Научная статья на тему 'Использование слабых классификаторов для выявления областей, в которых предположительно находится эмблема марки транспортного средства'

Использование слабых классификаторов для выявления областей, в которых предположительно находится эмблема марки транспортного средства Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
110
68
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Руднев Д. Н.

В статье разбирается один из методов распознавания объектов на изображении выделение экстремальных областей с использованием слабых классификаторов. Упоминаются другие часто используемые методамы и возможные трудности при работе с ними. Кратко описывается реализация метода и используемые дескрипторы для классификации. В ходе поставленного эксперимента показана эффективность работы метода для поставленной задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Руднев Д. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование слабых классификаторов для выявления областей, в которых предположительно находится эмблема марки транспортного средства»

Использование слабых классификаторов для выявления областей, в которых предположительно находится эмблема марки

транспортного средства

Руднев Д.Н., МГТУ им. Н.Э. Баумана [email protected]

Аннотация

В статье разбирается один из методов распознавания объектов на изображении - выделение экстремальных областей с использованием слабых классификаторов. Упоминаются другие часто используемые мето-дамы и возможные трудности при работе с ними. Кратко описывается реализация метода и используемые дескрипторы для классификации. В ходе поставленного эксперимента показана эффективность работы метода для поставленной задачи.

1 Введение

На территории РФ с 2013 года функционирует единая система контроля (ЕСК) передвижения транспортных средств (ТС). Данные поступают в центр обработки данных (ЦОД) ЕСК с систем фотовидеофиксации ТС, включающих в себя системы идентификации ТС (СИТС). СИТС формирует пакет данных о прохождении каждого ТС через зону, контролируемую параметрами фотовидеофиксации.

Пакет данных о прохождении ТС содержит дату и время фиксации ТС, фотофиксацию ТС, изображение выделенного государственного регистрационного знака (ГРЗ), а также распознанный ГРЗ. Поступающие в ЕСК данные обрабатываются системой распознавания для определения марки ТС. Каждую секунду в ЕСК поступает более 500 пакетов данных и эта цифра растет. Определять марки ТС необходимо в реальном времени.

В настоящее время для распознавания марок используется модифицированный алгоритм Виолы-Джонса [1]. Это точный, но ресурсоемкий алгоритм. Обработка всего изображения повторяется несколько раз для поиска эмблем разного размера.

В связи с растущей нагрузкой на ЕСК становится актуальной задача повышения скорости работы алгоритма распознавания марки ТС. Слабое место алгоритма Виолы-Джонса -обработка всего изображения несколько раз, в то время как эмблема может занимать лишь малую часть изображения. Задача: уменьшить

область поиска эмблемы, тем самым значительно повысив скорость распознавания. Зная заранее примерные размеры эмблемы можно сократить количество обходов изображения.

Для решения задачи необходимо сделать предварительную выборку, выделив области с предположительным местонахождением эмблемы. Постараться обозначить размеры области, занимаемой эмблемой, как можно точнее.

2 Выбор метода

Чтобы решить поставленную задачу, для сравнения было выбрано несколько методов локализации и распознавания.

Анализ контуров подразумевает под собой поиск контуров на изображении. Такой способ дает нужные результаты только в случае, если эмблема на фотографии имеет четкий и непрерывный контур. Подходящие условия выполняются довольно редко.

Поиск эмблемы в области над ГРЗ. При использовании данного метода проблемы могут возникнуть уже на этапе поиска ГРЗ, который может быть неправильно локализован или отсутствовать.

Поиск эмблем в районе оси симметрии ТС. Сложный в реализации метод. Ось симметрии может быть не найдена, если кузов ТС не был полностью захвачен фотофиксацией.

Выделение экстремальных областей. Этот метод основан на нахождении экстремальных регионов [2] (наборов связанных пикселей, интенсивность которых значительно отличается от интенсивности пикселей в окрестностях этого региона) и их последовательной классификации несколькими классификаторами.

Для решения задачи был выбран последний рассматриваемый метод. Впервые он был применен Мейтасом и Нейманом [2] [3] для распознавания шрифта. Реализованный на основе метода алгоритм не зависит от масштабов искомых объектов, расположения их на изображении, достаточно устойчив к изображениям с низкими контрастностью и раз-

Использование слабых классификаторов для выявления областей, в которых предположительно

решением, умеренному размытию. При этом приемлемая скорость работы алгоритма достигается путем быстрого вычисления вектора дескрипторов за константное время. На рисунке 1 приведен пример результата работы метода.

Рис. 1. Результат работы метода выделения экстремальных областей

3 Описание метода

Для выделения экстремальных областей входными данными служит изображение. На выходе метода формируется список отобранных классификатором экстремальных областей вида координаты левого нижнего, координаты правого верхнего угла. В методе используются алгоритмы вычисления дескрипторов экстремальных областей, алгоритм вычисления порога Оцу [2]. Метод работает с использованием предварительно обученного классификатора.

Экстремальные регионы представляют собой набор связанных пикселей изображения, бинаризованного с определенным порогом. Более формально, экстремальный регион г -набор смежных пикселей, таких что для всех пикселей р € г и всех пикселей с] из внешней границы 5 грегиона г выполняются следующее условие: / (р) < /(¿¡[) или I (р) > /((})

в зависимости от того, по возрастанию, или убыванию интенсивности строятся области.

Для того чтобы найти экстремальные регионы, необходимо отсортировать все пиксели на изображении по возрастанию (или убыванию) интенсивности. Далее необходимо обойти последовательно все пиксели из отсортированного списка и маркировать соответствующие точки на изображении. При этом образуются новые регионы следующим образом:

• если соседние пиксели текущего региона еще не были промаркированы, то образуется новый регион, состоящий из текущего пикселя;

• если среди соседних пикселей обнаружен пиксель, принадлежащий какому-либо региону, то образуется новый регион, состоящий из всех пикселей найденного региона и текущего пикселя;

• если среди соседних пикселей обнаружено несколько пикселей, принадлежащих разным регионам, то образуется новый регион, объединяющий все пиксели найденных регионов и текущий пиксель.

В данной работе используются следующие последовательно-вычисляемые дескрипторы экстремальных регионов [2] [3]:

• площадь - количество пикселей региона;

• периметр - длина границы региона;

• ограничивающий прямоугольник -верхняя левая и нижняя правая точка;

• эйлерова характеристика [2];

• горизонтальные пересечения - вектор, содержащий количества переходов между пикселями, принадлежащими и не принадлежащими региону в заданной строке региона.

Порог Оцу используется в методе для фильтрации областей на этапе обучения классификатора. Суть метода Оцу в вычислении порога бинаризации для полутонового изображения, делящего пиксели изображения на два класса: полезные и фоновые. Деление происходит так, чтобы внутриклассовая дисперсия была минимальной.

Для того чтобы избежать большого количества ложноположительных результатов и избыточности детектора экстремальных регионов, регионы отбираются последовательным классификатором. Классификация разбита на два этапа в целях повышения эффективности алгоритма.

На первом этапе, вычисляются дескрипторы регионов, последовательно увеличивая порог от 0 до 255. Дескрипторы далее используются как признаки для классификатора, который оценивает вероятность р(г) того, что данный регион является символом ГРЗ. Затем, просматриваются полученные значения р(г), с учетом отношения включения регионов на всех порогах, и среди них выбираются

Табл. 1. Достоверность метода

Элемент текста Полнота Точность F метрика

Метод определения экстремальных областей 98,9% 9% 16,5%

Табл. 2. Скорость работы методов

Название метода Врем работы метода, мс

на 5 на 10

марках марках

Метод определения 258

экстремальных обла-

стей

Модифицированный 1700 3050

алгоритм Виолы-Джонса

Объединенный метод 310 (- 420

распознавания 1390мс) (-2630мс)

только те регионы, которые соответствуют локальному максимуму р(г) (при условии, что этот локальный максимум больше некоторого порога рт[П и разница между локальным максимумом и локальным минимумом больше . Выбранные на первом этапе регионы подаются на второй этап классификации.

4 Эксперимент

Проведен эксперимент с целью исследования скорости работы алгоритма, точности и полноты распознавания, а также эффективности метода по критерию сужения области поиска эмблемы. Также была измерена скорость работы алгоритма и объединенной системы: разработанного модуля вместе с модифицированным алгоритмом Виолы-Джонса.

Для подсчета достоверности метода были выбраны формулы точности (формула 1) и полноты (формула 2) распознавания. Целостная характеристика распознавания в таком случае отображается f метрикой (формула 3).

100% (1)

С™, = — * 100% (2)

^ _ 2«асс*д ^

асс+ц

где й^ - число верных положительных срабатываний, а - число всех срабатываний, е -число эмблем на изображениях, асс - точность, д - полнота.

Входные данные эксперимента:

• количество распознаваемых марок;

• положительная и отрицательная выборка;

• тестовая выборка.

Этапы выполнения эксперимента:

• обучение классификатора;

• определение экстремальных областей;

• распознавание марок;

• подсчет статистики.

Выходные данные:

• точность распознавания, полнота, ^метрика;

• врем работы реализованного метода, метода распознавания с использованием алгоритма Виолы-Джонса и объединенного метода.

4.1 Результаты эксперимента

Результаты эксперимента представлены в таблице 1 и 2.

5 Заключение

Эксперимент показал, что метод имеет низкую точность, но в нашем случае это не играет роли. Важно, чтобы во время выполнения алгоритм совершал как можно меньше ложноотрицательных срабатываний, т. е. как можно меньше пропускал эмблемы. И с этой задачей метод справляется на 98,9%, как следует из результатов эксперимента. При этом скорость объединенного метода увеличилась в разы. Чем больше марок обрабатывается, тем сильнее будет заметна разница. Большую роль играет тот факт, что реализованный метод обрабатывает изображение единожды, в отличие от Виолы-Джонса, который обходит изображение несколько раз для каждой марки.

Список литературы

P. Viola and M.J. Jones. 2001. Rapid Object Detection using a Boosted Cascade of Simple Features, proceedings IEEE Conf. on Computer Vision and Pattern Recognition. Kauai, Hawaii USA.

Real-Time Scene Text Localization and Recognition [Providence, USA, 2012] URL: http ://cmp.felk.cvut. cz/~neum alu 1 /neumann-cvpr2012.pdf (дата обращения 14.03.2016).

Jiri Matas and Karel Zimmermann. 2005. Unconstrained Licence Plate Detection, Proceedings of the 8th International IEEE Conference on Intelligent Transportation Systems. Wien, Austria.

i Надоели баннеры? Вы всегда можете отключить рекламу.