_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №01-2/2017 ISSN 2410-6070_
Список использованной литературы
1. «О Стратегии развития железнодорожного транспорта в Российской Федерации до 2030 года»: Распоряжение Правительства РФ от 17.06.2008 № № 877-р. // утверждено распоряжением правительства РФ от 22.11.2008 № 1734-р;
2. Годовой отчёт 2012 / «ОАО» РЖД (Российские железные дороги). — Москва, 2012. — 275 с;
3. Годовой отчёт 2013 / «ОАО» РЖД (Российские железные дороги). — Москва, 2013. — 262 с;
4. Годовой отчёт 2014 / «ОАО» РЖД (Российские железные дороги). — Москва, 2014. — 226 с;
5. Правила устройства электроустановок (ПУЭ), изд. 7, 2001 - 2004 г.г.
© Береснев Е.И., 2017
УДК 004.048
И.В. Винокуров
к.т.н., доцент КФ МГТУ им. Н.Э. Баумана г. Калуга, Российская Федерация
РАСПОЗНАВАНИЕ РЕГИСТРАЦИОННОГО НОМЕРА АВТОМОБИЛЯ НА НЕЙРОННОЙ СЕТИ ХЭММИНГА
Аннотация
В статье обосновывается выбор метода распознавания. Рассматриваются основные этапы обработки изображения регистрационного номера автомобиля. Реализуется распознавания его элементов на нейронной сети Хэмминга.
Ключевые слова
Регистрационный номер автомобиля, признаковые методы распознавания, адаптивная бинаризация,
нейронная сеть Хэмминга.
В настоящее время существует множество программных систем и аппаратно-программных комплексов распознавания регистрационных номеров автомобилей по фотографиям с видеокамер слежения - «Поток» (компания «Росси»), «MegaCar» (компания «Megapixel»), «Авто-Инспектор» (компания ISS) и т.п. Практически в каждой из них распознавание регистрационного номера автомобиля состоит из следующих основных этапов: предобработка, сегментация и распознавание. Этап распознавания символов является самым важным и может быть осуществлен тремя типами методов — шаблонными, структурными и признаковыми.
В признаковых методах усреднённое изображение каждого символа представляется как объект в n-мерном пространстве признаков. Полученный n-мерный вектор сравнивается с эталонными векторами, и изображение относится к наиболее подходящему из них. Одним из признаковых методов является адаптивное распознавание с использованием нейронных сетей. Этот метод может быть использован и для распознавания элементов регистрационных номеров автомобилей и заключаться в следующем:
1. обнаружение и выделение горизонтального фрагмента изображения, предположительно содержащего регистрационный номер автомобиля;
2. обнаружение и выделение из горизонтального фрагмента изображения регистрационный номер автомобиля;
3. обнаружение и выделение элементов регистрационного номера автомобиля из содержащего его фрагмента изображения;
4. распознавание элементов регистрационный номер автомобиля;
_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №01-2/2017 ISSN 2410-6070_
5. коррекция элементов регистрационного номера автомобиля в соответствии с его типом.
Учитывая достаточно большую информативность получаемых с видеокамер фотографий автомобилей, ограничим зону выделения и последующего распознания их регистрационных номеров - анализируемую зону. Для этого необходимо определить координаты области, в пределах которой располагаются регистрационные номера автомобилей на всех фотографиях с видеокамеры, например, как это показано на рис. 1.
Рисунок 1 - Выделение на изображении автомобиля анализируемой области
Далее необходимо из анализируемой области изображения выделить горизонтальный фрагмент, предположительно содержащий автомобильный номер. Это можно сделать, например, следующим образом - вычислить для всех горизонтальных пиксельных линий их цветовую интенсивность, т.е. определить цветовую интенсивность вертикальной проекции изображения. Для этой цели можно воспользоваться следующим выражением:
Ру = X f ^ У ^
I=0
где ^ - ширина изображения в пикселях,
(/, у) - цвет пикселя с координатами (/, у) .
Максимумы (пики) цветовой интенсивности вертикальной проекции изображения вероятнее всего будут свидетельствовать о наличии в соответствующем фрагменте изображения регистрационного номера автомобиля. Причина этого заключается в том, что белый цвет его фона имеет максимальную цветовую насыщенность. Однако найти пики цветовой интенсивности мало, - необходимо определить и их протяжённость, определяемую предполагаемой высотой номерной пластины автомобиля. Высота пластины стандартизована и это даёт основание отсечь лишние вертикальные пики, например, так, как это показано на рис. 2.
Рисунок 2 - Пики цветовой интенсивности вертикальной проекции
_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №01-2/2017 ISSN 2410-6070_
Реализация следующего этапа - обнаружение и выделение из горизонтального фрагмента изображения автомобильного номера может быть осуществлено аналогично предыдущему. Вычисление цветовой интенсивности горизонтальной проекции изображения осуществляется, как и ранее, следующим образом:
h-1
Px = X f (J^
j=0
где h - высота фрагмента изображения в пикселях,
f (j, x) - цвет пикселя с координатами (j, x).
Максимумы (пики) цветовой интенсивности горизонтальной проекции фрагмента изображения вероятнее всего будут свидетельствовать о наличии в нем регистрационного номера автомобиля, рис. 3.
Рисунок 3 - Пики цветовой интенсивности горизонтальной проекции
Исходя из известной ширины символа регистрационного номера автомобиля, можно, как и в предыдущем этапе, посредством вычисления цветовой интенсивности его горизонтальной проекции, выделить в нем расположение составляющих его символов, рис. 4.
Рисунок 4 - Пики горизонтальной интенсивности элементов регистрационного номера автмомобиля
Непосредственно перед этапом выделения во фрагменте изображения символов регистрационного номера автомобиля может возникнуть необходимость в его повороте. Для поворота области изображения используется алгоритм, основанный на аффинном преобразовании координат. Для уменьшения искажений изображения при повороте, связанных с его дискретным характером, может быть применен метод, основанный на билинейной интерполяции по ближайшим четырем пикселям.
Определение угла поворота регистрационного номера автомобиля выполняется в результате использования нескольких этапов анализа и последующей обработки изображения. На первом этапе выполняется операция выявления границ изображения на основе линейного оператора Собеля для горизонтальных границ со следующей маской свертки [1, с. 403]:
-1 -2 -1
0 0 0
1 2 1
_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №01-2/2017 ISSN 2410-6070_
Этот оператор наиболее чувствителен к направлениям границ изображения, близким к горизонтальным. Как следствие, он позволяет хорошо выделить на изображении верхнюю и нижнюю часть регистрационного номера автомобиля, рис. 5.
Рисунок 5 - Результат использования линейного оператора Собеля
Целью второго этапа является определение уравнения прямых, соответствующих верхней и нижней границе регистрационного номера автомобиля. На этом этапе выполняется расчет карты плотностей найденных точек границ в пространстве коэффициентов линейных зависимостей пространственных координат согласно преобразованию Хафа [1, с. 410]. Каждая точка карты границ, полученной на предыдущем этапе, порождает целое семейство проходящих через нее прямых:
yj
axij + b,
что в пространстве линейных коэффициентов также соответствует прямой:
Ъ = аху - уу.
Наделяя прямые в пространстве коэффициентов весом X , у ) соответствующим значению яркости
изображения результата подчеркивания границ (см. рис. 5), и проводя их в пространстве коэффициентов а и Ъ с яркостью, равной весу, получим изображения, подобные приведенному на рис. 6.
Рисунок 6 - Карта результатов преобразования Хафа
Вертикальное направление карты, приведенной на этом рисунке, соответствует изменениям значений коэффициента а, горизонтальное - Ъ. Диапазон изменения коэффициентов рассчитывается исходя из допустимых поворотов изображения номера в плоскости изображения и размеров найденного изображения номера согласно формулам:
ае[-0.2 0.2](0.2«^(10°)),
Ъ e[-amaxW Н + amaxWI где атах - максимальное значение а,
W - ширина изображения регистрационного номера, н - высота изображения регистрационного номера. Наиболее яркие точки изображения карты результатов преобразования Хафа (см. рис. 6) соответствуют наиболее ярким прямым исходного изображения границ, что позволяет определить уравнения этих прямых и, соответственно, углы их наклона. Так как искомыми являются прямые, соответствующие верхней и нижней границе номерного знака автомобиля, то для пределения наиболее вероятного угла поворота номера на изображении карты результатов преобразования Хафа необходимо найти две точки, имеющие одно значение а и разные значения Ъ, с наибольшей суммарной яркостью. Значение параметра а найденных
_МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №01-2/2017 ISSN 2410-6070_
точек полностью определяет угол наклона изображения номерного знака как a = tg(ф) .
Для распознавания (классификации) элементов регистрационного номера автомобиля вполне достаточна нейронная сеть Хэмминга. Сеть такого типа реализует вычисление хэммингово (евклидово) расстояние между распознаваемым и эталонным образами. Непосредственно перед реализацией этапа распознавания на нейронной сети, в ряде случаев может потребоваться шаблонная скелетизация.
Все допустимые элементы регистрационного номера автомобиля после этапа их бинаризации (растеризации) представляются в виде матрицы размером n*m. При этом пикселю с максимальной цветовой насыщенностью соответствует нулевое значение, а с минимальной цветовой насыщенностью - единичное.
Если изображение автомобиля имеет достаточно плохое качество, то возникает необходимость в адаптивной бинаризации. Основными параметрами адаптивной бинаризации являются радиус и порог. Первый представляет собой размер области, на которой происходит анализ каждого из участков изображения (другое название - радиус адаптивного контрастирования). Порогом является некоторое значение цвета (как правило, в градациях серого). Если цвет пикселя превышает это значение, то в последующем он рассматривается как пиксель с черным цветом, если не превышает, то с белым.
Результат работы описанного выше способа адаптивной бинаризации приведён на рис. 7.
к694ух
Рисунок 7 - Результат работы адаптивной бинаризации изображения
Следует отметить, что нейронная сеть Хэмминга уступает по эффективности распознавания сетям обратного распространения ошибки, ART и некоторым другим, поскольку способна правильно распознавать (классифицировать) только слабо зашумлённые образы. С целью повышения эффективности процесса распознавания, непосредственно перед его реализацией, выделенные фрагменты изображения регистрационного номера автомобиля сравниваются с эталонными значениями параметров их яркости, контрастности, оттенкам и цветовой насыщенности. Дополнительными параметрами высококонтрастных фрагментов изображения могут быть их высота, отношение ширины к высоте и некоторые другие, рис. 8.
1-т694ух
Выделенный фрагмент изображения * т 6 9 А У X 1 □ □ t
Высота фрагмента - + + + + + + + + + —
Отношение ширины фрагмента к его + + + + + + + — + + —
высоте
Результаты классификации сетью Т 6 9 4 У X □ □
Хэмминга
Рисунок 8 - Этапы реализации распознавания фрагментов регистрационного номера автомобиля с использованием дополнительных параметров
Список использованной литературы:
1. Гонсалес Р. Цифровая обработка изображений в среде МА^АВ / Р. Гонсалес, Р. Вудс, С. Эддинс. - М.: Техносфера, 2006. - 616 с.
© Винокуров И.В., 2017
МЕЖДУНАРОДНЫЙ НАУЧНЫЙ ЖУРНАЛ «ИННОВАЦИОННАЯ НАУКА» №01-2/2017 ISSN 2410-6070_
УДК 004.42
И.В. Винокуров
к.т.н., доцент КФ МГТУ им. Н.Э. Баумана г. Калуга, Российская Федерация
РЕАЛИЗАЦИЯ РАСПОЗНАВАНИЯ РЕГИСТРАЦИОННОГО НОМЕРА АВТОМОБИЛЯ НА
НЕЙРОННОЙ СЕТИ ХЭММИНГА
Аннотация
В статье описывается программная реализация распознавания регистрационного номера автомобиля на нейронной сети Хэмминга. Описываются этапы работы с приложением. Приводятся основные экранные формы.
Ключевые слова
Регистрационный номер автомобиля, признаковые методы распознавания, адаптивная бинаризация,
нейронная сеть Хэмминга.
Описанная в предыдущей статье методика нейросетевого распознавания регистрационного номера автомобиля реализована в виде кросс-платформенного Java-приложения. На главном окне располагаются основное меню, список изображений автомобилей и кнопки с заголовками "Распознать" и "Остановить". Элементы основного меню Java-приложения приведены на рис. 1-2.
Рисунок 1 - Элементы меню "Изображение"
Рисунок 2 - Элемент меню "Настройки"
Действия, реализуемые элементами меню "Изображение", следующие:
"Загрузка изображения" - реализует выбор файлов с изображениями автомобилей и отображение их имен как элементов списка на главном окне приложения.
"Выделить и распознать номер" - инициирует процесс распознавания регистрационного номера автомобиля на выбранном из списка изображении автомобиля. После завершения процесса распознавания отображает выделенный из изображения номер автомобиля и результат его распознавания.
"Остановить процесс распознавания" - принудительно завершает процесс распознавания регистрационного номера автомобиля на изображении.
"Выйти" - завершает работу Java-приложения.
Действия, реализуемые элементом меню "Настройки":
"Изменить параметры распознавания" - отображает диалоговое окно, позволяющее просматривать и/или изменять текущие значения параметров распознавания регистрационного номера автомобиля. Окно имеет три закладки, на которых отображаются логически взаимосвязанные параметры распознавания, представляющие собой коэффициенты математических методов цифровой обработки изображений.