Научная статья на тему 'Анализ эффективности методов распознавания символов в рамках задачи распознавания номерного знака автотранспорта'

Анализ эффективности методов распознавания символов в рамках задачи распознавания номерного знака автотранспорта Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
207
112
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Убоженко Н. В.

В данной статье рассматриваются основные методы распознавания символов и производится сравнение их эффективности применительно к задаче распознавания номерного знака автотранспорта. Описываются основные этапы процесса распознавания печатных символов. Проводится анализ существующих методов распознавания с выделением их преимуществ и недостатков. Анализируется эффективность каждого из методов в рамках поставленной задачи. В конце статьи на основании результатов сравнения производится выбор наиболее подходящего метода, как основы для разработки новых эффективных алгоритмов распознавания символов номерного знака автотранспорта.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ эффективности методов распознавания символов в рамках задачи распознавания номерного знака автотранспорта»

АНАЛИЗ ЭФФЕКТИВНОСТИ МЕТОДОВ РАСПОЗНАВАНИЯ СИМВОЛОВ В РАМКАХ

ЗАДАЧИ РАСПОЗНАВАНИЯ НОМЕРНОГО ЗНАКА АВТОТРАНСПОРТА

© Убоженко Н.В.*

Московский государственный университет леса, г. Мытищи

В данной статье рассматриваются основные методы распознавания символов и производится сравнение их эффективности применительно к задаче распознавания номерного знака автотранспорта. Описываются основные этапы процесса распознавания печатных символов. Проводится анализ существующих методов распознавания с выделением их преимуществ и недостатков. Анализируется эффективность каждого из методов в рамках поставленной задачи. В конце статьи на основании результатов сравнения производится выбор наиболее подходящего метода, как основы для разработки новых эффективных алгоритмов распознавания символов номерного знака автотранспорта.

Решение проблемы идентификации автомобиля по регистрационному номерному знаку является важным аспектом безопасности и контроля. Использовать такой продукт можно в различных сферах применения, касающихся автотранспорта. Задачу идентификации автомобиля можно условно разделить на две подзадачи: локализация номерной пластины и распознавание символов. Данная статья посвящена анализу второй подзадачи, т.е. непосредственно процессу распознавания.

В настоящее время существует не так много систем определения номерных знаков, не все из которых являются по-настоящему качественной продукцией. Параллельно с написанием алгоритмов, разрабатываются аппаратные средства для этих целей. Но системы, обладающие высоким быстродействием и точностью распознавания, как правило, очень дороги. Высокая стоимость существующих продуктов не позволяет осуществить их массовое внедрение. Именно поэтому вопрос создания качественного программного комплекса распознавания номерных знаков транспортных средств в настоящее время достаточно актуален. В общем случае распознавание реализуется в три этапа: предварительная обработка изображения, сегментация символов и собственно распознавание символов.

Предварительная обработка изображения

Процедура предварительной обработки используется практически всегда после получения визуальной информации. Она представляет собой применение операций усреднения и выравнивания гистограмм, различного ти-

* Магистрант кафедры Вычислительной техники.

па фильтров для исключения помех и подавления внешних шумов, а также проведение корректной бинаризации изображения и любых действий иного характера, необходимых для дальнейшей работы с данным изображением. На выходе этапа предварительной обработки мы имеем дело с чёрно-белым (после проведения бинаризации) изображением, корректно избавленным от различного рода визуальных дефектов (например, зашумленности) и содержащим полезную информацию (в случае номерной пластины - символы номерного знака автотранспорта).

Сегментация символьной информации

Под сегментацией понимается процесс разделения изображения на отдельные символы. Итогом проведения данного этапа являются координаты точных границ каждого символа на изображении, прошедшем этап предварительной обработки. Результат данного процесса во многом зависит от корректно проведённой предварительной обработки изображения, так как подавляющее большинство алгоритмов сегментации весьма чувствительно к дефектам обрабатываемого изображения, например, к склеиванию границ символов после некорректно проведённой бинаризации.

Необходимо чётко понимать, что в рамках задачи распознавания символов с номерной пластины автотранспорта всегда будет присутствовать определённый процент «грязных», трудночитаемых номеров, дефектность которых не будет устранена окончательно после предварительной обработки изображения. Этот факт необходимо учитывать при дальнейшем выборе метода распознавания символов.

Распознавание структурированных символов

Конечный этап работы с изображением - непосредственно распознавание символов. Распознавание структурированных (печатных) символов различных изображений обеспечивает решение ряда научных и прикладных задач при идентификации объектов различной природы. Современные методы распознавания символов используются для решения как типовых задач, например распознавания рукописного и / или печатного текста, так и специализированных задач, ориентированных на распознавание символьной информации, нанесенной на поверхность различных объектов. Для этапа распознавания символов входными данными являются изображения, полученные в результате предварительной обработки и сегментации исходного изображения. На сегодняшний день известно три основных подхода к распознаванию символов: шаблонный, структурный и признаковый.

Шаблонный метод распознавания

Шаблонный метод распознавания начинается с составления базы данных шаблонов изображений всех возможных символов номерного знака, букв и цифр. В такую базу данных могут быть включены изображения как

для одного, так и для целого ряда масштабов. Для распознавания очередного символа он приводится к одному из допустимых размеров и производится его последовательное сравнение с каждым из имеющихся шаблонов. Для уменьшения числа сравнений возможно вычисление каких-либо дополнительных характеристик, например количества замкнутых областей белого цвета в символе, предполагая, что сами символы черного цвета, и сравнение только с соответствующими шаблонами. В качестве меры сходства двух изображений обычно используется коэффициент перекрёстной корреляции.

К достоинствам шаблонных методов распознавания относится достаточно высокая степень распознавания дефектных символов (склеенных или разорванных, искажённых шумом, грязных и т.д.) при высокой скорости распознавания и сравнительной простоте реализации. Недостаток данных методов - невозможность распознать шрифт, хоть немного отличающийся от заложенного в систему (размером, наклоном или начертанием). Алгоритм, основанный на шаблонном методе, должен заранее «знать» шрифт, который ему предоставляют для распознавания.

Признаковый метод распознавания

Признаковые методы базируются на том, что изображению ставится в соответствие ^мерный вектор признаков. Распознавание заключается в сравнении его с набором эталонных векторов той же размерности. Задача распознавания, принятия решения о принадлежности образа тому или иному классу, на основании анализа вычисленных признаков, имеет целый ряд строгих математических решений в рамках детерминистического и вероятностного подходов. В системах распознавания символов чаще всего используется классификация, основанная на подсчете евклидова расстояния между вектором признаков распознаваемого символа и векторами признаков эталонного описания. Тип и количество признаков в немалой степени определяют качество распознавания. Формирование вектора производится во время анализа предварительно подготовленного изображения. Данный процесс называют извлечением признаков. Эталон для каждого класса получают путем аналогичной обработки символов обучающей выборки. Сравнение полученного вектора признаков изображения с набором эталонных векторов позволяет отнести образ изображения к тому или иному классу, т.е. распознать его.

Основные достоинства признаковых методов - простота реализации, хорошая обобщающая способность, хорошая устойчивость к изменениям формы символов, низкое число отказов от распознавания, высокое быстродействие. Наиболее серьезный недостаток этих методов - неустойчивость к различным дефектам изображения. Кроме того, признаковые методы обладают другим серьезным недостатком - на этапе извлечения признаков происходит необратимая потеря части информации о символе. Извлечение признаков ведется независимо, поэтому информация о взаимном расположении элементов символа утрачивается. Четких правил отбора признаков не суще-

ствует, поэтому методы от разных разработчиков систем распознавания оперируют различными наборами признаков.

Структурный метод распознавания

В структурных методах объект описывается как граф, узлами которого являются элементы входного объекта, а дугами пространственные отношения между ними. Методы, реализующие подобный подход, обычно работают с векторными изображениями. Структурными элементами являются составляющие символ линии. Так, для буквы «р» это вертикальный отрезок и дуга. Математический анализ, используемый в структурных методах, позволяет отнести полученное при векторизации изображения к определённому классу и, таким образом, распознать его.

Достоинство структурных методов - это устойчивость к изменениям формы символов, что позволяет применять их в задачах распознавания, к примеру, рукописного текста. К недостаткам же структурных методов следует отнести их высокую чувствительность к дефектам изображения, нарушающим составляющие элементы. Также векторизация может добавить дополнительные дефекты. Кроме того, для этих методов, в отличие от шаблонных и признаковых, до сих пор не созданы эффективные автоматизированные процедуры обучения. Поэтому структурные описания чаще всего приходиться создавать вручную.

Сравнение основных методов распознавания символов и выбор наилучшего метода в рамках поставленной задачи

К достоинствам шаблонного метода относятся хорошее распознавание дефектных символов («разорванных» или «склеенных»), простота и высокая скорость распознавания. Недостатком же является необходимость настройки системы на типы и размеры шрифтов.

Достоинства признакового метода таковы: данный метод позволяет распознавать различные начертания символов, т.е. различные подчерки, шрифты и т.д. Недостатки: этот метод неизбежно вызывает некоторую потерю информации, весьма чувствителен к качеству изображения и возможным помехам.

Достоинства структурного метода аналогичны достоинствам признакового метода и состоят в универсальности шрифта, к которому принадлежат символы, подлежащие распознаванию. Недостаток данного метода заключается в очень высокой чувствительности к дефектам изображения, а также в отсутствии достаточно эффективных автоматизированных процедур обучения и необходимости создания структурных описаний вручную. Также данный метод отличается весьма объёмными вычислениями, что делает его реализацию в системах реального времени затруднительной.

В рамках задачи распознавания номерного знака автотранспорта целесообразно сделать основным шаблонный метод распознавания. Основанием для такого вывода служит следующее:

- этот метод устойчив к искажению данных, что нередко наблюдается на номерных пластинах в виде теней и грязи;

- шаблонный метод имеет высокую скорость обработки данных;

- имеется априорная информация о единственном возможном шрифте;

- для хранения эталонов не требуется больших затрат памяти.

В настоящее время одним из наиболее эффективных подходов в рамках задачи распознавания структурированных печатных символов считается использование комбинированных шаблонно-признаковых методов. Но в качестве основы для создания эффективных алгоритмов в рамках задачи распознавания символов с номерной пластины автотранспорта разумнее всего будет выбрать именно шаблонный метод распознавания.

Список литературы:

1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. - М., 2005.

2. Лукьяница А.А., Шишкин А.Г. Цифровая обработка видеоизображений. - М.: Ай-Эс-Эс Пресс, 2009.

3. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. - М.: Наука, 1974.

4. Яне Б. Цифровая обработка изображений. - М.: Техносфера, 2007.

5. Павлидис Т. Алгоритмы машинной графики и обработки изображений. - М.: Радио и связь, 1986.

6. Сойфер В.А. Методы компьютерной обработки изображений. - М.: Физматлит, 2003.

7. Горелик А.Л., Скрипкин В.А. Методы распознавания. - М., 1977.

ИССЛЕДОВАНИЕ МЕТОДА СТРУКТУРНО-ПАРАМЕТРИЧЕСКОЙ ИДЕНТИФИКАЦИИ ЛИНЕЙНЫХ

ДИНАМИЧЕСКИХ СИСТЕМ С ПОМЕХАМИ НА ВХОДЕ-ВЫХОДЕ СИСТЕМЫ С ИСПОЛЬЗОВАНИЕМ ГЕНЕТИЧЕСКОГО АЛГОРИТМА

© Энгельгардт В.В.*

Самарский государственный университет путей сообщения, г. Самара

Произведено исследование метода, позволяющего проводить структурно-параметрическую идентификацию линейных динамических систем с учётом помех на входе и выходе системы. Данный подход основан на использовании генетического алгоритма, который используется для идентификации структуры модели.

* Преподаватель кафедры «Мехатроника в автоматизированных производствах».

i Надоели баннеры? Вы всегда можете отключить рекламу.