Математические структуры и моделирование 2015. №4(36). С. 123-128
УДК 004.93
компьютерное зрение как средство извлечения информации из видеоряда
Н.В. Манюкова
кандидат педагогических наук, доцент, e-mail: [email protected] ФГБОУ ВПО «Нижневартовский государственный университет»
Аннотация. В статье рассмотрены области применения компьютерного зрения, представлены этапы распознавания информации из видеоряда, в частности номерных знаков транспортных средств.
Ключевые слова: компьютерное зрение, оператор Собеля, распознавание образов.
Компьютерное зрение призвано решать задачи, связанные со сбором и анализом зрительной информации в различных областях производства, при этом частично или полностью заменяя человека. Вопросы, касающиеся компьютерного зрения, были популярны ещё в 60-е годы XX века, но сейчас они находятся в особой стадии своего развития. Поскольку недавно появилась возможность доступного использования компьютеров и программного обеспечения большим количеством пользователей для обработки изображений и создания программных средств на основе идеи компьютерного зрения.
Под компьютерным зрением понимают теорию и технологию создания искусственных компьютерных систем, которые осуществляют обнаружение, классификацию и отслеживание объектов. Информацию они получают из изображений, которые могут быть представлены определённым видеорядом, изображением с различных камер или трехмерными данными, отсканированными изображениями и т. п.
Цель компьютерного зрения заключается в формировании полезных выводов относительно объектов и сцен реального мира на основе анализа изображений, полученных с помощью датчиков [8].
Имеется множество публикаций, посвящённых компьютерному зрению. Данными вопросами занимаются как отечественные учёные С.Ю. Желтов [3], А.Н. Писаревский [5] и др., так и зарубежные Л. Шапиро, Дж. Стокман [8], Д. Форсайт [7] и др., рассматривая современные подходы в этой области.
Б.В. Анисимов, В.Д. Курганов, В.К. Злобин в своих работах особое внимание уделяют идентификации точечных изображений при распознавании образов и распознаванию пространственных объектов по их плоским изображениям [1]. Они рассматривают особенности цифровой обработки точечных изображений, методы обработки плоских изображений пространственных объектов.
Процесс обработки и анализ изображений в задачах компьютерного зрения детально представлены в исследованиях Ю.В. Визильтера [2], С.Ю. Желто-
124
Н.В. Манюкова. Компьютерное зрение как средство...
Таблица 1. Алгоритм работы приложения
Этап Шаги
Инициализация 1. Инициализация захвата видео и чтение параметров камеры.
Главный цикл 2. Захват кадра видеопотока.
3. Обнаружение автомобильного номера в видеопотоке.
4. Распознавание автомобильного номера.
5. Занесение информации в базу данных.
Выключение 6. Остановка видеопотока.
ва [3]. Авторы в анализе изображений используют математические модели, описывают задачи линейной и нелинейной фильтрации, применяя приёмы выделения контурных точек, гистограммную обработку изображений, бинаризацию полутоновых изображений, операторы их вычисления, проблемы постобработки контурного изображения.
С.Ю. Желтов [3] и С.И. Протасов [6] рассматривают алгоритмы и методы анализа, визуализации и передачи данных в системах компьютерного зрения.
Многие системы компьютерного зрения реализуют следующие функции:
• Получение изображений;
• Предварительная обработка;
• Выделение деталей;
• Детектирование/Сегментация;
• Высокоуровневая обработка [4].
Результатом компьютерного зрения может являться видоизмененное изображение или список значений определённых параметров изображения, например, размер объекта, цвет, ориентация по отношению к камере, скорость и т. п. Рассмотрим пример идентификации автомобиля через распознавание его номерного знака. Программа распознавания автомобильных номеров работает по следующему принципу (табл. 1).
Описание алгоритма распознавания номера. Программа распознавания автомобильных номеров состоит из нескольких этапов. По окончании их выполнения реализуется распознавание автомобильного номера.
На первом этапе происходит инициализация захвата видео и чтение параметров камеры с помощью диалогового окна, библиотеки AForge.NET, выбора источника видеопотока.
Второй этап состоит из 4 шагов.
Шаги со 2 по 5 повторяются непрерывно, пока приложение не завершит свою работу, в то время как шаги 1 и 6 выполняются только при инициализации и завершении работы приложения.
На первом шаге из видеопотока кадр сохраняется в переменную для его дальнейшей обработки (рис. 1).
На втором шаге к изображению применяется бинаризация. Это попиксель-
Математические структуры и моделирование. 2015. №4(36)
125
Рис. 1. Исходное изображение
ная операция, в которой значение пикселя сравнивается с фиксированным порогом. Бинаризация применяется ко всему изображению. Пиксели сохраняются в формате 8 бит RGB. Их составляющие значения (красный, зелёный и синий) суммируются и сравниваются с пороговым значением.
{1, если (Red + Green + Blue) ^ порог,
(1)
0, если (Red + Green + Blue) > порог.
Далее используется оператор Собеля (рис. 2), который определяет градиент яркости изображения в каждой точке. Так выявляется направление наибольшего увеличения яркости и величина её изменения. Результат показывает, насколько изменяется яркость изображения в каждой точке и вероятность нахождения точки на грани, а также ориентацию границы.
Завершением второго шага является выделение контуров и поиск контура подходящего по параметрам номерного знака. Для всех замкнутых областей выделяются контуры. Далее координаты всех подходящих контуров записываются в массив. Используя массив с полученными координатами из предыдущего алгоритма, обрабатываются участки, удовлетворяющие параметрам номерного знака. Из исходного изображения по координатам вырезаем предполагаемый номер (рис. 3).
На третьем шаге к данному изображению также применяется бинаризация, оператор Собеля и выделяются все контуры (рис. 4).
Затем происходит распознавание. Для этих целей используются шаблоны (рис. 5).
По координатам каждого контура берётся часть изображения, приводится к размеру шаблона и сравнивается. Для сравнения используется функция, переводящая изображение в массив. Далее массив сравнивается с шаблонными массивами. По результатам сравнения происходит распознавание символов. В итоге получается текстовое представление распознанного номерного знака.
126
Н.В. Манюкова. Компьютерное зрение как средство...
Рис. 2. Бинаризация изображения (порог) и применение оператора Собеля
999
Рис. 3. Вырезанный участок изображения
Рис. 4. Выделение контуров
1234567890
ABCDEHKMOPTXY
Рис. 5. Шаблоны букв
Математические структуры и моделирование. 2015. №4(36)
127
Имя столбца Тип данных Длина Разрешить... Уникальн... Первичный...
Номер псКаг 12 Нет Нет Нет
Дата datetime 8 Нет Нет Нет
Время datetime 8 Нет Нет Нет
Рис. 6. Структура базы данных
По завершении второго этапа последним шагом текстовое значение номерного знака заносится в базу данных (рис. 6). Таким образом, компьютерное зрение широко используется в различных системах управления, в системах видеонаблюдения и видеорегистрации, применяется при разработке роботов и извлечения информации из видеоряда.
Литература
1. Анисимов Б.В., Курганов В.Д., Злобин В.К. Распознавание и цифровая обработка изображений: учеб. пособие для студентов вузов. М. : Высш. шк., 1983. 295 с.
2. Визильтер Ю.В., Желтов С.Ю., Бондаренко А.В., Осоков М.В., Моржин А.В. Обработка и анализ изображений в задачах машинного зрения: Курс лекций и практических занятий. М. : Физматкнига, 2010. 672 с.
3. Желтов С.Ю. Разработка теории, методов и алгоритмов машинного зрения в задачах обнаружения объектов: диссертация ... доктора технических наук: 05.13.01 / Желтов Сергей Юрьевич. Москва, 2002. 338 с.
4. Компьютерное зрение [Электронный ресурс]. Режим доступа: http://
тасН1пере^а.огд/1^ех,рНр/Компьютерное_зрение (Дата обращения: 25.10.2015).
5. Писаревский А.Н., Чернявский А.Ф., Афанасьев Г.К. и др. Системы технического зрения (принципиальные основы,аппаратное и математическое обеспечение). Л. : Машиностроение. Ленингр. отд-ние, 1988.
6. Протасов С.И. Методы и алгоритмы анализа, передачи и визуализации данных в системах компьютерного стереозрения: автореферат диссертации . . . кандидата физико-математических наук: 05.13.17 / Протасов Станислав Игоревич. Воронеж, 2013. 16 с.
7. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. Пер. с англ. -М. : Издательский дом «Вильямс», 2004. 928с.
8. Шапиро Л., Стокман Дж. Компьютерное зрение. Пер. с англ. М. : Лаборатория знаний, 2006. 752с.
128
Н.В. Манюкова. Компьютерное зрение как средство...
computer vision as a means of extracting information from
the video
N.V. Manukova
Ph.D.(Pedagogics), Associate Professor, e-mail: [email protected]
Federal State Budgetary Educational Institution of Higher Professional Education
’’Nizhnevartovsk state University”
Abstract. The article discusses the applications of computer vision, presents the stages of the recognition of information from video sequences, in particular registration plates of vehicles.
Keywords: computer vision, Sobel operator, pattern recognition.