Научная статья на тему 'Распознавание объектов на двумерном изображении'

Распознавание объектов на двумерном изображении Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1597
1034
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНОЕ ЗРЕНИЕ / OPENCV / БИНАРИЗАЦИЯ / КОНТУР / ВЕЙВЛЕТ-АНАЛИЗ / КАСКАД ХААРА / SURF / COMPUTING VISION / BINARIZATION / CONTOUR / WAVELET ANALYSIS / CASCADE OF HAAR

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ноздрачев Сергей Алексеевич, Живрин Ярослав Эдуардович

В работе рассматриваются различные методы подготовки изображения к поиску объекта, а также методы распознавания объекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Detection of objects on a two-dimensional image

The paper discusses the various methods of preparation of the image to search for an object, and object recognition methods.

Текст научной работы на тему «Распознавание объектов на двумерном изображении»

УДК 004.023

РАСПОЗНАВАНИЕ ОБЪЕКТОВ НА ДВУМЕРНОМ

ИЗОБРАЖЕНИИ

Ноздрачев Сергей Алексеевич

ассистент кафедры информатики и информационных технологий Московский государственный университет печати имени Ивана Федорова 127550 Россия, г. Москва, ул. Прянишникова, д. 2А пв2ёг. s. a@gmail.com

Живрин Ярослав Эдуардович

студент кафедры информатики и информационных технологий Московский государственный университет печати имени Ивана Федорова 127550 Россия, г. Москва, ул. Прянишникова, д. 2А jargiv@ya.ru

Аннотация. В работе рассматриваются различные методы подготовки изображения к поиску объекта, а также методы распознавания объекта.

Ключевые слова: компьютерное зрение, OpenCV, бинаризация, контур, вейвлет-анализ, каскад Хаара, SURF.

Компьютерное зрение — это технология создания машин, которые могут производить обнаружение, отслеживание и классификацию объектов. Для обработки данных в ней применяются статистические методы, а также модели, построенные при помощи геометрии, физики и теории обучения.

Основным разделом компьютерного зрения является извлечение информации из изображения или последовательности изображений. Чаще всего это применяется для определения и распознавания объекта.

Распознавание объекта разделено на два этапа: фильтрация изображения и анализ результатов фильтрации.

Фильтрация. На этапе фильтрации используются различные методы, выделяющие на изображениях области интереса. Во время фильтрации не производится анализ объекта, но точки, которые проходят фильтрацию, можно рассматривать как области с особыми характеристиками. Среди методов можно выделить наиболее часто применяемые группы методов: определение краев, бинаризация, вейвлет-анализ и фильтрация функций.

Определение краев — термин, обозначающий набор математических методов, направленных на выявление точек в цифровом изображении, в которых яркость изображения резко меняется. Эти точки обычно организованы в виде набора кривых линий.

Выделенные края могут быть двух типов: независящие и зависящие от точки зрения. Независящие границы отображают такие свойства, как цвет и форма поверхности. Зависящие могут меняться в разных точках обзора и отображают геометрию сцены [8,9].

Бинаризация. Одним из наиболее простых и естественных способов бинаризации изображения является пороговое преобразование по яркости. Бинаризация — преобразование изображения в

монохромное. Обычно участки изображения, прошедшие фильтрацию, окрашиваются в белый, а все остальное изображение в черный. Один из наиболее быстрых и эффективных методов поиска порогового значения — метод, придуманный японским ученым Нобуюки Оцу, и основанный на обработке гистограммы яркости изображения.

В другом популярном способе бинаризации используется поиск объекта по цвету. Данному методу мешает влияние множества факторов. Например, освещенность. Видимый цвет — это результат взаимодействия спектра излучаемого света и поверхности. Поэтому если белый лист освещать красным светом, то и лист будет казаться красным. [4]

Проще всего использовать для детектора границ цветовую модель HSV. Для определения границ цветового пятна все три слоя цветового пространства отделяются друг от друга. Далее для каждого слоя устанавливаются пороговые значения. После сложения итогового изображения белыми пикселями на нем будут отображены те точки, в которых значения выше порогового во всех трех координатах цветовой модели.

Вейвлет-анализ. Традиционно сложилось, что во многих командах вейвлет-анализом называется поиск произвольного паттерна на изображении при помощи свёртки с моделью этого паттерна. Задача сводится к поиску объекта по шаблону с некоторыми допущениями. Хорошим примером использования расширенной трактовки вейвлетов является задачка поиска блика в глазу, для которой вейвлетом является сам блик.

Анализ результатов фильтрации. Среди множества способов обработки результатов фильтрации выделяют несколько: алгоритмы контурного анализа и алгоритмы на нейронных сетях.

Контурный анализ позволяет описывать и производить объекты, которые представлены в виде

своих внешних очертаний — контуров. Контур содержит всю необходимую информацию о форме объекта. Но внутренние точки объекта не учитываются. Это ограничивает образ применения контурного анализа, но позволяет перейти от двумерного пространства изображений к пространству контуров, что позволяет очень сильно снизить алгоритмическую и временную сложность программы. Обычно выделяют два алгоритма: метод «жука» и цепной код Фримана.

Алгоритмы на нейронных сетях. Одним из таких алгоритмов является каскад Хаара. Алгоритм, основанный на каскадах примитивов, на вейвлете Хаара и классификаторе AdaBoost.

Примитивы Хаара — признаки цифрового изображения, используемые в распознавании образов и основанные на вейвлете Хаара. Эти признаки представляют собой разделенные на две, три или четыре области прямоугольники, которые позиционируются на изображении. Интенсивность пикселей в каждой области суммируется, после чего вычисляется разность между суммами. Эта разность является значением данного признака Хаара [2, 7].

Другим часто используемым методом является SURF. Метод ищет ключевые точки при помощи матрицы Гессе. Этот метод позволяет найти стабильные ключевые точки, которые будут определяться даже при повороте объекта. Для каждой ключевой точки при помощи фильтров Хаара считается градиент, а из матрицы Гессе берется масштаб. Для каждой точки формируется дескриптор, состоящий из 64 или 128 чисел, каждое из которых обозначает флуктуации градиента вокруг точки.

В системе контроля на производстве гораздо легче использовать цветные маркеры и распознавание цвета, чем создавать и обучать нейронную сеть для классификации объекта. Так же, как и при детекции движения проще следить за изменением границ областей с различной яркостью. Но в системе

автоопределения автомобильных номеров или системе распознавания лиц, наоборот, вряд ли подойдет какой-либо метод, в котором не используются элементы искусственного интеллекта. Таким образом, все вышеперечисленные методы имеют свои преимущества.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Дэвид А. Форсайт, Джин Понс. Компьютерное зрение. Современный подход. — М., 2004.

2. Метод Виолы-Джонса как основа для распознавания лиц [Электронный ресурс] // Хабрахабр — URL: http://habrahabr.ru/post/ 133826 (дата обращения: 15.11.2015).

3. Обнаружение объектов методом Оцу [Электронный ресурс] // Хабрахабр — URL: http://habrahabr.ru/post/112079 (дата обращения: 15.11.2015).

4. OpenCV шаг за шагом. Поиск объекта по цвету — RGB [Электронный ресурс] // Робокрафт — URL: http://robocraft.ru/blog/computervision/ 365.html (дата обращения: 15.11.2015).

5. Детектор границ Канни [Электронный ресурс] // Хабрахабр — URL: http://habrahabr.ru/post/ 114589 (дата обращения: 15.11.2015).

6. Градиенты и оператор Собеля [Электронный ресурс] // Learning Open CV — URL: Шр://1ост.т^Ы/6.3_Градиенты_и_оператор_Со беля (дата обращения: 15.11.2015).

7. Признаки Хаара [Электронный ресурс] // Википедия — URL: https://en.wikipedia.org/wiki/ Признаки_Хаара (дата обращения: 15.11.2015).

8. Edge detection [Электронный ресурс] // Википедия — URL: https://en.wikipedia.org/wiki/ Edge_detection (дата обращения: 15.11.2015).

9. Попов Д.И. Компьютерная графика. — М.: Изд-во МГУП, 2009. — 70 с.

DETECTION OF OBJECTS ON A TWO-DIMENSIONAL IMAGE

Sergey Alecseevich Nozdrachev

Moscow State University of Printing Arts 127550Russia, Moscow, Pryanishnikova st., 2А

Yroslav Eduardovich Zhivrin

Moscow State University of Printing Arts 127550Russia, Moscow, Pryanishnikova st., 2А

Annotation. The paper discusses the various methods of preparation of the image to search for an object, and object recognition methods.

Keywords: Computing vision, OpenCV, binarization, contour, wavelet analysis, cascade of Haar, SURF.

i Надоели баннеры? Вы всегда можете отключить рекламу.