Научная статья на тему 'Метод предварительной фильтрации изображений для повышения точности распознавания образов'

Метод предварительной фильтрации изображений для повышения точности распознавания образов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
393
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПОЗНАВАНИЕ ОБРАЗОВ / ОБРАБОТКА ИЗОБРАЖЕНИЙ / КОНТУРНЫЙ АНАЛИЗ / БИЛАТЕРАЛЬНЫЙ ФИЛЬТР / ШОК-ФИЛЬТР

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Коваль Юлия Александровна, Филиппов Михаил Владимирович

Решение задачи распознавания тех или иных объектов на снимках, как правило, затруднено ввиду наличия разного рода искажений. В данной работе рассмотрен метод предобработки изображений с использованием билатерального фильтра и шок-фильтра для последующего распознавания образов методом контурного анализа. Приведена оценка качества распознавания при использовании указанных фильтров и без них. Качество распознавания оценивалось при разных параметрах фильтров.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Коваль Юлия Александровна, Филиппов Михаил Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The method of image pre-filtering to improve the accuracy of recognition

Solution of the recognition problem of various objects in images is usually difficult because of the presence of various kinds of distortions. This paper describes a method of pretreatment of images using bilateral and shock filters for subsequent pattern recognition method of contour analysis. Assessment of the recognition quality, when using these filters, and without filters for different parameters is made.

Текст научной работы на тему «Метод предварительной фильтрации изображений для повышения точности распознавания образов»

УДК 004.93

Метод предварительной фильтрации изображений для повышения точности распознавания образов

© Ю.А. Коваль, М.В. Филиппов МГТУ им. Н.Э. Баумана, Москва, 105005, Россия

Решение задачи распознавания тех или иных объектов на снимках, как правило, затруднено ввиду наличия разного рода искажений. В данной работе рассмотрен метод предобработки изображений с использованием билатерального фильтра и шок-фильтра для последующего распознавания образов методом контурного анализа. Приведена оценка качества распознавания при использовании указанных фильтров и без них. Качество распознавания оценивалось при разных параметрах фильтров.

Ключевые слова: распознавание образов, обработка изображений, билатеральный фильтр, шок-фильтр, контурный анализ.

Введение. Проблема автоматического определения заданных объектов на снимках, известная как распознавание образов, привлекает в последнее время внимание исследователей. Одна из основных трудностей, связанных с решением данной задачи, — низкое качество снимков, обусловленное различными искажениями. Например, на аэрофотографиях, получаемых с помощью летательных аппаратов, часто имеют место случайные помехи типа облачности, тумана, дымки [1], поэтому для задач распознавания объектов целесообразно использовать предобработку изображений.

В большинстве случаев для борьбы с такими случайными помехами применяют стандартные фильтры низких частот или медианные фильтры [2]. Однако эти фильтры не только частично устраняют шумы, но и размывают границы объектов, что затрудняет их распознавание. В данной статье рассмотрен метод предобработки изображения с помощью последовательного применения билатерального фильтра и шок-фильтра. Проведено исследование влияния предобработки с использованием данного метода на эффективность и скорость распознавания.

Метод контурного анализа. Для распознавания изображений, не обладающих внутренними деталями, применяется контурный анализ [3]. Этот метод позволяет распознавать объекты с измененным размером, а также с небольшим (до 15°) углом поворота. Возможна модификация для объектов, повернутых под любым углом.

Под контуром понимается граница объекта, т. е. совокупность точек (пикселов), отделяющих объект от фона. Контур кодируется последовательностью, состоящей из комплексных чисел. На контуре

фиксируется начальная точка. Затем контур обходится в заданном направлении (например, по часовой стрелке), и каждый вектор смещения V записывается комплексным числом:

V = х + ¡у,

где х — смещение точки по оси X; у — смещение по оси У.

Смещение берется относительно предыдущей точки контура. Смещение первой точки определяется относительно точки (0, 0). Вектор-контур Я длиной к можно обозначить следующим образом:

Я = (У о, Уь..., У к-1^

где у I — ¡-я точка контура.

Скалярным произведением контуров Я и N называется комплексное число

р = ( Я, N) = £ (уп, Ъп ),

п=0

где к — размерность контура; у п — п-й вектор контура Я; Ъп — п-й вектор контура N. Скалярное произведение векторов (у п, Ъп) вычисляется по формуле

(а + ¡Ъ, с + ¡ё) = (а + ¡Ъ)(с - ¡ё) = ас + Ъё + ¡(Ъс - аё). Чтобы вычислить степень сходства контуров, используется нормированное скалярное произведение (НСП):

т

л =-,

I Я | • | N |

где длины контуров вычисляются по формуле

1

( к— Л 2

Я |

Цу п|2

V п=0 У

Модуль НСП дает меру сходства контуров, а его аргумент — угол поворота контуров относительно друг друга (при сохранении начальной точки контура). Таким образом, можно найти одинаковые контуры на заданном изображении.

Билатеральная фильтрация. Билатеральный фильтр позволяет сглаживать изображения, устраняя шумы [4]. В отличие, например, от медианного фильтра билатеральный фильтр, сглаживая изображения, оставляет объекты достаточно четкими. Однако при этом контур изображения немного расплывается.

Основная идея билатерального фильтра — учесть близость между пикселами различных цветов и сделать переход цветов более последовательным, а изображение более сглаженным. Формула для расчета цвета каждого пиксела имеет вид

+х +х

\ | /(1)е(1- X)s(f (4) -/(XЫ К Х ) = -. (!)

| | е&- X(4) - f (X))4

-X -X

Интеграл в формуле (1) берется по всем пикселам изображения;

— Ц а(1-х) " с(1-х) = е а"

- ! Г я (f (4)- f (х)) *(f (4) - f (х)) = е 2^ а

где а (4- X) — расстояние между текущим пикселом и рассчитываемым; g ^(4) - f (X)) — разность цветовых значений текущего и

рассчитываемого пиксела; а а и аг — константы.

Поскольку на больших расстояниях от рассчитываемого пиксела функция с(4- X) будет стремиться к нулю, вклад в интеграл дают только пикселы, расположенные от этого пиксела не далее заданного радиуса.

Шок-фильтр. Для выделения четкой границы между зонами с разной интенсивностью цвета используется шок-фильтр [5]. Определить близость анализируемой точки к границе можно, вычислив градиент функции интенсивности цвета в этой точке, так как на границе он будет иметь наибольшее значение. Однако градиента недостаточно, чтобы узнать, к какой зоне интенсивности принадлежит пиксел, поскольку большие значения градиента также характеризуют отдельные пикселы, отличающиеся от общего фона. Для того

чтобы определить нужную зону, используется оператор Лапласа:

Дg =

gxx ^ gУУ,

где gxx, gyy — вторые производные от функции g по X и по у соответственно.

Если обозначить через f (X, у) исходное изображение, то выражение для шок-фильтра может быть представлено в виде

fi(*, У) = f (*, У) - asign(Af )| v/|, (2)

где sign — знаковая функция; Vf — градиент функции f; a — константа.

На основании формулы (2) можно сделать следующий вывод: если пиксел относится к зоне минимальной интенсивности цвета, его значение будет уменьшено, а в противном случае — увеличено. Таким образом, создается четкая граница раздела цветовых областей.

К недостаткам шок-фильтра относится создание помех в случае большого количества отдельных пикселов и шумов.

Алгоритм предварительной обработки снимков. Применение отдельно шок-фильтра или билатерального фильтра для предобработки нецелесообразно, так как шок-фильтр усиливает шумы, а билатеральный фильтр делает контур сложно выделяемым за счет размытости изображения. Поэтому в работе предложен алгоритм, основанный на последовательном применении сначала билатерального, а потом шок-фильтра. На рис. 1 представлены результаты использования данного алгоритма для предварительной обработки изображений.

Исходное изображение самолета (рис. 1, а) имеет размытые края и зашумлено. Применение билатерального фильтра приводит к сглаживанию шумов, но в то же время размывает границы фигуры (рис. 1, б). Шок-фильтр делает границы изображения четкими, но не усиливает шумы, так как они были минимизированы билатеральным фильтром (рис. 1, в).

а б в

Рис. 1

Результаты, получаемые при использовании алгоритма, и, соответственно, качество распознавания изображений зависят от констант а^ и аг, входящих в формулу (1) для билатерального фильтра, и от константы а из выражения (2) для шок-фильтра. Далее приведены результаты исследования влияния этих коэффициентов на качество распознавания.

На рис. 2, 3 показано влияние коэффициентов а^ и аг билатерального фильтра на качество распознавания (кривая 1). Значения НСП получены в результате контурного анализа, описанного в разд. 1. Чем меньше значение НСП, тем меньше подобие контуров, а значит, возможность распознавания объектов. Для сравнения на графиках показан результат, полученный без применения фильтров вообще (кривая 2).

Рис. 2

Рис. 3

При увеличении коэффициентов билатерального фильтра цвет объектов приближается к цвету фона и границы становятся менее разборчивыми, за счет чего при считывании контура возникают ошибки. В исходных примерах это особенно сказывается на крыльях самолетов, так как они окружены с двух сторон пикселами другого цвета, каждый из которых влияет на цвет результата.

На рис. 4 показано влияние коэффициента а шок-фильтра (кривая 1), для сравнения приведен также результат, полученный без

Значения НСП получены в результате контурного анализа, описанного в разд. 1.

Поскольку шумы, добавляемые шок-фильтром, не портят границы изображения, резкого снижения качества распознавания при увеличении коэффициента не наблюдается. Однако в отдельных местах может быть затронута граница, за счет чего качество может быть снижено.

Из графиков, приведенных на рис. 2-4, можно выбрать значения коэффициентов а^, аг и а, при которых вероятность правильного распознавания максимальна.

применения фильтров (кривая 2).

0,1 0,2 0,3 0,4 а

Рис. 4

С использованием подобранных коэффициентов была рассмотрена задача распознавания самолетов на тестовом аэрофотоснимке. Результаты были получены при отсутствии предварительной обработки (рис. 5) и с применением рассмотренного алгоритма фильтрации (рис. 6).

Рис. 6

Как видно из этих рисунков, предварительная фильтрация с использованием представленного алгоритма позволяет правильно распознать на 30 % больше объектов.

Заключение. В работе представлен метод предварительной обработки изображений с искаженными границами, основанный на последовательном применении билатерального фильтра и шок-фильтра. Показано, что в случае изображения, обработанного указанным способом, вероятность правильного распознавания объектов существенно повышается.

ЛИТЕРАТУРА

[1] Гонсалес Р., Вудс Р. Цифровая обработка изображений. Москва, Техносфера, 2005, 1072 с.

[2] Красильников Н.Н. Цифровая обработка 2D- и ЗБ-изображений. Санкт-Петербург, БХВ-Петербург, 2011, 608 с.

[3] Фурман Я.А. Введение в контурный анализ. Москва, ФИЗМАТЛИТ, 2003, 598 с.

[4] Tomasi C., Manduchi R. Bilateral Filtering for Grey and Color Images. Proceedings of the 1998 IEEE International Conference on Computer Vision. Bombay, India, 1998, pp. 839-848.

[5] Weickert J., Coherence-Encahncing Shock Filters. Lecture Notes in Computer Science. Springer, 2003, vol. 2781, pp. 1-8.

Статья поступила в редакцию 03.10.2014

Ссылку на эту статью просим оформлять следующим образом: Коваль Ю.А., Филиппов М.В. Метод предварительной фильтрации изображений для повышения точности распознавания образов. Инженерный журнал: наука и инновации, 2014, вып.12.

URL: http://engjournal.ru/catalog/it/hidden/1307.html

Коваль Юлия Александровна родилась в 1992 г., магистрант 2-го курса на кафедре «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Н.Э. Баумана. Область научных интересов: обработка изображений и распознавание объектов. e-mail: vaalfreja@gmail.com

Филиппов Михаил Владимирович родился в 1953 г., окончил МИФИ в 1977 г. Канд. техн. наук, доцент кафедры «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Н.Э. Баумана. Автор более 50 научных и учебно-методических публикаций в области автоматизированного проектирования, взаимодействия лазерного излучения с веществом и цифровой обработки изображений. Область научных интересов: разработка средств защиты информации и цифровая обработка сигналов. e-mail: filippov.mike@mail.ru

The method of image pre-filtering to improve the accuracy of recognition

© Yu.A. Koval, M.V. Filippov Bauman Moscow State Technical University, Moscow, 105005, Russia

Solution of the recognition problem of various objects in images is usually difficult because of the presence of various kinds of distortions. This paper describes a method of pretreatment of images using bilateral and shock filters for subsequent pattern recognition method of contour analysis. Assessment of the recognition quality, when using these filters, and without filters for different parameters is made.

Keywords: pattern recognition, image processing, bilateral filter, shock filter, contour analysis.

REFERENCES

[1] Gonzalez R.C., Woods R.E. Digital Image Processing. 2nd ed. Pearson Education, Inc., 2002.

[2] Krasilnikov N.N. Tsifrovaya obrabotka 2D i 3D izobrazheniy [ Digital processing of 2D- and 3D-images]. BHV-Petersburg, 2011, 608 p.

[3] Furman Ya.A. Vvedenie v konturnyi analiz [Introduction to circuit analy-sis].Moscow, FIZMATLIT, 2003, 598 p.

[4] Tomasi C., Manduchi R. Bilateral Filtering for Grey and Color Images. Proceedings of the 1998 IEEE International Conference on Computer Vision, Bombay, India, 1998, pp. 839-848.

[5] Weickert J. Coherence-Encahncing Shock Filters. Lecture Notes in Computer Science, vol. 2781, Springer, 2003, pp. 1-8.

Koval Yu.A. (b. 1992) studying for the 2nd course mage's degree at the Department of Computer Software and Information Technology in Bauman Moscow State Technical University. Research interests: digital image processing and object recognition. e-mail: vaalfreja@gmail.com

Filippov M.V. (b. 1953) graduated from Moscow Engineering Physics Institute in 1977. Ph.D., Assoc. Professor of the Software and Information Technologies Department of Bauman Moscow State Technical University. The author of more than 50 scientific and educational publications in the field of computer-aided design, the interaction of laser radiation with matter and digital signal processing. Research interests: digital signal processing, pattern recognition, the development of information security. e-mail: filippov.mike@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.