Научная статья на тему 'АНАЛИЗ ИНВАРИАНТНОСТИ МЕР БЛИЗОСТИ ДЛЯ ПОИСКА ОБЪЕКТА ПО ШАБЛОНУ ПРИ ВРАЩЕНИИ И МАСШТАБИРОВАНИИ ИЗОБРАЖЕНИЯ'

АНАЛИЗ ИНВАРИАНТНОСТИ МЕР БЛИЗОСТИ ДЛЯ ПОИСКА ОБЪЕКТА ПО ШАБЛОНУ ПРИ ВРАЩЕНИИ И МАСШТАБИРОВАНИИ ИЗОБРАЖЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
110
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАБОТКА ИЗОБРАЖЕНИЯ / ПОИСК ЦЕЛИ / МЕРЫ БЛИЗОСТИ / МЕТРИКА РАССТОЯНИЙ / ИНВАРИАНТНОСТЬ К ПОВОРОТУ / МАСШТАБ ИЗОБРАЖЕНИЯ / IMAGE PROCESSING / TARGET DETECTION / PROXIMITY MEASURE / CHAMFERDISTANCE / ROTATION INVARIANCE / IMAGE SCALE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Утев Дмитрий Андреевич, Борисова Ирина Валентиновна, Ющенко Валерий Павлович

В работе рассматривается вопрос устойчивости обнаружения объектов на изображениях с помощью мер близости. Целью работы является определение степени инвариантности различных мер близости для поиска объектов по шаблону при вращении и масштабировании сканируемого изображения и выявление меры близости, наиболее устойчивой к данным геометрическим преобразованиям изображения. Анализируемые меры близости: корреляционная, компарационная, метрика расстояний до границ(ChamferDistance). Моделирование производится в пакете программ Matlab. Для тестирования мер близости создана база из тридцати телевизионных изображений. Изображения представляют собой сцены, содержащие искомые объекты - цели, с имитацией как сложного, так и простого фона. Определено, что все рассматриваемые меры близости устойчиво определяют цель при небольших поворотах и коэффициентах масштабирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Утев Дмитрий Андреевич, Борисова Ирина Валентиновна, Ющенко Валерий Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF ROTATION AND SCALE INVARIANCE FOR PROXIMITY MEASURES IN TARGET DETECTION

The problem of stability of object detection in images using proximity measures is considered. The purpose of the work is to determine the degree of invariance of various proximity measures for detecting objects by reference when rotating and zooming the scanned image. The proximity measure that is most resistant to these geometric transformations of the image is found out. The proximity measures are analyzed: correlation, comparison, Chamfer Distance. The target location is based on the coordinates of the extremum of the target function. Modeling is performed in the Matlab software package. A database of thirty television images was created to test the proximity measures. Test images contain the required objects and imitations of both complex and simple backgrounds. It was determined that all considered proximity measures steadily determine the target with small turns and scaling factors.

Текст научной работы на тему «АНАЛИЗ ИНВАРИАНТНОСТИ МЕР БЛИЗОСТИ ДЛЯ ПОИСКА ОБЪЕКТА ПО ШАБЛОНУ ПРИ ВРАЩЕНИИ И МАСШТАБИРОВАНИИ ИЗОБРАЖЕНИЯ»

УДК 004.932.72

DOI: 10.33764/2618-981X-2020-8-2-100-106

АНАЛИЗ ИНВАРИАНТНОСТИ МЕР БЛИЗОСТИ

ДЛЯ ПОИСКА ОБЪЕКТА ПО ШАБЛОНУ ПРИ ВРАЩЕНИИ

И МАСШТАБИРОВАНИИ ИЗОБРАЖЕНИЯ

Дмитрий Андреевич Утев

Новосибирский государственный технический университет, 630073, Россия, г. Новосибирск, пр. К. Маркса, 20, аспирант кафедры автономных информационных и управляющих систем, тел. (999)451-65-28, e-mail: yoh60438@gmail.com

Ирина Валентиновна Борисова

Новосибирский государственный технический университет, 630073, Россия, г. Новосибирск, пр. К. Маркса, 20, кандидат технических наук, доцент кафедры автономных информационных и управляющих систем, тел. (383)346-26-23, e-mail: i.v.borisova@corp.nstu.ru

Валерий Павлович Ющенко

Новосибирский государственный технический университет, 630073, Россия, г. Новосибирск, пр.К. Маркса, 20, доктор технических наук, профессор кафедры автономных информационных и управляющих систем, тел. (383)346-26-23, e-mail: jwp@aport2000.ru

В работе рассматривается вопрос устойчивости обнаружения объектов на изображениях с помощью мер близости. Целью работы является определение степени инвариантности различных мер близости для поиска объектов по шаблону при вращении и масштабировании сканируемого изображения и выявление меры близости, наиболее устойчивой к данным геометрическим преобразованиям изображения. Анализируемые меры близости: корреляционная, компарационная, метрика расстояний до границ(ChamferDistance). Моделирование производится в пакете программ Matlab. Для тестирования мер близости создана база из тридцати телевизионных изображений. Изображения представляют собой сцены, содержащие искомые объекты - цели, с имитацией как сложного, так и простого фона. Определено, что все рассматриваемые меры близости устойчиво определяют цель при небольших поворотах и коэффициентах масштабирования.

Ключевые слова: обработка изображения, поиск цели, меры близости, метрика расстояний, инвариантность к повороту, масштаб изображения.

ANALYSIS OF ROTATION AND SCALE INVARIANCE FOR PROXIMITY MEASURES IN TARGET DETECTION

Dmitry A. Utev

Novosibirsk State Technical University, 20, Prospekt K. Marksa, Novosibirsk,630073, Russia, Ph. D. Student, Department Autonomous Information and Control Systems, phone: (999)451-65-28, e-mail: yoh60438@gmail.com

Irina V. Borisova

Novosibirsk State Technical University, 20, Prospekt K. Marksa, Novosibirsk,630073, Russia, Ph. D., Assoc. Prof., Department of Autonomous Information and Control Systems, phone: (383)346-26-23, e-mail: i.v.borisova@corp.nstu.ru

Valery P. Yushchenko

Novosibirsk State Technical University, 20, Prospekt K. Marksa, Novosibirsk,630073, Russia, D. Sc, Prof., Department of Autonomous Information and Control Systems, phone: (383)346-26-23, e-mail: jwp@aport2000.ru

The problem of stability of object detection in images using proximity measures is considered. The purpose of the work is to determine the degree of invariance of various proximity measures for detecting objects by reference when rotating and zooming the scanned image. The proximity measure that is most resistant to these geometric transformations of the image is found out. The proximity measures are analyzed: correlation, comparison, Chamfer Distance. The target location is based on the coordinates of the extremum of the target function. Modeling is performed in the Matlab software package. A database of thirty television images was created to test the proximity measures. Test images contain the required objects and imitations of both complex and simple backgrounds. It was determined that all considered proximity measures steadily determine the target with small turns and scaling factors.

Key words: image processing, target detection, proximity measure, ChamferDistance, rotation invariance, image scale.

Введение

На сегодняшний день существует несколько подходов к обнаружению объектов на изображениях [1-5]. Одни методы основаны на применении различных мер близости для поиска объекта по шаблону на полутоновом изображении. В работе [6] проведен сравнительный анализ трех мер близости: корреляционной, компарационной и метрики расстояния до границ (ChamferDistance). В за-ключенииработы авторы говорят о преимуществе метрики ChamferDistanceнад остальными исследуемыми мерами. Другие методы, такие как SIFT [7], HOG [8] и их различные модификации [9- 11] используют гистограммы направленных градиентов для поиска. Данные группы методов обладают инвариантностью к геометрическим и фотометрическим преобразованиям изображения.

Целью настоящей работы является исследование инвариантности корреляционной, компарационной мер близости и ChamferDistance к повороту и масштабированию изображения.

Методы обнаружения объектов на изображениях

Поиск объекта на изображении осуществляется сканированием изображения окном, линейные размеры которого соответствуют размерам эталона, с применением различных мер близости.

Корреляционная мера близости. Для поиска объекта на изображении с помощью корреляционной меры близости рассчитывают корреляционную функцию [12] (1):

N-1M-1 - -

X Z(b( x1+x у+y) - b)(d (x y) - d)

У1) = ^^-rrrr-, (1)

где Ь(х,у) и d(х, у) - яркости элемента фрагмента изображения и элемента эта-

лона размером ИхМ; Ь и d- средние яркости по фрагменту и шаблону соответственно; Бъ и Dd - дисперсии яркости по фрагменту и эталону.

Местоположение объекта определяется по максимуму корреляционной функции.

Компарационная мера близости отличается от корреляционной пространством признаков, в котором происходит вычисление [13]. Если в корреляционной матрице признаком точки является яркость, то в компарационной - направление перепада яркости.

Рассматривается фасетная модель изображения [14], которая описывает реальное изображение как совокупность наклонных фасетов (плоскостей, ближайших к локальной окрестности). Ориентация фасета в координатной плоскости совпадает с ориентацией вектора градиента яркости в локальной окрестности [15]. Дискретное изображение с помощью порога анизотропности делят на пять классов, первые четыре соответствуют направлениям градиента 0, я/4, я/2, 3п/4, а пятый - окрестности с изотропной структурой. Для анизотропных окрестностей направление с максимальной энергией определяет ориентацию градиента и класс окрестности [16].

Компарационная функция рассчитывается по формуле (2):

5-II (2)

где а(у, к) и с(у, к) - элементы сравниваемых закодированных изображений, 8 -символ Кронекера[17]:

А У к) = ^ а( Ук) = с( Ук) 0, а( у, к) ф с( у, к )'

,к)_ ' 7 7 /оч

°с(у,к) , (3)

По функции (2) рассчитывается количество совпадений закодированных изображений.Сравнивая закодированные фрагменты и шаблон в каждой точке изображения, строится компарационная матрица изображения (КМ).

Так как при сравнении объекта и фрагмента фона количество совпадений случайно, то будем считать, что распределение фоновых элементов КМ подчиняется биноминальному распределению:

Р(М,К, р) -

í Т/ГлЛ

рМ^"М, (4)

К

М

\1У1У

где К - площадь фрагментов, М-значение элемента КМ, р-вероятность совпадения классов в точке, д - вероятность несовпадения,при этомр+д=1.

Локация объекта осуществляется по максимуму КМ.

СЬат/вгВ181апсв. В основе метода СЬашГегБ1в1апсе [18] лежитметри-ка01в1апсеТгапв1огш. Исходное изображение и эталон подвергается бинаризации, а следом - кодированию. В бинарном изображении элементы со значением 1 соответствуют точкам расположения границ объектов, остальные 0. В процессе кодирования элементы матрицы, соответствующие расположению контура на бинарном изображении, заполняются нулями, остальные - расстояниямидо ближайшего контура. Полученные матрицы сопоставляются и строится функция, соответствующая сумме значений элементов (5):

N-1К-1

С (х1, У0 = XX ^(X У) ■Т (х1 + х,У1 + У), (5)

х=0 У=0

где db (х, y)- значения элементов бинарного эталона, Г-матрица расстояний до границ.

Координаты цели определяются по минимуму функции (5).

Результаты исследования

Для проведения анализа была создана база из тридцати телевизионных изображений. Изображения представляют собой сцены, содержащие искомые объекты - цели, с имитацией как сложного, так и простого фона. Моделирование проводилось в пакете прикладных программ Matlab [19] с шагом изменения угла поворота в 1о и коэффициента масштабирования в 0.01 раз. Для бинаризации изображения применялся детектор контуров Canny [20].

Пример эталонов различных изображений представлен на рис. 1, а обнаруженных объектов при угле поворота 10о - на рис. 2.

Рис. 1. Эталоны

Рис. 2. Обнаруженные объекты. 103

По данным моделирования были построены графики, определяющие границы инвариантности мер близости повернутого изображения (рис 3, а) и изображения с измененным масштабом (рис 3, б, в). При вращении изображения корреляционная и компарационная мера близости устойчиво работают при угле поворота до 15о, метрика СЬашГегБ1в1апсе - 20о. При изменении масштаба СИашГегВ1в1апсе увереннолоцирует объекты в диапазонезначений коэффициента масштабирования от 0.9 до 1.13, компарационная мера от 0.85 до 1.2, корреляционная от 0.84 до1.22 в среднем.

18 24

Угол поворота, град.

Корреляционная мера близости Компарационная мера близости Chamfer Distance

1.45

Коэфф. масшт., раз Корреляционная мера близости Компарационная мера близости Chamfer Distance

а)

б)

ОМ 0.S8 0.82 0.76

Коэфф. масшт., раз Корреляционная мера близости Компарационная мера близости Chamfer Distance

Рис. 3. Границы устойчивости мер близости.

Заключение

При анализе различных мер близости на инвариантность при вращении и масштабировании изображения определено, что с помощью исследуемых мер близости уверенно обнаруживаются объекты на изображениях при небольших геометрических преобразованиях: вращении изображений в пределах от 10 до 20 градусов и изменении масштаба с диапазоном коэффициента масштабирования 0.85 - 1.2 раз. Метрика СЬашГегВ1в1апееобеспечивает наилучшее обнаружение при повороте изображения, но уступает другим мерам близости при масштабировании. Разница между компарационной и корреляционной мерой минимальна в пользу последней. Необходимо отметить, что полученные границы устойчивости исследуемых мер значительно ниже, чем у методов, основанных на применении гистограмм направленных градиентов.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Гонсалес, Р. Цифровая обработка изображений: пер. с англ. / Р. Гонсалес, Р. Вудс ; под ред. П. А. Чочиа. - М.: Техносфера, 2005. - 1072 с.

2. Басараб, М. Цифровая обработка сигналов и изображений / М. Басараб, В. Волосюк, О. Горячкин. - М.: ФИЗМАТЛИТ, 2007. - 552 с.

3. Гальчук, И.В. Методы выделения малоразмерных подвижных объектов на сложном фоне / И.В. Гальчук, А.Г. Костевич // Тр. юбилейной науч.-техн. конф. по радиоэлектронике, посвященной 50-летию РТФ. - Томск, 2000. - Т. 5. - С. 82-86.

4. Солонина, А.И. Алгоритмы и процессоры цифровой обработки сигналов [Текст] / А.И. Солонина, Д. А. Улахович, Л. А. Яковлев. - СПб.: БХВ-Петербург, 2002. - 464 с.

5. Дуда Р. Распознавание образов и анализ сцен: пер. с англ. / Р. Дуда, П. Харт; под ред. В.Л. Стефанюка. - М: Изд-во «МИР», 1976. - 509 с.

6.Анализ мер близости для поиска объектов по шаблону / И. В. Борисова, В. Н. Легкий, Д. А. Утев и др. // Известия высших учебных заведений. Поволжскийрегион. Техническиена-уки. - 2018. - № 3 (47). - С. 36-46.- DOI 10.21685/2072-3059-2018-37. Lowe, D.G. Objectrecognition from local scale-invariant features / D.G. Lowe // Proceedings

of the International Conference on Computer Vision. - 1999. - Vol. 2. - P. 1150-1157. - DOI: 10.1109/ICCV.1999.790410.

8. Dalal, N. Histograms of oriented gradients for human detection / N. Dalal, B. Triggs // Computer Vision and Pattern Recognition. - 2005. - Vol. 1. - P. 886-893. - DOI: 10.1109/CVPR.2005.177.

9. Лукашевич, П. В. Масштабно-инвариантный алгоритм обнаружения областей изображений / П.В. Лукашевич, Б.А. Залесский // Информатика. - 2011. - № 3. - С. 118-128.

10. Мирамонте-Харамилло Д. Алгоритм сопоставления изображений на основе скользящих гистограмм направленных градиентов / Д. Мирамонте-Харамилло, В.Х. Диас-Рамиреси др.// Информационные процессы. - 2014. - Т. 14, № 1. - С. 56-63.

11. Rublee E., ORB: an efficient alternative to SIFT or SURF /E. Rublee, V. Rabaud, K. Konolige, G. Bradski // IEEE International Conference on Computer Vision, -2011, - P. 2564-2571.

12.Борисова И. В. Цифровые методы обработки информации: учебное пособие [Текст] / И. В. Борисова. - Новосибирск: Изд-во НГТУ, 2014.- 139 с.

13.Борисова, И.В. Применение ориентации градиента яркости для систем автосопровождения объектов / И.В. Борисова, В.Н. Легкий, С.А. Кравец // Компьютерная оптика. - 2017. -Т.41, №.6 - С. 931-937. - DOI: 10.18287/2412-6179-2017-41-6-931-937

14. Haralick, R.M. A facet model for image data / R.M. Haralick, L.T. Watson // Computer Graphics and Image Processing. - 1981. - Vol. 15, Issue 2. - P. 113-129. - DOI: 10.1016/0146-664X(81)90073-3.

15. Попов П.Г., Локальные анизотропные признаки изображений / П. Г. Попов // Оптический журнал. - 1994. - № 2. - С.36.

16. Попов, П.Г., Практическое применение эффекта «отскока» в обработке изображений / П.Г. Попов, И.В. Борисова // Оптический журнал. - 1999. - Т. 66, № 4. - С. 94-101.

17. Броневич А.Г., Анализ неопределенности выделения информативных признаков и представлений изображений/ А. Г. Броневич,А. Н. Каркищенко, А. Е. Лепский.-М:ФИЗМАЛИТ, 2013. - 320с.

18. Borgefors, G. Distancetransformationsindigitalimages / G. Borgefors // ComputerVision, Graphics, andlmageProcessing. - 1986. - Vol. 34, № 3. - P. 344-371.

19. Гонсалес Р., Цифровая обработка изображений в среде MATLAB./ Р. Гонсалес, Р. Вудс, С. Эддинс. - М: Техносфера, 2006. - 616с.

20. Canny J. A Computational Approach to Edge Detection / J. Canny // IEEE transactions on pattern analysis and machine intelligenc. - 1986. - Vol. 6. - P. 679-698.

© Д. А. Утев, И. В. Борисова, В. П. Ющенко, 2020

i Надоели баннеры? Вы всегда можете отключить рекламу.