Научная статья на тему 'Применение ориентации градиента яркости для систем автосопровождения объектов'

Применение ориентации градиента яркости для систем автосопровождения объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
308
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
обработка изображений / автосопровождение целей / направление градиента яркости / эталонный фрагмент / image processing / target detection / gradient orientation / reference image

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Борисова Ирина Валентиновна, Легкий Владимир Николаевич, Кравец Сергей Александрович

Рассматривается задача автосопровождения объекта, находящегося на сложном естественном фоне. Обнаружение объекта производится в каждом кадре видеопоследовательности путем поточечного сопоставления с эталоном. Предлагаемый метод основан на представлении каждой точки изображения ориентацией градиента яркости в локальной окрестности. В зависимости от своей ориентации окрестности разделяются на классы. Помимо классов анизотропных окрестностей, вводится класс окрестностей с изотропной структурой. Классы нумеруются, и номер класса окрестности принимается в качестве признака рассматриваемой точки. После кодировки изображение сканируется эталоном, используемая мера близости – поэлементное сравнение (компарация). В результате формируется компарационная матрица, каждый элемент которой есть число совпадений элементов эталона и текущего фрагмента изображения. Локация объекта производится по максимальному значению компарационной матрицы. Для достижения устойчивого сопровождения применяется особое правило перезаписи эталона – динамическая мера близости. Результаты тестирования показали более устойчивое сопровождение объекта по сравнению с использованием нормированной корреляционной меры.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Борисова Ирина Валентиновна, Легкий Владимир Николаевич, Кравец Сергей Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of the gradient orientation for systems of automatic target detection

In this paper, a problem of automatic target tracking in complex natural backgrounds is considered. Target detection is performed in each frame of a video sequence by the elementwise comparison with a reference image. The proposed method is based on the representation of every pixel as the orientation of the luminance gradient in the vicinity. The vicinities are divided into classes depending on their orientation. In addition to the classes of anisotropic vicinities, a class of vicinities with an isotropic structure is introduced. The classes are numbered and the number of the vicinity class is used as a feature of the point of interest. Thus, the original gray-scale image is transformed to a pseudo-image in which the detection procedure is carried out. The encoded image is then scanned using a reference image. The elementwise comparison of the reference image with the current fragment is performed in a feature space. As a result, a comparison matrix is formed, each element of which is the number of matching elements of the reference image and the current image fragment. The position of the reference image is determined by the maximum value of the comparison matrix. A special rule of reference image overwriting, the so-called dynamic proximity measure, is used to achieve stable tracking. The testing results have shown that with our approach the object tracking is more stable in comparison with the use of normalized correlation.

Текст научной работы на тему «Применение ориентации градиента яркости для систем автосопровождения объектов»

ПРИМЕНЕНИЕ ОРИЕНТАЦИИ ГРАДИЕНТА ЯРКОСТИ ДЛЯ СИСТЕМ АВТОСОПРОВОЖДЕНИЯ ОБЪЕКТОВ

И.В. Борисова 1, В.Н. Легкий 1, С.А. Кравец 1 1Новосибирский государственный технический университет, Новосибирск, Россия

Аннотация

Рассматривается задача автосопровождения объекта, находящегося на сложном естественном фоне. Обнаружение объекта производится в каждом кадре видеопоследовательности путем поточечного сопоставления с эталоном. Предлагаемый метод основан на представлении каждой точки изображения ориентацией градиента яркости в локальной окрестности. В зависимости от своей ориентации окрестности разделяются на классы. Помимо классов анизотропных окрестностей, вводится класс окрестностей с изотропной структурой. Классы нумеруются, и номер класса окрестности принимается в качестве признака рассматриваемой точки. После кодировки изображение сканируется эталоном, используемая мера близости - поэлементное сравнение (компарация). В результате формируется компарационная матрица, каждый элемент которой есть число совпадений элементов эталона и текущего фрагмента изображения. Локация объекта производится по максимальному значению компарационной матрицы. Для достижения устойчивого сопровождения применяется особое правило перезаписи эталона - динамическая мера близости. Результаты тестирования показали более устойчивое сопровождение объекта по сравнению с использованием нормированной корреляционной меры.

Ключевые слова: обработка изображений, автосопровождение целей, направление градиента яркости, эталонный фрагмент.

Цитирование: Борисова, И.В. Применение ориентации градиента яркости для систем автосопровождения объектов / И.В. Борисова, В.Н. Легкий, С.А. Кравец // Компьютерная оптика. -2017. - Т.41, №.6 - С. 931-937. - БСЯ: 10.18287/2412-6179-2017-41-6-931-937.

Введение

Автоматизированные оптико-электронные системы обработки изображений, в частности системы автосопровождения объектов, должны учитывать следующие особенности задач обнаружения и распознавания объектов:

- объекты могут иметь малый контраст по отношению к фону;

- характеристики изображений фона не могут быть определены заранее;

- объекты должны обнаруживаться при частичном заслонении;

- видимый размер объектов и их ракурс могут изменяться;

- должна быть возможность обработки информации, полученной от различных датчиков, в разных спектральных диапазонах.

В основе многофункциональной обработки видеоинформации лежит пространство признаков изображений. Эти признаки должны быть достаточно универсальными, чтобы позволить реализовать все требуемые возможности системы. Заложенные в системе методы и алгоритмы обработки изображений должны строиться на едином выбранном пространстве признаков, а их адаптивность будет достигаться анализом и адаптацией признакового пространства.

Ориентация градиента яркости в окрестности как признак изображения является достаточно устойчивой к шумам и вариабельности шкалы яркости. Ориентация градиента используется для описания изображений различных спектральных диапазонов, для обнаружения, распознавания и сопровождения объектов, для фильтрации шумов, повышения визуального качества и т.д. [1].

Методы, использующие градиент яркости как локальный признак, можно разделить на две группы. Методы первой группы для сопоставления двух изображений объекта (или эталона и потенциального объекта) используют непосредственно ориентацию градиента яркости в окрестности [1, 2, 7 - 9]. Методы второй группы используют гистограммы направлений градиентов. На таком подходе основаны известные дескрипторы SIFT [3], HOG [4] и их многочисленные модификации [5, 6]. Переход к гистограммам позволяет обеспечить инвариантность к поворотам изображения объекта. Но, с другой стороны, отказ от информации о расположении элементов изображения в пространстве, т.е. построение гистограммы по всему объекту, дает низкие результаты сопоставления [5]. Поэтому предполагается разбиение изображения объекта на фрагменты (блоки), для каждого из которых формируются гистограммы направлений градиентов [4], или использование совокупности особых точек, описывающих объект [3].

Большинство методов первой группы основано на поэлементном сравнении квантованных значений направления градиента яркости объекта и эталона [1, 7, 8]. Этими методами могут сравниваться изображения, полученные при разных условиях освещения, в разное время и в разных диапазонах [7] или изображения реальных сцен и контурных эталонов [1, 8]. Альтернативный подход - формирование псевдоизображений для модулей и углов направлений градиента, вычисление по этим псевдоизображениям ковариационных матриц для объекта и эталона, расчет расстояния между ковариационными матрицами [9].

Предлагаемый метод отличается от аналогов дополнительной проверкой окрестностей на анизотроп-

ность. Признаком является не только направление градиента яркости в окрестности, но и отсутствие четко выраженной ориентации градиента, т.е. изотропность. Метод основывается на поэлементном сравнении с эталоном.

1. Фасетная модель изображений

Рассмотрим задачу автосопровождения объекта, который находится на сложном естественном фоне и имеет низкий контраст относительно фона. Элементы фона могут заслонять объект на некоторое время. Общая яркость изображения, а также его частей может изменяться. Для таких изображений алгоритмы сопоставления изображений, использующие непосредственно полутоновую информацию, например, корреляционные методы, оказываются неэффективными. Избавиться от яркостной зависимости позволяет описание изображений в терминах фасетной модели [2].

Фасетная модель описывает изображение как совокупность наклонных фасетов, т.е. плоскостей, ближайших к локальной окрестности, в смысле некоторого критерия (например, метода наименьших квадратов). Фасеты составляют с горизонтальной плоскостью двугранный угол и характеризуются величиной угла наклона и ориентацией в плоскости координат. Ориентация фасета в координатной плоскости совпадает с ориентацией вектора градиента яркости в данной локальной окрестности.

Разделим окрестности изображения на условные группы (классы) в зависимости от ориентации градиента яркости. Номер класса окрестности рассматриваемой точки изображения (нумерация классов может быть произвольной) принимается в качестве признака этой точки. Таким образом, формируется псевдоизображение, каждая точка которого кодируется номером класса окрестности.

Дискретные изображения, заданные на квадратной решетке, могут быть описаны моделью, использующей пять классов окрестностей С, I = 1+5. Первые четыре класса соответствуют направлениям градиента яркости, составляющим углы 0, р / 4, р / 2, 3я / 4 с горизонталью (беззнаковый градиент). Пятый класс составляют окрестности с изотропной структурой.

Характеристики вектора градиента яркости могут быть получены различными методами, в том числе при обработке окрестности изображения пространственными дифференциальными операторами (например, операторами Собела или Превитт). Также хорошие результаты показал метод локальных анизотропных признаков (ЛАП) [1]. В методе ЛАП для каждой локальной окрестности находится спектр Фурье, и анализируются суммы элементов энергетического спектра Ет и Еп - в направлении с максимальной энергией и в перпендикулярном направлении. Используя отношение Еп / Ет, окрестность V проверяется на изотропность:

Еп / Ет < в, V й С5

Еп / Ет > в, V е С/ ()

где в - порог анизотропности, С5 - класс изотропных окрестностей.

Для анизотропных окрестностей направление с максимальной энергией определяет ориентацию градиента и класс окрестности.

Проблема выделения изотропных окрестностей очень важна при поточечном сопоставлении с эталоном. Если структура окрестности близка к изотропной, т.е. окрестность не имеет четко выраженной анизотропии спектра, то существует большая вероятность определения ложных направлений. Признак, соответствующий такой точке, будет неустойчив и может меняться под воздействием шумов. Поэтому окрестности такого вида следует рассматривать как изотропные. Для этого требуется корректно определить порог анизотропности в. Эта процедура, названная «эффектом отскока», подробно описана в работе [1].

2. Компарационная мера близости

Мерой близости двух закодированных изображений одного размера служит компарационная функция:

5=ЕЕ§ кй, (2)

] к

где а(, к) и Ъ(, к) - элементы сравниваемых псевдоизображений, а 5 - символ Кронекера:

§ а(м) = IX а(j,к) = Ъ(j, к)

Ъ(м5 |0, а(^к) *Ъ(^к)•

Компарационная функция 5 дает количество совпадающих элементов закодированных изображений. Сравнивая закодированные эталон и текущие фрагменты анализируемого изображения в режиме двух-координатного сканирования, получаем компараци-онную матрицу (КМ).

Компарационная матрица аналогична корреляционной матрице, но в ином пространстве признаков. Признаком точки теперь является не яркость, а направление перепада яркости. При сравнении эталонного и анализируемого изображений местоположение эталона и его координаты определяются по максимальному значению КМ.

Когда эталон сравнивается с фрагментом фона, количество совпавших элементов случайно. Предположим, что значения признаков равновероятны. Тогда значения «фоновых» элементов КМ подчиняются биномиальному распределению:

Р(М,ж, р) = [М) -м , (3)

где Ж - площадь фрагментов, М - значение элемента КМ, р - вероятность совпадения классов в точке, q -вероятность несовпадения, p+q = 1.

Для обнаружения цели фоновые элементы КМ должны иметь как можно меньшие значения при неизменной величине компарационного пика. Это достигается выбором такого порога анизотропности в0, при котором пик распределения фоновых элементов мак-

симально смещен влево по оси М(рис. 1). Этот порог называется точкой отскока [1] и определяет оптимальный режим работы для заданных изображения и эталона. Для того чтобы найти точку отскока, строится кривая смещения координаты максимума распределения значений элементов КМ для разных порогов Q.

Р\

0,08 -

в=во о^о

0,07 0,06 0,05 0,04 0,03 0,02 0,01 О

Q=1

м

51 64 128 256

Рис. 1. Схема смещения максимума распределения фоновых элементов КМ при изменении порога анизотропности, W = 256

3. Сопровождение объекта

Рассмотрим систему автосопровождения объекта. Для простоты будем рассматривать только один объект, находящийся в поле зрения системы. Будем считать, что первый эталонный фрагмент уже имеется. Это фрагмент реального изображения, который указал оператор или выделила система обнаружения. В текущем кадре формируется зона поиска объекта. После кодировки фрагменты зоны поиска сравниваются с эталоном с использованием компарационной меры близости, при этом формируется компарационная матрица. Локация объекта производится по максимальному из полученных значений КМ. Обновление эталона происходит после каждого кадра. Если зафиксирован срыв слежения, то перезапись эталона запрещается до тех пор, пока объект не будет обнаружен.

Знание статистики КМ имеет очень важное значение, оно позволяет выполнять контроль достоверности результатов. Если компарационный пик лежит в области фоновых значений КМ, то результат нельзя принимать как достоверный. Основными причинами срыва слежения являются заслонение или затенение цели, а также попадание в эталон фрагментов окружающего фона.

Описанный алгоритм проиллюстрирован на рис. 2, приведена последовательность кадров с обнаруженными объектами. Размер объекта - 23x23 элемента.

Для устойчивого слежения и возможности продолжать автосопровождение в том случае, когда видна лишь часть цели или она на некоторое время совсем пропадает из поля зрения, используется динамическая мера близости (ДМБ) [10]:

Djk (1) = 1, 1 £ Djk (t) £ K " j, k,

[ Djk (t -1) + t1, Ujk (t) = Ujk (t -1) (4)

[Djk (t -1) -t2, Ujk (t) Ф Ujk (t -1),

Djk (t) = <

где Т1,Т2 > 0 - постоянные величины, г - количество перезаписей эталона, /(г) - элемент (/, к) эталона на шаге г, К - пороговое значение, определяется количеством сравнений эталона, необходимых для получения установившейся матрицы.

Рис. 2. Процедура поиска объекта с перезаписью эталона: а) начальный эталон (кадр 1), б) кадр 4, в) кадр 8, г) кадр 12, д) кадр 14

Смысл динамической меры близости состоит в том, что элементы эталона, не изменяющие свое значение от кадра к кадру, будут иметь больший «вес» по сравнению с остальными. Таким образом, производится адаптация эталона к форме движущегося объекта. При исчезновении объекта матрица ДМБ некоторое время сохраняет информацию о нем. Через некоторое количество кадров, определяемое величинами Т1 и Т2, эта информация стирается из кратковременной памяти, если объект снова не появится в поле зрения следящей системы. Кроме того, использование матрицы Б позволяет автоматически варьировать размеры эталона, согласуя их с размерами объекта.

На рис. 3 приведен пример матрицы Б, накопленной к 16-му кадру. Легко заметить, что элементы фона, присутствующие в эталонных фрагментах, имеют в этой матрице существенно меньший вес по сравнению с элементами объекта.

Рис. 3. Накопленная матрица динамической меры близости

Тестирование рассмотренного метода показало устойчивое сопровождение при кратковременном заслонении цели, в то время как при использовании классической нормированной корреляционной меры

наблюдалась потеря объекта (рис. 4). На рис. 5 приведены значения сформированных компарационной и корреляционной матриц для зоны поиска в кадре 16.

ИИ -

I

в

Рис. 4. Кадр 16 с найденными объектами при использовании компарационной меры близости ^) и корреляционной меры (б)

значения по строке Ю "

-15 -10 -5 0 5 10 15 У Рис. 5. Сечения матриц близости для кадра 16 по координатам объекта: а) горизонтальное, б) вертикальное

В качестве эталонов возможно использование не только фрагментов реальных изображений, но и графических изображений, в частности схематичных рисунков. Применение графических эталонов оправдано в начале слежения до накопления матрицы ДМБ и при срыве слежения.

При сравнении полутонового изображения и бинарного эталона точки отскока не существует. Для того чтобы набрать необходимую статистику случайных совпадений элементов, на бинарный графический эталон накладывается случайный шум. Дальнейшая процедура разделения окрестностей на классы и построения компарационной матрицы не отличается от сопоставления с полутоновым эталоном. На

рис. 6а приведен пример графического эталона с наложенным Гауссовым шумом (математическое ожидание шума равно нулю, дисперсия - 100). На рис. 6 б показан результат обнаружения объекта, соответствующего графическому эталону.

Рис. 6. Поиск объекта по графическому эталону: а) эталон, б) результат поиска

4. Анализ устойчивости к шумам

Было проведено сравнение обнаружения тестовых объектов при использовании компарационной и корреляционной меры близости. Эталонные фрагменты (рис. 7а) вырезались из изображений реальной сцены (рис. 7 б) и помещались на постоянный фон. Изображения сцены подбирались таким образом, чтобы элементы фона не перекрывали объект. Размер эталона -46x26 элементов, размер изображения сцены - 68x68 элементов, среднее квадратическое отклонение (СКО) значений яркости приведенного на рис. 6а эталона равнялось 43. К изображениям эталона и сцены добавлялся шум. Для исследования использовался аддитивный Гауссов шум с нулевым математическим ожиданием и переменной дисперсией и импульсный шум типа «соль и перец» с разной плотностью.

Рис. 7. Пример тестового эталонного фрагмента (а) и изображения сцены (б)

Устойчивость компарационного метода к шумам объясняется наличием процедуры выделения изотропных окрестностей. Поэтому для сравнения результатов окрестности разделялись на 4 анизотропных класса без выделения изотропностей и на 5 классов, с учетом изотропности. Результаты по сериям из 100 изображений приведены в табл. 1, 2.

На изображениях, искаженных Гауссовым шумом, компарационной мерой с выделением изотропности было обнаружено большее число объектов, чем корреляционной мерой. На изображениях, искаженных импульсным шумом, компарационная мера с выделением изотропности и корреляционная мера показали практически одинаковые результаты. Легко заметить, что без выделения изотропности компарационная мера показывает существенно худшие результаты.

Табл. 1. Сравнительные результаты обнаружения методами компарации и корреляции при Гауссовом шуме

СКО шума Обнаруженные объекты, %

Компарация Корреляция

5 классов 4 класса

40 100 100 100

60 85 80 73

80 56 35 31

100 35 15 20

Табл. 2. Сравнительные результаты обнаружения методами компарации и корреляции при импульсном шуме

Плотность шума, % Обнаруженные объекты, %

Компарация Корреляция

5 классов 4 класса

10 100 100 100

20 59 40 62

25 48 32 45

30 20 7 18

Заключение

Рассмотренный метод автосопровождения целей эффективен, если параметры движения объекта и носителя, на котором установлен датчик изображений, обеспечивают сопоставимость кадров в темпе перезаписи эталона. Поточечное сопоставление с эталоном, вообще говоря, не обеспечивает инвариантности к изменению масштаба и поворотам. Смена масштаба эталона должна производиться исходя из анализа матрицы динамической меры близости.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Если эталонный объект обладает ярко выраженной анизотропией структуры, рассмотренный метод формирования КМ может быть модифицирован, для того чтобы обеспечить инвариантность к повороту в плоскости изображения. Для эталона формируется гистограмма направлений градиентов. Затем выполняется циклический сдвиг гистограммы таким образом, чтобы пик гистограммы соответствовал первому направлению. Гистограмма направлений для текущего фрагмента изображения строится аналогично и сравнивается с эталонной. Фрагменты изображения, в которых гистограммы направлений градиента наиболее близки к эталонной, поворачиваются на соответствующий угол, кодируются и сравниваются с эталоном. Либо наоборот, заранее формируется набор повернутых эталонов, и сравнение проводится с эталоном, соответствующим пику гистограммы направлений.

Процедура выделения изотропных окрестностей повышает устойчивость обнаружения к шумам. Выбор оптимальных параметров и сама процедура обнаружения выполняются автоматически.

Реализация рассмотренного метода производилась на программируемом модуле, выполненном на нейро-процессорах NM6403 с тактовой частотой 40 МГц. За счет поддержки данными нейропроцессорами вектор-но-матричного умножения удалось организовать параллельное выполнение операций при кодировании изображений и вычислении компарационной матрицы. Время выполнения операций на процессорах для поиска эталона размером 20x20 элементов в зоне поиска размером 40x40 элементов составило 28 мсек.

Литература

1. Попов, П.Г. Практическое применение эффекта «отскока» в обработке изображений / П.Г. Попов, И.В. Борисова // Оптический журнал. - 1999. - Т. 66, № 4. - С. 94-101.

2. Haralick, R.M. A facet model for image data / R.M. Haralick, L.T. Watson // Computer Graphics and Image Processing. - 1981. - Vol. 15, Issue 2. - P. 113-129. -DOI: 10.1016/0146-664X(81)90073-3.

3. Lowe, D.G. Object recognition from local scale-invariant features / D.G. Lowe // Proceedings of the International Conference on Computer Vision. - 1999. - Vol. 2. -P. 1150-1157. - DOI: 10.1109/ICCV.1999.790410.

4. Dalal, N. Histograms of oriented gradients for human detection / N. Dalal, B. Triggs // Computer Vision and Pattern Recognition. - 2005. - Vol. 1. - P. 886-893. - DOI: 10.1109/CVPR.2005.177.

5. Мирамонте-Харамилло, Д. Алгоритм сопоставления изображений на основе скользящих гистограмм направленных градиентов / Д. Мирамонте-Харамилло, В.Х. Диас-Рамирес, В.И. Кобер, В.Н. Карнаухов // Информационные процессы. - 2014. - Т. 14, № 1. - С. 56-63.

6. Лукашевич, П.В. Масштабно-инвариантный алгоритм обнаружения областей изображений / П.В. Лукашевич, Б.А. Залесский // Информатика. - 2011. - № 3. - С. 118-128.

7. Haber, E. Intensity gradient based registration and fusion of multi-modal images / E. Haber, J. Modersitzki // International Conference on Medical Image Computing and Computer-Assisted Intervention. - 2006. - Vol. 9. - P. 726733. - DOI: 10.1007/11866763_89.

8. Блохинов, Ю.Б. Поиск трехмерных объектов на изображениях на основе динамически формируемых контурных эталонов / Ю.Б. Блохинов, А.С. Чернявский // Механика, управление и автоматика. - 2012. - № 2(8). - С. 181-188.

9. Борискевич, И.А. Адаптивная ковариационная стабилизация видеоизображения / И.А.Борискевич, В.Ю.Цветков // Доклады Белорусского государственного университета информатики и радиоэлектроники. -2015. - № 5(91). - С. 60-66.

10. Попов, П.Г. Динамическая мера близости изображений: Часть II: Кратковременная память. Системы контроля / П.Г. Попов // Автометрия. - 1994. - № 2. - С. 47-54.

Сведения об авторах

Борисова Ирина Валентиновна, 1967 года рождения, в 1989 году окончила с отличием Новосибирский электротехнический институт (сейчас Новосибирский государственный технический университет, НГТУ) по специальности «Прикладная математика», в 2000 г. защитила диссертацию на соискание степени кандидата технических наук. Работает доцентом кафедры автономных информационных и управляющих систем в НГТУ. Область научных интересов: математические методы обработки изображений, распознавание образов. E-mail: i.v. borisova@corp.nstu.ru .

Легкий Владимир Николаевич, 1957 года рождения, в 1981 году окончил Новосибирский электротехнический институт (сейчас НГТУ) по специальности «Радиомеханические и оптоэлектронные приборные устройства». Кандидатскую диссертацию защитил в 1986 г., докторскую - в 2002 г. Работает в НГТУ заведующим кафедрой автономных информационных и управляющих систем. Область научных интересов: системы ближней локации, оптоэлектронные системы обнаружения и распознавания объектов. E-mail: sniios@mail.ru .

Кравец Сергей Александрович, 1990 года рождения, в 2015 году окончил магистратуру Новосибирского государственного технического университета по направлению «Управление в технических системах». На данный момент проходит обучение в аспирантуре на кафедре автономных информационных и управляющих систем по направлению «Управление в технических системах». Область научных интересов: системы обнаружения и классификации объектов, искусственные нейронные сети. E-mail: santoserg@yandex.ru .

ГРНТИ: 28.23.15 Поступила в редакцию 17 июля 2017 г. Окончательный вариант

9 ноября 2017 г.

APPLICATION OF THE GRADIENT ORIENTATION FOR SYSTEMS OF AUTOMATIC TARGET DETECTION

I. V. Borisova1, V.N. Legkiy1, S.A. Kravets1 'Novosibirsk State Technical University, Novosibirsk, Russia

Abstract

In this paper, a problem of automatic target tracking in complex natural backgrounds is considered. Target detection is performed in each frame of a video sequence by the elementwise comparison with a reference image. The proposed method is based on the representation of every pixel as the orientation of the luminance gradient in the vicinity. The vicinities are divided into classes depending on their orientation. In addition to the classes of anisotropic vicinities, a class of vicinities with an isotropic structure is introduced. The classes are numbered and the number of the vicinity class is used as a feature of the point of interest. Thus, the original gray-scale image is transformed to a pseudo-image in which the detection procedure is carried out. The encoded image is then scanned using a reference image. The elementwise comparison of the reference image with the current fragment is performed in a feature space. As a result, a comparison matrix is formed, each element of which is the number of matching elements of the reference image and the current image fragment. The position of the reference image is determined by the maximum value of the comparison matrix. A special rule of reference image overwriting, the so-called dynamic proximity measure, is used to achieve stable tracking. The testing results have shown that with our approach the object tracking is more stable in comparison with the use of normalized correlation.

Keywords: image processing, target detection, gradient orientation, reference image.

Citation: Borisova IV, Legkiy VN, Kravets SA. Application of the gradient orientation for systems of automatic target detection. Computer Optics. 2017; 41(6): 931-937. DOI: 10.18287/24126179-2017-41-6-931-937.

References

[1] Popov PG, Borisova IV. Practical use of the rebound effect in image processing. J Opt Technol 1999; 66(4): 360-366. DOI: 10.1364/J0T.66.000360.

[2] Haralick RM, Watson LT. A facet model for image data. Computer Graphics and Image Processing 1981; 15(2): 113-129. DOI: 10.1016/0146-664X(81)90073-3.

[3] Lowe DG. Object recognition from local scale-invariant features. Proc of the International Conference on Computer Vision 1999; 2: 1150-1157. DOI: 10.1109/ICCV.1999.790410.

[4] Dalal N, Triggs B. Histograms of oriented gradients for human detection. CVPR 2005; 1: 886-893. DOI: 10.1109/CVPR.2005.177.

[5] Miramontes-Jaramillo D, Diaz-Ramirez VH, Kober V, Karnaukhov V. A novel image matching algorithm based on sliding histograms of oriented gradients. Journal of

Communications Technology and Electronics 2014; 59(12): 1446-1450. DOI: 10.1134/S1064226914120146.

[6] Lukashevich PV, Zalessky BA. Scale invariant algorithm for matching image regions [In Russian]. Informatics 2011; 3: 118-128.

[7] Haber E, Modersitzki J. Intensity gradient based registration and fusion of multi-modal images. MICCAI 2006; 9: 726-733. DOI: 10.1007/11866763_89.

[8] Blokhinov YuB, Chernyavskiy AS. The search for three-dimensional objects in images based on dynamically generated contour templates [In Russian]. Mechanics, Control and Informatics 2012; 2(8): 181-188.

[9] Baryskievic IA, Tsviatkou VYu. Adaptive covariance stabilization of video image [In Russian]. Doklady BGUIR 2015; 5(91): 60-66.

[10] Popov PG. Dynamical measure of the images relationship. Part II: Short-time memory and the control systems [In Russian]. Avtometriya 1994; 2: 47-54.

Authors' information

Irina V. Borisova (b. 1967) graduated with honour (1989) from Novosibirsk Institute of Electrical Engineering (presently, Novosibirsk State Technical University), majoring in Applied Mathematics. She received her PhD in Engineering in 2000. Currently she works as associate professor at Autonomous Information and Control Systems department in NSTU. Research interests are currently focused on computer image processing and pattern recognition. E-mail: i.v. borisova@corp.nstu.ru .

Vladimir N. Legkiy (b. 1957) graduated (1981) from Novosibirsk Institute of Electrical Engineering (presently, Novosibirsk State Technical University), majoring in Radio-mechanical and Optoelectronic Devices. He received his PhD in Engineering in 1986. He received a Doctor in Engineering degree in 2002. Currently he works as the Head of Autonomous Information and Control Systems department in NSTU. Research interests are currently focused on near-field systems, optoelectronic systems for target detection and recognition. E-mail: sniios@mail.ru .

Sergey A. Kravets (b. 1990) received a master's degree in «Management of Engineering Systems» at Novosibirsk State Technical University in 2015. Currently he studies as a postgraduate student of Autonomous Information and Control Systems department in NSTU. Research interests are currently focused on systems for target detection and recognition, artificial neural networks. E-mail: santoserg@yandex.ru .

Received July 17, 2017. The final version - November 9, 2017.

i Надоели баннеры? Вы всегда можете отключить рекламу.