Научная статья на тему 'Адаптивное выделение мелких объектов на цифровых изображениях'

Адаптивное выделение мелких объектов на цифровых изображениях Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
209
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФИЛЬТРАЦИЯ / FILTERING / ЛОКАЛИЗАЦИЯ ОБЪЕКТОВ НА ИЗОБРАЖЕНИЯХ / LOCALIZATION OF THE OBJECTS IN IMAGES / АДАПТИВНАЯ ПОРОГОВАЯ ОБРАБОТКА / ADAPTIVE THRESHOLDING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Волков В.Ю.

Задача обнаружения и локализации протяженных мелких объектов различных размеров и формы встречается в радиотехнических системах наблюдения, которые используют радары с синтезированной апертурой, лидары, инфракрасные и телевизионные камеры. Основной трудностью при обработке является интенсивный и нестационарный фон. Эта задача решается с использованием ориентированной фильтрации, адаптивной пороговой обработки и морфологического анализа. Предложен усовершенствованный метод адаптации порога обнаружения, основанный на анализе изолированных фрагментов, остающихся на изображении после пороговой обработки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Волков В.Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Adaptive Extraction of Small Objects in Digital Images

The problem of detection and localization of various size and shape small-extended objects in electronic surveillance systems using synthetic aperture radar, lidar, infrared and television cameras is discussed. An intensive and non-stationary background is described as the main difficulty in processing. This problem is solved using oriented filtering, adaptive thresholding and morphological analysis. Improved method is proposed for the adaptation of detection threshold based on the analysis of isolated fragments remaining in the image after thresholding.

Текст научной работы на тему «Адаптивное выделение мелких объектов на цифровых изображениях»

Телевидение и обработка изображений

УДК 621.391:621.397

В. Ю. Волков

Санкт-Петербургский государственный университет телекоммуникаций им. проф. М. А. Бонч-Бруевича

Адаптивное выделение мелких объектов на цифровых изображениях

Задача обнаружения и локализации протяженных мелких объектов различных размеров и формы встречается в радиотехнических системах наблюдения, которые используют радары с синтезированной апертурой, лидары, инфракрасные и телевизионные камеры. Основной трудностью при обработке является интенсивный и нестационарный фон. Эта задача решается с использованием ориентированной фильтрации, адаптивной пороговой обработки и морфологического анализа. Предложен усовершенствованный метод адаптации порога обнаружения, основанный на анализе изолированных фрагментов, остающихся на изображении после пороговой обработки.

Фильтрация, локализация объектов на изображениях, адаптивная пороговая обработка

Задача обнаружения и локализации мелкомасштабных протяженных объектов на зашумленных изображениях возникает в радиотехнических системах наблюдения, использующих радары с синтезированной апертурой, инфракрасные и лазерные системы, а также телевизионные камеры [1]—[4]. Эта задача актуальна, поскольку указанные объекты обычно имеют искусственное происхождение и представляют первостепенный интерес.

При обнаружении, выделении и локализации объектов возникают существенные трудности в построении эффективных алгоритмов и структур обработки, так как принимаемые изображения содержат интенсивный и нестационарный фон с элементами, структурно-подобными сигналам. При этом отношение "сигнал/фон" обычно невелико, а зарегистрированное цифровое изображение имеет невысокое качество, малое число уровней квантования, пятенный характер и нечеткие границы природных и искусственных структур (берегов рек, дорог, мостов, зданий).

Наряду с объектами и фоном в радиолокационных изображениях присутствует так называемый спекл-шум, обусловленный взаимной интерференцией когерентных волн, имеющих случайные сдвиги фаз и/или случайные интенсивности. Мелкомасштабные объекты выглядят как ориентированные или неориентированные пятна, имеющие нечеткие границы вследствие недостаточно высокого разре-© Волков В. Ю., 2017

шения и внутреннюю спекл-структуру. Такие же особенности свойственны и пассивной помехе [4], [5].

При выделении объектов интереса пространственное накопление в пределах границ малоэффективно вследствие их небольших размеров. Статистика фона весьма отличается от гауссовской, распределения явно асимметричны, а "хвосты" распределений подчинены логнормальной или смешанной (загрязненной) нормальной (contaminated-normal) плотности [6]. При малых объемах выборок эти плотности оцениваются с трудом.

Такой характер фона и полезных сигналов практически исключает использование известных методов пороговой обработки, например гисто-граммных методов, метода Отсу [3] и др. Неправильное формирование порогов может привести к потере полезных объектов на самой ранней стадии обработки. Невозможно использование и традиционных методов выделения контуров на изображениях в целях выделения природных объектов (рек, дорог, границ лесополосы и т. п.), основанных на формировании пространственных производных (градиентов и лапласианов), поскольку из-за особенностей спекл-картинок существенно проявляются импульсные помехи без видимого эффекта выделения качественного контура.

Основными принципами, позволяющими решать указанную сложную задачу, является пространственно-ориентированная фильтрация, адап-

тивная пороговая обработка и селекция полезных объектов по связности соседних пикселей с учетом протяженности полезных структур [1]-[3], [7].

Постановка задачи и метод обнаружения объектов на изображениях. Имеется изображение в цифровой форме, содержащее объекты интереса с произвольной ориентацией со сравнительно незначительными по отношению к изображению размерами. Форма объектов может быть линейной или пятенной, а их размеры задаются в пикселях, причем для протяженности объектов указываются минимальная и максимальная границы. Особенностью задачи является то, что появление мелкомасштабных объектов интереса практически не влияет на интегральные характеристики изображения.

Общая структура цифровой обработки изображений включает предварительную фильтрацию, бинарное квантование (пороговую обработку) и последующую морфологическую обработку. Входное изображение после регистрации представляется в цифровой форме (двумерным массивом на прямоугольной сетке отсчетов). Задача автоматической установки порога в автономных информационно-управляющих системах очень важна для сегментации [2], [3], [7]-[10]. Хорошо известные методы установки глобальных и локальных порогов обычно используют гистограммы или локальные свойства точки на изображении [3], [8]. Как правило, при установке порогов используются свойства входного изображения, а результаты пороговой обработки не учитываются. В предложенном в настоящей статье методе оптимальное значение порога зависит от свойств выделяемых объектов. Тем самым пороговая обработка адаптируется к результатам бинаризации.

Целью настоящей статьи является исследование адаптивного метода установки порога сегментации для обнаружения и выделения объектов, основанного на структурном разложении бинарного изображения на элементарные изолированные связные фрагменты различной формы и размеров, анализ влияния порогового уровня на результаты разложения и разработка алгоритма для установки и изменения порога в соответствии с результатами разложения.

Предварительная фильтрация. Предварительная фильтрация имеет целью улучшение изображения, устранение нестационарности фона и подчеркивание перепадов и границ. Предполагается, что объекты интереса всегда имеют более высокую интенсивность по отношению к фону (в противном случае необходимо инвертировать изображение). В указанных целях применяются дифференцирую-

Ь Ь Ь Ь Ь Ь

г Ь а а а а а

Ь Ь Ь Ь Ь Ь

.!

Ь Ь Ь Ь Ь Ь

а а а а а Ь г

Ь Ь Ь Ь Ь Ь

.1

б

Ь Ь Ь Ь Ь

Ь а а а Ь

г Ь а а а Ь

Ь а а а Ь

Ь Ь Ь Ь Ь

1

в

Рис. 1

щие фильтры со сглаживанием в выбранном окне, которые позволяют далее использовать глобальный порог для бинарного квантования по превышению интенсивностью порога квантования [7], [8].

При фильтрации линейных объектов заданной ориентации используются пространственно-ориентированные маски фильтра (рис. 1, а, б) (г, у - ко -ординаты элемента маски, располагаемого на пикселе изображения, с которым ассоциируется результат обработки).

Задача оптимизации весовых коэффициентов элементов масок представляет самостоятельный интерес. В настоящей статье приняты коэффициенты а = 1, Ь = — 1. При этом сумма всех коэффициентов не равна нулю, что приводит к некоторому ненулевому уровню фона на выходе фильтра. Это не влияет на последующую селекцию объектов, а приводит только к изменениям пороговых уровней.

Предложенные маски имеют незамкнутое окаймление символами Ь, что позволяет эффективно выделять окончания протяженных линейных объектов, имеющих произвольную и неизвестную длину. Далее результаты фильтрации масками по рис. 1, а и б суммируются, при этом происходит подавление линий, длина которых существенно превышает длину масок. Такая обработка позволяет сократить число каналов ориентированной фильтрации объектов.

В случае объектов с неизвестной ориентацией организуется ряд каналов с масками для выделения всех возможных мелких объектов. Для выде-

Рис. 2

■ ... V :, : ■ д -V -М

Рис. 3

ления небольших объектов пятенного характера применяются неориентированные маски фильтров (например, маска по рис. 1, в).

Наряду с усреднением в дифференцирующих фильтрах используются и другие операторы, такие, как выборочная медиана или максимальное значение среди пограничных элементов со значением коэффициентов Ь [7]. Результаты использования усредняющих фильтров показаны на рис. 2 и 3, где приведены исходные изображения (а) и результаты предварительной фильтрации с помощью ориентированной маски (б). Мелкомасштабные объекты интереса выделены белым овалом.

Пороговая обработка. Этот этап очень важен. Неправильная установка порога часто приводит к необратимым потерям сигналов. Обычно мелкомасштабные объекты интереса обладают высокой интенсивностью и выделяются после пороговой обработки. Однако их локализации препятствует фон, на котором после бинаризации формируются объекты различной формы и размеров - "мусор".

Рис. 4 иллюстрирует изменение результатов обработки на выходе порогового устройства изображения, приведенного на рис. 3, а, для трех значений порога. На рис. 4, а при низком пороге (фактически определенном по методу Отсу) в об-

0 ,1 • .1* £ ^ \ -/ ч, I I _ : X уГч^*

б

а

а

в

ласти фона формируются множество различных, в том числе и протяженных объектов, что не позволяет в дальнейшем селектировать полезные и мешающие объекты (фон) по их протяженности.

С ростом значения порога количество "мусорных" объектов снижается, а сами они уменьшаются, в частности принимают вид изолированных пикселей (рис. 4, б). При очень высоких значениях порога (рис. 4, в) эти фрагменты пропадают, однако начинается разрушение полезных объектов, которые сами распадаются на отдельные фрагменты, после чего могут быть безвозвратно потеряны. Поэтому значения порогов не должны быть слишком высокими; они должны обеспечивать фрагментацию фона, но при этом сохранять структуру сигналов. Лучший пороговый уровень дает максимальные морфологические различия (по протяженности) между полезными и фоновыми объектами, и эти различия следует использовать при дальнейшей обработке.

Основная идея установки и адаптивного регулирования порога бинарного квантования связана с учетом результатов бинаризации. В этих целях предлагается иерархия видов изолированных фрагментов, возникающих на бинарном изображении, и для заданного вида изолированных фрагментов вводится эффективность их выделения, которая может быть использована для настройки порогового уровня [7], [9], [10].

Иерархия изолированных фрагментов на бинарном изображении. Целью является анализ атрибутов изолированных фрагментов, характеризующих протяженность и смежность мелкомасштабных объектов интереса. Для характеристики протяженности используется характериза-ционная маска изолированного фрагмента - минимальная прямоугольная маска, которая полностью охватывает этот фрагмент. При этом в нее не попадают части других фрагментов.

Другой характеристикой является наполненность объекта, которая измеряется общим количеством смежных пикселей в изолированном фрагменте. Относительная наполненность определяется отношением наполненности к количеству пикселей в характеризационной маске объекта.

На рис. 5, а показано гауссовское шумовое поле, на рис. 5, б - результат его бинаризации достаточно высоким порогом. Изолированные пиксели на этом рисунке характеризуются маской 1 х 1, изолированные пары пикселей могут иметь ха-рактеризационную маску 1 х 2, 2 х 1 или 2 х 2 в зависимости от их ориентации. Некоторые изолированные пары, тройки и четверки полностью накрываются маской 2 х 2. Более крупные фрагменты из трех точек имеют маски 2 х 3 и 3 х 2. Линии из трех точек могут иметь маски 1 х 3, 3 х 1 или 3 х 3 в зависимости от ориентации. Имеются и другие более протяженные, но изолированные фрагменты различной формы и ориентации.

Иерархия мелких изолированных фрагментов на бинарном изображении (до характеризационной маски 3 х 3 включительно) приведена на рис. 5, в. В левом верхнем углу находятся изолированные точки. Размеры и сложность структур изолированных фрагментов возрастают от левого верхнего к правому нижнему углу рисунка.

Поскольку фрагмент есть совокупность связных точек, его можно характеризовать параметром связности - длиной пути между крайними точками во фрагменте [3]. В этом случае связность фрагмента будет равна максимальному размеру характеризационной маски.

Для реализации адаптивной пороговой обработки на начальном этапе можно использовать квадратные характеризационные маски 1 х 1, 2 х 2, 3 х 3 и т. д. Это не исключает в дальнейшем привлечение ориентации фрагментов как дополнительного признака при установке порога.

I I

Т~1 + -♦

J__I

I Г н—I ±_1. I I

I I

III I "Г-Т-Г-Г -■I—I—*-—I-

—1-1—1-1—I-*-.*-*-

М4444+

I—*—I—*—I—*—I— ♦-Ч-*--*-*--*-!-

Н-Н+4-!-

♦--♦-I—И—Ь-Ф-

Н-Н+-Н-

-■Ь-Ф-И-I Т I I

■н-н-

-и-н--1—1-»"»-

т-1-н-

-1—I—'

11111II Т--Т-1—

а

в

Вход

£

Регистрация I ^ Фильтр j F ^ Бинарный квантователь

Фильтр 2

E

Селектор максимума

Селектор длины

Выход

Рис. 6

Установка и регулировка порога с использованием анализа изолированных фрагментов на бинарном изображении. Число возникающих в бинарном изображении мелких фрагментов каждого вида невелико как при очень низких, так и при высоких значениях порогов. При низких порогах мелкие фрагменты сливаются в более крупные, а при высоких порогах остаются только очень мелкие объекты, в конечном счете, только изолированные точки. Будем считать объектами интереса связные объекты, содержащие 2, 3 и более пикселей. Для некоторого промежуточного значения порога количество таких мелкомасштабных связных объектов будет максимальным.

С ростом значения порога уменьшается общее число пикселей, в которых интенсивность превышает порог, а следовательно, и возможность образования связных структур. Поэтому при анализе количества пикселей, содержащихся в тех или иных фрагментах, целесообразно нормировать это количество на общее число пикселей, в которых установленный порог превышен. Полученные нормированные числа можно рассматривать как оценку эффективности селекции мелкомасштабно -го фрагмента при данном значении порога.

Пусть после бинарного квантования с заданным значением порога T изображение содержало всего N(T) точек превышения порога. При последовательном выделении мелкомасштабных объектов с увеличивающейся в размерах характе-ризационной маской и их удалении из бинарного изображения на нем остаются все более и более

крупные фрагменты. На каждом шаге удаления бинарное изображение теряет Nj (T ), N2 (T ) и т. д.

пикселей. Поскольку все эти числа зависят от порога квантования, то можно произвести нормировку и рассматривать относительные значения N (T )/N (t), N2 (t)/N (t ) и т. д. Эти значения можно рассматривать как оценку эффективности выделения фрагментов при заданном значении порога.

Структура обработки изображений, реализующая адаптивную пороговую обработку с селекцией связанных объектов в целях выделения мелкомасштабных объектов, приведена на рис. 6. Предварительная фильтрация зарегистрированного изображения I выполняется фильтром F. Выходное изображение фильтра квантуется с набором порогов T. Фильтр E реализует морфологические операции для выделения изолированных фрагментов с учетом характеризационной маски. Селектор максимума извлекает пороговое значение, которое максимизирует эффективность E выделения фрагментов заданной протяженности. Селектор максимума выбирает мелкомасштабные объекты заданной длины.

На рис. 7 показана параллельная реализация алгоритма выделения одного (¿-го) из возможных K объектов интереса. Бинарное квантование осуществляется параллельно c несколькими порогами Tj, ..., TM. Полученный массив бинарных изображений поступает на систему каналов, в каждом из которых выделяется объект интереса и подсчи-тывается число выделенных пикселей. Максимум этого числа определяет оптимальное значение по-

К структурам выделения других объектов интереса

T

рога для данного фрагмента, и соответствующее бинарное изображение селектируется. Для каждого объекта формируются аналогичные структуры.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Анализ вероятностей появления связных фрагментов. Рассмотрим задачу обнаружения сигнала на фоне случайной одномерной стационарной шумовой последовательности, а также на случайном двумерном однородном шумовом поле1. Сигнал проявляется в увеличении математического ожидания в нескольких смежных элементах последовательности или в некоторой области поля, при этом незначительные и неизвестные размеры области не позволяют использовать для обнаружения сигнала накопление или гистограммные методы.

Для решения задачи можно установить порог бинарного квантования, обеспечивающий при малом числе ложных выбросов выделение полезного сигнала. Фактически требуется установить порог как процентную точку плотности распределения шума. Поскольку распределение шума неизвестно, следует применить непараметрические методы.

Известные знаковые и ранговые процедуры не учитывают связность элементов сигнала, ожидаемые размеры объектов интереса, которые являются весьма информативными признаками. Кроме того, в них полезный сигнал влияет на значение порога, что не позволяет поддерживать заданные параметры обнаружения. Эти недостатки можно устранить, если использовать селекцию фрагментов после бинаризации по размерам и форме.

Рассмотрим сначала конечную одномерную дискретную последовательность независимых случайных величин, которая представляет шум. Пусть установлен некоторый порог бинаризации, преобразующий эту последовательность в последовательность 1 и 0 с неизвестными вероятностями появления p и q соответственно, причем p + q = 1. Такая последовательность возникает на выходе пороговой схемы при воздействии на вход последовательности случайных величин с некоторым распределением вероятности.

Задача состоит в оценивании неизвестного значения p или q по реализации из N значений бинарной последовательности. На рис. 8, а показан фрагмент такой последовательности для N = 9.

Хорошо известна оценка р = п1/ N, связанная с подсчетом числа единиц в последовательности

Одномерное представление шума позволяет определить точные значения вероятностей появления связных фрагментов, тогда как при двумерном представлении удается получить лишь нижние границы для этих вероятностей.

0.5 0

1 0 1 0 1 1 1 0 1 0

V} 81 6 4 2

12 3 4

5 6 а

8 9

0.5 б

Рис. 8

[6], где П1 - случайное число единиц. Величина П1 имеет биномиальное распределение с диспер-2

сией с?1 = pqN, поэтому при оценке малых вероятностей р оценка р имеет большой коэффициент вариации V = с^р = у]д/^р), т. е. сильно

флуктуирует. Типовой вид зависимости коэффициента вариации от вероятности р приведен на

рис. 8, б (vo = -ШV = д/р).

Оценка процентной точки распределения может служить порогом в задаче обнаружения объектов на шумовом фоне. При этом обеспечивается стабилизация вероятности появления ложных выбросов. Известно, что ошибки оценивания процентных точек минимальны при оценивании медианы распределения (р = 0.5), при этом ко -

эффициент вариации оценки V) = 1 [6]. Ошибки оценивания растут с уменьшением вероятности, соответствующей процентной точке.

Рассмотрим другой метод непараметрической оценки р, основанный на подсчете числа единиц в изолированных связанных фрагментах, состоящих из единиц, окруженных нулями. Такими фрагментами будут изолированные единицы ^ ={010}, пары 5*2 ={0110}, изолированные тройки 5з = {01110} и т. д. На рис. 8, а показана последовательность из N символов, в которой имеются две изолированные единицы и одна изолированная пара. В одномерном случае возможна селекция изолированных фрагментов только по размерам (числу связанных единиц).

Вероятности появления изолированных фрагментов имеют максимумы при определенных значениях вероятностей р и д. Эти значения могут быть оценены посредством селекции соответствующих фрагментов и подсчетом в них числа единиц.

Теоретические расчеты зависимости вероятности Рб появления соответствующего изолированного фрагмента от значения д = 1 - р для N = 9 приведены на рис. 9, а. Расчеты основаны

Б

2

и

Р

на определении числа благоприятных исходов относительно общего числа кодовых комбинаций,

число которых составляет 2N = 512. При этом в исходной последовательности возможны кратные события, например, одновременно могут возникнуть максимум 4 изолированные единицы или 3 изолированные пары.

В рассмотренном случае максимум вероятности появления изолированных единиц реализуется при ^ = 0.69, для изолированных пар - при

д2 = 0.5, для троек - при дз = 0.4. На рис. 9, а

приведена кривая 1 функции 1 - д^, показывающая вероятность появления хотя бы одной единицы в коде. Эта кривая получена суммированием значений вероятностей всех возможных изолированных фрагментов для данного значения д.

Возможности выделения любых изолированных фрагментов падают с ростом порога (что сопровождается ростом вероятности д), так как число точек превышения порога уменьшается. Поэтому для характеристики эффективности селекции изолированных фрагментов вероятность их выделения можно нормировать на вероятность появления хотя бы одной единицы 1 - д^ (рис. 9, а, 1). Результаты нормировки представляют эффективность селекции = р / (1 - дN ) и приведены на рис. 10, а. Положения максимумов приведенных

кривых зависят только от вида изолированного фрагмента, поэтому их оценки являются непараметрическими (не зависящими от распределения) оценками для соответствующих вероятностей превышения порога.

Проиллюстрируем результаты исследования на примере бинаризации гауссовской последовательности N (о, о2 ) порогом Т/о. Зависимости вероятностей появления изолированных фрагментов от порога для этого случая представлены на рис. 9, б. Максимум для изолированных точек приходится на Т^ ст = 0.5, максимум для пар - на медиану, для троек - на Тз/ст = -0.27.

Зависимости эффективности селекции от вероятности д и от относительного порога Т/ст приведены на рис. 10, а и б соответственно. Для изолированных точек ^ экстремум эффективности выделения отсутствует, при возрастании порога вероятность выделения таких точек сохраняет конечное значение, в то время как вероятности выделения более сложных связанных фрагментов падают до нуля. Экстремумы для других фрагментов перемещаются левее, в частности, для изолированных пар - на медиану. Кривая 1 на рис. 10, б представляет вероятность появления единицы в каждой позиции кода 1 - Ф(Т/ о).

Полученные результаты справедливы для любого вида распределения вероятностей последова-

тельности, которая подвергается бинаризации. Их также можно распространить на двумерный случай.

Для гауссовского шумового поля с нулевым математическим ожиданием и единичной дисперсией вероятность того, что интенсивность в отдельном пикселе превышает пороговое значение, определяется как Р(Т) = 1 -Ф(Т), где Ф(Т) -интеграл вероятности. Тогда для характеризаци-онной маски, содержащей N элементов, вероятность отсутствия любых фрагментов равна

ФN (Т). Поэтому для нахождения эффективности селекции вероятности появления изолированных фрагментов следует нормировать на функцию PN (Т) = 1 - ФN (Т), определяющую вероятность появления хотя бы одного изолированного фрагмента в пределах маски.

С учетом указанного вероятность получения изолированной точки на характеризационной маске 3 х 3 рассчитывается как

Р (Т) = Ф8 (Т)[1 -Ф(Т)],

а вероятность появления изолированного фрагмента на характеризационной маске 2 х 2 ограничена снизу значением

Р2 (Т) = 2Ф10 (Т)[1 - Ф(Т)]2 [1 + Ф2 (Т)] +

+ Ф12 (Т)[1 -Ф(Т)]3 [1 + 3Ф(Т)]. (1)

В (1) учтены вероятности появления двух горизонтальных и двух диагональных пар, четырех троек и одной четверки единиц в пикселях маски.

Для характеризационной маски 3 х 3 имеются 2 варианта линий из троек пикселей в окнах 3 х 1 и 1 х 3, 2 диагональные линии из троек, 36 вариантов четверок, 32 варианта пятерок, 2 шестерки для окон 3 х 2 и 2 х 3, 4 шестерки в окне 3 х 3, 12 семерок, 4 восьмерки и 1 вариант девяти единиц в пикселях. Суммируя вероятности каждого из событий с весами, равными количеству благоприятных вариантов, можно определить нижнюю границу для вероятности появления фрагмента с этими свойствами.

Зависимости нижних границ эффективности селекции

Ек = Рк (Т )/ РN (Т), к = 1, 2, 3 (для характеризационных масок 1 х 1, 2 х 2 и 3 х 3 соответственно), приведены на рис. 11, а. Для изолированных точек максимум в нормированных кривых отсутствует. Кривые эффективности для любых связных фрагментов имеют очевидный максимум. Для фрагментов, состоящих из двух

Рис. 11

пикселей, он соответствует значению порога Т2/о = 1.3, т. е. такой порог является наилучшим для выделения указанных объектов.

Положения максимумов определяются непараметрическими оценками процентных точек распределений вероятностей интенсивностей, причем такие оценки привязаны к размеру и форме выделяемого фрагмента. Теоретические расчеты и наличие максимумов в характерных точках подтверждаются результатами моделирования процесса бинаризации шумового поля с нормальным распределением (рис. 11, б). Моделирование производилось на изображении размером 256 х 256 пикселей при пороговых уровнях.

Нетрудно заметить, что выбранный по максимумам этих кривых порог в рассмотренном примере близок к оптимальному порогу по критерию максимального правдоподобия для задачи обнаружения сдвига гауссовского распределения при отношении "сигнал/шум" примерно 2.6 [9], [10].

Характеристики обнаружения сигнала в каждой точке изображения. Рассмотрим одномерную задачу обнаружения увеличения интенсивности в двух смежных точках в случае, когда порог обнаружения устанавливается по максимальному числу изолированных фрагментов 52 в бинарном выходном сигнале, т. е. требуемый порог к является выборочной модой распределения р$ (щ ) числа

превышений порогов Тк (к = 1, К) для выбранного типа изолированного фрагмента.

Точный вид распределения порога м>б (к) установить затруднительно. Гистограмма этого распределения, полученная моделированием гауссов-ской шумовой последовательности х^ ~ N (т0, с),

к = 1, N для N = 256, фрагмента 52, т0 = 3, с = 1 показана на рис. 12, а. Считая распределение ^2 (к) симметричным, примем для него гауссовскую аппроксимацию с коэффициентами вариации V = 0.5; 1 и 1.5. Пусть распределение в сигнальных точках также гауссовское и отношение "сигнал/шум" в каждой точке определяется как ё = (1 - т0 )/<с.

Тогда условная вероятность правильного обнаружения изолированного фрагмента из двух смежных точек при заданном пороге к определяется как

В2 (ё, к) = Ф2 (ё - к).

Если селектор порога обеспечивает его несмещенную оценку, безусловная вероятность правильного обнаружения указанного фрагмента определяется следующим образом:

Б (ё) = | Б2 (ё, к)^2 (к) скг.

Зависимости Б (ё) для трех значений коэффициента вариации V и заданной вероятности ложной тревоги Г = 0.25 приведены на рис. 12, б. Кривая 1 соответствует нулевому значению порога.

Результаты моделирования для гауссовской шумовой последовательности ^ = 64) приведены

на рис. 13, а. Последовательность является нестационарной и включает протяженный участок с 10-го по 30-й элемент, на котором отношение "сигнал/шум" увеличивается вдвое (нестационарный фрагмент указан линией 1). Адаптивный порог показан линией 2. Результат селекции фрагментов Б2 на бинаризованном сигнале отображен кривой 3. Ввиду применения морфологической обработки наличие нестационарности не повлияло на порог.

Для сравнения на рис. 13, б приведен результат выделения фрагментов с помощью порога, установленного по выборочной медиане (линия 2). Данный обнаружитель подвержен воздействию протяженной помехи, поскольку морфологическая обработка отсутствует. В результате выделен весь участок увеличенного сигнала (кривая 3), на котором определение фрагмента Б2 невозможно.

Выделение мелкомасштабных объектов на реальных изображениях. Результаты выделения мелкомасштабных объектов на реальных радиолокационных изображениях представлены на рис. 14 для изображений, приведенных на рис. 2 (рис. 14, а-в) и 3 (рис. 14, г-е).

На рис. 14, а, г показаны выходы бинарных квантователей. Для бинаризации в обоих случаях использовались адаптивные пороги, которые выбирались по максимуму оценок эффективности выделения небольших связных фрагментов.

Зависимости значений эффективности выделения фрагментов от порогового уровня пред-

10

J_Ш_

21

1

42

2 3

б

Рис. 12

21

42

п

и

6

4

2

5

2

3

0

0

п

а

а

и

1

2

2

3

0

п

Es 0.35 0.25 0.15 0.05

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 х1

L

2 х 2

3 х 3

J_I_I_L

"X.

Es 0.09 0.06 0.03 0

0

10 15

б

20

25

Рис. 14

ставлены на рис. 14, б, д. На кривых указан тип квадратной характеризационной маски. Морфологическая обработка заключалась в выделении объектов заданной протяженности.

Результаты выделения объектов интереса приведены на рис. 14, в, е.

Таким образом, в настоящей статье предложен новый алгоритм выделения и локализации мелкомасштабных объектов, включающий предварительную фильтрацию, адаптивную пороговую обработку и морфологический отбор. Для селекции связных изолированных фрагментов использована соответствующая иерархия. Тип мелкомасштабного протяженного объекта определяется его характеризационной маской, полно-26

стью накрывающей этот объект. Эффективность выделения мелкомасштабных связных фрагментов определенного типа на бинарном изображении для заданного значения порога определяется как число пикселей, принадлежащих этим фрагментам, отнесенное к общему числу превышений данного порога. Наилучший пороговый уровень должен обеспечивать наибольшую эффективность выделения фрагментов данного типа.

Эффективность предложенного адаптивного метода установки и регулировки порога проверена моделированием гауссовского поля, а также при обработке реальных изображений, полученных радиолокатором с САР.

а

г

5

T

д

в

е

СПИСОК ЛИТЕРАТУРЫ

1. Волков В. Ю. Методы дискретной фильтрации и задачи обработки изображений в радиотехнических системах наблюдения / СПбГУТ. СПб., 2013. 144 с.

2. Волков В. Ю. Адаптивные и инвариантные алгоритмы обнаружения объектов на изображениях и их моделирование в Matlab: учеб. пособие. СПб.: Лань, 2014. 191 с.

3. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. М.: Техносфера, 2006. 615 с.

4. Gao Gui. Statistical modeling of SAR images. A Survey // Sensors. 2010. Vol. 10, iss. 1. P. 775-795.

5. Misra A., Kartikeyan B. Denosing techniques for synthetic aperture radar data - a Review // Int. J. Computer Engineering & Technology (IJCET). 2015. Vol. 6, iss. 9. P. 01-11.

6. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика. Основы моделирования и первичная обработка данных: справ. изд. М.: Финансы и статистика, 1983. 471 с.

7. Волков В. Ю., Турнецкий Л. С. Пороговая обработка для сегментации и выделения протяженных объектов на цифровых изображениях // Информационно-управляющие системы. 2009. № 5 (42). С. 10-13.

8. Sezgin M., Sankur B. Survey over image thresholding techniques and quantitative performance evaluation. // J. of Electronic Imaging. 2004. Vol. 13, iss. 1. P. 146-165.

9. Volkov V. Segmentation and Extraction of Extensive Objects on Digital Images // Proc. 2009 Intern. conf. on Image Processing, Computer Vision and Pattern Recognition. IPCV2009, Las Vegas, USA, Jul 13-16, 2009. Las Vegas: CSREA Press, 2009. Vol. II. P. 656-662.

10. Volkov V. Thresholding for segmentation and extraction of extensive objects on digital images // Proc. 32 Ann. German Conf. on Artificial Intelligence. KI 2009, Paderborn, Germany, Sept. 15-18, 2009. Berlin: Springer Verlag, 2009. P. 623-630.

Статья поступила в редакцию 28 октября 2016 г.

Для цитирования: Волков В. Ю. Адаптивное выделение мелких объектов на цифровых изображениях // Изв. вузов России. Радиоэлектроника. 2017. № 1. С. 17-28.

Волков Владимир Юрьевич - доктор технических наук (1993), профессор (1995) кафедры радиосистем и обработки сигналов Санкт-Петербургского государственного университета телекоммуникаций им. проф. М. А. Бонч-Бруе-вича. Автор 200 научных работ. Сфера научных интересов - обработка изображений в системах технического зрения; решение задач приема в условиях априорной неопределенности. E-mail: vladimi-volkov@yandex.ru

V. Yu. Volkov

The Bonch-Bruevich Saint Petersburg State University of Telecommunications Adaptive Extraction of Small Objects in Digital Images

Abstract. The problem of detection and localization of various size and shape small-extended objects in electronic surveillance systems using synthetic aperture radar, lidar, infrared and television cameras is discussed. An intensive and non-stationary background is described as the main difficulty in processing. This problem is solved using oriented filtering, adaptive thresholding and morphological analysis. Improved method is proposed for the adaptation of detection threshold based on the analysis of isolated fragments remaining in the image after thresholding.

Key words: Filtering, Localization of the Objects in Images, Adaptive Thresholding

REFERENCES

1. Volkov V. Yu. Metody diskretnoi filtratsii I zadachi obrabotki izobrahzenii v radiotekhnicheskikh sistemakh na-blyudeniya. [Methods of discrete filtering and image processing in radio surveillance systems]. SPbGUT, Saint Petersburg, 2013, 144 p. (In Russian)

2. Volkov V. Yu. Adaptivnye I invariantnye algoritmy obnar-uhzeniya ob''eknov na izobrahzeniyakh I ikh modelirovanie v Matlab. [Adaptive algorithms and invariant object recognition in images and simulation in Matlab]. Saint Petersburg, Lan', 2014, 191 p. (In Russian)

3. Gonsales R. C., Woods R. E., Eddins St. L. Digital image processing using MATLAB. Upper Saddle River, Prentice Hall, 2004, 344 p.

4. Gao Gui. Statistical modeling of SAR images. A Survey. Sensors. 2010, vol. 10, no. 1, pp. 775-795.

5. Misra A., Kartikeyan B. Denosing techniques for synthetic aperture radar data - a Review. Int. J. Computer Engineering & Technology (IJCET). 2015, vol. 6, no. 9, pp. 01-11.

6. Aivazyan S. A., Enyukov J. S., Meshalkin L. D. Pri-kladnaya statistika. Osnovy modelirovaniya i pervichnaya obrabotka dannykh [Fundamentals of modeling and primary data processing]. Moscow, Finance and Statistics, 1983, 471 p. (In Russian)

7. Volkov V. Yu., Turneckiy L. S. Thresholding segmentation and isolation of extended objects in digital images. Information and Control Systems. 2009, no. 5 (42), pp. 10-13. (In Russian)

8. Sezgin M., Sankur B. Survey over image thresholding techniques and quantitative performance evaluation. J. of Electronic Imaging. 2004, vol. 13, no. 1, pp. 146-165.

9. Volkov V. Segmentation and Extraction of Exten- 10. Volkov V. Thresholding for segmentation and ex-

sive Objects on Digital Images. Proc. 2009 Int. conf. on traction of extensive objects on digital images. Proc. 32

Image Processing, Computer Vision and Pattern Recogni- Ann. German Conf. on Artificial Intelligence. KI 2009.

tion. IPCV2009. Jul 13-16, 2009, Las Vegas, USA. Las Ve- Sept. 15-18, 2009, Paderborn, Germany, Berlin, Springer

gas, CSREA Press, 2009, vol. II, pp. 656-662. Verlag, 2009, pp. 623-630.

Received October, 28, 2016

For citation: Volkov V. Yu. Adaptive Extraction of Small Objects in Digital Images. Izvestiya Vysshikh Uchebnykh Zavedenii Ros-sii. Radioelektronika. [Journal of the Russian Universities. Radioelectronics]. 2017, no. 1, pp. 17-28. (In Russian)

Vladimir Yu. Volkov - D.Sc.in engineering (1993), Professor (1995) of the department of radiosystems and Signal Processing of the Bonch-Bruevich State Telecommunications University (Saint Petersburg). The author of 200 scientific publications. Area of expertise: image processing in computer vision systems; reception under a priori uncertainty conditions. E-mail: vladimi-volkov@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.