УДК 621.397:621.396.96
пороговая обработка для сегментации и выделения протяженных объектов на цифровых изображениях
В. Ю. Волков,
доктор техн. наук, профессор
Санкт-Петербургский государственный университет телекоммуникаций им. проф. М. А. Бонч-Бруевича Л. С. Турнецкий,
канд. техн. наук, старший научный сотрудник, доцент ОАО «Научно-производственное предприятие «Радар ммс»
Исследуется задача установки порога бинарного квантования для сегментации и выделения объектов на цифровых изображениях. Рассматривается структура цифровой обработки, включающая предварительную фильтрацию, пороговую обработку и логическую фильтрацию. Предложен новый метод динамической установки и регулировки порогового уровня, который основан на анализе изолированных фрагментов, выделенных на изображении в процессе сегментации. Предложенный метод позволяет оптимизировать решение задачи сегментации объектов на цифровых изображениях на фоне гауссова шума.
Ключевые слова — фильтрация, сегментация, выделение объектов, эрозия элементов, порог бинарного квантования.
Введение
Сегментация представляет разделение изображения (оптикоэлектронных или радиолокационных) на отдельные области, в частности, выделение на сложном фоне объектов интереса, имеющих требуемые свойства [1-3]. Во многих случаях полезные объекты на изображениях являются протяженными, и сегментация может использовать это свойство. Данную идею авторы статьи развивают на основе исследования обработки оптикоэлектронных изображений и предлагают новый метод для выделения именно протяженных объектов интереса неизвестного размера на фоне множества зашумляющих изображение локальных яркостных фрагментов, имеющих случайные местоположение и форму и меньшую протяженность, чем объекты интереса.
Общая структура цифровой обработки изображений включает предварительную фильтрацию, бинарное квантование и последующую логическую обработку. Целью статьи является исследование влияния порогового уровня на результаты сегментации и разработка метода для автоматической установки и изменения порога бинарного
квантования. Задача автоматической установки порога в автономных информационно-управля-ющих системах очень важна для сегментации, выделения и распознавания полезных объектов на фоне помех [2]. Хорошо известные методы установки глобальных и локальных порогов обычно используют гистограммы или локальные свойства точки на изображении. Предлагаемый метод для вычисления порога использует результаты сегментации. Этот метод применим для установки как глобального порога, так и локального порога в скользящем окне.
Структура цифровой обработки изображений и предварительная фильтрация
Общая структура цифровой обработки для сегментации и выделения объектов на изображениях (рис. 1) содержит после формирования изображения на входном преобразователе предварительную фильтрацию (фильтр F), пороговую обработку (бинарное квантование) и обработку бинарного изображения (фильтр Е). Исходное изображение X после регистрации представляется двумерным массивом на прямоугольной сетке точек.
Порог
■ Рис. 1. Общая структура цифровой обработки изображений
Предварительная фильтрация имеет целью улучшение изображения и подчеркивание перепадов и границ. В данном случае применяются дифференцирующие фильтры, которые позволяют затем использовать глобальный порог для бинарного квантования изображения.
Исследовались два типа фильтров, которые использовали скользящее окно размером 9 х 9:
уА = х1,1- А1,1; уМ = хи I- ми I ■
Первый фильтр — стандартный линейный лапласиан, где Л^ j = (1 / N) ^ хк — выборочное
среднее в окне. Второй фильтр — нелинейный, он использует выборочную медиану М1 ,• = med (хк)
вместо выборочного среднего. Здесь й представляет пару координат вокруг точки (., у), а область S[, у не содержит центрального элемента (i, у).
На примере реального изображения морской сцены (рис. 2, а), полученного с выхода инфракрасной системы наблюдения, приводятся результаты исследования (рис. 2, б). Предваритель-
б) Частость 1500
1000 500 0
100 150 200 250
Интенсивность
■ Рис. 2. Исходное изображение морской сцены (а) и его гистограмма интенсивности (б)
а)
■ Рис. 3. Результаты предварительной фильтрации изображений для двух типов фильтров: а — с выборочным средним; б — с выборочной медианой
ная фильтрация позволяет сделать изображения однородными (рис. 3, а, б). Гистограммы концентрируются около нулевого уровня. Для визуализации изображений использовались соответствующие преобразования сдвига и масштаба. Хорошо заметно, что использование выборочной медианы приводит к подавлению протяженных границ, в частности, линии горизонта. Этот эффект может быть использован для построения комбинированной обработки изображений.
Пороговая обработка
Бинарное квантование представляет весьма ответственный этап обработки изображений, поскольку может привести к необратимым потерям информации. Предположим, что объекты на изображении светлые, тогда квантование дает высокий уровень (белое) при превышении порога в данной точке и низкий уровень (черное) в противном случае. Влияние уровня квантования на данные изображения иллюстрирует рис. 4, а—в.
Слишком низкий порог квантования приводит к трудностям сегментации, поскольку мно-
■ Рис. 4. Результаты бинарного квантования для скользящего окна 9 х 9: низкий (а), промежуточный (б) и высокий (в) уровни квантования; слева — фильтр с выборочным средним, справа — с выборочной медианой
гие объекты сливаются, полезные объекты и помехи практически не различаются по протяженности. С увеличением уровня квантования на изображении начинают проявляться различия в протяженностях для разных объектов. Слишком высокий уровень квантования изображений может привести к разрушению полезных объектов, которые «раскалываются» на мелкие фрагменты и теряют свои информационные части.
Иерархия изолированных фрагментов на изображении и их сегментация
Наилучший порог бинарного квантования дает максимальные отличия в протяженностях полезных объектов и помех. Это позволяет осуществить эффективную сегментацию и выделение полезных объектов на фоне помех с учетом их формы и протяженности.
Основная идея установки и регулирования порога квантования для эффективного выделения полезных объектов на фоне помех связана с учетом результатов сегментации. Для этого предлагается иерархия изолированных фрагментов, которые образуются на квантованном изображении, по их форме и размерам. Протяженные свойства изолированного фрагмента можно характеризовать минимальной прямоугольной маской, которая полностью его накрывает. Изолированные точки (пикселы) характеризуются маской 1 х 1, изолированные пары точек могут иметь характе-ризационную маску 1 х 2, 2 х 1 или 2 х 2 в зависимости от их ориентации. Маска 2 х 2 может также характеризовать уголки из трех точек. Более крупные фрагменты из трех точек имеют маски
2 х 3 и 3 х 2. Линии из трех точек могут иметь маски 1 х 3, 3 х 1 или 3 х 3 в зависимости от ориентации. Предлагаемая иерархия фрагментов иллюстрируется на рис. 5 для масок с максимальным размером 3 х 3 (показаны не все фрагменты, а только с малым числом точек (до трех), чтобы пояснить принцип иерархии).
■ Рис. 5. Иерархия мелких изолированных фрагментов на изображении
Простейшая иерархия фрагментов не учитывает их ориентацию и использует только квадратные характеризационные маски 1 х 1, 2 х 2, 3 х 3 и т. д.
Метод сегментации изображения состоит в последовательном выделении мелких изолированных фрагментов, начиная с изолированных точек, и удалении (эрозии) их из изображения. На первом шаге удаляются изолированные точки, на втором — изолированные фрагменты с харак-теризационной маской 2 х 2, затем — изолированные фрагменты с маской 3 х 3 и т. д. В данном исследовании применялась эрозия всех изолированных фрагментов изображения, имеющих максимальный размер до маски 9 х 9 (рис. 6).
Число точек, удаленных из изображения на каждом шаге эрозии, является полезным индикатором для установки и изменения порога бинарного квантования. Эти значения зависят от величины порога квантования. Будем считать, что в случае превышения порога бинарного квантования на выходе получается яркая точка.
■ Рис. 6. Результаты выделения протяженных объектов путем эрозии мелких изолированных фрагментов изображения: низкий (а), промежуточный (б) и высокий (в) порог квантования; слева — фильтр с выборочным средним, справа — с выборочной медианой
Порог
Порог
Рис. 7. Эффективность эрозии для характеризаци-онных масок (1 — 1 х 1; 2 — 2 х 2; 3— 3 х 3; 4 — 5 х 5; 5 — 7 х 7; 6 — 9 х 9) в зависимости от значения порога квантования: а — фильтр с выборочным средним; б — фильтр с выборочной медианой
Пусть после бинарного квантования изображение содержит некоторое количество таких ярких точек. Исходное число точек NIP (number of initial points) зависит от величины порогового уровня. Эти точки распределяются по изолированным фрагментам изображения. Можно составить распределение числа точек по изолированным фрагментам, тогда число исходных изолированных одиночных точек будет NIP1, число точек в изолированных фрагментах с маской 2 х 2 (изолированные пары и уголки из трех точек) — NIP2, в изолированных фрагментах с маской
3 х 3 — NIP3 и т. д. Поскольку числа точек в изолированных фрагментах изображения зависят от порога квантования, то необходимо произвести нормировку и рассматривать относительные значения NIP1/NIP, NIP2/NIP, NIP3/NIP и т. д. Эти значения можно рассматривать как эффективность эрозии квантованного изображения на соответствующем шаге эрозии.
Зависимости компьютерных испытаний эффективности эрозии от значения порога квантования для приведенных выше реальных изображений представлены на рис. 7, а, б.
Кривые имеют максимумы, концентрирующиеся для разных характеризационных масок вблизи одного значения порога квантования и для каждого используемого типа фильтра предварительной обработки в скользящем окне. Это позволяет для конкретного текущего качества изображения и типа наблюдаемой сцены (сюжета) для одной из характеризационных масок определить соответствующее типу предварительной обработки наилучшее значение порога квантования с точки зрения эффективности эрозии (удаления из изображения) мелких изолированных объектов (помеховых) на изображениях и выявления протяженных объектов, представляющих интерес. При этом для текущего обрабатываемого изображения в дальнейшем не требуется на каждом
шаге эрозии производить заново адаптивную точную настройку значения порога квантования, что значительно сокращает время обработки изображения. Таким образом, наилучший порог квантования может быть оперативно автоматически установлен по максимуму эффективности эрозии на изображениях помеховых изолированных фрагментов различных типов (размера и формы) при изменении содержания наблюдаемой сцены.
Заключение
1. Предложен метод сегментации на изображениях протяженных объектов, представляющих интерес, включающий в качестве логической фильтрации пошаговое последовательное удаление (эрозию) на квантованном изображении мелких изолированных, различных по размерам и форме типов помеховых фрагментов с помощью набора характе-ризационных масок различной формы и размера.
2. Введена эффективность эрозии как относительное число удаляемых точек на каждом шаге обработки. Показано, что для каждого из двух рассмотренных типов фильтров предварительной обработки в скользящем окне (с выборочным средним и выборочной медианой) этот показатель имеет максимум при некотором значении порога квантования для применявшихся характеризационных масок.
3. Предложен новый метод установки и регулировки порога бинарного квантования изображения с учетом результатов эрозии изолированных фрагментов. Наилучший порог квантования соответствует максимальной величине эффективности эрозии изолированных объектов для данного типа фильтра предварительной обработки в скользящем окне. Метод опробован на серии изображений морских сцен и показал хорошие практические результаты в тех случаях, когда требовалось выделить протяженные объекты на фоне помех различного вида.
Литература
1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. — М.: Техносфера, 2005. — 1072 с.
2. Weszka J., Rosenfeld A. Threshold evaluation Techniques // IEEE Trans. SMC-8. 1978. P. 622-629.
3. Волков В. Ю., Макаренко А. А., Рогачев В. А., Тур-нецкий Л. С. Анализ характеристик и цифровая обработка тепловых дискретизированных изображений // Цифровая обработка сигналов и ее применение: Тр. 10-й Междунар. конф. / ИПУ РАН. Вып. X. Т. 2. М., 2008. С. 485-488.
■