ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
Том №271
июнь
200)
ПРИМЕНЕНИЕ ВЕРОЯТНОСТНЫХ И СТАТИСТИЧЕСКИХ МЕТОДОВ
УДК 519.237.8:528.854
П. В. Губанов
АВТОМАТИЧЕСКАЯ СЕГМЕНТАЦИЯ ТЕКСТУРИРОВАННЫХ ИЗОБРАЖЕНИЙ НА ОСНОВЕ ЛОКАЛЬНЫХ РАСПРЕДЕЛЕНИЙ ХАРАКТЕРИСТИК
Предлагается двухэтапный метод автоматической кластеризации локальных распределений характеристик для сегментации текстурированных изображений. В качестве характеристик использованы коэффициенты габоровских фильтров. Метод применяется к задаче автоматической сегментации колажей натуральных микротекстур и восстановлению двухуровневых изображений, искаженных коррелированными шумами.
Большинство предложенных на сегодняшний день алгоритмов автоматической сегментации текстурированных изображений состоит ю двух этапов: формирование локальных характеристик изображения и разбиение изображения на однородные в смысле этих характеристик области. В классических методах сегментации [1] локальные характеристики сглаживаются и рассматриваются как векторы в метрическом пространстве, описывая таким образом каждую текстуру усредненным вектором характеристик (центром). В качестве меры различия при таком подходе чаще всего используется квадрат (взвешенного) евклидова расстояния. Это предполагает в качестве модели данных гауссовскую смесь распределений с одним ядром на каждую текстуру. Для кластеризации векторов характеристик используют метод К-средних и его варианты. Однако поскольку модель гауссовской смеси неадекватта в случае текстур, альтернативные методы используют матрицу попарных расстояний. В качестве элементов матрицы берутся значения статистик критериев однородности локальных распределений характеристик [2]. Основное преимущество этих методов в том, что они не требуют задания метрики в векторном пространстве.
В настоящей работе предлагается метод группировки распределений характеристик. В отличие от подходов, основанных на векторах характеристик и матрице расстояний, предлагаемый метод работает непосредственно с гистограммами и не требует отображения данных ни в точки метрического пространства, ни в матрицу попарных расстояний. Так удается избежать вычислительно трудоемкого этапа подготовки данных, что дает выигрыш в скорости. В отличие от кластеризации методом К-средних, кластеризация по распределению естественным образом корректно учитывает многомодальные плотности распределения исходных данных.
Представление изображения
Для формирования локальных характеристик текстуры будем использовать ее спектральные свойства. Определим семейство комплексных габоровских фильтров формулой
с(х, <тД)=Сехр<
X X
Ъ?
ехр|гХ
где к - фазовый множитель, определяющий длину волны (частоту) и угол поворота фильтра, а - масштабный параметр, зависящий от к. Свертка вида
выполняет локальное преобразование Фурье. Здесь
- исходный сигнал. Такое представление оптимально в смысле фундаментального принципа неопределенности Д/Дсо > 2п, (А/ - точность измерения пространственной и Дсо - частотной координат [3]) и хорошо зарекомендовало себя на практике в качестве инструмента описания текстур [1]. Для представления характеристик изображения ограничимся конечным множеством фильтров (каналов), определяемых набором параметров , кг . Параметры выбираются так, чтобы минимизировать отношение неопределенностей.
Вектор модулей коэффициентов фильтра /\х) с элементами /(*)* о, содержит ин-
формацию о пространственной связи между точками в окрестности х, но ев может оказаться недостаточно для полного описания текстуры. Поэтому используется взвешенное эмпирическое распределение габоровских коэффициентов в окрестности х:
/ у
где Игг - неотрицательная монотонно убывающая весовая функция с максимумом в начале координат, < <••■<([ - разбиение области значений коэффициентов соотвествующего фильтра. В качестве весовой функции проще всего выбрал» квадратное или радиальное окно, хотя возможны и другие варианты, например гауссово окно. Поскольку функция автокорреляции габоровских коэффициентов изменяется с шириной полосы фильтра, зависящей от его размеров, согласно [1] размер окна выбирается пропорциональным аг.
Рассматривая /г(',х) как оценку плотности свойственного текстуре распределения вероятностей характеристик, мера различия между двумя
точками хI и X^ вычисляется независимо для ка-
ждого канала г как значение статистики критерия однородности двух выборок [4]
В качестве меры можно выбрать статистику Колмогорова-Смирнова, X2 > расстояние Кульбака-Лайбле-ра, Крамера-Мшеса или другую. Наилучших результатов удалось добиться с использованием статистики %2.
Комбинирование полученных для отдельных каналов расстояний удобно производить с помощью
нормы Минковского £)(х<,Ху)=|^[ог(г,,л:у|Р| .
Для малых р норма Минковского менее чувствительна к различиям в одном канале. Возможно вычислять значение статистики %г по выборкам, объединенным по каналам, но при этом возникают трудности при сравнении малых областей.
Кластеризация локальных распределений характеристик
Обозначим X - множество узлов изображения (например, узлы дискретной сетки), Т = -дискретное множество характеристик Каждый узел г е X характеризуется набором М наблюдений (х,,^), записанных в таблицу сопряженности (п0). Таким образом, для каждого / определена гистограмма
на Т Пд =Пу/п,, п, = Если для каждой тек)
слуры V на изображении определено эмпирическое распределение характеристик ^, то порождающую модель можно записать так:
1) выбрать узел / е X с некоторой вероятностью р,;
2) выбрать метку текстуры а согласно известной матрице-индикатору М,а (М1а = 1 если узлу / соответствует текстура а, 0 иначе, условие нормировки 2М1у =1 V/);
У
3) выбрать е Т из условного распределения , характерного для выбранной текстуры. Распределение вероятностей пары {х,в этом случае Р[х1,^\М,р,д)= логарифм функции
а
правдоподбия 1 = 1п Р, "у 1п<?у|а-
I /а )
Учкшвая нормировки, методом множителей Лагранжа получим оценки максимального правдоподобия парамет-п,
ров модели р, = : 2>/
п ы
J Ям •
О
к
Проводя аналогию с методом К-средних, можно заметить, что выражение для д^ представляет собой формулу пересчета центров, а Мш выбирается ю условия ближайшего в смысле меры Кульбака соседа. Предлагаемый в настоящей работе метод кластеризации состоит из д вух этапов.
1. Грубое разбиение характеристик изображения на заведомо избыточное (заранее неизвестное) число классов однородности.
2. Слияние близких в смысле выбранной метрики малых классов, пока не будет превышен заданный порог слияния.
На этапе 1 используется алгоритм, подобный методу К-средних [4] с неизвестным числом классов:
1) создается первый кластер, который инициализируется гистограммой, соответствующей некоторому узлу изображения;
2) для каждого узла изображения:
а. находим расстояния между гистограммой характеристик данного узла и всеми имеющимися кластерами;
б. выбираем минимальное расстояние и сравниваем его с заданным порогом близости: если оно меньше, объединяем- гистограммы, иначе создаем новый кластер и инициализируем его гистограммой данной точки.
Результат работы этапа 1 - разбиение характеристик изображения на некоторое количество однородных в смысле выбранной метрики и порога близости классов. Выбор порога обусловлен двумя факторами. Слишком низкая величина приводит к образованию чрезмерно большого числа близких классов, что замедляет как работу самого алгоритма, так и последующего этапа слияния. Слишком большая величина приводит к объединению в один кластер существенно различных областей. Поскольку такая ошибка не может быть исправлена на этапе слияния, следует склоняться к выбору меньшего порога. Его численное значение выбирается эмпирически.
Помимо заниженной величины порога близости причиной избыточной кластеризации могут стать локальные неоднородности изображения, порождающие близкие (по сравнению с областями разной текстуры) классы. Для борьбы с этим явлением применяется процедура слияния классов, в результате которой можно оценить количество различных текстур в исходном изображении:
1) для каждой пары классов вычисляем значение коэффициента грубости слияния [5] М1 = рй, где
р - количество точек в меньшем классе, И - расстояние между классами;
2) выбираем пару классов с минимальным зна-
, „„ МГ
чением М1 и вычисляем отношение М1К = ———,
М/
пи
где М!^ - значение коэффициента грубости на текущем шаге, - максимальное значение М1
на предыдущих этапах;
3. объединяем эту пару, если значение МШ < У, иначе считаем, что получено оптимальное разбиение, и прекращаем работу. Сегментация изображения получается путем классификации всех его узлов согласно полученному набору классов однородности.
Результаты
Тестирование алгоритма проводилось на полутоновых изображениях 256 х 256 точек, 256 градаций серого. Для выделения текстуры использовался банк 12 габоров-ских фильтров с четырьмя ориентациями (0, 45, 90 и 135°) и тремя масштабами (2, 4, 8). В качестве весовой функции использовалось квадратное окно. Ширина окна выбиралась с учетом масштаба 8,16 и 32 соответственно. Характеристики вычислялись в узлах равномерной сетки 64 х 64 (через каждые 4 точки изображения). Разбиения для гистограмм вычислялись по размаху характеристик в каждом канале, по 16 равных отрезков в каждом разбиении. В качестве меры близости использовалась статистика критерия х2 • Порог близости полагался равным сумме критических значений распределения статистики на уровне значимости 70 %. Порог отношения грубости слияния выбирался равным 2.
В качестве тестовых избражений были взяты коллажи микротекстур из альбома [6], широко используемые для проверки алгоритмов сегментации натуральных текстур. В случае правильно определенной конфигурации кластеров доля ошибочно классифицированных узлов не превышала 6 %, что вполне приемлемо в реальных задачах. Однако на некоторых комбинациях текстур алгоритм слияний работал некорректно и приводил либо к объединению разных областей, либо к избыточной кластеризации. Эти ошибки обусловлены выбором порога грубости слияния и неоднородностью текстур. На рис. 1 представлен один из тестовых коллажей. В результате применения этапа 1 кластеризации было получено разбиение, представленное на рис. 2. Этап слияния привел к изображению на рис. 3. На рис. 4 черным показаны ошибочно классифицированные точки. Доля ошибок составила в данном случае 0,5 %.
Алгоритм был также применен для восстановления двухуровневых изображений в коррелированных шумах. Эта задача значительно проще, поскольку число классов разбиения известно заранее. Для создания шумов на тестовых изображениях использовались двумерные процессы авторегрессии с различными параметрами. Доля ошибочно классифицированных узлов не превышала 6 % в случае
правильного определения количества классов при грубой кластеризации. На рис. 5 представлено оригинальное изображение, на рис. 6 параметры процесса авторегрессии первого порядка модулированы оригинальным изображением, на рис. 7 - восстановленное изображение, на рис. 8 ошибочно классифицированные точки отмечены черным цветом. Доля ошибок составила 4,7 %.
Рис. 5
Рис.6
Рис.7
Рис. 8
Выводы
Полученный алгоритм продемонстрировал работоспособность, сравнимую с методами глобальной оптимизации [2], однако требует более совершенной процедуры оценивания количества кластеров, чтобы считаться автоматическим на более широком классе текстур.
Применительно к восстановлению двухуровневых изображений в коррелированных шумах алгоритм показал хорошие результаты, приемлемые для
решения практических задач. Однако при известных распределениях шумов целесообразно использовать более простые алгоритмы восстановления.
Во всех случаях ошибочно классифицированные узлы преимущественно расположены вдоль границ текстур, что вызвано конечностью носителя габо-ровских фильтров. Для более точного обнаружения границ следует искать способы выделения характеристик по меньшим локальным областям, а также учитывать геометрические особенности изображений.
ЛИТЕРАТУРА
1.JalnA.,FarrokfmiaF. Unsupervised texture segmentation using Gabor filters // Pattern Recognition. 1991. Vol. 24. № 12.P. 1167-1186.
2. Hofinann T., Puzicha J., Buhman J. Unsupervised texture segmentation in a deterministic annealing framework // IEEE Trans, on PAMI.
1998. Vol. 20. № 8. P. 803-818.
3. Daugman J. Uncertanity relation /or resolution in space, spatial frequency, and orientation optimized by two-dimiensional visual cortical
filters // Journal of the optical society Am. A. 1985. Vol. 2. № 7. P. 1160-1169.
4. Айвазян C.A., Мхитарян B.C. Прикладная статистика и основы эконометрики. M.: ЮНИТИ, 1998. 1022 с.
5. Ojala T., Pietikùinen M. Unsupervised texture segmentation using feature distributions // Pattern Recognition. 1999. Vol. 32. № 3.
6. Brodatz P. Textures: A Photographic album for artists and designers. New York: Dover Publications, 1966.
Статья представлена кафедрой высшей математики и математического моделирования факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию 21 февраля 2000 г.
УДК 620.179.152
О. И. Недавний, В. И. Солодушкин, В. А. Удод
ОПТИМАЛЬНАЯ АПОДИЗАЦИЯ АПЕРТУРЫ ДЕТЕКТОРА ИЗЛУЧЕНИЯ В РАДИОМЕТРИЧЕСКИХ СИСТЕМАХ
В одномерном варианте решена задача оптимального выбора аподизирующей функции апертуры детектора излучения, применяемого для регистрации излучения в радиометрических системах радиационного контроля. Представлена геометрическая интерпретация основного расчетного соотношения. Указана область использования полученных результатов.
Проводимые в настоящей работе исследования относятся к радиометрическим системам неразрушающего радиационного контроля. Принцип действия данных систем состоит в следующем [1]. Пучок квантов, испускаемых источником рентгеновского или у-излучения, сканирует по объекту контроля (ОК), последовательно просвечивая все его участки. Излучение, прошедшее через контролируемый участок, регистрируется детектором и далее преобразуется к виду, удобному для дальнейшей обработки у (или), оконечной регистрации.,Пр результатам регистрации оцератором цьцюсигся рещение q состоянии внутренней структуры ОК, в частности, о наличии (либо отсутствии) в ОК инородных включений (ИВ).
При проектировании радиометрической системы одной из основных является задача оптимального выбора апертуры детектора излучения [2]. Ранее эта задача решалась путем оптимального выбора отдельных параметров апертур, имеющих заданную форму и обладающих в пределах рабочей зоны детектора однородной чувствительностью к падающему излучению [2—6]. Между тем, естественно предположить, что для обнаружения системой ИВ сложной конфигурации целесообразно использовать детекторы с неоднородной (аподизированной) чувствительностью апертуры. На практике простейшие детекторы такого типа используются в некоторых системах рентгеновской вычислительной томографии для повышения пространственного разрешения томограмм [7].
Целью настоящей работы является оптимальный (в смысле заданного критерия) выбор аподизирующей функции (АФ) апертуры детектора радиометрической системы, предназначенной для обнаружения в ОК плотных ИВ сложной конфигурации. Ввиду сложности рассматриваемой задачи ограничимся одномерным вариантом при еб решении.
Постановка оптимизационной задачи
Для формализованного описания исследуемой задачи сделаем следующие предположения:
1) поток квантов излучения - пуассоновский;
2) сканирование ОК осуществляется дискретно с малым шагом (малым по сравнению с поперечными размерами обнаруживаемого ИВ). При этом само сканирование происходит следующим образом. Пучок излучения фиксируется в некоторой позиции на ОК и просвечивает его в течение определенного промежутка времени. По истечении этого времени пучок перемещается в следующую позицию (совершает шаг) и процесс повторяется;
3) детектор регистрирует излучение в счетном режиме, т.е. измеряет число квантов за фиксированный промежуток времени и притом тогда, когда пучок излучения находится в какой-то фиксированной позиции;
4) аподизированная апертура технически реализована в виде однородного фильтрующего поглотителя (ФП) излучения, имеющего переменную толщину и установленного за ОК перед детектором.
Одним из распространенных критериев качества функционирования радиометрических систем радиационного контроля является отношение сигнал / шум (ОСШ) [2], которое для счетного режима регистрации излучения представимо в виде
M.HL, m
а
где AN -максимальное изменение среднего числа кван-
тов излучения, регистрируемых детектором, обусловленное наличием ИВ в ОК (сигнал); а— среднее квадратиче-ское отклонение числа квантов, регистрируемых детектором при отсутствии ИВ в ОК (шум).
Используем в дальнейшем условие максимума ОСШ (1) как критерий оптимального выбора АФ апертуры детектора радиометрической системы. С учетом введенных предположений 1 - 4 запишем развернутое выражение для ОСШ (1) в одномерном варианте
]ф(;е)/(*)А А/ = с-._-(2)
fl/(X)dX
Здесь с = JbN0zx exp^- j; Ь - ширина апертуры
детектора (совпадает с шириной ИВ); А6 - плотность потока квантов излучения вблизи детектора при отсутствии ОК; £ - эффективность регистрации излучения детектором; г- время измерения числа квантов детектором (постоянное на каждом шаге сканирования ОК); щ - линейный коэффициент ослабления (JIKO) излучения для материала OK; Н - толщина ОК; ^з(х)=1-ехр(-/^<Д)) -функция ИВ, означающая для фиксированного х вероятность события {три движении кванта вдоль прямой, проходящей через точку * параллельно оси пучка излучения, он вступает во взаимодействие с материалом ИВ};