УДК 621.317.35
А.В. Копылов, А.С. Карцева (Тула, ТулГУ)
СГЛАЖИВАНИЕ СИГНАЛОВ И ИЗОБРАЖЕНИЙ С СОХРАНЕНИЕМ ГРАНИЦ МЕТОДОМ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Рассматриваются два алгоритма динамическою программирования в задаче сглаживания сигналов и изображений, позволяющих учитывать различные априорные предположения о гладкости результата обработки, включая предположения о наличии существенных неоднооодностее, разуывов или скачков, и имеющих линейную вычислительную сложность относительно числа целевых переменных.
Задача сглаживания с сохранением границ является типичной в практике обработки сигналов и изображений. Она постоянно возникает, когда есть основания предполагать наличие существенных неоднородностей, разрывов или скачков в искомом, сглаженном изображении, которые замаскированы шумом во вторичных данных, доступных непосредственной обработке.
Далее рассматриваются два подо да к сохранению границ в задаче обобщенного сглаживания. Первый основан на пошаговом нахождении граничных точек при помощи процедры динамического программирования «вперед и навстречу» [1] и учете ж при даьнейшем формировании критерия оптимизации, а второй - на использовании вместо квадратичной функции связи, имеющей смысл штрафа на негладкость искомого сигнаа, функции, имеющей вид модуля разности соседних элементов данных, что, как покаано в работе, также дает эффект сохранения границ.
Основная идея сглаживания данных древовидной структуры с сохранением границ. Будем рассматривать изображение как действительнозначную функцию У = (у^, 1 е Т), которая принимает значения из некоторого подходящего множества у е У и определена на дискретном множестве Т = (1 = (11,12): tl = 1,...,N1,?2 =1,...,N2}.
В рамках оптимизационного подхода к проблеме сглаживания алгоритм анаиза данных строим как агорит минимизации подходящей целевой функции J(х|у), определенной на множестве всех возможных вариантов вторичного массива данных X = (х^1 еТ) и ирающей роль
штрафа на несоответствие между каждой возможной версией результата и обрабатываемого массива данных У = (у 11 е Т).
Каждый элемент сигнаа или изображения естественным обраом связан с некоторым количеством своих соседей. Отношение соседства удобно выражать в виде неориентированного графа О, который определяется множеством пар соседних друг с другом элементов О с Т х Т. Для
сигналов естественным представлением графа соседства переменных О является цепь, представляющая собой вырожденный случай дерева. Простейшим графом соседства для изображений обычно является прямоугольна решетка (рис. 1,а), но для создания не итерационной процедуры обработки наиболее удобным будет аппроксимировать ее последовательностью деревьев (рис. 1,б), каждый раз оставляя вертикальные связи лишь в одном из столбцов.
1 --------------Ц ---------------а;
Рис. 1. Граф соседства на множестве элементов изображения: а - прямоугольная решетка; б - дерево
С учетом отношений соседства подобного вида целева функция практически всегда может быть выбрана в так называемой сепарабельной форме как сумма двух типов функций, называемых узловыми функциями и функциями связи:
3 (Х|¥ )= (Хг|Уг)+ ХУг', г "(хг ■>х 1")- (1)
геТ (1"о
Узловые функции (х | У г) выбираются в зависимости от конкретной решаемой задачи таким обраом, что кажда из них принимает тем большее значение, чем более очевидно расхождение между гипотезой о том, что Хг является искомым локаьным значением, и соответствующей
окрестностью Уг массива данных. Кажда функция связи у гХг"Хг" налагает штраф на раличие значений пары соседних переменных, то есть на негладкость результата на соответствующем ребре (г", г") графа соседства.
При использовании аппроксимации графа соседства в виде решетки последовательностью деревьев минимизация сепарабельной целевой функции осуществляется посредством эффективной глобаьной процедуры, подобной процедре динамического программирования [1]. Оптимизационна процедра для целевой функции с древовидной сепааабельностью основана на том факте, что удаление любого ребра (г"" е О рабивает дерево на два не связанных друг с другом поддерева О!"" и О " (рис. 2), оп-
ределенных на соответствующих непересекающихся множествах вершин Т"^ и Т"" , так что Т = Т^’ иГ1'1». Если У»(Х"'1») и У^"(Х''") - частичные целевые функции соответствующих частичных векторов переменных, исходна целевая функция может быть представлена в виде суммы
У(Х) =у" '№г)+УГ1"(Х'' , Ъ")+Г"ч" (X? г)- (2)
V V"
J’t fit Т'' rpff Н Г'"
1'Г iriY -Чг 1tY ( Vt* 'ЧГ
Рис. 2. Два поддерева, соединенных ребром (t ',tf)
В дополнение введем обозначения:
У"'1'(х1»)= т*п У1'г(ХГ1'X '~"г'(х1") = т*п У"V(Х"г)- (3)
XX^ \»
8^1» 8^1"
Две функции (3), определенные в узах, соединенных ребром (О") , имеют тот же смысл, что и функции Беллмана в классической процедуре динамического программирования, поэтому назовем их левосторонней и правосторонней функциями Беллмана для ребра (1,1") или возможно, верхней и нижней функциями в зависимости от ориентации соответствующего ребра.
Основным свойством функции Беллмана является тот факт, что
тт У(X) = тт {У' '» (х') + у 1 ^» (х'», X'") + У'у' (X'» )} =
X X'» , X'»
= тт(тт[у" '1 » (X'») + у^1"(Х'»,X'»)]+ »(х 1" )}. (4)
х1" х1'
В задачах обработки изображений граф смежности переменных, соответствующий целевой функции (рис. 1,а)
ч N N2 , V N N2 , V
У(Х|У)= X Е пх^21^2)+ Е Е у'(2-1,х^2)
Ь=Щ =1 Ч =212 =2 (5)
N1 N2 ( ) ()
+ Е Е у"( — 2,х^21
Ч=212=2
не является деревом и метод сглаживания с сохранением границ, рассмотренный в предыдущем разделе, не может быть непосредственно применен к изображениям.
Превратить граф в виде решетки в дерево можно удалением некоторых ребер, например вертикальных, за исключением одного столбца, как показано на рис. 1,б. Но сокращенный граф соседства не позволит обеспечить гладкость искомого массива данных во всех направлениях для каждого элемента растра. Эта возможность сохранится лишь для узлов соответствующего вертикального столбца. В качестве компромиссного решения подход, рассмотренный в работе [2], предлагает приять отимшьные значения переменных в одном столбце с сохраненными вертикальными связями, например ?1, в качестве финальных оценок элементов скрытого массива данных для этого столбца. Такая процедура повторяется для каждого из возможных деревьев с 11=1,...,N1 с теми же горизонтальными ветвями. В данной работе используется именно этот способ обработки изображения с тем отличием, что для каждого дерева используется процедура сглаживания с сохранением границ, описанная ранее.
Очевидно, что чем более безразличной задана функция связи, т.е. чем меньше она отличается от нуля с ростом несоответствия (X'» - X'»),
тем меньше будет минимальное значение целевой функции тт У(Х). Но
Х
степень подобной зависимости должна быть различной для различных пар соседних переменных, и чем она больше, тем более вероятно предположение о том, что рассматриваемая пара содержит еще не найденный скрытый скачок в массиве данных.
Итерационный метод сглаживания сигналов и изображений, основанный на понятии напряженности. Пусть функция уу' » (X'»,X'») является основной, в достаточной мере жесткой функцией связи, обеспечивающей требуемую степень сглаживания на ребре (1 ',1 ") графа соседства переменных, для которого скачок еще не зафиксирован, а функция *
УУ (X'",X'’) - более мягкая функция связи, допускающая наличие скачков. Если отношение
тт {У"'" (X'") + у у'" (X'", X'*) + Ууу (X у )}
Ч1, x 1"
г1 1" =-------------------------------------------------------7-*-7- (6)
тт {Ууу (X'") + У у'" (X'", xi•) + Ууу (X у )}
xt',x1"
превышает некоторый заданный порог г 1 '" > к, то будем считать, что для данной пары соседних переменных возможен скачок. Пусть ^ " принимает значение (6) при превышении порога к и ноль - в противном случае. Будем называть неотрицательную переменную г^у напряженностью на ребре (1 ",1"). Последовательно вычислим напряженность гуу для всех ребер графа соседства. Ребра (1 "Д"), где напряженность достегает своего абсолютного максимума одновременно на всех ветвях двух соседних подде-
ревьев внутри интервала А, содержат новые найденные скачки. Это означает, что функция связи у у' " (xt», X'") ребра (1 ",1" ) должна быть заменена
*
на более безразличную у у " (xt», xt»). Процедура начинает свою работу при исходных основных функциях связи в предположении, что в исходном массиве скачки отсутствуют. Затем процедура запускается вновь с другим набором функций связи, пока не останется ребер с положительным значением напряженности. Данный алгоритм может обнаружить скачки, расположенные ближе друг к другу, чем размер интервала А, но делает это последовательно на разных стадиях обработки.
В качестве примера рассмотрим задачу обычного сглаживания изображений с сохранением границ. В этом случае узловые функции и функции связи приняты квадратичными и имеют достаточно постой вид:
v{xht2 1^,,,2 2 —V2’
У¥2 (1С<1,<2“ЬЩ2)= и<1>2 (— ~:(Н12 )2 , (7)
к а 2
у,2 -1,,2 ,Xt1t2 ) = М¥2 “М2 “ -С,1,2 ) .
Локальной оценкой сглаженного значения интенсивности изображения xOt является значение яркости соответствующего элемента изображения. Таким образом, элементарный фрагмент изображения состоит из единственного элемента У,1,2 = у,,2 . Коэффициенты вертикальных и горизонтальных узловых функций и"1,2 и и"',2 принимают положительные
значения для ребер, на которые распространяются ограничения гладкости, и нулевые значения для ребер, где зафиксирована возможность резких изменений интенсивности.
Пример обработки изображения с использованием описанной процедуры сглаживания с сохранением границ приведен на рис. 3. Он получен за гать итераций с использованием интервала А = 2 .
Как видно на рис. 3,б, алгоритм смог обнаружить резкие перепады яркости, расположенные очень близко друг к другу в отличие, например, от процедуры динамического программирования с квадратичными функциями связи, результат работы которой показан на рис. 3 ,в.
Неитерационный алгоритм сглаживания сигналов
с использованием модуля разности отсчетов сигнала в качестве функции штрафа на негладкость. Предложенный далее метод сглаживания использует в качестве функции связи в рассмотренной выше процедуре динамического программирования модуль разности локальных оценок синалав двух соседних точках.
1М91?аМШт11! , 1л(е1Рсп
а б в
Рис. 3. Результаты сглаживания тестового изображения: а - исходное изображение; б - слаженное процедурой с сохранением границ; в - слаженное процедурой динамического программирования с использованием квадратичных функций связи с сопоставимой
степенью сглаживания
Пусть функция связи
у,,,-(X,,X, — ) = u|xt -X,_1|, и >0. (8)
Предположим, что функция Беллмана на предыдущем шаге У, — (X,_) выпукла и дифференцируема всюду в области определения. Тогда ее производная •//_(X,_)=———«/,_(X,-) монотонно возрастает.
dxt—
Можно доказать, что функция Беллмана и обратное рекуррентное
и / и
соотношение на каждом шаге завися от параметров л( - и xt —, которые
определяются как решение уравнений У,—1 (/,1-) = - и У-/^) = исоответственно. Обратное рекуррентное соотношение /_-(X,) в таком случае
и
полностью определяется своими параметрами X, - и X,- и является кусочно-линейной функцией [3].
Предложенный метод можно использовать также для сглаживания изображений с учетом сделанных предположений о древовидной структуре графа соседства. Пример сглаживания изображений приведен на рис. 4.
Для обработки тестового изображения на рис. 4, а узловые функции выбраны квадратичными, а функции связи представляют собой модуль разности значений искомого сигнал в соседних точках:
Л I ,12 - ^
Уу,2 (^,1,2 -1, Xtl2)= И ¥2 X ,1,, 2 - - -С,1,2 . (9)
г
It
ч
V
а б
Рис. 4. Результаты сглаживания изображения: а - исходное
изображение; б - слаженное процедурой х функцией связи
в виде модуля разности
Как показывают исследования, использование функции модул позволяет получать изображения с необходимой степенью сглаживания, и в то же время локальные особенности исходного массива данных в виде резких перепадов яркости изображения четко отслеживаются и сохраняются процедурой обработки.
Библиографический список
1. Muchnik I. Bellman Functions of Trees for Segmentation, Generalized Smoothing, Matching and Multi-Alignment in Massive Data Sets /1. Muchnik, V. Mottl // DIMACS Technical Report 98-15, Rutgers University, USA. -1998.-P. 63.
2. Optimization techniques on pixel neighborhood graphs for image processing / V. Mottl [et al.] // Graph-Based Representations in Pattern Recognition. Computing, Supplement 12. Springer-Verlag/Wien. - 1998. - P. 135-145.
3. Копылов А.В. Критерии и алгоритмы оценивания нестационарной регрессии в анаизе временных радов / А.В. Копылов, О.В. Красотки-на, В.В. Моттль // Математические методы распознавания образов: 12-я Всероссийска конференция: Сборник докладов.- М.: МАКС Пресс, 2005. -С. 140-144.
Получено 23.04.08