МЕТОДИЧЕСКИЕ ОСНОВЫ ПОСТРОЕНИЯ СИСТЕМ ОБРАБОТКИ ИЗОБРАЖЕНИЙ
УДК 681.7.069.32 DOI: 10.17586/0021-3454-2015-58-2-87-93
Ю. С. Бехтин, Д. В. Титов
ТЕОРЕТИЧЕСКОЕ ОБОСНОВАНИЕ ВЫБОРА ВЕЙВЛЕТ-БАЗИСА В ЗАДАЧАХ СЖАТИЯ ЗАШУМЛЕННЫХ СИГНАЛОВ
Предложена обобщенная процедура выбора вейвлет-базиса из библиотеки базисов для компрессии зашумленных сигналов и изображений разных классов.
Ключевые слова: вейвлет-преобразование, вейвлет-базис, библиотека базисов, вейвлет-коэффициенты.
Введение. Вейвлет-преобразование широко применяется в различных задачах цифровой обработки сигналов и изображений, в частности, для шумоподавления и компрессии. Эффективность вейвлет-преобразования обусловлена его способностью аппроксимировать специальные классы функций относительно небольшим числом ненулевых вейвлет-коэффициентов [1, 2]. Это свойство проявляется при решении задач компрессии сигналов и изображений, а также как при подавлении шума, так и при минимизации вычислений. Для вейвлеткомпрессии и фильтрации применяется пороговая обработка (thresholding [3, 4]), которая заключается в приравнивании нулю таких коэффициентов. Ненулевые вейвлет-коэффициенты называются значимыми.
При выборе дискретного ортонормированного вейвлета учитываются гладкость, число нулевых моментов и компактность носителя [2, 5, 6].
Для коэффициентов дискретного базиса уj k число нулевых моментов определяется по
условию [5]:
где I — число отсчетов исследуемого сигнала, j — номер уровня (субполосы) вейвлетдекомпозиции, к — порядковый номер вейвлет-коэффициента соответствующего уровня. Условие (1) означает, что базис у ортогонален любому многочлену степени p - 1. Чем больше нулевых моментов у базиса, тем выше уровень сжатия низкочастотной части сигнала.
Вейвлеты, разработанные Куафман (Coifman) и названные куафлетами (coiflet), имеют 3р ненулевых моментов, причем они менее асимметричны, чем ортогональные вейвлеты Добеши (Daubechies). Симмлет-фильтры (symmlet), также полученные Добеши, имеют форму, близкую к симметричной, но у них p нулевых моментов.
Свойство гладкости по Липшицу определяется как [5]:
I-1
Z lmyjk(l)=^ m=o,1,■■■, p- д
(1)
l=0
Уjk(l +1) -Уjk(l) ^ c2 ja,
(2)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2015. Т. 58, № 2
88
Теоретическое обоснование выбора вейвлет-базиса
где c>0 — некоторая константа, а — показатель гладкости, или регулярности (regularity). Чем больше а, тем большую степень сглаживания обеспечивает данный вейвлет-базис. Это свойство является важным при кодировании, когда появляются „артефакты звона“ (ringing) некоторых фрагментов сигналов и изображений, коррелирующих с импульсной характеристикой фильтра.
Компактность носителя определяется как
V j ^ (l) = 0 для l £
2 jk,2 jk + (2 j -1)(2p -1)
(3)
Это свойство позволяет строить быстрые и точные вычислительные процедуры на вейвлетах.
Размер носителя и число нулевых моментов априорно независимы. При выборе вейвлета необходимо обеспечить баланс между гладкостью, не зависящими друг от друга числом нулевых моментов и размерами носителей. При обработке кусочно-регулярных сигналов и изображений (в случае большого числа участков с однородной текстурой) необходимо выбирать вейвлет с большим числом нулевых моментов, чтобы получить максимальное число малых по амплитуде вейвлет-коэффициентов. Если неоднородность сигнала высока, то лучше уменьшить размер носителя за счет снижения числа нулевых моментов. При этом гладкость ортогональных вейвлетов связана с числом нулевых моментов, но амплитуда вейвлеткоэффициентов на высоких уровнях декомпозиции зависит от числа нулевых моментов.
В отличие от вейвлетов Добеши, регулярность которых связана с числом обращающихся в нуль моментов, использование биортогональных вейвлетов обеспечивает большую свободу выбора [5]. Если один из них обладает гладкостью порядка а, то дуальный ему вейвлет автоматически имеет, по крайней мере, а нулевых моментов. Биортогональные базисы близки к ортонормированным.
При отказе от ортонормированности возможно построить неортогональные вейвлеты в виде фреймов [7]. Особый класс фреймов представлен базисами Рисса в L2(R).
Таким образом, отбор вейвлета (базиса) по рассмотренным критериям является трудно формализуемой процедурой при вейвлет-кодировании зашумленных сигналов. Синтез вейвлета и масштабирующей функции, адаптируемых под обрабатываемый сигнал (например, с помощью лифтинга), представляется хорошей альтернативой, но на данный момент не разработаны схемы, пригодные для широких классов сигналов. Поэтому целесообразно формирование некоторой библиотеки, выбор базиса из которой производится по специальному критерию, разработанному для сигналов или изображений определенного класса. В настоящей статье предлагается обобщенная процедура выбора, полученная на основе развития теории нелинейной аппроксимации [5], учитывающей ошибки квантования при вейвлет-компрессии зашумленных сигналов и изображений.
Предположим, что сжатию подвергается наблюдаемый сигнал Y, который является образом неизвестного оригинала X, искаженного аддитивным, нормально распределенным шумом Z с нулевым средним:
Y = X + Z. (4)
Многомасштабный анализ позволяет выполнить декомпозицию зашумленного сигнала (4) с использованием быстрого вейвлет-преобразования (БВП) при заданном числе уровней Q [2]. Поскольку вейвлет-преобразование является результатом последовательных сверток,
оператор W[ j], формирующий вейвлет-коэффициенты на каждом уровне j (j = 1,..., Q ),
равен:
W[ j ] = G[ j ] П H[ j ],
i =1
(5)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2015. Т. 58, № 2
Ю. С. Бехтин, Д. В. Титов
89
где H[ j] — низкочастотный, а G[ j] — высокочастотный полосовые фильтры, весовые коэффициенты которых определяются типом вейвлета (базиса).
Вейвлет-декомпозиция зашумленного сигнала при фиксированном базисе может быть представлена следующим образом:
WY = W[ j ]Y = W[j] (X + Z) = W[j] X + W[j] Z = WX + X*. (6)
В этом случае при условии независимости случайных переменных X и Z компоненты WX = W[j ] X, W* = W[ j ](Z ) будут центрированными и некоррелированными случайными процессами с нулевым математическим ожиданием: E[Wx] = 0, E[W*] = 0, E[WxW*] = 0. Это
означает, что на уровне вейвлет-преобразования модель (4) также является аддитивной вида (6).
Требуется выполнить сжатие данных зашумленного сигнала (4), кодируя вейвлет-коэффициенты (6) таким образом, чтобы ошибка восстановления была минимальной в смысле среднего квадрата евклидовой нормы:
Е
^ min,
(7)
где Wjx — вейвлет-коэффициенты восстановленного после компрессии сигнала X. В работах [1, 3] показано, что ошибка восстановления (7), которая вычисляется в области вейвлетпреобразования (трансформанты), эквивалентна среднему квадрату нормы ошибки в пространственной области:
Е
X - X
:L
= Е { ||Wx - W*f}
(8)
Очевидно, что на ошибку восстановления (7) влияет тип выбранного базиса (вейвлета). Таким образом, поиск минимума среднего квадрата нормы ошибки восстановления оригинала
Е
X - X
сопровождается выбором оптимального в смысле (7) вейвлет-базиса из
некоторой библиотеки.
Пусть подвергаемый сжатию зашумленный сигнал (4) представлен I дискретными отсчетами, что в случае БВП дает I вейвлет-коэффициентов. Тогда после сжатия остается только M значимых вейвлет-коэффициентов (M < I ), которые перед кодированием подвергаются квантованию. Без учета возможных потерь энергии сигнала в случае кодирования оценка вейвлет-коэффициента может быть представлена в виде:
w
X к
(wY ), если к < M,
\ Ykr ’ Vk е [1,...,I],
0, если к > M +1,
(9)
где — операция квантования.
Для вычисления полной ошибки, вызванной аппроксимацией и квантованием, вначале рассмотрим сумму квадратов отклонений оценок вейвлет-коэффициентов от их истинных значений:
= Z К
к =M +1
II К wX> - wXк ) = = Z wxk M 2 + ZK - wYk -°кв к ) =
к=1 к =M +1 к=1
2 M >2 I I M M
- w к) +Z(k + °кв к ) = z wYk + Z wi+Z wlk + Z °кв к
к=1 к =M +1 к =M +1 к=1 к=1
I M I M
№ II + № 1 Z w\k +Z<£ к. к =1 к =1
(10)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2015. Т. 58, № 2
90
Теоретическое обоснование выбора вейвлет-базиса
Для удобства введем следующие обозначения:
i I
2 1 ^ 2 а = — > w-
k=1
средняя сумма квадра-
1 м
тов всех вейвлет-коэффициентов зашумленного сигнала; О2 =—> wYk — средняя сумма
м k=1 k
1 I
квадратов значимых вейвлет-коэффициентов; аЩ, =~> w^k — дисперсия вейвлет-
I
k=1
м
12
коэффициентов шума с нулевым средним; а^ = м >0^ k — выборочная дисперсия ошиб-
k=1
ки квантования значимых вейвлет-коэффициентов. Тогда среднее квадрата евклидовой нормы (7) с учетом (10) и того, что M = sI, принимает вид
I2
E
WX - W
х
\ = 1 >
( = у >
’ 1 k=1
Wx - w
X k
2-2 2 2 = а -so +еакв
(11)
Из соотношения (11) видно, что для качественного шумоподавления при сжатии (кодировании) зашумленного сигнала желательно иметь как можно большую сумму квадратов значимых вейвлет-коэффициентов и как можно меньшую дисперсию ошибки квантования.
Пусть библиотека базисов Л представляет собой коллекцию L ортонормированных базисов
Л={р‘, р2, .... Pl}.(12)
В общем случае состав библиотеки может изменяться в зависимости от класса кодируемого зашумленного сигнала. В библиотеку могут, например, входить: базис евклидова пространства R1, базисы Хаара—Уолша, различные вейвлет-базисы семейства Добеши, биортогональные вейвлет-базисы (семейство bior), вейвлеты Кравченко—Рвачева [5]. На их основе строятся соответствующие вейвлет-пакетные базисы и куафлеты. В состав библиотеки можно добавить локальные тригонометрические базисы.
Такой набор базисов может быть легко адаптирован для эффективного представления сигналов любой размерности, в том числе двумерных (изображений). Вычислительная сложность применения того или иного базиса из библиотеки определяется количеством дискретных отсчетов сигнала I, типом вейвлет-обработки и размерностью сигнала, в частности, одномерная (1D) или двумерная (2D) обработка. Количественная оценка вычислительной сложности, таким образом, содержит:
— для процессов декомпозиции (анализа) и реконструкции (синтеза) по ортонормированным 1D- и 2D-базисам, включая 2D-вейвлеты, — O(I) операций;
— при нахождении лучшего базиса при одномерной вейвлет-пакетной обработке — O(Ilog21), а при двумерной — O(Ilog41) операций;
— при нахождении лучшего одномерного локально-тригонометрического базиса —
2 2 O(I [log21] ), а двумерного — O(I [log41] ) операций.
В библиотеку также можно добавить базис, вычисляемый по преобразованию Каруне-на—Лоэва, который дает минимальную энтропию [3].
Набор библиотеки базисов вполне достаточен для декомпозиции (анализа) и реконструкции (синтеза) сигналов и изображений различных классов. Следовательно, неизвестный сигнал f может быть полностью представленMэлементами (M < I) базиса $е (£ = 1,...,L):
f = B(£) Wi(£),
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2015. Т. 58, № 2
Ю. С. Бехтин, Д. В. Титов
91
где B(£) е R1 — ортогональная матрица, столбцы которой являются элементами р£; а WM (£ = 1,...,L ) — матрица сМненулевыми коэффициентами вейвлет-преобразования.
Таким образом, задача совместной фильтрации и сжатия данных искаженного сигнала представляется как задача выбора модели из набора Ре (£ = 1,..., L).
Определение. Базис Р“ предпочтительней базиса Р“ при кодировании зашумленных
сигналов, если при всех s е
I _1,1
■(“) (а (oJ „ )s(») (
Если существуют два числа 81 и 82, такие что
s1 6°а — °а кв ) ^ s1 6°ю — аю кв ) и s2 (
аю аю кв
).
(13)
а а аа кв
) < s2 (ащ ащ кв ) ,
то ра и р“ равнозначны. Параметры а2 и являются функциями переменной 8, поскольку ее величина определяет количество значимых вейвлет-коэффициентов в аппроксимации сигнала.
Чтобы избавиться от неопределенности при сравнении базисов, необходимо использовать некоторый критерий, однозначно демонстрирующий преимущество одного базиса перед другим. Для неискаженных сигналов в теории вейвлет-преобразования рассматриваются критерии, построенные на вогнутых функциях стоимости Шура [2].
Перед тем как использовать такой подход для зашумленных сигналов, необходимо
s /~2 2 \
рассмотреть динамику параметра u = —-I а — акв при квантовании с высоким разрешением
а2 v '
1 I
и при квантовании на низких скоростях а2 ~ — 2 *2 . Поскольку при вейвлет-преобразовании
к=1
сигналов выполняется принцип сохранения энергии, то значение а2 не зависит от выбора базиса и является постоянным для конкретного сигнала или изображения.
На основании вышесказанного сформулируем теорему, справедливую при кодировании зашумленного сигнала на разных скоростях.
Теорема. Базис Р“ предпочтительней базиса Р“ при кодировании зашумленных сигналов тогда и только тогда, когда при всех вогнутых функциях Ф(и) справедливо неравенство
I
£ф
1=1
1 < (а)2
4
— а
(а)2
1 ( / -.2 1 w(“)
WYi
— а(“ )21 ^кв г I
(14)
|<]Г Ф-
.аI l 1г “* jJ Й l^Iv ,
Доказательство. Используем лемму, полученную в теории мажорирования [8].
Лемма. Пусть х[к] > 0 и *[к ] > 0 — две положительные последовательности длины I,
где
х[к] > х[к +1] и *[к] > *[к +1] при 1 < к < I, (15)
I I
причем 2 х[к] = 2 *[к]. При всех M < I эти последовательности удовлетворяют неравенст-
к=1 к =1
вам
M M
2х[к ] >2 у[к ]
к =1 к =1
тогда и только тогда, когда для всех вогнутых функций Ф(и) справедливо
(16)
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2015. Т. 58, № 2
92
Теоретическое обоснование выбора вейвлет-базиса
£Ф(*И) ^ФО-М). (17)
к=1 к =1
Доказательство теоремы основывается на представлении аргумента функции Ф(и) для любого базиса в виде упорядоченной последовательности
и
(£)
1
м
о2/5
w
(£)
2
-о
2
£ кв i
1
м
-2Г 5 *
0 1 i =1
(£)
[ ].
(18)
для которой справедливо *(£)[к] > *(£)[к +1], на основании того, что вейвлет-коэффициенты упорядочены по убыванию, а ошибки квантования не превышают ошибки нелинейной аппроксимации. По условию (13) базис Р“ предпочтительней р“ тогда и только тогда, когда при всех M > 1 выполняется неравенство
м м
5 *(а)[к ] >5 *(ш)[к ].
к =1 к=1
В соответствии с леммой для всех вогнутых функций
5ф (*(а)[к ]) ^5ф (*(Ш)[к ])■
к =1 к=1
тогда после обратной подстановки (18) выполняется (14).
Из практических соображений необходимо использовать какую-либо одну вогнутую функцию Ф(и) . На основании теоремы в рассмотрение вводится функция стоимости Шура [8]:
Г 1 ( wf i 2 0(£)2 У]
U2 /1 ^кв i и
С(Р')= 5ф
i=1
Тогда наилучший базис Р“ минимизирует стоимость аппроксимации [2]:
(19)
C(p“)=min С(р£).
(20)
£
Следовательно, выбор наилучшего базиса зависит от вида вогнутой функции Ф(и) .
На практике при кодировании зашумленных сигналов некоторых классов и изображений в качестве функции стоимости целесообразным считается использование энтропии вида [2]:
Ф(*) = -и ln и , и > 0 .
Для каждого базиса условие и > 0 ограничивает верхний предел суммы в (19) до /=М, ~2 2
при котором <о - окв.
Заключение. В работе получена функция стоимости, позволяющая эффективно выбирать вейвлет-базисы из библиотеки при компрессии зашумленных сигналов и изображений. На практике, чтобы получить оценки вейвлет-коэффициентов , необходимо определить
2
способ обработки зашумленного сигнала в области вейвлет-трансформанты, т.е. найти о .
Компрессия сигнала на основе вейвлет-преобразования, как уже отмечалось, сопровождается отбрасыванием части вейвлет-коэффициентов малой амплитуды. Таким образом, базис и число М значимых вейвлет-коэффициентов влияют на эффективность использования квоты битов, поскольку определяют интервал квантования и расходы, связанные с кодированием
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2015. Т. 58, № 2
Ю. С. Бехтин, Д. В. Титов 93
карты расположения значимых вейвлет-коэффициентов (карты существенности), числа М и типа базиса.
Работа выполнена в рамках гранта Президента РФ для молодых ученых-кандидатов наук (МК-1194.2014.8).
СПИСОК ЛИТЕРАТУРЫ
1. Ахмед Н., Рао К. Р. Ортогональные преобразования при обработке цифровых сигналов. М.: Связь, 1980.
2. Малла С. Вейвлеты в обработке сигналов. М.: Мир, 2005. 671 с.
3. ГонсалесР., ВудсР. Цифровая обработка изображений. М.: Техносфера, 2006. 1072 с.
4. Добеши И. Десять лекций по вейвлетам. М.: Регулярная и хаотическая динамика, 2001.
5. Кравченко В. Ф., Рвачев, В. Л. Алгебра логики, атомарные функции и вейвлеты в физических приложениях. М.: Физматлит, 2006. 416 с.
6. Хардле В., Крекьячарян Ж., Пикар Д. и др. Вейвлеты, аппроксимация и статистические приложения / Пер. К. А. Алексеева [Электронный ресурс]: <http://www.quantlet.de/scripts/wav/html>.
7. Cohen A., Daubechies I., Feauveau J.-C. Biorthogonal Bases of Compactly Supported Wavelets // Comm. on Pure and Appl. Math. 1992. N 45. P. 485—560.
8. Lloyd S. P. Least Squares Quantization in PCM // IEEE Transactions on Information Theory. 1982. Vol. IT-28. P. 129—137.
Юрий Станиславович Бехтин
Дмитрий Витальевич Титов
Рекомендована Юго-Западным государственным университетом
Сведения об авторах
д-р техн. наук, профессор; Рязанский государственный радиотехнический университет, кафедра автоматики и информационных технологий в управлении; E-mail: yuri.bekhtin@yandex.ru канд. техн. наук; Юго-Западный государственный университет, кафедра вычислительной техники, Курск; старший преподаватель;
E-mail: amazing2004@inbox.ru
Поступила в редакцию 10.09.14 г.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2015. Т. 58, № 2