Научная статья на тему 'Оптимальное распределение бит в параунитарном субполосном кодере изображений на основе алгебры кватернионов'

Оптимальное распределение бит в параунитарном субполосном кодере изображений на основе алгебры кватернионов Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
86
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАРАУНИТАРНЫЙ БАНК ФИЛЬТРОВ / МНОГОПОЛОСНОЕ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ / КВАТЕРНИОН / ИЗОБРАЖЕНИЕ / ДИСПЕРСИЯ РЕКОНСТРУКЦИИ СИГНАЛА

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы —

Рассматривается проблема распределения бит в контексте древовидной структуры 2D параунитарного банка фильтров на основе алгебры кватернионов пакета 4-полосного вейвлет преобразования. Показано, что оптимальное распределение бит будет в случае, если дисперсии ошибок квантователей в каналах кодера равны.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

OPTIMAL BIT ALLOCATION IN THE PARAUNITARY SUBBAND IMAGE CODER BASED ON THE QUATERNION ALGEBRA

The problem of bit allocation in the context of the tree structure 2D paraunitary filter bank based on the quaternion algebra, i.e. 4-band packet wavelet transform, is considered. It was shown that the bit allocation is optimal if the quantizers error variances in the encoder channels are equaled.

Текст научной работы на тему «Оптимальное распределение бит в параунитарном субполосном кодере изображений на основе алгебры кватернионов»

2013

УДК 004.383.5

Доклады БГУИР

№ 1 (79)

ОПТИМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ БИТ В ПАРАУНИТАРНОМ СУБПОЛОСНОМ КОДЕРЕ ИЗОБРАЖЕНИЙ НА ОСНОВЕ АЛГЕБРЫ КВАТЕРНИОНОВ

НА. ПЕТРОВСКИЙ

Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 220013, Беларусь

Поступила в редакцию 12 ноября 2013

Рассматривается проблема распределения бит в контексте древовидной структуры 2D параунитарного банка фильтров на основе алгебры кватернионов - пакета 4-полосного вейвлет преобразования. Показано, что оптимальное распределение бит будет в случае, если дисперсии ошибок квантователей в каналах кодера равны.

Ключевые слова: параунитарный банк фильтров, многополосное вейвлет-преобразование, кватернион, изображение, дисперсия реконструкции сигнала.

Постановка задачи

В последние несколько декад банки фильтров рассматриваются как наиболее эффективная техника компрессии данных мультимедиа [1]. Банки фильтров применяются в кодировании аудиосигналов, изображений и видеопотока в таких стандартах как JPEG, JPEG2000, JPEG XR, MPEG и H.264/AVC.

Рис. 1. Схема субполосного кодирования на основе полифазных матриц

На рис. 1 показана схема субполосного кодирования на основе максимально децимированного М-канального банка фильтров, состоящего из систем анализа и синтеза, полифазных матриц Е(I) и I) соответственно. Полифазная структура банка фильтров формулируется следующим образом [1]:

[н0(2) ВД ... Нм_1(г)]Т=Е (1М)Ф)\ [ВД ВД ... Е^Дг^ВДН^),

где е(г) = [1 г 1 ... г ш \\к{г) и ¥к(г) - передаточные функции к -го канала банка

фильтров анализа и синтеза соответственно. Если матрица Е(1) обратима, то полифазная матрица синтеза К(1) может быть выбрана как обратная матрица Е(1), тогда перфективная реконструкция достигается. Такой банк фильтров называется перфективно реконструированный банк фильтров или биортогональный банк фильтров. Если Ет( 1_1)Е(1) = I и Я(I) = Ет(1, то это специальный класс банка фильтров - параунитарный банк фильтров (ПУБФ). Структура ПУБФ получается путем факторизации его полифазной матрицы Е(1) на элементарные математические преобразования, как правило, это планарные обороты Гивенса. Для ПУБФ анализа с линейной ФЧХ и четного числа каналов М хорошо известна факторизация передаточной полифазной матрицы Е(1) [2]:

Е(г) = Сжч(г)Сж_2(г)...С1(г)Е0, где Е0 =-^Ф0\¥с11аё(1м/2, Зм/2), СДг) = 1<1>\¥Л(г)\¥,

i = 1,...,N-1, W

IM/2 ^M/2

J-M/2 _IM/2,

A(z) = diag(I m/2, z-1Im/2) , Ф = diag(Ui,Vi), Ц и Уг

произвольные ортогональные матрицы размера М/2 х М/2. Кроме того, для упрощения обозначенной выше факторизации для I > 0 матрица и может быть представлена единичной матрицей, тогда Фi = diag(I, V). Как видно, ПУБФ может реализовываться на основе решетчатых и лестничных структур, которые, как известно, сохраняют перфективную реконструкцию и при реализации на арифметике с фиксированной запятой.

Положим, что входной сигнал х(п) стационарный, спектральная мощность которого

$хх (е1™), Ьк количество бит представления сигнала Ук (п) на выходе к -го канала системы анализа, а а^ есть дисперсия сигнала V (п):

л

< = i Sxx(eja)|Hk(eш)|2 |f.

Динамический диапазон отсчета сигнала V (п) на входе к -го квантователя делится на

интервалов. Вес старшего значащего бита выбирается пропорционально дисперсии а^

таким образом, чтобы вероятность переполнения была одинаковой во всех каналах. Дисперсия ошибки к -го квантователя при условии, что шум квантования аддитивный ко входному сигналу V (п) определяется следующим образом [3]:

_2 „ п-2Ьк _2 =^к 2 к ,

где &к - константа, которая зависит от функции плотности вероятности сигнала V (п). Для параунитарной системы, где сохраняется баланс энергий, шум квантования рассматривается на входе системы синтеза К(1), который усредняется в каналах синтеза и равен средней дисперсии ошибки реконструкции сигнала:

r

1 M-1 M-1

= — h °2 = h % 2-2% о2 / M.

m h h k V

Итак, положим, что общее количество бит для квантователей всех М канальных сигналов Ук(п), к = 0,..,М-1 фиксировано и равно Ь. Проблема оптимального распределения бит кватователей может быть сформулирована следующим образом: найти Ь0,...,ЬМ_1 при

M b / M-1 2b

условии, что общий ресурс битов b = h /м = const и минимизации min h k g2

/ M.

Таким образом, целью оптимизации является минимизация дисперсии ошибки реконструкции сигнала <з2г при ограничении на общий ресурс битов.

В случае схемы кодирования на основе линейного преобразования, как показано в [3, 4], оптимальное распределение бит для каждого квантователя в каналах будет, когда дисперсии шума квантования канальных сигналов равны. Для параунитарного субполосного кодера важно как распределить общий ресурс бит между канальными квантователями и как выбрать/факторизовать параунитарную матрицу Е(1), чтобы максимизировать коэффициент субполосного кодирования. Решение второй задачи показано в [5]. В данной работе определяется схема оптимального распределения бит в параунитарном субполосном кодере изображений, который реализован на основе алгебры кватернионов.

Параунитарный субполосный кодер

Матрицы E0 и R в факторизации решетчатой структуры параунитарного банка фильтров анализа, как показано в [5], можно выразить через матрицы умножения кватернионов (левого и правого умножения) следующим образом: E0 = M+ (Q0)M—(P0), R = M1 (Q), i = 1,..., N —1 , где P и все Q,- некоторые единичные кватернионы, тогда передаточная функция решетчатой структуры общего ПУБФ анализа будет равна: E(z) = M±(6^_1)A(z)M±(6JV_2)A(z)...M±(61)A(z)M+(a)»r(P0). В работе [5] утверждается, что для каждой ортогональной матрицы размерностью 4^4 существует уникальная (с точностью до знака) пара единичных кватернионов P и Q таких, что:

M+ (P) ■ M— (Q) = M— (Q) ■ M+ (P). Данная факторизация всегда соответствуют ортогональному преобразованию сигналов, даже если ее компоненты квантованы. Это происходит потому, что столбцы каждой матрицы умножения кватернионов составлены из одних и тех же элементов с точностью до знака. Реализация параунитарного банка фильтров анализа с линейной ФЧХ на основе умножителей кватернионов предполагает определение Ф0 и Фг как

[6]: Ф0 =M—(P0)M+ (Q0), Фг =M— (P), i = 1,...,N — 1, где все P и Q - некоторые единичные кватернионы.

Для схемы компрессии изображений 1D ПУБФ на кватернионах (N = 3) [6] используется для построения 2D разделяемого ПУБФ (см. рис. 2). Соотношение децимации/интерполяции в 2D схеме ПУБФ, эквивалентной рис. 1, задается двумерной

матрицей [1] 4 0 и коэффициент децимации определяется как ее определитель, т. е. М = 16.

На рис. 3 показаны результаты работы схемы (рис. 2): исходное изображение Lena (512^512) (а), декомпозиция изображения полифазной матрицей E(z) (б); реконструированное

изображение полифазной матрицей R(z) (в). Эксперимент проводился для ПУБФ с линейной ФЧХ (% = -231/512 + /459/1024 + j0 + £0; р0 = -7/8 - /3/8+j0 + £0; р = -3/16+ /15/16+j0 + k0; P2 = -9/16 - /13/16+ j0 + £0), которому соответствует 4-х полосное вейвлет-преобразование. Вейвлет-фильтры имеют хорошую частотную избирательность: уровень АЧХ в полосе непропускания для низкочастотных и высокочастотных фильтров составляет около -35 дБ, а для полосовых - около -20 дБ. При этом показатель эффективности кодирования равен 8,1845 дБ. Пиковое значение отношения сигнал-шум здесь составило 53,24 дБ.

x(n)

I 4

4

Eo(z)

4

1=->| 4

Vo(n)t Qo Uo(n)

Vi(n) Ql Ui(n)>

Eoo(z) Roo(z)

V2(n)t Qi U2(n)>

Vjfci^ Q3 U3(n)

t 4^

I 4

t 4

j 4

!=->! 4

Eo3(z)

Qo

Ul2(n)>

Vn(n)>

Qi

Jn(ny

Vl4(n^

Ql

Jl4(n)»

Q3

(i у

Ro3(z)

f 4

t 4

f 4

z^

f 4

z1

f 4

T

-1 z

1 4

Ro(z) -1 z

t 4

-1 z

f 4

y(n)

-Обработка столбцов-

-Обработка строк—► ^^ашГе ^ ^—Обработка строк—► Ч-Обработка столбцов

-Анализ-

-Синтез—

Рис. 2. Схема 2D параунитарного субполосного кодирования

а б в

Рис. 3. Исходное изображение Lena (512*512) (а); декомпозиция изображения полифазной матрицей E(z) (б); реконструированное изображение полифазной матрицей R(z) (в)

Задача оптимального распределения бит по каналам в схеме на рис.2 формируется

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

следующим образом:

найти h[n />!,...,/>,- при условии, что b = (h] +b} +...+/>,-)/ 16 = const и минимизации ошибки

_ 2

реконструкции сигнала min^zk2 2Ъкo2v /16.

к=0

С другой стороны, задачу оптимизации можно определить как поиск дисперсии сигнала на выходе квантователей при минимизации общей дисперсии ошибки реконструкции сигнала на выходе системы синтеза. Известно, что

15 /

V2b = Щ Т1Ък К

к=0

z

z

4

z

4

z

z

4

z

4

z

z

z

4

z

z

4

z

z

U

После умножений левой и правой части данного выражения на 2 2Ък )16 получается,

к=0

что 22b](вкo^k f = ](2-2bk вкo2k f. к=0 v к=0 4 '

Здесь левая часть не зависит от числа битов квантователя bk, т.е. это константа. Пусть

Dk = вк 2 2bk oV дисперсия сигнала на выходе к -го квантователя, тогда равенство

к

15 1

представляется следующим образом: const = Dk 16 . После возведения левой и правой части в

к

к =0

степень 16 получается, что const = ]D .

к=0

Таким образом, задача оптимального распределения бит квантователей в каналах схемы параунитарного субполосного кодирования формулируется следующим образом:

15 1 15

найти D0,...,Dl5 при условии, что const = [ Dku' и минимизации min ^ 1)к /16.

к=0 к=0

Так как Dk = вк 2~2bt oV > 0, то значения Dk являются неотрицательными величинами.

Известно, что сумма неотрицательных значений минимальна, когда их произведение будет постоянной величиной при условии, если все они равны: D0 = 1\ =... = Z)15 = D, где I) некая наперед заданная величина. Физическая интерпретация данного результата следующая:

дисперсия сигналов Dk = вк 2 2Ък ov на выходах квантователей всех каналов равна, или

к

другими словами, дисперсия ошибки реконструкции изображения минимальна, когда дисперсии ошибок, внесенные каждым квантователем, равны.

Величина D определяется в процессе задания степени сжатия изображения. Пусть Dk = D, тогда

2-2Ьк = D

вко2к '

Далее следует, что

15

22b = П

' D ^

j- I6+---+16

к=0

v в к о2к у

D

п (в к о;к)

к=0

15 /

D = 2-2b ПИ )16 .

— , тогда

к=0

Таким образом, оптимальное распределение бит квантователей по каналам параунитарного

субполосного кодера будет следующим: £к

Ък = Ь + к

П (вк о2к)"

Как следует из приведенных рассуждений, оптимальное распределение бит для каждого квантователя в каналах 2D параунитарного субполосного кодера будет, когда дисперсии шума квантования канальных сигналов равны.

16

Заключение

Обосновано оптимальное распределение бит в схеме 2D параунитарного субполосного кодера на основе алгебры кватернионов. Так, если число бит представления субполосного сигнала фиксировано, то дисперсии ошибок квантователей в каналах кодера должны быть равны для оптимального распределения бит в параунитарном субполосном кодере. В приложениях кодирования изображений важнее использовать критерий минимизации ошибки реконструкции, чем минимизировать ее дисперсию. Например, можно добавить различные неотрицательные веса для каждого канала и затем пытаться минимизировать взвешенную сумму дисперсий ошибок квантователей. В задаче оптимизации еще можно использовать факт, что средне арифметическое неотрицательных величин больше или равно их средне геометрического. Легко доказать: чтобы минимизировать сумму взвешенных слагаемых, они должны быть равны. Другими словами, дисперсии ошибок квантования в каналах кодера обратно пропорциональны соответствующим весам.

OPTIMAL BIT ALLOCATION IN THE PARAUNITARY SUBBAND IMAGE CODER BASED ON THE QUATERNION ALGEBRA

N.A. PETROVSKY

Abstract

The problem of bit allocation in the context of the tree structure 2D paraunitary filter bank based on the quaternion algebra, i.e. 4-band packet wavelet transform, is considered. It was shown that the bit allocation is optimal if the quantizers error variances in the encoder channels are equaled.

Список литературы

1. Vaidyanathan P.P. Prentice-Hall. NJ. 1993.

2. Chen Y-J., Amaratunga K.S. IEEE Trans. CAS - II. 2003. Vol. 50, № 12. P. 963-976.

3. Jayant N.S., Noll P. Prentice-Hall. NJ. 1993.

4. Soman A.R., Vaidyanathan P.P. IEEE Trans. Signal processing. 1993. Vol. 41, № 5. P. 1824-1835.

5. ParfieniukM, PetrovskyA. Signal Processing. 2010. Vol. 90. P. 1755-1767.

6. Петровский Н.А., ПарфенюкМ. // Докл. БГУИР. 2011. № 1 (55). С. 70-74.

i Надоели баннеры? Вы всегда можете отключить рекламу.