Научная статья на тему 'Оценка влияния модификации вейвлет-коэффициентов на сжатие медиаданных'

Оценка влияния модификации вейвлет-коэффициентов на сжатие медиаданных Текст научной статьи по специальности «Автоматика. Вычислительная техника»

CC BY
76
12
Поделиться
Ключевые слова
вейвлет-коэффициенты / квантование / сжатие / восстановление / масштабирование / коррекция.

Аннотация научной статьи по автоматике и вычислительной технике, автор научной работы — А. А. Борискевич, В. Ю. Цветков

Предложены алгоритмы модификации вейвлет-коэффициентов, основанные на масштабировании и коррекции значений вейвлет-коэффициентов для адаптации к равномерной шкале квантования и согласования восстановленных значений с динамическим диапазоном исходных вейвлет-коэффициентов. Данные алгоритмы позволяют улучшить характеристики вейвлет-сжатия различных компонент медиаданных (аудио, изображений и видео) с потерями. Дана количественная оценка влияния модификации вейвлет-коэффициентов на характеристики сжатия. Показано, что характеристики вейвлет-кодеков могут быть улучшены в области малых коэффициентов сжатия за счет выбора оптимального значения масштабирующего коэффициента и в области средних коэффициентов сжатия за счет коррекции восстановленных значений вейвлет-коэффициентов на величину предсказанной ошибки восстановления.

Похожие темы научных работ по автоматике и вычислительной технике , автор научной работы — А. А. Борискевич, В. Ю. Цветков,

ESTIMATION OF WAVELET COEFFICIENTS MODIFICATION INFLUENCE ON MULTIMEDIA DATA COMPRESSION

The wavelet coefficients modification algorithms based on scaling and correcting wavelet coefficient values for adaptation to uniform quantization scale and adjusting reconstructed values with original wavelet coefficients dynamic range are proposed. The algorithms allow to improve lossy wavelet compression characteristics for the various multimedia components (audio, image and video). A quantitative estimation of wavelet coefficients modification influence on the multimedia data compression characteristics is presented. It is shown that the wavelet compression characteristics may be improved in domain of low compression coefficients due to choice of optimal scalable coefficient and in domain of mean compression coefficients due to correction of reconstructed wavelet coefficient values according to predicted reconstruction error value

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Текст научной работы на тему «Оценка влияния модификации вейвлет-коэффициентов на сжатие медиаданных»

2006

Доклады БГУИР

октябрь-декабрь

№ 4 (16)

УДК 621.391

ОЦЕНКА ВЛИЯНИЯ МОДИФИКАЦИИ ВЕЙВЛЕТ-КОЭФФИЦИЕНТОВ НА СЖАТИЕ МЕДИАДАННЫХ

А.А. БОРИСКЕВИЧ, В.Ю. ЦВЕТКОВ

Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 220013, Беларусь,

Поступила в редакцию 19 июня 2006

Предложены алгоритмы модификации вейвлет-коэффициентов, основанные на масштабировании и коррекции значений вейвлет-коэффициентов для адаптации к равномерной шкале квантования и согласования восстановленных значений с динамическим диапазоном исходных вейвлет-коэффициентов. Данные алгоритмы позволяют улучшить характеристики вейвлет-сжатия различных компонент медиаданных (аудио, изображений и видео) с потерями. Дана количественная оценка влияния модификации вейвлет-коэффициентов на характеристики сжатия. Показано, что характеристики вейвлет-кодеков могут быть улучшены в области малых коэффициентов сжатия за счет выбора оптимального значения масштабирующего коэффициента и в области средних коэффициентов сжатия за счет коррекции восстановленных значений вейвлет-коэффициентов на величину предсказанной ошибки восстановления.

Ключевые слова: вейвлет-коэффициенты, квантование, сжатие, восстановление, масштабирование, коррекция.

Введение

Перспективным направлением в области хранения, обработки, передачи и распределения мультимедийной информации является технология вейвлет-сжатия. Данная технология позволяет достичь высокого качества восстановления информации и значительных коэффициентов сжатия при относительно низкой вычислительной сложности. Наибольшее распространение получили алгоритмы вейвлет-сжатия изображений, такие как EZW (Embedded Zerotree Wavelet) [1], SLCCA (Significance-linked connected component analysis) [2], SPIHT (Set Partitioning in Hierarchical Trees) [3], SPECK (Set Partitioning Embedded bloCK) [4], MRWD (Morphological Representation of Wavelet Data) [5], JPEG 2000 [6] и т.д. Для сжатия видеоданных разработаны трехмерные версии некоторых алгоритмов, в частности 3D-EZW [7], 3D-SLCCA [8], 3D-SPIHT [9]. Вопрос эффективности применения одномерных версий перечисленных алгоритмов для сжатия аудиоданных практически не исследован. В связи с этим актуальной является задача совершенствования и развития алгоритмов вейвлет-сжатия для улучшения их характеристик и расширения области применения.

Квантование и восстановление значений вейвлет-коэффициентов

Сущность технологии вейвлет-сжатия состоит в использовании операций прямого и обратного рационального и целочисленного вейвлет-преобразований, эффективного вложенного квантования и восстановления вейвлет-коэффициентов. При динамическом выделении сетевых

ресурсов и резервировании полосы пропускания канала связи в соответствие с объемом передаваемой информации и временем на передачу возможно сжатие изображений, аудио и видеоданных без потерь с использованием целочисленного вейвлет-преобразования на основе лиф-тинг-схемы [10]. Если требуемая скорость передачи превышает пропускную способность канала связи, возможно их согласование за счет сжатия дискретных сигналов с потерями на основе рационального вейвлет-преобразования, использующего банк вейвлет-фильтров [11]. Сжатие рациональных значений вейвлет-коэффициентов требует их предварительного квантования. При вейвлет-сжатии осуществляется прогрессивная передача информации о вейвлет-коэффициентах. Особенностью режима прогрессивной передачи является эффективное распределение бит, определяющих значения вейвлет-коэффициентов, по битовым плоскостям и передача битовых плоскостей в порядке убывания их психовизуальной и психоакустической значимости. Это позволяет реализовать на приемной стороне постепенное восстановление значений вейвлет-коэффициентов и постепенное улучшение качества восстанавливаемого сигнала, оцениваемого средним квадратом ошибки MSE (mean-square error) и пиковым отношением сигнал шум PSNR (peak signal-to-noise ratio) при определенной степени сжатия BR (Bit Ratio):

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

MSE =1 g (( - Хг

n-1 ~

(1)

PSNR = 10log

n

f( -1))

10

MSE

У

(2)

BR = BD/CR , (3)

где Xi, Xi — исходное и восстановленное значения дискретов сигнала (пикселей изображения, видеоданных или отсчетов аудиоданных); n — общее число пикселей изображения, видеоданных или отсчетов аудиоданных; BD - битовая глубина (bit depth — число бит на пиксель (bpp) для исходного изображения и видеоданных или число бит на отсчет (bps) для исходных аудиоданных); CR=n-BD/V — коэффициент сжатия (Compression Ratio); V - объем сжатых данных в битах.

Причинами ошибок восстановления данных являются квантование рациональных значений вейвлет-коэффициентов и ограничение объема V передаваемой о них информации при

CR>1.

В результате равномерного квантования ряд различных значений исходных вейвлет-коэффициентов заключенных в интервале квантования [L, L+1), заменяются на L и L+1 или L в зависимости от способа квантования: округление до ближайшего целого в соответствии

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[L, при L < CO < L + 0,5, с выражением С- = < или округление с недостатком согласно

[L +1, при L + 0,5 < C° < L +1

соотношению C° = L, при L < C° < L +1, где i = 0, n — 1 - номер вейвлет-коэффициента; n -

число вейвлет-коэффициентов.

Операции округления и усечения необратимы и являются причинами шума квантования. Мощность шума квантования вейвлет-коэффициентов определяет качество восстановления сигнала при малой степени сжатия.

При средней и высокой степени сжатия качество восстановления сигнала определяется объемом V передаваемой информации о вейвлет-коэффициентах. Ограничение V приводит к неточному восстановлению значений вейвлет-коэффициентов. При сжатии с потерями для всех исходных C i и восстановленных

CR, значений вейвлет-коэффициентов справедливо соотноше-

nR ^ г>° ние Ci < Ci .

Увеличение степени сжатия приводит к росту значений ошибок восстановления вейв-лет-коэффициентов и ухудшению оценок MSE и PSNR восстановленных данных.

В связи с этим актуальной является задача поиска эффективных алгоритмов обработки рациональных значений вейвлет-коэффициентов, позволяющих сократить потери информации при квантовании и восстановлении значений вейвлет-коэффициентов.

Масштабирование значений вейвлет-коэффициентов

Предлагается алгоритм адаптации значений вейвлет-коэффициентов к шкале квантования по критерию минимума среднеквадратической ошибки восстановления данных. Алгоритм основан на масштабировании значений вейвлет-коэффициентов перед квантованием и после их восстановления. Он позволяет сократить объем информации о вейвлет-коэффициентах и улучшить качество восстановления при сжатии медиаданных с потерями. На рис. 1,а представлена структурная схема процедуры масштабирования вейвлет-коэффициентов. Из рисунка видно, что суть предложенного алгоритма состоит в умножении рациональных значений всех вейвлет-коэффициентов на масштабирующий коэффициент s перед квантованием и выполнении обратной операции после восстановления значений вейвлет-коэффициентов. Выбор значения коэффициента s зависит от плотности вероятности значений исходных и восстановленных вейвлет-коэффициентов и осуществляется следующим образом.

Если значения любой пары исходных вейвлет-коэффициентов СOi и С0у находятся в интервале квантования [L,L+1), то модуль их разности не превышает единицы:

VC°VC°(((l<CO <L + i)(L<CO <L + I)a(C° *CO))(cO -C°\<l)). (4)

В этом случае значение масштабирующего коэффициента может быть выбрано из диапазона s>1 таким образом, чтобы для любой пары вейвлет-коэффициентов, значения которых находятся в интервале квантования [L,L+1), выполнялось условие

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

VC°VC°3s(((L < CO <L +1) a(L < CO < L +1) a(c° * CO)) ^ ((sCO -sC°\ > 1) a (s > 1))). (5)

Следовательно, значения вейвлет-коэффициентов из интервала квантования [L,L+1) (рис. 1,6) после масштабирования окажутся в разных интервалах (рис. 1,г) и после квантования (рис. 1,ó) могут быть восстановлены более точно, чем квантованные немасштабированные вейвлет-коэффициенты (рис. 1,в).

Выполнение условия (5) позволяет уменьшить шум квантования и улучшить оценку MSE для восстановленных данных, не превышающую предельного значения MSE при коэффициенте сжатия CR=1 без масштабирования (s=1).

Если значения любой пары восстановленных вейвлет-коэффициентов СRi и Су находятся на разных уровнях квантования L¡ и L2, то модуль разности значений соответствующих не-квантованных исходных вейвлет-коэффициентов не меньше единицы:

vcR vcR vcOvcO ((( = L )a(CR = L2 ))) - c;O| > 1)). (6)

В этом случае значение масштабирующего коэффициента может быть выбрано из диапазона s<1 так, чтобы для любой пары восстановленных вейвлет-коэффициентов, значения которых находятся на разных уровнях квантования L¡ и L2, выполнялось условие:

vcRVCR VCOVCO 3s * j * j

(((CR = L1) a(CR = L2)) ^ ((Is CO -sCO\ < 1) A(s < 1))).

(7)

б)

С и С i С н-1 в)

Рис. 1. Масштабирование вейвлет-коэффициентов: а — структурная схема процедуры масштабирования; б — исходные вейвлет-коэффициенты; в — квантованные вейвлет-коэффициенты; г — масштабированные вейвлет-коэффициенты; д — квантованные масштабированные вейвлет-коэффициенты

Поскольку величина масштабирующего коэффициента 5 влияет на максимальное абсолютное значение С°тах исходных вейвлет-коэффициентов, то изменение числа Т битовых плоскостей (реальной битовой глубины) оценивается соотношением:

T = |log2 (C1 (s ))|,

где | | — операция округления с избытком; C (s) = max

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 \CO (s)

(8)

— максимальное абсолют-

ное значение исходных вейвлет-коэффициентов; I = 0, п -1; п - число вейвлет-коэффициентов.

Согласно выражению (8), выбор значения масштабирующего коэффициента 5<1 приводит к уменьшению значения максимального вейвлет-коэффициента, числа Т битовых плоскостей, а также увеличению концентрации информации в битовых плоскостях. В результате при сжатии с потерями передаваемая информация о вейвлет-коэффициентах в объеме V, ограниченном коэффициентом сжатия, позволяет менее точно восстановить значения большего числа вейвлет-коэффициентов. Сокращение числа битовых плоскостей за счет масштабирования при 5< 1 может привести к тому, что реальный коэффициент сжатия СЯ окажется больше заданного коэффициента сжатия СЯ$.

Алгоритм поиска оптимального значения масштабирующего коэффициента 5 по критерию минимума среднеквадратической ошибки МБЕ восстановления сигнала целесообразно осуществлять в диапазонах 5^<5<1 и 1<5<5Н, где 5Ь и 5Н — нижняя и верхняя границы поиска. Значение 5Н определяется минимально достижимым значением МБЕ при коэффициенте сжатия СЯ=1 без масштабирования (5=1). Значение 5Ь определяется условием СЯ$<тт(СЯ). Выбранное значение 5 должно быть передано на декомпрессор.

тах

Коррекция восстановленных значений вейвлет-коэффициентов

Предлагается алгоритм согласования восстановленных значений вейвлет-коэффициентов с динамическим диапазоном исходных вейвлет-коэффициентов. Данный алгоритм основан на коррекции восстановленных значений в соответствии с предсказанной ошибкой восстановления и позволяет улучшить качество восстановления при сжатии медиаданных с потерями. Алгоритм включает операции определения максимального абсолютного значения С0тах исходных вейвлет-коэффициентов (рис. 2,а), передачи данного значения в декомпрессор, вычисления максимального абсолютного значения С* восстановленных вейвлет-коэффициентов и вычисления приблизительного значения ошибки 5 восстановления вейвлет-коэффициентов в соответствии с выражением:

с0 - Ск

5 _ max_max

(9)

а)

б)

Рис. 2. Коррекция восстановленных значений вейвлет-коэффициентов: а — структурная схема процедуры коррекции; б — алгоритм коррекции

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Предсказанная ошибка восстановления 5 используется для вычисления скорректированных значений вейвлет-коэффициентов С* (рис. 2,б) с учетом знака восстановленных значений вейвлет-коэффициентов CRi в соответствии с соотношением:

с* _

С* +5 при С* > 0, С*-5 при С* < 0, 0 при С* _ 0.

(10)

Из выражений (1), (2) и (10) видно, что данная коррекция позволяет улучшить оценки качества восстановленного сигнала МБЕ и PSNR.

2

Результаты моделирования

Для оценки эффективности использования предложенных алгоритмов модификации вейвлет-коэффициентов разработаны программные модели вейвлет-кодеков для сжатия медиа-данных с потерями: одномерные (1Б^С), двумерные (2Б^С) и трехмерные (ЗБ^С) [12].

В качестве тестовых сигналов для оценки характеристик сжатия аудиоданных выбраны два характерных монофонических музыкальных 16-битных фрагмента по 262144 отсчета

21

в стиле рок ("Rock") и джаз ("Jazz") с частотой оцифвки 44100 Гц, имеющие существенные различия в динамическим диапазоне и распределении спектральных компонент. В качестве тестовых изображений использованы два стандартных тестовых полутоновых изображения 512x512 пикселей: низкочастотное "Lena" и высокочастотное "Barbara". Для оценки параметров 3D алгоритмов сжатия использованы две видеопоследовательности по 64 полутоновых кадра форматом 64x64 пикселей, представляющие перемещение низкочастотных ("Video-1") и высокочастотных ("Video-2") объектов на видеоизображении.

Адаптация значений вейвлет-коэффициентов к шкале квантования для полутоновых изображений и видеоданных наиболее эффективна при небольшой степени сжатия (рис. 3). При BR>2 bpp выигрыш в оценке PSNR для полутоновых изображений может достигать 5 дБ. Для аудиоданных масштабирование не приводит к существенному выигрышу в оценке PSNR, но позволяет управлять степенью сжатия в пределах 13-16 bps без существенного изменения значения PSNR.

Тестовое изображение: "Lena" Всйвлст: биортогональный 9.7

45

30

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.5 1 1.5 2 2.5 3 а)

PSNR BR- 8 bpp

BR = 4 bpp

___BR = 2 bpp

1/ Видеопоследовательность: "Video-1"

У Вейвлет: Хаара

s

Тестовое изображение: "Barbara" Всйвлст: биортогональный 6.8

б)

PSNR BR = 8 bpp

/ f BR = 4 bpp

BR = 2 bpp

\j Видеопоследовательность: "Video-2" .

» Вейвлет: Хаара

s

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.5 1

0.5

1.5

2.5

в) г)

Рис. 3. Характеристики сжатия полутоновых изображений и видеоданных: а — PSNR

для "Lena"; б — PSNR для "Barbara"; в — PSNR для "Video-1"; г — PSNR для "Video-2"

Относительно низкая эффективность масштабирования значений вейвлет-коэффициентов для аудиоданных в сравнении с изображениями и видеоданными объясняется более высокой разрядностью отсчетов аудиоданных, а также спецификой формы плотности вероятности значений вейвлет-коэффициентов, обусловленной высокочастотным характером аудиоданных и более равномерной концентрацией информации в битовых плоскостях.

Согласование восстановленных значений вейвлет-коэффициентов с динамическим диапазоном исходных вейвлет-коэффициентов за счет коррекции наиболее эффективно при сжатии аудио и видеоданных (рис. 4). Вейвлет-кодеки с коррекцией (1D-WCc, 2D-WCc, 3D-WCc) в

сравнении с вейвлет-кодеками без коррекции (1D-WC, 2D-WC, 3D-WC) позволяют получить наибольший выигрыш в оценке PSNR в области средних коэффициентов сжатия: до 5 дБ для аудиоданных при 0,5<BR<14 bps и до 3 дБ для изображений и видеоданных при 0,5<BR<4 bpp. В области малых коэффициентов сжатия точность предсказания ошибки восстановления невысока и может дать проигрыш в оценке PSNR до 7 дБ для изображений и видеоданных. В области больших коэффициентов сжатия коррекция неэффективна из-за низкой точности восстановления значений вейвлет-коэффициентов. Из рис. 4 видно, что для высокочастотных компонент медиаданных коррекция восстановленных значений вейвлет-коэффициентов более эффективна, чем для низкочастотных. Это объясняется более равномерным характером гистограммы значений вейвлет-коэффициентов высокочастотных данных.

55

dH|

50 45

PSNR 2P-WC ("Lena1") 2D-WCc ("Lena"-) '

2D-WCc ("Barbara"') 2D-WC ("Barbara")

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вейвлет: биортопшальный 6.8

BR

50

35

20

a)

PSNR 3D_WC Г"Video-1")

--'У jS-'-

3D-WCc ("Video-1") >' / ^

_У <y 3D-WCc ("Video-2")"

\3D-WC ("Video-2")

/ Вейвлет: Xaapa

BR

100 dB|

90

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

PSNR 9П-Wr ("I рпя")

2D-WCc {"Lena") У' 7

X \ 2D-WCc ("Barbara")

A' " /' }! / f - if ft • //' \ 2D-WC ("Barbara")

- Вейвлет: Xaapa BR

3 1 2 3 4 5 6 7 bpp 6)

PSNR

lD-WCc ("Rock"') lD-WCc ("Jazz"

4 5 6)

/^4lD-WC ("Rock") D-WC ("Jazz")

Вейвлет: Xa apa

10 12 14 bps 16

Рис. 4. Характеристики сжатия компонент медиаданных: а, б — Р8ЫЯ для полутоновых изображений; в — Р8ЫЯ для видеоданных; г — Р8ЫЯ для аудиоданных

Заключение

Результаты моделирования показывают эффективность использования предложенных алгоритмов модификации значений вейвлет-коэффициентов в составе вейвлет-кодеков для сжатия различных компонент медиаданных: изображений, видео, аудио. Алгоритм адаптации значений вейвлет-коэффициентов к шкале квантования, основанный на выборе оптимального значения масштабирующего коэффициента, эффективен в области малых коэффициентов сжатия (БЯ>2 bpp — для изображений и видеоданных) и позволяет получить выигрыш в оценке Р8ИЯ порядка 5 дБ для полутоновых изображений и видеоданных. Алгоритм согласования восстановленных значений вейвлет-коэффициентов с динамическим диапазоном исходных вейв-лет-коэффициентов, основанный на коррекции восстановленных значений вейвлет-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

коэффициентов в соответствие с предсказанной ошибкой восстановления, эффективен в области средних коэффициентов сжатия (0,5<BR<4 bpp — для изображений и видеоданных, 0,5<BR<14 bps — для аудиоданных) и позволяет получить выигрыш в оценке PSNR до 10 дБ для аудиоданных и до 3 дБ для изображений и видеоданных. Эффективность предложенных алгоритмов модификации вейвлет-коэффициентов ограничена формой плотности вероятности значений вейвлет-коэффициентов различных компонент медиаданных.

ESTIMATION OF WAVELET COEFFICIENTS MODIFICATION INFLUENCE ON

MULTIMEDIA DATA COMPRESSION

A.A. BORISKEVICH, V.YU. TSVIATKOU Abstract

The wavelet coefficients modification algorithms based on scaling and correcting wavelet coefficient values for adaptation to uniform quantization scale and adjusting reconstructed values with original wavelet coefficients dynamic range are proposed. The algorithms allow to improve lossy wavelet compression characteristics for the various multimedia components (audio, image and video). A quantitative estimation of wavelet coefficients modification influence on the multimedia data compression characteristics is presented. It is shown that the wavelet compression characteristics may be improved in domain of low compression coefficients due to choice of optimal scalable coefficient and in domain of mean compression coefficients due to correction of reconstructed wavelet coefficient values according to predicted reconstruction error value.

Литература

1. Shapiro. J.M. // IEEE Trans. Signal Processing. 1993. № 41. P. 3445-3462.

2. Chai B.-B, Vass J., ZhuangX. // IEEE Trans. Image Processing. 1999. Vol. 8, № 6. P. 774-784.

3. Said A., Pearlman W.A. // IEEE Trans. on Circuits and Systems for Video Technology. 1996. Vol. 6. P. 243250.

4. Islam A., Pearlman W.A. Set partitioned sub-block coding (speck) // ISO/IEC/JTC1/SC29, WG1 N873. 1998.

5. Servetto S., Ramchandran K., OrchardM.T. // Proc. of IEEE International Conference on Image Processing. 1995. P. 530-533.

6. Sementilli P.J., Bilgin A., Kasner J.H., Marcellin M.W. // Proc. of SPIE, Appl. of Digital Image Proc. 1998. P. 2-12.

7. Martucci S.A., Sodagar I., Chiang T., Zhang Y.-Q. // IEEE Trans. Circuits and Systems for Video Technology. 1997. Vol. 7, № 1. P. 109-118.

8. Vass J., Chai B.-B., ZhuangX. // Proc. of IEEE Workshop on Multimedia Signal Processing, Los Angeles, CA. 1998. P. 474-479.

9. Kim B.-J., Pearlman W. // Proceedings of Data Compression Conference. 1997. P. 251-260.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Sweldens W. // Proc. of SPIE. 1995. Vol. 2569. P. 68-79.

11. Villasenor J., Belzer B, Liao J. // IEEE Trans. Image Processing. 1995. Vol. 2. P. 1053-1060.

12. Борискевич А.А., Цветков В.Ю. // Совр. средства связи: Материалы конф. Минск: Бестпринт, 2006. С. 93.