Научная статья на тему 'Двумерный и трехмерный алгоритмы кодирования цифровых цветных изображений'

Двумерный и трехмерный алгоритмы кодирования цифровых цветных изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
175
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Двумерный и трехмерный алгоритмы кодирования цифровых цветных изображений»

Петров А.В. ДВУМЕРНЫЙ И ТРЕХМЕРНЫЙ АЛГОРИТМЫ КОДИРОВАНИЯ ЦИФРОВЫХ ЦВЕТНЫХ ИЗОБРАЖЕНИЙ

В статье рассмотрен математический аппарат вейвлет-преобразований применительно к его использованию для обработки и сжатия цифровых цветных изображений.

Для анализа нестационарных процессов, в которых информативным является сам факт изменения частотно-временных характеристик сигнала (примерами таких сигналов являются речь, музыка, изображение), требуются базисные функции, способные выявлять как частотные, так и временные характеристики, т.е. обладающие частотно-временной локализацией.

Одним из способов решения данной задачи является использование математического аппарата вейвлет-функций, в частности, вейвлет-разложения сигнала, при котором, в отличие от оконного преобразования Фурье, базисную функцию не только смещают во времени, но и масштабируют, чтобы получить многократное перекрытие сигнала. Вид вейвлет-преобразования на плоскости «время-частота» приведён на рис. 1 [2,

11, 12] .

СО *

1

■ІГіЙ НШІ

1

І

Рис. 1. Представление вейвлет-преобразования на плоскости «время-частота»

Непрерывным вейвлет-преобразованием (CWT, continuous wavelet transform) функции f(х)еL(R) называют функцию двух переменных [13, 14]:

W(a,b) = Wf (a, Ь) = ( f (t), y(a,b,t) , a, b е R, a Ф 0 ,

где a - масштабирующий коэффициент; b - величина сдвига; вейвлеты ¿(t) = y(a,b,t) являются масштабированными и сдвинутыми копиями порождающего (материнского) вейвлета y(t) е L (R) :

х ч 1 Л - b4 , „

^ab (t) = ^=г У(--) , a, b е R, a Ф 0 .

a

Если для порождающего вейвлета выполняется условие I - |2

7 т®)

С = I ------— < +7 ,

^ ■' ю

—7

где Ч (ю) - образ Фурье вейвлета то вейвлет-преобразование обратимо, т.е. существует обрат-

ное непрерывное вейвлет-преобразование:

. йайЪ

1 гг -

f (t) = — J J wbMa bj) -

Сш а

^ —7 —7

Таким образом, непрерывное вейвлет-преобразование - это разложение сигнала по всем возможным сдвигам и сжатиям (растяжениям) некоторой функции [6, 14]. Количество копий порождающего вейвлета,

необходимое для обратимого разложения, можно существенно сократить.

Распространённый случай - вычисление значений И(а,Ь) только для а и Ь вида:

л-1 ъ . .

а = 2 , — = 7 , I,] е 2 .

а

Вместо непрерывной функции получается конечное множество значений:

(1)

=( f iWj) (о),

где yj (t) = 42 y(2it - j) , i, j е Z .

Обратное преобразование примет вид:

7 7

f(t) = 2 2 4°(t) • (2)

i=-7 i=-7

Формулы (1) и (2) определяют диадное (или дискретное) ортогональное вейвлет-преобразование. Вейвлет-преобразование сигналов может быть представлено как банк фильтров. Простой одноуровневый банк фильтров показан на рис. 2 [2, 12]

Рис. 2. Представление вейвлет-преобразования в виде банка фильтров

На рис. 2 показано, каким образом вейвлет-преобразование использует два фильтра: низкочастотный

фильтр к* и высокочастотный фильтр % * , за которыми следует децимация сигнала (БиЬБашрІіпд). В левой части схемы сигнал подвергают фильтрации, а затем децимации, т.е. отбрасывают часть отсчётов отфиль-

трованного сигнала, оставляя, например, только чётные отсчёты. Очевидно, что подобная схема неэффективна, и предпочтительнее производить децимацию перед фильтрацией (рис. 3).

Рис. 3. Стандартный КИХ-фильтр с децимированным сигналом на выходе (слева) и его более эффективная реализация (справа)

Если применить полученную новую модель КИХ-фильтра к вейвлет-преобразованию в виде банка фильтров (рис. 2), то данное преобразование можно записать в следующей векторной форме:

'■*211-р-<*) [ ?(211,

>42 )) < )I 2-' Х0<2) I

где Р <2) - полифазная матрица:

Р* <2) -

Гк*Е < 2) к0 < 2)Л

кЕ <2) ¿0 <2),

Важным свойством определённых выше преобразований является то, что отсчёты записывают в единый поток данных, замещая предыдущие значения. Все отсчёты этого потока заменяются новыми отсчётами, и в любой момент времени необходимы только текущие отсчёты для осуществления дальнейших вычислений. Это свойство сходно со свойством быстрого преобразования Фурье, где преобразованные данные также замещают исходные. Таким образом, происходит существенная экономия памяти при осуществлении преобразований, что является важнейшим фактором при построении лифтинговых вейвлет-преобразований на устройствах с ограниченными вычислительными ресурсами (например, на мобильных телефонах или карманных компьютерах).

В работе предложены конкретные алгоритмы по обработке цифровых цветных изображений, построенные на базе математического аппарата вейвлет-преобразований. Первоначально изображение подвергается чередующимся последовательностям вертикальных и горизонтальных одномерных вейвлет-преобразований. Сначала преобразуются все строки, а затем все столбцы. На следующем этапе левая верхняя четверть матрицы получившейся в результате предыдущего преобразования опять преобразуется (сначала все строки, затем все столбцы). И так далее. Количество этапов соответствует количеству уровней вейвлет-декомпозиции. В результате преобразования мы получаем множество прямоугольных диапазонов вейвлет-коэффициентов, которые принято называть частотными диапазонами, так как они содержат информацию о том, как ведет себя исходный двухмерный сигнал (изображение) при разном разрешении (то есть набор коэффициентов при разной частоте). В процессе вейвлет-преобразований происходит разложение исходного вектора на низкочастотные и высокочастотные составляющие. В то же время в реальных изображениях основная доля информации содержится именно в области низких частот. Следовательно, в процессе вейвлет-преобразований может быть достигнуто эффективное разделение исходного сигнала на ряд «слоёв», отсчёты в которых сгруппированы в зависимости от значимости содержащейся в них информации. Из данных преобразованного изображения удаляются некоторые коэффициенты. Сжатое изображение восстанавливается путем декодирования коэффициентов, если это необходимо, и применением обратного преобразования.

Для обработки цифровых цветных изображений предложен двумерный алгоритм (рис. 4) [3, 8, 10, 17].

Рис. 4. Алгоритм обработки цифровых изображений

Любое цифровое растровое изображение может быть представлено в виде двухмерной (2D) матрицы с отсчётами исходного сигнала, причём в случае стандартного цветного изображения (RGB, 24 бита на пик-

сель), эта матрица распадается на три независимых слоя, то есть, фактически, любое цветное изображение может быть представлено в виде трёх 2D-матриц с исходными отсчётами.

Процесс 2D-преобразования матрицы отчётов может быть представлен в виде двух ^-преобразований -столбцов и строк исходной матрицы, что позволяет построить эффективные и оптимизированные вычислительные алгоритмы.

В качестве метода вейвлет-преобразования при обработке отсчётов предложено использовать фильтры Добеши 4-го порядка, обеспечивающие высокие степени разложения исходного сигнала, в частности, применительно к реальным фотографическим изображениям (рис. 5) [5, 15] .

Рис. 5. Пример обработки изображения с помощью фильтров Добеши 4-го порядка (2 уровня рекурсивного вейвлет-разложения)

После разложения сигнала по степени значимости вейвлет-коэффициентов, в обработанной 2D-матрице установлен ряд взаимосвязей между отсчётами в различных частотных диапазонах, и это свойство может быть использовано для эффективного кодирования методом погружённого нуль дерева (EZW, Embedded Zerotree Wavelet encoder) и сжатия с потерями информации.

Первым шагом EZW-кодер должен определить начальный порог. При работе с битовой картой (обычной фотографией) начальный шаг определяют следующим образом:

f _ QMAX(|w(x,^)))

¿0 = 2 •

Для кодирования изображения требуются два прохода кодера - основной проход и дополнительный [ 1,

4, 7, 9]. Во время основного прохода сканируют изображение и для каждого коэффициента выводят опре-

делённый символ:

если коэффициент превышает порог, то на выходе появляется символ P (positive);

если коэффициент менее отрицательного значения порога, то на выходе появляется символ N

(negative);

если коэффициент является корнем нуль-дерева, то на выходе появляется символ T (tree);

если ни одно из условий не соблюдено, то на выходе появляется символ Z (isolated zero).

Далее все коэффициенты, абсолютная величина которых превышает порог, переносят в специальный список, а их позиции в изображении заменяют нулями, чтобы избежать их повторного кодирования.

Во время дополнительного прохода происходит упорядочение коэффициентов из списка, определённого во время основного прохода кодера, а также происходит определение порядка передачи коэффициентов.

Разработанные выше методы могут быть использованы для обработки видеопоследовательностей. При этом будем считать, что любая последовательность кадров может быть представлена в виде SD-матрицы отсчётов, и, соответственно, обработана с помощью специального трёхмерного вейвлет-преобразования (рис. 6) [16]•

Рис. 6. Структурная схема предложенного метода обработки видеопоследовательности

Следует отметить, что обрабатываемую последовательность представляют в виде групп кадров, по 16 кадров в каждой. Такой объём анализируемой группы кадров является разумным компромиссом между скоростью обработки и степенью компрессии данных. В то же время векторы из 16 элементов могут быть эффективно обработаны с помощью 4 рекурсивных вызовов вейвлет-преобразования Баттерворта.

Одномерное вейвлет-преобразование Баттерворта кадров по временной оси в явном виде отделяет информацию о неподвижном фоне и движущемся объекте.

Выделение объекта движения состоит в определении координат прямоугольного окна, содержащего наибольшее количество информации по критерию превышения порога в 90% от всей энергии, содержащейся в кадре, причём измерения данного окна определяются кратными 16 для наиболее эффективной работы вейвлет-преобразования Баттерворта.

Важно отметить, что битовый поток, формируемый описываемым методом, обладает особой гибкостью -как внутри кадра, так и между кадрами, во временной области. Это означает, что возможны различные пути прогрессивной загрузки видеопоследовательности: как поочерёдная загрузка всех кадров, так и

одновременная. В первом варианте в случае обрыва связи восстановленное изображение будет высокого качества, но будет размыт объект движения. Во втором варианте всё движение будет восстановлено полностью, но общее качество изображения будет низким. Очевидно, что в случае успешной загрузки всех кадров целиком видеопоследовательность будет восстановлена точно и с высоким качеством.

Данное свойство позволяет добиться высокой помехоустойчивости передаваемого по каналу потока данных.

В общем случае адаптивный алгоритм прогрессивной загрузки видеопоследовательности позволяет отказаться от «привязки» абонента к какому-либо выбранному закодированному видеопотоку с фиксированной скоростью, предоставляя абонентам сервис с наилучшим возможным качеством, используя ту часть единого потока данных, которая может быть принята при данной скорости абонентского подключения.

ЛИТЕРАТУРА

1. Александров В.В., Горский Н.Д. Представление и обработка изображений: рекурсивный подход / /

Л.: Наука, 1985. - 190 с.

2. Айфичер Э., Джервис Б. Цифровая обработка сигналов: практический подход, 2-е издание.: Пер. с англ. - М.: Издательский дом «Вильямс», 2004. - 992 с.

3. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. - М.: ДИАЛОГ-МИФИ, 2003. - 384 с.

4. Воробьев В.И., Грибунин В.Г. Теория и практика вейвлет-преобразования. - С.-Пб.: ВУС, 1999. -

204 с.

5. Добеши И. Десять лекций по вейвлетам. - Ижевск: НИЦ «Регулярная и хаотичная динамика», 2001. -

4 64 с.

6. Жизняков А.Л., Вакунов Н.В. Вейвлет-преобразование в обработке и анализе изображений. - М.:

Государственный научный центр Российской Федерации - ВНИИгеосистем, 2004. - 102 с.

7. Новиков Л.В. Основы вейвлет-анализа сигналов. Учебное пособие. 1999. - 152 с.

8. Претт У. Цифровая обработка изображений: Пер. с англ. - М.: Мир, 1982. - Кн. 1. - 312 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Родионов И.В. Использование вейвлет-преобразований для эффективного сжатия цветных цифровых

изображений. // Тезисы 58 НТК СПбГУТ, 2006.

10. Уэлстид С. Фракталы и вейвлеты для сжатия изображений. Учебное пособ. - М.: Издательство

«Триумф», 2003. - 320 с.

11. Ярославский Л.П. Введение в цифровую обработку изображений // М.: Сов. радио, 1969. - 312 с.

12. Eklunfh J.O., Huang T.S., Justusson B.I. and etc. Two-dimensional Digital Signal Processing. Transforms and Median Filters. 1984. - p. 224.

13. Mallat S. A theory for multiresolutional signal decomposition: the wavelet representation.

IEEE Trans. Pattern Analysis and Machine Intelligence, 1989, N7, pp. 674-693.

14. Pennec E.L., Mallat S. Image compression with geometrical wavelets. In Proc. Of IEEE ICIP, Volume 1, 2000, pp. 661-664.

15. Tang Y.Y., Yang L.H., Liu J., Ma H. Wavelet theory and its application to pattern recognition. - Singapore: Regal press (S) Pte. Ltd., 2000. - 359 p.

16. Villasenor J., Belzer B., Liao J. Wavelet Filter Evaluation for Image Compressing. IEEE Trans. on Image Proc., Vol. 4, 1995, No. 8, pp. 1053-1060.

17. Wallach D.S., Kunapalli S., Cohen M.F. Accelerated MPEG compression of Dynamic poligonal scenes // ACM. Jun 1994.

i Надоели баннеры? Вы всегда можете отключить рекламу.