Статистический анализ эффективности основных преобразований в системах сжатия

Иванов В.Г.; Ломоносов Ю.В.; Любарский М.Г.

УДК 004.627

В.Г. ИВАНОВ, д-р. техн. наук, проф., зав. каф. НЮАУ им. Я. Мудрого, Ю.В. ЛОМОНОСОВ, канд. техн. наук, доц. НЮАУ им. Я. Мудрого,

М.Г. ЛЮБАРСКИЙ, д-р физ.-мат. наук, проф. НЮАУ им. Я. Мудрого (г. Харьков)

СТАТИСТИЧЕСКИЙ АНАЛИЗ ЭФФЕКТИВНОСТИ ОСНОВНЫХ ПРЕОБРАЗОВАНИЙ В СИСТЕМАХ СЖАТИЯ

Проведен статистический анализ эффективности основных унитарных преобразований, которые используются в алгоритмах сжатия изображений. Отмечается, что одним из наиболее эффективных преобразований является преобразование Карунена-Лоэва, которое обладает свойством полной декорреляции коэффициентов. Однако в действующих форматах сжатия изображений используется наиболее близкое по характеристикам преобразование с дальнейшим квантованием коэффициентов.

Ключевые слова: унитарные преобразования, статистический анализ, сжатие изображений.

Постановка проблемы. Быстрое развитие компьютерных систем и систем телекоммуникаций приводит к возникновению необходимости постоянного развития и модификации методов и алгоритмов сжатия данных. Среди всех видов мультимедийных данных наиболее распространенными являются графические изображения. Специфика современных графических форматов заключается в поиске и применении наиболее эффективных преобразований, а также способов представления данных при формировании результирующего потока, и рассматривать эти задачи необходимо комплексно. Поэтому эффективное функционирование и развитие систем хранения, обработки, передачи мультимедийной информации невозможно без использования методов сжатия, которые требуют корректного сравнения на базе анализа эффективности основных унитарных преобразований.

Анализ литературы. Цитируемая литература в основном состоит из работ, в которых наиболее полно и ясно изложено то или иное направление в области сжатия данных. К сожалению, законченного сравнительного анализа основных преобразований в алгоритмах сжатия данных для тестовых изображений, отвечающих современному состоянию, полностью не приводится [1 - 9].

Цель статьи. Провести статистический анализ и сопоставить эффективность унитарных преобразований методов сжатия данных с целью более точного прогноза количественных результатов сжатия.

Многие алгоритмы сжатия изображений основаны на применении к изображению какого-либо ортогонального преобразования и последующего квантования. Степень сжатия изображения и его качество зависят от обоих этих этапов, а, главное, от их согласованности с типом сжимаемого

изображения, который можно охарактеризовать статистическими свойствами последнего. Среди основных известных преобразований, преобразование Карунена-Лоэва является единственным унитарным преобразованием, в котором достигается полная декорреляция коэффициентов для произвольного изображения. В других преобразованиях между коэффициентами преобразования остается некоторая остаточная корреляция [1, 2]. Кроме того, преобразование Карунена-Лоэва обеспечивает наибольшую среди всех унитарных преобразований степень концентрации энергии спектра преобразования. К сожалению, его коэффициенты не фиксированы, а зависят от исходных данных. Вычисление этих коэффициентов (собственных векторов ковариационной матрицы) делается медленно, как и нахождение самих преобразованных величин. Поскольку преобразование зависит от исходных данных, приходится сохранять его коэффициенты в сжатом файле.

Статистический анализ коэффициентов преобразований Т(ы,у) можно свести к случаю обработки наблюдений над системой произвольного числа случайных величин Х\, Х2, ..., Хт, над которой произведено п независимых наблюдений и найдены числовые характеристики этой системы -математические ожидания и элементы корреляционной матрицы, на главной диагонали которой стоят дисперсии коэффициентов преобразования (В) [3, 4].

Требуется найти оценки для характеристик системы - математических

ожиданий т

х1

х2 '

и элементов корреляционной матрицы

К11 К12 • •• К 1т

2 2 •• К 2т

к К тт

(1)

На главной диагонали корреляционной матрицы стоят дисперсии случайных величин (коэффициентов) Х1, Х2, ... , Хт (т = 1, 2, ... , п2):

к11 В1, к22 В2, ... ; ктт Вт.

Оценки для математических ожиданий находятся как

1 "V

х^,

тг = —

Хк п

(2)

г=1

N 2

где к = 1, 2, ..., т; / = 1, 2, ..., п, а т = 8*8 и п = —— = 1024 .

т

Несмещенные оценки для дисперсий определяются по формулам

п

^ (хш - ~ хк )2

Ок =^

п -1

(3)

т

х

т

а корреляционные моменты равны

£ (xk, - mцк )(xli - m ц )

K k! = ^---------------------, (4)

n -1

где к и l изменяются от 1 до m .

На основе приведенных выше выражений путем численного моделирования на ЭВМ был проведен анализ эффективности того или иного преобразования по критерию неравномерности распределения дисперсий коэффициентов преобразования, а также их остаточной корреляции для широкого класса тестовых изображений, которые традиционно используются для сравнительного анализа алгоритмов сжатия данных [1, 2, 6, 7, 8].

Удобно использовать понятие класса изображений, который определяется достаточно условно как в кодировании изображений, так и в телевидении [7, 8]. Под классом будем понимать совокупность изображений, которые после сжатия дают качественно близкие результаты. Класс 1 -изображение слабой насыщенности типа "Портрет" (Zelda.bmp), класс 2 -изображение средней насыщенности типа "Художественный портрет" (Lena.bmp) и общий план (Cameraman.bmp), класс 3 - насыщенное деталями изображение (Boat.bmp), класс 4 - насыщенное деталями искусственное изображение с символьными данными (Печать.bmp, Pechat_00011.bmp).

В таблице представлены значения среднеквадратической ошибки и соответствующего коэффициента сжатия для рассматриваемых преобразований и классов изображений после отбрасывания определенного количества дисперсий при обратном z-сканировании.

Как и следовало ожидать, наилучшим с точки зрения минимизации среднеквадратической ошибки, равной сумме отброшенных дисперсий, является преобразование Карунена-Лоэва (KL), которое одновременно полностью декоррелирует исходные данные, то есть ковариационная матрица в результате этого преобразования является диагональной.

Рассмотренные преобразования (KL - Карунена-Лоэва, Cos - дискретное косинусное преобразование, Haar - преобразование Хаара) можно упорядочить по эффективности следующим образом: KL > Cos > Haar.

Полученные результаты достаточно хорошо согласуются с данными других исследователей, которые для анализа в качестве статистической модели изображения выбирали двумерный марковский процесс первого порядка или те же тестовые изображения [7, 9]. Таким образом, дисперсионный критерий дает возможность предсказать (спрогнозировать) относительное качество различных ортогональных преобразований при сжатии данных и изображений.

Квантование и кодирование коэффициентов преобразований.

Эффективность JPEG-кодирования изображений, связанная с усечением разложений, является функцией числа и относительной важности

отбрасываемых коэффициентов преобразования, а также точности (квантования), используемой для представления значений сохраняемых коэффициентов. Квантование является тем звеном обработки, на котором JPEG вносит потери.

Таблица

Значение ошибки и коэффициента сжатия при отбрасывании различного числа

дисперсий

Тип преобра- зования Кол-во отброшенных дисперсий 15 28 40 50

Кол-во оставленных дисперсий 49 36 24 14

Теоретический коэффициент сжатия 1,306 1,778 2,667 4,571

KL Сумма отброшенных дисперсий Zelda 0,0012 0,003 0,008 0,017

Lena 0,0014 0,004 0,010 0,022

Cameraman 0,0019 0,006 0,015 0,03

peppers 0,0009 0,003 0,009 0,024

pechat 0,0144 0,037 0,080 0,162

Boat 0,0010 0,004 0,013 0,031

Cos Сумма отброшенных дисперсий Zelda 0,0019 0,005 0,011 0,021

Lena 0,0025 0,007 0,015 0,028

Cameraman 0,0030 0,009 0,021 0,037

peppers 0,0024 0,006 0,015 0,032

pechat 0,0171 0,048 0,100 0,172

Boat 0,0015 0,006 0,017 0,035

Haar Сумма отброшенных дисперсий Zelda 0,0041 0,007 0,018 0,037

Lena 0,0040 0,008 0,021 0,047

Cameraman 0,0082 0,015 0,033 0,058

peppers 0,0097 0,018 0,039 0,075

pechat 0,0514 0,095 0,189 0,311

Boat 0,0090 0,017 0,04 0,075

Таблица квантования может быть взята по умолчанию или формируется кодером для конкретной статистики изображения и передается декодеру вместе со сжатыми данными. В стандарте JPEG на базе дискретного косинусного преобразования для цветных изображений разработаны таблицы квантования сигналов яркости и цветности, которые рекомендуются к использованию по умолчанию, но использование которых не является строго предписанным. Они были получены опытным путем на основе психофизических тестов [9] и имеют общую тенденцию - с ростом пространственной частоты коэффициенты косинусного преобразования квантуются все более грубо.

Рис. 1. Зависимость коэффициента сжатия от СКО для тестового изображения "Zelda" при соответствующем преобразовании

Рис. 2. Зависимость коэффициента сжатия от СКО для тестового изображения "Lena" при соответствующем преобразовании

Такое квантование отражает то важнейшее свойство зрительной системы, что с ростом пространственной частоты падает ее контрастная характеристика чувствительности, а значит, отсутствует необходимость передавать составляющие этих частот с большой точностью. Таблица учитывает также анизотропию этой характеристики - в диагональном направлении значения факторов квантования еще более велики [5 - 9]. Элементы матрицы коэффициентов нормализации могут масштабироваться, обеспечивая тем самым многообразие уровней сжатия.

На рис. 1 и 2 приведены зависимости коэффициента сжатия (отношение количества двоичных знаков на входе обобщенной модели к количеству этих знаков, полученных на выходе) от среднеквадратической ошибки (СКО), а на рис. 3 и 4 - визуальные примеры некоторых исходных и восстановленных тестовых изображений после соответствующих преобразований.

а) JPEG-Cos (DCT) CKO=12% K=21

б) JPEG-Cos (DCT) CKO=12% K=15 Рис. 3. Примеры исходных и восстановленных тестовых изображений: а) Zelda; б) Lena; в) Kameraman; г) Boat.

в) JPEG-Cos (DCT) CKO=12% K=17,5

г) JPEG-Cos (DCT) CKO=12% K=15,8-17,1

Рис. 4. Примеры исходных и восстановленных тестовых изображений: a) Kameraman; б) Boat.

Выводы. Путем численного моделирования на ЭВМ проведен анализ эффективности сжимающих свойств основных ортогональных преобразований с использованием критерия неравномерности распределения дисперсий коэффициентов, а также их остаточной корреляции для широкого класса тестовых изображений. Установлено, что наилучшим является преобразование КЪ. Однако в пространстве квантованных коэффициентов полной цепочки JPEG-кодирования преимущества преобразования КЪ для некоторых классов изображений, по сравнению с косинусным преобразованием, полностью утрачивается.

Выявлено, что преобразование КЪ при малых значениях СКО (0,06) на изображении Zelda.bmp дает выигрыш в сжатии по сравнению с JPEG-ДКП в

44 %, и затем с ростом СКО это преимущество уменьшается, а на изображении Lena.bmp степень сжатия становится практически одной и той же. Дисперсионный же критерий оценки сжимающих свойств того или иного преобразования по сравнению с преобразованием КЛ всегда лучше у последнего. Поэтому количественные оценки эффективности разрабатываемых алгоритмов кодирования реалистичных изображений рекомендуется делать на основе обобщенной модели технологической среды сжатия данных, учитывающей этапы квантования коэффициентов преобразований [8] .

Список литературы: 1. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сигналов. - М.: Связь, 1980. - 248 с. 2. Ватанабе С. Разложение Карунена-Лоэва и факторный анализ I Автоматический анализ сложных изображений. - М.: Мир, 1969. - С. 254-275. 3. Вентцель Е.С. Теория вероятностей. - М.: Гл. ред. физ.-мат. лит., 1964. - 576 с. 4. Купер Дж, Макгиллем К. Вероятностные методы анализа сигналов и систем. - М.: Мир, 1989. - 376 с.

5. Прет У. Цифровая обработка изображений. В 2-х кн. - Кн. 2. - М.: Мир, 1982. - 480 с.

6. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. - М.: Диалог-Мифи, 2002. - 384 с. 7. Сэломон Д. Сжатие данных, изображений и звука. - М.: Техносфера, 2004. - 368 с. 8. Иванов В.Г., Любарский М.Г., Ломоносов Ю.В. Фурье и вейвлет-анализ изображений в плоскости JPEG технологий // Проблемы управления и информатики. - К.: 2004. - № 5. - С. 111-124. 9. Гонсалес Р., Вудс Р. Цифровая обработка изображений. - М.: Техносфера, 2005. - 1072 с.

УДК 004.627

Статистичний аналіз ефективності основних перетворень в системах стиску / Иванов В.Г., Ломоносов Ю.В., Любарский М.Г. II Вісник НТУ "ХПІ". Тематичний випуск: Інформатика і моделювання. - Харків: НТУ "ХПІ". - 2009. - N° 13. - С. 69 - 76.

Проведений статистичний аналіз ефективності основних унітарних перетворень, які використовуються в алгоритмах стиснення зображень. Наголошується, що одним з найбільш ефективних перетворень є перетворення Карунена-Лоева, яке володіє властивістю повної декорреляции коефіцієнтів. Проте у форматах стиснення зображень, що діють, використовується найбільш близьке за характеристиками перетворення з подальшим квантуванням коефіцієнтів. Іл.: 4. Табл.: 1. Бібліогр.: 9 назв.

Ключові слова: унітарні перетворення, статистичний аналіз, стиснення зображень.

UDC 004.627

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Statistical analysis of efficiency of basic transformations is to the systems of compression / Ivanov V.G., Lyubarsky M.G., Lomonosov U.V. II Herald of the National Techical University "KhPI". Subject issue: Information Science and Modelling. - Kharkov: NTU "KhPI". - 2009. - №. 13. -P. 69 - 76.

The statistical analysis of efficiency of basic unitary transformations which are utillized in the algorithms of compression of images is conducted. It is marked that one of the most effective transformations is transformation of Karhunen-Loeve, which possesses property of complete декорреляции coefficients. However in the operating formats of compression of images the most near on descriptions transformation is utillized with the further quantum of coefficients. Figs: 4. Tabl.: 1. Refs: 9 titles.

Key words: unitary transformations, statistical analysis, compression of images.

Поступила в редакцию 10.04.2009

Статистический анализ эффективности основных преобразований в системах сжатия Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Иванов В. Г., Ломоносов Ю. В., Любарский М. Г.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Иванов В. Г., Ломоносов Ю. В., Любарский М. Г.

Statistical analysis of efficiency of basic transformations is to the systems of compression

Текст научной работы на тему «Статистический анализ эффективности основных преобразований в системах сжатия»