Анализ эффективности методов сжатия изображений в соответствии с различными критериями качества

Лукин Владимир Васильевич; Пономаренко Николай Николаевич; Кривенко Сергей Станиславович

точно проблематично изучить все особенности и тонкости программирования под различные типы микроконтроллеров, и это не считая сторонних производителей, которые тоже выпускают свое программное обеспечение. При таком развитии ситуации остается лишь надеяться на то, что в ближайшее время появится универсальный программный комплекс, который будет понятен и удобен в использовании, что, несомненно, должно привести к росту количества качественного программного обеспечения для устройств на основе микроконтроллеров.

Литература: 1. Предко М. Руководство по микроконтроллерам: в 2-х т. /Пер. с англ. М.: ПОСТМАРКЕТ, 2001. 315 с. 2. Тавернье К. PIC-микроконтроллеры: практика применения. М.: ДМК Пресс, 2004. 272 с. 3. Евстигнеев А.В. Микроконтроллеры AVR семейств Tiny и Mega фирмы ATMEL. М.: Додека XXI, 2005. 560 с. 4. http://www.gaw.ru/

УДК 519.713

АНАЛИЗ ЭФФЕКТИВНОСТИ МЕТОДОВ СЖАТИЯ ИЗОБРАЖЕНИЙ В СООТВЕТСТВИИ С РАЗЛИЧНЫМИ КРИТЕРИЯМИ КАЧЕСТВА

ЛУКИН В.В., ПОНОМАРЕНКО Н.Н.,

КРИВЕНКО С. С.____________________________

Проводится анализ эффективности сжатия изображений с использованием JPEG2000 и ряда вариантов JPEG в соответствии с различными количественными критериями качества декодированных данных. Показывается, что JPEG с равномерным квантованием при относительно небольших степенях сжатия, характерных для современных приложений, практически не уступает JPEG2000. При этом варианты JPEG, учитывающие особенности психовизуального восприятия, при типичных степенях сжатия обеспечивают более высокое визуальное качество изображений, чем JPEG2000.

1. Введение

Уже достаточно давно многими исследователями было замечено, что традиционные критерии (в частности, среднеквадратическая ошибка и связанное с ней отношение сигнал-шум), которые первоначально использовались, чтобы характеризовать точность измерений [1], а затем стали применяться и для описания эффективности различных методов обработки сигналов и изображений, часто неадекватно характеризуют эти методы [2]. Особенно это касается различных приложений обработки изображений (их фильтрации и сжатия), для которых указанные выше и ряд других широко применяемых критериев (например, пиковое отношение сигнал-шум - PSNR) во многих практических ситуациях плохо коррелируют с психо-физическими особенностями зрения человека, а именно человек определяет и оценивает качество изображений для мультимедиа, в медицине и т. п.

В связи с этим в последние годы большое внимание уделяется разработке новых критериев качества изоб-

html.cgi/txt/soft/avr/astudio.htm. 5. http://www.atmel.com. 6. Scott Dattalo. GPSim Datsheet. 7. http://www.phyton.ru/ cp1251/description/picmicro.shtml. 8. http://www.gaw.ru/ html.cgi/txt/publ/eqump/phuton2.htm. 9. MAX-IDE User’s Guide (AN3905). 10. MPLAB IDE User’s Guide (DS51519B). 11. http://gurin.tomsknet.ru/sigsim.html. 12. UMPS Reference Manual. 13. http://www.myke.com/umps.htm. 14. http:// avrfreaks.net/index. php?module = Freaks%20T ools&func=viewItem&item_id= 162.

Поступила в редколлегию 16.04.2007

Рецензент: канд. техн. наук, доцент Вершина А.И.

Островский Константин Владимирович, студент IV курса Открытого международного университета развития человека “Украина”. Научные интересы: компьютеры, компьютерные технологии, программирование. Адрес: Украина, 69000, Запорожье, ул. Патриотическая, д. 86, кв. 15, тел. 33-17-76.

ражений. Этими вопросами занимаются как специализированные исследовательские группы под руководством А.К. Бовика [3-6] (разработаны метрики NQM, UQI, SSIM, VIF), так и отдельные исследователи [7,8] (метрики VQM и PQS) и фирмы [9] (метрика DCTune). В последние два года нами были разработаны два новых критерия - PSNR-HVS [10] и PSNR-HVS-M [11]. В результате сравнительного анализа, проведенного в [10] и [11], показано, что существует достаточно большое количество типов искажений, при которых широко используемые критерии (метрики), например, UQI и SIM, ведут себя неадекватно. PSNR-HVS и, особенно, PSNR-HVS-M для рассмотренных приложений лучше соответствуют психо-визуальному восприятию. Это связано, прежде всего, с тем, что обе предложенные метрики учитывают различную чувствительность человеческого зрения к различным пространственным частотам, которая была доказана экспериментально и учтена при разработке стандарта сжатия JPEG [12], принятого более 10 лет назад и получившего очень широкое распространение в цифровых фотоаппаратах, мультимедиа и т.д. Принятый позднее стандарт сжатия JPEG2000 [13], обладающий по сравнению с JPEG рядом несомненных достоинств (лучшим компромиссом между PSNR и коэффициентом сжатия (КС), способностью обеспечивать заданный КС), тем не менее, на данный момент не вытеснил JPEG для указанных выше приложений и явной тенденции к этому не наблюдается. При этом, хотя потенциально в JPEG2000 имеется возможность учесть особенности визуального восприятия [14], эта опция не реализована в существующих на данный момент кодерах.

Отметим, что новая метрика PSNR-HVS-M позволяет также принять во внимание эффект маскирования частот [9] в соответствии с новой моделью, предложенной в [11]. Такие свойства новых метрик позволяют достаточно корректно проводить сравнительный анализ характеристик и эффективности различных методов обработки изображений и степени влияния разнообразных помех и искажений.

РИ, 2007, № 2

85

Целью данной работы является сравнительный анализ качества изображений, сжатых с потерями с использованием JPEG2000 и ряда вариантов JPEG в соответствии с различными количественными критериями качества декодированных данных. Напомним, что в JPEG может использоваться как неодинаковый шаг квантования (ШК) коэффициентов дискретного косинусного преобразования (ДКП), выполняемого в блоках размером 8х8 пикселей, так и фиксированный ШК, что позволяет достичь несколько больших значений PSNR при одних и тех же КС. Кроме того, сравнительно простая пост-обработка декодированных JPEG изображений (устранение блочных эффектов или деблокинг) позволяет дополнительно повысить качество [15]. Поэтому одна из задач исследования состоит в определении условий, при которых применение того или иного варианта методов сжатия на основе ДКП (JPEG и его производных) является предпочтительным.

2. Анализируемые метрики

Рассматриваемые ниже метрики (критерии) предусматривают наличие истинного (исходного) изображения, с которым производится «сравнение» искаженного изображения, в данном случае декодированного после сжатия с потерями. Метрикой, которая наиболее известна и широко используется в практике обработки изображений, является PSNR. При традиционном представлении изображений в градациях серого (8-битными целыми числами) PSNR рассчитывается как

PSNR = 10lg(2552 /MSE),

I J

MSE = ££(IH -Ikl)2/(IJ)

... ?

(1)

где {Iki} и {Iki} - соответственно истинное (неискаженное) и искаженное (в данном случае декодированное после сжатия с потерями) изображения. При этом обычно считается, что вносимые при сжатии с потерями искажения становятся визуально заметными, если PSNR меньше примерно 35 дБ. При использовании обычного JPEG искажения проявляются, прежде всего, в наличии характерных блочных эффектов, а при применении JPEG2000 - в эффектах Гиббса в окрестностях резких (контрастных) границ и малоразмерных объектов.

[5] при расчете метрики UQI. Размер используемого скользящего окна - 64x64 пикселя.

Истинное

изображение

Искаженное ' изображение

Устранение смешения среднего и коррекция контраста

Рис. 1. Последовательность операций расчета метрики PSNR-HVS

Метрика PSNR -HBS = 10lg(2552/MSEH), где

MSEh рассчитывается с учетом особенностей визуального восприятия человека (human visual system -HVS) в соответствии с подходом, описанным в [10, 16]:

I-7J-7 8 8

MSEh = K £ £ £ £((X[m,n]y -X[m,n]j) x

i=1j=1m=1n =1

x Tc[m,n])2, (2)

где K = 1/(I - 7) /(J - 7) / 64, Xjj - коэффициенты ДКП фрагмента искаженного изображения размером 8x8 пикселей с координатами верхнего левого угла, определяемыми индексами i и; X|j — коэффициенты ДКП

соответствующего фрагмента изображения {Iki}; Tc

- матрица корректирующих множителей. В качестве основы получения такой матрицы (табл. 1) в [10] нами было предложено использовать таблицу квантования стандарта JPEG [12].

Матрица Tc обладает рядом важных свойств. В частности, пропорции ее коэффициентов (множителей) обратно пропорциональны пропорциям соответствующих коэффициентов таблицы квантования JPEG. Кроме того, суммарный корректирующий множи-8 8 2

тель £ £ Tc[m,n]) /64 равен единице; при равно-

m=1n =1

мерном распределении искажений между пространственными частотами спектра ДКП это свойство обес-

Метрика PSNR-HVS рассчитывается с использованием таблицы квантизации (ее размер 8х8), принятой в стандарте JPEG для квантования компоненты Y цветных изображений [12]. Для этой таблицы характерна общая тенденция увеличения шага квантования спектральных компонент ДКП при увеличении «частоты». Последовательность опер аций для вычисления метрики PSNR-HVS представлена на рис. 1. Операции смещения среднего и коррекции контр аста осуществляются в скользящем окне, как это описано в работе

печивает равенство значений MSEh и MSE .

Таблица 1. Матрица корректирующих множителей

1,6084 2,3396 2,5735 1,6084 1,0723 0,6434 0,5046 0,4219

2,1446 2,1446 1,8382 1,3545 0,9898 0,4437 0,4289 0,4679

1,8382 1,9796 1,6084 1,0723 0,6434 0,4515 0,3730 0,4596

1,8382 1,5138 1,1698 0,8874 0,5046 0,2958 0,3217 0,4151

1,4297 1,1698 0,6955 0,4596 0,3785 0,2361 0,2499 0,3342

1,0723 0,7353 0,4679 0,4021 0,3177 0,2475 0,2277 0,2797

0,5252 0,4021 0,3299 0,2958 0,2499 0,2127 0,2145 0,2548

0,3574 0,2797 0,2709 0,2626 0,2298 0,2574 0,2499 0,2600

86

РИ, 2007, № 2

Применение метрики PSNR-HVS позволило, в частности, «идентифицировать» различную степень визуальных искажений одного и того же изображения пространственно-коррелированным и некоррелированным аддитивным шумом с одной и той же дисперсией (и соответственно, MSE). Изображение, искаженное пространственно -коррелированными помехами, визуально воспринимается как имеющее более низкое качество (см. пример на рис. 2). Аналогично, поскольку искажения в области низких частот воспринимаются человеческим глазом как более заметные, при одном и том же PSNR и MSE (1), изображение, искаженное смазом, визуально воспринимается хуже, чем искаженное пространственно-некоррелированной помехой (аддитивной или мультипликативной).

а

б

Рис. 2. Тестовое изображение Patterns, искаженное Гауссовским аддитивным шумом, PSNR = 27,5 дБ (а); тестовое изображение Patterns, искаженное пространственно коррелированным Гауссовским аддитивным шумом, PSNR = 27,5 дБ (б)

Новая метрика PSNR-HVS-M [11] позволяет, в дополнение к учету различной чувствительности зрения человека к разным пространственным частотам, принять во внимание и эффекты маскирования. Не вдаваясь в детали (они приведены в [11]), отметим, что эффект маскирования состоит в следующем. Если в ДКП-спектре присутствуют одна или две частоты, амплитуды которых существенно (в несколько раз) превышают амплитуды других частот, то человечес-

кое зрение практически не реагирует на искажения, соответствующие этим частотам с относительно малыми амплитудами и сосредоточенной в них небольшой мощностью для каждого блока. При этом маскирующая способность выше для низких частот и меньше для высоких частот. Программная реализация для расчета PSNR-HVS-M при наличии искаженного и истинного изображений доступна по адресу www.cs.tut.fi/~ponom/psnrhvsm.htm.

Проведенный в [11] анализ показал, в частности, следующее. Во-первых, проведенный в трех странах (Украина, Финляндия, Италия) эксперимент с участием более 150 добровольных исследователей из числа студентов и преподавателей университетов показал, что визуальное качество изображений, искаженных различными помехами с разными типами и степенями, оценивалось участниками достаточно устойчиво независимо от характеристик монитора и дальности до него, освещенности и ряда других факторов. Во-вторых, выстроенные в порядке возрастания качества изображения и количественные оценки качества с использованием метрики PSNR-HVS-M обеспечивают заметно более высокие значения коэффициентов ранговой корреляции Спирмена и Кендалла, чем при использовании других метрик. Наконец, было продемонстрировано, что если изображение содержит много текстурных участков, причем искажения концентрируются именно в них, то даже при P SNR (1) порядка 26-30 дБ эти искажения могут быть практически незаметны визуально, о чем свидетельствуют значения PSNR-HVS-M, также выражаемые в децибеллах, которые существенно больше обычного PSNR.

Кроме перечисленных выше метрик качества, рассмотрим метрику SSIM [5] и DCTune [9]. Такой выбор обусловлен следующими обстоятельствами. Метрика SSIM в настоящее время позиционируется как одна из лучших и наиболее совершенных, хотя, как показано в [10], далеко не всегда она адекватна визуальному восприятию. Метрика DCTune [9], используемая NASA, обеспечивает достаточно высокие значения коэффициентов ранговой корреляции Спир -мена и Кендалла [11] и, на наш взгляд, является одной из лучших среди известных в настоящее время. Отметим, что значения SSIM варьируются в пределах от нуля до единицы (чем больше, тем выше качество), а значения метрики DCTune положительны (чем они ближе к нулю, тем выше качество).

3. Сравнительный анализ эффективности методов сжатия с потерями

Анализ эффективности проводился для тестового изображения Барбара, представленного в градациях серого. Исследовались следующие пять методов сжатия с потерями: JPEG2000 (кодер Kakadu) [13]; вариант JPEG с использованием постоянного (независимо от частоты) шага квантования (JPEG(UQ)); JPEG(UQ) с деблокингом [15], реализуемым после декомпрессии (JPEG(UQ)+DB); обычный JPEG с использованием оптимизированных для обеспечения максимального

РИ, 2007, № 2

87

визуального качества (зависящих от частоты) шагов квантования (JPEG); этот же вариант JPEG с дебло-кингом [15], реализуемым после декомпрессии (JPEG+DB).

Значения исследуемых метрик для пяти анализируемых методов сжатия представлены в табл. 2-6 для различных степеней сжатия, характеризуемых параметром bpp (bits per pixel - бит на пиксель). Коэффициент сжатия может быть легко пересчитан как 8/bpp.

Очевидно, что при увеличении КС (уменьшении bpp) все метрики указывают на ухудшение визуального качества декодированных изображений. Это свойство должно быть характерным для любой метрики при изменении степени проявления искажений заданного вида; неадекватность оценки качества с использованием метрик, как правило, имеет место при сравнении изображений с различными типами искажений.

Анализ значений PSNR показывает, что новый стандарт JPEG2000 по этому критерию существенно превосходит все исследуемые варианты JPEG, как с использованием деблокинга, так и без него. Именно эти различия и являются одним из основных аргументов в плане перехода на новый стандарт. Как и можно было ожидать, деблокинг несколько улучшает качество декодированных изображений, особенно в диапазоне значений bpp от 0,5 до 2,5, характерном для многих практических приложений. При этом JPEG(UQ) обеспечивает несколько большие значения PSNR, чем обычный JPEG.

Сравнение значений SSIM позволяет прийти к таким же выводам, что и в результате анализа PSNR. На основании приведенных данных также можно сделать вывод о целесообразности применения деблокинга.

Поведение и результаты сравнения значений метрики PSNR-HVS более интересны. Прежде всего, обратим внимание на тот факт, что значения PSNR-HVS для JPEG оказываются выше, чем для метода сжатия JPEG(UQ). Более того, для типичных для сжатия неподвижных изображений КС порядка 5 -8 обычный JPEG обеспечивает значения PSNR-HVS, которые мало отличаются от соответствующих значений для нового стандарта JPEG2000 (а применение метода JPEG+DB приводит к еще более высоким значениям PSNR-HVS). Тогда возникает вполне закономерный вопрос - имеет ли смысл замена обычного JPEG на JPEG2000, о чем ратуют создатели нового стандарта, в таких приложениях, как сжатие цветных изображений в цифровых фотоаппаратах. На наш взгляд, для этого приложения никаких явных преимуществ JPEG2000 не имеет.

К аналогичным выводам можно прийти и в результате анализа качества декодированных изображений, используя метрику PSNR-HVS-М. Снова для bpp от 0,49 и выше значения PSNR-HVS-М для JPEG+DB и JPEG оказываются больше, чем для JPEG2000. Хорошо видно и то, что визуальное качество декодированных изображений для JPEG+DB и JPEG выше, чем, соответственно, для JPEG(UQ)+DB и JPEG(UQ). И лишь при высоких степенях сжатия новый стандарт

Таблица 2. Значения PSNR, дБ, от bpp

bpp 0,18 0,24 0,30 0,37 0,49 0,73 1,01 1,48 1,98 2,25 2,59 3,11 3,87

JPEG2000 27,20 28,68 29,93 30,92 32,76 35,52 38,12 41,32 43,74 44,89 46,56 48,69 51,40

JPEG(UQ) 22,71 24,21 25,65 26,95 29,02 32,60 35,54 38,68 41,37 42,64 44,21 46,69 50,46

JPEG(UQ)+DB 23,91 25,55 27,11 28,52 30,69 34,03 36,69 39,54 42,04 43,24 44,72 46,91 50,63

JPEG 22,72 24,62 25,62 26,48 28,06 31,02 33,76 37,13 39,63 40,81 41,96 43,69 46,48

JPEG+DB 23,98 25,65 26,60 27,48 29,29 32,37 34,97 38,05 40,16 41,45 42,25 43,83 46,95

Таблица 3. Значения SSIM от bpp

bpp 0,18 0,24 0,30 0,37 0,49 0,73 1,01 1,48 1,98 2,25 2,59 3,11 3,87

JPEG2000 0,78 0,83 0,86 0,88 0,91 0,94 0,96 0,97 0,98 0,99 0,99 0,99 1

JPEG(UQ) 0,60 0,67 0,74 0,79 0,84 0,91 0,94 0,96 0,98 0,98 0,99 0,99 1

JPEG(UQ)+DB 0,65 0,72 0,79 0,83 0,88 0,93 0,95 0,97 0,98 0,98 0,99 0,99 1

JPEG 0,60 0,69 0,75 0,79 0,84 0,90 0,94 0,96 0,97 0,98 0,98 0,99 0,99

JPEG+DB 0,66 0,74 0,78 0,82 0,87 0,92 0,95 0,97 0,98 0,98 0,98 0,99 0,99

Таблица 4. Значения PSNR-HVS, дБ от bpp

bpp 0,18 0,24 0,30 0,37 0,49 0,73 1,01 1,48 1,98 2,25 2,59 3,11 3,87

JPEG2000 23,99 25,89 27,51 28,16 30,61 33,09 36,57 40,41 43,26 44,74 45,36 47,91 49,13

JPEG(UQ) 18,84 20,45 22,06 23,53 25,86 29,95 33,42 37,30 40,61 42,13 44,09 46,56 50,30

JPEG(UQ)+DB 20,69 22,39 24,04 25,44 27,75 31,48 34,61 38,19 41,22 42,61 44,38 46,68 50,33

JPEG 19,26 22,75 24,88 26,52 29,01 33,01 36,70 41,26 44,86 46,14 47,31 49,81 52,48

JPEG+DB 20,98 24,11 26,03 27,53 29,95 33,85 37,29 41,75 45,03 46,34 47,44 49,74 52,09

88

РИ, 2007, № 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 5. Значения PSNR-HVS-М, дБ от bpp

bpp 0,18 0,24 0,30 0,37 0,49 0,73 1,01 1,48 1,98 2,25 2,59 3,11 3,87

JPEG2000 25,93 28,26 30,31 31,04 34,17 37,08 41,42 46,14 49,35 50,84 51,17 53,12 53,51

JPEG(UQ) 19,86 21,78 23,72 25,52 28,45 33,69 38,18 43,33 47,86 50,03 52,80 56,29 61,63

JPEG(UQ)+DB 21,97 23,98 26,01 27,68 30,59 35,47 39,65 44,51 48,65 50,66 53,16 56,34 61,60

JPEG 20,35 24,81 27,79 30,21 33,89 39,78 45,11 51,84 57,54 59,81 61,20 63,29 68,69

JPEG+DB 22,29 26,39 29,05 31,21 34,67 40,38 44,81 51,86 56,48 58,67 60,09 62,58 66,11

Таблица 6. Значения DCTune от bpp

bpp 0,18 0,24 0,30 0,37 0,49 0,73 1,01 1,48 1,98 2,25 2,59 3,11 3,87

JPEG2000 21,47 16,67 13,57 12,57 9,61 7,23 4,91 3,15 2,37 2,07 2,00 1,62 1,53

JPEG(UQ) 34,97 29,69 20,12 16,86 13,21 9,09 6,32 4,03 2,74 2,30 1,85 1,40 0,95

JPEG(UQ)+DB 33,10 25,73 18,10 15,18 11,63 7,83 5,52 3,64 2,54 2,16 1,78 1,38 0,95

JPEG 38,95 20,85 15,66 13,04 10,47 7,04 4,64 2,69 1,79 1,50 1,31 1,00 0,72

JPEG+DB 31,41 18,17 14,35 12,39 9,81 6,46 4,33 2,55 1,75 1,50 1,32 1,00 0,77

JPEG2000 в соответствии с метрикой PSNR-HVS-М оказывается предпочтительней. Отметим также, что при коэффициенте сжатия меньше 8 в соответствии с критерием PSNR-HVS-M не имеет смысл использовать деблокинг.

Анализ значений метрики DCTune, в принципе, позволяет сделать те же выводы, что и проведенный выше анализ для метрик PSNR-HVS-М и PSNR-HVS (напомним, что в идеале, т.е. при отсутствии искажений, значения метрики DCTune стремятся к нулю). Таким образом, при средних значениях КС методы JPEG+DB и JPEG оказываются вполне сравнимыми с JPEG2000. Об этом свидетельствует и визуальный анализ декодированных изображений, приведенных на рис. 3 для bpp=0,73. При малых коэффициентах сжатия (меньше 3) JPEG(UQ) обеспечивает лучшие результаты, чем JPEG2000 в соответствии с обеими метриками PSNR-HVS-M и DCTune.

а б

в

Рис. 3. Декодированное изображения Барбара для методов сжатия JPEG2000 (а), JPEG (б) и JPEG+DB (в)

4. Выводы

Проведен анализ качества изображений при их сжатии различными методами. Впервые показано, что визуальное качество изображений можно достаточно адекватно характеризовать с помощью новых метрик PSNR-HVS-М и PSNR-HVS. Естественно, что окончательные рекомендации в плане их практического использования можно будет сделать только после проведения более тщательных исследований с применением достаточно большой базы тестовых изображений и рассмотрения разнообразных типов и степеней проявления помех и искажений. Практически важно, что разработанные метрики позволяют адекватно сравнивать между собой качество изображений с несколько различными типами искажений (а для декодированных изображений при использовании для их сжатия JPEG2000 и JPEG искажения различны), а также давать обоснованные пояснения и рекомендации по практическому использованию методов сжатия с потерями.

Литература: 1. Фалькович С.Е. Оценка параметров сигнала. М.: Сов. радио, 1970. 336 с. 2. Bovik A., Handbook of Image and Video Processing, Academic Press, 2000. 3. Damera-Venkata N., Kite T., Geisler W., Evans B. and Bovik A. Image Quality Assessment Based on a Degradation Model, IEEE Trans. on Image Processing, 2000. Vol. 9. Р. 636-650. 4. Wang Z., Bovik A. A universal image quality index, IEEE Signal Processing Letters, 2002. Vol. 9. Р. 81-84. 5. Wang Z., Bovik A., Sheikh H., Simoncelli E. “Image quality assessment: from error visibility to structural similarity”, IEEE Trans. on Image Proc., 2004. Vol.13. Р.600-612. 6. Sheikh H. R. and Bovik A. C., “Image Information and Visual Quality”, IEEE Transactions on Image Processing. 2006. Vol. 15. Р. 430-444.

7. Xiao F. DCT-based Video Quality Evaluation, Final Proj ect for EE392J, 2000. 8. Miyahara, M., Kotani, K., Algazi, V.R. ’’Objective picture quality scale (PQS) for image coding”, IEEE Transactions on Communications. 1998. Vol. 46, issue 9. Р. 1215-1226. 9. Solomon J.A., Watson A. B., andAhumada A. “Visibility of DCT basis functions: Effects of contrast masking”, Proceedings of Data Compression Conference, Snowbird, Utah: IEEE Computer Society Press. 1994. Р. 361370. 10. Egiazarian K., Astola J., Ponomarenko N., Lukin V., Battisti F., Carli M. New full-reference quality metrics

РИ, 2007, № 2

89

based on HVS, CD-ROM Proceedings of the Second International Workshop on Video Processing and Quality Metrics, Scottsdale, USA, 2006. 4 p. 11. Ponomarenko N., Silvestri F., Egiazarian K., Astola J., Carli M., Lukin V. On between-coefficient contrast masking of DCT basis functions, CD-ROM Proceedings of the Third International Workshop on Video Processing and Quality Metrics, Scottsdale, USA, 2007. 4 p. 12. Wallace G. The JPEG Still Picture Compression Standard, Comm. of the ACM. 1991. Vol. 34, No.4. 13. D. Taubman, M. Marcellin, JPEG 2000: Image Compression Fundamentals, Standards and Practice. Boston: Kluwer, 2002. 14. Zeng Wenjun, Daly S., Lei Shawmin, An overview of the visual optimization tollos in JPEG2000, Signal Processing: Image Communication. 2002. Vol. 17. Р. 85-104. 15. Egiazarian K., Astola J., Helsingius M., Kuosmanen P. Adaptive denoising and lossy compression of images in transform domain, Journal ofElectronic Imaging. 1999. Vol. 8. Р. 233-245. 16. N. Nill, A Visual Model Weighted Cosine Transform for Image Compression and Quality Assessment, IEEE Transactions on Communications COM-33. 1985. Р. 551-557.

Поступила в редколлегию 28.03.2007

Рецензент: д-р техн. наук, проф. Разсказовский В.Б.

Лукин Владимир Васильевич , д-р техн. наук, проф., зам. зав. каф. ПІ ЮС НАКУ им. Жуковского „ХАИ”. Научные интересы: цифровая обработка сигналов и изображений. Адрес: Украина, 61070, Харьков, ул. Чкалова, 17, тел. (057)7074841, E-Mail: [email protected], факс (057)7441186.

Пономаренко Николай Николаевич, канд. техн. наук, докторант каф. ППОС НАКУ им. Жуковского „ХАИ”. Научные интересы: цифровая обработка сигналов и изображений. Адрес: Украина, 61070, Харьков, ул. Чкалова, 17, тел. (057)7074841, E-Mail: [email protected], факс (057)7441186.

Кривенко Сергей Станиславович, инженер электросвязи 2 кат. ОАО «Укртелеком», соискатель каф. ППОС НАКУ им. Жуковского „ХАИ”. Научные интересы: цифровая обработка сигналов и изображений. Адрес: Украина, 61061, Харьков, ул. Краснооктябрьская, 14, тел. (057)7121641, E-Mail: [email protected]

УДК621.391

ДИНАМИЧЕСКОЕ КОДИРОВАНИЕ ТРАНСФОРМАНТ ИЗОБРАЖЕНИЙ В ДВУХУРОВНЕВОМ ПОЛИАДИЧЕСКОМ ПРОСТРАНСТВЕ

с учетом цифровых объемов на представление кодограмм Wk и служебных данных Wra :

k

сж

WTp

Wk + Wra ’

(1)

где W^ - объем цифрового представления трансформанты dwt:

БАРАННИК В.В., ХАХАНОВА И.В., ЕЛИСЕЕВ В.В. * 1

Предлагается метод сжатия изображений на основе компактного представления компонент трансформант дискретных вейвлет-преобразований (dwt). Формирование кодового представления трансформант проводится в динамической полиадической системе. В этом случае дополнительное увеличение степени сжатия достигается в результате сокращения объемов служебных данных.

1. Введение

Последнее десятилетие характеризуется резким повышением видеоинформационных потребностей в различных отраслях деятельности человека. При этом темпы роста объемов изображений на несколько порядков превышают возможности вычислительных и телекоммуникационных технологий. Поэтому важным научно-прикладным направлением является совершенствование цифровой обработки изображений, в том числе их компактного представления [1 - 4].

W^ = m х n х b ; (2)

m , n - соответственно количество строк и столбцов в трансформанте; b - количество разрядов на представление компоненты трансформанты;

Wra = (m + n) х b . (3)

Из анализа выражения (1) видно, что с ростом объема Wra происходит уменьшение коэффициента сжатия k сж .

Одним из способов уменьшения влияния объема Wra

на величину k сж является увеличение размеров трансформанты, для компонент которой будет соответствовать единая система полиадических оснований. Действительно, разделив числитель и знаменатель соотношения (1), получим

Отсюда цель исследований состоит в уменьшении аппаратно -вычислительных затрат на цифровую обработку изображений при обеспечении передачи данных в информационно-телекоммуникационных системах в реальном времени.

Одним из недостатков метода сжатия, изложенного в работе [2], являются большие объемы двоичных разрядов Wra , затрачиваемых на представление служебных данных (значений динамических диапазонов компонент трансформант dwt). Для метода [2] коэффициент сжатия kсж трансформант dwt оценивается

k

сж

____________b____________

Wk /(m х n) + (m + n) b/(m x n)

(4)

Как видно из анализа знаменателя выражения (4), при увеличении (m х n) затраты количества разрядов служебной части кодогр аммы, приходящиеся на одну компоненту трансформанты, уменьшаются. С одной стороны, это приводит к увеличению коэффициента сжатия. Данная зависимость демонстрируется в таблице, для m = 128.

90

РИ, 2007, № 2

Analysis to efficiency of the methods of the compression of the scene in accordance with different quality criteria

Текст научной работы на тему «Анализ эффективности методов сжатия изображений в соответствии с различными критериями качества»