Научная статья на тему 'СЖАТИЕ ЦИФРОВЫХ ДАННЫХ С ПОТЕРЯМИ. ОЦЕНКА КАЧЕСТВА СЖАТИЯ'

СЖАТИЕ ЦИФРОВЫХ ДАННЫХ С ПОТЕРЯМИ. ОЦЕНКА КАЧЕСТВА СЖАТИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
65
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «СЖАТИЕ ЦИФРОВЫХ ДАННЫХ С ПОТЕРЯМИ. ОЦЕНКА КАЧЕСТВА СЖАТИЯ»

Т.К. Филиппов

СЖАТИЕ ЦИФРОВЫХ ДАННЫХ С ПОТЕРЯМИ. ОЦЕНКА КАЧЕСТВА СЖАТИЯ

Введение

В основе любого способа сжатия информации лежит модель источника информации, или, более конкретно, модель избыточности. Иными словами, для сжатия информации используются некоторые сведения о том, какого рода информация сжимается.

При цифровой компрессии изображений качество получаемого при декодировании изображения напрямую зависит от степени сжатия. В настоящее время для компрессии используются алгоритмы с потерями, позволяющие (в отличие от алгоритмов без потерь) достигать больших степеней сжатия (до 20-100 раз). Подобные алгоритмы характеризуются потерями визуального качества закодированного сигнала по сравнению с исходным. Потеря информации не является критической при слабом сжатии. В противоположном случае при очень большой степени сжатия искажения становятся заметными и зачастую неприемлемыми для зрительного восприятия [1].

Альтернативные алгоритмы сжатия изображений

Для цифровых изображений как класса мультимедийных данных в настоящее время единственным действительно широко используемым форматом сжатия с потерями является JPEG, получивший широкое применение благодаря распространению цифровых фотоаппаратов, сканеров и других устройств захвата изображений. С учетом количества представленных в формате JPEG изображений очевидны весьма значительные потери, связанные с хранением, передачей и обработкой, возможно, неоптимально (по качеству и степени компрессии) сжатой информации.

С учетом вышесказанного представляется актуальным исследование методов сжатия, основанных на иных представлениях изображений (по сравнению с наиболее распространенными пространственно-спектральными), к которым относятся алгоритмы поблочного кодирования с преобразованием, основанные на дискретных ортогональных преобразованиях. Новые перспективные методы, появившиеся на базе векторного квантования, субполосного кодирования, фрактальных преобразований, преобразований на основе всплесков, потенциально могут обеспечить существенно более высокое сжатие информации, однако их внедрение пока во многих случаях упирается в проблему вычислительной сложности их реализации, которая часто объясняется отсутствием быстрых алгоритмов [2].

При решении задачи локального вейвлет-анализа данных предполагается применение дискретного вейвлет-преобразования одномерного сигнала на примере вейвлет-базиса Хаара и быстрого алгоритма дискретного ортогонального вейвлет-разложения С. Малла. Замена конструкции предполагает ее трансформацию от иерархической схемы вычислений, используемой в известных алгоритмах, к схеме, в которой вычисление ко-

эффициентов для вейвлетов каждого уровня производится последовательно для всех его позиций на цифровом сигнале в рекурсивном режиме [3].

Данное изменение вычислительной конструкции вейвлет-преобразования позволяет отойти от «блочного» характера вычислений [4], который обычно приводит либо к избыточной в вычислительном плане схемы последовательного вычисления вейвлет-преобразования, либо к снижению качественных показателей анализа.

Изменение вычислительной конструкции в параллельную или параллельно -рекурсивную форму, которая хорошо приспособлена к задаче локального «скользящего» анализа цифровых сигналов и изображений [5], приводит, в частности, к существенному снижению сложности обработки. Подбор коэффициентов сжатия позволяет получить приемлемые результаты для последующей работы с данными, несмотря на появившиеся артефакты (искажения, вызванные обработкой).

Оценки сжатия изображений

Наиболее адекватным критерием оценки качества изображения является зрение человека. К сожалению, такой метод является в достаточной степени субъективным.

Для количественной характеристики существуют различные методы, среди которых наибольшее распространение получили точные с математической точки зрения критерии оценки качества изображения на основе оценки отношения энергии сигнала и искажений (шума). Наиболее простым и распространенным параметром для оценки качества является пиковое отношение сигнал/шум (peak signal to noise ratio), сокращенно PSNR, которое выражает количественную характеристику отношения энергии шума, вносимого процессом кодирования, к максимально возможной энергии исходного сигнала. PSNR выражается в децибелах (dB). Чем больше значение PSNR, тем меньше искажение сигнала. Нулевому уровню искажений соответствует значение PSNR, равное бесконечности [6].

Другой особенностью современных кодеров, обусловленной спецификой человеческого зрения, является различная обработка информации, связанной с яркостью и цветностью изображений. Человеческий глаз как оптический инструмент более чувствителен к изменениям яркости, чем к изменениям цвета. С учетом данной особенности зрения цветной сигнал, который обычно принято характеризовать тремя значениями цветов (RGB), перед кодированием переводится в представление YUV, где Y - яркостная компонента сигнала, а U и V - две цветоразностных компоненты. Процедура перевода из RGB в YUV является линейной и обратимой для реальных значений цветности, то есть при обратном восстановлении сигнала RGB из YUV потери будут отсутствовать (PSNR равно бесконечности). Для целочисленных значений, строго говоря, при трансформации изображения из RGB в YUV возникают незначительные потери, связанные с округлением действительных чисел (с плавающей точкой) до целых. Тем не менее, данные потери качества практически незаметны для человеческого зрения.

PSNR = 10 • log 1 ^ MaxErr 2 •wh (1)

2 j - yu j )2 ' i=0,j=0 J J

где MaxErr - максимум модуля разности цветовой компоненты, W - ширина изображения, h - высота изображения. Данная метрика, по сути, аналогична среднеквадратичному

отклонению, однако пользоваться ей несколько удобнее за счет логарифмического масштаба шкалы.

Результаты сжатия тестовых изображений

Для тестирования алгоритмов сжатия изображений на протяжении многих лет использовались три файла: «Lena», «Barbara» и «Goldhill». Все изображения иимеют размер 512x512 точек.

Визуально довольно сложно дать объективно точную сравнительную оценку полученным сжатым изображениям. В связи с этим применяются количественные характеристики на примере PSNR.

Результаты определения PSNR для изображения «Goldhill»:

Отношение Оригинал /JPEG = 35.673; Оригинал/Wavelet = 34.266 (рис. 1.1, 1.2).

Рис. 1.1. Исходное изображение «Goldhill»

а б

Рис. 1.2. Сжатые изображения «Goldhill» методом JPEG (а) и методом Wavelet (б)

Результаты определения PSNR для изображения «Barbara»: Отношение Оригинал /JPEG = 34.04998; Оригинал/Wavelet = 40.27348 (рис. 2.1, 2.2). В данном случае применение wavelet метода показало более качественное сжатие изображения, в отличие от JPEG метода.

Рис. 2.1. Исходное изображение «Barbara»

а б

Рис. 2.2. Сжатые изображения «Barbara» методом JPEG (а) и методом Wavelet (б)

Результаты определения PSNR для изображения «Lena»:

Отношение Оригинал /JPEG = 38.32295; Оригинал/Wavelet = 41.08069 (рис. 3.1, 3.2). В данном случае применение wavelet метода также показало более качественное сжатие изображения, в отличие от JPEG метода.

Рис. 3.1. Исходное изображение «Lena»

а б

Рис. 3.2. Сжатые изображения «Lena» методом JPEG (а) и методом Wavelet (б)

Результаты

Для увеличения эффективности сжатия изображений были применены принципиально новые методы сжатия, допускающие некоторые потери информации, согласованные со зрительной системой человека. Применение таких методов позволило достигать существенных значений коэффициентов сжатия.

Для более объективной оценки качества сжатых изображений с потерями необходимо помимо визуальной оценки применять различные существующие методы оценки. В данном случае было предложено использование самого распостранненного на сегодня типа оценки - PSNR. При проведении сравнительного анализа с учетом схожих визуальных результатов сжатия было выявлено преимущество метода Wavelet-преобразования по отношению к JPEG методу.

Оценка качества сжатого изображения PSNR высчитывается при помощи специализированного программного обеспечения «MSU Video Quality Measurement Tool».

Для получения оценки качества в программу внесены оригинал изображения и сжатые изображения при помощи программ с JPEG и Wavelet-преобразованиями.

Литература

1. Программа для оценки качества кодирования (PSNR Checker). [Электронный ресурс]. - Режим доступа: http://www.codec.ru/information/psnr_checker.html.

2. Окунев В.В. Методы многокритериальной оптимизации фрактального сжатия изображений: Автореф. дисс. ... канд. тех. наук. - Санкт-Петербург, 2010.

3. Копенков В.Н., Мясников В.В. Быстрые алгоритмы локального дискретного вейвлет-преобразования с базисом Хаара // Перспективные информационные технологии в научных исследованиях, проектировании и обучении ПИТ-2006: В 2 т. Т. 2. - Самара, 2006. - С. 113-118; Myasnikov V.V. Methods for Designing Recursive FIR Filters // Proceedings of International Conference «Computer Vision and Graphics» (ICCVG 2004). - Warsaw, 2004, Springer; Филиппов Т.К. Применение вейвлет-преобразования информации при техническом анализе экономических данных // Научно-технические ведомости СПбГПУ. -2012. - № 5.

4. Mallat S. A wavelet tour of signal processing. - М.: Academic Press, 1999.

5. Копенков В.Н., Мясников В.В. Указ. соч.; Chernov A.V., Myasnikov V.V., Sergeyev V.V. Fast Method for Local Image Processing and Analysis // Pattern Recognition and Image Analysis. - 1999. - Vol. 9. - No. 4. - P. 572-577.

6. Программа для оценки качества кодирования (PSNR Checker). [Электронный ресурс]. - Режим доступа: http://www.codec.ru/information/psnr_checker.html.

i Надоели баннеры? Вы всегда можете отключить рекламу.