Научная статья на тему 'Особенности сжатия цветных изображений jpeg-подобными алгоритмами'

Особенности сжатия цветных изображений jpeg-подобными алгоритмами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
479
159
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Молчанов В.А., Тропченко А.А.

В работе рассматриваются различные способы преобразования цветовых компонент при сжатии цветных изображений на основе стандарта JPEG и анализируется влияние подобных преобразований на качество восстановленного изображения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Молчанов В.А., Тропченко А.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Особенности сжатия цветных изображений jpeg-подобными алгоритмами»

ОСОБЕННОСТИ СЖАТИЯ ЦВЕТНЫХ ИЗОБРАЖЕНИЙ JPEG-ПОДОБНЫМИ АЛГОРИТМАМИ В.А. Молчанов, А.А. Тропченко

В работе рассматриваются различные способы преобразования цветовых компонент при сжатии цветных изображений на основе стандарта JPEG и анализируется влияние подобных преобразований на качество восстановленного изображения.

Введение

В данной работе рассматривается сжатие полноцветных изображений, изначально представленных в системе цветопредставления RGB, на основе JPEG-подобного алгоритма.

Цифровые изображения или статические растровые изображения могут рассматриваться как двумерные массивы пикселей. При использовании системы цветопредставления каждый пиксель представляет собой запись (структуру), полями которой являются компоненты цвета.

Метод сжатия JPEG - один из самых распространенных алгоритмов сжатия черно-белых и цветных изображений. Алгоритм состоит из ряда этапов: преобразования цветового пространства и сжатия его компонент, фрагментации, дискретного косинусного преобразования фрагментов, векторизации, квантования и взвешивания, вторичного сжатия [1-3]. При этом обратное преобразование рефлексивно прямому.

Хотя JPEG и является стандартом ISO, формат его файлов не был зафиксирован. Пользуясь этим, производители создают свои, несовместимые между собой форматы и, следовательно, могут изменить алгоритм [4, 5].

В работе рассматривается модификация первого этапа преобразования алгоритма JPEG, а именно - смена стандартного цветового пространства YCbCr на аналогичные ему, т.е. также использующие для передачи изображения одну компоненту яркости и две компоненты цветоразности.

Цветовые пространства, используемые при сжатии цифровых изображений

В цветовом пространстве RGB пикселы цветного изображения представляются с помощью трех чисел, указывающих относительное соотношение красного (Red), зеленого (Green) и голубого (Blue) цветов (три основные компоненты видимого света). Любой цвет можно получить с помощью комбинации цветов в соответствующей пропорции. Однако при таком подходе практически нет возможности эффективного сжатия изображений, так как для правильного отображения все три компоненты должны быть представлены с одинаковым разрешением.

Поэтому в методе JPEG используется искусственное специальное цветовое пространство YCbCr [1].

Известно, что органы зрения человека менее чувствительны к цвету предметов, чем к их яркости. Цветовое пространство YCbCr и его вариации (иногда их обозначают YUV) является популярным методом эффективного представления цветных изображений. Компонента Y обозначает яркость, которая вычисляется как взвешенное усреднение компонент R, G и В по следующей формуле:

Y = krR + kgG + kbB, где к обозначает соответствующий весовой множитель.

Цветовая информация может быть представлена компонентами цветовых разностей. Тогда каждая из этих компонент представляет собой разность между компонентами R, G и В и компонентой светимости Y. Преимущества такого способа представле-

ния изображений состоит в том, что можно, не сжимая компоненту светимости Y, сжать световые составляющие, представив их с меньшим разрешением, что и осуществляется в алгоритме JPEG на втором шаге сжатия.

Перед тем, как отображать изображение на экране, требуется произвести обратное преобразование из YCbCr в RGB.

Формулы для прямого преобразования выглядят следующим образом: Y = krR + (1 - kb - kr )G + kbB

Cb =z-^(B - Y) ; Cr =t-^(R - Y) 1 - kb 1 - kr

и для обратного преобразования

R = Y + 1 - kr C G = Y - 2kb(l - kb) C - 2kr(l - kr) C 0.5 r' 1 -kb -kr b 1 -kb -kr r'

1 - k, B = Y +l-kb Cb .

0.5 b

Рекомендация ITU-T c идентификатором ВТ.б01 предлагает коэффициенты kb = 0.114 и kr = 0.229 [4]. В этом случае используются следующие формулы преобразования:

Yöoi = 0.25 7R' + 0.504G' + 0.098B' + 1б ; Cb = -0.148R' - 0.291G' + 0.439B' + 128; Cr = 0.439R' - 0.368G' - 0.071B' + 12.

Данный вариант преобразования YCbCr имеет название YQ,Cr: SDTV (Soft Definition Television). Недавно появившийся стандарт телевещания HDTV (High Definition Television) использует несколько иные формулы перехода из RGB в YCbCr [5,6]: Y709 = 0.183R' + 0.614G' + 0.062B' + 16, Cb = -0.101R' - 0.338G' + 0.439B' + 128, Cr = 0.439R' - 0.399G' - 0.040B' + 128. Однако цветовое пространство YCbCr - не единственное, использующее для передачи изображения компоненту светимости и две компоненты цветоразности. Наиболее известно цветовое пространствоYUV, используемое стандартами PAL (Phase Alternation Line), NTSC (National Television System Committee) и SECAM (Sequential Color with Memory). Следует отметить, что пространство YCbCr было разработано в рамках рекомендации ITU-R BT.601 на основе именно этого цветового пространства [3, 6]. Формулы перехода из RGB в YUV выглядят следующим образом: Y'= 0.299 *R' + 0.587*G' + 0.114*B', U=-0.147*R' - 0.289 *G' + 0.436 *B', V= 0.615*R' - 0.515*G' - 0.100*B'.

Другое цветовое пространство - YIQ - также разработано на основе YUV и опционально используется в NTSC. Здесь I - inphase - синфазный сигнал, Q - quadrature -квадратура. Формулы перехода из RGB имеют вид Y'= 0.299 *R' + 0.587*G' + 0.114*B', I=-0.596*R' - 0.275 *G' - 0.321 *B', Q= 0.212*R'- 0.523 *G'- 0.311 *B'.

Photo YCC (торговая марка Eastman Kodak Company) - было разработано для кодирования изображения на носителях Photo CD. Целью было создания цветового пространства, независимого от устройства отображения. Формулы перехода из RGB: Y= 0.213 *R' + 0.419*G' + 0.081 *B', C1=-0.131*R'- 0.256*G' + 0.387*B' + 156, C2= 0.373 *R' - 0.312*G' - 0.061 *B' + 137.

Прореживание матриц цветовых компонент

С целью обеспечения более компактного представления матриц цветовых компонент выполняется процедура их прореживания или семплирования. Ранее такая процедура именовалась децимацией.

В ходе семплирования может изменяться число строк и столбцов матриц цветовых компонент, например, за счет удаления каждой четной строки или каждого четного столбца [1, 3].

% %

% О

% % 4:4:4 Семплиравание

О

% О

4:2:2 Семплирование

О

о о

4:2:0 Семплирование

Рис. 1. Различные форматы сэмплирования

Формат семплирования 4:4:4 подразумевает, что все три компоненты (У, СЬ и Cr) имеют одинаковую размерность и, следовательно, сэмплы всех компонентов присутствуют в каждом пикселе. Число в пропорции означает относительную долю каждой компоненты при сэмплировании в горизонтальном направлении, т.е. для каждой из четырех компонент яркости отбирается по четыре хроматические компоненты. Сэмплирование по формату 4:4:4 означает полную точность в передаче хроматических компонент. При сэмплировании по формуле 4:2:2 (этот формат иногда обозначается YUY2) хроматические компоненты по вертикали имеют одинаковую размерность с яркостью, а по горизонтали они имеют половину от размерности яркости (числа 4:2:2 означают, что на каждые четыре сэмпла яркости Y по горизонтали отбирается только две компоненты СЬ и две компоненты Cr). Формат 4:2:2 используется для высококачественного цветного видео. В популярном формате семплирования 4:2:0 (YV12) каждая компонента СЬ и Cr имеет и по вертикали, и по горизонтали половину разрешения по сравнению с Y. Соотношение 4:2:0 выглядит несколько странным, поскольку эти числа не имеют обычной интерпретации, а само это выражении просто является данью исторической традиции, когда под этим «кодом» подразумевался именно этот формат сэмплирования, который отличается от форматов 4:4:4 и 4:2:2. Цветное сэмплирование 4:2:0 широко используется во многих потребительских приложениях, таких как видеоконференции, цифровое телевидение и диски DVD. Поскольку хроматические компоненты отбираются в четыре раза реже компонент яркости, то пространство 4:2:0 YCbCr требует в два раза меньше сэмплов по сравнению с форматом видео 4:4:4 (или RGB). Различные форматы сэмплирования показаны на рис.1.

Анализ качества восстановленных изображений

Чтобы провести анализ эффективности различных цветовых пространств и форматов сэмплирования, было выполнено сжатие и последующее восстановление ряда различных по своему информационному смыслу изображений. Тестирование проводилось на изображениях в формате *.bmp размером 1024 пикселей по длине и 768 пикселей по высоте. Реализовано несколько вариантов преобразования:

• цветовые пространства, в которые преобразовывалось исходное изображение -YUV, УСьСг, УСьСг (HDTV), Photo YCC и YIQ;

• режимы семплирования: режим 4:4:4 - при этом достигаются минимальные потери качества при меньшем коэффициенте сжатия, и режим 4:2:0, при котором компоненты Cb и Cr берутся вдвое реже, чем яркостная составляющая, т.е. через строку и через столбец, что обеспечивает больший коэффициент сжатия при худшем качестве.

Коэффициент качества, который используется в стандарте JPEG как входной параметр для формирования матрицы квантования (с помощью этого параметра происходит управление степенью потери качества сжатого изображения и коэффициентом сжатия), принимал значения от 1 до 10.

В результате сжатия и последующего восстановления изображений для указанных случаев определялось отношение сигнала к шуму по трем цветовым компонентам - R, G и B и максимальное отклонение значений пикселей.

На рис. 2 показана одна из полученных зависимостей качества восстановленного изображения для различных цветовых пространств и различных матриц квантования.

PSNR ( семплирование 4:4:4)

100

95

90

W Q.

85

80

75

123456789 10

Quant multiple

YUV YCbCr YCbCr HDTV —YCC —YIQ

Рис. 2. Зависимость сооношения сигнал/шум (в dB) от коэффициента качества при сжатии цветных изображений с использованием различных цветовых пространств

Заключение

Таким образом, выполненное сравнение качества восстановленных изображений показало, что в режиме семплирования 4:4:4 наилучшие результаты показали использование цветового пространства YUV и YCbCr (HDTV), которое дали примерно одинаковые, самые большие показатели отношения сигнала к шуму. В режиме 4:2:0 использование цветового пространства YCbCr HDTV показало наилучшие результаты по значению отношения сигнала к шуму. Вместе с тем, использование YCbCr HDTV обеспечивает наименьшее отношение максимального отклонения значений пикселей.

Литература

1. Ватолин Д., Ратушняк А., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. М.: ДИАЛОГ-МИФИ, 2003. 384 с.

2. Сэломон Д. Сжатие данных, изображений и звука. М., Техносфера, 2004. 368 с.

3. Ричардсон Я. Видеокодирование. Н.264 и MPEG-4 - стандарты нового поколения. М.: Техносфера, 2005. 368 с.

4. Draft ITU-T Recommendation and Final Draft International Standard of Joint Video Specification (ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC), 2003

5. Image and Video Coding - Emerging Standards and Beyond. // IEEE Transactions on Circuits and Systems for Video Technology. 1997. V. 8. № 7. Р. 814-837.

6. Thomas Wiegand, Gary J. Sullivan, Gisle Bjontegaard, Ajay Luthra. Overview of the H.264/AVC Video Coding Standard. // IEEE Transactions on Circuits and Systems for Video Technology. July 2003

i Надоели баннеры? Вы всегда можете отключить рекламу.