Научная статья на тему 'Выбор параметров сжатия изображений с потерями на основе их характеристических свойств'

Выбор параметров сжатия изображений с потерями на основе их характеристических свойств Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1676
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЖАТИЕ ИЗОБРАЖЕНИЙ / ДИСКРЕТНОЕ КОСИНУСНОЕ ПРЕОБРАЗОВАНИЕ / АЛГОРИТМ JPEG

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Хомоненко А.Д., Старобинец Д.Ю., Уваров В.А.

Предлагается схема выбора параметров сжатия изображений с потерями на основе оценки их характеристических свойств. Выбор параметров выполняется применительно к дискретному косинусному преобразованию в составе алгоритма сжатия JPEG из условий получения минимального объема сжатого файла при заданных требованиях к качеству изображения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Choice of lossy image compression parameters on the basis of their characteristic properties

This article presents a scheme of a choice of the parameters of lossy image compression based on the assessment of their characteristic properties. The choice of parameters is carried out with the reference to discrete cosine transformation being a part of JPEG compression algorithm resulting from the conditions of receiving the minimum volume of the compressed file at the set requirements to the quality of an image.

Текст научной работы на тему «Выбор параметров сжатия изображений с потерями на основе их характеристических свойств»

78

Информационные технологии

3. Искусственный интеллект. Стратегии и методы решения сложных проблем / Дж. Ф. Люггер. - М. : Вильямс, 2005. - 864 с.

4. Формальные языки и грамматики / А. В. Гладкий. - М. : Наука, 1973. - 368 с.

5. Автоматизация проверки проектов на основе АРМ-тест / Б. Ф. Безродный, М. Н. Василенко, Б. П. Денисов, Д. В. Седых // АСИ. -2008. - № 9. - С. 22-24.

6. Система контроля и обеспечения качества проектной документации / А. А. Кочетков,

М. Н. Василенко, Б. П. Денисов, М. С. Трясов,

О. А. Максименко // АСИ. - 2006. - № 8. -С. 9-11.

7. Автоматизированная система экспертизы схемных решений / Т. А. Тележенко // АСИ. -2009. - № 5. - С. 24-26.

8. Инструкция по ведению технической документации железнодорожной автоматики и телемеханики ЦШ-617-11 : утв. ОАО «РЖД» 14.09.2011 (ред. 04.10.2011 г.). - Екатеринбург : УралЮрИздат, 2012. - 63 с.

УДК 004.4

A. Д. Хомоненко

Петербургский государственный университет путей сообщения Д. Ю. Старобинец

Военно-космическая академия им. А. Ф. Можайского

B. А. Уваров

Петербургский государственный университет путей сообщения

ВЫБОР ПАРАМЕТРОВ СЖАТИЯ ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ НА ОСНОВЕ ИХ ХАРАКТЕРИСТИЧЕСКИХ СВОЙСТВ

Предлагается схема выбора параметров сжатия изображений с потерями на основе оценки их характеристических свойств. Выбор параметров выполняется применительно к дискретному косинусному преобразованию в составе алгоритма сжатия JPEG из условий получения минимального объема сжатого файла при заданных требованиях к качеству изображения.

сжатие изображений, дискретное косинусное преобразование, алгоритм JPEG.

Введение

Алгоритмы сжатия изображений с потерями, такие как дискретное косинусное преобразование, вейвлет-преобразование, позволяют обеспечить существенно более высокую степень сжатия по сравнению с алгоритмами сжатия без потерь, например, кодирования длин серий, арифметического сжатия и Хаффмана. Однако существенным ограничением использования алгоритмов сжатия изображений с потерями может быть недо-

пустимость снижения качества изображений ниже определенного уровня при решении ряда практических задач [1-4].

К числу таких практических задач можно отнести, например, задачи распознавания объектов изображения при проведении воздушного или космического мониторинга и разведки местности, наблюдении за объектами железнодорожного, водного и автомобильного транспорта и т. п. [5]. При решении перечисленных задач проводится фотографирование (или видеосъемка) мест-

2012/4

Proceedings of Petersburg Transport University

Информационные технологии

79

ности; полученные при этом изображения требуется сжать и передать на землю для последующей обработки. В такой ситуации, на наш взгляд, целесообразно выполнить автоматическое определение параметров сжатия изображений, чтобы добиться наилучшего соотношения качества и степени сжатия изображения.

Центральным понятием в теории сжатия информации является избыточность. Устранением избыточности обеспечивается сжатие информации. В изображениях имеют место следующие два вида избыточности:

1. В определенном изображении некоторые цвета могут встречаться часто, а другие - редко.

2. В результате корреляции соседние пиксели оказываются окрашенными в близкие цвета.

Первый вид избыточности можно удалить с помощью кодов переменной длины, присваиваемых разным пикселям или символам. Для часто встречающихся пикселей назначаются более короткие коды, для редко встречающихся пикселей - более длинные. Тем самым обеспечивается сжатие изображения. Кроме того, может применяться кодирование одинаковых последовательностей пикселей или символов (словарные методы сжатия).

Второй вид избыточности устраняется с помощью различных методов. Могут применяться, например: переход в другую систему представления цветов; ортогональные преобразования изображений для снижения корреляции; квантование и отбрасывание коэффициентов перед выполнением обратных преобразований и др.

При решении прикладных задач, связанных с передачей, обработкой и хранением изображений, наибольший интерес представляет использование методов сжатия изображений с потерями. Чтобы осуществить такой вид сжатия, применяют методы, перечисленные выше, однако, помимо выбора сочетания этих методов для обеспечения лучшего сжатия, актуальной задачей на сегодняшний день является также автоматизация выбора параметров для каждого из них.

1 Дискретное косинусное преобразование

Дискретное косинусное преобразование (ДКП) представляет собой один из наиболее распространенных методов сжатия изображения с потерями. Суть метода заключается в том, что при прямом преобразовании выполняется вычисление косинусных коэффициентов. При обратном преобразовании большая часть вычисленных при прямом преобразовании коэффициентов отбрасывается. Но при этом большой потери качества изображения не происходит.

Метод дает хорошие результаты для изображений с плавным изменением цветов для соседних пикселей. ДКП применяется как составная часть конвейерного алгоритма сжатия изображений JPEG.

Рассматриваемое преобразование выполняется по одному или двум измерениям. В одномерном случае дискретное косинусное преобразование исходного массива V из N чисел в массив коэффициентов T выполняется по формулам вида

тп /-wVr 1 (2 n + 1) ^

T[i] = c(i) L V[n] cos ———,

n=o 2N

i = 0,

, N,

где c(0) = V1/ N, c(i) = ^J2/N , i ф 0.

Обратное преобразование массива коэффициентов T в массив V из N чисел выполняется с помощью соотношений вида

V[i] = Nf c(n)T[n]cos(2' +1ПП, i = 0, ...,N.

n=o 2N

В двумерном случае прямое дискретное косинусное преобразование исходной матрицы V размером N в матрицу коэффициентов T выполняется по формулам вида

N-1N-1 (2 n +1) in

T [i, j] =c(i, j) L L V [n, k ] cos —x

n=0 k 2N

(2 k + 1)in . . . ,T

xcos--------—, i, j = 0, ...,N,

2N

где c(i, j) = 1 / N, i или j = 0; c(i, j) = 2/ N, i Ф ° j Ф 0.

ISSN 1815-588Х. Известия ПГУПС

2012/4

80

Информационные технологии

В двумерном случае обратное ДКП матрицы коэффициентов T в матрицу V размером N выполняется с помощью соотношений вида

N-1N-1 (2 n + 1) in

V\п,к] = X Ё c(i. j)т[i, j]cos( _ дт— х

i=о j=о 2N

(2 к +1) in

х cos--------, n, к = 0, .... N.

2N

В двумерном случае ДКП удобно выполнять в матричном виде. Прямое преобразование при этом записывается в виде

T = MVMT.

Соответственно обратное дискретное косинусное преобразование записывается в виде

V = MTTM.

При реализации ДКП в алгоритме JPEG изображение разбивается на блоки размером 8x8, V представляет собой матрицу размером 8x8, а M есть матрица вида

" 11 1 "

V8 Vs " ' Vs

о О X/l 2COS16 п .. . iCOs1f'

О О уз 2COS16 п .. . iCosi'

cos 16 п TCOS§п .. . iCosi°r

Перед тем, как выполнить обратное преобразование, находят коэффициенты ДКП, вклад которых в изображение минимален и которые можно отбросить. В случае применения ДКП в составе JPEG для этой цели используется квантование. Для определения значений квантов в формате JPEG используется массив из 64 элементов, называемый таблицей квантования (округления). Элементы матрицы квантования вычисляются по формуле:

q(i. j ) = 1+(i+j)r.

где i, j - координаты элементов матрицы квантования; q(i, j) - элемент матрицы квантования; r - коэффициент квантования, задаваемый пользователем.

Для каждого элемента матрицы дискретного косинусного преобразования существует соответствующий элемент матрицы округления. Результирующая матрица получается делением каждого элемента матрицы дискретного косинусного преобразования на соответствующий элемент матрицы округления и последующим округлением результата до ближайшего целого числа. Как правило, значения элементов матрицы округления растут слева направо и сверху вниз.

На этапе выбора матрицы округления осуществляется управление степенью сжатия и происходят самые большие потери. При использовании матрицы квантования с большими коэффициентами получается больше нулей и, следовательно, большая степень сжатия. От выбора матрицы округления зависит баланс между степенью сжатия изображения и его качеством после восстановления. Стандарт JPEG позволяет использовать любую матрицу округления, однако ISO разработала набор матриц округления.

Фактор качества задает интервал между соседними уровнями матрицы округления, расположенными на ее диагоналях. Пример полученной таким образом матрицы округления представлен на рис. 1.

3 5 7 9 11 13 15 17

5 7 11 13 15 17 19 21

7 11 13 15 17 19 21 23

9 11 13 15 17 19 21 23

11 13 15 17 19 21 23 25

13 15 17 19 21 23 25 27

15 17 19 21 23 25 27 29

17 19 21 23 25 27 29 31

Рис. 1. Матрица округления с фактором качества, равным 2

2012/4

Proceedings of Petersburg Transport University

Информационные технологии

81

Выбор параметров сжатия изображений с потерями напрямую связан с оценкой качества полученного изображения. Таким образом, для автоматизации выбора параметров сжатия изображений необходимо произвести предварительный анализ исходного изображения и дать оценку качества полученного изображения.

2 Оценка качества изображений

Выбор хорошего показателя и критерия оценки потери качества изображения представляет непростую задачу. Как правило, все известные в настоящее время показатели и критерии имеют заметные недостатки. Рассмотрим кратко наиболее распространенные показатели.

Среднеквадратичное отклонение (root-meansquare - RMS) значений пикселей:

d ( х, y)=

Znm , ч 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

г=1,м(ху -Уу)

п

По этому показателю изображение будет сильно испорчено при понижении яркости всего на 5 % (глаз этого не заметит - у разных мониторов настройка яркости варьируется значительно больше).

В то же время изображения со «снегом» -резким изменением цвета отдельных точек, слабыми полосами или «муаром» будут признаны «почти не изменившимися».

Максимальное отклонение:

max

d (X У) =—,---------(ху - У у)-

г, у = 1,...,n

Этот показатель чувствителен к изменению отдельных пикселей. К примеру, в изображении может существенно измениться значение одного пикселя (что почти незаметно для глаза), однако, согласно этой мере, изображение будет сильно испорчено.

Отношение сигнала к шуму (peak-to-peak signal-to-noise ratio - PSNR) :

d (х, y)=10- logio

2552n2

Znm s \

«■=i, j=i( ху- Уу)

2

Этот показатель часто используется на практике. По сути, показатель аналогичен среднеквадратичному отклонению с присущими ему недостатками, но пользоваться им несколько удобнее благодаря логарифмическому масштабу шкалы.

Лучше всего потери качества изображений оценивают наши глаза. Отличным считается сжатие, при котором невозможно на глаз различить первоначальное и распакованное изображения. Хорошим считается сжатие, при котором определить, какое из изображений подвергалось сжатию, можно только сравнивая два находящихся рядом изображения.

Еще одним критерием оценки потери качества изображений может служить возможность либо невозможность распознания в сжатом изображении объекта (объектов), которые могли быть распознаны в исходном изображении с помощью современных методов. В данной статье для оценки потери качества сжатого изображения использовался экспертный подход, который заключается в определении возможности распознания объектов различной природы.

Как сказано выше, для автоматического выбора параметров сжатия изображений с потерями необходимо произвести предварительный анализ параметров изображения. Для данной цели можно адаптировать перечисленные методы оценки потери качества изображений, однако, ввиду присущих им недостатков, для определения степени сжатия произвольного изображения они малопригодны. Наиболее перспективным, на наш взгляд, может быть метод, основанный на анализе статистических свойств изображения.

3 Алгоритм определения параметров

сжатия изображения

Рассмотрим алгоритм определения параметров сжатия изображения с потерями на основе оценки статистических свойств изображения.

Предварительно для заданного класса изображений (фотографий, получаемых во время воздушного или космического мониторинга и разведки местности) строится

ISSN 1815-588Х. Известия ПГУПС

2012/4

82

Информационные технологии

таблица соответствия значений среднего коэффициента яркости пикселей изображения значениям требуемого коэффициента сжатия. Значение требуемого коэффициента сжатия при конкретном значении характеристик изображения определяется экспертным путем из условий обеспечения требуемого качества изображения при сжатии.

После съемки очередного изображения для определения параметров сжатия изображения выполняются следующие шаги:

1. Выполняется расчет значения коэффициентов яркости для пикселей изображения.

2. По вычисленному значению коэффициентов яркости пикселей изображения с помощью построенной на предварительном этапе таблицы определяется значение требуемого коэффициента сжатия изображения.

Далее производится сжатие изображения и передача его для последующей обработки и распознавания контролируемых объектов.

Пусть имеется изображение, которое представлено матрицей размерностью mxn пикселей. Для выполнения первого этапа производится расчет усредненных показателей яркости для соседних пикселей. Под «соседними», или смежными, пикселями будем понимать пиксели, находящиеся сверху, снизу, слева и справа от исходного в матрице изображения, т. е. для пикселя с координатами (x, у) соседними будут являться пиксели с координатами: (х - 1, у); (х + 1, у); (x, у - 1); (x, у + 1). В случае представления изображения в формате RGB каждый пиксель имеет три составляющие: красную, зеленую и синюю. Поочередно сравниваются (вычитаются) каждые из них. Из трех полученных чисел берется среднее значение, что и принимается за усредненный показатель яркости между двумя пикселями.

Таким образом, для смежных пикселей RGB-изображения усредненный показатель яркости D (х,у, i, j) вычисляется по формуле:

D( x У, i, j)=

= (| R( Ixy) - R( Ij )| + |G( Ixy) - a

3 *

, -G( Ij )| + | B( Ixy) - B( Ij )|)

где I - матрица пикселей изображения; R, G, B - функции для определения красной, зеленой и синей составляющих пикселя соответственно; x, у - координаты исходного пикселя; i, j - координаты соседнего пикселя.

После вычисления усредненного показателя яркости для выбора параметров степени сжатия изображения необходимо рассчитать коэффициент разности яркости смежных пикселей изображения.

Расчет коэффициента выполняется также для четырех соседних пикселей, для чего вычисляется среднее значение показателей яркости между ними. Операция повторяется для каждого пикселя изображения.

Таким образом, вычисление элемента матрицы коэффициентов разности яркости смежных пикселей С(х, у) осуществляется по формуле:

С (x y,i, j) =

= (D ( x, У, x -1, y ) + D ( x, y, x, y -1) +

= 4

+D ( x, y, x +1, y ) + D ( x, y, xy +1))

4 '

Из рассчитанных коэффициентов строится матрица ||Сг. ; ||:

C11 С. . Ck

II C21 C22 . . C2k

Cn1 Cn2 . . Cnk

На основании данной матрицы вычисляются средний и максимальный коэффициенты межпиксельной взаимосвязи для изображения:

K

Zn,k с

i=1, j=1 Ci, j .

n ■ к ’

K

max | C j

В качестве альтернативного показателя, используемого для определения характе-

2012/4

Proceedings of Petersburg Transport University

Информационные технологии

83

ристических свойств изображений, могут использоваться энтропийные оценки [6, 7].

4 Результаты численного эксперимента

В качестве эксперимента были рассчитаны коэффициенты межпиксельной взаимосвязи для различных изображений, характеризующих статистические свойства данных изображений, и выполнено их преобразование в стандарт JPEG с различными коэффициентами сжатия (эксперимент проводился в среде MatLab [8]). На рис. 2 приведены тестовые изображения с различной степенью сжатия: а) исходное изображение (качество изображения 100 %); б) 50 %; в) 30 %;

г) 20 %; д) 10 %; е) 5 %.

Для исходного изображения (рис. 2, а) значение коэффициента межпиксельной взаимосвязи K = 25,76. Результаты расчета степени сжатия для приведенных изображений представлены в табл. 1.

Как видно из приведенных изображений, при качестве более 20 % обеспечивается достаточная детализация объектов изображения, а именно при большей степени сжатия на изображении становятся неразличимы мелкие объекты. Приведенная оценка является субъективной, качество изображений может оцениваться как с использованием экспертных оценок, так и с использованием известных методов обработки изображений.

Таким образом, имеется возможность для заданного класса изображений установить диапазон значений коэффициента межпиксельной взаимосвязи, при котором достигается максимальная степень сжатия при сохранении приемлемого качества полученного изображения.

В ходе эксперимента установлена зависимость между статистическими характеристиками исходного изображения, степенью его сжатия и качеством полученного изображения. Оптимальные значения качества изображений при различных значениях

а) б) в)

г) д) е)

Рис. 2. Изображения с различными коэффициентами сжатия

ISSN 1815-588Х. Известия ПГУПС

2012/4

84

Информационные технологии

ТАБЛИЦА 1. Значения степени сжатия при заданном качестве

Качество JPEG-изображения, % 5 10 20 30 50 100

Степень сжатия 7 5,8 5 4,4 3,5 1

коэффициента межпиксельной взаимосвязи приведены в табл. 2.

В табл. 2 отмечены оптимальные значения качества JPEG-изображения. При данных значениях сжатия качество изображения ухудшается, но при этом имеется возможность распознать на полученном изображении выбранный объект. В данном случае оценка качества полученного изображения производилась экспертным методом без использования автоматизированных методов

пень сжатия - такую, что при максимально возможной степени сжатия искомый объект на изображении будет гарантированно обнаружен при использовании стандартных методов.

Дальнейшие исследования целесообразно продолжить в направлении выработки рекомендаций по определению параметров сжатия изображений с потерями с помощью других алгоритмов, например, вейвлет-преобразования в составе многостадийного

ТАБЛИЦА 2. Оптимальные значения качества изображений

Коэффициент межпиксельной взаимосвязи изображения, K Качество полученного JPEG-изображения, %

10 15 20 25 30

Меньше 3 +

3-6 +

6-10 +

10-15 +

Больше 16 +

и средств распознания объектов и оценки качества. Полученный результат в значительной степени зависит от разрешения изображения, а также от размера распознаваемого объекта и средств распознавания.

Заключение

Таким образом, экспериментально показано, что для изображений различной природы имеется возможность на основании расчета коэффициентов межпиксельной взаимосвязи автоматически подбирать оптимальную сте-

алгоритма JPEG2000 [4, 9-10] и других подходов, например [11]. Кроме того, целесообразно оценить влияние числа учитываемых смежных пикселей изображения на параметры качества изображения после сжатия

[5], а также рассмотреть решение задачи с применением энтропийных оценок характеристических свойств изображений [6, 7].

Библиографический список

1. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео / Д. Вато-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2012/4

Proceedings of Petersburg Transport University

Информационные технологии

85

лин, А. Ратушняк, М. Смирнов, В. Юкин. - М. : Диалог-МИФИ, 2003. - 384 с.

2. Сжатие данных, изображений и звука / Д. Сэломон. - М. : Техносфера, 2005. - 368 с.

3. Форматы и алгоритмы сжатия изображений в действии : учеб. пособие / Дж. Миано. -М. : Триумф, 2003. - 336 с.

4. Методы сжатия изображений : учеб. пособие / А. Д. Хомоненко. - СПб. : Петербургский гос. ун-т путей сообщения, 2009. - 31 с.

5. Дистанционное зондирование. Методы и модели обработки изображений / Р. Шовен-гердт. - М. : Техносфера, 2010. - 560 с.

6. Теория информации : учеб. пособие / В. В. Лидовский. - М. : Компания «Спутник+», 2004. - 111 с.

7. Основы теории передачи информации. Ч. 1. Экономное кодирование : учеб. пособие / В. И. Шульгин. - Харьков : Национальный аэро-

космический университет (Харьковский авиационный институт), 2003. - 102 с.

8. Цифровая обработка изображений в среде Matlab / Р. Гонсалес, Р. Вудс, Р. Эддинс. - М. : Техносфера, 2006. - 616 с.

9. Введение в теорию вейвлетов : учеб. пособие / Ю. К. Демьянович, В. А. Ходаковский. -СПб. : Петербургский гос. ун-т путей сообщения, 2008. - 51 с.

10. Фракталы и вейвлеты для сжатия изображений в действии : учеб. пособие / С. Уэл-стид. - М. : Триумф, 2003. - 320 с.

11. Технология компрессии изображений больших размеров / А. И. Алтухов, Е. А. Дудин, Б. В. Титков // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. - 2009. - № 72. -С. 46-51.

ISSN 1815-588Х. Известия ПГУПС

2012/4

i Надоели баннеры? Вы всегда можете отключить рекламу.