Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений

Лужков Юрий Валерьевич

11. Тихонов В. И., Харисов В. Н. Статистический анализ и синтез радиотехнических устройств и систем. М.: Радио и связь, 1991.

12. Банди Б. Методы оптимизации: Вводный курс. М.: Радио и связь, 1988. Сергей Викторович Соколов

Павел Александрович Кучеренко —

Рекомендована кафедрой автоматики и телемеханики на ж.-д. транспорте

Сведения об авторах д-р техн. наук, профессор; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону

аспирант; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону; E-mail: [email protected]

Поступила в редакцию 21.05.08 г.

УДК 004.627

Ю. В. Лужков

МЕТОД АДАПТИВНОГО СКАЛЯРНОГО КВАНТОВАНИЯ В СХЕМАХ НЕОБРАТИМОГО СЖАТИЯ ИЗОБРАЖЕНИЙ

Рассматривается проблема адаптивной генерации матриц квантования. Для схем сжатия изображений с потерей качества, использующих спектральные преобразования, предложен способ адаптивного скалярного квантования спектральных коэффициентов на основе весового критерия и рассмотрены способы определения этого критерия.

Ключевые слова: сжатие изображений, адаптивное квантование, весовой критерий, JPEG.

Введение. В настоящее время одним из распространенных форматов сжатия изображений с потерей качества является JPEG (Joint Photographic Experts Group) [1]. Разработаны и другие схемы сжатия (см., например, работы [2, 3]), эффективность которых существенно превосходит алгоритмы на основе дискретных спектральных преобразований. Однако вследствие широкой распространенности последних перед исследователями встает следующий вопрос: возможно ли модифицировать существующую схему компрессии таким образом, чтобы повысить степень сжатия, не меняя при этом алгоритм декомпрессии? Решение этой задачи позволит вносить изменения в существующие программы-компрессоры, не заботясь о наличии у пользователей специального (модифицированного) программного обеспечения для декомпрессии изображений.

В применяемых алгоритмах сжатия используются некоторые параметры по умолчанию. Например, в формате JPEG к таким параметрам относятся матрицы квантования и таблицы Хаффмана: они сохраняются в заголовке сжатого файла, и формат допускает самостоятельное определение пользователем их значений, что является одним из путей повышения степени компрессии. Так, известны несколько подходов к составлению матриц квантования в формате JPEG (например, [4, 5]), которые, однако, не являются универсальными и требуют сравнительно большого объема вычислений.

В настоящей статье рассматривается обобщенный подход к адаптивному скалярному квантованию коэффициентов спектра, предлагаемый способ прост в реализации и может быть применен, в частности, для формата JPEG.

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 13

Адаптивное квантование сигнала. Квантование — способ обработки сигнала, сопряженный с внесением в него искажения. Суть квантования сводится к разбиению диапазона значений сигнала 2 на конечное число интервалов с последующим выбором одного значения для представления любой величины из данного интервала. При векторном квантовании — это разбиение пространства возможных значений векторной величины на конечное число областей. Наиболее полный аналитический обзор вопросов квантования приведен в работе [6]. Так, пусть заданы множество интервалов £ = {Si; / е Ъ} и множество точек

С = {у1; / е Ъ}, тогда функция квантования сигнала 2 определяется как г) = уг- для г е . При равномерном скалярном квантовании множество интервалов можно представить в виде

где А — параметр, или шаг, квантования; величина ё задает смещение интервалов относи-

Тогда операция квантования может быть сведена к простому делению с округлением:

где [•] — операция округления до ближайшего целого.

При восстановлении сигнала z привносится ошибка e : z = q(z) - e.

Методы адаптивного квантования могут быть разделены на две группы: адаптивное скалярное квантование; векторное и кодовое квантование.

Адаптивность в скалярном квантовании достигается путем индивидуального выбора параметра квантования А для каждого квантуемого значения.

Адаптивное скалярное квантование на основе весового критерия. Предлагаемый в настоящей статье подход основан на статистическом анализе коэффициентов спектра. Этот подход может быть использован в схемах сжатия (например, JPEG) при условии, что окно сканирования сигнала имеет постоянный размер.

Так, пусть дана последовательность коэффициентов спектра, разбитая на M одинаковых блоков по N значений в каждом, при этом n = 0, N -1 — номер (позиция) коэффициента в данном блоке, т.е. каждый коэффициент имеет аналог в любом другом блоке. Суть предлагаемого подхода заключается в следующем: для каждого n-го номера вычисляется значение специального весового критерия, и значение параметра квантования данного коэффициента спектра тем больше, чем меньше соответствующее ему значение весового критерия.

Таким образом, идея метода основана на том, что процедура квантования выполняется с учетом некоторой статистической информации о сигнале, заданном как z = {z0 0,..., Zn _1 m-i), полученной от M блоков для каждого порядкового номера n. Функция квантования (1) в этом случае будет обозначаться как q(z,n), а функция параметра квантования — как A(z,n).

Введем критерий T, назвав его весом спектрального коэффициента. Величина T отражает степень значимости спектральных коэффициентов zn m, имеющих одинаковый порядковый номер n, для всех M блоков, m = 0, M -1. Рассмотрим некоторые способы определения критерия T . Первый из возможных способов основан на статистике максимальных значений:

Si =[d + Ai, d + A(i +1)), i e Z,

тельно нуля, ё е [-А / 2, А /2) ; / — номер интервала, который и является кодируемым объектом.

(1)

где zm,max

1, zn,m zm ,max; cn = j | m=0 0, |zn,m ^ zm,max,

максимальный по модулю спектральный коэффициент в данном блоке.

m,max >

m,max>

Такой способ вычисления критерия пригоден в том случае, если нет выраженной концентрации энергии сигнала на определенных спектральных позициях. Однако, как показали, например, эксперименты с дискретным косинусным преобразованием (ДКП), в 99 % случаев коэффициент с номером 0 определяется как максимальный, причем для более чем 90 % номеров п значение критерия Т равно 0, что препятствует практическому использованию данного критерия в схемах сжатия на основе ДКП.

Другой способ вычисления Т является развитием предыдущего и основан на пороговом ограничении спектральных коэффициентов:

M-1

Tn = ^ cn, m=0

cn = <

> P; < p,

о < p < zm

где Р — порог ограничения.

Использование порогового ограничения позволяет решить проблему непропорционального распределения энергии сигнала, присущую первому способу. Однако основной недостаток порогового вычисления Т — необходимость определения значения Р.

Следующий алгоритм вычисления Т оперирует средними амплитудами спектра, не используя при этом порог Р:

1

M-1

Tn M ^ |Zn,m| M m=0

(2)

Достоинством данного способа является отсутствие обязательной дополнительной обработки сигнала (для определения порога P). К недостаткам можно отнести операции с числами с плавающей запятой (при использовании предыдущих способов выполняется просто увеличение счетчиков на единицу).

На рис. 1, а, б представлена зависимость T(n), вычисленная по формуле (2) для коэффициентов ДКП при M = 8 х 8 = 64: а — результаты вычислений для матрицы яркости Y изображений "Lena" и "Oldman", б — для хроматических матриц изображения "Oldman". На графиках значения T упорядочены так, чтобы значения критерия не возрастали. Как видно, динамика изменения величины T достаточно резкая, что в некоторых случаях может привести к чрезмерному квантованию малозначимых спектральных коэффициентов.

а)

Т 100

10

0,1

0,01

--изображение "Lena" — изображение "Oldman"

ill

1 I 1 41 51 61 п

1 1 1 ^ 1 1 1 1 1 1 1 1 1

б) т 10

0,1

0,01

0,001

— — Cb

■у 1 1 L 3 1 4 1 51 61 п

Рис. 1

Скорректировать ситуацию можно, выбирая в качестве значения критерия максимальные амплитуды коэффициентов:

Тп = тах 2п,т . (3)

1

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 15 Обратимся далее к определению функции А(г, ") . Пусть ее значения ограничены диапазоном [1, a2 ], 0 < о < a2. Введем линейную функцию от T :

E(T) = о! + ^ Т" (С12 -al).

Тшах Тшт

Также может использоваться нелинейная функция от Т, что достигается введением корректирующей функции /:

1 (Тшах )-1 (Т" )

E (T ) = a1 +

f ((max ) f (Tmin )

(a2 -a1)-

(4)

Поскольку любое значение критерия Tn в общем случае зависит от всех коэффициентов исходного спектрального вектора z , то функция E также зависит от z . Фактически это есть функция параметра квантования сигнала A(z, n) . Введем обозначение f (z, n) = f (Tn ). Тогда формула (4) окончательно принимает следующий вид:

f ( z> n max )-f ( z>n)

A(z, n) = A(T) = a1 +

f (zn max )-f (zn min )

(a2 - a1 )•

(5)

Таким образом, функция параметра квантования локализована в диапазоне от с1 до с2. Варьируя ее форму, можно осуществлять квантование коэффициентов спектра с данным порядковым номером с большим или меньшим шагом: см. рис. 2, а (значения Т упорядочены по возрастанию). На рисунке кривая 1 соответствует линейному преобразованию, кривая 2 — преобразованию с использованием функции 1 . Так, пусть известно, что высокочастотным коэффициентам спектра соответствуют малые значения Т. Тогда для подавления высоких частот достаточно задать функцию 1 с таким расчетом, чтобы ее энергия на начальном участке была большой.

Примеры корректирующих функций 1 приведены на рис. 2, б.

--1-sin(nx/2) - - - - — 1-sin3(nx/2)

\

* 1

С V ^^^ V

I» ^^^^

Тпах m 0 Рис. 2

0,2

0,4

0,6

0,8

Квантование с различным шагом реализовано, например, в формате JPEG. Однако значения параметра А не вычисляются адаптивно, а представлены значениями по умолчанию. Рассмотрим возможность применения предложенного подхода для адаптивной генерации матриц квантования в схеме JPEG. В формуле (5) будем использовать линейную корректирующую функцию и критерий максимальных амплитуд (3).

x

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Т

На рис. 3, а приведены графики стандартных функций параметра квантования в формате JPEG, а на рис. 3, б — графики значений А, сгенерированных адаптивным способом для изображения "Oldman". В обоих случаях значения упорядочены в соответствии с „зигзаг"-сканированием. Как видно, отличие сгенерированных значений от стандартных достаточно велико.

а)

б)

Д 120

80

40

Д 120

80

40

60 n

20

40

60 n

Рис. 3

График зависимости Т(п) для изображения "ОЫшап" представлен на рис. 4, а. На рис. 4, б показаны результаты сжатия этого изображения с применением функций квантования, данных по умолчанию (кривая 1), и функций, сгенерированных в рамках эксперимента (кривая 2). По оси абсцисс — среднее число бит на пиксел (Ь ), по оси ординат — пиковое отношение сигнала к шуму (РБКК). Анализ результатов показывает, что разница в степени сжатия составляет до 20 % в пользу адаптивного подхода при одинаковых значениях РБК^

а)

Т 1000

800 600 400 200

б)

PSNR, дБ

1 1 - Y

1 Cb, Cr

1 1 1

1 1 1 Д 1

> 1 " k - ..

100

90

80

70

r L

r + A ф

и

11 21

31 41 51 61 n

b, бит/пиксел

Рис. 4

Заключение. Предложенный способ адаптивного скалярного квантования коэффициентов спектра основан на вычислении критерия значимости коэффициентов спектра. Как показали эксперименты, применение рассмотренного подхода в схеме JPEG позволяет получить выигрыш по степени сжатия до 20 % по сравнению с использованием стандартных матриц квантования.

При практическом использовании рассмотренного метода квантования необходима модернизация только компрессора, а для просмотра изображений достаточно применения стандартного JPEG-декомпрессора, что является важным достоинством предложенного решения.

0

2

4

6

1

Система автоматического распознавания речевых команд

17

СПИСОК ЛИТЕРАТУРЫ

1. Wallace G. K. The JPEG still picture compression standard // IEEE Trans. Consumer Electronics. 1992. Vol. 38, N 1. P. 18—34.

2. Shukla R. Rate-distortion optimized tree-structured compression algorithms for piecewise polynomial images // IEEE Transact. on Image Processing. 2005. Vol. 14, N 3. P. 343—359.

3. Dalai M., Leonardi R. L-inf norm based second generation image coding // Proc. of Intern. Conf. on Image Processing. 2004. P. 3193—3196.

4. Ratnakar V., Livny M. Extending RD-OPT with global thresholding for JPEG optimization // Proc. of the Conf. on Data Compression. 1996. P. 379—386.

5. Fung H. T., Parker K. J. Design of image-adaptive quantization tables for JPEG // J. of Electronic Imaging. 1996. Vol. 4, N 2. P. 144—150.

6. GrayR. M., NeuhoffD. L. Quantization // IEEE Transact. on Information Theory. 1998. Vol. 44, N 6. P. 2325—2383.

Сведения об авторе — аспирант, Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра вычислительной техники; E-mail: [email protected]

Поступила в редакцию 24.11.08 г.

УДК 004.522

К. К. Гладышев, Е. А. Шульгин СИСТЕМА АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД

Приводится описание системы автоматического распознавания речевых команд, состоящей из нескольких уровней: оцифровки сигнала; выделения первичных признаков речевых сигналов на основе линейных спектральных корней; поиска распознаваемой команды по базе эталонов с использованием методов динамического программирования; семантической коррекции распознанной последовательности символов по орфоэпическому словарю. Разработанная система может быть использована в сфере речевых технологий.

Ключевые слова: распознавание речи, динамическое программирование, линейное предсказание.

Полноценная замкнутая система распознавания речи (СРР) состоит из множества взаимосвязанных уровней [1—4]. Общая эффективность работы такой системы непосредственно зависит от качества реализации каждого уровня. Подобное построение системы связано с физиологическими процессами, происходящими при восприятии речи человеком. На выходе слухового аппарата человека формируется набор сигналов, которые в дальнейшем обрабатываются мозгом и преобразуются в последовательности осмысленных речевых единиц.

Обобщенно можно выделить следующие уровни человеческой системы восприятия речи [5]:

— физическое восприятие колебаний звука в ухе с помощью специального органа — улитки;

— преобразование звуковых колебаний в определенную последовательность информативных сигналов и передача их через нейроны в головной мозг;

Юрий Валерьевич Лужков

Рекомендована кафедрой вычислительной техники

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лужков Юрий Валерьевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лужков Юрий Валерьевич

Method of Adaptive Scalar Quantization in Lossy Image Compression Schemes

Текст научной работы на тему «Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений»