Научная статья на тему 'Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений'

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
198
57
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЖАТИЕ ИЗОБРАЖЕНИЙ / IMAGE COMPRESSION / АДАПТИВНОЕ КВАНТОВАНИЕ / ADAPTIVE QUANTIZATION / ВЕСОВОЙ КРИТЕРИЙ / WEIGHT CRITERION / JPEG

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лужков Юрий Валерьевич

Рассматривается проблема адаптивной генерации матриц квантования. Для схем сжатия изображений с потерей качества, использующих спектральные преобразования, предложен способ адаптивного скалярного квантования спектральных коэффициентов на основе весового критерия и рассмотрены способы определения этого критерия.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of Adaptive Scalar Quantization in Lossy Image Compression Schemes

The problem of adaptive generation of quantization matrixes for lossy compression schemes, using spectral transformations is considered. The way of adaptive scalar quantization of spectral coefficients on the basis of weight criterion is offered, ways of calculation of this criterion are considered.

Текст научной работы на тему «Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений»

11. Тихонов В. И., Харисов В. Н. Статистический анализ и синтез радиотехнических устройств и систем. М.: Радио и связь, 1991.

12. Банди Б. Методы оптимизации: Вводный курс. М.: Радио и связь, 1988. Сергей Викторович Соколов

Павел Александрович Кучеренко —

Рекомендована кафедрой автоматики и телемеханики на ж.-д. транспорте

Сведения об авторах д-р техн. наук, профессор; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону

аспирант; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону; E-mail: [email protected]

Поступила в редакцию 21.05.08 г.

УДК 004.627

Ю. В. Лужков

МЕТОД АДАПТИВНОГО СКАЛЯРНОГО КВАНТОВАНИЯ В СХЕМАХ НЕОБРАТИМОГО СЖАТИЯ ИЗОБРАЖЕНИЙ

Рассматривается проблема адаптивной генерации матриц квантования. Для схем сжатия изображений с потерей качества, использующих спектральные преобразования, предложен способ адаптивного скалярного квантования спектральных коэффициентов на основе весового критерия и рассмотрены способы определения этого критерия.

Ключевые слова: сжатие изображений, адаптивное квантование, весовой критерий, JPEG.

Введение. В настоящее время одним из распространенных форматов сжатия изображений с потерей качества является JPEG (Joint Photographic Experts Group) [1]. Разработаны и другие схемы сжатия (см., например, работы [2, 3]), эффективность которых существенно превосходит алгоритмы на основе дискретных спектральных преобразований. Однако вследствие широкой распространенности последних перед исследователями встает следующий вопрос: возможно ли модифицировать существующую схему компрессии таким образом, чтобы повысить степень сжатия, не меняя при этом алгоритм декомпрессии? Решение этой задачи позволит вносить изменения в существующие программы-компрессоры, не заботясь о наличии у пользователей специального (модифицированного) программного обеспечения для декомпрессии изображений.

В применяемых алгоритмах сжатия используются некоторые параметры по умолчанию. Например, в формате JPEG к таким параметрам относятся матрицы квантования и таблицы Хаффмана: они сохраняются в заголовке сжатого файла, и формат допускает самостоятельное определение пользователем их значений, что является одним из путей повышения степени компрессии. Так, известны несколько подходов к составлению матриц квантования в формате JPEG (например, [4, 5]), которые, однако, не являются универсальными и требуют сравнительно большого объема вычислений.

В настоящей статье рассматривается обобщенный подход к адаптивному скалярному квантованию коэффициентов спектра, предлагаемый способ прост в реализации и может быть применен, в частности, для формата JPEG.

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 13

Адаптивное квантование сигнала. Квантование — способ обработки сигнала, сопряженный с внесением в него искажения. Суть квантования сводится к разбиению диапазона значений сигнала 2 на конечное число интервалов с последующим выбором одного значения для представления любой величины из данного интервала. При векторном квантовании — это разбиение пространства возможных значений векторной величины на конечное число областей. Наиболее полный аналитический обзор вопросов квантования приведен в работе [6]. Так, пусть заданы множество интервалов £ = {Si; / е Ъ} и множество точек

С = {у1; / е Ъ}, тогда функция квантования сигнала 2 определяется как г) = уг- для г е . При равномерном скалярном квантовании множество интервалов можно представить в виде

где А — параметр, или шаг, квантования; величина ё задает смещение интервалов относи-

Тогда операция квантования может быть сведена к простому делению с округлением:

где [•] — операция округления до ближайшего целого.

При восстановлении сигнала z привносится ошибка e : z = q(z) - e.

Методы адаптивного квантования могут быть разделены на две группы: адаптивное скалярное квантование; векторное и кодовое квантование.

Адаптивность в скалярном квантовании достигается путем индивидуального выбора параметра квантования А для каждого квантуемого значения.

Адаптивное скалярное квантование на основе весового критерия. Предлагаемый в настоящей статье подход основан на статистическом анализе коэффициентов спектра. Этот подход может быть использован в схемах сжатия (например, JPEG) при условии, что окно сканирования сигнала имеет постоянный размер.

Так, пусть дана последовательность коэффициентов спектра, разбитая на M одинаковых блоков по N значений в каждом, при этом n = 0, N -1 — номер (позиция) коэффициента в данном блоке, т.е. каждый коэффициент имеет аналог в любом другом блоке. Суть предлагаемого подхода заключается в следующем: для каждого n-го номера вычисляется значение специального весового критерия, и значение параметра квантования данного коэффициента спектра тем больше, чем меньше соответствующее ему значение весового критерия.

Таким образом, идея метода основана на том, что процедура квантования выполняется с учетом некоторой статистической информации о сигнале, заданном как z = {z0 0,..., Zn _1 m-i), полученной от M блоков для каждого порядкового номера n. Функция квантования (1) в этом случае будет обозначаться как q(z,n), а функция параметра квантования — как A(z,n).

Введем критерий T, назвав его весом спектрального коэффициента. Величина T отражает степень значимости спектральных коэффициентов zn m, имеющих одинаковый порядковый номер n, для всех M блоков, m = 0, M -1. Рассмотрим некоторые способы определения критерия T . Первый из возможных способов основан на статистике максимальных значений:

Si =[d + Ai, d + A(i +1)), i e Z,

тельно нуля, ё е [-А / 2, А /2) ; / — номер интервала, который и является кодируемым объектом.

(1)

где zm,max

1, zn,m zm ,max; cn = j | m=0 0, |zn,m ^ zm,max,

максимальный по модулю спектральный коэффициент в данном блоке.

m,max >

m,max>

Такой способ вычисления критерия пригоден в том случае, если нет выраженной концентрации энергии сигнала на определенных спектральных позициях. Однако, как показали, например, эксперименты с дискретным косинусным преобразованием (ДКП), в 99 % случаев коэффициент с номером 0 определяется как максимальный, причем для более чем 90 % номеров п значение критерия Т равно 0, что препятствует практическому использованию данного критерия в схемах сжатия на основе ДКП.

Другой способ вычисления Т является развитием предыдущего и основан на пороговом ограничении спектральных коэффициентов:

M-1

Tn = ^ cn, m=0

cn = <

> P; < p,

о < p < zm

где Р — порог ограничения.

Использование порогового ограничения позволяет решить проблему непропорционального распределения энергии сигнала, присущую первому способу. Однако основной недостаток порогового вычисления Т — необходимость определения значения Р.

Следующий алгоритм вычисления Т оперирует средними амплитудами спектра, не используя при этом порог Р:

1

M-1

Tn M ^ |Zn,m| M m=0

(2)

Достоинством данного способа является отсутствие обязательной дополнительной обработки сигнала (для определения порога P). К недостаткам можно отнести операции с числами с плавающей запятой (при использовании предыдущих способов выполняется просто увеличение счетчиков на единицу).

На рис. 1, а, б представлена зависимость T(n), вычисленная по формуле (2) для коэффициентов ДКП при M = 8 х 8 = 64: а — результаты вычислений для матрицы яркости Y изображений "Lena" и "Oldman", б — для хроматических матриц изображения "Oldman". На графиках значения T упорядочены так, чтобы значения критерия не возрастали. Как видно, динамика изменения величины T достаточно резкая, что в некоторых случаях может привести к чрезмерному квантованию малозначимых спектральных коэффициентов.

а)

Т 100

10

0,1

0,01

--изображение "Lena" — изображение "Oldman"

ill

1 I 1 41 51 61 п

1 1 1 ^ 1 1 1 1 1 1 1 1 1

б) т 10

0,1

0,01

0,001

— — Cb

■у 1 1 L 3 1 4 1 51 61 п

Рис. 1

Скорректировать ситуацию можно, выбирая в качестве значения критерия максимальные амплитуды коэффициентов:

Тп = тах 2п,т . (3)

1

1

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 15 Обратимся далее к определению функции А(г, ") . Пусть ее значения ограничены диапазоном [1, a2 ], 0 < о < a2. Введем линейную функцию от T :

E(T) = о! + ^ Т" (С12 -al).

Тшах Тшт

Также может использоваться нелинейная функция от Т, что достигается введением корректирующей функции /:

1 (Тшах )-1 (Т" )

E (T ) = a1 +

f ((max ) f (Tmin )

(a2 -a1)-

(4)

Поскольку любое значение критерия Tn в общем случае зависит от всех коэффициентов исходного спектрального вектора z , то функция E также зависит от z . Фактически это есть функция параметра квантования сигнала A(z, n) . Введем обозначение f (z, n) = f (Tn ). Тогда формула (4) окончательно принимает следующий вид:

f ( z> n max )-f ( z>n)

A(z, n) = A(T) = a1 +

f (zn max )-f (zn min )

(a2 - a1 )•

(5)

Таким образом, функция параметра квантования локализована в диапазоне от с1 до с2. Варьируя ее форму, можно осуществлять квантование коэффициентов спектра с данным порядковым номером с большим или меньшим шагом: см. рис. 2, а (значения Т упорядочены по возрастанию). На рисунке кривая 1 соответствует линейному преобразованию, кривая 2 — преобразованию с использованием функции 1 . Так, пусть известно, что высокочастотным коэффициентам спектра соответствуют малые значения Т. Тогда для подавления высоких частот достаточно задать функцию 1 с таким расчетом, чтобы ее энергия на начальном участке была большой.

Примеры корректирующих функций 1 приведены на рис. 2, б.

--1-sin(nx/2) - - - - — 1-sin3(nx/2)

\

* 1

С V ^^^ V

I» ^^^^

Тпах m 0 Рис. 2

0,2

0,4

0,6

0,8

Квантование с различным шагом реализовано, например, в формате JPEG. Однако значения параметра А не вычисляются адаптивно, а представлены значениями по умолчанию. Рассмотрим возможность применения предложенного подхода для адаптивной генерации матриц квантования в схеме JPEG. В формуле (5) будем использовать линейную корректирующую функцию и критерий максимальных амплитуд (3).

x

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Т

На рис. 3, а приведены графики стандартных функций параметра квантования в формате JPEG, а на рис. 3, б — графики значений А, сгенерированных адаптивным способом для изображения "Oldman". В обоих случаях значения упорядочены в соответствии с „зигзаг"-сканированием. Как видно, отличие сгенерированных значений от стандартных достаточно велико.

а)

б)

Д 120

80

40

Д 120

80

40

60 n

20

40

60 n

Рис. 3

График зависимости Т(п) для изображения "ОЫшап" представлен на рис. 4, а. На рис. 4, б показаны результаты сжатия этого изображения с применением функций квантования, данных по умолчанию (кривая 1), и функций, сгенерированных в рамках эксперимента (кривая 2). По оси абсцисс — среднее число бит на пиксел (Ь ), по оси ординат — пиковое отношение сигнала к шуму (РБКК). Анализ результатов показывает, что разница в степени сжатия составляет до 20 % в пользу адаптивного подхода при одинаковых значениях РБК^

а)

Т 1000

800 600 400 200

б)

PSNR, дБ

1 1 - Y

1 Cb, Cr

1 1 1

1 1 1 Д 1

> 1 " k - ..

100

90

80

70

r L

r + A ф

и

11 21

31 41 51 61 n

b, бит/пиксел

Рис. 4

Заключение. Предложенный способ адаптивного скалярного квантования коэффициентов спектра основан на вычислении критерия значимости коэффициентов спектра. Как показали эксперименты, применение рассмотренного подхода в схеме JPEG позволяет получить выигрыш по степени сжатия до 20 % по сравнению с использованием стандартных матриц квантования.

При практическом использовании рассмотренного метода квантования необходима модернизация только компрессора, а для просмотра изображений достаточно применения стандартного JPEG-декомпрессора, что является важным достоинством предложенного решения.

0

0

0

0

2

4

6

1

Система автоматического распознавания речевых команд

17

СПИСОК ЛИТЕРАТУРЫ

1. Wallace G. K. The JPEG still picture compression standard // IEEE Trans. Consumer Electronics. 1992. Vol. 38, N 1. P. 18—34.

2. Shukla R. Rate-distortion optimized tree-structured compression algorithms for piecewise polynomial images // IEEE Transact. on Image Processing. 2005. Vol. 14, N 3. P. 343—359.

3. Dalai M., Leonardi R. L-inf norm based second generation image coding // Proc. of Intern. Conf. on Image Processing. 2004. P. 3193—3196.

4. Ratnakar V., Livny M. Extending RD-OPT with global thresholding for JPEG optimization // Proc. of the Conf. on Data Compression. 1996. P. 379—386.

5. Fung H. T., Parker K. J. Design of image-adaptive quantization tables for JPEG // J. of Electronic Imaging. 1996. Vol. 4, N 2. P. 144—150.

6. GrayR. M., NeuhoffD. L. Quantization // IEEE Transact. on Information Theory. 1998. Vol. 44, N 6. P. 2325—2383.

Сведения об авторе — аспирант, Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра вычислительной техники; E-mail: [email protected]

Поступила в редакцию 24.11.08 г.

УДК 004.522

К. К. Гладышев, Е. А. Шульгин СИСТЕМА АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД

Приводится описание системы автоматического распознавания речевых команд, состоящей из нескольких уровней: оцифровки сигнала; выделения первичных признаков речевых сигналов на основе линейных спектральных корней; поиска распознаваемой команды по базе эталонов с использованием методов динамического программирования; семантической коррекции распознанной последовательности символов по орфоэпическому словарю. Разработанная система может быть использована в сфере речевых технологий.

Ключевые слова: распознавание речи, динамическое программирование, линейное предсказание.

Полноценная замкнутая система распознавания речи (СРР) состоит из множества взаимосвязанных уровней [1—4]. Общая эффективность работы такой системы непосредственно зависит от качества реализации каждого уровня. Подобное построение системы связано с физиологическими процессами, происходящими при восприятии речи человеком. На выходе слухового аппарата человека формируется набор сигналов, которые в дальнейшем обрабатываются мозгом и преобразуются в последовательности осмысленных речевых единиц.

Обобщенно можно выделить следующие уровни человеческой системы восприятия речи [5]:

— физическое восприятие колебаний звука в ухе с помощью специального органа — улитки;

— преобразование звуковых колебаний в определенную последовательность информативных сигналов и передача их через нейроны в головной мозг;

Юрий Валерьевич Лужков

Рекомендована кафедрой вычислительной техники

i Надоели баннеры? Вы всегда можете отключить рекламу.