11. Тихонов В. И., Харисов В. Н. Статистический анализ и синтез радиотехнических устройств и систем. М.: Радио и связь, 1991.
12. Банди Б. Методы оптимизации: Вводный курс. М.: Радио и связь, 1988. Сергей Викторович Соколов
Павел Александрович Кучеренко —
Рекомендована кафедрой автоматики и телемеханики на ж.-д. транспорте
Сведения об авторах д-р техн. наук, профессор; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону
аспирант; Ростовский государственный университет путей сообщения, кафедра автоматики и телемеханики на ж.-д. транспорте, Ростов-на-Дону; E-mail: [email protected]
Поступила в редакцию 21.05.08 г.
УДК 004.627
Ю. В. Лужков
МЕТОД АДАПТИВНОГО СКАЛЯРНОГО КВАНТОВАНИЯ В СХЕМАХ НЕОБРАТИМОГО СЖАТИЯ ИЗОБРАЖЕНИЙ
Рассматривается проблема адаптивной генерации матриц квантования. Для схем сжатия изображений с потерей качества, использующих спектральные преобразования, предложен способ адаптивного скалярного квантования спектральных коэффициентов на основе весового критерия и рассмотрены способы определения этого критерия.
Ключевые слова: сжатие изображений, адаптивное квантование, весовой критерий, JPEG.
Введение. В настоящее время одним из распространенных форматов сжатия изображений с потерей качества является JPEG (Joint Photographic Experts Group) [1]. Разработаны и другие схемы сжатия (см., например, работы [2, 3]), эффективность которых существенно превосходит алгоритмы на основе дискретных спектральных преобразований. Однако вследствие широкой распространенности последних перед исследователями встает следующий вопрос: возможно ли модифицировать существующую схему компрессии таким образом, чтобы повысить степень сжатия, не меняя при этом алгоритм декомпрессии? Решение этой задачи позволит вносить изменения в существующие программы-компрессоры, не заботясь о наличии у пользователей специального (модифицированного) программного обеспечения для декомпрессии изображений.
В применяемых алгоритмах сжатия используются некоторые параметры по умолчанию. Например, в формате JPEG к таким параметрам относятся матрицы квантования и таблицы Хаффмана: они сохраняются в заголовке сжатого файла, и формат допускает самостоятельное определение пользователем их значений, что является одним из путей повышения степени компрессии. Так, известны несколько подходов к составлению матриц квантования в формате JPEG (например, [4, 5]), которые, однако, не являются универсальными и требуют сравнительно большого объема вычислений.
В настоящей статье рассматривается обобщенный подход к адаптивному скалярному квантованию коэффициентов спектра, предлагаемый способ прост в реализации и может быть применен, в частности, для формата JPEG.
Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 13
Адаптивное квантование сигнала. Квантование — способ обработки сигнала, сопряженный с внесением в него искажения. Суть квантования сводится к разбиению диапазона значений сигнала 2 на конечное число интервалов с последующим выбором одного значения для представления любой величины из данного интервала. При векторном квантовании — это разбиение пространства возможных значений векторной величины на конечное число областей. Наиболее полный аналитический обзор вопросов квантования приведен в работе [6]. Так, пусть заданы множество интервалов £ = {Si; / е Ъ} и множество точек
С = {у1; / е Ъ}, тогда функция квантования сигнала 2 определяется как г) = уг- для г е . При равномерном скалярном квантовании множество интервалов можно представить в виде
где А — параметр, или шаг, квантования; величина ё задает смещение интервалов относи-
Тогда операция квантования может быть сведена к простому делению с округлением:
где [•] — операция округления до ближайшего целого.
При восстановлении сигнала z привносится ошибка e : z = q(z) - e.
Методы адаптивного квантования могут быть разделены на две группы: адаптивное скалярное квантование; векторное и кодовое квантование.
Адаптивность в скалярном квантовании достигается путем индивидуального выбора параметра квантования А для каждого квантуемого значения.
Адаптивное скалярное квантование на основе весового критерия. Предлагаемый в настоящей статье подход основан на статистическом анализе коэффициентов спектра. Этот подход может быть использован в схемах сжатия (например, JPEG) при условии, что окно сканирования сигнала имеет постоянный размер.
Так, пусть дана последовательность коэффициентов спектра, разбитая на M одинаковых блоков по N значений в каждом, при этом n = 0, N -1 — номер (позиция) коэффициента в данном блоке, т.е. каждый коэффициент имеет аналог в любом другом блоке. Суть предлагаемого подхода заключается в следующем: для каждого n-го номера вычисляется значение специального весового критерия, и значение параметра квантования данного коэффициента спектра тем больше, чем меньше соответствующее ему значение весового критерия.
Таким образом, идея метода основана на том, что процедура квантования выполняется с учетом некоторой статистической информации о сигнале, заданном как z = {z0 0,..., Zn _1 m-i), полученной от M блоков для каждого порядкового номера n. Функция квантования (1) в этом случае будет обозначаться как q(z,n), а функция параметра квантования — как A(z,n).
Введем критерий T, назвав его весом спектрального коэффициента. Величина T отражает степень значимости спектральных коэффициентов zn m, имеющих одинаковый порядковый номер n, для всех M блоков, m = 0, M -1. Рассмотрим некоторые способы определения критерия T . Первый из возможных способов основан на статистике максимальных значений:
Si =[d + Ai, d + A(i +1)), i e Z,
тельно нуля, ё е [-А / 2, А /2) ; / — номер интервала, который и является кодируемым объектом.
(1)
где zm,max
1, zn,m zm ,max; cn = j | m=0 0, |zn,m ^ zm,max,
максимальный по модулю спектральный коэффициент в данном блоке.
m,max >
m,max>
Такой способ вычисления критерия пригоден в том случае, если нет выраженной концентрации энергии сигнала на определенных спектральных позициях. Однако, как показали, например, эксперименты с дискретным косинусным преобразованием (ДКП), в 99 % случаев коэффициент с номером 0 определяется как максимальный, причем для более чем 90 % номеров п значение критерия Т равно 0, что препятствует практическому использованию данного критерия в схемах сжатия на основе ДКП.
Другой способ вычисления Т является развитием предыдущего и основан на пороговом ограничении спектральных коэффициентов:
M-1
Tn = ^ cn, m=0
cn = <
> P; < p,
о < p < zm
где Р — порог ограничения.
Использование порогового ограничения позволяет решить проблему непропорционального распределения энергии сигнала, присущую первому способу. Однако основной недостаток порогового вычисления Т — необходимость определения значения Р.
Следующий алгоритм вычисления Т оперирует средними амплитудами спектра, не используя при этом порог Р:
1
M-1
Tn M ^ |Zn,m| M m=0
(2)
Достоинством данного способа является отсутствие обязательной дополнительной обработки сигнала (для определения порога P). К недостаткам можно отнести операции с числами с плавающей запятой (при использовании предыдущих способов выполняется просто увеличение счетчиков на единицу).
На рис. 1, а, б представлена зависимость T(n), вычисленная по формуле (2) для коэффициентов ДКП при M = 8 х 8 = 64: а — результаты вычислений для матрицы яркости Y изображений "Lena" и "Oldman", б — для хроматических матриц изображения "Oldman". На графиках значения T упорядочены так, чтобы значения критерия не возрастали. Как видно, динамика изменения величины T достаточно резкая, что в некоторых случаях может привести к чрезмерному квантованию малозначимых спектральных коэффициентов.
а)
Т 100
10
0,1
0,01
--изображение "Lena" — изображение "Oldman"
ill
1 I 1 41 51 61 п
1 1 1 ^ 1 1 1 1 1 1 1 1 1
б) т 10
0,1
0,01
0,001
— — Cb
■у 1 1 L 3 1 4 1 51 61 п
Рис. 1
Скорректировать ситуацию можно, выбирая в качестве значения критерия максимальные амплитуды коэффициентов:
Тп = тах 2п,т . (3)
1
1
Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 15 Обратимся далее к определению функции А(г, ") . Пусть ее значения ограничены диапазоном [1, a2 ], 0 < о < a2. Введем линейную функцию от T :
E(T) = о! + ^ Т" (С12 -al).
Тшах Тшт
Также может использоваться нелинейная функция от Т, что достигается введением корректирующей функции /:
1 (Тшах )-1 (Т" )
E (T ) = a1 +
f ((max ) f (Tmin )
(a2 -a1)-
(4)
Поскольку любое значение критерия Tn в общем случае зависит от всех коэффициентов исходного спектрального вектора z , то функция E также зависит от z . Фактически это есть функция параметра квантования сигнала A(z, n) . Введем обозначение f (z, n) = f (Tn ). Тогда формула (4) окончательно принимает следующий вид:
f ( z> n max )-f ( z>n)
A(z, n) = A(T) = a1 +
f (zn max )-f (zn min )
(a2 - a1 )•
(5)
Таким образом, функция параметра квантования локализована в диапазоне от с1 до с2. Варьируя ее форму, можно осуществлять квантование коэффициентов спектра с данным порядковым номером с большим или меньшим шагом: см. рис. 2, а (значения Т упорядочены по возрастанию). На рисунке кривая 1 соответствует линейному преобразованию, кривая 2 — преобразованию с использованием функции 1 . Так, пусть известно, что высокочастотным коэффициентам спектра соответствуют малые значения Т. Тогда для подавления высоких частот достаточно задать функцию 1 с таким расчетом, чтобы ее энергия на начальном участке была большой.
Примеры корректирующих функций 1 приведены на рис. 2, б.
--1-sin(nx/2) - - - - — 1-sin3(nx/2)
\
* 1
С V ^^^ V
I» ^^^^
Тпах m 0 Рис. 2
0,2
0,4
0,6
0,8
Квантование с различным шагом реализовано, например, в формате JPEG. Однако значения параметра А не вычисляются адаптивно, а представлены значениями по умолчанию. Рассмотрим возможность применения предложенного подхода для адаптивной генерации матриц квантования в схеме JPEG. В формуле (5) будем использовать линейную корректирующую функцию и критерий максимальных амплитуд (3).
x
Т
На рис. 3, а приведены графики стандартных функций параметра квантования в формате JPEG, а на рис. 3, б — графики значений А, сгенерированных адаптивным способом для изображения "Oldman". В обоих случаях значения упорядочены в соответствии с „зигзаг"-сканированием. Как видно, отличие сгенерированных значений от стандартных достаточно велико.
а)
б)
Д 120
80
40
Д 120
80
40
60 n
20
40
60 n
Рис. 3
График зависимости Т(п) для изображения "ОЫшап" представлен на рис. 4, а. На рис. 4, б показаны результаты сжатия этого изображения с применением функций квантования, данных по умолчанию (кривая 1), и функций, сгенерированных в рамках эксперимента (кривая 2). По оси абсцисс — среднее число бит на пиксел (Ь ), по оси ординат — пиковое отношение сигнала к шуму (РБКК). Анализ результатов показывает, что разница в степени сжатия составляет до 20 % в пользу адаптивного подхода при одинаковых значениях РБК^
а)
Т 1000
800 600 400 200
б)
PSNR, дБ
1 1 - Y
1 Cb, Cr
1 1 1
1 1 1 Д 1
> 1 " k - ..
100
90
80
70
r L
r + A ф
и
11 21
31 41 51 61 n
b, бит/пиксел
Рис. 4
Заключение. Предложенный способ адаптивного скалярного квантования коэффициентов спектра основан на вычислении критерия значимости коэффициентов спектра. Как показали эксперименты, применение рассмотренного подхода в схеме JPEG позволяет получить выигрыш по степени сжатия до 20 % по сравнению с использованием стандартных матриц квантования.
При практическом использовании рассмотренного метода квантования необходима модернизация только компрессора, а для просмотра изображений достаточно применения стандартного JPEG-декомпрессора, что является важным достоинством предложенного решения.
0
0
0
0
2
4
6
1
Система автоматического распознавания речевых команд
17
СПИСОК ЛИТЕРАТУРЫ
1. Wallace G. K. The JPEG still picture compression standard // IEEE Trans. Consumer Electronics. 1992. Vol. 38, N 1. P. 18—34.
2. Shukla R. Rate-distortion optimized tree-structured compression algorithms for piecewise polynomial images // IEEE Transact. on Image Processing. 2005. Vol. 14, N 3. P. 343—359.
3. Dalai M., Leonardi R. L-inf norm based second generation image coding // Proc. of Intern. Conf. on Image Processing. 2004. P. 3193—3196.
4. Ratnakar V., Livny M. Extending RD-OPT with global thresholding for JPEG optimization // Proc. of the Conf. on Data Compression. 1996. P. 379—386.
5. Fung H. T., Parker K. J. Design of image-adaptive quantization tables for JPEG // J. of Electronic Imaging. 1996. Vol. 4, N 2. P. 144—150.
6. GrayR. M., NeuhoffD. L. Quantization // IEEE Transact. on Information Theory. 1998. Vol. 44, N 6. P. 2325—2383.
Сведения об авторе — аспирант, Санкт-Петербургский государственный университет информационных технологий, механики и оптики, кафедра вычислительной техники; E-mail: [email protected]
Поступила в редакцию 24.11.08 г.
УДК 004.522
К. К. Гладышев, Е. А. Шульгин СИСТЕМА АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД
Приводится описание системы автоматического распознавания речевых команд, состоящей из нескольких уровней: оцифровки сигнала; выделения первичных признаков речевых сигналов на основе линейных спектральных корней; поиска распознаваемой команды по базе эталонов с использованием методов динамического программирования; семантической коррекции распознанной последовательности символов по орфоэпическому словарю. Разработанная система может быть использована в сфере речевых технологий.
Ключевые слова: распознавание речи, динамическое программирование, линейное предсказание.
Полноценная замкнутая система распознавания речи (СРР) состоит из множества взаимосвязанных уровней [1—4]. Общая эффективность работы такой системы непосредственно зависит от качества реализации каждого уровня. Подобное построение системы связано с физиологическими процессами, происходящими при восприятии речи человеком. На выходе слухового аппарата человека формируется набор сигналов, которые в дальнейшем обрабатываются мозгом и преобразуются в последовательности осмысленных речевых единиц.
Обобщенно можно выделить следующие уровни человеческой системы восприятия речи [5]:
— физическое восприятие колебаний звука в ухе с помощью специального органа — улитки;
— преобразование звуковых колебаний в определенную последовательность информативных сигналов и передача их через нейроны в головной мозг;
Юрий Валерьевич Лужков
Рекомендована кафедрой вычислительной техники