УДК 681.3.069
П.П. Кравченко, В.А. Каграманянц ОПТИМИЗИРОВАННЫЕ ДЕЛЬТА-ПРЕОБРАЗОВАНИЯ ВТОРОГО ПОРЯДКА И КОМПРЕССИЯ АУДИОСИГНАЛОВ
Рассматривается метод компрессии аудиосигналов, основанный на оптимизированных дельта-преобразованиях второго порядка со сглаживанием и предлагается метод повышения компрессии, не приводящий к существенному снижению качества декодированного сигнала и повышению вычислительной трудоемкости алгоритма.
Компрессия; аудио; дельта-преобразование.
P.P. Kravchenko, V.A. Kagramanyants OPTIMIZED SECOND-ORDER DELTA-TRANSFORMATIONS AND AUDIO COMPRESSION
This paper discusses a method of audio compression, based on optimized second-order del-ta-transformations and proposes an approach of increasing compression ratio without significant decrease of decoded audio quality or increase of computational complexity.
Compression; audio; delta-modulation.
С развитием телекоммуникационных технологий все большее внимание уделяется разработке методов эффективной компрессии аудио- и видеоданных в реальном времени. Особую актуальность эта задача представляет для многоканальных систем. Известно множество методов кодирования аудиосигналов, отличающихся качественными характеристиками, вычислительной трудоемкостью, уровнем компрессии и т.д. Среди методов, отличающихся малой вычислительной трудоемкостью, особый интерес представляет основанный на дельта-преобразованиях второго порядка. Суть данного метода состоит в следующем [1].
Входной оцифрованный поток аудиоданных поступает в кодер в виде набора отсчетов импульсно-кодовой модуляции, разделенных во временной области на фрагменты (окна). В кодере производится расчет веса кванта преобразования и выбирается промежуточная частота дискретизации. Условия стыковки и начальные условия соседних аудио-фрагментов пересчитываются в зависимости от соотношения весов квантов цифрового преобразования и значений промежуточных частот дискретизации. Затем к отсчетам применяется алгоритм оптимизированного дельта-преобразования второго порядка со сглаживанием, который может быть представлен в следующем виде:
z = у, - yt;
VY = Y - Y •
i i i-1 *
Vy*,-! = ; n > 1;
n }>
Vz* =VYt -Vy*^;
Ai+1 = -sign(zi + 1.5Vzi*+(0.5Vzi*2/c - 0.125c)si'gn(Vzi*));
c > c; c > 0;
где yi = y(tj), i = 0,1,2... - значения амплитуды входного сигнала, Yi - значения аппроксимирующей функции, zi - ошибка преобразования, c* - постоянная величина, определяющая вес модуля кванта преобразования.
Известия ЮФУ. Технические науки
Тематический выпуск
Выбор веса кванта преобразования производится для каждого окна отдельно. Для определения веса модуля кванта преобразования с* можно воспользоваться следующими соотношениями [1]:
Е ^2 у ;
п, ср п, ср
Е
* п, ср
с =—; п к
к = 0,2 + 0,3,
где V2у - среднее значение V2 у на фрагменте п, а е - среднее значение мак-
n, ср п, ср
симального уровня наихудших воздействий на этом фрагменте.
Выбранное значение веса кванта оказывает влияние на проявление шума квантования и на характер перегрузок по крутизне. Ошибка, связанная с перегрузкой по крутизне, коррелирована с исходным сигналом и имеет составляющие, идентичные по частоте и близкие по фазе основным компонентам входного сигнала [2,3], что ослабляет влияние перегрузки по крутизне на качество кодирования. Шум квантования практически не коррелирован с исходным сигналом и, следовательно, намного более заметен для слушателя, чем шум перегрузки по крутизне при эквивалентном уровне мощности [3,4].
На принимающей стороне полученные компрессированные данные, представляющие собой дельта-последовательность - последовательность знаков квантов цифрового преобразования (дельта-бит), передаются в декодер, который выполняет восстановление значений отсчетов аудио-фрагмента следующим образом:
V 2у+ = с*Л т;
VI',+ 1 ^ + V %+{;
У =У+VY ■
1 ,+1 1 , “ У 1 ,+1 ’
где У. и VI. - значения аппроксимирующей функции и ее приращения на предыдущем шаге, V 2У - вторая разность на текущем шаге, у и VI те-
, +1 , +1 , +1
кущие значения аппроксимирующей функции и ее приращения.
Описанный выше метод обладает низкой вычислительной трудоемкостью в сравнении с другими методами компрессии аудио, что особенно характерно для декодирования (2 базовых операции сложения). В то же время, к недостаткам можно отнести сравнительно более низкую степень компрессии, уступающую многим известным методам. Поэтому актуальной является задача исследования возможности повышения результирующей степени компрессии метода на основе дельта-преобразований второго порядка.
В данной работе предлагается метод повышения степени компрессии без существенного снижения качества декодированного сигнала и повышения вычислительной трудоемкости алгоритма.
Исходная дельта-последовательность рассматривается как последовательность отрезков длиной 4 бита. Экспериментальные исследования показывают, что распределение вероятностей появления этих отрезков примерно одинаково для подавляющего большинства различных дельта-последовательностей. Тем не менее, разброс значений вероятности появления различных 4-битных отрезков невелик, что не позволяет эффективно воспользоваться энтропийными методами кодирования данных.
С целью повышения степени компрессии предлагается следующий метод модификации исходной последовательности, не приводящий к заметному снижению качества выходного аудиосигнала.
Поскольку длина отрезка равна 4 битам, то существует 16 возможных типов таких отрезков. Среди этих 16 отрезков встречаются такие пары отрезков, которые дают при декодировании идентичные значения первой производной сигнала и значения амплитуды сигнала, отличающиеся не более чем на вес модуля кванта преобразования с* при условии совпадения начальных условий. В этом случае появляется возможность кодировать такие отрезки одним символом, что приводит к сокращению общего числа отрезков-символов с 16 до 11. При этом исходный алгоритм оптимизированного дельта-преобразования второго порядка со сглаживанием без каких-либо модификаций автоматически обрабатывает указанное выше отклонение амплитуды сигнала. Благодаря этому, рассматриваемый метод модификации дельта-последовательности приводит к незначительному ухудшению качества декодированного аудиосигнала.
Полученный сокращенный алфавит из 11 символов с учетом распределения их вероятностей затем кодируется с применением специального метода статистического кодирования. Вводимое усложнение алгоритма позволяет сохранить вычислительную трудоемкость на достаточно низком уровне.
Проведенные эксперименты показывают, что предложенный метод модификации дельта-последовательности позволяет обеспечить дополнительное повышение степени компрессии на 20-25% при снижении отношения сигнал/шум около 1 дБ.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Кравченко П.П. Основы теории оптимизированных дельта-преобразований второго порядка. Цифровое управление, сжатие и параллельная обработка информации: Монография. - Таганрог: Изд-во ТТИ ЮФУ, 2008. - 194 с.
2. Венедиктов М.Д., Женевский Ю.П., Марков В.В., Эйдус Г.С. Дельта-модуляция. Теория и применение. - М.: Связь, 1976. - 224 с.
3. Стил Р. Принципы дельта-модуляции / Под ред. В.В. Маркова. - М.: Связь, 1979. - 368 с.
4. Феер К. Беспроводная цифровая связь. - М.: Радио и связь, 2000 - 520 с.
Кравченко Павел Павлович
Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.
E-mail: kravch@tsure.ru.
347928, .Таганрог, пер. Некрасовский, 44.
Тел.: 88634314945.
Каграманянц Виктор Александрович
E-mail: vict@mopevm.tsure.ru.
Тел.: 88634371746.
Kravchenko Pavel Pavlovich
Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: kravch@tsure.ru.
44, Nekrasovski, Taganrog, 347928, Russia.
Phone: +78634314945.
Victor Alexandrovich Kagramanyants
E-mail: vict@mopevm.tsure.ru.
Phone: +78634371746.