Розенберг Игорь Наумович
ОАО «Научно-исследовательский и проектно-конструкторский институт инженеров железнодорожного транспорта» (НИИАС).
E-mail: [email protected].
109029, г. Москва, ул. Нижегородская, д. 27, стр. 1.
Тел.: 84959677701. '
Bozhenyuk Alexander Vitalievich
Scientific and Technical Center «INTECH» of «Southern Federal University».
E-mail: [email protected].
4, Oktyabrskaya Square, Taganrog, 347922, Russia.
Phone: +79885315343.
Rogushina Eugenia Michailovna
E-mail: [email protected].
Phone: +79885315343.
Rozenberg Igor Naymovich
Public Corporation “Research and Development Institute of Railway Engineers”.
E-mail: [email protected].
27/1, Nizhegorodskaya Street, Moscow, 109029, Russia.
Phone: +74959677701.
УДК 861.352
ПЛ. Кравченко, BA. Каграманянц
МЕТОД ПОВЫШЕНИЯ КОМПРЕССИИ АУДИОСИГНАЛОВ, ЗАКОДИРОВАННЫХ НА ОСНОВЕ ОПТИМИЗИРОВАННЫХ ДЕЛЬТА-ПРЕОБРАЗОВАНИЙ ВТОРОГО ПОРЯДКА
Рассматриваются актуальные вопросы повышения уровня компрессии аудиосигналов при кодировании на основе оптимизированных дельта-преобразований второго по.
существенно низкой по сравнению с широко известными кодеками вычислительной трудоемкости, характерной для алгоритмизации на основе дельта-преобразований, с одновременным обеспечением достаточных для многих практических применений уровня компрессии и качества декодированного сигнала.
Аудиосигналы; дельта-преобразования; компрессия.
P.P. Kravchenko, V.A. Kagramanyants
A METHOD OF COMPRESSION INCREASE OF AUDIO, ENCODED WITH OPTIMIZED SECOND-ORDER DELTA-TRANSFORMATIONS
This article discusses important task of increasing compression rate for signals, encoded with optimized second-order delta-transformations. The distinctive feature of method proposed in the article is essentially low computational complexity, compared to other well-known audio codecs, combined with compression rate, sufficient for various applications.
Audio signals; delta-transformations; compression.
Компрессия аудиоданных является неотъемлемой частью телекоммуникационных мультимедийных систем, систем мобильной связи, бортовых систем связи, функционирующих на основе обеспечивающих целостность передаваемых данных современных протоколов передачи данных. Такие системы функционируют в ре,
используемых алгоритмов компрессии. Быстродействие оказывает влияние на число одновременно обслуживаемых пользователей или каналов, время работы мобильного устройства от батареи, стоимость специализированных вычислительных средств обработки аудио, возможность кодирования аудио в фоновом режиме при использовании ресурсов вычислителя для других задач.
В связи с отмеченным выше, разработка новых методов и алгоритмов ком, -вающих достаточное для практического использования качество и компрессию , .
Для обработки звуковых сигналов в телефонных сетях в начальный период внедрения цифровой связи активно использовались алгоритмы на основе дельтапреобразования первого порядка. Главной отличительной особенностью этих алгоритмов являлась предельная простота реализации. Вместе с тем дельтапреобразование первого порядка характеризовалось низкой точностью и существенным ограничением скорости изменения преобразовываемого сигнала. Совершенствование точностных и динамических хаактеристик при обеспечении простоты алгоритмов многие годы было связано с разработкой дельта-преобразований второго порядка, что освещалось в многочисленных работах (Р. Стила, А.В. Шилейко, Г.Г. Меньшикова, ёе Jeager Б. и многих др.). Важной проблемой для практического использования известных алгоритмов дельта-преобразования второго порядка долгое время оставалась неустойчивость.
Дельта-преобразования второго порядка, характеризующиеся стабильностью, оптимизацией по быстродействию и точности, освещены в работе [1]. Там же рассматриваются вопросы использования этих преобразований для компрессии аудиосигналов. Данный метод, в отличие от широко используемых в настоящее вре-, -ровании и декодировании, однако уступает по степени сжатия исходного аудио.
В работе рассматриваются возможности существенного повышения степени компрессии аудиосигнала, закодированного на основе оптимизированных дельтапреобразований второго порядка с обеспечением существенно малой вычислительной трудоёмкости кодирования и декодирования.
В функционировании алгоритмов компрессии можно выделить две основных составляющие: формирование дельта-последовательности и перекодирование -.
Сущность формирования дельта-последовательности подробно рассмотрена в работе [1]. Входной оцифрованный с определенной частотой дискретизации сигнал поступает в кодер в виде последовательности отсчетов в формате линейной импульсно-кодовой модуляции, которые разделяются во временной области на
( ).
расчет веса (модуля) кванта преобразования. Условия стыковки и начальные условия соседних аудиофрагментов пересчитываются в зависимости от соотношения весов квантов преобразования и значений промежуточных частот дискретизации. После этого к звуковым отсчетам фрагмента применяется алгоритм оптимизированного дельта-преобразования второго порядка со сглаживанием [1]. Полученные компрессированные данные - дельта-последовательности (знаки квантов преобразования) - передаются на сторону декодера. В декодере на основании полученной последовательности и начальных условий выполняется декодирование значений
.
Формирование промежуточной частоты дискретизации, и как следствие, управление качеством кодирования и скоростью выходного битового потока коде-
ра возможно посредством учащения (добавления промежуточных отсчетов) фрагментов звуковых данных с использованием интерполяции или удаления отсчетов
( ).
Полный алгоритм компрессии и декомпрессии аудио на основе оптимизиро-
- -ты дискретизации и перерасчетом веса модуля кванта преобразования приведен в [1]. .
:
zi = ^ - Уі;VYi = Yi - ^
Уу*—1 = ^;л > 1;
Vzi —Ууі—і;
НО
F = Zi + 1.5Vzi• + (0.5Vzi /c - 0.125с)лі£п( Vzi ); Д+1 = - sign( F); е* > c;c > 0;
(1)
:
V2^+і = С* Л;
VYi+l =VYi +V 2^-+1,
^+1 = Yf +VYi
і+1 ’
(2)
Упрощенный алгоритм декодера соответствует алгоритму демодуляции. В выражениях (1) и (2) у1 = у(У, 1 = 0,1,2... - значения амплитуды входного сигнала на 1-м шаге преобразования, ^ = 1;0 + гМ, 1;0 - начальный момент времени преобразования, М - временной шаг дискретизации, У1 - значения аппроксимирующей функции, у0, У0 - начальные значения, г1 - ошибка преобразования, с* - постоянная положительная величина, определяющая вес модуля кванта преобразования,
Д;+1 - дельта-бит (знак кванта преобразования); VZ+1 и V2Yi+1 - первая и вторая разности соответственно.
Рассмотрим сущность свойств цепочек дельта-битов и разработки алгоритмов перекодирования цепочек с целью повышения компрессии [2, 3].
- -
, -
стью не приводит к положительному решению вопроса повышения компрессии.
В то же время оценка условной энтропии первого и более высоких порядков показали, что отдельные сочетания дельта-битов встречаются чаще других. Участки - , -- , , ( ) -сигнале. Напротив, участки, с приближенным к равномерному распределению
- , .
Данный фактор представляет несомненный интерес для решения рассматри-. -
прессии: энтропийные методы и метод перекодирования групп дельта-битов. Ана-
,
.
В данной работе рассматривается метод и алгоритмы повышения степени дополнительной компрессии путем модификации исходной дельта-последовательности (на уровне групп дельта-битов) без существенной потери качества и повышения трудоемкости. Сущность метода состоит в разбиении дельта-последовательности на цепочки дельта-битов равной длины и последующей группировки отдельных цепочек с введением специального кодирования.
Решение задачи компрессии на основе перекодирования цепочек дельтабитов исходно связано с формированием принципов выбора длин цепочек, которые могут быть закодированы одним символом. В качестве этих принципов в рамках данной работы для выбора кодируемой одним символом длины цепочки определены следующие требования (рис. 1): амплитуды аппроксимирующей функции сигнала в начале и конце цепочек, кодируемых одним символом, должны совпадать; внутри кодируемых одним символом цепочек значения амплитуды сигнала между цепочками при декодировании должны отличаться не более, чем на 2с*; с целью обеспечения максимально возможного уровня компрессии, длина цепочки должна быть максимальной (с учетом характера функции г(п)). Данным условиям удовлетворяют только цепочки, длины четыре.
Д1
Рис. 1. Траектория сигнала при декодировании цепочек
Сгруппируем цепочки по одинаковым значениям БУ, которые они дают на конце (величина БУ = Уп - У0 соответствует изменению амплитуды декодированного сигнала после декодирования цепочки). Результат можно видеть в табл. 1. Цепочкам, с одинаковым значением БУ на конце, назначен одинаковый условный "символ".
1
Перекодирование цепочек длиной 4
№ цепочек Коды цепочек БУ VYn -VYo vY у 1 корр "Символ" Вероятность
0 1111 -10 -4 -4 а 0,018
1 1110 -8 -2 -2 Ь 0,024
2 1101 -6 -2 -2 с 0,073
3, 4 1100, 1011 -4 0 и -2 -1 ё 0,110
5, 8 1010, 0111 -2 0 и -2 -1 е 0,179
6, 9 1001, 0110 0 0 0 f 0,192
7, 10 0101,1000 2 0 и 2 1 ё 0,179
11, 12 0011, 0100 4 0 и 2 1 Ъ 0,110
13 0010 6 2 2 і 0,073
14 15 0001 0000 8 10 2 4 2 4 .І к 0,024 0,018
Чтобы обеспечить равенство УУП на концах цепочек, необходимо для пар цепочек, кодируемых одним символом, принудительно назначить на конце цепочки новое "исправленное" значение УУшрр. С целью минимизации ошибки значение УУК1)рр следует выбрать равным среднему УУП для обеих входящих в пару цепочек. Указанное изменение ¥Укорр имеет место одновременно и в кодере и в декодере.
Экспериментально оцениваемые вероятности символов, с учетом объединения цепочек в символы и соответствующего сложения вероятностей по объединяемым парам, показаны в табл. 1.
Воспользовавшись известным алгоритмом Хаффмана, с учетом приведенных вероятностей, можно получить префиксный код минимальной избыточности. Дополнительная компрессия для полученного кода составит ~1,298, т.е. около 30 %. В рамках решения рассматриваемой задачи предложен альтернативный префиксный код (табл. 2), который более удобен при табличной реализации декодирования. При этом обеспечивается компрессия ~ 1,281, что сопоставимо с кодом Хаффмана. Формируемые в соответствии с данным принципом коды представле-. 2.
Таблица 2
Декодирование
Декодирование второй части кода
индекс индекс(бинарное представление) символ
0 111 00 а
1 111 01 Ь
2 111 10 j
3 111 11 к
Декодирование первой части кода
индекс индекс(бинарное представление) символ
0 000 с
1 001 й
2 010 е
3 011 f
4 100 ё
5 101 Ъ
6 110 і
Алгоритм кодирования с учетом вышесказанного имеет следующий вид:
1) закодировать очередные 4 отсчета из входного потока с использованием алгоритма оптимизированного дельта-преобразования второго порядка со сглаживанием;
2) 4- , -
вать его в качестве номера цепочки в табл. 1 и вывести в выходной поток соответствующий 3- или 5-битный код символа;
3) скорректировать первую разность сигнала УУП в соответствии с ¥Укорр ( . 1);
4) если во входном потоке еще имеются данные - перейти к п. 1, иначе конец. При декодировании алгоритм имеет следующий вид:
1) 3 3- ;
2) если прочтенное значение равно 7 ("111" в двоичной записи) - перейти к
. 4;
3) . 3, образом символ, и перейти к п. 5;
4) 2 2-
;
5) . 1, -
лученный символ и обновить состояние декодера, скорректировав первую разность сигнала УУП в соответствии с ¥Укорр (табл. 1);
6) если во входном потоке еще имеются данные - перейти к п. 1, иначе конец.
При проведении экспериментальных исследований использовались готовые реализации известных кодеков, которые написаны на языках низкого уровня и содержат хорошо оптимизированный по быстродействию код. Программы кодеков на основе предлагаемых алгоритмов написаны на языке высокого уровня и не оптимизированы по быстродействию. Приводимые оценочные результаты характеризуют сравнительный уровень компрессии в среднем; качество восстанавливаемых сигналов выполнялось на основе объективной (отношение сигнал-шум, дБ) или субъективной или обеих указанных оценок. Для тестирования использовались 30 файлов с женским голосом, 30 файлов с мужским и 15 музыкальных файлов.
Использование модифицированного алгоритма дельта-преобразования показало возможность увеличения компрессии по сравнению с базовым алгоритмом дельта-преобразования на ~30 % при незначительном снижении качества (снижение отношения сигнал-шум на ~3 %, исходные частоты дискретизации 8, 16, 44 кГц). Данный уровень повышения компрессии подтверждается теоретическим исследованием.
Проведенное сравнительное тестирование с кодеком AMR (8 кГц, 16-битные отсчеты, официальная реализация консорциума 3GPP, занимающегося стандартизацией работы сетей сотовой связи третьего поколения) показывает, что разработанные кодеки при обеспечении сопоставимого уровня компрессии (~10,5 раз) имеют несколько более низкое качество сигнала и существенный выигрыш в скоростях кодирования и декодирования (2,6^4 раза).
Проведенное сравнительное тестирование с кодеком стандарта ITU-T G.726, используемым в цифровой телефонии, показывает, что разработанные кодеки при обеспечении сопоставимого уровня компрессии (сжатие в ~4 раза при частоте дис-8 16- ), -ственный выигрыш в скоростях кодирования и декодирования (2^3 раза).
Сравнение с универсальным кодеком аудио MPEG-I Layer 3 (MP3, 44 кГц) при использовании настроек по умолчанию показало, что при обеспечении сопоставимого с MP3 уровня компрессии разработанные кодеки уступают в качестве , -ния (в 4,6^5,6 раз).
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Кравченко П.П. Оптимизированные дельта-преобразования второго порядка. Теория и применение: Монография. - М.: Радиотехника, 2010. - 288 с.
2. . . -ванных дельта-преобразований второго порядка // X Всероссийская научная конференция "Техническая кибернетика, радиоэлектроника и системы управления": Сборник материалов. - Таганрог: Изд-во ТТИ ЮФУ, 2010. - Т. 1. - С. 107-108.
3. Крав ченко ПЛ., Каграманянц В А., Хусаинов Н.Ш. Программная систе ма компрессии речевых сигналов: Свидетельство об офиц. регистрации программы для ЭВМ № 2009611765, / . ., . ., . . -№ 2008616136 от 24.12.2008. Зарегистрировано в реестре программ для ЭВМ 03.04.2009.
Статью рекомендовал к опубликованию д.т.н., профессор Л.П. Фельдман.
Кравченко Павел Павлович
Технологический институт федерального государственного автономного
образовательного учреждения высшего профессионального образования «Южный
федеральный университет» в г. Таганроге.
E-mail: [email protected].
347928, г. Таганрог, пер. Некрасовский, 44.
Тел.: 88634314945.
Каграманянц Виктор Александрович
E-mail: [email protected].
Тел.: 88634371746.
Kravchenko Pavel Pavlovich
Taganrog Institute of Technology - Federal State-Owned Educational Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: [email protected].
44, Nekrasovski, Taganrog, 347928, Russia.
Phone: +78634314945.
Kagramanyants Victor Alexandrovich
E-mail: [email protected].
Phone: +78634371746.
УДК 001.63:681.586
A.H. Катков МЕТОДИКА МОДЕЛЬНО-УПРАВЛЯЕМОГО ПРОЕКТИРОВАНИЯ ЦИФРОВЫХ ДАТЧИКОВ
Изложена методика модельно-управляемого проектирования цифровых датчиков. Модельно-управляемое проектирование представляет собой естественный подход к проектированию, обусловленный эволюционным развитием элементной базы, а также методик и инструментальных средств проектирования. Показано, что модельно-управляемое проектирование сокращает длительность разработки, повышает технические и эксплуатационные качества датчиков, позволяет оценивать возможности реализации и выбирать реализуемые варианты. Приведен пример применения методики для проектирования цифрового датчика разности давлений. Актуальность и научно-техническая новизна работы заключается в описанной методике.
; - .
A.N. Katkov DIGITAL SENSORS MODEL-BASED DESIGN TECHNIQUE
Digital sensors model-based design technique is stated. Model-based design represents the natural approach to the designing, caused by evolutionary development of element base, and also techniques and tool design tools. It is shown that model-based design reduces duration of working out, increases technical and operational qualities of gauges, allows to define possibilities of realisation and to choose realised variants. Example of technique deployment for digital differential pressure sensor design is given. Actuality and scientific-technical novelty are consists in described technique.
Digital sensor; model-based design.
Датчики физических величин представляют собой важный класс средств измерений и применяются в различных условиях эксплуатации. Исключить влияние внешних факторов на измерительные сигналы (ИС) датчиков удаётся редко, поэтому общепринятой практикой стала компенсация следствий влияния внешних воздействующих факторов (ВВФ) на ИС, иными словами, коррекция погрешностей. Широко применяются цифровые методы коррекции погрешностей, основанные на методе вспомогательных измерений [1], не зависящие от времени и позволяющие добиться высоких метрологических характеристик [2]. Применение цифровой обработки ИС в датчиках стало возможным с развитием микромощной ма-