Адаптивные первичные кодеки речевых сигналов на основе теоремы В .А. Котельникова и представления Хургина-Яковлева
Дмитриев В.Т., кандидат технических наук, доцент, и.о. заведующего кафедрой радиоуправления и связи РГРТУ
Проанализированы алгоритмы адаптации первичных кодеков к различным мешающим факторам. Рассмотрены алгоритмы адаптации первичных кодеков к акустическим шумам, а также адаптации сочетаний первичного и помехоустойчивого программно-конфигурируемых кодеков при действии помех в канале связи с целью обеспечения оптимального соотношения качества восстановленной речи при минимальной скорости передачи на основе теоремы В.А. Котельникова и представления Хургина-Яковлева.
Проведен анализ первичных кодеков, обеспечивающих наилучшее качество восстановленной речи на выходе кодера при действии различных видов акустических шумов. Показано, что применение представления Хургина-Яковлева обеспечивает дополнительный выигрыш качества восстановленного речевого сигнала на 0,1-0,5 балла, согласно ГОСТ Р 50840-95 при раздельном кодировании отсчетов сигнала и первой производной, более простую реализацию синтезирующих фильтров, а также возможности параллельной обработки. Применение данного алгоритма позволяет увеличить качество восстановленной речи на 1-1,5 балла согласно ГОСТ Р 50840-95 при действии акустических шумов по сравнению с аналогичными неадаптивными кодеками на основе теоремы В.А. Котельникова или возможность снижения требуемой скорости передачи на 15-30% для программно-конфигурируемых радиосистем приема, передачи и обработки информации.
• речевые сигналы • первичный кодек • программно-конфигурируемые системы
• адаптация кодека • прием и передача информации • обработка сигналов • акустические шумы • помехи • канал связи.
Введение
В радиосистемах приема, передачи и обработки информации необходимо обоснование выбора первичных кодеков речевых сигналов (РС), обладающих возможностью более гибкой перестройки скорости передаваемой информации как с целью
19
20
сохранения качества восстановленной речи на приеме при действии акустических шумов (АШ) различной природы и интенсивности, так и с целью поддержания постоянной скорости при необходимости изменения параметров помехоустойчивого кодека при действии помех различной интенсивности в канале связи.
В последнее время распространение адаптивных кодеков РС обусловлено повсеместным переходом на системы с коммутацией пакетов, которые не требуют применения первичных кодеков с постоянной скоростью передачи, как в системах с коммутацией каналов. Это обуславливает распространение кодеков речи, которые имеют набор скоростей передачи и обладают возможностью их адаптивной перестройки. К таким кодекам можно отнести кодеки ДМР, обеспечивающего возможность перестройки скорости от 4,7 до 12,2 кбит/с, кодек стандарта Э722.2 при скоростях от 1,2 до 2,4 кбит/с, кодек стандарта Э729.1 при скоростях от 8 до 32 кбит/с и многие другие стандарты и алгоритмы первичного кодирования РС [1-4].
Наиболее широкое распространение данные стандарты адаптивных кодеков с переменной скоростью получили в системах сотовой связи как наиболее динамично развивающейся области телекоммуникационных технологий [5, 6].
Для более гибкой адаптации кодеков РС для систем приема, передачи и обработки информации возможно использование алгоритма Хургина-Яков-лева, рассматривающее представление сигнала в виде отсчетов сигнала и его производных [7, 8]. Применение данного представления позволит повысить помехоустойчивость передаваемых отсчетов и качество восстановленной речи на приеме, обеспечит возможность параллельной обработки, а также более простую реализацию синтезирующих фильтров.
В [8] показано, что при использовании данного представления можно более гибко изменять скорость передачи в системах передачи РС за счет раздельного кодирования прореженных отсчетов сигнала и производной.
Целью данной статьи является исследование первичных кодеков речевых сигналов на основе теоремы В.А. Котельникова и представления Хургина-Яковлева с целью разработки алгоритмов адаптации к акустическим шумам и искажениям в канале связи.
Методы адаптации кодеков речевых сигналов с переменной скоростью
Возможны несколько основных методов построения адаптивных кодеков РС с переменной скоростью передачи информации. Наиболее простой из них — за счет использования алгоритма УДй [3], действие которой основано на выявлении и исключении пауз в разговоре. Применение данного алгоритма позволяет сократить скорость передачи до 30%. При этом в течение времени разговора передаётся различное количество бит, и для выравнивания скорости передачи необходима задержка нескольких кадров.
В другом методе [6] также возможна адаптация алгоритма кодирования РС к особенностям речи отдельных дикторов. Это выполняется за счет настройки предсказателей под особенности индивидуального голоса или за счет обучения искусственных нейронных сетей на одном конкретном голосе пользователя передающего устройства. Недостатком данного метода является необходимость хранения в памяти приемника и передатчика наборов параметров, необходимых для кодирования и декодирования: в виде коэффициентов предсказания или кепстральных коэффициентов [6].
Другой алгоритм адаптации связан с возможностями увеличения качества речи на выходе первичного кодека при воздействии АШ [9]. Эти шумы в значительной мере ухудшают восприятие полезного РС на выходе кодека, которые в значительной степени зависят от используемого алгоритма первичного кодирования. При этом изменение интенсивности, громкости или вида АШ приводит к резким изменениям качества восстановленного РС. Для улучшения качества речи на выходе таких систем используются адаптивные методы очистки от АШ при определении параметров шума в паузах речи. При этом искажения в значительной степени зависят от используемого алгоритма первичного кодирования [5, 6].
Следующим решением данной проблемы является адаптация первичного кодека к АШ, которая осуществляется не только за счет изменения параметров первичного кодирования, но и за счет смены алгоритма помехоустойчивого кодирования [9].
Использование кодека РС адаптивного к действию АШ в общераспространенных и широко используемых сетях передачи данных создает довольно широкий круг потребителей. В этот круг входят как коммерческие организации, использующие корпоративные сети для обмена информацией, требованием к которым может быть коммерческая тайна, так и рядовые граждане, желающие повысить качество информации, передаваемой по радиосетям программно-конфигурируемых радиосистем приема, передачи и обработки информации.
При воздействии помех в канале связи возможна совместная адаптация алгоритмов первичного и помехоустойчивого кодирования. Совместная адаптация двух данных кодеров обеспечит не только выбор оптимального соотношения скорость/ качество, необходимого для пользователей данных сетей, но и возможности улучшения качества речи в данных системах при действии различного рода помех за счет подбора наилучших сочетаний кодеков. Адаптация параметров первичного и помехоустойчивого кодера к помехам и искажениям в канале связи обеспечивает повышение помехоустойчивости передаваемого по каналу связи речевого трафика при незначительных изменениях скорости передачи, а также сохранение приемлемого качества восстановленной речи в случае действия АШ и помех в программно-конфигурируемых радиосистемах приема, передачи и обработки информации.
Также особенно важно найти оптимальное сочетание между алгоритмом первичного и помехоустойчивого кодирования при перегрузках, возникающих в сетях связи, чтобы снизить нагрузку на канал связи и исключить потери пакетов при незначительном снижении качества речи на выходе системы связи. С этой целью необходимо использовать алгоритмы первичного кодирования РС, обеспечивающие минимальное снижение качества речи на выходе декодера при значительном снижении скорости в помехоустойчивых алгоритмах передачи РС.
21
Алгоритм адаптации кодеков речевых сигналов к акустическим шумам
Предложен алгоритм кодирования РС, адаптивный к действию АШ, который заключается в объединении уже имеющихся и реализованных блоков основных кодеков РС. Структурная схема алгоритма приведена на рисунке 1.
Рис. 1. Структурная схема адаптации первичного кодека к АШ
Данный алгоритм с помощью обнаружителя пауз, построенного на основе детектора голосовой активности УДй, определяет паузы в РС, в котором выделяются продолжительные паузы, длительность которых превышает два сегмента анализа и более — то есть более 32 мс, в которых с помощью алгоритмов анализа в спектральной и временной области происходит определение вида АШ.
В спектральной области с помощью системы полосовых фильтров происходит оценка широкополосного и узкополосного АШ, а во временной области с помощью порогового устройства происходит выявление импульсного шума. В обнаружителе пауз происходит выделение паузы в РС, в рамках которой происходит определение вида АШ по ранее разработанному алгоритму. Также происходит вычисление среднего уровня мощности сигнала и помехи, с помощью которых происходит оценка отношения сигнал-шум.
Как показано в результате экспериментальных исследований [10], очистку РС от АШ целесообразно использовать при отношениях сигнал-шум не более 25 дБ. При более высоких отношениях сигнал-шум применение процедуры очистки нецелесообразно, так как в интервале 25-30 дБ это не приводит к существенным выигрышам восстановленного РС, а при отношениях сигнал-шум выше 30 дБ происходит ухудшение качества из-за неточности определения пауз в РС, а также ошибках при построениях модели шумов в смеси РС и АШ.
22
В программно-конфигурируемом первичном кодеке происходит выбор параметров алгоритмов первичного кодирования РС, а также выбор самого алгоритма кодирования, который обеспечивает наибольшее качество
речи на выходе в заданном диапазоне скоростей передачи. На приемную сторону при этом предварительно сообщается о номере выбираемого кодека или набора параметров кодека. Показано [10], что предложенные кодеки имеют в своем составе общие блоки, которые можно объединить в адаптивном кодеке. При необходимости в таком кодеке возможна программная реализация любых известных кодеков РС.
Для выбора первичного алгоритма кодирования в программно-конфигурируемых радиосистемах приема, передачи и обработки информации, а также разработки соответствующих рекомендаций проведены исследования известных кодеков РС при действии различных видов естественных и синтезированных АШ [11, 12]: широкополосных (фен, чайник, музыка, синтезированный шум), узкополосных (стиральная машина, самолет, двигатель и синтезированный узкополосный шум) и импульсных (поезд и синтезированный импульсный шум с различной интенсивностью).
Для оценки качества речи и узнаваемости голоса диктора использовались тестовые фразы, приведенные в ГОСТ Р 50840-95 [11]. В результате эксперимента построены зависимости [12], отражающие оценку качества восстановленной речи для каждого кодека при влиянии различных видов АШ. В ходе экспериментальных исследований проведена оценка качества РС на выходе различных групп кодеков: низкоскоростных (1-2,4 кбит/с), среднескоростных (4,8-8 кбит/с) и высокоскоростных (16-64 кбит/с). Результаты экспериментальных исследований алгоритмов первичного кодирования для программно-конфигурируемых радиосистем приема, передачи и обработки информации приведены в таблицах 1-3.
Таблица 1
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии различных видов АШ для низкоскоростных кодеков
Вид АШ Кодек наиболее устойчивый к АШ
Узкополосный 1_ВРАМР 2.4 кбит/с, 1_ВРАМР 2 кбит/с, ММВЕ 2.4 кбит/с.
Широкополосный 1_ВРАМР 2.4 кбит/с, 1_ВРАМР 2 кбит/с.
Импульсный 1_ВРАМР 1.2 кбит/с, 1_ВРАМР 1 кбит/с.
Таблица 2
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии различных видов АШ для среднескоростных кодеков
Вид АШ Кодек наиболее устойчивый к АШ
Узкополосный Э 729а 8 кбит/с, 1СЕ1_Р 8 кбит/с, Э 723.1 6.3 кбит/с, !СЕ1_Р 6 кбит/с.
Широкополосный Э 729а 8 кбит/с, !СЕ1_Р 8 кбит/с.
Импульсный Э 729а 8 кбит/с.
23
ifcluiln......fe^
liP^^ Г
Дмитриев В.Т.
Адаптивные первичные кодеки речевых сигналов на основе теоремы В.А. Котельникова
и представления Хургина-Яковлева
Таблица 3
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии различных видов АШ для высокоскоростных
кодеков
Вид АШ Кодек наиболее устойчивый к АШ
Узкополосный 1.Э 7281 16 кбит/с, 2.Э 726 32 кбит/с, 3.Э 726 40 кбит/с
Широкополосный 1.Э 7281 16 кбит/с, 2.Э 726 32 кбит/с, 3.Э 726 40 кбит/с.
Импульсный 1. Э 726 24 кбит/с, 2. Э 726 40 кбит/с.
24
Использование данных алгоритмов при действии различных АШ повышает качество восстановленной речи на приемной стороне на 0,3-1 балл, согласно ГОСТ Р 50840-95 [11], при незначительном увеличении скорости по сравнению с известными алгоритмами кодирования речи в программно-конфигурируемых радиосистемах приема, передачи и обработки информации.
Адаптация первичных кодеков речевых сигналов к помехам в канале связи
Другим возможным методом адаптации систем передачи РС для программно-конфигурируемых радиосистем приема, передачи и обработки информации является совместная адаптация программно-конфигурируемых первичных и помехоустойчивых кодеков к помехам в канале связи. Адаптация возможна за счет выбора сочетаний первичного и помехоустойчивых кодеков, обеспечивающих заданную канальную скорость и качество восстановленной речи на приемной стороне при действии определенных помех в канале связи.
Задача выбора такого сочетания впервые обоснована как оптимизационная задача выбора первичного и канального кодирования в [13, 14]. Во многом решение данной задачи определяется исходя из требуемой канальной скорости системы. Возможные варианты решения данной проблемы при высоких скоростях передачи проанализированы в работе [15].
Показано, что различные виды помех в канале связи различно влияют на распределение ошибок и, соответственно, требуют применения соответствующих видов помехоустойчивого кодирования [14]. При этом применение помехоустойчивого кода с максимальной исправляющей способностью требует введения чрезмерной избыточности и не исключает полностью появления ошибок в РС.
Для выбора первичного алгоритма кодирования в сетях связи нового поколения, а также разработки соответствующих рекомендаций проведены исследования известных кодеков РС при действии помех и искажений
в канале. В качестве модели искажений принята известная в литературе модель, когда биты передаваемой информации искажаются с вероятностью рош по случайному закону. В ходе экспериментальных исследований проведена оценка качества РС на выходе различных групп кодеков: низкоскоростных (1-2,4 кбит/с), средне-скоростных (4,8-8 кбит/с) и высокоскоростных (16-64 кбит/с). Выбраны отдельные кодеки, обеспечивающие лучшее качество восстановленной речи на выходе кодека для кодеков своей группы. Результаты экспериментальных исследований алгоритмов первичного кодирования для программно-конфигурируемых радиосистем приема, передачи и обработки информации приведены в таблицах 4-6.
Таблица 4
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии помех в канале связи для низкоскоростных кодеков
Рош,% Кодек, наиболее устойчивый к помехам
0 1_ВРАМР 1 кбит/с,
1 1. 1_ВРАМР 1 кбит/с,
2. ММВЕ 1,2 кбит/с.
2 1. ММВЕ 1.2 кбит/с,
2. 1_ВРАМР 1 кбит/с.
3 1. ММВЕ 2.4 кбит/с,
5 1. ММВЕ 2.4 кбит/с.
Таблица 5
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии помех в канале связи для среднескоростных кодеков
Рош,% Кодек, наиболее устойчивый к помехам
0 1СЕ1_Р 6 кбит/с.
1 Э.729а 8 кбит/с.
2 Э.729а 8 кбит/с.
3 Э.729а 8 кбит/с.
5 Э.729а 8 кбит/с.
Таблица 6
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии помех в канале связи для высокоскоростных кодеков
Рош,% Кодек, наиболее устойчивый к помехам
0 Э.726 40 кбит/с.
1 Э.726 24 кбит/с.
2 Э.726 24 кбит/с.
3 Э.726 24 кбит/с.
5 Э.726 24 кбит/с.
25
Проведено исследование первичных кодеков при действии равномерно распределённых ошибок, действующих на битовый поток на выходе. Показано, что наиболее устойчивые к действию ошибок в канале связи являются для высокоскоростных кодеков кодеки на основе ИКМ и АИКМ, а для сред-нескоростных — кодеки на основе алгоритма СЕ1_Р. Низкосортные кодеки в равной степени подвержены значительному воздействию ошибок в канале связи и требуют применения помехоустойчивого кодирования с достаточной избыточностью для устранения ошибок в канале связи.
Кроме того, в случае загрузки в радиосети необходимо применение алгоритмов адаптации для снижения скорости передачи с целью снижения потерь пакетов. При этом необходим переход с первичных кодеков, обеспечивающих среднюю скорость передачи РС на алгоритмы низкоскоростного кодирования РС при незначительной потере качества восстановленного сигнала. Поэтому в таких системах необходимо применять для адаптации низкоскоростные кодеки, обеспечивающие высокое качество восстановленной речи на выходе системы.
На рисунке 2 представлена структурная схема предложенного алгоритма совместной адаптации первичного кодека РС и помехоустойчивого кодека к АШ и помехам в канале связи для программно-конфигурируемых радиосистем приема, передачи и обработки информации.
26
Рис. 2. Структурная схема совместной адаптации программно-конфигурируемых первичного к АШ и помехоустойчивого кодека к искажениям в канале связи
Данная схема обеспечивает возможность обеспечения хорошего качества восстановленной речи на выходе декодера при воздействии АШ и помех в канале связи при изменении их параметров в течение времени передачи за счет перестройки параметров кодера и самого алгоритма первичного кодирования.
На основании данных о виде АШ и отношения сигнал-шум на входе системы происходит настройка алгоритмов и параметров первичного и помехоустойчивого кодека при передаче по описанному выше алгоритму.
В данном случае итоговая канальная скорость Ск полученного сочетания кодов зависит от исправляющей способности помехоустойчивого кода, определяемой параметрами п и к, стойкости первичного кода к ошибкам Рк, скорости на выходе первичного кодека Сп, а также качества восстановленной речи на выходе первичного декодера К:
Ск=йп, к, Рк, Сп, К). (1)
Сведения о выбранном наборе параметров программно-конфигурируемых первичного и помехоустойчивого кодов можно передавать по отдельному обратному каналу на передающую сторону. На приемной стороне происходит оценка помеховой обстановки в канале связи за счет обнаруженных и исправленных ошибок в помехоустойчивом декодере. Если исправляющая способность установленного помехоустойчивого кода оказывается недостаточной, то на передающую сторону по обратному каналу передается специальный сигнал, который поступает в блок настройки параметров первичного и помехоустойчивого кодов.
После адаптивного помехоустойчивого декодера в адаптивном первичном декодере происходит восстановление переданного РС. На выходе декодера происходит оценка качества восстановленной речи на приемной стороне по объективным алгоритмам оценки качества речи [16, 17].
В результате проведенных исследований показано, что наиболее целесообразно использовать комплексный алгоритм оценки качества восстановленной речи, с учетом известных на приемной стороне искажений, определяемых видом АШ и видом используемого первичного кодека, а также учитывать модифицированный критерий на основе функции спектральной динамики [17]:
где М — число сегментов РС, 72 ^п,1,т) — показатель РОБй для 1-ой критической полосы спектра сегмента т длины Ыэед, В1 — коэффициент «значимости» спектральных составляющих 1-ой критической полосы, X ^пД,т) и У ^пД,т) — 1-ая критическая полоса спектра сегмента т с длиной Ыэед чистого и зашумленного РС.
Применение алгоритма Хургина-Яковлева при адаптации кодеков речевых сигналов
Для увеличения качества восстановленного РС в первичных кодеках предложено использовать алгоритма Хургина-Яковлева, который обеспечивает представление РС в виде прореженных отсчетов сигнала и производной, что дает возможность параллельной обработки и передачи в сетях связи.
27
Дмитриев В.Т.
Адаптивные первичные кодеки речевых сигналов на основе теоремы В.А. Котельникова
и представления Хургина-Яковлева
28
Алгоритм Хургина-Яковлева [7] позволяет обеспечить представление РС с верхней граничной частотой Б и финитным спектром в виде совокупности отсчетов сигнала и его N-1 первых производных, взятых с частотой дискретизации Fд в виде:
Fa = 2F/N = fk/N,
(3)
где fk = 2F — частота дискретизации, которая определяется в соответствии с теоремой В. А. Котельникова.
В общем виде алгоритм Хургина-Яковлева допускает разложение исходного сигнала ^) с верхней частотой Б в виде [8]:
N-1 «з
(4)
¿-О П- -50
где sinc(a)=sin(a)/a, п=а(:-№Д)/МД, ^к)(№Д) — к-я производная сигнала, ДD <1/2F — величина интервала между моментами отсчетов, определенных по теореме В.А. Котельникова. Способ обработки сигнала подразумевает передачу как отсчетов функции f(NnDD), так и ее первых N-1 производных DD),..., f(N-1)(NnDD),
которые на приемном конце поступают на соответствующие синтезирующие фильтры с импульсными переходными функциями: епДО = (I - №1Д/' вше"О(ШпД) / ЛТД) - Это дает возможность параллельной обработки отсчетов сигнала и его N-1 производных, что значительно снижает вычислительные затраты.
Рассмотрим особенности представления исходного сигнала в виде отсчетов сигнала и его производной при N=2. Такое представление дает возможность восстановить функцию с финитным спектром, спектр которой сосредоточен внутри интервала (-пp/ДD; pp/ДD), через отсчеты этой функции и ее первой производной, следующих через равные интервалы 2ДD [7]. На приемном конце сигнал восстанавливается по формулам:
При этом количество информации о функции, получаемое в единицу времени, остается равным количеству данных, определяемых теоремой В.А. Котельникова, так как информация заключается в отсчетах сигнала и производной.
Структурная схема алгоритма обработки РС на основе данного представления при N=2 показана на рисунке 3, с учетом передачи отсчетов
сигнала и первой производной, где Д — дифференциатор, Ц — дециматор, Код — кодер, Декод — декодер, КС — канал связи, 1 — интерполятор, Ф1 и Ф2-синтези-рующие фильтры сигнала и его производной в алгоритме Хургина-Яковлева. Как следует из приведенной структурной схемы, первоначально происходит дискретизация исходного сигнала с частотой дискретизации, определенной в соответствии с теоремой В.А. Котельникова, {к.
Рис. 3. Структурная схема алгоритма обработки и передачи сигналов на основе алгоритма Хургина-Яковлева при N=2
Затем дискретизированный сигнал поступает на дифференциатор, где происходит получение отсчетов производной. Как было показано [8] в результате проведенных исследований, наибольшую точность в данном алгоритме обеспечивает алгоритм получения производной в частотной области:
Далее полученные дискретные отсчеты сигнала и производной поступают в дециматор, где происходит отброс каждого второго отсчета. Затем отсчеты сигнала и производной поступают на программно-конфигурируемые первичные кодеры и далее в канал радиосвязи. При этом отсчеты сигнала и производной могут передаваться как по двум независимым каналам, так и по одному последовательно.
Искаженные в канале связи кодированные отсчеты сигнала и производной поступают в двухканальный приемник. После декодирования в программно-конфигурируемых декодерах отсчеты сигнала и производной попадают на интерполяторы, где происходит вставка между соседними отсчетами входного сигнала нулевых отсчетов. Затем отсчеты сигнала и производной поступают на синтезирующие фильтры (Ф1 и Ф2) и далее на сумматор, на выходе которого получаются отсчеты восстановленного сигнала. Применение данного представления в программно-конфигурируемых радиосистемах обеспечивает возможности передачи и кодирования нескольких независимых потоков прореженных отсчетов сигнала и производных, каждый из которых обладает собственными статистическими характеристиками [18].
В результате проведенных исследований показано [8], что применение алгоритма Хур-гина-Яковлева увеличивает помехоустойчивость при восстановлении РС на 1,3 дБ, по сравнению с теоремой В.А. Котельникова, а также обеспечивает более простую реализацию синтезирующих фильтров. При этом обеспечивается выигрыш по СКО при порядке фильтров с конечной импульсной характеристикой Р=10-190
29
г
для стационарного случайного процесса с равномерным спектром п = 33-90%, а для РС п = 10-65% [8].
Предложены алгоритмы первичного кодирования отсчетов сигнала и производной на основе алгоритма Хургина-Яковлева в кодеках на основе адаптивной дифференциальной импульсно-кодовой модуляции [18], обеспечивающие увеличение качества восстановленного РС на 0,5-0,7 балла согласно ГОСТ Р 50840-95 относительно аналогичных алгоритмов на основе теоремы В.А. Котельникова.
На рисунке 4 показаны зависимости выигрыша в отношении сигнал-шум квантования Дq на выходе систем кодирования на основе алгоритма Хургина-Яковлева по сравнению с известными и теоремы В.А. Котельникова от скорости передачи для следующих первичных кодеков, реализованных на основе алгоритма Хургина-Яковлева: 1 кривая — ИКМ без компандера, 2 кривая — ИКМ с ц-компандером, 3 кривая — блочная адаптивная ИКМ, 4 кривая — АДИКМ с фиксированным предсказателем.
ДР.ДБ 4
3
2 4
Г
1 /
8 16 24 32 40 48 56 С, кбит/С
30
Рис. 4. Выигрыш в отношении сигнал-шум квантования от скорости передачи первичного кодека для систем передачи на основе алгоритма
Хургина-Яковлева
По результатам исследований, описанных в [18-20], определены первичные кодеки, обеспечивающие наилучшее качество восстановленного РС для каждого вида АШ: широкополосного, узкополосного и импульсного. Если два кодека из групп низкоскоростных, среднескоростных и высокоскоростных при данном отношении сигнал-шум обеспечивают одинаковое качество, выбирался кодек с наименьшей скоростью передачи. Результаты исследований первичных кодеков на основе алгоритма Хургина-Яковлева для современных систем связи показаны в таблицах 7-9.
Таким образом, показано, что применение алгоритма Хургина-Яковлева в структуре адаптивного кодека, показанной на рисунке 2, может увеличить качество восстановленной речи на 1-1,5 балла, согласно ГОСТ Р 50840-95, при действии АШ по сравнению с аналогичными неадаптивными кодеками на основе теоремы В.А. Котельникова.
Таблица 7
Алгоритмы первичного кодирования РС на основе алгоритма Хургина-Яковлева, обеспечивающие наибольшее качество речи в случае действия различных видов АШ при разных ОСШ для высокоскоростных кодеков
Отношение сигнал/ шум для АШ -10 0 10 20 30
Широкополосный G726 40 кбит/с G726 40 кбит/с G726 40 кбит/с G726 40 кбит/с G726 40 кбит/с
Узкополосный G728i 8 кбит/с G728i 8 кбит/с G726 24 кбит/с G726 40 кбит/с G726 40 кбит/с
Импульсный G726 40 кбит/с G726 24 кбит/с G726 40 кбит/с G726 40 кбит/с G726 40 кбит/с
Таблица 8
Алгоритмы первичного кодирования РС на основе алгоритма Хургина-Яковлева, обеспечивающие наибольшее качество речи в случае действия различных видов АШ при разных ОСШ для среднескоростных кодеков
Отношение сигнал/ шум для АШ -10 0 10 20 30
Широкополосный G729a8 кбит/с ICELP, 8 кбит/с ICELP, 8 кбит/с G723.1 6,3 кбит/с G723.1 6,3 кбит/с
Узкополосный ICELP, 8 кбит/с G723.1 6,3 кбит/с G723.1 6,3 кбит/с G723.1 6,3 кбит/с G729a8 кбит/с
Импульсный G729a8 кбит/с G723.1 5,3 кбит/с G723.1 6,3 кбит/с G723.1 6,3 кбит/с G723.16,3 кбит/с
Таблица 9
Алгоритмы первичного кодирования РС на основе Алгоритма Хургина-Яковлева, обеспечивающие наибольшее качество речи в случае действия различных видов АШ при разных ОСШ для низкоскоростных кодеков
Отношение сигнал/ шум для АШ -10 0 10 20 30
Широкополосный LBR AMR, 2,4 кбит/с MMBE, 1,2 кбит/с LBR AMR, 2,4 кбит/с LBR AMR, 2,4 кбит/с LBR AMR, 2,4 кбит/с
Узкополосный LBR AMR, 1 кбит/с LBR AMR, 1,2 кбит/с MMBE, 2,4 кбит/с MMBE, 2,4 кбит/с MMBE, 2,4 кбит/с
Импульсный LBR AMR, 1,2 кбит/с LBR AMR, 1 кбит/с MMBE, 2,4 кбит/с MMBE, 2,4 кбит/с MMBE, 2,4 кбит/с
Также возможно применение кодеков на основе алгоритма Хургина-Яковлева при адаптации к ошибкам в канале связи по схеме, представленной на рисунке 2, для программно-конфигурируемых радиосистем приема, передачи и обработки информации. В ходе экспериментальных исследований проведена оценка качества РС на выходе различных групп кодеков на основе представления Хургина-Яковлева:
31
низкоскоростных (1-2,4 кбит/с), среднескоростных (4,8-8 кбит/с) и высокоскоростных (16-64 кбит/с). Выбраны отдельные кодеки, обеспечивающие лучшее качество восстановленной речи на выходе кодека для кодеков своей группы. Результаты экспериментальных исследований алгоритмов первичного кодирования на основе представления Хурги-на-Яковлева для программно-конфигурируемых радиосистем приема, передачи и обработки информации приведены в таблицах 10-12.
Таблица 10
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии помех для низкоскоростных кодеков на основе представления Хургина-Яковлева
Рош,% Кодек, наиболее устойчивый к помехам
0 1_ВРАМР 1 кбит/с.
1 1_ВРАМР 1 кбит/с,
1_ВРАМР 2.4 кбит/с,
ММВЕ 2.4 кбит/с.
2 1_ВРАМР 2.4 кбит/с,
ММВЕ 1.2 кбит/с,
ММВЕ 2.4 кбит/с.
3 ММВЕ 2.4 кбит/с.
5 ММВЕ 1.2 кбит/с.
ММВЕ 2.4 кбит/с.
Таблица 11
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии помех для среднескоростных кодеков на основе представления Хургина-Яковлева
Рош,% Кодек, наиболее устойчивый к помехам
0 1СЕ1_Р 6 кбит/с.
1 Э.729а 8 кбит/с.
2 Э.729а 8 кбит/с.
3 Э.729а 8 кбит/с.
5 Э.729а 8 кбит/с.
32
В [18] показано, что применение алгоритма Хургина-Яковлева относительно известных кодеков, построенных на основе теоремы В.А. Котельникова, обеспечивает выигрыш в качестве восстановленной речи на 0,10,5 балла согласно ГОСТ Р 50840-95 за счет раздельного кодирования отсчетов сигнала и его первой производной и частичной компенсации шумов квантования при восстановлении сигнала в декодере.
Таблица 12
Алгоритмы первичного кодирования РС, обеспечивающие наибольшее качество речи при действии помех для высокоскоростных кодеков на основе представления Хургина-Яковлева
Рош,% Кодек, наиболее устойчивый к помехам
0 Э.726 40 кбит/с,
Э.726 24 кбит/с.
1 Э.726 24 кбит/с,
Э.726 40 кбит/с.
2 Э.726 24 кбит/с.
3 Э.726 24 кбит/с.
5 Э.726 24 кбит/с.
В [20] показано, что снижение качества речи при уменьшении разрядности квантования производной гораздо меньше, чем при аналогичном снижении разрядности прореженного сигнала. Кодек прореженной производной может обеспечивать скорость передачи на 30% меньше по сравнению с кодеком прореженного РС. Таким образом, результирующая скорость суммарного потока для кодека на основе алгоритма Хургина-Яковлева уменьшается на 15%.
Таким образом, применение предложенного алгоритма адаптации в программно-конфигурируемых радиосистемах приема, передачи и обработки информации совместно с алгоритмом Хургина-Яковлева позволит повысить исправляющую способность применяемого помехоустойчивого кодирования без существенного уменьшения качества восстановленного РС при действии помех.
Заключение
Проанализированы алгоритмы адаптации методов первичного кодирования к АШ, а также адаптации при действии помех в канале связи с целью обеспечения оптимального соотношения качества восстановленной речи при минимально возможной скорости передачи в программно-конфигурируемых радиосистемах приема, передачи и обработки информации.
Приведены алгоритмы первичного кодирования РС на основе теоремы В.А. Котельникова, обеспечивающие наибольшее качество речи при действии различных видов АШ, для низкоскоростных, среднескоростных и высокоскоростных кодеков. Показано, что применение данного алгоритма адаптации при действии различных АШ в системах передачи РС может повысить качество восстановленного РС на приемной стороне от 0,3 до 1 балла, согласно ГОСТ Р 50840-95 при незначительном увеличении скорости по сравнению с известными системами передачи РС.
Показано, что применение алгоритма Хургина-Яковлева обеспечивает дополнительный выигрыш качества восстановленного РС на 0,1-0,5 балла, согласно ГОСТ Р 50840-95 при раздельном кодировании отсчетов сигнала и первой производной, а также более простую реализацию синтезирующих фильтров и возможности параллельной обработки.
33
34
Показано, что алгоритмы первичного кодирования РС на основе алгоритма Хургина-Яковлева обеспечивают наибольшее качество речи при действии различных видов АШ для низкоскоростных, среднескоростных и высокоскоростных кодеков.
Применение алгоритма Хургина-Яковлева в структуре адаптивного кодека может увеличить качество восстановленной речи на 1-1,5 балла согласно ГОСТ Р 50840-95 при действии АШ по сравнению с аналогичными неадаптивными кодеками на основе теоремы В.А. Котельникова или возможность снижения скорости передачи на 15-30% для программно-конфигурируемых радиосистем приема, передачи и обработки информации.
Кроме того, показано, что применение предложенного алгоритма адаптации для программно-конфигурируемых радиосистем приема, передачи и обработки информации совместно с алгоритмом Хургина-Яковлева, позволит повысить исправляющую способность применяемого помехоустойчивого кодирования без существенного уменьшения качества восстановленного РС при действии помех в программно-конфигурируемых радиосистемах приема, передачи и обработки информации.
Поддержка исследований. Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 20-07-00783.
Литература
1. ITU-T Recommendation G.722. 7 kHz audio-coding within 64 kbit/s, 1988.
2. ITU-T Recommendation G.729. C source code and test vectors for implementation verification of the G.729 8 kbit/s CS-ACELP speech coder. - Geneva, 1996.
3. ITU-T Recommendation G.729 Annex A. Reduced complexity 8 kbit/s CS-ACELP speech codec, 1996.
4. Jean-Marc Valin Speex: A Free Codec For Free Speech. [Электронный ресурс]. URL: https://arxiv.org/pdf/1602.08668.pdf.
5. Басов О.О., Рыболовлев А.А. Анализ степени адаптации современного парка кодеков речи. // Цифровая обработка сигналов и ее применение. Доклады 9-й международной конференции. — С. 157-160.
6. Афанасьев А.А., Басов О.О., Богачев Г.В. Особенности системы с переменной структурой для кодирования речевых сигналов. 6-я Международная конференция и выставка "Цифровая обработка сигналов и ее применение". Доклады — 1. — М: 2004. — С. 76-79.
7. Хургин Я.И., Яковлев В.П. Финитные функции в физике и технике. М.: Наука. 1971. — 408 с.
8. Кириллов С.Н., Дмитриев В.Т. Реализационные возможности и помехоустойчивость процедуры восстановления сигналов на основе алгоритма Хургина-Яковлева// Радиотехника. 2003. № 1. — С. 73-75.
9. Кириллов С.Н., Дмитриев В.Т., Лукьянов Д.И., Семин Д.С. Algorithms for evaluating the quality of the received speech and psycho-emotional state of the speaker by the action of acoustic noise in telecommunication systems» // 2018 Moscow Workshop on Electronic and Networking Technologies (MWENT). Proceedings. — Moscow: National Research University "Higher School of Economics". Russia, Moscow, March 16, 2018. IEEE Catalog Number: CFP18N39-CDR. ISBN: 978-1-5386-3497-4.-14.
10. Кириллов С.Н. Дмитриев В.Т. Selection and justification of primary speech codec under the action of acoustic noise // 2019 8th Mediterranean Conference on Embedded Computing (MECO) DOI: 10.1109/MECO.2019.8760279.
11. ГОСТ Р 50840-95. Передача речи по трактам связи. М.: Госстандарт России, 1995. — 180 с.
12. Дмитриев В.Т., Янак А.Ф. Исследование воздействия акустических шумов на первичные кодеки речевых сигналов. //Вестник РГРТУ2016. № 2 (Выпуск 56). — С. 38-44.
13. Бабкин В.В., Ланнэ А.А., Шантала В.С. Оптимизационная задача выбора речевого и канального кодирования. // Материалы междуна-родной конференции DSPA-2005. Москва 2005. — С. 345-347.
14. Помехоустойчивые кодеки — будущее цифровой телефонии [Электронный ресурс]. URL: https://www.osp.ru/nets/1997/10/142940/.
15. Кириллов С.Н., Дмитриев В.Т., Крысяев Д.Е., Попов С.С. Исследование качества передаваемой речевой информации при различном сочетании алгоритмов кодирования источника и канала связи в условиях действия помех . Вестник РГРТУ 2008 № 1 (Выпуск 23) . С. 53-56.
16. Дмитриев В.Т., Константинова. Алгоритм комплексной оценки качества речи в канале связи.// Вестник РГРТУ. 2016. № 56. — С. 42-47.
17. Кириллов С.Н., Дмитриев В.Т. Комплексный алгоритм объективной оценки качества декодированного речевого сигнала при действии акустических помех. // Труды СПИИРАН 2018 № 1. — С. 34-55.
18. Дмитриев В.Т. Помехоустойчивость кодеков речи на основе алгоритма Хургина-Яковлева/ Вестник РГРТА Вып. № 12, 2003. — С. 133-136.
19. Кириллов С.Н., Дмитриев В.Т. Устойчивость первичных кодеков речевых сигналов на основе представления Хургина-Яковлева к действию акустических шумов.// Вестник Рязанского государственного радиотехнического университета. 2019. № 3. — С. 17-25.
20. Кириллов С.Н., Дмитриев В.Т. Алгоритм адаптации кодеков речевых сигналов к акустическим шумам на основе представления Хургина-Яковлева. // Материалы IV Всероссийской научно-технической конференции «Актуальные проблемы современной науки и производства». — Рязань: РГРТУ.2019. — С. 7-13.
ADAPTIVE PRIMARY CODES OF SPEECH SIGNALS BASED ON THEOREM V.A. KOTELNIKOV AND REPRESENTATIONS OF KHURGIN-YAKOVLEV
Дмитриев В.Т., кандидат технических наук, доцент, и.о. заведующего кафедрой радиоуправления и связи РГРТУ
The algorithms for adaptation of primary codecs to various interfering factors are analyzed. Algorithms for adaptation of primary codecs to acoustic noise, as well as adaptation of combinations of primary and noise-immune software-configurable codecs under the action of interference in the communication channel, with the aim of optimal ratio of the quality of the reconstructed speech at a minimum transmission rate based on the theorem of V.A. Kotelnikov and the performances of Khurgin-Yakovlev. The analysis of primary codecs providing the best quality of the reconstructed speech at the output of the encoder under the action of various types of acoustic noise is carried out. It is shown that the use of the Khurgin-Yakovlev representation provides an additional gain in the quality of the reconstructed speech signal by 0.1-0.5 points, according to GOST R 50840-95 with separate coding of signal samples and the first derivative, simpler producing filters , as well as the possibility of parallel processing.
35
MÊUILJÎ lilïwr л Дмитриев В.Т. Адаптивные первичные кодеки речевых сигналов на основе теоремы В.А. Котельникова и представления Хургина-Яковлева
36 The use of this algorithm allows to increase the quality of the recovered speech by 1 ... 1.5 points according to GOST R 50840-95 under the influence of acoustic noise in comparison with similar non-adaptive codecs based on V.A. Kotelnikov or the possibility of the required transmission rate by 15-30% for software-defined radio systems for receiving, transmitting and processing information. • speech signals • primary codec • software-defined systems • codec adaptation • reception and transmission of information • signal processing • acoustic noise • interference • communication channel.