Научная статья на тему 'Особенности проявления структурно-статистических признаков речевых сигналов при низкоскоростном кодировании'

Особенности проявления структурно-статистических признаков речевых сигналов при низкоскоростном кодировании Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
404
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАЦИОНАРНОСТЬ / КОДИРОВАНИЕ РЕЧИ / НИЗКОСКОРОСТНОЕ КОДИРОВАНИЕ РЕЧИ / ИНФОРМАТИВНЫЙ ПРИЗНАК

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Шишкалов Андрей Владимирович, Медведев Владимир Михайлович

Рассмотрены принципы формирования сигналов с низкоскоростным кодированием речи (НКР), представлены фрагменты речевого сигнала и виде последовательности ИКМ-отсчетов и соответствующие им фрагменты кадров передачи сообщения на выходе кодера речи, выявлена последовательность двоичных символов на периоде кадра НКР, характеризующая стационарностью значений двоичных символов при передаче паузы речи.I

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n clause examination foundations formation of speech signals, represent fragments of speech signals as consecution PCM-symbols and corresponding fragments data frame in speech coder destination, defect consecution bits on period of kadr speech coder, characterizing stationarity bits meaning by speech pause transmission.

Текст научной работы на тему «Особенности проявления структурно-статистических признаков речевых сигналов при низкоскоростном кодировании»

полосы занимаемых частот составляет до 30 %.

Описан метод формирования спектрально-эффективных сигналов с OFDM с помощью ОБПФ и линейного преобразования входных символов канального алфавита. Данный метод можно реализовать с помощью цифрового устройства формирования сигналов с OFDM.

Предложен метод приема спектрально-эффективных сигналов с OFDM, основанный на использовании решетчатого алгоритма представления сигналов.

Работа выполнена при финансовой поддержке ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 гг.», госконтракт № 07.514.12.4008.

список литературы

1. Вишневский, В.М. Широкополосные беспроводные сети передачи информации [Текст] / В.М. Вишневский, А.И. Ляхов, С.Л. Портной [и др.]. -М.: Техносфера, 2005. -592 с.

2. Макаров, С.Б. Снижение пик-фактора сигналов с ортогональным частотным уплотнением [Текст] / С.Б. Макаров, А.В. Рашич // Научно-технические ведомости СПбГПУ -2008. -№ 2(55). -С. 79-84.

3. Макаров, С.Б. Передача дискретных сообщений по радиоканалам с ограниченной полосой пропу-

скания [Текст] / С.Б. Макаров, И.А. Цикин. -М.: Радио и связь, 1988. -304 с.

4. Школьный, Л.А. Оптимизация формы огибающей радиоимпульса по минимуму внеполосных излучений [Текст] / Л.А. Школьный // Радиотехника. -1975. -Т. 30. -№ 6. -С. 12-15.

5. Атик, С. Алгоритм приема спектрально-эффективных сигналов с OFDM [Текст] / С. Атик, С.Б. Макаров, А.В. Рашич // Научно-технические ведомости СПбГПУ -2010. -№ 3 (101). -C. 32-38.

УДК 621.391:355.40

А.В. Шишкалов, В.М. Медведев

особенности проявления структурно-статистических признаков речевых сигналов при низкоскоростном кодировании

Одна из задач, решаемых с помощью методов теории систем массового обслуживания, - расчет интенсивности нагрузки узла телефонной сети. При этом величина интенсивности нагрузки характеризуется как среднее число ресурсов, занятых обслуживанием трафика на заданном интервале времени [1]. Если в каждый момент времени t из заданного интервала [t t2] число занятых обслуживанием трафика ресурсов из данного набора равно A(t), то средняя интенсивность трафика может быть оценена как

— 1 f2

A(t1,t2) = —— Г A(t)dt. (1)

t2 - t1 ^

Из выражения (1) следует, что для оценивания интенсивности нагрузки необходимо располагать данными о фрагментах активности каналов связи. В системах IP-телефонии (системы передачи речевых данных, построенных согласно рекомендациям H.323, SIP и т. д.) такая задача решается

с помощью детекторов активности речи, устанавливающих флаг начала и окончания передачи фрагмента активности речи. В групповых сигналах с коммутацией каналов, примерами которых являются DTX-600, DTX-360, CS-8000, NCM-501 и т. д., а также в групповых сигналах спутниковых систем связи VSAT (Very Small Aperture Terminal), использующих фирменные (не описанные в международных рекомендациях) алгоритмы передачи данных, информация об активности речевых каналов не передается. Это обстоятельство затрудняет определение интенсивности нагрузки в заданные моменты времени, что в свою очередь затрудняет измерение и управление основными характеристиками качества обслуживания телекоммуникационных систем.

В данной статье рассматривается возможность определения фрагментов активности речевого канала с помощью структурно-статистических при-

знаков речевого сигнала при низкоскоростном кодировании.

Передача речевой информации характеризуется периодической сменой фрагментов активности и пауз в речевом сообщении. Перед передачей по каналу связи речевое сообщение проходит последовательные процедуры ИКМ-преобразования и кодирования низкоскоростным кодером речи [2]. На этапе ИКМ-обработки осуществляется преобразование амплитуды акустического речевого колебания в последовательность ИКМ-отсчетов, следующих со строго определенной скоростью (64 кбит/с).

Методы низкоскоростного кодирования речи (НКР) основаны на параметрическом кодировании, т. е. на представлении речевого сигнала набором медленно изменяющихся параметров [3, 4]. Такое представление речевых сигналов приводит к понижению скорости передачи цифрового потока. При представлении речевого сигнала в виде набора параметров из него исключается часть имеющейся в нем избыточности представления. Результат работы низкоскоростного кодера речи - формирование последовательности кадров параметров кодируемого речевого сигнала.

Для организации передачи в канале связи кадры параметров имеют строго определенные длину кадра и скорость передачи. Длины кадров и скорости их передачи зависят от используемого алгоритма НКР.

Рассмотрим взаимосвязь между характерными фрагментами в речевых сообщениях (фрагменты активности речи и фрагменты пауз) и особенности их проявлений в сигнале на выходе кодера НКР. На рис. 1 представлены фрагменты последовательности ИКМ-отсчетов (рис. 1 а) и соответству-а)

ющие им фрагменты кадров передачи сообщения на выходе кодера речи (рис. 1 б). Из рисунка видно, что фрагменты активности канала С1 и С2, представленные в виде последовательности ИКМ-отсчетов, в результате кодирования кодером речи преобразуются в последовательность речевых кадров (фрагменты С'1 и С'2), содержащих в себе параметры речевого сообщения.

На рисунке следующие обозначения: -длина кадра речевого кодека; С С2 - фрагменты активности речевого канала в сигнале ИКМ; С'1, С'2 - проявление фрагментов С1 и С2 в канале передачи данных; В1, В2 - фрагменты пауз в сигнале ИКМ; В' В' - проявление фрагментов В1 и В2 в канале передачи данных.

При кодировании ИКМ-отсчетов, выражающих моменты неактивности паузы речевого канала (фрагменты В1 и В2), создаются речевые кадры, близкие по своей структуре (фрагменты В'1 и В'2). Это обстоятельство объясняется постоянством кодируемых параметров речевого сообщения в моменты неактивности речевого канала. Отсюда следует, что если речевой сигнал не меняется (передаются фрагменты паузы речи), то и параметры результатов преобразования речевого сигнала кодером речи будут постоянны.

Различие (в значениях соответствующих двоичных символов параметров преобразования речевого сообщения НКР) между последовательно передаваемыми речевыми кадрами будем характеризовать расстоянием Хэмминга & в соответствующих двоичных символах между двумя принятыми речевыми кадрами г и]. На рис. 2 представлен пример передачи речевых кадров.

Из рисунка следует, что значение расстояния Хэмминга в последовательно передаваемых рече-

б)

Рис. 1. Фрагменты последовательности ИКМ-отсчетов и соответствующие им фрагменты кадров кодера речи

гО)

1000 00110100 0000 10101111 1 LOO 11011010 ОЭОО 10011111 0100 11011100 ОЭОО 10000100 ОЭОО 11101111

00000110 00000000 1 11001100 1 00000000 1 00000000 1 00000000 1 00000000 1

Ю0 00000000

100 00100001

Ю0 00100100

100 00100001

Ю0 10000110

100 00100110

Ю0 00100110

11101001 00110111 11111110 00100111 00000100 00010101 00110111

10111100 10000000 10000000 10000000 00000000 10000000 10000000

10001001 00000001 11000000 00000001 00000000 00000001 00000001

10000000 11001010 00000000 11001010 00000000 00001100 11001010

00000000 •

00000000 • 01000000 ■

00000000 • 00000000 10011000

00000000 ■

Рис. 2. Фрагмент передачи речевых кадров

вых кадрах I - I для символа а равно нулю, для S1 s8 1 символа а5 - трем, для - нулю, для a37 - единице. В силу того что принятые из спутникового канала связи речевые кадры могут иметь различные параметры, проявляющиеся в значениях двоичных символов, величина d.. имеет случайный характер.

На рис. 3 показана зависимость параметра d от времени для примера, представленного на рис. 2.

Из рис. 3 следует, что фрагменты пауз в канале связи выражаются меньшим значением d, чем фрагменты активности речевого канала. В силу этого значение расстояния Хэмминга между принятыми речевыми кадрами может служить информативным признаком состояния канала связи (моменты активности и неактивности канала связи).

Речевые сообщения, передаваемые в современных системах спутниковой связи, кодируются в большинстве случаев по алгоритмам МСЭ G.729 и G.723.1. Наиболее применяемой из них является рекомендация G.723.1. Она используется для передачи речевых сообщений в следующих спутниковых системах связи: DialAway IP, SkyStar Adwantage, HNS PES, iDirect, SkyEdge и др.

Исследование структурных признаков речевых кадров и исследование поведения показателя d.. для различных фрагментов передачи речи v

можно разделить на следующие этапы:

моделирование сигнала НКР, передаваемого в режиме неактивности речевого канала;

выявление структурных признаков, присущих сигналам НКР при передаче фазы неактивности

канала, составление словаря признаков таких сигналов;

решение задачи распознавания речевых сигналов по выявленным признакам.

Для выявления структурных признаков речевого сигнала, присущих ему при передаче сигналов холостого хода, рассмотрим особенности и результаты этого исследования на выходе НКР. Осуществлено моделирование такого сигнала. При этом учитывалось, что на вход кодера речи поступают отсчеты фрагмента паузы после ИКМ, сформированные согласно рекомендации МСЭ G.711, (при известном описании формата отсчетов ИКМ и алгоритма, осуществляющего преобразование отсчетов ИКМ в кадры НКР), а их преобразование произведено в соответствии с алгоритмом НКР по рекомендации G.723.1. В сформированном таким образом сигнале осуществляется поиск стационарных фрагментов речевых кадров. Поиск стационарных фрагментов речевого кадра будем производить путем фиксации минимума суммы значений параметра с1. . между соответствующими двоичными символами анализируемых кадров.

В силу случайного характера поведения параметра с1.. в условиях наблюдения оценен закон распределения данного параметра. Для этого задавались требования по точности (доверительный интервал е) и надежности (доверительная вероятность в) описания закона распределения, определивших требуемое число испытаний N ) [5]. При е = 0,01 и в = 0,95 число требуемых испытаний должно составить N > 9604. Именно анализируемые 9600 кадров НКР составят интервал времени

d ® ® '20 f---.Г-

й й ]ШЯГ

2?4 4?8 7?2 9?6 12 TZa «Гё t,

Рис. 3. Вид зависимости значений параметра d от времени

а)

б)

/

Рис. 4. Фрагмент речевого сигнала, передаваемого в режиме неактивности речевого канала связи

для выявления стационарности значений двоичных символов. Для НКР вида G.723.1 (при скорости передачи данных 6,4 кбит/с и периоде кадра равном 192 бита) время исследования интервала стационарности составляет порядка 288 с, для НКР вида G.729 (при скорости передачи данных 8 кбит/с и периоде кадра равном 80 бит), время интервала стационарности составляет порядка 96 с.

На рис. 4 а представлен фрагмент исходного ИКМ-сигнала, передаваемого в режиме неактивности канала связи, на рис. 4 б представлен результат кодирования этих отсчетов ИКМ в сигнал НКР G.723.1. Параметр Ц) обозначает период кадра НКР.

В результате анализа сигнала НКР G.723.1, передаваемого в режиме холостого хода и оценивания степени стационарности соответствующих двоичных символов речевых кадров, выявлено г двоичных символов (для НКР G.723.1 г = 110), не меняющих свое значение на протяжении всего эксперимента из Ц) двоичных символов, составляющих длину речевого кадра (й = 0). Остальные символы, меняющие свое значение на протяжении времени анализа, распределены

по релеевскому закону распределения и в дальнейшем интересовать нас не будут. Оценивание закона распределения производено по методике, описанной в [5] при 8 = 0,01 и в = 0,95. На рис. 5 представлена зависимость значения параметра й, измеренного в 9604 речевых кадрах сигнала НКР, от соответствующих двоичных символов, составляющих речевой кадр.

Таким образом, стационарность значений двоичных символов в речевых кадрах НКР позволяет сформировать структурные признаки речевых сигналов при передаче паузы речи. Это обстоятельство позволяет выявлять фрагменты активности и неактивности в канале связи при передаче речевых данных.

Отмечена зависимость между проявлениями активности/паузы речевого сигнала и структурой кадра НКР (см. рис. 1). При передачи фрагментов паузы речевого сигнала зафиксировано постоянство кодируемых параметров в кадре НКР.

Для проведения экспериментальных исследований числа двоичных символов, сохраняющих стационарность своих значений, заданы требо-

Рис. 5. Зависимость параметра й от номеров соответствующих двоичных символов, составляющих речевой кадр

вания по точности и надежности определения результатов и получено минимальное число требуемых для этого испытаний, позволившее определить интервал стационарности. Для НКР вида G.723.1 интервал стационарности составляет порядка 288 с, для НКР вида G.729 - 96 с.

Выявленные число г и расположение двоичных символов, проявляющих стационарность

своего значения на периоде кадра НКР, позволят обеспечить распознавание состояния речевого канала по двум последовательно передаваемым кадрам НКР, при этом вероятность принятия ложного решения относительно состояния канала связи для сигналов НКР G.723.1 будет составлять 2-110 (г = 110), для сигналов НКР G.729 - 2-42 (г = 42).

список литературы

1. Крылов, В.В. Теория телетрафика и ее приложения [Текст] / В.В. Крылов. -СПб.: БХВ-Петербург, 2005. -288 с.

2. Григорьев, В.А. Передача сигналов в зарубежных информационно-технических системах [Текст] / В.А. Григорьев. -СПб.: ВАС, 1998.

3. Звонкович, В.Р. Анализ метода интерполяции речевых сигналов [Текст] / В.Р. Звонкович // Электросвязь. -1985. -№ 7. -С. 22-25.

4. Зюко, А.Г. Методы низкоскоростного кодирования при цифровой передаче речи [Текст] / А.Г. Зюко, В.Л. Банкет, В.Ю. Лехан // Зарубежная радиоэлектроника. -1986. -№ 11.

5. Юсупов, Р.М. Статистические методы обработки результатов наблюдений [Текст] / Р.М. Юсупов, Г.Б. Петухов, В.Н. Сидоров [и др.]. -М.: МО СССР, 1984. -564 с.

УДК 681.5:62-5

Ю.А. Константинов, ИМ. Крюков, М.М. Поскребышев, Н.А. Харламова автоматизированный сбор данных

при исследовании характеристик волоконных световодов

на этапах производства

Оперативный контроль качества и быстрое принятие решения в производстве специальных волоконных световодов (ВС) имеют огромное значение. Все типовые процессы производства и контроля качества в современном производстве в высокой степени автоматизированы. Однако существуют некоторые этапы производства, для которых требуется сложная методика обработки результатов измерений, анализ ситуации и оперативное принятие решения в ходе технологического процесса. Ниже перечислены основные задачи, решенные авторами в рамках автоматизации некоторых этапов:

контроль диаметра заготовки в ходе процесса осаждения реагентов и обработки результатов измерений;

принятие решений об исправности оборудования;

процесс сохранения и преобразования данных

измерения профиля показателя преломления в заготовке (преформе);

система обработки рефлектограмм вытянутых световодов и принятие решения об их годности.

Автоматизированный контроль диаметра в процессе производства преформы описан в [1]. Данные с видеокамеры поступают на персональный компьютер, включенный в корпоративную сеть. Данные со всех измерительных установок в необработанном и обработанном виде поступают в централизованную базу данных на сервер. После изготовления преформы происходит исследование ее профиля показателя преломления.

Любой волоконный световод вытягивается из заготовки, оптические характеристики которой определяют параметры изделия. На производстве специальных волоконных световодов, где контро-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.