Научная статья на тему 'Оценка вокализации речевого сигнала на основе его коэффициента корреляции'

Оценка вокализации речевого сигнала на основе его коэффициента корреляции Текст научной статьи по специальности «Математика»

CC BY
83
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Голубинский А. Н., Булгаков О. М.

Разработан способ оценки вокализации сегмента речи в виде граничных условий для коэффициента корреляции. Даны практические рекомендации по вычислению численных значений критических отсчётов коэффициента корреляции для вокализованных и невокализованных речевых сигналов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оценка вокализации речевого сигнала на основе его коэффициента корреляции»

Таким образом, на основании проведенных исследований можно сделать следующие выводы: способ сушки под вакуумом для обезвоживания пастообразных ПОК производных нафталина и бензола до заданной конечной влажности и концентрации целевого вещества неприменим; для этих целей предлагается использовать способ сушки с интенсивным удалением влаги в аппаратах с активным гидродинамическим режимом; эффективность протекания процессов термического обезвоживания ПОК находится в прямой зависимости от степени их чистоты, в связи с чем необходимо формировать требования к организации предварительной стадии очистки целевого вещества.

Список литературы:

1. Леонтьева А.И. Анализ и совершенствование технологии пара-фенилдиамина / А.И. Леонтьева, К.В. Брянкин, С.Ю. Чупрунов, Л.Н. Че-мерчев, П. А. Фефелов, В.И. Коновалов // Химическая промышленность. -1999. - №7. - С. 3-6.

2. Нестерова Т.Н. Критические температуры и давления органических соединений. Анализ состояния базы данных и развитие методов прогнозирования / Т.Н. Нестерова, И.А. Нестеров. - Самара: Изд-во Самарского научного центра РАН, 2009. - 580 с.

3. Брянкин К.В. Термостабильность полупродуктов органических красителей - фактор, определяющий выбор аппаратурного оформления стадии сушки / К.В. Брянкин, Д.О. Толмачев, А.Ю. Орлов, Е.В. Брыкина // «Теоретические и экспериментальные основы создания новых высокоэффективных процессов и оборудования»: труды VII Международной научной конференции. - Иваново: Издательство ИГХТУ, 2005. - С. 140-145.

4. Леонтьева А.И. О возможностях повышения эффективности процесса сушки пастообразных полупродуктов органических красителей / А.И. Леонтьева, В.И. Коновалов, К.В. Брянкин, С.Ю. Чупрунов, Л.Н. Че-мерчев, А. А. Чернов // Журнал прикладной химии. - 2000. - Т. 73. - Вып. 3. - С. 456-458.

ОЦЕНКА ВОКАЛИЗАЦИИ РЕЧЕВОГО СИГНАЛА НА ОСНОВЕ ЕГО КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

© Голубинский А.Н.*, Булгаков О.М.Ф

Воронежский институт МВД России, г. Воронеж

Разработан способ оценки вокализации сегмента речи в виде граничных условий для коэффициента корреляции. Даны практические

* Старший преподаватель кафедры Радиотехники, кандидат технических наук

♦ Заместитель начальника института по учебной работе, доктор технических наук, доцент

рекомендации по вычислению численных значений критических отсчётов коэффициента корреляции для вокализованных и невокализо-ванных речевых сигналов.

В настоящее время разработка и совершенствование речевых технологий является весьма актуальным направлением [1]. Речевой сигнал, как важный источник информации, широко используется в телефонии, медицине, системах управления и хранения информации, различных приложениях цифровой обработки сигналов. В этой связи, необходимо отметить, о значимости речевой науки, которая может дать конструктивные пути решения для многих практических задач, связанных с обработкой речевых сигналов. При этом не вызывает сомнений актуальность разработки новых высокоточных методов обработки речевых сигналов, которые позволят повысить надёжность систем, основанных на использовании речи и голоса в виде информационного источника.

Математическую модель речевого сигнала, использующую для представления сигнала синусоиды кратной частоты (обычно, частоте основного тона), как правило, называют гармонической. Оставшаяся часть сигнала, которая не может быть описана при помощи данной модели, называется шумовой. Представление сигнала в форме гармоники плюс шум эффективно используется во многих речевых приложениях [1]. Следует отметить, что от разделения математической модели речевого сигнала на периодическую и шумовую части, в существенной степени зависит адекватность модели и её применимость в конкретных технических задачах. Точная сепарация речевого сигнала на периодическую и шумовую составляющие является сложной задачей, при решении которой принимаются ряд допущений [1, 2]. Известно [3, 4], что периодическая составляющая характеризует вокализованные участки речи, а шумовая составляющая описывает преимущественно невокализованные участки речи.

Известны следующие методы определения степени вокализации речевого сегмента: по оценке среднего числа пересечений через ноль, по оценке кратковременной энергии речевого сигнала, на основе мгновенной взаимокорреляционной функции, на основе определения фрактальной размерности речевого сегмента и др.

При этом данные методы обладают рядом существенных недостатков, например: существенным перекрытием [3] диапазона значений среднего числа пересечений через ноль для вокализованных и невокализованных речевых сигналов, перекрытием [3] диапазона значений мгновенных энергий для вокализованных и невокализованных речевых сегментов, большим временем анализа, неустойчивостью к наличию шумов и др.

Таким образом, актуальна разработка способа адекватной оценки того, является ли рассматриваемый участок речи вокализованным или не явля-

ется таковым. При этом необходимо определить критерий, который может способствовать решению поставленной задачи.

Для разработки модели шумовой компоненты, проанализируем каким коэффициентом корреляции, обладают невокализованные сегменты речи. Известно [3, 4], что коэффициент корреляции у вокализованного речевого сигнала имеет некоторый незатухающий (нестационарный) участок, а у невокализованного речевого сигнала коэффициент корреляции практически сразу сильно затухает. Будем характеризовать степень вокализации речевого сигнала по номеру отсчета коэффициента корреляции г)э'4', начиная с которого все значения коэффициента корреляции заходят в доверительные границы нулевых значений, полученные по методу Бартлетта ± 2 а.:

(■ +2 ) <■>

где а. - стандартная среднеквадратичная ошибка для коэффициентов корреляции; N - количество отсчетов речевого сигнала;

К - некоторое значение количества отсчетов коэффициентов корреляции не превышающее примерно 'ы/4 [5].

Для практических расчётов примем значение К = N/4 [5]. В выражении (1) коэффициент корреляции центрированного речевого сигнала вычисляется по формуле:

'' КУо ст 2

К- (2)

при этом в связи с добавлением звуковыми платами различных постоянных составляющих в обрабатываемый речевой сигнал, проводилась операция центрирования входного речевого сигнала. Таким образом, отсчеты центрированного речевого сигнала:

у1 _ х1 - х , I _ 0, N -1 (3)

где х, =х(1Л) - начальные отсчеты речевого сигнала; Л = 1// - интервал дискретизации; / - частота дискретизации; N - число отсчетов; х - математическое ожидание:

_ 1 ^

х _ ^ Е X (4)

-¿V , _ о

Функция корреляции в предположении эргодичности стационарного в широком смысле случайного процесса рассчитывается как:

1 N-j 1 N-j _

К О) - КУ; = N Е (У - У)(у+; - У) = N Е У у+;' > =0; 3 (5)

здесь для центрированной реализации у, математическое ожидание у = 0 ; 3 - количество вычисляемых отсчетов коэффициента корреляции.

Будем считать, что речевой сигнал является в значительной мере нево-кализованным, если все значения коэффициента корреляции заходят в границы Бартлетта ± 2;, начиная с некоторого отсчёта:

32; < З0 (6)

где 32; - значение номера критического отсчёта коэффициента корреляции для невокализованного речевого сегмента; 30 - количество отсчётов коэффициента корреляции, соответствующее периоду основного тона Т0:

Т = / = 3„А = 3 (7)

^0 ] а

отсюда:

З0 = / (8)

/ 0

Перепишем (6) в виде:

32™ < / (9)

/0

Учитывая, что частота основного тона в подавляющем большинстве случаев находится в диапазоне [3, 4] /0 е [70; 330] Гц, запишем на основе (9) граничное условие для невокализованных участков речи:

32;г <-А- * з -10-3 • / (10)

/0г

Таким образом, если выполняется соответствующее практическое правило (для частоты дискретизации / принимающей стандартные значения равные: 6000 Гц, 8000 Гц и 11025 Гц):

(все значения коэффициента корреляции заходят в границы Бартлетта до 19, 25 или 34 отсчёта) то данный речевой сигнал можно считать невокали-зованным.

Рассуждая аналогичным образом, сформулируем граничное условие для вокализованных речевых сигналов:

3а > / -1,43 -10-2 • / (12)

V 0тт

где - значение номера критического отсчёта коэффициента корреляции для вокализованного речевого сегмента.

То есть, если выполняется условие (для соответствующих /):

32 \ > 85,7 ; > 114,3; > 157,5 (13)

_6кГц 2аЛ/й _8кГц 2аЛ/й _11025 Гц V>

(значения коэффициента корреляции заходят границы Бартлетта после 86, 115 или 158 отсчёта) то данный рече ой сигнал можно считать окали-зо ванным.

Заметим, что достаточно высокоточную оценку частоты основного тона можно конструктивно получить, используя, например, метод минимума невязки коэффициентов корреляции [6].

Для гласного звука «о», нестационарный относительно границ Бартлетта участок коэффициента корреляции оказался равным 210 отсчётам (при / = 6000 Гц), т.е. в течение 210 отсчётов коэффициент корреляции не заходит в доверительные границы Бартлетта. При этом, как видно условие (13) выполняется, т.е. речевой сигнал в достаточной степени вокализованный.

В тоже время для шумного звука «ш» коэффициент корреляции заходит в границы Бартлетта ±2аг, как правило, уже начиная (при/ = 6000 Гц) с первого - пятого отсчёта (после нулевого отсчёта, при котором коэффициент корреляции равен единице). То есть коэффициент корреляции для звука «ш» ведёт себя в значительной мере похоже на коэффициент корреляции белого шума ограниченного по полосе частот некоторой верхней частотой. При этом из выполнения условия (11) следует, что речевой сигнал невокализованный.

Список литературы:

1. Азаров И.С. Вычисление мгновенных гармонических параметров речевого сигнала / И.С. Азаров, А.А. Петровский // Речевые технологии. -2008. - № 1. - С. 67-77.

2. Голубинский А.Н. Общий случай модели речевого сигнала в виде суммы квазидетерминированного случайного процесса и белого шума с

ограниченным по полосе частот спектром / А.Н. Голубинский // Системы управления и информационные технологии. - 2009. - № 1. - С. 95-100.

3. Рабинер Л.Р. Цифровая обработка речевых сигналов / Л.Р. Рабинер, Р.В. Шафер. - М.: Радио и связь, 1981. - 496 с.

4. Назаров М.В. Методы цифровой обработки и передачи речевых сигналов / М.В. Назаров, Ю.Н. Прохоров. - М.: Радио и связь, 1985. - 176 с.

5. Бокс Дж. Анализ временных рядов. Прогноз и управление / Дж. Бокс, Г. Дженкинс. - М.: Мир, 1974. - Вып. 1. - 408 с.

6. Голубинский А.Н. Метод оценки частоты основного тона речевого сигнала на основе минимума невязки коэффициентов корреляции / А.Н. Го -лубинский // Телекоммуникации. - 2009. - № 8. - С. 16-21.

ВОЗМОЖНОСТЬ ИСПОЛЬЗОВАНИЯ АВТОМАТНОГО ПРОГРАММИРОВАНИЯ ПРИ РАБОТЕ С СИСТЕМОЙ MOODLE

© Горбаченко И.М.*

Сибирский государственный технологический университет, г. Красноярск

В статье описаны возможности интерактивной обучающей системы Moodle, особенности работы с элементами курса «Лекция». На основе практики создания обучающих курсов предложено описание работы с разделами «Лекция» на языке автоматного программирования.

На современном этапе развития техники в процесс обучения дисциплинам все большее применение нашли компьютерные обучающие системы. Таких систем существует несколько, в том числе и разработанных отдельными коллективами специалистов, так и специализированными фирмами. Это, например, системы LearningSpace, БИГОР, ГОПЕРМЕДИА и другие. Одной из таких систем является система управления обучением Moodle (Modular Object-Oriented Dynamic Learning Environment), которая разработана в США. Система выделяется как простотой и удобством использования, так и своими возможностями.

С помощью этого программного комплекса были созданы несколько обучающих систем, например по дисциплине «Дискретная математика» (авторы Т.Н. Иванилова, А.Г. Доррер), по дисциплине «Надежность информационных систем» (автор И.М. Горбаченко) и другим.

Один из элементов обучающего курса, создаваемого в Moodle, является «Лекция», который используется в системе не только и не столько как

* Доцент кафедры Системотехники, кандидат технических наук, доцент

i Надоели баннеры? Вы всегда можете отключить рекламу.