Научная статья на тему 'Программа оценки точности выделения основного тона речевого сигнала'

Программа оценки точности выделения основного тона речевого сигнала Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
147
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЧЕВОЙ СИГНАЛ / SPEECH SIGNAL / ОСНОВНОЙ ТОН / FUNDAMENTAL TONE / ТОЧНОСТЬ ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА / ACCURACY OF MEASURING FUNDAMENTAL TONE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Архипов И.О., Гитлин В.Б.

Разработано программное обеспечение для оценки точности алгоритмов выделения основного тона речевого сигнала, учитывающее количество больших и малых ошибок выделения основного тона, а также ошибки, возникающие на этапе принятия решения о тональности или нетональности текущего интервала анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Архипов И.О., Гитлин В.Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROGRAM OF THE ASSESSMENT OF ACCURACY OF MEASURING FUNDAMENTAL TONE OF THE SPEECH SIGNAL

The software for an assessment of accuracy of algorithms of measuring the fundamental tone of a speech signal considering quantity of big and small errors of measuring the fundamental tone, and also the errors arising at a stage of making decision on a tonality or not a tonality of the current interval of the analysis is developed.

Текст научной работы на тему «Программа оценки точности выделения основного тона речевого сигнала»

ТЕХНИЧЕСКИЕ НАУКИ

УДК 004.934.2

И.О. Архипов

канд. техн. наук, доцент, заведующий кафедрой «Программное обеспечение», ФГБОУ ВПО «Ижевский государственный технический университет им. М.Т. Калашникова», г. Ижевск

В.Б. Гитлин

д-р техн. наук, профессор, кафедра «Вычислительная техника», ФГБОУ ВПО «Ижевский государственный технический университет им. М.Т. Калашникова», г. Ижевск

ПРОГРАММА ОЦЕНКИ ТОЧНОСТИ ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА

Аннотация. Разработано программное обеспечение для оценки точности алгоритмов выделения основного тона речевого сигнала, учитывающее количество больших и малых ошибок выделения основного тона, а также ошибки, возникающие на этапе принятия решения о тональности или нетональности текущего интервала анализа.

Ключевые слова: речевой сигнал, основной тон, точность выделения основного тона.

I.O. Arhipov, Kalashnikov Izhevsk State Technical University, Izhevsk

V.B. Gitlin, Kalashnikov Izhevsk State Technical University, Izhevsk

PROGRAM OF THE ASSESSMENT OF ACCURACY OF MEASURING FUNDAMENTAL TONE OF THE

SPEECH SIGNAL

Abstract. The software for an assessment of accuracy of algorithms of measuring the fundamental tone of a speech signal considering quantity of big and small errors of measuring the fundamental tone, and also the errors arising at a stage of making decision on a tonality or not a tonality of the current interval of the analysis is developed.

Keywords: speech signal, fundamental tone, accuracy of measuring fundamental tone.

Основная сложность сравнения выделителей основного тона (ОТ) заключается в отсутствии общепринятых объективных критериев оценки, а также открытым остается вопрос выбора выделителя ОТ, используемого в качестве эталона. Помимо этого, методы проверки качества выделения ОТ трудоемки, требуют значительных затрат времени и зависят от конкретных условий эксперимента, в частности от качества входного сигнала. Автоматизация процесса испытаний возможна при наличии критерия, который позволяет оценить работу выделителя ОТ и может быть использован в автоматизированной системе. Помимо выделителя ОТ, на результаты сравнительного анализа влияет тип микрофона, тип усилительной аппаратуры, характер искажений тракта передачи, наличие помех и акустических шумов и т.д. Дополнительные проблемы возникают из-за низкой воспроизводимости речевого сигнала, что приводит к проведению исследований на обширном речевом материале. Алгоритмы сегментации речи на тональные и нетональные интервалы являются неотъемлемой частью любого выделителя ОТ, что требует раздельного учета ошибок в зависимости от типа их источника.

В работах [1, 2] использованы параметры, которые должны учитываться при оценке надежности работы выделителей ОТ:

1) точность принятия решения «ТОН» - это ошибка принятия решения, когда в эталонном контуре ОТ речевой сигнал был классифицирован как вокализованный, а в исследуемом контуре - как невокализованный;

2) точность принятия решения «НЕ ТОН» - это ошибка принятия решения когда в эталонном контуре ОТ речевой сигнал был классифицирован как невокализованный, а в исследуемом контуре - как вокализованный;

3) малые ошибки - это отклонения исследуемого контура от эталонного на величину от 5% до 15% (отклонения менее 5% не учитываются, т.к. слабо воспринимаются на слух);

4) большие ошибки - отклонения исследуемого контура от эталонного на величину более 15%, что может привести к сбоям выделителя ОТ на вторую гармонику ОТ.

Наличие четырех типов ошибок затрудняет принятие решения. В качестве интегральной меры оценки качества работы выделителя ОТ часто используют [1, 2] обобщенную ошибку, вычисленную в многомерном пространстве ошибок. Определим критерий ошибки б как норму вектора, образованного средними значениями ошибок, имеющих схожую природу возникновения:

б_

бТ + бНТ

(1)

2 ) \ 2

где бб - процент интервалов анализа с большими ошибками выделения частоты ОТ; бм - процент интервалов анализа с малыми ошибками выделения частоты ОТ; бТ - процент интервалов анализа с ошибкой типа «ТОН»; бНТ - процент интервалов анализа с ошибкой типа «НЕ ТОН».

Отношение среднего значения ошибок выделения ОТ к обобщенной ошибке и среднего значения ошибок принятия решения «ТОН» или «НЕ ТОН» к обобщенной ошибке

б + б

бОТ =■

(2)

б _ бТ + бНТ

(3)

позволяют количественно оценить, какая часть исследуемого алгоритма работает надежнее, связанная с выделением ОТ или с принятием решения о тональности или нетональности речи.

Рисунок 1 - Окно программы оценки точности выделения контура от речевого сигнала

Описанный в данной работе метод оценки надежности выделения ОТ реализован в виде программной оболочки, представленной на рисунке 1. В рабочей области программы отображается осциллограмма речевого сигнала, эталонный контур ОТ, а также два контура ОТ, полученные от разных выделителей ОТ, что может быть полезным для их сравнения.

2

2

+

и

Панель управления на рисунке 1 позволяет выбрать контуры ОТ, которые необходимо сравнивать между собой. Область панели управления состоит из двух частей: «Группа 1» и «Группа 2». В каждой группе необходимо выбрать файл для сравнения. Результаты анализа сводятся в таблицу в нижней области окна программы. Предусмотрена возможность выгрузки результатов анализа в файл в формате «.csv», пригодном для дальнейшей обработки средствами других программ, например MS Excel. Также есть возможность сохранить графики рабочей области программы в графическом формате для использования в качестве иллюстраций в текстах научных работ.

В результате в работе предложен метод определения точности выделителя ОТ речевого сигнала, позволяющий оценить надежность этапов выделения ОТ и детектирования вокализованной речи как раздельно друг от друга, так и в виде обобщенного критерия. Разработана программная оболочка, реализующая данный метод и позволяющая представить результаты анализа в наглядной визуальной форме, а также сохранить в виде файла для дальнейшего изучения в других программах.

Список литературы:

1. Архипов И.О. Разработка критериев и алгоритмов сегментации речевого сигнала на участки «ТОН/НЕ ТОН» для метода выделения основного тона в информационно-измерительных системах речевой технологии [Текст]: автореф. дис. ... канд. техн. наук: 05.11.16 / Архипов Игорь Олегович; Ижев. гос. техн. ун-т. - Ижевск, 2000. - 20 с.

2. Гитлин В.Б. Разработка концепции выделения основного тона речи в информационно-измерительных системах реального времени [Текст]: автореф. дис. ... д-ра техн. наук: 05.11.16 / Гитлин Валерий Борисович; Ижев. гос. техн. ун-т. - Ижевск, 2000. - 32 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.