Научная статья на тему 'Количественная оценка биграмм для дифонного синтеза речи'

Количественная оценка биграмм для дифонного синтеза речи Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
81
26
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЯКУТСКИЙ ЯЗЫК / СИНТЕЗ РЕЧИ / ДИФОН / БИГРАММА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Леонтьев Н.А., Слепцов И.А.

В данной работе производится количественная оценка числа биграмм необходимого для дифонного синтеза речи на якутском языке. Число биграмм считается на основе словаря созданного из базы газетного корпуса якутского языка.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Количественная оценка биграмм для дифонного синтеза речи»

Решатель работает по принципу обслуживания по мере возможностей (выполнение потоков планировалось непосредственно операционной системой). Результаты работы решателя представлены на рисунке 3.

Тестирование решателя проводилось на SMP-машине. В таблице 1 приведены исходные данные тестирования решателя.

Таблица 1

Исходные данные тестирования

Характеристика Значение

Количество и тип вычислительных ядер 4 x Intel(R) Xeon(R) CPU E5345 @ 2.33GHz

Операционная система Linux 2.6.34.7-0.5-xen #1 SMP 2010-10-25 08:40:12 +0200 x86 64 x86 64 x86 64 GNU/Linux

Размерность матрицы А 1000 x 1000

Размерность матрицы В 1000 x 1000

Как видно из рисунка 3, число потоков имеет смысл увеличивать только до того момента, когда их количество достигнет количества ядер. Дальнейшее увеличение числа потоков не приводит к ускорению вычислений.

Список литературы:

1. Приемы объектно-ориентированного проектирования. Паттерны проектирования / Э. Гамма, Р. Хелм, Р. Джонсон, Д. Влиссидес. - СПб.: Питер, 2011. - 368 с.

КОЛИЧЕСТВЕННАЯ ОЦЕНКА БИГРАММ ДЛЯ ДИФОННОГО СИНТЕЗА РЕЧИ

© Леонтьев Н.А.*, Слепцов И. А.*

Северо-Восточный федеральный университет им. М.К. Аммосова,

г. Якутск

В данной работе производится количественная оценка числа биграмм необходимого для дифонного синтеза речи на якутском языке. Число биграмм считается на основе словаря созданного из базы газетного корпуса якутского языка.

Ключевые слова якутский язык, синтез речи, дифон, биграмма.

Компьютерный синтез речи является одним из развивающихся способов человек-машинного взаимодействия. Распространение миниатюрных электронных приборов позволяет применять их в повседневной жизни, с помо-

* Доцент кафедры Радиотехники и информационных технологий, кандидат технических наук.

* Аспирант кафедры Радиофизики и электроники.

щью синтеза речи упрощается вывод информации в различных ситуациях, например при управлении автотранспортом. Также голосовой синтез используются в приборах для людей имеющих проблемы с органами зрения или другими ограничения по здоровью.

Для компьютерного синтеза речи используются различные методы: формантный, фонемный, дифонный, слоговой, на основе словарей. Все эти методы имеют свои преимущества и ограничения.

Синтез речи на основе фонем [1,2] использует только фонемы без учета перехода фонем из друг в друга. Качество речи является недостаточным при таком методе синтеза речи, речь являет рваной при переходах из одной фонемы в другую. Для повышения качества речи применяют дифонный синтез речи. Дифон - это фрагмент звуковой речи состоящий из двух половинок соседних фонем. Дифоны можно применить и для распознавания речи [3] и для синтеза речи. При записывании дифонов на компьютер необходимо обеспечить монотонный уровень звука, что усложняет процесс записи. Данный метод не позволяет управлять параметрами речи, но формирует вполне различаемую дикторскую речь.

Якутский алфавит содержит в себе буквы русского алфавита, вдобавок к нему имеются 5 национальных букв, это буквы «gHyeh», также используются два диграфа «нь» и «дь», а также четыре дифтонга «уо», «ыа», «ye», «иэ».

Для количественной оценки дифонов был использован газетный корпус якутского языка [4], созданный в рамках проекта по автоматической разметке якутского языка. С помощью данного корпуса были созданы программы для идентификации языка текстового сообщения [5], исследованы частотные свойства языка [6] и букв [7, 8], созданы программы автоматической коррекции букв [9] и проверки орфографии [10].

Газетные статьи в корпусе сохранены в стандарте Unicode в кодировке UTF-8 с использованием базы данных MySQL, для обработки корпуса применен скрипт на языке программирования PHP с использованием библиотеки Multibyte String Function. Из корпус был выделен словарь уникальных словоформ. Количество словоформ в словаре свыше 100 тыс., имеется большое число заимствованных слов из русского языка. Будем считать, что состав словаря газетных публикаций является отражением современного словаря якутского языка.

Биграммы используются в различных приложениях, например при идентификации языка [11], для выделения левого и правого контекста с использованием биграмм из слов.

На рисунке 1 приведена часть экрана вывода скрипта для разбиения слов на биграммы. При работе скрипта осуществляет вывод слова, длины слова, а также биграмм, на которые разбито слово с учетом диграфов и мягкого и твердого знаков.

дьыалан длина слова:7 дьы ыа ал ла air дьыбааммар длина слова: 10 дьы ыб ба аа ам мм ма ар дьыбаан длина слова:7 дьы ыб ба аа ан дьыбаана длина слова:8 дьы ыб ба аа ан на дьыбаантан длина слова: 10 дьы ыб ба аа ан нт та ан дьыбааны длина слова:8 дьы ыб ба аа ан ны дьыбааныгар длина слова: 11 дьы ыб ба аа ан ны ыг га ар дьыбаанын длина слова:9 дьы ыб ба аа ан ны ын дьыбаанна длина слова:9 дьы ыб ба аа ан нн на

дьыбарга длина слова:8 дьы ыб ба ар рг га дьыбардаах длина слова: 10 дьы ыб ба ар рд да аа ах

дьыл-кун длина слова:8 дьы ыл ку ун дьыл-хонук длина слова: 10 дьы ыл хо он ну ук дьыл-^аларын длина слова: 12 дьы ыл §а ал ла ар ры ын

Рис. 1. Пример работы скрипта

В конце работы скрипта производится расчет биграмм и составление таблицы с количество полученных биграмм.

В якутском языку существуют диграфы «нь» и «дь», в заимствованных словах из русского языка «ь» и «ъ» используются с согласными буквами, что увеличивает количество фонем. Для синтеза речи необходимо учитывать согласную букву с мягким или твердым знаком как отдельную фонему, так как только в данном случае речь будет иметь более высокое качество.

Гласные звуки в якутском языке различаются по долготе, например, есть звук «а» и долгий звук «аа». Граница в долгих гласных звуках не считается, так как это один и тот же звук, но только более продолжительный.

В результате получилось 1055 комбинаций фонем, их распределение по типам фонем приведены в таблице 1.

Таблица 1

Распределение комбинаций фонем по типам

Типы пар Количество

гласная-гласная 55, в том числе 8 пар долгих гласных

согласная-гласная 311

гласная-согласная 283

согласная-согласная 406

Всего: 1055

При фонетизации заимствованных слов необходимо учесть, что пары согласная-согласная являются границами слогов, что уменьшает количество фонем. Так же учет пар гласная-гласная приводить к уменьшении, так как в якутском языке в одном слоге имеет только парные долгие гласные, а остальные гласные произносятся раздельно по слогам. При таком подсчете число дифонов уменьшается до 602.

При полной фонетизации слов также возможно замена букв «ф», «в», «ц», «е», «ш», «щ», «з», «ж», «я», «ъ» на аналоги, что уменьшает возможное количество фонем еще примерно на 200 единиц дифонов. Современный якутский язык не обходится без заимствованный слов, поэтому подобная фонетизация приведет к снижению качества произношения речи.

Для синтеза речи на якутском языке необходимо, по крайней мере 1055 дифонов с учетом слов на русском языке. Если применять только фонетизи-рованные варианты слов, то количество дифонов сокращается 602 единиц.

Список литературы:

1. Фонемный синтез речи на якутском языке. Свидетельство о гос. регистрации прогр. для ЭВМ № 2014613342 / Н.А.Леонтьев, И.А. Слепцов. -зарегистрировано в Реестре программ для ЭВМ 11.02.2014 г.

2. Леонтьев Н.А., Слепцов И.А. Компилятивная модель для автоматизированного синтеза якутского языка // Инновационный потенциал молодежной науки: материалы Всероссийской научной конференции / Под. ред. А.Ф. Мустаева. - Уфа: Изд-во БГПУ, 2013. - С. 217-220.

3. Бурибаева А.К., Дорохина Г.В., Ниценко А.В., Шелепов В.Ю. Сегментация и дифонное распознавание речевых сигналов // Труды СПИИРАН. -СПб., 2013. - С. 20-41.

4. Леонтьев Н.А. Национальный корпус Интернет-сайтов газет на якутском языке // Журнал научных и прикладных исследований. - Уфа: Инфи-нити, 2014. - № 4. - С. 35-36.

5. Леонтьев Н.А. Идентификация языка текстового сообщения с помощью газетного корпуса якутского языка [Электронный ресурс] // Universum: Технические науки: электрон. научн. журн. - 2014. - № 8 (9). -Режим доступа: http://7universum.com/ru/tech/archive/item/1539 (дата обращения: 26.08.2014).

6. Леонтьев Н.А. Частотный словарь якутского языка по материалам газетного корпуса // Язык и культура (Новосибирск). - 2014. - № 13. - C. 57-60.

7. Леонтьев Н.А. Частоты употребления букв якутского языка в газетном корпусе [Электронный ресурс] // Современные научные исследования и инновации. - 2014. - № 7 - Режим доступа: http://web.snauka.ru/issues/2014/ 07/36069 (дата обращения: 06.08.2014).

8. Протопопова В.Ф. Частотная таблица символов якутского языка с учетом диграфов и дифтонгов // Информационно-телекоммуникационные системы и технологии (ИТСиТ-2014): Материалы Всероссийской научно-практической конференции. Кузбас. гос. техн. ун-т им. Т.Ф. Горбачева. -Кемерово, 2014. - С. 141-142.

9. Леонтьев Н.А. Автоматическая коррекция букв в текстовом сообщении на якутском языке [Электронный ресурс] // Интернет-журнал Науковедение. - Выпуск 3. - июнь 2014. - Режим доступа: http://naukovedenie.ru/ PDF/96TVN314.pdf (дата обращения: 26.11.2014).

10. Леонтьев Н.А., Протопопова В.Ф. Применение газетного корпуса якутского языка для проверки орфографии // Наука и современность. - 2014. -№ 32-2. - С. 45-48.

11. Леонтьев Н.А. Распознавание языка текстовых сообщений с помощью биграмм на материалах якутского языка // Современное состояние естественных и технических наук. - М.: ООО «Издательство "Спутник+"», 2014. - № XIV - С. 88-91.

i Надоели баннеры? Вы всегда можете отключить рекламу.