Научная статья на тему 'Формальная модель фонематики в синтезаторе чувашской речи'

Формальная модель фонематики в синтезаторе чувашской речи Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
193
76
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Формальная модель фонематики в синтезаторе чувашской речи»

УДК 681.3

П.В. ЖЕЛТОВ, В.П. ЖЕЛТОВ

ФОРМАЛЬНАЯ МОДЕЛЬ ФОНЕМАТИКИ В СИНТЕЗАТОРЕ ЧУВАШСКОЙ РЕЧИ

Создание систем автоматического анализа и синтеза речи является одним из наиболее актуальных направлений развития современных компьютерных технологий.

Подобные системы имеют широкое применение. Они используются лицами с ограниченными функциями зрения и нарушениями опорно-двигательного аппарата при общении с компьютером, а также в портативных системах машинного перевода с помощью голоса.

Синтезаторы и распознаватели речи созданы для многих естественных языков. Так, следует отметить системы, созданные в России:

1) для русского языка - «Агафон»[2], распознаватель «Горыныч», а также ряд общедоступных программ в Интернете;

2) для татарского языка - «Синтезатор татарской речи» [3];

3) для английского и китайских языков - система распознавания 8БТ [1].

Что касается других языков РФ (кроме русского и татарского), то подобные разработки для них пока отсутствуют.

В данной работе приводится формальная модель чувашской фонетики и рассматриваются ряд концептуальных вопросов по созданию синтезатора чувашской речи.

Созданная фонематическая модель служит для транскрибирования текста по принципу <слово>^<набор фонем>.

Современная орфография чувашского языка представляет собой эклектику двух языковых систем - чувашской и русской. Таким образом, в чувашском языке имеются не адаптированные к чувашской фонетике русские заимствования, которые произносятся по правилам русской фонетики. Для того, чтобы правильно транскрибировать, к примеру, слова пар (русское) и пар-«дай» (чувашское), необходимо знать, на каком языке они написаны.

Русский язык в отличие от чувашского относится к акцентным языкам и поэтому обладает ярко выраженным словесным ударением. Чувашский же язык является сингармоничным, и слова в чувашском произносятся менее энергично и без ударения. Однако в отличие от других тюркских языков чувашский вокализм строится не только на противопоставлении твердых (заднеязычных) гласных мягким (предназначенным), но и на противопоставлении обычных по долготе гласных кратким (а - а , е (э) - ё, и, у - у ). Второй особенностью чувашско-

го языка является зависимость произношения согласных от окружающих их гласных - озвончение согласных, стоящих между двумя гласными или после сонорной и перед гласной. Причем на эту схему накладываются предыдущая и правила сингармонизма. Согласные же противопоставляются по принципу мягкости-твердости (сингармонизм) и глухости - озвонченности. Причем глухие согласные могут быть одинарными (в начале и конце слова, а также после шипящих и других глухих в середине слова) и удвоенными (в середине слова - па-раппан 'барабан', атте 'папа', акка - 'тетя, старшая сестра'). Таким образом, чувашское произношение находится в сильной контекстной зависимости от написания. В чувашском обычно принято говорить о 13 гласных (а, э(е), ы, у, о, а, ё, а0,ё0, и, иы, у, о) и 48 согласных (двойные согласные, как правило, не выделяют) [4], однако в рамках формальной модели удобно выделить все согласные, в том числе удвоенные: к, кь, кк, кькь, Г, Гь, п, пь, пп, пьпь, Б, Бь, хь, хх, хьхь, ГХ, ГьХь, т, ть, тт, тьть, Д, Дь, с, З, д, дд, Жь, ч/%, чч/ Щ, ^ (ДьЖь), ш, шш, Ж, ц/тс, ф, фь, л, лл, ль, льль, м, мм, мь, мьмь, н, нн, нь, ньнь, р, рр, рь, рьрь, й, в, вв, вь, вьвь. Звук ч различается в верховом и низовом произношениях. В верховом он близок к русскому ч, только произносится мягче, а в низовом это аффриката -тч. В литературном языке допустимы оба произношения этого звука. Гласные а0, ё0, о также диалектные (некоторые чувашские говоры в Чувашской Республике и за ее пределами). Гласная а - огубленное а: папа°й - 'дедушка', ха§а°н -'когда'. Гласная ё - огубленное ё: дёр - 'сто' и дё0р - 'земля'. Благодаря тому, что глухая согласная/шипящая согласная, стоящая между двумя гласными или между сонорной (й, л, р, в, н, м) и гласной, озванчиваются, в современном чувашском языке в русских словах появляется звук ДЗ (озвонченное ц): тунец (рыба) - тунеца 'тунец' + аффикс. дат .-вин. падежа = ТУНЬЭДЗА - 'тунцу, тунца'. Это явление хорошо иллюстрирует контекстную зависимость озвончения согласных. С учетом этого можно говорить о 59 согласных в чувашском языке.

Таким образом чувашские полузвонкие Д, З, Г, Ж не являются идентичными русским звонкими д, з, б, г, ж. Так как учет русского произношения в рамках одной модели представляются затруднительным, то в создаваемом синтезаторе было принято решение о замене в русскоязычных словах русских фонем (как звонких, так и глухих) их чувашскими аналогами: бар = Бар, кадр = каДр и т.д. Таким образом, синтезатор произносит неадаптированные русские слова на чувашский манер.

Переход от написания к транскрипции и далее к цепочке звуков осуществляется по буквенно-слоговому принципу. Таким образом, любое слово распадается на набор слогов типа ГС или СГ, или Г. Отдельных согласных в такой модели нет. А слова типа варман, которые невозможно разделить на одни двухбуквенные слоги, представляются как ва+ар-ма+ан. Где знак ’+’ означает необходимость слияния двух фонем в одну. Дело в том, что если бы мы транскрибировали его как ва-р-ма-н, то при звукозаписи одиночных согласных фонем вне контекста гласной (предшествующей или последующей) их произношение сильно отличалось бы от контекстного, и при формировании такой цепочки существовали бы нестыковки амплитуд/уровней, в резуль-

тате чего звучание согласной становилось бы плохо слышным (особенно, если она стоит в конце слова) (рис. 1 и 2). Однако в нашей базе данных существуют все фонемы и по отдельности.

Это сделано для слов типа СГСС, встречающихся как в чувашском, так и в русском языках. В таких случаях нет возможности представить последнюю согласную в виде слога и приходится транскрибировать её по отдельности: ?урт = ?у+ур-т, скирда = с-ки+ир-Да. Что касается чувашских удвоенных согласных, то они рассматриваются нами как одна особая фонема: параппан = па-ра-ппа+ан.

Следующим этапом является формирование в тексте ритмических групп. Дело в том, что для чувашского языка, в отличие от русского, не характерно словесное ударение, при котором звуковой поток распадается на слова. Например в предложении «Мы читаем книгу научного содержания» - три уда-

рения и пять слов. Утверждение лингвистов о наличии в чувашском языке словесного ударения и падения его на последний или первый слог в зависимости от наличия в слове слогов с обычными или краткими гласными основаны на исследовании изолированно произнесенных слов и на непрерывный поток речи не распространяются.

В чувашской речи конечные слоги слов (если они не следуют в конце ритмической группы) теряют характерные просодические признаки и переходят в разряд серединных слогов, а часто, объединяясь с начальным слогом следующего слова, претерпевают фонетические изменения - подвергаются озвончению. То же можно сказать и о первых слогах, которые, объединяясь с конечными слогами предшествующих слов, также подвергаются озвончению. Примеры ритмических групп: Эс уна ан ту = Эсуна анту = эЗуна анДу.

Правило формирования подобных ритмических групп в чувашском языке достаточно простое:

1. Два слова объединяются в ритмическую группу, если последняя буква первого глухая/шипящая согласная, а первая буква второго гласная.

2. Последняя буква первого слова - сонорная согласная/гласная, а первая буква второго слова - глухая /шипящая согласная.

На снове вышеизложенной теории на кафедре компьютерных технологий ЧГУ имени И.Н. Ульянова был впервые создан синтезатор чувашской речи. Продукт в настоящее время проходит а-тестирование.

Литература

1. Баранников В.А., Кибкало А.А., Рыжачкин И.П. Система распознавания непрерывной речи // Труды Казанской школы по компьютерной и когнитивной лингвистике ТБЬ-2002. Казань: Отечество, 2002. С. 62-66.

2. Зиновьева Н.В., Кривнова О.Ф., Захаров Л.М. Программный синтез русской речи («АГАФОН») //. Труды международного семинара по компьютерной лингвистике и ее приложениям Диалог 95. Казань: Полиграф, 1995. С. 121-127.

3. Ибрагимов Т.И. К проблеме фонематического представления орфографического текста в синтезаторе татарской речи // Труда математического центра имени Н.И. Лобачевского. Т. 4. Компьютерная лингвистика. Казань: Унипресс, 1999. С. 84-92.

4. Яковлев П.Я. Чаваш фонетики. Чебоксары: Изд-во Чуваш. ун-та, 2001. 131 с.

ЖЕЛТОВ ПАВЕЛ ВАЛЕРИАНОВИЧ родился в 1982 г. Окончил Чувашский государственный университет. Кандидат технических наук, доцент кафедры компьютерных технологий Чувашского университета. Область научных интересов - лингво-процессоры и системы машинного перевода. Число опубликованных работ - 25.

ЖЕЛТОВ ВАЛЕРИАН ПЕТРОВИЧ родился в 1942 г. Окончил Чувашский государственный педагогический институт им. И.Я. Яковлева и Московский энергетический институт. Кандидат технических наук, профессор, заведующий кафедрой компьютерных технологий, декан факультета дизайна и компьютерных технологий Чувашского государственного университета.

i Надоели баннеры? Вы всегда можете отключить рекламу.