Многофункциональная интеллектуальная обучающая система русскому языку как иностранному на базе синтезатора и анализатора речи
Лобанов Б.М., доктор технических наук Михалёва Е.В., кандидат филологических наук Петровская Т.С., доктор технических наук Савинов А.П., кандидат технических наук Швец А.В., аспирант
В статье показано, что большинство проблем, возникающих при постановке правильного произношения у иностранных студентов, могут быть эффективно решены с помощью многофункциональной интеллектуальной обучающей системы русскому языку как иностранному (МИОС РКИ), разрабатываемой в НИ ТПУ г. Томск.
Авторами предложена конфигурация МИОС РКИ, состоящая из редакторов занятий и упражнений, планировщика учебных занятий, системы психофизиологического тестирования обучаемого, модели обучаемого, блока проверки упражнений, модуля распознавания ошибок, лингвистического процессора, базы знаний фонетических правил и экспертной системы, определяющей пробелы в знаниях в области фонетики у обучаемого. Кроме этого, в состав системы включены, разработанные в ОИПИ НАН Беларуси синтезатор речи «MuШphone», а также анализатор речи для организации обратной связи с обучаемым.
Показано, что интегрированные в МИОС РКИ синтезатор и анализатор речи являются базовыми элементами, определяющими интеллектуальность фонетического тренажёра. Их применение в системах обучения РКИ позволяет воспроизводить и анализировать тексты любых жанров и различной тематики, что делает возможным использование такого тренажёра в современных гипертекстовых обучающих системах, работающих по различным программам и дисциплинам. Разрабатываемая система рассчитана на дистанционную работу со студентами, как с преподавателем, так и без него — в самостоятельном режиме обучения.
67
Ulli!
• обучающие системы • дистанционное обучение • фонетика русского языка • обучение РКИ • синтез и распознавание речи
• речевые технологии
The article shows that most of the problems, encountered in the production of the correct pronunciation of foreign students, can be effectively solved by the multi-functional intellectual tutoring system of Russian language as a foreign language, which is under development in the Tomsk Polytechnic University.
The authors propose a configuration of this system, which includes classes and exercises editors, classes scheduler, student psychophysiological testing system, student learning model, exercise checking unit, error detection unit, linguistic processor, phonetic rules knowledge base and expert system which identifies gaps in phonetics knowledge of the student. Also system includes a speech synthesizer called «Multiphone» which is developed by National Academy of Sciences of Belarus and a speech analyzer for providing a feedback to the student.
The speech synthesizer and the speech analyzer, integrated into the system as a basic elements, which define the intellectuality of phonetic simulator. Their use in Russian language as foreign language tutoring systems allows playing and analyzing texts of all genres and different topics. It gives an opportunity to integrate the simulator in modern hypertext tutoring systems which are used for teaching. The developed system is designed for remote study with or without teacher in independent study mode.
• teaching systems • distant teaching • russian phonetics • teaching RCI • synthesis and understanding speech • speech technology
Введение
Обучение иностранных студентов фонетике русского языка — одна из важнейших задач в силу ряда причин: методологических, коммуникативных, этических и др. От освоения норм произношения зависит, в первую очередь, успешность овладения всеми видами речевой деятельности [1, 2]. Соотношения «фонема — звук», «фонема — буква», «фонема — смысл», для того чтобы стать психической реальностью, должны пройти путь длительной отработки и «выйти» на уровень автоматизма. Без автоматизма невозможно распознавание фонем и их вариантов и, следовательно, невозможно правильное произношение значимых единиц языка, адекватное отражение на письме звучащей речи (например, в речи китайского студента — «микласкоб» — микроскоп, «как тела» — как дела), распознавание морфем и слов на слух. Кроме того, поскольку грамматические значения и категории часто оформляются в русском языке фонетическими средствами, то ошибки в произношении и восприятии звуков могут стать причиной грамматических нарушений в речи иностранных граждан. Помимо всего прочего, особенности произношения, являющиеся следстви-
68
ем интерференции, маркируют принадлежность к своему (чужому) этни-
ческому сообществу, что формирует общие коммуникативные установки характера
— как позитивного, так и негативного.
В процессе освоения русского языка как иностранного каждый обучающийся сталкивается и с проблемами акцентологического характера: широкий спектр функций ударения (различение лексем и омографов, лексико-грамматических и стилистических вариантов слов) и подвижность (отсутствие правил позиционирования словесного ударения). В ряде случаев могут встречаться сложности в постановке ударения в принципе, если средства его формирования отличаются от средств формирования в родном языке
— как, например, в случае, если первый (родной) язык имеет тонический характер ударения.
Освоение фонетики, кроме всего прочего, предполагает формирование автоматического навыка использования интонационных конструкций в зависимости от коммуникативной ситуации. Поскольку функции интонации не ограничиваются собственно фонетическим уровнем — ритмической организацией речи, то её освоение определяет и эффективность коммуникации в прагматическом аспекте: уточнение содержания, выражение актуальной информации, интенций и коннотаций в первую очередь.
Опыт преподавания РКИ показывает, что среди изучающих русский язык встречается 1-2% людей, имеющих психоневрологические или логопедические проблемы, причём не во всех странах эти проблемы осознаются, и по их поводу принимаются адекватные решения. Такая ситуация предполагает не просто создание гибкой индивидуальной образовательной траектории, а тщательного индивидуального подхода и индивидуальной отработки навыков использования единиц фонетического уровня языка и речи.
Таким образом, эффективное овладение языком на фонетическом уровне определяет эффективность протекания целого ряда психофизиологических процессов: распознавания звуковых сигналов и их идентификации, понимания речи, продуцирования разных форм речи — как устной, так и письменной. Использование индивидуализации в обучении, в свою очередь, позволяет решить ряд вопросов, связанных с особенностями субъекта, осваивающего язык, с особенностями влияния родного (первого) языка, особенностями ряда внешних факторов, в первую очередь, обучающей (образовательной) среды. Именно влиянием этих факторов обусловлено стремление создать гибкую обучающую систему, представляющую собой и симулятор речи, и речевой тренажёр одновременно. Это стремление поддерживается и задачами организации эффективной самостоятельной работы студента / слушателя.
Актуальность использования такой многофункциональной обучающей системы в условиях интернационализации образования, индивидуализации подходов к освоению образовательных программ, изменения стратегий восприятия и переработки информации со стороны молодёжи (предпочтительно визуальный канал восприятия, отказ от аналитического чтения, гипертекстовая стратегия получения информации) поддерживается таким фактором, как доступность подобных обучающих ресурсов и возможность дистанционного их использования.
Эта система призвана решить и задачи освоения иностранными студентами фонетики русского языка, что особенно актуально, если учитывать специфику контингента иностранных студентов Томского политехнического университета (ТПУ) — почти половину составляют представители стран АТР, для которых освоение фонетики и графики русского языка представляет значительную сложность.
69
Задачи, которые ставят лингвисты перед разработчиками такой системы, состоят в предоставлении обучающемуся субъекту ряда возможностей, таких как:
1) слушать русскую речь в её нормативном варианте, в мужском и женском
исполнении;
2) видеть произносимый текст в графическом (буквенном) виде;
3) слышать самостоятельно набранный текст любого жанра;
4) отрабатывать с использованием механизмов имитации произношение отдельных:
• фонем / звуков;
• слогов;
• фонетических слов;
• синтагм и фраз;
5) отрабатывать нормы русского ударения, а также контекстуального разграни-
чения омографов;
6) отрабатывать использование интонационных конструкций посредством ими-
тации;
7) одновременно со звуком иметь возможность видеть транскрипционное изо-
бражение этих сегментных единиц, а также изображение артикуляционных органов и акустических фонограмм (для восприятия так называемых «психологических фонем» [3]).
Большинство проблем, возникающих при обучении РКИ при постановке правильного произношения у иностранных студентов, может быть эффективно решено с помощью описываемой ниже многофункциональной интеллектуальной обучающей системы русскому языку как иностранному — МИОС РКИ.
Функциональная схема МИОС РКИ
Функциональная схема МИОС РКИ представлена на рис.1. В состав МИОС РКИ входят редакторы занятий и упражнений, планировщик учебных занятий, система психофизиологического тестирования обучаемого, модель обучаемого, блок проверки упражнений, модуль распознавания ошибок, лингвистический процессор, синтезатор и анализатор речи, база знаний фонетических правил и экспертная система, определяющая пробелы в знаниях в области фонетики у обучаемого.
На первом занятии с МИОС РКИ обучаемый проходит специальное психофизиологическое тестирование для определения оптимальной стратегии его обучения. В состав модуля тестирования входят следующие функциональные модули:
• анкетирование — документ, в котором студент указывает общие сведения
о себе. К таким сведениям относятся: национальность, возраст, уровень образования и другие сведения, учёт которых необходим для формирования индивидуального обучения;
• личностное тестирование — тест, направленный на получение информации о
личностных качествах студента: восприятие, внимание, память, мышление,
70
темперамент, характер, его способность к обучению;
Рис.1. Функциональная схема МИОС РКИ
• входной контроль — специально составленные задания, которые помогают определить уровень начальных знаний студента по русскому языку и установить особенности артикуляции его речевых органов.
Совокупность вышеперечисленной информации формирует модель обучаемого, которая отражает индивидуальные черты конкретного студента. Анкета обучаемого, психофизиологическое тестирование и входной контроль отображают статические характеристики студента. Чтобы система могла осуществлять объективное управление в течение всего процесса обучения студента, в модель обучаемого поступают результаты его текущей успеваемости. Это позволяет системе оперативно оценивать эффективность усваивания им учебного материала и соответственно корректировать, если это необходимо, в модуле планировщика учебных занятий его индивидуальный учебный план обучения. Данный модуль осуществляет формирование тематической последовательности проведения уроков и их наполнение для каждого студента, работающего с тренажёром.
Разрабатываемая система рассчитана на работу как с преподавателем, так и без него — в самостоятельном режиме обучения. Преподаватель может вручную изменять стратегию обучения каждому студенту, если посчитает, что стратегия, составленная тренажёром, недостаточно оптимальна.
Упражнения и справочный грамматический материал РКИ, хранящиеся в базе данных тренажёра, позволяют изучать следующие разделы фонетики:
1. Звуки: а) гласные; б) согласные; в) буквы алфавита;
71
2. Произношение: а) слогов; б) слов; в) фраз;
3. Интонация: интонационные конструкции ИК1, ИК2, ИК3, ИК4, ИК5, ИК6, ИК7;
4. Аудирование: а) диктант; б) изложение; в) пересказ.
Текст упражнения подаётся на вход лингвистического процессора, который обрабатывает входной поток данных и передаёт решение в блок проверки упражнений, а также, при необходимости, формирует команды синтезатору речи, формируя корректный интонационный контур. Синтезатор речи озвучивает упражнение, чтобы показать, как правильно должно звучать то или иное слово и как изменяется интонация в процессе чтения данного текста. Одновременно с этим на экране монитора обучаемого тренажёр отображает транскрипционную форму и эталонный график изменения основного тона озвучиваемого им текста.
После прослушивания текста обучаемый имеет возможность произнести его в микрофон. Таким образом, в тренажёре организована обратная связь, позволяющая оценить эффективность процесса обучения. Речевой сигнал поступает в анализатор речи, который отображает на экране монитора транскрипцию и график изменения основного тона произнесённых звуков для сравнения с эталонными характеристиками указанных параметров озвученного ранее синтезатором текста.
Модуль распознавания речевых ошибок автоматически осуществляет сравнение образца с реальным звучанием, регистрирует ошибку и передаёт информацию о ней в экспертную систему, где ошибка квалифицируется и через модель обучаемого корректируется стратегия дальнейшего его обучения. При возникновении у студента затруднений с выполнением задания в отсутствии преподавателя система подсказок по его желанию осуществляет поэтапную помощь в виде последовательности подсказок:
1. Перевод упражнения на родной язык обучаемого.
2. Отображение правила, на которое подготовлено данное упражнение.
3. Ознакомление с алгоритмом выполнения упражнения аналогичного типа.
4. Выдача ответа на поставленное планировщиком занятий задание.
Экспертная система отправляет отчёт о статусе выполнения задания в базу данных результатов, а также через систему подсказок формирует рекомендации по дальнейшему освоению материала.
Интерфейсный модуль студента выводит информацию по следующим пунктам:
1. Анализ транскрипции.
2. Анализ основного тона обучаемого.
3. Анализ ошибок и фонетические правила, которые необходимо повторить.
72
4. Отображение движения артикуляционных органов.
Анализ транскрипции указывает на место в тексте, где обучаемый неправильно произнёс звук. Анализ основного тона позволяет обучаемому сравнить эталонный график основного тона со своим собственным и скорректировать интонацию при повторном выполнении упражнения. Анализ ошибок и фонетические правила, которые необходимо повторить, позволяют студенту освежить знания и для их закрепления выполнить дополнительные упражнения по данной теме. Отображение движения артикуляционных органов показывает студенту, как правильно осуществлять движение органов артикуляции, чтобы исключить зафиксированную ошибку в произношении слова.
Интерфейсный модуль преподавателя выводит такую же информацию, позволяя преподавателю отслеживать эффективность процесса обучения каждого студента и корректировать ранее установленные индивидуальные планы обучения.
Синтезатор речи
Интегрированный в МИОС РКИ синтезатор речи по тексту (СРТ) является одним из базовых элементов, определяющих интеллектуальность фонетического тренажёра. Применение синтезаторов речи в системах изучения РКИ позволяет воспроизводить тексты любых жанров и различной тематики, что делает возможным его использование в современных гипертекстовых обучающих системах, работающих по различным программам и дисциплинам.
Аудиовизуальный синтезатор русской речи для фонетического тренажёра ТПУ разработан в Лаборатории распознавания и синтеза речи Объединённого института проблем информатики НАН Беларуси. Теоретические основы и принципы построения используемого СРТ подробно описаны в [4].
Модульная структура СРТ представлена на рис. 2, где модули, управляющие последовательностью действий других модулей, называются контроллерами, в то время как модули, реализующие алгоритмы обработки текста или речевого сигнала, называются процессорами.
Рис. 2. Модульная структура синтезатора речи
73
Чт lii .J ,. JJSo Лобанов Б.М., Михалева Е.В., Петровская Т.С., Савинов А.П., Швец А.В. Многофункциональная интеллектуальная обучающая система русскому языку как иностранному на базе синтезатора и анализатора речи
74
Главный контроллер системы управляет последовательностью преобразований входных данных, получая на каждом этапе промежуточный результат и передавая его на обработку на следующий этап. Контроллер нормализации текста производит удаление из текста символов, не нужных для синтеза речи, убирает случайное дублирование знаков препинания, заменяет похожие символы на один, очищает входной текст от недопустимых символов, используя для этого списки букв языка, знаков препинания, а также правила замены символов.
«Очищенный» таким образом текст подаётся на вход лингвистического контроллера, выходом которого является просодически размеченный текст. Преобразованный текст поступает на вход фонетического процессора, который осуществляет преобразования «буква — фонема», «фонема — аллофон», затем — на вход просодического процессора, который устанавливает текущие значения амплитуды, частоты основного тона и длительности каждого аллофона. Просодически размеченный аллофонный текст поступает затем на вход акустического процессора, который генерирует речевой сигнал с использованием БД звуковых волн аллофонов и мультифонов. Результат преобразований поступает в контроллер формата выходных данных, который осуществляет преобразование в нужный формат: wav или тр3.
В синтезаторе речи реализована возможность работы в 3-х режимах:
1. Режим интонирования произвольных неразмеченных орфографических текстов.
2. Режим интонирования орфографических текстов, размеченных в соответствии требованиям реализации интонационных конструкций (ИК1 — ИК7).
3. Режим отображения на экране дисплея синхронного с произносимыми звуками движения артикулярных органов человека.
В каждом из режимов СРТ обеспечивает:
• возможность 3-кратного замедления или ускорения нормального (среднего) темпа речи;
• задание желаемого регистра и диапазона высоты голоса путём изменения значений РоШ1П и Ротал;
• выбор мужского или женского голоса;
• возможность задания речевой паузы в любом месте текста путём вставки в текст желаемого количества значков ##...#, задающих длительность паузы, кратную 0,25 секунды;
• возможность пополнения и редактирования грамматического словаря русского языка с помощью редактора словаря — VocablEditor;
• возможность снятия омографической неопределённости слов с помощью редактора омографов — HomogEditor;
• отображение на экране дисплея синхронно с произносимым звуком движения артикулярных органов человека (изображение в анфас и в разрезе).
В режиме интонирования неразмеченных орфографических текстов СРТ дополнительно обеспечивает автоматическую разметку на синтагмы, выделенные слова и интонационные типы, характерные для деловых текстов. Предусмотрена также возможность совместной работы СРТ и лингвистического процессора [5]. Озвучиваемый текст в нормативной орфо-
графической записи подвергается полному синтаксическому анализу, осуществляемому парсером ЭТАП-3, который членит текст на отдельные предложения, выделяет эмфатические элементы, устанавливает границы речевых синтагм с помощью специальных правил, применяемых к синтаксической структуре. Система речевого синтеза «Мультифон» обрабатывает эту информацию и определяет длительность пауз между синтагмами в зависимости от интонационного типа предложения, а также характер акцентов внутри синтагм. Попутно в формирующейся гибридной системе речевого синтеза частично решается критическая для такой системы задача различения омографов: полное её разрешение возможно только с опорой на семантические структуры.
В режиме интонирования размеченных преподавателем текстов СРТ дополнительно обеспечивает интонирование фраз в соответствии с определёнными правилами задания требуемых интонационных конструкций (ИК1 — ИК7). В режиме интонирования предварительно размеченных преподавателем текстов СРТ дополнительно обеспечивает интонирование фраз в соответствии с определёнными правилами задания требуемых интонационных конструкций (ИК1 — ИК7) [6]. Например:
Сегодня холодно. Сегодня холодно? Какая у него машина? Какая у него машина!
Здесь цифра указывает на номер используемой ИК, а её позиция — на положение интонационного центра фразы.
Анализатор речи
Анализатор речи (АР) построен на базе технологии клонирования голоса [4] с использованием метода анализа через синтез. Функциональная схема АР представлена на рис. 3. Текст слова или фразы, произносимых в процессе обучения, поступает на вход СРТ, который осуществляет синтез РС с нормативной интонацией и произношением звуков и его фонемную разметку. Далее проводится формантный анализ и нормализация формант-ных параметров [7] синтезированного и естественного речевых сигналов одинакового текстового содержания. Затем осуществляется нелинейное по времени сопоставление синтезированных и естественных речевых сигналов методами динамического программирования (ДП-сопоставление). При этом происходит автоматический перенос фонемных меток с синтезированного на естественный речевой сигнал и, таким образом, осуществляется автоматическая фонемная маркировка произнесённого речевого сигнала. На последних этапах осуществляется вычисление фонетической и интонационной мер сходства с нормализированных формантных параметров синтезированного и произнесённого РС, визуализация и оценка результатов.
Результатом формантного анализа и их нелинейного по времени сопоставления является нормализованный набор фонетически размеченных (транскрибированных) формант-ных параметров, включающих:
• амплитуду сигнала (силу звука) — АО и частоту основного тона (высоту звука) — F0, опре-
деляющих интонацию речи;
• частоты 1-й, 2-й и 3-й формант (артикуляцию звуков) — F1, F2, F3, определяющих фоне-
тическое качество звуков речи.
75
Анализатор речи (АР) реализован в двух режимах работы:
• режим сопоставления и оценки сходства звукового состава произносимых зву-
ков и слов с эталонами;
• режим сопоставления и оценки сходства интонации произносимых фраз с эта-
лонами в рамках ПАЕ-модели [4].
Рис. 3. Модульная структура анализатора речи [7]
Программная реализация этих режимов во многом сходна с описанными в [4] системами ФоноКлонатор и ИнтоКлонатор соответственно.
Структурная схема дистанционной системы обучения
Работа МИОС РКИ построена по системе «клиент — сервер», что позволяет поддерживать возможность единовременной обработки до 20 запросов и осуществлять с удалённого терминала разнообразные настройки системы, такие как постановка ударения, выбор интонационной конструкции и регулирование параметров воспроизведения — громкости и темпа речи.
76
Структурная схема работы образовательной системы в целом, обеспечивающей организацию дистанционного обучения студентов, изображена на рис. 4.
Дистанционная система обучения РКИ состоит из следующих основных компонентов:
Рис. 4. Структурная схема дистанционной системы обучения РКИ
АРМ подготовки и редактирования текстов
АРМ подготовки и редактирования текстов (АРМТ) предназначено для создания набора отредактированных текстов, озвучиваемых синтезатором речи и используемых в процессе обучения устной речи: слушанию (слуховому восприятию и пониманию) и говорению (произношению звуков и интонированию). АРМТ реализуется на связанном с сервером персональном компьютере (ПК), как это представлено на рис. 5.
АРМТ в составе ПО персонального компьютера включает: синтезатор речи по тексту — Multiphone; редактор словаря — VocablEditor; редактор омографов — HomogEditor; редактор интонационных конструкций — ^^^г; синтаксический редактор — SyntEtap.
Синтезатор речи по тексту — Multiphone — используется во всех задачах обучения РКИ для слухового контроля редактируемых текстов.
Редактор словаря — VocablEditor — используется во всех задачах обучения РКИ для автоматического пополнения словаря синтезатора речи. Для этого вводимые тексты проверяются программой VocablEditor и в словарь добавляются слова, у которых отсутствовало словесное ударение.
77
Pcjah'TUJ» f IUK:I|IM VocablEditnr
1
PcjsKivf ммтрэфоо HnmogEiliror
Сншяксичккнй pcjJ ктор П1Е1Я[]
Haoop orp ua ktii|) сван н ьп
текчч rjt ic 0Т-1£1Ы4ЫЧ МДаЧЛЧ, этапам н урокам обучения
ПК
Редактор
ItHHiHÜHIEIIHHhll
КИКГРУКПИЙ [К E4U«
т
Нгаодрые теисты к отдельным задачам, этапами урокам обучения
Бви прослушивание н редактирование т£игто»
1
Синтезатор ре<п Mulliphoüe
\
Г
9
Рис. 5. Автоматизированное рабочее место подготовки и редактирования текстов
78
Редактор омографов — HomogEditor — используется во всех задачах обучения РКИ для снятия омографической неопределённости слов. Для этого вводимые тексты проверяются программой HomogEditor и в найденных словах-омографах методистом-преподавателем проставляется ударение в нужном месте либо заменяется буква [Е] на букву [Ё].
Редактор интонационных конструкций — ^^^г — используется в задачах освоения интонации русской речи. Для этого вводимые тексты — набор монологических и диалогических текстов различной степени сложности — размечаются методистом-преподавателем по определённым правилам для задания требуемых интонационных конструкций (ИК1 — ИК7).
Синтаксический редактор — SyntEtap — используется в задачах обучения слуховому восприятию и пониманию текстов высокой сложности. Для этого вводимые предложения с помощью программы SyntEtap [5] автоматически и (или) вручную преподавателем размечаются на синтагмы, выделенные слова и интонационные типы, характерные для деловых или художественных текстов.
АРМ подготовки и редактирования звуков
АРМ подготовки и редактирования звуков (АРМЗ) предназначено для создания набора отредактированных звуковых файлов, используемых в составе подсистем синтеза и анализа речи. Эти подсистемы являются ядром описываемой системы обучения устной речи: слушанию (слуховому восприятию и пониманию) и говорению (произношению звуков и интонированию).
АРМЗ реализуется на связанном с сервером ПК, как это представлено на рис. 6. АРМЗ в составе ПО ПК включает:
• синтезатор речи по тексту — МиШрЬюпе;
• анализатор речи — SpeechAnalyzer;
• звуковой клонатор — РЬюпоСЬпа^г;
• интонационный клонатор — 1п1оС1опа1ог;
• звуковой редактор — SoundForge.
Рис. 6. Автоматизированное рабочее место подготовки и редактирования звука
Синтезатор речи по тексту — МиШрЬюпе — используется для слухового контроля натуральности звучания синтезированных звуков речи и интонации фраз в процессе редактирования фонетических и просодических БД синтезатора.
Анализатор речи — SpeechAnalyzer — используется для автоматической оценки сходства произносимых звуков и интонации фраз с эталонами. Для этого нормативно произносимые учителем в микрофон слова и фразы сопоставляются программой SpeechAnalyzer с синтезированными эталонами. При их неудовлетворительном совпадении осуществляется редактирование соответствующих элементов фонетических и просодических БД синтезатора.
Звуковой клонатор — РЬюпоС1опа1ог — используется для корректировки звуковых БД (аллофонов и аллослогов) существующих «голосов» синтезатора, а также для создания новых мужских и женских голосов. Подробное описание принципов работы звукового клонатора дано в монографии [4].
79
Интонационный клонатор — МоСЬпаК^—используется для корректировки существующих просодических БД синтезатора (мелодических и энергетических «портретов»), а также для создания новых просодических стилей речи и интонационных конструкций (ИК1 — ИК7). Подробное описание принципов работы интонационного клонатора дано в монографии [4].
Звуковой редактор — SoundForge — или другое стандартное средство для работы со звуком — используется для записи и редактирования звуков при корректировке звуковых и просодических БД.
Заключение
Сформулированным во введении требованиям к системе обучения иностранных студентов фонетике русского языка на современном программном рынке РФ в той или иной мере отвечают две компьютерные обучающие системы: «Звуковой тренажёр» (Институт проблем управления РАН, г. Москва, [8]) и «Профессор Хиггинс» (ООО «ИстраСофт», г. Москва, [9]).
Для сравнения в таблице 1 вместе с характеристиками МИОС РКИ приведены характеристики указанных выше систем обучения фонетике русского
Разработанный коллективом ИПУ РАН звуковой тренажёр предназначен для обучения правильному произношению звуков речи русского языка [8].
К достоинствам данного тренажёра можно отнести организацию различных способов контроля качества произношения обучаемым звуков русского языка:
• В тренажёре показывается схематическое изображение анимации речевого
тракта в момент произнесения изучаемого звука.
• Осуществляется визуальный артикуляционный контроль произношения звуков
русской речи по положению губ путём сравнения эталонного изображения с
изображением движения губ обучаемого.
• Производится графический контроль путём сопоставления фонограммы звука,
произнесённой обучаемым, с эталонной.
К недостаткам звукового тренажёра следует отнести маленький объём предлагаемых им услуг по изучению фонетики русского языка. В настоящее время он позволяет изучать только произношения фонем и слогов русского языка.
Наиболее полными функциональными возможностями обладает фонетический справочник-тренажёр русского языка «Профессор Хиггинс», охватывающий все основные аспекты обучения языку, цель которого — помочь обучаемому самостоятельно научиться слышать и понимать разговорную русскую речь на элементарном уровне [9].
К достоинствам данного фонетического тренажёра можно отнести следующее:
• Курс построен в виде полного мультимедиасправочника-тренажёра русского языка, рассчитанного на элементарный уровень обучения РКИ, который включает в себя разделы, начиная от произношения отдельных звуков, слогов, слов,
языка.
80
изучения интонации синтагм и кончая аудированием и разговорником.
• Наличие обратной связи с обучаемым через систему распознавания произносимой им речи.
• Организация разнообразных способов контроля произношения звуков русской речи: акустический контроль, графическое отображение звуков, определённой частоты, а также анимационное изображение механизма движения органов речи для произносимых звуков и слогов.
Таблица 1
Сравнительные характеристики фонемных тренажёров РКИ
№ Наименование фонемных тренажёров РКИ Звуковой тренажёр ИПУ РАН, Москва Профессор Хиггинс (ООО ИстраСофт), Москва МИОС РКИ ТПУ, Томск
Параметры тренажёра Виды контроля Виды контроля Виды контроля
< со £ к ср < < со £ к ср < < со £
1 Произношение Фонемы о + + + + + +
э + + + + + + + +
Слоги о + + + + + +
э + + + + + + + +
Слова о + + + +
э + + + + +
2 Словесное ударение о + + +
э + + + +
3 Интонация о + + +
э + + +
4 Произвольное озвучивание текста о нет нет да
э нет нет Синтезатор речи
5 Число дикторов 1 1 2 (муж. и жен.)
6 Возможность дистанционного обучения да нет да
7 Адаптивная стратегия обучения нет нет да
8 Интеллектуальная помощь обучаемому нет нет да
таблице 1: Ак. — акустический анализ, произносимых звуков, Гиз. — графическое отображение эталонных и произносимых обучаемым звуков, Арт. — анимационное изображение механизма движения органов речи, О — обучаемый, Э — эталонный.
81
В
К недостаткам тренажёра «Профессор Хиггинс» можно отнести следующее:
— Тренажёр рассчитан на самостоятельное изучение русского языка. Однако в тренажёре отсутствует интеллектуальная компонента, организующая помощь пользователю в виде последовательности подсказок в случае возникновения у него затруднений.
— Тренажёр не позволяет автоматически адаптировать стратегию обучения с учётом индивидуальных особенностей обучаемого, а также результатов текущего контроля его знаний.
— В тренажёре отсутствует экономически рентабельная возможность организации дистанционного обучения под руководством преподавателя или тьютора.
— Несмотря на то, что тренажёр отнесён разработчиками к категории справочников, возможности его в этом направлении ограничены элементарным уровнем и тем словарным запасом, который заложен в него.
— Анализ и оценка правильности интонации произношения предложений тренажёром не осуществляются. Обучаемый может судить об этом только на качественном уровне, сравнивая акустическое воспроизведение своей фонограммы с эталонной.
Как видно из таблицы 1, описанная в данной статье многофункциональная интеллектуальная обучающая система русскому языку как иностранному на базе синтезатора и анализатора речи учитывает достоинства и во многом устраняет недостатки рассмотренных систем обучения фонетике русского языка. В настоящее время МИОС РКИ находится на стадии экспериментального макетирования путём объединения отдельных узлов и тестирования системы в целом. Объединение многолетнего опыта разработки систем анализа и синтеза речи в ОИПИ НАН Беларуси и десятилетний опыт в обучении иностранных студентов в Томском политехническом университете позволяют надеяться на успешное решение поставленных задач.
1. Бернштейн С.И. Вопросы обучения произношению (применительно к преподаванию русского языка иностранцам). Вопросы фонетики и обучение произношению. М: Изд-во Моск. ун-та, 1975.
2. Бузанова Т.В. Роль и место фонетики в процессе обучения иностранцев русскому языку на начальном этапе // Русская и сопоставительная филология: Лингвокультурологический аспект / Казан. гос. ун-т. Филол. фак-т. Казань: Казан. гос. ун-т, 2004. С. 53-56.
3. Журавлёв А.П. Звук и смысл: Кн. для внеклас. чтения учащихся ст. классов. 2-е изд., испр. и доп. М.: Просвещение, 1991.
4. Лобанов Б.М., ЦирульникЛ.И. Компьютерный синтез и клонирование речи. Минск: Белорусская Наука, 2008.
5. Иомдин Л.Л., Лобанов Б.М., Гецевич Ю.С. Говорящий «ЭТАП». Опыт использования синтаксического анализатора системы ЭТАП в русском речевом синтезе // Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог'2011». М.: Изд-во РГГУ, 2011. Вып. 10(17). С. 669-679.
6. Интонация. Перечень интонационных конструкций //http:/www.philol.msu.ru~fonetica/ index1.htm
7. Lobanov B., Davydov А. On the Way to Precise and Robust Formant Frequencies Tracking // Speech and Computer: proceedings of the 13-th International conference SPECOM'2009, St.-Petersburg, Russia, 21-25 June, 2009 / Institute of Informatics and Automation of RAS, Speech Informatics Group. P. 615-618.
Литература
82
8. Абраменков А.Н., Мясоедова М.А., Петухова Н.В., Паршакова А.А., Душкин Д.Н., Фархадов М.П. Компьютерный речевой тренажёр как новый мультимедийный Интернет-сервис // Анализ разговорной русской речи (АР3-2011): Труды пятого междисциплинарного семинара. СПб.: ГУ АП, 2011. С. 71-77.
9. Профессор Хиггинс. Русский без акцента! //http://www.istrasoft.ru/ru/programmy/professor-higgins-russkij-bez-akcenta.html
Сведения об авторах
Лобанов Борис Мефодьевич,
доктор технических наук, профессор, главный научный сотрудник Лаборатории распознавания и синтеза речи ОИПИ НАН Беларуси, профессор Университета в Белостоке (Польша), основатель и лидер научной школы по проблеме распознавания и синтеза речи. Область научных интересов: теория и методы синтеза, распознавания и понимания устной речи, речевые технологии, компьютерная лингвистика. E-mail: [email protected]
Михалёва Елена Владимировна,
кандидат филологических наук, практический психолог. Заведующая кафедрой русского языка как иностранного Института международного образования Томского политехнического университета. Область научных интересов: лексикология и мотивология, когнитивные и психолингвистические аспекты освоения неродного языка, юридическая лингвистика.
Петровская Татьяна Семеновна,
доктор технических наук, зам. проректора по образовательной и международной деятельности Томского политехнического университета. Область научных интересов: проблемы качества инженерного образования, международное образование и межкультурная коммуникация. Email: [email protected]
Савинов Анатолий Павлович,
кандидат технических наук, заведующий Лабораторией компьютерной лингвистики и интеллектуальных обучающих систем, доцент Междисциплинарной кафедры Института международного образования и языковой коммуникации Томского политехнического университета. Область научных интересов: искусственный интеллект, речевое общение с ЭВМ на естественном языке, интеллектуальные обучающие системы. Email: [email protected]
Швец Антон Васильевич,
аспирант Междисциплинарной кафедры Института международного образования и языковой коммуникации Томского политехнического университета. Область научных интересов: объектно-ориентированное программирование, искусственный интеллект. Email: [email protected]
83