Технологии синтеза речи в обучении лексике английского языка

Клепикова Татьяна Альбертовна; Чухарев-Худилайнен Евгений Михайлович

ПРОБЛЕМЫ ЯЗЫКОЗНАНИЯ И ТЕОРИИ КОММУНИКАЦИИ

Т А. КЛЕПИКОВА, Е М. ЧУXАРЕВ-ХУДИЛАЙНЕН

Татьяна Альбертовна КЛЕПИКОВА — доктор филологических наук, доцент кафедры английского языка и перевода СПбЕЭУ. В 2009 г. защитила докторскую диссертацию. Автор более 100 публикаций.

Сфера научных интересов — когнитивная лингвистика, прикладная лингвистика.

Евгений Михайлович ЧУ^ХАРЕВ-ХУДИЛШНЕН — кандидат филологических наук, профессор-ассистент факультета английского языка Университета штата Айова (США).

В 2009 г. защитил кандидатскую диссертацию по прикладной лингвистике.

Автор 24 публикаций.

Сфера научных интересов — компьютерная лингвистика.

Ъ Ъ Ъ

ТЕХНОЛОГИИ СИНТЕЗА РЕЧИ В ОБУЧЕНИИ ЛЕКСИКЕ АНГЛИЙСКОГО ЯЗЫКА

Системы компьютерного синтеза речи (text-to-speech, TTS) используются для автоматического формирования речевого сигнала по транскрипции или орфографическому представлению содержания сообщения. За последние 10 лет качество систем TTS было существенно улучшено за счет расширения используемых фонетических словарей и моделирования супрассгмснтных единиц. Технологии TTS используются в информационно-справочных системах с речевым доступом, в оперативном формировании публичных объявлений (на вокзалах, в аэропортах и пр.), для информирования операторов о технологических процессах.

Цель настоящего исследования — установить практическую возможность использования технологий TTS для формирования звукового сопровождения изучаемых лексических единиц в контексте изучения английского языка как иностранного, а также степень влияния качества такого сопровождения на успешность и эффективность усвоения лексического материала.

В качестве платформы для проведения исследования была использована адаптивная обучающая система с моделью обучаемого «Лингваториум» (http://linguatorium.ru), разработанная коллективом Центра лингвистических исследований им. A.A. Худякова.

ГРНТИ 16.21.31

Создание лексического тренажера «Лингваториум» было мотивировано необходимостью повышения эффективности обучения английскому языку (в том числе профессионально-ориентированному) в части формирования и совершенствования лексической компетенции. Данная необходимость вызвана объективными сложностями, возникающими в практике преподавания и препятствующими качественному и долговременному усвоению больших объемов терминологически насыщенной лексики. Ситуация обусловлена снижением объемов аудиторной нагрузки и значительным объемом языкового материала (в первую очередь, лексики), который студенты должны освоить самостоятельно. При этом самостоятельное усвоение лексики чаще всего реализуется через работу с графической формой слова, в то время как звуковой формат лексической единицы в процессе самостоятельной работы не задейст-вуется. В результате страдает качество усвоения — успешное узнавание и воспроизведение оказываются возможными только в письменной форме. Другим отрицательным фактором является непрозрачность самостоятельной работы, отсутствие возможности контроля действий обучающихся по усвоению лексики в плане периодичности и продолжительности занятий [1].

Интеграция обучающей системы «Лингваториум» в процесс обучения преследует следующие цели:

• сформировать лексический навык путем закрепления в сознании (ментальном лексиконе) устойчивых ассоциативных связей между графической/звуковой формой слова и его концептуальным содержанием;

• существенно повысить объем усваиваемого лексического материала;

• оптимизировать учебный процесс как для преподавателя, так и для студентов, наполнить значимым содержанием и сделать прозрачной самостоятельную работу студентов, создать регулярный формат работы с возможностью контроля прогресса усвоения и освободить время на аудиторных занятиях для продуктивной речевой деятельности;

• обеспечить индивидуальный режим занятий обучающего, независимый от группы темп обучения.

Для достижения поставленных целей в системе «Лингваториум» были использованы возможности

современных компьютерных технологий и инженерно-лингвистического моделирования речемысли-тельной деятельности человека; лингвистические базы данных (электронные словари, тезаурусы); эргономические резервы (оптимальное для обучающихся распределение учебной нагрузки и технологии индивидуальных занятий); многоуровневая модель лексической памяти; возможности итеративного моделирования памяти с учетом психолингвистических закономерностей процессов усвоения лексики [3].

В рамках системы «Лингваториум» тренинг включает процедуру предъявления лексического материала в виде озвученной карточки лексической единицы, включающей примеры употребления слова, транскрипцию, перевод, и далее — выполнение автоматически генерируемых системой упражнений. Алгоритм автоматической генерации упражнений включает процедуру формирования обучающих воздействий, процедуру подбора дистракторов (с предотвращением семантических коллизий), процедуру моделирования обучаемого. Принципы включения лексической единицы в ротацию определяются в соответствии с закономерностями итеративного научения (количество повторений, порядок повторений, появление лексической единицы в различного рода упражнениях).

Значимым параметром при использовании лексического тренажера «Лингваториум» является корректность восприятия звуковой формы как отдельных слов, так и примеров их употребления в контексте. Обучение фонетическому компоненту восприятия лексической единицы обеспечивается автоматическим озвучиванием. Если при ознакомлении с лексическими карточками доступ к звуковому формату слова и примера осуществляется по инициативе обучаемого (по нажатию соответствующей пиктограммы в пользовательском интерфейсе), то в ходе выполнения упражнений озвучивание происходит автоматически, что исключает ситуацию, когда студент «поленился нажать» пиктограмму оз-вучки и в результате усвоил неверное произношение слова.

Система «Лингваториум» прошла успешную апробацию в ряде образовательных учреждений, результаты пилотных экспериментов (проведенных по двойной слепой методике) представлены в виде докладов на международных конференциях [4] и опубликованы (см.: http://linguatorium.ru/research. ru.html).

Функционал системы «Лингваториум» предоставляет возможности для проведения научных исследований. Процесс обучения в системе является одновременно экспериментальным полигоном: «Лингваториум» не только регистрирует периодичность и продолжительность занятий обучаемых, но и протоколирует все виды взаимодействий с пользователями для дальнейшего анализа. В частности,

78

ПРОБЛЕМЫ ЯЗЫКОЗНАНИЯ И ТЕОРИИ КОММУНИКАЦИИ

формируемый системой протокол позволяет оценить динамику усвоения лексических единиц (их «движение» между блоками лексической памяти ученика, ошибки при выполнении заданий и т. д.) и влияние различных параметров собственно системы и обучающего алгоритма на эффективность усвоения. Результаты исследований принимаются во внимание при дальнейшем совершенствовании функционала системы и оптимизации процесса обучения [2].

Для проведения настоящего исследования все подлежащие изучению лексические единицы были озвучены с использованием автоматических систем речевого синтеза (text-to-speech engines) "Sam" (год выпуска: 2000, разработчик: Microsoft Corporation. США; данная система речевого синтеза является составной частью стандартной поставки операционных систем Windows 2000 и Windows ХР) и "iSpeech" (год выпуска: 2012, разработчик: iSpeech, Inc., США; система была предоставлена компанией-разработчиком для проведения настоящего исследования). Указанные синтезаторы речи были выбраны с тем расчетом, чтобы качество формируемого ими речевого сигнала существенно отличалось. Все пользователи системы «Лингваториум», принявшие участие в экспериментах, акцептовали оферту об оказании дистанционных образовательных услуг, включающую положение о согласии с участием в экспериментальных исследованиях.

Эксперимент № 1

В первом эксперименте приняли участие ученики средней общеобразовательной школы № 2 города Новодвинска Архангельской области: 35 пятиклассников (из них 15 девочек, возраст 11-12 лет) и 8 десятиклассников (из них 4 девушки, возраст 16-17 лет), а также 5 студентов факультета иностранных языков Российского государственного педагогического университета им. А.И. Герцена (девушки, возраст 21-23 года).

Эксперимент проводился с 19 сентября по 8 ноября 2012 г. В ходе эксперимента предъявляемые для освоения в системе «Лингваториум» лексические единицы случайным образом распределялись в два списка: опытный и контрольный. Указанные списки формировались независимо для каждого ученика. В соответствии с двойным слепым принципом организации исследования данные о распределении лексических единиц по спискам хранились на сервере системы «Лингваториум» и были недоступны как для исследователей, так и участников эксперимента вплоть до завершения последнего.

Лексические единицы, включенные в контрольный список, предъявлялись ученикам с голосовым сопровождением Sam, а включенные в опытный список — с сопровождением iSpeech.

В ходе проведения эксперимента один из пользователей отправил через режим «Обратная связь» системы сообщение следующего содержания: «Все очень хорошо, но 1 из озвучивающих голосов звучит с помехами. И очень печально. Это мужской голос, самый низкий, он озвучивает такие слова, как, к примеру, decline, niggling, adverse». (Позднее было определено, что названные данным пользователем лексические единицы были включены в контрольный список.)

После окончания эксперимента из базы данных системы «Лингваториум» был выгружен протокол, фиксирующий все взаимодействия учеников с системой в ходе занятий, а также опытные и контрольные списки лексических единиц. Данные были обезличены путем удаления персональных идентификаторов.

Исследованы следующие показатели:

• чистое время занятий с момента первого предъявления лексической единицы до момента ее закрепления в долговременной памяти по данным обучающего алгоритма;

• количество ошибок при выполнении упражнений различных типов, сформированных для изучения и закрепления каждой лексической единицы.

Статистически достоверных различий между указанными показателями в отношении лексических единиц опытного и контрольного списка обнаружено не было (р » 0,05).

Эксперимент № 2

Для участия во втором эксперименте были случайным образом отобраны 64 пользователя «Лин-гваториума» (26 женщин) в возрасте от 8 до 60 лет (средний возраст 20 лет, SD = 13,5). В ходе занятий в системе с вероятностью 30 % использовалась озвучка Sam, с вероятностью 70 % — озвучка iSpeech, причем на протяжении каждой сессии занятий в системе использовался только один тип озвучки. После окончания каждой сессии пользователю предлагалось ответить на следующий вопрос: «Оцените, пожалуйста, качество голосовой озвучки во время Вашего сегодняшнего занятия: отличное, хорошее,

удовлетворительное, плохое, ужасное». Все ответы пользователей фиксировались в протокольной базе данных. Эксперимент проводился с 8 ноября по 22 ноября 2012 г.

В ходе эксперимента один из пользователей системы отправил через режим «Обратная связь» следующее сообщение: «Звук ужасный, что делать?» (Позднее было определено, что сообщение было отправлено после сессии занятий, в которой использовалась озвучка Sam.)

После окончания эксперимента информация об использованной озвучке и ответах пользователей на указанный вопрос была экспортирована из базы данных системы «Лингваториум» и обезличена путем удаления персональных идентификаторов.

55 из 64 человек (86 %) отметили более высокое качество озвучки iSpeech по сравнению с озвуч-кой Sam.

Выводы

Синтезированная звуковая поддержка является эффективным дополнением к визуальному предъявлению лексических единиц при изучении как терминов, так и единиц общеязыковой лексики.

Несмотря на то, что проведенное исследование не выявило статистически значимого влияния качества озвучки лексических единиц (iSpeech vs.Sam) на скорость и качество усвоения лексики, более качественная озвучка влияет на вовлеченность обучаемых в процесс обучения за счет повышения их мотивации. Кроме того, использование качественных автоматических синтезаторов речи (таких, как исследованный в настоящей работе синтезатор iSpeech), особенно в составе автоматизированных обучающих систем, позволяет существенно сократить трудозатраты при подготовке учебных материалов к практическому курсу английского языка.

ЛИТЕРАТУРА

1. Клепикова ТА. Усвоение лексики: мифы, реальность и компьютерные тренажеры // IV Общероссийская научно-практическая конференция «Особенности профессиональной лингвистики и лингводидактики в техническом вузе»: сб. науч. ст. СПб.: Изд-во Национального минерально-сырьевого университета «Горный», 2012. С. 43-17.

2. Чухарев-Худилайнен Е.М. «Лингваториум»: адаптивная обучающая система и полигон для доказательных лингвистических исследований // Язык и речь в междисциплинарном пространстве: сб. материалов Между-нар. науч.-практ. конф., 12-13 мая 2011 г. СПб.: Изд-во СПбГУЭФ, 2011. С. 201-204.

3. Чухарев-Худилайнен Е.М. Многоуровневая модель лексической памяти в обучающей системе // Прикладная лингвистика в науке и образовании: сб. трудов VI Междунар. науч. конф., 5-7 апр. 2012 г. СПб.: Книжный дом, 2012. С. 299-302.

4. Chukharev-HudilainenE., Klepikova Т. Linguatoriumin Teaching English Writing for Special Purposes. Paper Presentation// Technology for Second Language Learning. Ames: Iowa State University, 2012.

Технологии синтеза речи в обучении лексике английского языка Текст научной статьи по специальности «Науки об образовании»

Аннотация научной статьи по наукам об образовании, автор научной работы — Клепикова Татьяна Альбертовна, Чухарев-худилайнен Евгений Михайлович

Похожие темы научных работ по наукам об образовании , автор научной работы — Клепикова Татьяна Альбертовна, Чухарев-худилайнен Евгений Михайлович

Speech synthesis technologies in English vocabulary instruction

Текст научной работы на тему «Технологии синтеза речи в обучении лексике английского языка»