Научная статья на тему 'Технологии синтеза речи в обучении лексике английского языка'

Технологии синтеза речи в обучении лексике английского языка Текст научной статьи по специальности «Науки об образовании»

CC BY
428
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНЫЕ ОБУЧАЮЩИЕ СИСТЕМЫ / СИНТЕЗАТОРЫ РЕЧИ / УСВОЕНИЕ ИНОЯЗЫЧНОЙ ЛЕКСИКИ / INTELLIGENT TUTORING SYSTEMS / SPEECH SYNTHESIS / FOREIGN LANGUAGE VOCABULARY ACQUISITION

Аннотация научной статьи по наукам об образовании, автор научной работы — Клепикова Татьяна Альбертовна, Чухарев-худилайнен Евгений Михайлович

В статье рассматриваются вопросы использования технологий синтеза речи в адаптивной компьютерной обучающей системе «Лингваториум». Авторы представляют результаты эксперимента по исследованию влияния качества звукового сопровождения на эффективность и успешность усвоения англоязычной лексики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам об образовании , автор научной работы — Клепикова Татьяна Альбертовна, Чухарев-худилайнен Евгений Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Speech synthesis technologies in English vocabulary instruction

The article examines the application of speech synthesizing technologies in the adaptive tutoring system “Linguatorium”. The authors present the results of the experiment, analyzing the impact of synthesized speech quality on the effective and successful acquisition of English vocabulary.

Текст научной работы на тему «Технологии синтеза речи в обучении лексике английского языка»

ПРОБЛЕМЫ ЯЗЫКОЗНАНИЯ И ТЕОРИИ КОММУНИКАЦИИ

Т А. КЛЕПИКОВА, Е М. ЧУXАРЕВ-ХУДИЛАЙНЕН

Татьяна Альбертовна КЛЕПИКОВА — доктор филологических наук, доцент кафедры английского языка и перевода СПбЕЭУ. В 2009 г. защитила докторскую диссертацию. Автор более 100 публикаций.

Сфера научных интересов — когнитивная лингвистика, прикладная лингвистика.

Евгений Михайлович ЧУ^ХАРЕВ-ХУДИЛШНЕН — кандидат филологических наук, профессор-ассистент факультета английского языка Университета штата Айова (США).

В 2009 г. защитил кандидатскую диссертацию по прикладной лингвистике.

Автор 24 публикаций.

Сфера научных интересов — компьютерная лингвистика.

Ъ Ъ Ъ

ТЕХНОЛОГИИ СИНТЕЗА РЕЧИ В ОБУЧЕНИИ ЛЕКСИКЕ АНГЛИЙСКОГО ЯЗЫКА

Системы компьютерного синтеза речи (text-to-speech, TTS) используются для автоматического формирования речевого сигнала по транскрипции или орфографическому представлению содержания сообщения. За последние 10 лет качество систем TTS было существенно улучшено за счет расширения используемых фонетических словарей и моделирования супрассгмснтных единиц. Технологии TTS используются в информационно-справочных системах с речевым доступом, в оперативном формировании публичных объявлений (на вокзалах, в аэропортах и пр.), для информирования операторов о технологических процессах.

Цель настоящего исследования — установить практическую возможность использования технологий TTS для формирования звукового сопровождения изучаемых лексических единиц в контексте изучения английского языка как иностранного, а также степень влияния качества такого сопровождения на успешность и эффективность усвоения лексического материала.

В качестве платформы для проведения исследования была использована адаптивная обучающая система с моделью обучаемого «Лингваториум» (http://linguatorium.ru), разработанная коллективом Центра лингвистических исследований им. A.A. Худякова.

ГРНТИ 16.21.31

© Т.А. Клепикова, Е.М. Чухарев-Худилайнен, 2013

Создание лексического тренажера «Лингваториум» было мотивировано необходимостью повышения эффективности обучения английскому языку (в том числе профессионально-ориентированному) в части формирования и совершенствования лексической компетенции. Данная необходимость вызвана объективными сложностями, возникающими в практике преподавания и препятствующими качественному и долговременному усвоению больших объемов терминологически насыщенной лексики. Ситуация обусловлена снижением объемов аудиторной нагрузки и значительным объемом языкового материала (в первую очередь, лексики), который студенты должны освоить самостоятельно. При этом самостоятельное усвоение лексики чаще всего реализуется через работу с графической формой слова, в то время как звуковой формат лексической единицы в процессе самостоятельной работы не задейст-вуется. В результате страдает качество усвоения — успешное узнавание и воспроизведение оказываются возможными только в письменной форме. Другим отрицательным фактором является непрозрачность самостоятельной работы, отсутствие возможности контроля действий обучающихся по усвоению лексики в плане периодичности и продолжительности занятий [1].

Интеграция обучающей системы «Лингваториум» в процесс обучения преследует следующие цели:

• сформировать лексический навык путем закрепления в сознании (ментальном лексиконе) устойчивых ассоциативных связей между графической/звуковой формой слова и его концептуальным содержанием;

• существенно повысить объем усваиваемого лексического материала;

• оптимизировать учебный процесс как для преподавателя, так и для студентов, наполнить значимым содержанием и сделать прозрачной самостоятельную работу студентов, создать регулярный формат работы с возможностью контроля прогресса усвоения и освободить время на аудиторных занятиях для продуктивной речевой деятельности;

• обеспечить индивидуальный режим занятий обучающего, независимый от группы темп обучения.

Для достижения поставленных целей в системе «Лингваториум» были использованы возможности

современных компьютерных технологий и инженерно-лингвистического моделирования речемысли-тельной деятельности человека; лингвистические базы данных (электронные словари, тезаурусы); эргономические резервы (оптимальное для обучающихся распределение учебной нагрузки и технологии индивидуальных занятий); многоуровневая модель лексической памяти; возможности итеративного моделирования памяти с учетом психолингвистических закономерностей процессов усвоения лексики [3].

В рамках системы «Лингваториум» тренинг включает процедуру предъявления лексического материала в виде озвученной карточки лексической единицы, включающей примеры употребления слова, транскрипцию, перевод, и далее — выполнение автоматически генерируемых системой упражнений. Алгоритм автоматической генерации упражнений включает процедуру формирования обучающих воздействий, процедуру подбора дистракторов (с предотвращением семантических коллизий), процедуру моделирования обучаемого. Принципы включения лексической единицы в ротацию определяются в соответствии с закономерностями итеративного научения (количество повторений, порядок повторений, появление лексической единицы в различного рода упражнениях).

Значимым параметром при использовании лексического тренажера «Лингваториум» является корректность восприятия звуковой формы как отдельных слов, так и примеров их употребления в контексте. Обучение фонетическому компоненту восприятия лексической единицы обеспечивается автоматическим озвучиванием. Если при ознакомлении с лексическими карточками доступ к звуковому формату слова и примера осуществляется по инициативе обучаемого (по нажатию соответствующей пиктограммы в пользовательском интерфейсе), то в ходе выполнения упражнений озвучивание происходит автоматически, что исключает ситуацию, когда студент «поленился нажать» пиктограмму оз-вучки и в результате усвоил неверное произношение слова.

Система «Лингваториум» прошла успешную апробацию в ряде образовательных учреждений, результаты пилотных экспериментов (проведенных по двойной слепой методике) представлены в виде докладов на международных конференциях [4] и опубликованы (см.: http://linguatorium.ru/research. ru.html).

Функционал системы «Лингваториум» предоставляет возможности для проведения научных исследований. Процесс обучения в системе является одновременно экспериментальным полигоном: «Лингваториум» не только регистрирует периодичность и продолжительность занятий обучаемых, но и протоколирует все виды взаимодействий с пользователями для дальнейшего анализа. В частности,

78

ПРОБЛЕМЫ ЯЗЫКОЗНАНИЯ И ТЕОРИИ КОММУНИКАЦИИ

формируемый системой протокол позволяет оценить динамику усвоения лексических единиц (их «движение» между блоками лексической памяти ученика, ошибки при выполнении заданий и т. д.) и влияние различных параметров собственно системы и обучающего алгоритма на эффективность усвоения. Результаты исследований принимаются во внимание при дальнейшем совершенствовании функционала системы и оптимизации процесса обучения [2].

Для проведения настоящего исследования все подлежащие изучению лексические единицы были озвучены с использованием автоматических систем речевого синтеза (text-to-speech engines) "Sam" (год выпуска: 2000, разработчик: Microsoft Corporation. США; данная система речевого синтеза является составной частью стандартной поставки операционных систем Windows 2000 и Windows ХР) и "iSpeech" (год выпуска: 2012, разработчик: iSpeech, Inc., США; система была предоставлена компанией-разработчиком для проведения настоящего исследования). Указанные синтезаторы речи были выбраны с тем расчетом, чтобы качество формируемого ими речевого сигнала существенно отличалось. Все пользователи системы «Лингваториум», принявшие участие в экспериментах, акцептовали оферту об оказании дистанционных образовательных услуг, включающую положение о согласии с участием в экспериментальных исследованиях.

Эксперимент № 1

В первом эксперименте приняли участие ученики средней общеобразовательной школы № 2 города Новодвинска Архангельской области: 35 пятиклассников (из них 15 девочек, возраст 11-12 лет) и 8 десятиклассников (из них 4 девушки, возраст 16-17 лет), а также 5 студентов факультета иностранных языков Российского государственного педагогического университета им. А.И. Герцена (девушки, возраст 21-23 года).

Эксперимент проводился с 19 сентября по 8 ноября 2012 г. В ходе эксперимента предъявляемые для освоения в системе «Лингваториум» лексические единицы случайным образом распределялись в два списка: опытный и контрольный. Указанные списки формировались независимо для каждого ученика. В соответствии с двойным слепым принципом организации исследования данные о распределении лексических единиц по спискам хранились на сервере системы «Лингваториум» и были недоступны как для исследователей, так и участников эксперимента вплоть до завершения последнего.

Лексические единицы, включенные в контрольный список, предъявлялись ученикам с голосовым сопровождением Sam, а включенные в опытный список — с сопровождением iSpeech.

В ходе проведения эксперимента один из пользователей отправил через режим «Обратная связь» системы сообщение следующего содержания: «Все очень хорошо, но 1 из озвучивающих голосов звучит с помехами. И очень печально. Это мужской голос, самый низкий, он озвучивает такие слова, как, к примеру, decline, niggling, adverse». (Позднее было определено, что названные данным пользователем лексические единицы были включены в контрольный список.)

После окончания эксперимента из базы данных системы «Лингваториум» был выгружен протокол, фиксирующий все взаимодействия учеников с системой в ходе занятий, а также опытные и контрольные списки лексических единиц. Данные были обезличены путем удаления персональных идентификаторов.

Исследованы следующие показатели:

• чистое время занятий с момента первого предъявления лексической единицы до момента ее закрепления в долговременной памяти по данным обучающего алгоритма;

• количество ошибок при выполнении упражнений различных типов, сформированных для изучения и закрепления каждой лексической единицы.

Статистически достоверных различий между указанными показателями в отношении лексических единиц опытного и контрольного списка обнаружено не было (р » 0,05).

Эксперимент № 2

Для участия во втором эксперименте были случайным образом отобраны 64 пользователя «Лин-гваториума» (26 женщин) в возрасте от 8 до 60 лет (средний возраст 20 лет, SD = 13,5). В ходе занятий в системе с вероятностью 30 % использовалась озвучка Sam, с вероятностью 70 % — озвучка iSpeech, причем на протяжении каждой сессии занятий в системе использовался только один тип озвучки. После окончания каждой сессии пользователю предлагалось ответить на следующий вопрос: «Оцените, пожалуйста, качество голосовой озвучки во время Вашего сегодняшнего занятия: отличное, хорошее,

удовлетворительное, плохое, ужасное». Все ответы пользователей фиксировались в протокольной базе данных. Эксперимент проводился с 8 ноября по 22 ноября 2012 г.

В ходе эксперимента один из пользователей системы отправил через режим «Обратная связь» следующее сообщение: «Звук ужасный, что делать?» (Позднее было определено, что сообщение было отправлено после сессии занятий, в которой использовалась озвучка Sam.)

После окончания эксперимента информация об использованной озвучке и ответах пользователей на указанный вопрос была экспортирована из базы данных системы «Лингваториум» и обезличена путем удаления персональных идентификаторов.

55 из 64 человек (86 %) отметили более высокое качество озвучки iSpeech по сравнению с озвуч-кой Sam.

Выводы

Синтезированная звуковая поддержка является эффективным дополнением к визуальному предъявлению лексических единиц при изучении как терминов, так и единиц общеязыковой лексики.

Несмотря на то, что проведенное исследование не выявило статистически значимого влияния качества озвучки лексических единиц (iSpeech vs.Sam) на скорость и качество усвоения лексики, более качественная озвучка влияет на вовлеченность обучаемых в процесс обучения за счет повышения их мотивации. Кроме того, использование качественных автоматических синтезаторов речи (таких, как исследованный в настоящей работе синтезатор iSpeech), особенно в составе автоматизированных обучающих систем, позволяет существенно сократить трудозатраты при подготовке учебных материалов к практическому курсу английского языка.

ЛИТЕРАТУРА

1. Клепикова ТА. Усвоение лексики: мифы, реальность и компьютерные тренажеры // IV Общероссийская научно-практическая конференция «Особенности профессиональной лингвистики и лингводидактики в техническом вузе»: сб. науч. ст. СПб.: Изд-во Национального минерально-сырьевого университета «Горный», 2012. С. 43-17.

2. Чухарев-Худилайнен Е.М. «Лингваториум»: адаптивная обучающая система и полигон для доказательных лингвистических исследований // Язык и речь в междисциплинарном пространстве: сб. материалов Между-нар. науч.-практ. конф., 12-13 мая 2011 г. СПб.: Изд-во СПбГУЭФ, 2011. С. 201-204.

3. Чухарев-Худилайнен Е.М. Многоуровневая модель лексической памяти в обучающей системе // Прикладная лингвистика в науке и образовании: сб. трудов VI Междунар. науч. конф., 5-7 апр. 2012 г. СПб.: Книжный дом, 2012. С. 299-302.

4. Chukharev-HudilainenE., Klepikova Т. Linguatoriumin Teaching English Writing for Special Purposes. Paper Presentation// Technology for Second Language Learning. Ames: Iowa State University, 2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.