ПРОБЛЕМЫ ЯЗЫКОЗНАНИЯ И ТЕОРИИ КОММУНИКАЦИИ
Т А. КЛЕПИКОВА, Е М. ЧУXАРЕВ-ХУДИЛАЙНЕН
Татьяна Альбертовна КЛЕПИКОВА — доктор филологических наук, доцент кафедры английского языка и перевода СПбЕЭУ. В 2009 г. защитила докторскую диссертацию. Автор более 100 публикаций.
Сфера научных интересов — когнитивная лингвистика, прикладная лингвистика.
Евгений Михайлович ЧУ^ХАРЕВ-ХУДИЛШНЕН — кандидат филологических наук, профессор-ассистент факультета английского языка Университета штата Айова (США).
В 2009 г. защитил кандидатскую диссертацию по прикладной лингвистике.
Автор 24 публикаций.
Сфера научных интересов — компьютерная лингвистика.
Ъ Ъ Ъ
ТЕХНОЛОГИИ СИНТЕЗА РЕЧИ В ОБУЧЕНИИ ЛЕКСИКЕ АНГЛИЙСКОГО ЯЗЫКА
Системы компьютерного синтеза речи (text-to-speech, TTS) используются для автоматического формирования речевого сигнала по транскрипции или орфографическому представлению содержания сообщения. За последние 10 лет качество систем TTS было существенно улучшено за счет расширения используемых фонетических словарей и моделирования супрассгмснтных единиц. Технологии TTS используются в информационно-справочных системах с речевым доступом, в оперативном формировании публичных объявлений (на вокзалах, в аэропортах и пр.), для информирования операторов о технологических процессах.
Цель настоящего исследования — установить практическую возможность использования технологий TTS для формирования звукового сопровождения изучаемых лексических единиц в контексте изучения английского языка как иностранного, а также степень влияния качества такого сопровождения на успешность и эффективность усвоения лексического материала.
В качестве платформы для проведения исследования была использована адаптивная обучающая система с моделью обучаемого «Лингваториум» (http://linguatorium.ru), разработанная коллективом Центра лингвистических исследований им. A.A. Худякова.
ГРНТИ 16.21.31
© Т.А. Клепикова, Е.М. Чухарев-Худилайнен, 2013
Создание лексического тренажера «Лингваториум» было мотивировано необходимостью повышения эффективности обучения английскому языку (в том числе профессионально-ориентированному) в части формирования и совершенствования лексической компетенции. Данная необходимость вызвана объективными сложностями, возникающими в практике преподавания и препятствующими качественному и долговременному усвоению больших объемов терминологически насыщенной лексики. Ситуация обусловлена снижением объемов аудиторной нагрузки и значительным объемом языкового материала (в первую очередь, лексики), который студенты должны освоить самостоятельно. При этом самостоятельное усвоение лексики чаще всего реализуется через работу с графической формой слова, в то время как звуковой формат лексической единицы в процессе самостоятельной работы не задейст-вуется. В результате страдает качество усвоения — успешное узнавание и воспроизведение оказываются возможными только в письменной форме. Другим отрицательным фактором является непрозрачность самостоятельной работы, отсутствие возможности контроля действий обучающихся по усвоению лексики в плане периодичности и продолжительности занятий [1].
Интеграция обучающей системы «Лингваториум» в процесс обучения преследует следующие цели:
• сформировать лексический навык путем закрепления в сознании (ментальном лексиконе) устойчивых ассоциативных связей между графической/звуковой формой слова и его концептуальным содержанием;
• существенно повысить объем усваиваемого лексического материала;
• оптимизировать учебный процесс как для преподавателя, так и для студентов, наполнить значимым содержанием и сделать прозрачной самостоятельную работу студентов, создать регулярный формат работы с возможностью контроля прогресса усвоения и освободить время на аудиторных занятиях для продуктивной речевой деятельности;
• обеспечить индивидуальный режим занятий обучающего, независимый от группы темп обучения.
Для достижения поставленных целей в системе «Лингваториум» были использованы возможности
современных компьютерных технологий и инженерно-лингвистического моделирования речемысли-тельной деятельности человека; лингвистические базы данных (электронные словари, тезаурусы); эргономические резервы (оптимальное для обучающихся распределение учебной нагрузки и технологии индивидуальных занятий); многоуровневая модель лексической памяти; возможности итеративного моделирования памяти с учетом психолингвистических закономерностей процессов усвоения лексики [3].
В рамках системы «Лингваториум» тренинг включает процедуру предъявления лексического материала в виде озвученной карточки лексической единицы, включающей примеры употребления слова, транскрипцию, перевод, и далее — выполнение автоматически генерируемых системой упражнений. Алгоритм автоматической генерации упражнений включает процедуру формирования обучающих воздействий, процедуру подбора дистракторов (с предотвращением семантических коллизий), процедуру моделирования обучаемого. Принципы включения лексической единицы в ротацию определяются в соответствии с закономерностями итеративного научения (количество повторений, порядок повторений, появление лексической единицы в различного рода упражнениях).
Значимым параметром при использовании лексического тренажера «Лингваториум» является корректность восприятия звуковой формы как отдельных слов, так и примеров их употребления в контексте. Обучение фонетическому компоненту восприятия лексической единицы обеспечивается автоматическим озвучиванием. Если при ознакомлении с лексическими карточками доступ к звуковому формату слова и примера осуществляется по инициативе обучаемого (по нажатию соответствующей пиктограммы в пользовательском интерфейсе), то в ходе выполнения упражнений озвучивание происходит автоматически, что исключает ситуацию, когда студент «поленился нажать» пиктограмму оз-вучки и в результате усвоил неверное произношение слова.
Система «Лингваториум» прошла успешную апробацию в ряде образовательных учреждений, результаты пилотных экспериментов (проведенных по двойной слепой методике) представлены в виде докладов на международных конференциях [4] и опубликованы (см.: http://linguatorium.ru/research. ru.html).
Функционал системы «Лингваториум» предоставляет возможности для проведения научных исследований. Процесс обучения в системе является одновременно экспериментальным полигоном: «Лингваториум» не только регистрирует периодичность и продолжительность занятий обучаемых, но и протоколирует все виды взаимодействий с пользователями для дальнейшего анализа. В частности,
78
ПРОБЛЕМЫ ЯЗЫКОЗНАНИЯ И ТЕОРИИ КОММУНИКАЦИИ
формируемый системой протокол позволяет оценить динамику усвоения лексических единиц (их «движение» между блоками лексической памяти ученика, ошибки при выполнении заданий и т. д.) и влияние различных параметров собственно системы и обучающего алгоритма на эффективность усвоения. Результаты исследований принимаются во внимание при дальнейшем совершенствовании функционала системы и оптимизации процесса обучения [2].
Для проведения настоящего исследования все подлежащие изучению лексические единицы были озвучены с использованием автоматических систем речевого синтеза (text-to-speech engines) "Sam" (год выпуска: 2000, разработчик: Microsoft Corporation. США; данная система речевого синтеза является составной частью стандартной поставки операционных систем Windows 2000 и Windows ХР) и "iSpeech" (год выпуска: 2012, разработчик: iSpeech, Inc., США; система была предоставлена компанией-разработчиком для проведения настоящего исследования). Указанные синтезаторы речи были выбраны с тем расчетом, чтобы качество формируемого ими речевого сигнала существенно отличалось. Все пользователи системы «Лингваториум», принявшие участие в экспериментах, акцептовали оферту об оказании дистанционных образовательных услуг, включающую положение о согласии с участием в экспериментальных исследованиях.
Эксперимент № 1
В первом эксперименте приняли участие ученики средней общеобразовательной школы № 2 города Новодвинска Архангельской области: 35 пятиклассников (из них 15 девочек, возраст 11-12 лет) и 8 десятиклассников (из них 4 девушки, возраст 16-17 лет), а также 5 студентов факультета иностранных языков Российского государственного педагогического университета им. А.И. Герцена (девушки, возраст 21-23 года).
Эксперимент проводился с 19 сентября по 8 ноября 2012 г. В ходе эксперимента предъявляемые для освоения в системе «Лингваториум» лексические единицы случайным образом распределялись в два списка: опытный и контрольный. Указанные списки формировались независимо для каждого ученика. В соответствии с двойным слепым принципом организации исследования данные о распределении лексических единиц по спискам хранились на сервере системы «Лингваториум» и были недоступны как для исследователей, так и участников эксперимента вплоть до завершения последнего.
Лексические единицы, включенные в контрольный список, предъявлялись ученикам с голосовым сопровождением Sam, а включенные в опытный список — с сопровождением iSpeech.
В ходе проведения эксперимента один из пользователей отправил через режим «Обратная связь» системы сообщение следующего содержания: «Все очень хорошо, но 1 из озвучивающих голосов звучит с помехами. И очень печально. Это мужской голос, самый низкий, он озвучивает такие слова, как, к примеру, decline, niggling, adverse». (Позднее было определено, что названные данным пользователем лексические единицы были включены в контрольный список.)
После окончания эксперимента из базы данных системы «Лингваториум» был выгружен протокол, фиксирующий все взаимодействия учеников с системой в ходе занятий, а также опытные и контрольные списки лексических единиц. Данные были обезличены путем удаления персональных идентификаторов.
Исследованы следующие показатели:
• чистое время занятий с момента первого предъявления лексической единицы до момента ее закрепления в долговременной памяти по данным обучающего алгоритма;
• количество ошибок при выполнении упражнений различных типов, сформированных для изучения и закрепления каждой лексической единицы.
Статистически достоверных различий между указанными показателями в отношении лексических единиц опытного и контрольного списка обнаружено не было (р » 0,05).
Эксперимент № 2
Для участия во втором эксперименте были случайным образом отобраны 64 пользователя «Лин-гваториума» (26 женщин) в возрасте от 8 до 60 лет (средний возраст 20 лет, SD = 13,5). В ходе занятий в системе с вероятностью 30 % использовалась озвучка Sam, с вероятностью 70 % — озвучка iSpeech, причем на протяжении каждой сессии занятий в системе использовался только один тип озвучки. После окончания каждой сессии пользователю предлагалось ответить на следующий вопрос: «Оцените, пожалуйста, качество голосовой озвучки во время Вашего сегодняшнего занятия: отличное, хорошее,
удовлетворительное, плохое, ужасное». Все ответы пользователей фиксировались в протокольной базе данных. Эксперимент проводился с 8 ноября по 22 ноября 2012 г.
В ходе эксперимента один из пользователей системы отправил через режим «Обратная связь» следующее сообщение: «Звук ужасный, что делать?» (Позднее было определено, что сообщение было отправлено после сессии занятий, в которой использовалась озвучка Sam.)
После окончания эксперимента информация об использованной озвучке и ответах пользователей на указанный вопрос была экспортирована из базы данных системы «Лингваториум» и обезличена путем удаления персональных идентификаторов.
55 из 64 человек (86 %) отметили более высокое качество озвучки iSpeech по сравнению с озвуч-кой Sam.
Выводы
Синтезированная звуковая поддержка является эффективным дополнением к визуальному предъявлению лексических единиц при изучении как терминов, так и единиц общеязыковой лексики.
Несмотря на то, что проведенное исследование не выявило статистически значимого влияния качества озвучки лексических единиц (iSpeech vs.Sam) на скорость и качество усвоения лексики, более качественная озвучка влияет на вовлеченность обучаемых в процесс обучения за счет повышения их мотивации. Кроме того, использование качественных автоматических синтезаторов речи (таких, как исследованный в настоящей работе синтезатор iSpeech), особенно в составе автоматизированных обучающих систем, позволяет существенно сократить трудозатраты при подготовке учебных материалов к практическому курсу английского языка.
ЛИТЕРАТУРА
1. Клепикова ТА. Усвоение лексики: мифы, реальность и компьютерные тренажеры // IV Общероссийская научно-практическая конференция «Особенности профессиональной лингвистики и лингводидактики в техническом вузе»: сб. науч. ст. СПб.: Изд-во Национального минерально-сырьевого университета «Горный», 2012. С. 43-17.
2. Чухарев-Худилайнен Е.М. «Лингваториум»: адаптивная обучающая система и полигон для доказательных лингвистических исследований // Язык и речь в междисциплинарном пространстве: сб. материалов Между-нар. науч.-практ. конф., 12-13 мая 2011 г. СПб.: Изд-во СПбГУЭФ, 2011. С. 201-204.
3. Чухарев-Худилайнен Е.М. Многоуровневая модель лексической памяти в обучающей системе // Прикладная лингвистика в науке и образовании: сб. трудов VI Междунар. науч. конф., 5-7 апр. 2012 г. СПб.: Книжный дом, 2012. С. 299-302.
4. Chukharev-HudilainenE., Klepikova Т. Linguatoriumin Teaching English Writing for Special Purposes. Paper Presentation// Technology for Second Language Learning. Ames: Iowa State University, 2012.