УДК 372.881.1 Б01: 10.18720/ИиМ/188К 2227-8591.33.03
В.А. Дорожкина, М.А. Ивлева
ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА В ОБУЧЕНИИ СТУДЕНТОВ ЛИНГВИСТИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ
ДОРОЖКИНА Влада Алексеевна - магистрантка кафедры иностранных языков гуманитарного факультета; Новосибирский государственный технический университет.
ул. К. Маркса, 20, г. Новосибирск, 630073, Россия. e-mail: [email protected]
DOROZHKINA Vlada A. - Novosibirsk State Technical University.
20, K. Marksa, Novosibirsk, 630073, Russia. e-mail: [email protected]
ИВЛЕВА Марина Анатольевна - кандидат филологических наук, доцент кафедры иностранных языков гуманитарного факультета; Новосибирский государственный технический университет. Член Ассоциации преподавателей перевода.
ул. К. Маркса, 20, г. Новосибирск, 630073, Россия. e-mail: [email protected]
IVLEVA Marina А. - Novosibirsk State Technical University. Association of Translation Teachers member
20, K. Marksa, Novosibirsk, 630073, Russia. e-mail: [email protected]
Развитие технологий и улучшение качества машинного перевода привело к появлению нового вида деятельности - постредактирования. Процесс включает в себя редактирование машинного перевода для достижения качества, близкого к профессиональному переводу, выполненному человеком изначально. Проблема заключается в том, что на данный момент профессии постредактора машинного перевода не обучают в российских вузах, несмотря на ее востребованность и актуальность на переводческом рынке. В статье рассматривается вопрос необходимости внедрения постредактирования машинного перевода в программу обучения студентов лингвистических вузов, в том числе и тех, для кого перевод не является профильным направлением. На теоретическом уровне статья описывает разницу между постредактированием, редактированием и переводом. В статье приводится сопоставительный анализ программ обучения постредактированию машинного перевода в зарубежных вузах для выявления аспектов, которые будут выступать опорными точками при составлении российской программы обучения постредактированию. На практическом уровне оценивалась эффективность применения постредактирования в сравнении с переводом; целесообразность применения разработанных ранее авторами работы стратегий постредактирования в обучении. Исследование проводилось на базе педагогического эксперимента, участниками которого стали студенты-филологи второго курса, количественного и качественного анализа полученных данных. В статье приводятся сведения, полученные в результате анкетирования студентов и демонстрирующие степень их заинтересованности в обучении постредактированию. Полученные в результате исследования данные будут применяться для составления системы упражнений и, в дальнейшем, программы обучения постредактированию для реализации ее в российских вузах.
НЕЙРОННЫЙ МАШИННЫЙ ПЕРЕВОД; ПРЕПОДАВАНИЕ; СТРАТЕГИИ ПОСТРЕДАКТИРОВАНИЯ; ПЕРЕВОД; СТУДЕНТЫ ЛИНГВИСТИЧЕСКОГО НАПРАВЛЕНИЯ
Ссылка при цитировании: Дорожкина В.А., Ивлева М.А. Постредактирование машинного перевода в обучении студентов лингвистических специальностей // Вопросы методики преподавания в вузе. 2020. Т. 9. № 33. С. 38-45. Б01: 10.18720/НиЫ/188М 2227-8591.33.03
Введение. Двадцать первый век - эпоха преобразований, технологий и инноваций, появления новых профессий. В подобных условиях традиционная парадигма образования устарела: если прежде обучение имело скорее теоретическую направленность, то сейчас активно используется понятие «полезного знания», сфокусированного на конкретике и нацеленного на практический результат [1]. Сдвиг произошел из-за изменения требований к специалистам различных профессий, включая профессию переводчика. К обязанностям переводчика теперь относят не только работу со словарями и теоретическими материалами, но и умение использовать в работе автоматизированные системы перевода, память переводов и электронные глоссарии - инструменты, используемые для получения быстрого результата. Эти компетенции уже включены в современный профессиональный стандарт переводчика [2].
Лингвистическим вузам достаточно сложно перестроиться и пересмотреть программу, чтобы она в полной мере отвечала современным требованиям. Н.А. Маленьких точно описывает состояние лингвистического образования: «Вузы вынуждены адаптироваться к изменению внешних факторов, лежащих вне зоны их непосредственного контроля, а именно, к демографическим, социально-экономическим и даже внешнеполитическим условиям... Работодатели отмечают, что уровень профессиональной подготовки выпускников переводческих специальностей падает, в результате чего они вынуждены «доучивать» начинающих специалистов на местах» [3]. Более того, появляются новые профессии - локализатор,
постредактор - которым также не обучают в вузах на данный момент.
Машинный перевод (МП, перевод, выполняемый компьютерной программой) долгое время оставался предметом споров и сомнений у переводчиков в связи с его низким качеством [4: 66]. Однако в настоящее время, с появлением систем нейронного машинного перевода (НМП), качество машинного перевода существенно возросло, и все больше переводческих агентств используют его для ускорения работы и оптимизации процесса. Что привело к появлению профессии постредактора - специалиста, редактирующего машинный перевод для достижения качества профессионального перевода (выполненного человеком).
Профессия постредактора является новой на переводческом рынке. Проведено некоторое число научных исследований, посвященных механизмам МП, ошибкам МП исследованиям эффективности применения постредактирования МП в работе. Ранее авторы статьи разработали список стратегий постредактирования машинного перевода (ПРМП), позволяющих структурировать процесс работы.
Актуальность исследования заключается в том, что профессии постредактора на данный момент не обучают в российских лингвистических вузах. Необходимо оценить эффективность применения постредактирования в обучении студентов-лингвистов, в том числе и тех, для кого перевод не является профильным направлением. Необходимо также выяснить, обязательно ли иметь переводческое образование для того, чтобы успешно выполнять постредактирование машинного перевода.
Цель исследования необходимо рассматривать на нескольких уровнях:
1) Проанализировать существующие зарубежные программы обучения ПРМП.
2) Оценить эффективность применения постредактирования по отношению к переводу на основе качественного и количественного анализа переводческих ошибок.
3) Оценить лояльность студентов по отношению к постредактированию машинного перевода и степень их заинтересованности в обучении.
4) Оценить применимость разработанных ранее стратегий постредактирования в обучении.
Методы исследования включают теоретический анализ и обобщение данных научной литературы; сравнительный анализ рабочих программ по обучению ПРМП; педагогический эксперимент; опрос (анкетирование) студентов лингвистического направления (филологов); количественный и качественный анализ допущенных ошибок и полученных данных.
Теоретический анализ. Постредактирование машинного перевода представляет собой улучшение, приведение к адекватно-
сти и эквивалентности перевода, выполненного компьютером. Постредактированию нельзя обучать также, как редактированию, поскольку постредактирование по своей сути ближе к переводу, выполненному с нуля. Постредактирование МП предполагает исправление текста как результата работы компьютерной программы, а процесс редактирования предполагает исправление ошибок в тексте, переведенном человеком [5: 65].
Согласно докладу ассоциации TAUS, постредактирование имеет немаловажное отличие от перевода: оно должно проводиться за кратчайший промежуток времени, в ином случае возникает вопрос об эффективности и целесообразности использования МП [6]. При построении программы обучения ПРМП для лингвистических вузов необходимо учитывать этот фактор.
В то время как в российских университетах постредактирование еще не введено в программу, в зарубежных вузах МП изучают как в рамках дополнительных курсов, так и в программе обучения переводчиков. Рассмотрим сравнительную таблицу программ зарубежных лингвистических вузов (табл. 1).
Таблица 1
Программы зарубежных лингвистических вузов
KU Leuven, Belgium University of Zagreb, Croatia Universita di Bologna, Italy
1. The history of machine translation. 2. How machine translation can be evaluated. 3. An understanding of the way machine translation works and makes errors. 4. How the research field of natural language processing /language technology works. 5. An understanding of post-editing practices [7]. 1. The concept of translation quality. 2. Error classifications. 3. Post-editing vs. human translation revision. 4. Types of errors in MT output. 5. Levels of post-editing relative to translation purpose. 6. Post-editing guidelines. 7. Human and automatic MT quality assessment 8. Pre-editing; integration of MT in CAT tools; 9. MT and terminology; 10. Role of post-editing in professional translation practice; 11. The impact of MT on translation theory and practice [8]. 1. Key theoretical principles of MT. 2. The main architectures of MT systems. 3. Complex topics concerning the evaluation of MT quality and the effectiveness of MT. 4. Pre-editing, controlled language for the drafting of restricted input. 5. Different ways of intervention [9].
Больше программ можно найти на сайте «pemt.ru», в разделе «Курсы учебных заведений» [10].
Сравнительный анализ показал, что во всех образовательных программах большое внимание уделялось структуре систем МП и их типам, ошибкам, допускаемыми системами МП, способам оценки машинного перевода (ручной и автоматический). На практическом уровне рассматривались виды постредактирования и их различия. Несомненно, необходимо интегрировать эти пункты в российскую программу обучения постредактированию в первую очередь, однако не рекомендуется полностью копировать зарубежные программы. У каждого языка своя специфика, которая так или иначе влияет на качество машинного перевод и на стратегии постредактирования, в частности.
Стратегиям постредактирования -поэтапным действиям, выполняемым для достижения качества профессионального перевода - необходимо уделить особое внимание, поскольку они позволяют получить качественный результат за меньшее количество времени. За рубежом стратегии ПРМП активно изучаются. К примеру, Дж. Аллен сравнивает критерии, предложенные разными переводческими компаниями, для достижения адекватного качества МП [11: 306]. В контексте образования Дж. Белам рассказывает о своем опыте преподавания ПРМП в Эксетерском университете и разрабатывает стратегии для «быстрого» постредактирования, опираясь на ошибки студентов [12].
Ранее авторы работы разработали список стратегий постредактирования для пары английский-русский на основании анализа профессионального и машинного переводов научных и научно-популярных текстов [13].
Представленные стратегии необходимо предложить студентам для оценки их эф-
фективности и дальнейшей применимости при составлении программы обучения ПРМП.
Практический анализ. В рамках семинарских занятий был проведен педагогический эксперимент, участниками которого явились студенты-филологи второго курса Новосибирского государственного технического университета. По предварительно полученным сведениям, знания английского языка студентов оценивается на уровне B1-B2, группа обучается переводу в рамках курса «Теория и практика перевода», однако данная дисциплина не является профильной.
В рамках эксперимента были поставлены следующие задачи:
1) Оценить эффективность ПРМП для непрофильной группы в сравнении с самостоятельным переводом.
2) Оценить эффективность стратегий ПРМП.
3) Оценить отношение студентов к ПРМП по результатам анкетирования.
Материалом эксперимента явилась научно-популярная статья «May We All Praise the Amazing Dog Nose, and May We Then Boop It», написанная Дж. Леман [14].
Ход эксперимента: Все участники эксперимента прослушали ознакомительную лекцию о видах МП, сущности и видах ПРМП (легкое/полное), ошибках, допускаемых системами МП. Далее студенты были поделены на 3 равные группы по 5 человек в каждой. Первая группа выполняла традиционный перевод, вторая группа выполняла постредактирование этого же фрагмента на основе прослушанной лекции, третья - выполняла ПРМП, опираясь на предлагаемые стратегии постредактирования. На перевод было дано неограниченное количество времени, на постредактирование - 45 минут.
Для данного эксперимента рекомендации постредактору состояли в следующем:
1) исправлять ошибки согласования, устранять смысловые ошибки;
2) корректировать использование активного и пассивного залога, следить за корректностью перевода пассивных и безличных конструкций;
3) выполнять проверку корректности перевода терминологии и повторную проверку соблюдения ее единообразия в тексте перевода;
4) выполнять поиск контекстуально обусловленных синонимов;
5) использовать переводческие трансформации для получения перевода, близкого к профессиональному;
6) расшифровывать аббревиатуры, проводить конвертацию единиц измерения, если необходимо;
7) проверять актуальное членение исходного и переведенного текстов;
8) проверять стилистическую окраску оригинала и перевода, учитывать культурные особенности.
Результаты, полученные в ходе эксперимента, представлены в табл. 2.
Таблица 2
Ошибки ПРМП ПРМП+стратегии Перевод
Стиль 16 10 16
Терминология 10 6 8
Смысл 8 1 5
Язык 3 3 0
Работы студентов оценивались по базовым критериям, которые используют профессиональные редакторы. Стоит отметить, что бюро переводов работают по разным LQA моделям (Linquistic Quality Assurance) или метрикам, позволяющим оценивать качество перевода. В данной работе была использована модель LISA в упрощенном варианте [15].
Ошибки, связанные со стилем, включают в себя подстрочный перевод, повторы, канцелярит. Группа студентов, исполь-
зовавшая стратегии ПРМП, допустила на 37,5% меньше ошибок по сравнению с двумя другими группами.
К ошибкам терминологии относят неверный выбор термина, его некорректное написание, отсутствие единообразия. При применении стратегий постредактирования удалось избежать 40% ошибок по сравнению с ПРМП, который студенты выполняли самостоятельно. Результат группы, выполнявшей перевод, находится «посередине». К ошибкам этой группы следует отнести отсутствие терминологического единообразия и орфографические ошибки. Это объясняется тем, что подобного рода ошибки чаще всего допускаются по переводческой невнимательности, тогда как системы МП передают термины единообразно, но не всегда верно его выбирают.
Смысловые ошибки включают в себя неверную интерпретацию текста и двусмысленность перевода, что требует особого внимания. Группа, использовавшая предложенные стратегии ПРМП, допустила на 87,5% меньше ошибок по сравнению с группой, выполнявшими ПРМП своими силами.
К языковым (лингвистическим) ошибкам относят орфографические, грамматические и пунктуационные ошибки. Машинный перевод часто ошибается в пунктуации, тогда как в процессе перевода студенты-филологи продемонстрировали хорошее знание родного языка. В связи с этим, представляется целесообразным внести отдельный пункт в стратегии об особом внимание к лингвистическим ошибкам систем МП.
Также студентам была предложена небольшая анкета. По результатам опроса, 80% студентов (12 из 15 человек) оценили МП как полезный инструмент, облегчающий работу. К достоинствам МП студенты отнесли помощь в быстром понимании текста, перевод отдельных слов и кон-
струкций, что оказалось полезным при среднем уровне знания английского языка. К недостаткам - местами подстрочный перевод и необходимость верифицировать имена собственные и термины.
Выводы. Постредактирование машинного перевода (ПРМП) - перспективное направление, которое необходимо внедрять в российские вузы в рамках освоения новой и востребованной профессии постредактора. Машинному переводу уже обучают за рубежом в лингвистических университетах. В результате сравнительного анализа было выявлено, что зарубежные программы могут быть частично интегрированы в российскую образовательную программу обучения ПРМП. Проведенный на группе студентов-филологов педагогический эксперимент показал, что:
1) Эффективность ПРМП по сравнению с переводом высока, постредактирование МП могут выполнять студенты, для которых перевод не является профильным предметом, но при условии, что студентов будут обучать стратегиям ПРМП.
2) Применение стратегий ПРМП действительно позволяет улучшить качество машинного перевода. Стратегии ПРМП подлежат доработке и уточнению.
3) Студенты проявили высокий уровень лояльности к МП и оценили его как полезный инструмент, особенно при среднем знании английского языка.
Полученные результаты будут применяться в дальнейшем для составления систем упражнений для обучения ПРМП. Итогом работы станет составление программы обучения постредактированию машинного перевода для российских вузов.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Тестов В.А. Переход к новой образовательной парадигме в условиях сетевого пространства // Вестник Нижегородского университета им. Н.И. Лобачевского. 2012. № 4-1. С. 50-56.ISSN: 1993-1778
2. Профессиональный стандарт. Специалист в области перевода и локализации. Красноярск: Институт филологии и языковой коммуникации СФУ, 2018. С. 17-18, С. 9-10.
3. Маленьких Н.А. Комплексный подход к подготовке переводчиков // Вопросы методики преподавания в вузе. 2018. Т.7. №25. С.32-38. DOI: 10.18720/HUM/ISSN2227-8591.25.03
4. Ванчинова Е.А. Компьютерные технологии в переводе технических текстов // Филология и лингвистика в современном обществе: материалы IV Междунар. науч. конф. (Москва, июнь 2016 г.). - М.: Буки-Веди, 2016. ISBN 978-5-4465-0929-4. - С. 65-68
5. Нечаева Н.В., Светова С.Ю. Постредактирование машинного перевода как актуальное направление подготовки переводчиков в вузах // Вопросы методики преподавания в вузе. 2018. Т. 7. № 25. С. 64-73 DOI: 10.18720/HUM/ISSN2227-8591.25.07
6. Machine Translation Post-editing Guidelines // TAUS. - 2018. [Electronic resource] URL: https://www.taus.net/filedownloads/download7pat h=Articles%252Ftaus-cnglmachine-translationpos tediting-guidelines.pdf
7. Description of the MT course // Ku Leuven. 2019-2020. [Electronic resource] URL: https://on derwijsaanbod.kuleuven.be/syllabi/e/Y02900E.htm #activetab=doelstellingen_idp958928
8. Description of the course «Post-editing and machine translation quality assessment» // University of Zagreb. [Electronic resource] URL: https: //anglist.ffzg.unizg.hr/?p=33277&lang=en
9. Description of the course Machine Translation and Post Editing // Universita di Bologna. 2015-2016. [Electronic resource] URL: https:// www.unibo.it/en/teaching/course-unit-catalogue/co urse-unit/2015/397338
10. Курсы обучения постредактированию. [Электронный ресурс] URL: http://pemt.ru/study /st-education-%D1%81ourses/
11. Computers and Translation: A translator's guide /ed. By Н. Somers. USA: John Benjamin B.V, 2003. С.296-316.
12. Belam J. Buying up to falling down: a deductive approach to teaching postediting // UK: MTS, 2003.
13.Хасанова В.А. Особенности постредактирования машинного перевода научно-учебного и научно-популярного текстов // Актуальные проблемы современного общества: сб. мат. 15 междунар. науч.-практ. конф. молодых ученых /под ред. И.А. Казачихи-ной, С.Ю. Полянкиной. - Новосибирск: Изд-во
НГТУ, 2018. ISBN978-5-7782-3698-1 -С. 73-78.
14. Leman J. May We All Praise the Amazing Dog Nose, and May We Then Boop It // Popular mechanic, 2020.
15. LISA QA Metric // Метрика оценки качества перевода. [Электронный ресурс] URL: http://producthelp.sdl.com/SDL_TMS_2011/en/Cr eating_and_Maintaining_Organizations/Managing _QA_ModeWLISA_QA_Model.htm
REFERENCES
1. Testov V.A. Transition to a new educational paradigm in the network space // Vestnik of Lobachevsky University of Nizhni Novgorod. 2012. № 4-1. P. 50-56. ISSN: 1993-1778
2. Professional'nyj standart. Specialist v oblasti perevoda i lokalizacii. Krasnojarsk: Institut filologii i jazykovoj kommunikacii SFU, 2018. S. 17-18, S.9-10.
3. Malenkikh N.A. Comprehensive Approach to Translators Training. Teaching Methodology in Higher Education. 2018. Vol. 7. No 25. P. 32-38. DOI: 10.18720/HUM/ISSN 2227-8591.25.03
4. Vanchinova E.A. Komp'juternye tehnologii v perevode tehnicheskih tekstov // Filologija i lingvistika v sovremennom obshhestve: materialy IV Mezhdunar. nauch. konf. M.: Buki-Vedi, 2016. - ISBN 978-5-4465-0929-4. - S. 65-68.
5. Nechaeva N.V., Svetova S.Y. Post-Editing Machine Translation as a New Activity for Teaching Translation at Universities. Teaching Methodology in Higher Education. 2018. Vol. 7. No 25. P. 64-72. DOI: 10.18720/HUM/ISSN 2227-8591.25.07
6. Machine Translation Post-editing Guidelines // TAUS. - 2018. [Electronic resource] URL: https://www.taus.net/filedownloads/downloa d?path=Articles%252Ftaus-cnglmachine-translatio npostediting-guidelines.pdf
7. Description of the MT course // Ku Leuven. 2019-2020. [Electronic resource] URL: https: //onderwijsaanbod.kuleuven.be/syllabi/e/Y02900E .htm#activetab=doelstellingen_idp958928
8. Description of the course «Post-editing and machine translation quality assessment» // University of Zagreb. [Electronic resource] URL: https://anglist.ffzg.unizg.hr/?p=33277&lang=en
9. Description of the course Machine Translation and Post Editing // Universita di Bologna. 2015-2016. [Electronic resource] URL: https://www.unibo.it/en/teaching/course-unit-catalogue/course-unit/2015/397338
10. Kursy obuchenija postredaktirovaniju. [Electronic resourse] URL: http://pemt.ru/study/st-education-%D1%81ourses/
11. Computers and Translation: A translator's guide /ed. By N. Somers. USA: John Benjamin B.V, 2003. S.296-316.
12. Belam J. Buying up to falling down: a deductive approach to teaching postediting // UK: MTS, 2003.
13. Khasanova V.A. Peculiarities of Machine Translation Post-editing of Educational and Popular Scientific Texts // Urgent problems of modern society: sb. materialov 15 mezhdunar. nauch.-prakt. konf. molodyh uchenyh. Novosibirsk: Izd-vo NGTU, 2018. ISBN978-5-7782-3698-1. - S. 73-78.
14. Leman J. May We All Praise the Amazing Dog Nose, and May We Then Boop It // Popular mechanic, 2020.
15. LISA QA Metric // Metrika ocenki kachestva perevoda. [Electronic resourse] URL: http://producthelp.sdl.com/SDL_TMS_2011/en/Cr eating_and_Maintaining_Organizations/Managing _QA_Models/LISA_QA_Model.htm
Dorozhkina V.A., Ivleva M.A. Post-editing of machine translation in teaching students majoring in linguistics. The development of technologies and improvement of machine translation quality has led to the emergence of post-editing. This process involves editing a machine translation to achieve quality close to the professional translation. The problem is that the skills of machine translation post-editing are
not taught in Russian universities at the moment, despite their demand and relevance on the translation market. The article considers the need of machine translation post-editing to be involved in the educational program of linguistic universities, including those not majoring in translation. At theoretical level, this article describes the difference between post-editing, editing and translation. The article provides comparative analysis of machine translation post-editing programs in foreign universities. The aim is to identify aspects that will serve as reference points for the Russian post-editing training program. At practical level, the effectiveness of post-editing was evaluated in comparison with translation. The post-editing strategies developed earlier by the authors were analyzed for their effectiveness. The study was conducted on the basis of the pedagogical experiment, whose participants were second-year students majoring in Philology. and included quantitative and qualitative analysis of the data. The article provides information of students' survey analysis and demonstrates their motivation in learning post-editing. The results of the study will be used to create a system of exercises and a postediting educational program for its implementation in Russian universities.
NEURAL MACHINE TRANSLATION; TEACHING; POST-EDITING STRATEGIES; TRANSLATION; LINGUISTIC STUDENTS
Citation: Dorozhkina V.A., Ivleva MA. Post-editing of machine translation in teaching students majoring in linguistics. Teaching Methodology in Higher Education. 2020. Vol. 9. No 33. P. 38-45. DOI: 10.18720/HUM/ISSN 2227-8591.33.03
© Санкт-Петербургский политехнический университет Петра Великого, 2020