УДК 81'255.2'322.4:6
СОВРЕМЕННЫЕ СРЕДСТВА КОМПЬЮТЕРНОГО ПЕРЕВОДА ТЕХНИЧЕСКОГО ТЕКСТА:
ЗАДАЧИ И ТЕХНОЛОГИИ
Мячин Д.А., студент, направление подготовки 45.03.02 Лингвистика, Оренбургский государственный университет, Оренбург e-mail: dmitrii.m242@gmail.com
Научный руководитель: Переходько И.В., кандидат педагогических наук, доцент, доцент кафедры романской филологии и методики преподавания французского языка, Оренбургский государственный университет, Оренбург
e-mail: perehodko2008@yandex.ru
Аннотация. В современной лингвистической науке остаются актуальными вопросы изучения текстов, выполненных с помощью компьютерного перевода, с целью выявления наиболее типичных и частотных ошибок, так как их исследование позволяет разработать алгоритм работы переводчика на этапе постредактирования текста компьютерного перевода. В данной статье предпринята попытка исследования стратегий взаимодействия Человек-Машина при переводе, а также анализа текстов переводов, выполненных с помощью систем компьютерного перевода. Таким образом, на основе выявленных лингвистических особенностей компьютерного перевода научно-технических терминов сетей передачи данных были определены основные принципы работы переводчика на этапе постредактирования на уровне языковых и переводческих норм.
Ключевые слова: компьютерный перевод, технический текст, сети передачи данных, лексико-стили-стические ошибки, постредактирование.
MODERN MEANS OF COMPUTER TRANSLATION OF TECHNICAL TEXT: TASKS AND TECHNOLOGIES
Myachin D.A., student, training direction 45.03.02 Linguistics, Orenburg State University, Orenburg e-mail: dmitrii.m242@gmail.com
Scientific adviser: Peredodko I.V., Candidate of Pedagogical Sciences, Associate Professor, Associate Professor of the Department of Romance Philology and Methods of Teaching French, Orenburg State University, Orenburg e-mail: perehodko2008@yandex.ru
Abstract. In modern linguistic science the questions of studying texts performed with computer translation remain relevant for the purpose of identifying the most typical and frequency errors since their investigation allows us to develop an algorithm for the work of an interpreter at the stage ofpost-editing the text of a computer translation. This article attempts to examine strategy of interaction «human-to-machine» in the translation and to analyse translated texts executed by automatic systems, based on linguostylistic analysis. Thus, based on the revealed linguistic features of computer translation of scientific and technical terms of data transmission networks the basic principles of the translator's work at the stage ofpost-editing at the level of linguistic and translational norms were determined.
Keywords: computer translation, technical text, data transmission networks, lexical and stylistic mistakes, post-editing.
Актуальность исследования проблемы компьютерного перевода технического текста обуславливается, с одной стороны, неспособностью систем компьютерного перевода предоставить адекватный и эквивалентный вариант перевода без участия переводчика-постредактора и быстрым развитием Интернет-коммуникации, предоставляющей все более высокие требования к результату перевода, с другой стороны.
Всегда основные задачи перевода были связаны
с передачей информации, так как цель перевода -обеспечить понимание информации всеми участниками коммуникации. Сегодня, основной способ передачи информации - это Интернет, и перед переводчиками встала новая задача - получение адекватного и эквивалентного варианта перевода в короткие сроки. Во многом решение данной задачи связано с использованием информационных технологий в переводе, а именно программ автоматического перевода.
ФИЛОЛОГИЧЕСКИЕ НАУКИ
Автоматический перевод - это тип компьютерного перевода, при котором в компьютер вводится текст на одном языке, происходит обработка этого текста и вывод его на другом языке. К сожалению, сегодня реализация такого вида перевода сталкивается с определенными проблемами, которые еще предстоит решить и именно поэтому полностью автоматический машинный перевод текстов является невыполнимой задачей.
В следствие этого возник вопрос анализа компьютерного перевода данных текстов и составления, на основе этого анализа, алгоритма работы переводчика при постредактировании компьютерного перевода технического текста.
В ходе нашего исследования мы провели компьютерный перевод с полным постредактированием технического текста сайта blockchainfrance.net -«Qu'est-ce que la blockchain?». Выбор материала исследования обусловлен тем, что наиболее сложным для перевода с использованием систем компьютерного перевода является технический текст. Причины проблем, возникающих при компьютерном переводе подобных текстов, кроются в особенностях технического текста. Технический текст характеризуется логичностью излагаемого материала, в нем практически отсутствуют метафоры и иные атрибуты художественного текста. Технический текст имеет антиглагольную направленность, он изобилует терминами, профессионализмами и глагольно-именными цепочками [2].
Мы выполнили перевод текста оригинала с помощью трех систем компьютерного перевода: Google translate, Яндекс и Промт. Перевод проводился именно в этих системах, так как все они используют разные технологии при компьютерном переводе. Так, Google с 2016 года использует нейросеть, Яндекс проводит перевод также через нейросеть, но при этом использует технологию статистического компьютерного перевода, а после специальный алгоритм выбирает наиболее адекватный и эквивалентный вариант, а система Промт использует тех-
Таким образом, можно сделать вывод о том, что благодаря своему быстрому развитию системы компьютерного перевода сегодня - это очень полезный инструмент, существенно облегчающий работу переводчика, но они все еще допускают ошибки, чаще всего связанные с переводом тер-
нологию статистического компьютерного перевода.
Мы выполнили оценку перевода с использованием шкалы М. Нагао. В результате, перевод выполненный системой компьютерного перевода Google получил оценку: 2 балла - смысл предложения понятен, но возникают большие проблемы с грамматикой, словоупотреблением и стилем. Перевод системы Яндекс также 2 балла. Текст, полученный в ходе статистического перевода системой Промт, получил оценку: 4 балла - присутствуют ошибки словоупотребления и стилистики, требуется обращение к оригиналу [3].
Анализ и исправление основных ошибок может быть проиллюстрирован следующими примерами.
Система компьютерного перевода Яндекс допускает лексико-семантическую ошибку, связанную с переводом терминов, при переводе предложения: «Par extension, une blockchain constitue une base de données qui contient l'historique de tous les échanges effectués entre ses utilisateurs depuis sa création» -«Кроме того, блок-цепочка представляет собой базу данных, которая содержит историю всех обменов между пользователями с момента ее создания». Слово «blockchain» переводится методом транскрипции и является термином в русском языке, его следует переводить как «блокчейн».
Примером грамматической ошибки может служить вариант перевода фразы «un très grand cahier, que tout le monde peut lire librement et gratuitement, sur lequel tout le monde peut écrire», выполненный системой Google: «очень большую тетрадь, которую каждый может читать свободно и бесплатно, о которой каждый может писать». Грамматическая, синтаксическая ошибка связана с неверным переводом предлога, в данном случает предлог «sur» должен быть переведен как «в».
В ходе анализа и корректуры компьютерного перевода нами была составлена следующая сводная таблица, содержащая общее количество допущенных ошибок всеми исследуемыми системами компьютерного перевода (таблица 1).
минов и редких слов. Таким образом, изучение текстов, полученных с помощью автоматического компьютерного перевода - это актуальное направление лингвистических исследований, так как подобные исследования позволяют разработать алгоритм работы переводчика на этапе постредак-
Таблица 1 - Сравнительный количественный анализ ошибок
Лексико-семантические Грамматические
Морфологические Синтаксические
Google 7 0 2
Яндекс 13 0 3
Промт 20 5 7
тирования технического текста. Так, переводчик должен проводить контроль на уровне языковых норм, включающий контроль восприятия и понимания, грамматический, лексический и стилисти-
ческий контроль, и на уровне переводческих норм, включающий контроль на адекватность и приемлемость, прагматический самоконтроль и коннота-тивный контроль.
Литература
1. M. Hess. Einführung in die Computerlinguistik [Электронный ресурс]. - Режим доступа: https://www. cl.uzh.ch/dam/jcr:ffffffff-b2e3-81a5-ffff-fffff7c4f4a7/ecl1.0.l.pdf (дата обращения: 28.04.2019).
2. Крапивкина О. А., Мусохранова А. А. Лингво-прагматические аспекты перевода научно-технических текстов [Электронный ресурс]. - Режим доступа: http://human.snauka.ru/2014/08/7629 (дата обращения: 28.04.2019).
3. Nagao M., Mori S. A New Method of N-gram Statistics for Large Number of n and Automatic Extraction of Words and Phrases from Large Text Data of Japanese [Электронный ресурс]. - Режим доступа: http:// delivery.acm.org/10.1145/1000000/991994/p611-nagao.pdf?ip=178.45.193.250&id=991994&acc=0PEN&key= 4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E4D4702B0C3E38B35%2E6D218144511F3437&_acm_ = 1557207362_32d6a5b6454578c2532a4f0f39772b6b (дата обращения: 28.04.2019).
4. Переходько И. В., Мячин Д. А. Лингвистические особенности компьютерного перевода научно-технических терминов сетей передачи данных // Балтийский гуманитарный журнал. - 2018. - Том 7. -№ 4. - С. 98-102.
5. Переходько И. В., Мячин Д. А. Оценка качества компьютерного перевода [Электронный ресурс]. -Режим доступа: https://cyberleninka.ru/article/n7otsenka-kachestva-kompyuternogo-perevoda (дата обращения: 28.04.2019).