Решетневские чтения. 2017
УДК 82.322.4
ОЦЕНКА КАЧЕСТВА РАБОТЫ СИСТЕМ МАШИННОГО ПЕРЕВОДА
Н. Г. Ртищева
Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected]
Ставится задача выявить степень участия человека в переводе, осуществляемом при помощи систем машинного перевода.
Ключевые слова: машинный перевод, степень участия человека в машинном переводе.
EVALUATION OF THE PERFORMANCE OF MACHINE TRANSLATION SYSTEMS
N. G. Rtishcheva
Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]
The article identifies a degree of human involvement in the translation, with the assistance of machine translation systems.
Keywords: machine translation, the degree of human involvement in machine translation
В наше время, в эпоху интернета и преодоления границ общения по всему миру, всё более востребованным становится перевод с одного языка на другой, так как большинство информации в Интернете представлено на иностранных языках. Но далеко не каждый обладает знаниями иностранного языка, но не желая отказываться от информации люди, не имеющие этих знаний, прибегают к помощи систем машинного перевода.
К сожалению, качество машинного перевода оставляет желать лучшего: нередки случаи, когда текст, переведённый машиной, нельзя прочесть, так как он не связан между собой, слова не вписываются в контекст, значение слова подобрано совершенно не то, которое следовало бы выбрать. Но тем не менее, за неимением альтернативы, к помощи систем машинного перевода прибегает всё большее и большее число людей, даже не смотря на их низкое качество перевода.
К счастью, человек, обладающий знаниями иностранного языка может с лёгкостью исправить недочёты, допущенные программами. Знающий человек изменит перевод в лучшую сторону и максимально приблизит перевод к адекватному.
Обычно говорят о переводе «с одного языка на другой», но, в действительности, в процессе перевода происходит не просто замена одного языка другим. В переводе сталкиваются различные культуры, разные личности, разные склады мышления, разные литературы, разные эпохи, разные уровни развития, разные традиции и установки. Переводом интересуются культурологи, этнографы, психологи, историки, литературоведы и разные стороны переводческой деятельности могут быть объектом изучения в рамках
соответствующих наук. В то же время в науке о переводе - переводоведении - могут выделяться культурологические когнитивные, психологические, литературные и прочие аспекты. Если обобщить, то перевод -это процесс или результат передачи мысли с одного языка на другой, учитывая особенности как и исходного, так и переводимого языков.
Машинный перевод - это выполняемое на ЭВМ (компьютере) действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.
Существуют два принципиально разных подхода к построению алгоритмов машинного перевода: основанный на правилах (rule-based) и статистический, или основанный на статистике (statistical-based). Первый подход является традиционным и используется большинством разработчиков систем машинного перевода (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии и др.). Ко второму типу относится популярный сервис Яндекс. Перевод, Переводчик Google, а также новый сервис от ABBYY
Статистический машинный перевод - это разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар. Языковые пары - тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком - носителем двух языков, так и набором предложений и их переводов, выполненных человеком. Таким образом, статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше
Современное состояние и перспективы развития инженерного образования
результат статистического машинного перевода. Под понятием «статистического машинного перевода» подразумевается общий подход к решению проблемы перевода, который основан на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов [1-5].
Синхронный автоматический перевод (Speech-to-SpeechReal-TimeTranslation) - «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.
Процесс электронного перевода речи (S2S Real-TimeTranslation), как правило, включает следующие три этапа:
- автоматическое распознавание речи (ASR -automaticspeechrecognition) - преобразование речи в текст;
- машинный перевод (MAT - Machine-AssistedTranslation); - автоматический перевод текста с одного языка на другой;
- синтез речи (TTS - text-to-speech) - технология, которая даёт возможность произнести текст голосом, приближенным к естественному.
Вместо «машинный» иногда употребляется слово автоматический, что не влияет на смысл. Однако термин автоматизированный перевод имеет совсем другое значение - при нём программа просто помогает человеку переводить тексты.
Автоматизированный перевод - это широкое и не совсем точное понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:
Программы для проверки правописания, которые могут быть встроены в текстовые редакторы или дополнительные программы;
Программы для проверки грамматики, которые также встраиваются в текстовые редакторы или дополнительные программы;
Программы для управления терминологией, которые позволяют переводчикам управлять своей собственной терминологической базой в электронной форме.
Словари на компакт-дисках, одноязычные или многоязычные и т. д.
Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определенные изменения в сомнительных случаях называют «машинным переводом с участием человека».
Существует несколько форм организации взаимодействия ЭВМ и человека в машинном переводе:
- с постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат;
- с предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка;
- интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.
Качественный машинный перевод без участия человека возможен лишь в теории, машины, даже на их быстротечный прогресс, все еще слишком слабы, чтобы знать точные перечни всех синтаксических конструкций, возможных на том или ином языке, а также многое другое, что требуется знать любому уважающему себя переводчику. А пока что лишь мозг человека может различать разнообразные ситуации, видеть темы и ремы, учитывать стилистику, особенности языков и многое-многое другое.
Несмотря на то, что машинный перевод сейчас сделал огромные шаги в развитии, никто в коммерческой сфере не пользуется системами машинных переводов в полной мере, так как данные системы могут облегчить работу «живому» переводчику, но ни в коем случае его не заменить.
Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.
Таким образом, результаты машинного перевода почти всегда требуют редактирования. А то, насколько адекватными можно считать результаты перевода на компьютере, определяется не только качеством системы машинного перевода, но и качеством последующего редактирования.
Библиографические ссылки
1. Бар-Хиллел И. Будущее машинного перевода (почему машины не могут научиться переводить) // Вопросы языкознания. 1969. № 4. C. 11.
2. Будущее машинного перевода // Компьютера. 2002. № 21, 05 июня. C. 15.
3. Кулагина О. С. О современном состоянии машинного перевода // Математические вопросы кибернетики. Вып. 3. М. : Наука, 1991. C. 5-156.
4. Нелюбин Л. Л. Компьютерная лингвистика и машинный перевод. М., 1991.
5. Лингвистический энциклопедический словарь / глав. ред. В. Н. Ярцева. М. : Сов. энцикл., 1990. 685 с.
References
1. Bar-Hillel I. Future of machine translation (why machines can't learn to translate) // problems of linguistics. 1969. № 4. C. 11.
2. The future of machine translation // the Computer. 2002. № 21, June 05. C. 15.
3. Kulagina О. S. On the current state of machine translation // Mathematical problems of Cybernetics. Vol. 3. M. : Nauka, 1991. C. 5-156.
4. Nelyubin L. L. computational linguistics and machine translation.. M., 1991.
5. Linguistic encyclopedic dictionary / Chapters. edited by V. N. Yartseva. M. : Soviet encyclopedia, 1990. 685 p.
© Ртищева Н. Г., 2017