Научная статья на тему 'Оценка качества работы систем машинного перевода'

Оценка качества работы систем машинного перевода Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1513
255
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННЫЙ ПЕРЕВОД / СТЕПЕНЬ УЧАСТИЯ ЧЕЛОВЕКА В МАШИННОМ ПЕРЕВОДЕ / MACHINE TRANSLATION / THE DEGREE OF HUMAN INVOLVEMENT IN MACHINE TRANSLATION

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Ртищева Н. Г.

Ставится задача выявить степень участия человека в переводе, осуществляемом при помощи систем машинного перевода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EVALUATION OF THE PERFORMANCE OF MACHINE TRANSLATION SYSTEMS

The article identifies a degree of human involvement in the translation, with the assistance of machine translation systems.

Текст научной работы на тему «Оценка качества работы систем машинного перевода»

Решетневские чтения. 2017

УДК 82.322.4

ОЦЕНКА КАЧЕСТВА РАБОТЫ СИСТЕМ МАШИННОГО ПЕРЕВОДА

Н. Г. Ртищева

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail: [email protected]

Ставится задача выявить степень участия человека в переводе, осуществляемом при помощи систем машинного перевода.

Ключевые слова: машинный перевод, степень участия человека в машинном переводе.

EVALUATION OF THE PERFORMANCE OF MACHINE TRANSLATION SYSTEMS

N. G. Rtishcheva

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation E-mail: [email protected]

The article identifies a degree of human involvement in the translation, with the assistance of machine translation systems.

Keywords: machine translation, the degree of human involvement in machine translation

В наше время, в эпоху интернета и преодоления границ общения по всему миру, всё более востребованным становится перевод с одного языка на другой, так как большинство информации в Интернете представлено на иностранных языках. Но далеко не каждый обладает знаниями иностранного языка, но не желая отказываться от информации люди, не имеющие этих знаний, прибегают к помощи систем машинного перевода.

К сожалению, качество машинного перевода оставляет желать лучшего: нередки случаи, когда текст, переведённый машиной, нельзя прочесть, так как он не связан между собой, слова не вписываются в контекст, значение слова подобрано совершенно не то, которое следовало бы выбрать. Но тем не менее, за неимением альтернативы, к помощи систем машинного перевода прибегает всё большее и большее число людей, даже не смотря на их низкое качество перевода.

К счастью, человек, обладающий знаниями иностранного языка может с лёгкостью исправить недочёты, допущенные программами. Знающий человек изменит перевод в лучшую сторону и максимально приблизит перевод к адекватному.

Обычно говорят о переводе «с одного языка на другой», но, в действительности, в процессе перевода происходит не просто замена одного языка другим. В переводе сталкиваются различные культуры, разные личности, разные склады мышления, разные литературы, разные эпохи, разные уровни развития, разные традиции и установки. Переводом интересуются культурологи, этнографы, психологи, историки, литературоведы и разные стороны переводческой деятельности могут быть объектом изучения в рамках

соответствующих наук. В то же время в науке о переводе - переводоведении - могут выделяться культурологические когнитивные, психологические, литературные и прочие аспекты. Если обобщить, то перевод -это процесс или результат передачи мысли с одного языка на другой, учитывая особенности как и исходного, так и переводимого языков.

Машинный перевод - это выполняемое на ЭВМ (компьютере) действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.

Существуют два принципиально разных подхода к построению алгоритмов машинного перевода: основанный на правилах (rule-based) и статистический, или основанный на статистике (statistical-based). Первый подход является традиционным и используется большинством разработчиков систем машинного перевода (ПРОМТ в России, SYSTRAN во Франции, Linguatec в Германии и др.). Ко второму типу относится популярный сервис Яндекс. Перевод, Переводчик Google, а также новый сервис от ABBYY

Статистический машинный перевод - это разновидность машинного перевода текста, основанная на сравнении больших объёмов языковых пар. Языковые пары - тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком - носителем двух языков, так и набором предложений и их переводов, выполненных человеком. Таким образом, статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше

Современное состояние и перспективы развития инженерного образования

результат статистического машинного перевода. Под понятием «статистического машинного перевода» подразумевается общий подход к решению проблемы перевода, который основан на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов [1-5].

Синхронный автоматический перевод (Speech-to-SpeechReal-TimeTranslation) - «моментальный» машинный перевод речи, с одного естественного языка на другой, с помощью специальных программных и технических средств. Так же называется направление научных исследований, связанных с построением подобных систем.

Процесс электронного перевода речи (S2S Real-TimeTranslation), как правило, включает следующие три этапа:

- автоматическое распознавание речи (ASR -automaticspeechrecognition) - преобразование речи в текст;

- машинный перевод (MAT - Machine-AssistedTranslation); - автоматический перевод текста с одного языка на другой;

- синтез речи (TTS - text-to-speech) - технология, которая даёт возможность произнести текст голосом, приближенным к естественному.

Вместо «машинный» иногда употребляется слово автоматический, что не влияет на смысл. Однако термин автоматизированный перевод имеет совсем другое значение - при нём программа просто помогает человеку переводить тексты.

Автоматизированный перевод - это широкое и не совсем точное понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:

Программы для проверки правописания, которые могут быть встроены в текстовые редакторы или дополнительные программы;

Программы для проверки грамматики, которые также встраиваются в текстовые редакторы или дополнительные программы;

Программы для управления терминологией, которые позволяют переводчикам управлять своей собственной терминологической базой в электронной форме.

Словари на компакт-дисках, одноязычные или многоязычные и т. д.

Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определенные изменения в сомнительных случаях называют «машинным переводом с участием человека».

Существует несколько форм организации взаимодействия ЭВМ и человека в машинном переводе:

- с постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат;

- с предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка;

- интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.

Качественный машинный перевод без участия человека возможен лишь в теории, машины, даже на их быстротечный прогресс, все еще слишком слабы, чтобы знать точные перечни всех синтаксических конструкций, возможных на том или ином языке, а также многое другое, что требуется знать любому уважающему себя переводчику. А пока что лишь мозг человека может различать разнообразные ситуации, видеть темы и ремы, учитывать стилистику, особенности языков и многое-многое другое.

Несмотря на то, что машинный перевод сейчас сделал огромные шаги в развитии, никто в коммерческой сфере не пользуется системами машинных переводов в полной мере, так как данные системы могут облегчить работу «живому» переводчику, но ни в коем случае его не заменить.

Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Таким образом, результаты машинного перевода почти всегда требуют редактирования. А то, насколько адекватными можно считать результаты перевода на компьютере, определяется не только качеством системы машинного перевода, но и качеством последующего редактирования.

Библиографические ссылки

1. Бар-Хиллел И. Будущее машинного перевода (почему машины не могут научиться переводить) // Вопросы языкознания. 1969. № 4. C. 11.

2. Будущее машинного перевода // Компьютера. 2002. № 21, 05 июня. C. 15.

3. Кулагина О. С. О современном состоянии машинного перевода // Математические вопросы кибернетики. Вып. 3. М. : Наука, 1991. C. 5-156.

4. Нелюбин Л. Л. Компьютерная лингвистика и машинный перевод. М., 1991.

5. Лингвистический энциклопедический словарь / глав. ред. В. Н. Ярцева. М. : Сов. энцикл., 1990. 685 с.

References

1. Bar-Hillel I. Future of machine translation (why machines can't learn to translate) // problems of linguistics. 1969. № 4. C. 11.

2. The future of machine translation // the Computer. 2002. № 21, June 05. C. 15.

3. Kulagina О. S. On the current state of machine translation // Mathematical problems of Cybernetics. Vol. 3. M. : Nauka, 1991. C. 5-156.

4. Nelyubin L. L. computational linguistics and machine translation.. M., 1991.

5. Linguistic encyclopedic dictionary / Chapters. edited by V. N. Yartseva. M. : Soviet encyclopedia, 1990. 685 p.

© Ртищева Н. Г., 2017

i Надоели баннеры? Вы всегда можете отключить рекламу.