Научная статья на тему 'СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА'

СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
432
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННЫЙ ПЕРЕВОД / АВТОМАТИЧЕСКИЙ ПЕРЕВОД / КОРПУСНАЯ ЛИНГВИСТИКА / НЕЙРОСЕТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ростовская М.Д.

Информационный технологии непрерывно развиваются, возникают комплексные и сложные программы, такие как нейронные сети, которые постепенно входят в различные аспекты человеческой жизнедеятельности. Имитируя работу сознания человека, они позволяют писать тексты, создавать изображения, видео, программы и многое другое. Наряду с этим развивается и машинный перевод, который важен не только в контексте жизни специалиста-переводчика, но и в быту обычного человека. В статье будет рассматриваться состояние машинного перевода в наши дни.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CURRENT STATE OF MACHINE TRANSLATION

Information technologies are continuously developing, complex programs such as neural networks are emerging. Imitating the work of human consciousness, they allow us to write texts, create images, videos, programs and etc. Along with this, machine translation technologies are also developing. The article will consider the state of machine translation in our days.

Текст научной работы на тему «СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА»

УДК 81.33

Ростовская М.Д.

магистрант, кафедра Иностранных языков и перевода, Уральский гуманитарный институт Уральский федеральный университет имени первого Президента России Б.Н. Ельцина г. Екатеринбург, Россия)

СОВРЕМЕННОЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ МАШИННОГО ПЕРЕВОДА

Аннотация: информационный технологии непрерывно развиваются, возникают комплексные и сложные программы, такие как нейронные сети, которые постепенно входят в различные аспекты человеческой жизнедеятельности. Имитируя работу сознания человека, они позволяют писать тексты, создавать изображения, видео, программы и многое другое. Наряду с этим развивается и машинный перевод, который важен не только в контексте жизни специалиста-переводчика, но и в быту обычного человека. В статье будет рассматриваться состояние машинного перевода в наши дни.

Ключевые слова: машинный перевод, автоматический перевод, корпусная лингвистика, нейросеть.

История машинного перевода начинается с 1950-х годов, с применения словарного подхода, позволившего получать простой дословный перевод. В 1990-е годы с развитием корпусной лингвистики, основанной на примерах, сборе и хранении правильных переводов, машинный перевод начал совершенствоваться и давать более точные результаты [6, р. 92]. В настоящее время в развитии машинного перевода все большую роль начинают играть разработки в области искусственного интеллекта.

Актуальным предметом изучения остаются подходы к машинному переводу, их преимущества и недостатки. Исследователи в области подходов к машинному переводу работают над развитием гибридного подхода, который смог бы сочетать сильные стороны уже используемых инструментов: подход, основанный на грамматических правилах, корпусный подход, направленный на формирование баз с источниками данных, и статистический поход, сутью которого является использование программой большого количества параллельных текстов на разных языках [5, p. 165]. Совершенствование машинного перевода имеет комплексный характер, наблюдается тенденция усложнения и слияния нескольких подходов к машинному переводу для получения более точных результатов. Так, например, «Яндекс-переводчик», по словам одного из разработчиков Антона Дворковича, еще с сентября 2017 года отказался от использования статистической модели перевода в пользу гибрида на основе нейросетей [2].

Принципиальной особенностью нейросетевого подхода к машинному переводу является использование контекста всего исходного предложения для перевода, что позволяет получить более качественный результат. Высокая скорость графических процессоров и использование преимуществ параллелизма позволяют эффективно справляться с большим количеством задач при машинном переводе [1].

Кроме того, с усилением интереса к нейросетям, появляются совершенно новые разработки в области машинного перевода. Исследователями Массачусетского технологического института и Калифорнийского университета в Сан-Диего разрабатывается новая модель машинного перевода под названием VALHALLA, которая должна работать по принципу связи текста и ассоциативного изображения [3]. Работу такой модели можно представить следующим образом: специальная нейронная сеть сначала видит исходное предложение на одном языке, проецирует образ того, как оно может выглядеть, а затем использует эти данные для перевода на целевой язык. Команда обнаружила,

что такой метод демонстрирует более высокую точность машинного перевода по сравнению с обычным переводом текста.

Однако, несмотря на прогресс в сфере машинного перевода, здесь остается ряд проблем, решить которые до сих пор трудно. Во-первых, это перевод на морфологически богатые языки, такие как финский, арабский, немецкий: многие системы машинного перевода в силу недостатка баз данных не могут генерировать незнакомые им словоформы [4, p. 2].

Во-вторых, это перевод речи: содержание и качество устной речи значительно отличается от того, что может предложить машинный перевод в рамках подхода, доминирующее значение в котором имеет опора на существующие шаблоны и примеры [4, p. 2].

В-третьих, это перевод поэтических текстов, где автоматический перевод особенно проявляет свою слабую сторону. Тексты, изобилующие художественной образностью, теряют при автоматическом переводе зачастую не только свой ритмический рисунок, но и смысл, потому что машина выбирает не подходящую по значению переводческую единицу. Актуальной проблемой остается перевод образных выражений, таких как идиомы и пословицы, потому что машинный перевод зачастую предоставляет дословный и буквальный перевод таких выражений. Например, в песне группы Queen «We are the champions» есть строчка, в которой используется идиома «no bed of roses», означающая нелегкую жизнь, непростой опыт. Строчку «but it's been no bed of roses» можно перевести как «но это было нелегко», в некоторых поэтических переводах встречается вариант «борьба была нелегкой», однако крупные системы машинного перевода продолжают выдавать дословный перевод. Результат Google-переводчика: «но это не было розовым ложем», результат Яндекс-переводчика: «но это не было ложе из роз». Машинам все еще трудно считывать метафоры и видеть глубинный смысл таких высказываний.

Также актуальной проблемой остается нехватка данных для обучения машин перевода: требуется огромное количество предложений на языке

оригинала и перевода, структурированных по парам предложений, причем, эти примеры должны быть разнообразны по контексту. Особенно остро такая проблема стоит для редких языков и языков со сложной письменностью.

Таким образом, в области автоматизированного перевода появляются новые вызовы, связанные с нехваткой данных для качественного обучения машин. Тем не менее, с появлением новых технологий, таких как нейросети, машинный перевод стремительно меняется и, благодаря новым подходам и методам, выдает все более точные результаты, приближенные к работе реального переводчика.

СПИСОК ЛИТЕРАТУРЫ:

ашинный перевод 21 века: доступная фантастика. Интервью с Юлией Епифанцевой. URL: https://www.tadviser.ru/a/568603 (дата обращения:

динцев Н. Почему нейросеть-переводчик придумывает новые слова. URL:

3. Hinkel L. Hallucinating to better text translation URL: https://news.mit.edu/2022/hallucinating-better-text-translation-0606?hss_channel=lis-oCknw3BEJc (дата обращения: 01.06.2023)

4. Lopez A., Post M. Beyond bitext: Five open problems in machine translation // Proceedings of the EMNLP workshop on twenty years of Bitext. - 2013. - P. 1-3. kpor M. D. Machine translation approaches: issues and challenges // International Journal of Computer Science Issues (IJCSI). - 2014. - Vol. 11. - №. 5. - P. 159-165. heng H. A case study of machine translation: Problems and suggestions // International Journal of English Linguistics. - 2015. - Vol. 5. - №. 2. - P. 92-99.

Rostovskaya M.D.

master student, Department of Foreign Languages and Translation, Ural Institute of Humanities Ural Federal University named after the First President of Russia B.N.Yeltsin

(Ekaterinburg, Russia)

CURRENT STATE OF MACHINE TRANSLATION

Abstract: information technologies are continuously developing, complex programs such as neural networks are emerging. Imitating the work of human consciousness, they allow us to write texts, create images, videos, programs and etc. Along with this, machine translation technologies are also developing. The article will consider the state of machine translation in our days.

Keywords: machine translation, automatic translation, corpus linguistics, neural networks.

i Надоели баннеры? Вы всегда можете отключить рекламу.