ОБЩИЕ ПРИНЦИПЫ МАШИННОГО ПЕРЕВОДА Маматкасимова В.А.
Маматкасимова Васила Акрамджановна - кандидат филологических наук, преподаватель французского языка,
кафедра романо-германских языков, Университет мировой экономики и дипломатии, г. Ташкент, Республика Узбекистан
Аннотация: в самом общем виде сегодня под «машинным переводом» следует понимать автоматизированное действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом естественном языке, а также результат такого действия. Днем рождения машинного перевода как научного направления принято считать 4 марта 1947 г., поскольку именно в этот день американский математик, специалист по дешифровке Уоррен Уивер написал математику и философу Норберту Винеру письмо, в котором предложил рассматривать задачу перевода, как дешифровку текста. Поскольку в современном обществе наблюдается большой обмен информации на разных языках, а новые технологии, в том числе машинного перевода, постоянно появляются и совершенствуются, машинный перевод стремительно развивается. На смену устаревающим технологиям машинного перевода приходят более современные, позволяющие достичь более высоких результатов в более сжатые сроки. В обзоре представлена история возникновения машинного перевода, а также основные его виды, начиная с машинного перевода «по правилам» и заканчивая современными инструментами машинного перевода, основанного на технологии машинного обучения и искусственного интеллекта.
Ключевые слова: перевод, машинный перевод, естественные языки, история машинного перевода, машинный перевод «по правилам», статистический машинный перевод, гибридный машинный перевод, нейронный машинный перевод, искусственный интеллект, компьютерная лингвистика.
GENERAL PRINCIPLES OF MACHINE TRANSLATION Mamatkasimova У.А.
Mamatkasimova Vasila Akramjanovna - Candidate of Philology, French Lecturer, DEPARTMENT OF ROMANO-GERMANIC LANGUAGES, UNIVERSITY OF WORLD ECONOMY AND DIPLOMACY, TASHKENT, REPUBLIC OF UZBEKISTAN
Abstract: in its most general form today, "machine translation" should be understood as an automated action to convert a text in one natural language into a text equivalent in content in another natural language, as well as the result of such an action. The birthday of machine translation as a scientific direction is considered to be March 4, 1947, since it was on this day that the American mathematician and deciphering specialist Warren Weaver wrote a letter to the mathematician and philosopher Norbert Wiener, in which he proposed to consider the task of translation as deciphering a text. Since in modern society there is a large exchange of information in different languages, and new technologies, including machine translation, are constantly emerging and improving, machine translation is developing rapidly. Outdated machine translation technologies are being replaced by more modern ones, which allow achieving better results in a shorter time. The review presents the history of the emergence of machine translation, as well as its main types, starting with ma chine translation "by the rules" and ending with modern machine translation tools based on machine learning technology and artificial intelligence.
Keywords: translation, Machine translate, natural languages, history of machine translation, machine translation "according to the rules", statistical machine translation, hybrid machine translation, neural machine translation, artificial intelligence, computer linguistics.
УДК 070.378.174
Предложение У. Уивера возникло не спонтанно, а как логическое продолжение идей, «витавших» в воздухе на протяжении не одного десятилетия. Так, две первые машины (устройства) «для перевода» были запатентованы независимо друг от друга в России и во Франции еще в 1933 г. Строго говоря, эти механизмы почти ничего не переводили, но их появление было символично, поскольку мечта о машинах-переводчиках, заменяющих людей-переводчиков, приобрела физические очертания: запатентованные машины представляли собой реальные механизмы, потенциально успешные [1. C. 58]. Первый патент на изобретение переводной машины с многообещающим названием «Механический мозг» 22 июля 1933 г. получил французский гражданин армянского происхождения Жорж Арцруни. По сути «Механический мозг» представлял всего лишь большой механизированный словарь на бумажной ленте, однако на тот момент подобное новшество было воспринято общественностью с большим энтузиазмом. Российский
ученый П.П. Троянский свой патент «Машину для подбора и печатания слов при переводе с одного языка на другой или на несколько других одновременно» зарегистрировал спустя два с половиной месяца. Машина П.П. Троянского не представляла собой автоматизированное устройство, в ее работе требовались два помощника: один - владеющий исходным языком (языком оригинала), второй - языком перевода. Обязанностью первого помощника было задавать машине базовую форму каждого слова в подлежащем переводу предложении, его грамматические категории и роль в данном предложении (этот этап П.П. Троянский надеялся в скором времени механизировать, обратившись к помощи языковедов), после чего машина осуществляла «перевод». При этом в «переведенном» тексте все слова оказывались также в базовой форме, и уже второй помощник приводил «переведенный» машиной текст в соответствующий литературной норме вид. В 1937 г. на Парижской всемирной выставке Ж. Арцруни представил общественности работающий образец своей машины.
Изначально в основу машинного перевода был положен принцип перевода «по правилам» (Rule-Based Machine Translation, RBMT) (его также называют классическим). Машинный перевод «по правилам» разрабатывается на основе лингвистической информации об исходном и переводном языках. Разработчики такого перевода исходят из необходимости сопоставления двуязычных словарей и грамматик, которые описывают основные семантические, морфологические, синтаксические закономерности каждого языка [2. C. 231].
Следующим этапом в развитии машинного перевода стал так называемый статистический перевод (Statistical Machine Translation, SMT), который был доминирующей парадигмой машинного перевода на протяжении нескольких десятилетий. Основанные на выравнивании данных двуязычных параллельных корпусов системы статистического машинного перевода вычисляют частоту выровненных сегментов в параллельном корпусе. Модель статистического машинного перевода, основанная на структуре двух языков и отношений между ними, реализуется после выравнивания текста на уровне слов и фраз.
Список литературы /References
1. Барашко Е.Н., Храпцов Д.А. Современные системы машинного перевода // Актуальные проблемы развития естественных и технических наук: материалы международной научно-практической конференции. Новосибирск, 2018.
2. Котенко В.В. Перспективы развития нейронного машинного перевода в контексте концепции открытого образования // Ученые записки университета им. П.Ф. Лесгафта, 2020. № 4 (182).