Научная статья на тему 'АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА'

АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
283
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА / АВТОМАТИЗИРОВАННЫЙ ПЕРЕВОД / ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Егоров В.А.

В данной статье рассмотрены виды систем автоматизированного перевода. Проведен обзор основных систем машинного перевода, произведен их анализ и сравнение. Выдвинуты предположения о возможных путях развития таких систем.This article describes the types of automated translation systems. A review of the main machine translation systems, made analysis and comparison. Suggested possible ways of development of such systems.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА»

УДК 004.4

Егоров В. А. студент 4 курса

факультет «Информационных систем и технологий» Поволжский Государственный Университет Телекоммуникаций и Информатики

Россия, г. Самара АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО

ПЕРЕВОДА

Аннотация. В данной статье рассмотрены виды систем автоматизированного перевода. Проведен обзор основных систем машинного перевода, произведен их анализ и сравнение. Выдвинуты предположения о возможных путях развития таких систем. Ключевые слова: Компьютерная лингвистика, автоматизированный перевод, обработка естественного языка.

ANALYSIS AND SELECTION OF TRANSLATION SYSTEMS Annotation. This article describes the types of automated translation systems. A review of the main machine translation systems, made analysis and comparison. Suggested possible ways of development of such systems.

Key words: Computational linguistics, automated translation, Natural Language Processing

Машинный перевод—процесс перевода текстов с одного естественного языка на другой с помощью специальной компьютерной программы. Различают следующие основные цели использования автоматизированного перевода:

1. Упрощение работы переводчика - используя машинный перевод, переводчик может значительно ускорить перевод текста.

2. Возможность коммуникаций - машинный перевод дает возможность написать любому человеку из любой точки Земли.

3. Автоматическая локализация - позволяет быстрорастущим компаниям увеличивать рынок сбыта.

4. Быстрое ознакомление с интересующей информацией - машинный перевод позволяет получить в общих чертах информацию о содержании статьи, книги и т.д.

В данной статье будут рассмотрены самые популярные системы, работающие с русским языком, разобран принцип их работы, описаны основные достоинства и недостатки.

В настоящее время различают три вида систем машинного перевода:

1. Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT).

2. Статистические системы (Statistical Machine Translation, SMT).

3. Гибридные системы.

Системы на основе грамматических правил производят анализ текста, который используется в процессе перевода. Перевод производится на основе

встроенных словарей для данный языковой пары, а так же грамматик, охватывающих семантические, морфологические, синтаксические закономерности обоих языков. На основе всех этих данных исходный текст последовательно, предложение за предложением, преобразуется в текст на требуемом языке. Основной принцип работы таких систем - связь структур исходного и конечного текстов.

Системы на основе грамматических правил часто разделяют еще на три подгруппы - системы пословного перевода, трансфертные системы и интерлингвистические системы.

Преимуществами систем на основе грамматических правил являются грамматическая и синтаксическая точность, стабильность результата, возможность настройки на специфическую предметную область. К недостаткам таких систем относят необходимость создания, поддержки и обновления лингвистических баз данных, трудоемкость создания такой системы, а так же ее высокая стоимость.

Статистические системы при своей работе используют статистический анализ. В систему загружается двуязычный корпус текстов (содержащий большое количество текста на исходном языке и его «ручной» перевод на требуемый язык), после чего система анализирует статистику межъязыковых соответствий, синтаксических конструкций и т.д. Система является самообучаемой - при выборе варианта перевода она опирается на полученную ранее статистику. Чем больший словарь внутри языковой пары и чем точнее он составлен, тем лучше результат статистического машинного перевода. С каждым новым переведенным текстом улучшается качество последующих переводов.

Статистические системы отличаются быстротой настройки и легкостью добавления новых направлений перевода. Среди недостатков наиболее значительными является наличие многочисленных грамматических ошибок и нестабильность перевода.

Гибридные системы сочетают в себе подходы, описанные ранее. Ожидается, что гибридные системы машинного перевода позволяют объединить все преимущества, которыми обладают статистические системы и системы, основанные на правилах.

Будут рассмотрены три крупнейшие системы машинного перевода, работающие с русским языком - Яндекс.Перевод, Google Translate, PROMT.

Google Translate - система, в настоящий момент разрабатываемая компанией Google. Первоначально разрабатывалась Franz Josef Och. Построена на статистическом методе перевода. Для обучения системы первоначально использовались параллельные корпуса текстов ООН.

Данная система не осуществляет прямой перевод для языков пар, которые не входит английский язык. То есть, при переводе, например, с русского на итальянский, сначала будет осуществлен перевод с русского на английский язык, а после этого - с английского на итальянский.

Более того, для некоторых таких шагов больше. Например, тексты на

белорусском языке вначале переводятся на русский, после этого на английский и только потом превращаются в текст на конечном языке. Это значительно снижает точность перевода и делает систему абсолютно непригодной для перевода ряда текстов.

Яндекс.Перевод представляет собой сервис автоматического перевода слов, фраз, целых текстов, а так же веб-страниц. Яндекс.Перевод использует статистический перевод. Яндекс.Перевод состоит из двух частей - модели перевода и модели языка. Модель перевода занимается построением графа, содержащего все возможные варианты перевода предложения. Модель языка выбирает лучший вариант перевода с точки зрения оптимальной сочетаемости слов в естественном языке.

Хотя список доступных для перевода языков у Яндекс.Перевода значительно меньше, чем у Google Translate, перевод осуществляется напрямую, без использования промежуточных звеньев.

Система PROMT, для перевода строит полное синтаксическое дерево исходного текста. Для его построения она использует отдельно заданные правила для каждого языка. Причем она способна правильно обрабатывать анафоры, эллипсис и другие трудно поддающиеся обработке языковые конструкции. При переводе учитываются связи между словами в этом дереве, возможное положение этих слов в USH (Univerasl Sematic Hierarchy -иерархии универсальных семантических значений и отношений между ними), а также статистика взаимоотношений между словами.

Основным недостатком данной системы является её закрытость, отсутствие данных о полномасштабных тестированиях данной системы, что делает невозможным оценку качества производимого ей машинного перевода.

В настоящий момент, наиболее распространены системы машинного перевода, основанные на статистическом анализе. Эти системы проще создать и поддерживать.

В противоположность им, системы, основанные на правилах трудоемки в разработке и поддержке.

Однако, системы, основанные на правилах, уже сейчас имеют куда более высокое качество перевода, чем системы, основанные на статистике. Кроме того, они куда более перспективны.

Но построение систем на основе правил - задача хоть и необходимая и перспективная, но невероятно трудоемкая. Над созданием правил трудятся десятки лингвистов в течение многих лет. Поэтому прекрасным вариантом будет построение гибридной системы машинного перевода, которая будет обладать такими качествами как открытость, благодаря ей становится возможно пополнение базы правил не только ограниченной группой лиц, но силами всего общества, и гибридный принцип построения - сочетание статистических и естественно-языковых технологий позволит при меньшей базе правил добиться существенного повышения качества перевода.

В статье рассмотрены виды систем машинного перевода, приведены

примеры таких систем, произведено их сравнение и анализ. Наибольший интерес представляют системы, основанные на правилах и гибридные системы.

Использованные источники:

1. Машинный перевод: исторический обзор и преимущества [Электронный ресурс]: Компания ПРОМТ. — Режим доступа: http://www.promt.ru/company/press/pdf/mt_istorich_obzor_preimushestva.pdf

2. Нелюбин, Л.Л. Компьютерная лингвистика и машинный перевод[Текст] / Л.Л. Нелюбин // М., 1991. - С.152

3. Беляева Л.Н., Откупщикова М.И. (1996). Автоматический перевод. - В сб.: Прикладное языкознание. Азбука.

УДК 519.86:330.4

Татаринцева И.В., к.э.н.

доцент

Московский государственный технический университет им. Н.Э. Баумана (национальный исследовательский университет)

Россия, г. Москва Татаринцев В.А., к. техн. н.

доцент

Брянский государственный технический университет

Россия, г. Брянск АНАЛИЗ ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ С ПОМОЩЬЮ ЕСТЕСТВЕННО-НАУЧНЫХ МОДЕЛЕЙ

Аннотация: Рассмотрены основные математические модели естествознания, которые применяются для моделирования экономических процессов. Приведены примеры их применения для анализа влияния различных факторов на закономерности развития социально-экономических систем.

Ключевые слова: математические модели естествознания, базовая динамическая модель, экономическая система.

Tatarintseva I. V., Candidate of Economic Sciences, associate Professor Bauman Moscow State Technical University, Russia, Moscow Tatarintsev V.A., Candidate of Engineering Sciences, associate Professor

Bryansk State Technical University, Russia, Bryansk THE ANALYSIS OF ECONOMIC PROCESSES USING NATURAL-SCIENTIFIC MODELS Abstract: In article the main mathematical models of natural sciences which are applied to modeling of economic processes are considered. Some examples of their use-for the analysis of influence of various factors on the regularities of development of social-economic systems.

Key words: mathematical models of natural sciences, basic dynamic model, economic system.

i Надоели баннеры? Вы всегда можете отключить рекламу.