Научная статья на тему 'НОВЫЕ ТЕХНОЛОГИИ В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА. СИСТЕМЫ ПОИСКА И РАСПОЗНАВАНИЯ'

НОВЫЕ ТЕХНОЛОГИИ В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА. СИСТЕМЫ ПОИСКА И РАСПОЗНАВАНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
35
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЕРЕВОДЧИК / СИНТАКСИЧЕСКАЯ СТРУКТУРА / ЛИНГВИСТИЧЕСКИЙ ПРОЦЕССОР / ТЕХНОЛОГИЯ RBMT / КАМЕРА-ПЕРЕВОДЧИК / ФОТОПЕРЕВОД

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Калиниченко А.А.

В статье рассматривается описание и применение современных систем по переводу слов с иностранных языков. На каких алгоритмах они основаны. Существующие недостатки и достоинства разных переводчиков. Какие возможности данные системы предоставляют пользователю.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEW TECHNOLOGIES IN MACHINE TRANSLATION SYSTEMS. SYSTEMS OF SEARCH AND RECOGNITION

The article deals with the description and application of modern systems to translate words from foreign languages. Existing advantages and disadvantages of different translators. What opportunities these systems provide to the user.

Текст научной работы на тему «НОВЫЕ ТЕХНОЛОГИИ В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА. СИСТЕМЫ ПОИСКА И РАСПОЗНАВАНИЯ»

УДК 004.4

Калиниченко А.А. студент 3 курса

факультет «Информатика и вычислительная техника»

Барашко Е.Н.

научный руководитель, старший преподаватель Донской Государственный Технический Университет

Россия, г. Ростов-на-Дону НОВЫЕ ТЕХНОЛОГИИ В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА.

СИСТЕМЫ ПОИСКА И РАСПОЗНАВАНИЯ В статье рассматривается описание и применение современных систем по переводу слов с иностранных языков. На каких алгоритмах они основаны. Существующие недостатки и достоинства разных переводчиков. Какие возможности данные системы предоставляют пользователю.

Ключевые слова: переводчик, синтаксическая структура, лингвистический процессор, технология RBMT, камера-переводчик, Live-перевод, фотоперевод.

Kalinichenko A. A.

student

The 3rd course, faculty of "informatics and computing"

Don state technical university Russia, Rostov-on-Donu Supervisor: Barashko E. N., senior lecturer, Don State Technical University Russia, Rostov-na-Donu NEW TECHNOLOGIES IN MACHINE TRANSLATION SYSTEMS.

SYSTEMS OF SEARCH AND RECOGNITION The article deals with the description and application of modern systems to translate words from foreign languages. Existing advantages and disadvantages of different translators. What opportunities these systems provide to the user.

Keywords: interpreter, syntactic structure, linguistic processor, technology RBMT, camera translator, live transfer, photo input support.

Машинный перевод и его дальнейшее совершенствование в современной жизни имеет огромное значение для человека. Для обеспечения понимания между людьми, не владеющими иностранными языками, при проведении деловых, политических переговоров, а также для переводов научных статей, документов, книг, зачастую используются услуги переводчиков. При этом уровень профессионализма переводчика может быть разный, и не все могут позволить его услуги. Использование бумажных словарей для качественного перевода занимает много времени, при этом возможно искажение смысла текста или беседы (так как во многих языках одно слово имеет несколько значений).

С развитием информационных технологий и появлением персонального компьютера стали создаваться электронные словари, которые автоматически переводили сразу несколько слов одновременно, при этом, не соблюдая смыслового значения. Разрабатывались машины, которые принимали во внимание грамматические правила, и особенности каждого языка. Вместо пословного перевода каждого предложения строиться своя синтаксическая структура, на основе правил грамматики входного языка. После этого структура преобразуется в синтаксическую структуру языка вывода, а затем подставляя слова из словаря, то есть синтез предложения на выходном языке.

Одной из программ, позволяющих решать проблемы с переводом является PROMT, разработанная в Санкт-Петербурге 1991 году, которая занимает 95% всего российского рынка по машинному переводу. В основе инструментария она включает десктопные переводчики для английского, немецкого, французского, испанского, итальянского, португальского и русского языков. Первоначально в основе перевода PROMT лежала технология машинного перевода, созданная на правилах (RBMT). Система RBMT использует морфологический и синтаксический анализ. Качество перевода зависит от количества объёмов лингвистических баз данных (словарей) и глубины описания естественных языков, то есть учитывается максимальное количество особенностей грамматической структуры. В конце 2010 года PROMT представил гибридную технологию производств, совмещающую в себе две системы: RBMT и SMT. Смысл такого совмещения в том, что вместо одного варианта перевода программа предоставляет различное количество переводов, число которых у одного предложения, в зависимости от нескольких значений одного слова, конструкций и результатов статистической обработки, может доходить до нескольких сотен. Далее вероятностная модель языка позволяет выбрать самый вероятный из предложенных вариантов. С 2011 года PROMT также предлагает решения на основе статистического подхода.

Возможности данной программы позволяют переводить документы разных форматов, переводить выделенную область экрана с графическим текстом, а также переводить слова и тексты с помощью «горячих клавиш».

В настоящее время для машинного перевода используются также и лингвистические процессоры. Одним из таких приложений является ЭТАП-3 - запатентованная система лингвистической обработки, ориентируется на английском и русском языках. Она был разработана в Москве в Институте проблем передачи информации. Основанная на правилах системы, которая использует теорию смысл-текст. Существует несколько применений ЭТАП-3, таких как инструмент машинный перевод, преобразователь универсального сетевого языка, интерактивный обучающий инструмент для пользователей, изучающих русский язык и синтаксически аннотированный корпус русского языка. Демо-версии некоторых из этих инструментов доступны в интернете. Программа может переводить текст с английского языка на русский и наоборот.

Современная разработка от Google Translate - камера-переводчик, программа для смартфонов, которая переводит тексты по фото. Пользователю достаточно навести камеру на фрагмент текста, и в окне приложения появляется моментальный перевод. Недостатком этой программы служит некачественный перевод текста, пользователь должен использовать дополнительный ресурс для лучшего понимания перевода.

Главным конкурентом Google Translate является продукт от компании ABBYY. Он имеет продвинутую настраиваемую систему профессиональных тематических словарей, что в итоге дает более качественный перевод, а еще Lingvo изначально запрограммирован под полностью автономную офлайн-работу. Отличие ABBYY Lingvo от Google Translate, является, то, что перевод текста происходит без подключения к интернету. Новая функция перевода через камеру работает в двух режимах:

1. Live-перевод распознает и переводит текст одним тапом по экрану. Указатель в центре экрана фокусируется на нужном слове, затем на экране появляется значение зафиксированного слова и затем происходит переход в словарную карточку.

2. Фотоперевод, отличается тем, что переводит текст уже с гтовой фотографии.

Всего в приложении 250+ различных словарей. 50 из них (11 русских + актуальные языки) включены в приложение по умолчанию, а приобретение дополнительных словарей происходит поштучно через IAP.

Существует множество различных систем переводов текстов. Анализируя возможности, предоставляемые пользователю, достоинства и недостатки выше описанных программ, с нашей точки зрения самой оптимальной является ЭТАП-3, так как она позволяет не только переводить тексты, но также обладает инструментарием и интерфейсом, помогающим изучению русского языка иностранными гражданами.

Без такого продукта технического прогресса человечеству сложно было бы изучать иностранные языки, путешествовать в разные страны, планировать бизнес на территории другой страны, а также просто посещать иностранные сайты.

Использованные источники:

1. «ABBYY Lingvo научился распознавать и переводить текст с камеры смартфона» // Статья. http://lifechaker.ru - Sergey Suyagin

2. «ПРОМТ»//Материал из Википедии-свободной энциклопедии. http://ru.wikipedia.org.

i Надоели баннеры? Вы всегда можете отключить рекламу.