Научная статья на тему 'Использование современных систем автоматизации перевода в научно-исследовательской деятельности'

Использование современных систем автоматизации перевода в научно-исследовательской деятельности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
303
56
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННЫЙ ПЕРЕВОД / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / ГЛОССАРИЙ / ТЕЗАУРУС / ПАМЯТЬ ПЕРЕВОДОВ / MACHINE TRANSLATION / ARTIFICIAL INTELLIGENCE / GLOSSARY / THESAURUS / TRANSLATION MEMORY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Саморукова А.В.

В статье идет речь о современных системах автоматизации перевода и способах их применения в научно-исследовательской и служебной деятельности сотрудников ОВД.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Modern Translation Automatization’s Systems Using in the Scientific Research Activities

The article deals with application of the modern translation automatization’s systems in the scientific research and service activity of the ofcers in the law enforcement bodies.

Текст научной работы на тему «Использование современных систем автоматизации перевода в научно-исследовательской деятельности»

Использование современных систем автоматизации перевода в научно-исследовательской деятельности

А. В. САМОРУКОВА,

оперуполномоченный, кандидат филологических наук, доцент (УЭБиПК ГУ МВД России по г. Москве)

The Modern Translation Automatization's Systems Using in the

Scientific Research Activities

A. V. SAMORUKOVA,

Candidate of Philology, Associate Professor,

Operative

(Department of the Economical Safety and Corruption Counteraction of the Main Department of the Interior Ministry of Russia of Moscow region)

УДК 81'33

В статье идет речь о современных системах автоматизации перевода и способах их применения в научно-исследовательской и служебной деятельности сотрудников ОВД.

Машинный перевод, искусственный интеллект, глоссарий, тезаурус, память переводов.

The article deals with application of the modern translation automatization's systems in the scientific research and service activity of the officers in the law enforcement bodies.

Machine translation, artificial intelligence, glossary, thesaurus, translation memory.

Машинный перевод (далее — МП) имеет богатую историю, насчитывающую несколько десятилетий. За этот период данное направление компьютерной лингвистики пережило свои взлеты и падения, однако в перспективности научной деятельности в данной области не приходится сомневаться. Любой исследователь сталкивается в своей деятельности с необходимостью перевода научной информации, поэтому интерес к машинному переводу как наиболее актуальной проблеме искусственного интеллекта, имеющей как теоретическое, так и практическое значение, неуклонно возрастает.

МП относят к наиболее перспективным областям использования новейших информационных технологий в научно-исследовательской деятельности.

Всеобщая глобализация ставит перед сотрудниками правоохранительных органов, занимающимися научной деятельностью или работающими в сфере международного сотрудничества,

такие важные задачи, как предоставление доступа к информационному мировому пространству без языковых барьеров и снижение трудозатрат (как временных, так и денежных). Как подчеркнуто в работе И. В. Хайрутдиновой, знание иностранного языка, особенно английского, очень актуально для сотрудников внутренних дел, так как Федеральный закон Российской Федерации от 7 февраля 2011 г. № З-ФЗ «О полиции» предполагает возможность привлечения личного состава российской полиции к проведению международных операций [1, 6].

Проблема доступа к мировым информационным ресурсам стала особенно актуальной в последние годы — часто в обязанности сотрудников правоохранительных органов входит анализ огромного потока многоязычной (в основном англоязычной) информации, которая может оказаться необходимой для принятия верных решений. В данной ситуации выполнение этой задачи практически невозможно без применения техно-

логий автоматического перевода. Также овладение электронными технологиями в процессе осуществления перевода можно рассматривать как неотъемлемый элемент создания познавательной мотивации и стимулирования познавательной деятельности слушателей, обучающихся в учебных заведениях МВД России [7].

В настоящее время существуют коммерческие системы МП, в большинстве своем представленные двумя типами: браузеры, использующие уже существующие системы МП, и онлайн-системы.

Первый тип основан на принципах объектно-ориентированного программирования, которое состоит из независимых модулей-компонентов (например, система WEBTRANSITE семейства STYLUS, произведенная компанией ПРОМТ российского происхождения). Этот тип сейчас получил широкое распространение благодаря тому, что представляет собой эффективный инструмент для решения многих лингвистических задач, включая МП и анализ большого объема текстовой информации.

Второй тип не требует какого-либо специального программного обеспечения для пользователей, так как перевод осуществляется на сервере, где установлена система МП. Это удобно, но сокращает объемы переводимого текста из-за ограниченных возможностей сервера. Наиболее популярные онлайн-системы МП - ЯНДЕКС.ПЕРЕВОД (2011 г.) и GOOGLE TRANSLATE (2006 г.).

Стоит добавить, что наиболее распространенными способами использования компьютеров профессиональными переводчикам при письменном переводе является работа со словарями, глоссариями и памятью переводов (Translation memory), содержащей примеры ранее переведенных текстов (параллельные тексты) [2, 5], а также использование больших текстовых массивов на одном или нескольких языках, что дает понимание того, как слова и выражения используются в языке в целом, а также в конкретной предметной области.

Говоря о качестве получаемого перевода, стоит отметить тот факт, что он зависит от тематики и исходного текста. МП художественных текстов в настоящее время признан неэффективным, но при МП технических, научных и официально-деловых документов при наличии специализированных машинных словарей [4] и некоторой настройке системы на особенности того или иного типа текстов возможно получение качественного перевода, нуждающегося лишь в небольшой редакторской корректировке. При этом обращает на себя внимание тот факт, что особое место в современном МП занимают лексические проблемы, главным образом те, которые касаются терминов. Современные системы МП переводят с постредактированием

главным образом тексты научно-технического характера при условии однородности текстов, т. е. отсутствия больших различий в синтаксисе, стиле, характере употребляемой лексики и т. п. При этом наибольшую трудность представляет именно перевод терминов, причем широкого лексического значения, например, таких как «машина», «реакция», «эффективность», «автомат» и т. п. Многозначность терминологии снимается ближайшим контекстом, поскольку, как правило, экстралингвистический контекст (принадлежность к определенному подъязыку) задается типом текстов. Однако такое снятие многозначности предполагает наличие и использование специальных словарей [4]. Перевод сложных грамматических конструкций зачастую является некорректным, иногда мешающим пониманию ситуации или вовсе меняющим значение предложения.

Тем не менее, практика показывает, что использование систем МП после их настройки в соответствии с тематикой документов обеспечивает сокращение затрат времени на перевод приблизительно на 20—50 %.

Рис.1 Технологическая цепочка при переводе документа.

Факторы, в наибольшей степени влияющие на эффективность применения средств МП:

— структура документооборота. Если документы на перевод направляются в электронном виде, то только за счет сокращения объема ручной работы скорость всего процесса перевода увеличивается на 10-20 %;

— стиль документации, включая степень повторяемости. Высокая степень повторяемости делает эффективным применение систем МП. Унифицированные документы, хорошо поддающиеся обработке в настроенной системе МП, гарантируют ускорение процесса перевода на 60—70 %;

— объем требуемых переводов. Чем больше требуемый объем переводов, тем эффективнее применение средств МП;

— необходимость организации коллективной работы при переводе документов. Процесс подготовки документов обязательно должен включать этап тщательного редактирования с целью соблюдения единых стандартов и стилей. Применение средств автоматизации позволяет решить эти проблемы и тем самым сократить временные затраты на 10—20 %;

— наличие жестких требований к единству терминологии. Применение МП позволяет гарантировать соблюдение жестких требований к единству терминологии и сохранению форматирования. Зачастую таким образом удается сократить временные затраты на 40—70 %.

Формы организации взаимодействия компьютера и человека при МП:

— перевод с постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат;

— перевод с предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка;

— с интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи.

Следует различать понятия «автоматический» и «автоматизированный» перевод. Автоматический перевод (machinetranslation) — это процесс, при котором система МП полностью переводит документ, понятие «автоматизированный перевод» (machine-aided или machine-assisted translation) имеет совсем другое, более широкое значение — при его использовании программа просто помогает человеку переводить тексты, применяя различные вспомогательные средства — автоматические словари, системы автоматического перевода и т. д.

С появлением в жизни людей персонального компьютера, безусловно, стало возможным облегчить работу исследователей, увеличить скорость и качество ее выполнения с помощью специальных программ. Как отмечают В. Б. Княжев и А. Ф. Майдыков, повышение результативности учебно-методической деятельности должно быть обеспечено не только посредством разработки и обновления учебно-методических материалов учебных дисциплин, но и за счет применения новых педагогических технологий с широким использованием электронной техники [3]. Становится очевидным, что интеграция информационных технологий в научно-исследовательскую деятельность сотрудников ОВД является одним из самых приоритетных направлений и весомым фактором повышения эффективности служебной деятельности.

Список литературы:

1. О полиции: федер. закон Российской Федерации от 7 февраля 2011 г. № З-ФЗ // Рос. газ., 2011.

2. Maia B. Parallel texts and the study of sentence formation. // In translation and meaning, part 4. Maastricht, the Netherlands. 1995.

3. Княжев В. Б., Майдыков А. Ф. О путях дальнейшего совершенствования деятельности кафедр Академии управления МВД России // Труды Академии управления МВД России. 2016. № 4 (40).

4. Саморукова А. В. Особенности формирования профессиональных лексиконов (на примере создания автоматического словаря для налоговых служб): автореф. дис. ... канд. филол. наук. М., 2001.

5. Убин И. И. Параллельные тексты как лексическая основа автоматизации в двуязычной лексикографии // Сб. «Теоретические и практические аспекты лексикографии». Иваново, 1997.

6. Хайрутдинова И. В. Проблема обучения терминологии в педагогической практике // Труды Академии управления МВД России. 2012. № 1 (21).

7. Хайрутдинова И. В., Пырченкова Г. С. Методы и приемы обучения профессионально ориентированной коммуникации на иностранном языке // Труды Академии управления МВД России. 2009. № 2 (10).

E-mail: ecosd@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.