Научная статья на тему 'Память переводов в обучении переводчиков'

Память переводов в обучении переводчиков Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3831
656
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАМЯТЬ ПЕРЕВОДОВ / НАКОПИТЕЛЬ ПЕРЕВОДОВ / ПРОФЕССИОНАЛЬНОЕ ОБУЧЕНИЕ / ПЕРЕВОД / ОБУЧЕНИЕ ПЕРЕВОДУ / TM-ПРОГРАММА / TRANSLATION MEMORY / PROFESSIONAL EDUCATION / TRANSLATION / TEACHING TRANSLATION / TM SOFTWARE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бабина Ольга Ивановна, Осминин Павел Григорьевич

Рассмотрена задача обучения студентов работе со специализированным программным обеспечением. Освещена история развития программ памяти переводов, приводятся примеры наиболее известных программ, включая российские разработки, и критерии их различия, описывается общий процесс работы с программами, указываются наиболее типичные сферы применения технологии памяти переводов. Указаны преимущества программ памяти переводов, которые заключаются в повышении производительности труда переводчика, упрощении соблюдения единства терминологии в тексте перевода. Приведены недостатки таких программ повышение эффективности труда возможно только при переводе текстов, содержащих большое количество повторений, обучение работе с программами требует, как правило, временных и финансовых затрат. Обосновывается применение в образовательном процессе технологии памяти переводов, а также приводятся различные типы заданий для студентов, направленные на формирование навыка использования памяти переводов. Задания отражают реальную специфику работы переводчика, что увеличивает конкурентоспособность будущего выпускника на рынке труда. Приводится методика оценки результатов обучения. Результаты статьи могут использоваться при составлении методических рекомендаций по курсу обучения переводу.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TRANSLATION MEMORY IN TRANSLATORS’ EDUCATION

This paper deals with a topical issue of modern professional education consisting in teaching students to use special software in professional activity. The article presents a historical background of the development of Translation Memory (TM) software; most popular TM-software (including Russian achievements in this field) is exemplified and compared. The general process of utilizing TM-software in translators’ activity is described; typical spheres of translation memory usage are enumerated. The advantages of using the TM-software (increasing translators’ labour efficiency, alleviating terminology unification in the text in target language) are shown. Some disadvantages of these computer programs (an ability to increase efficiency only within restricted domains in texts containing many repetitions, high price of the software, time for learning to use the software) are also mentioned. The use of translation memory software in education is grounded. Different types of tasks for students aimed at mastering their practical skills in using translation memory software are suggested. These tasks reflect a specific character of the translators’ work, which allows the alumni to gain competitive advantage at labor market. Procedure for evaluating training results is given. The results of the paper can be used for compiling academic guidelines for translators’ education.

Текст научной работы на тему «Память переводов в обучении переводчиков»

УДК 378.16 ББК Ш11

ПАМЯТЬ ПЕРЕВОДОВ В ОБУЧЕНИИ ПЕРЕВОДЧИКОВ

О.И. Бабина, П.Г. Осминин Южно-Уральский государственный университет (г. Челябинск)

Рассмотрена задача обучения студентов работе со специализированным программным обеспечением. Освещена история развития программ памяти переводов, приводятся примеры наиболее известных программ, включая российские разработки, и критерии их различия, описывается общий процесс работы с программами, указываются наиболее типичные сферы применения технологии памяти переводов. Указаны преимущества программ памяти переводов, которые заключаются в повышении производительности труда переводчика, упрощении соблюдения единства терминологии в тексте перевода. Приведены недостатки таких программ - повышение эффективности труда возможно только при переводе текстов, содержащих большое количество повторений, обучение работе с программами требует, как правило, временных и финансовых затрат. Обосновывается применение в образовательном процессе технологии памяти переводов, а также приводятся различные типы заданий для студентов, направленные на формирование навыка использования памяти переводов. Задания отражают реальную специфику работы переводчика, что увеличивает конкурентоспособность будущего выпускника на рынке труда. Приводится методика оценки результатов обучения. Результаты статьи могут использоваться при составлении методических рекомендаций по курсу обучения переводу.

Ключевые слова: память переводов, накопитель переводов, профессиональное обучение, перевод, обучение переводу, ТМ-программа.

Введение

В современном мире увеличивается необходимость в переводческих услугах. Объем рынка переводов растет, увеличивается потребность в квалифицированных переводчиках, требуется повышение производительности труда переводчиков. Значительно возросла роль информационных технологий в переводе - широкое распространение получили как общие программы (текстовые редакторы), так и специализированные переводческие программы (электронные словари, корпусы текстов, программы памяти переводов, терминологические базы). Сам материал для перевода претерпел изменения - все чаще для перевода предлагается цифровой материал в виде презентаций, мультимедийных материалов [1]. Ряд авторов [2, 3] отмечает, что при подготовке переводчиков требуется учитывать изменения в работе переводчиков, обучать современным навыкам и умениям, использовать в обучении современные информационные технологии.

Обзор TM-программ

Технология памяти переводов, или накопителя переводов (Translation Memory, TM), предназначена для повторного использования

в переводческой деятельности ранее переведенных текстов.

Одни из первых попыток использования компьютера для помощи в ручном переводе относятся к 1966 г. [4]. В г. Мангейм Агентство переводов Вооруженных Сил Германии использовало компьютер для создания глоссариев для определенных типов текстов. Работа происходила следующим образом: переводчик читал английский текст и подчеркивал слова, для которых ему нужны немецкие эквиваленты. Затем оператор ЭВМ подавал эти сведения в компьютер, который мог составлять три или четыре глоссария к тексту за десять минут работы.

В Люксембурге в терминологическом бюро Европейского объединения угля и стали применялся поиск терминов в автоматическом словаре. По оценкам бюро переводчик тратил на поиск терминов не менее четверти времени. При работе с системой переводчик подчеркивал неизвестные ему слова. Затем предложение целиком вводилось в компьютер, осуществлялся автоматический поиск, и на печать выводились наиболее схожие предложения, а также слова с переводом в порядке появления в тексте. Чем больше поступало

запросов от переводчика, тем среди большего количества предложений выполнялся поиск, что увеличивало вероятность появления терминов в правильном контексте. Таким образом, бюро удалось не только облегчить работу переводчика, но и составлять специализированные глоссарии в короткие сроки.

В 1979 г. Питер Артен [5] пришел к выводу, что тексты Европейской Комиссии, которые необходимо было переводить на несколько языков, содержат очень большое количество повторений и цитат из различных документов комиссии, поэтому переводчики вынуждены тратить время на перевод уже переведенных текстов. Артен предложил, что необходимо иметь общую центральную память большого объема с функцией поиска, куда будут сохраняться все документы организации и их переводы. При наборе текста будет возможность указать требуемые языки для перевода и сравнить документ с документами в общей памяти, откуда будут выведены на печать наиболее близкие варианты перевода предложений оригинального текста на требуемых языках.

Мартин Кэй в 1980 г. в своем отчете [6] описал предполагаемое устройство для помощи переводчику, состоящее из текстового редактора и словаря. Текстовый редактор состоит из двух окон - верхнего, где содержится оригинальный текст, и нижнего, куда заносится перевод. Переводчик имеет возможность выделить слово или словосочетание в тексте и выполнить поиск в словаре; предполагалась возможность редактировать записи в словаре.

Первые коммерческие TM-программы появились в начале 1990-х годов. В 1984 г. в швейцарском городе Штайн-на-Рейне была основана компания STAR (акроним от Software Translation Artwork Recording). Компания занималась разработкой программного обеспечения, оказанием услуг по переводу. В 1991 г. компания выпустила программу Transit для операционной системы DOS, в состав программы входил модуль управления терминологией TermStar.

В 1984 г. в немецком городе Штутгарт была основана компания TRADOS (акроним от TRAnslation & Documentation Software) и в 1992 г. компания выпустила программу Translator's Workbench для операционной системы DOS. Программа включала память переводов, текстовый редактор, модуль управления терминологией MultiTerm.

В 1992 г. в английском городе Мейденхед была основана компания SDL International -поставщик лингвистических услуг. Компания быстро развивалась, приобретала более мелкие компании и стала одним из лидеров рынка. В 1998 г. SDL выпустила собственную TM-программу SDLX. В 2005 г. компания SDL приобрела компанию TRADOS.

В 1993 г. в Мадриде была основана компания ATRIL, которая выпустила Deja Vu -первую TM-программу для операционной системы Windows 3.1. Программа встраивалась в Microsoft Word for Windows 2.0. В 1996-1997 гг. Deja Vu была переработана в программу с отдельным интерфейсом.

В нашей стране достаточно мало разработок, относящихся к TM-программам. TM-программа MT2007 [7] разрабатывается примерно с 2007 г. силами одного разработчика, доступна в качестве отдельного приложения. Разработка программы приостанавливалась на некоторое время; возможно, программа будет доступна под названием CATnip. Компания ABBYY предлагает ABBYY Aligner [8] - инструмент для создания памяти перевода из параллельных текстов. Российская компания PROMT [9] предлагает объединение технологий машинного перевода (MT) и памяти переводов (TM).

В настоящее время доступно множество различных TM-программ. Самыми популярными являются Across, Deja Vu, MemoQ, OmegaT, SDL Trados Studio, STAR Transit, Wordfast.

Обычно на сайте компании - разработчика программы доступны как платные, так и бесплатные обучающие материалы. Для программ Deja Vu и SDL Trados доступны бесплатные обучающие материалы на русском языке от официальных дистрибьюторов программ в России и странах СНГ - бюро переводов «Окей» [10] и компании Т-Сервис [11].

На современном этапе память переводов представляет собой базу данных, в которой хранятся текстовые сегменты на исходном языке и языке перевода. Сегмент оригинала и сопоставленный ему сегмент перевода представляют собой единицу перевода (Translation Unit, TU). В роли сегмента обычно выступают предложения текста.

TM-программы можно различать по нескольким критериям.

1) По технической реализации можно выделить локальные TM-программы и доступные в режиме онлайн. При использовании

онлайн-версий (например, Google Translator Toolkit [12] и Wordfast Anywhere [13]) работа происходит в окне интернет-браузера. На рис. 1 показан пример работы с Wordfast Anywhere. При этом результаты работы (память переводов, глоссарии) в Google Translator Toolkit можно сделать доступными для других пользователей.

Локальные программы могут представлять собой отдельные приложения или встраиваемые приложения.

ются в текстовый редактор (например, Microsoft Word). Перевод происходит непосредственно в текстовом редакторе. Преимущество такого подхода в том, что пользователь работает с привычным интерфейсом редактора, ему доступны расширенные возможности редактирования текста. Недостаток заключается в ограниченности поддержки форматов файлов - обычно доступны лишь форматы текстового редактора.

При работе с отдельными приложениями весь процесс перевода происходит в среде приложения. При этом могут быть доступны дополнительные форматы. Недостатком может быть необходимость привыкать к интерфейсу программы.

2) По дополнительным функциональным возможностям. Часто в TM-программы встраиваются программы по управлению терминологией - они позволяют предоставлять общий доступ к терминологическим базам данных, хранить и обрабатывать терминологию. Это позволяет обеспечить единство терминологии в переводе, обеспечить соблюдение языковой

политики в рамках отдельного предприятия или предметной области.

Для построения памяти переводов необходимо уметь сопоставлять сегменты исходного текста и перевода, чтобы далее занести эти пары в базу данных программы. Поэтому зачастую ТМ-программы снабжены функцией выравнивания сегментов текстов (чаще предложений).

Кроме того, непосредственно в процессе перевода для разрешения неоднозначности

просмотреть употребление того или иного слова в контексте. ТМ-программы, как правило, предоставляют возможность построить конкорданс слова - найти список всех употреблений слова в контексте, одновременно предъявляя способы перевода лексической единицы в каждом случае. Фактически, эта функция представляет собой доступ к многоязычному корпусу текстов, и поиск лексических единиц осуществляется через интерфейсы, подобные тем, которые применяются при работе с корпусами текстов. Некоторые параллельные корпусы для отдельных пар языков с интерфейсом для составления конкорданса доступны в режиме онлайн (такие как Тгап88еагсЬ, WeBiText, Тга^оИ, 8упсЬгоТегш и другие). Так как поиск по информационному ресурсу уже достаточно мощный источник лингвистической информации для переводчика, параллельные корпусы текстов с инструментом поиска по нему иногда выделяют в отдельный тип памяти переводов [14] и противопоставляется собственно программам памяти переводов, где поиск повторяющихся

» File Edit Display Tools ? & | ^ | о = | <^? | □ <?=> | ^ ■=£>] О @ , Q. Ei | lSi ♦«*

100% (TM ENsRU) Private TU

[check the laundry care label for the required ironing temperature:

[Проверьте, какая рекомендуемая температура глажения указана на ярлыке текстильного изделия (памятке по уходу)

{р>

Check the laundry care label for the required ironing temperature:

<}100{>_______________________________________________________________________________________________________________

Проверьте, какая рекомендуемая температура нШёйИв указана на ярлыке текстильного изделия (памятке по уходу)

Рис. 1. Работа с Wordfast Anywhere

Встраиваемые приложения устанавлива- лексических единиц может потребоваться

сегментов производится автоматически для некоторого текста.

3) По общим критериям для программного обеспечения: существуют бесплатные и условно-платные программы, поддержка различных операционных систем (например, STAR Transit это условно-бесплатная программа и поддерживает только работу в ОС Windows, OmegaT - бесплатная программа с открытым исходным кодом, поддерживает работу в ОС Windows, Linux, Mac OS).

Использование TM-программ позволяет значительно увеличить производительность труда переводчика [15], упрощается работа по соблюдению единообразия терминологии в тексте. Память переводов эффективна при переводе: текстов со значительным количеством повторов (по статистике в конкретных предметных областях доля таких текстов по отношению ко всем материалам для перевода может достигать 70 % [16]), разных версий одного и того же документа, и активно применяется при локализации программного обеспечения [17]. Накопитель переводов малоэффективен при переводе текстов с малым количеством повторов, также требуются затраты как временные, так и финансовые на обучение пользователей.

Процесс перевода текстов

с использованием TM

Реальный процесс перевода с использованием памяти переводов включает несколько этапов.

1. Подготовка: на этой стадии следует решить вопрос о создании новой памяти переводов или осуществить выбор той памяти переводов, которую необходимо использовать для перевода данного текста, произвести необходимые настройки (например, произвести фокусировку на способах перевода термина, соответствующих ранее созданным проектам для того же заказчика) и корректировки (например, замена определенного термина во всех единицах перевода в соответствии с некоторым проектом) выбранной памяти переводов.

Важным аспектом перевода и использования памяти переводов является экономический аспект. Как правило, TM-программы включают инструменты для подсчета статистики, позволяющие определить количество точных и нечетких совпадений в оригинальном тексте и сегментах, хранящихся в базе данных, а также количество отсутствующих в базе данных, но повторяющихся в исходном

тексте сегментов. Эти данные необходимы, чтобы оценить трудоемкость перевода, рассчитать затраты временных ресурсов на перевод, определить необходимое количество переводчиков для выполнения работ. В отличие от традиционного перевода, где имеет значение количество знаков (так как каждый элемент текста должен переводиться отдельно), использование памяти переводов позволяет сократить затрачиваемые ресурсы, оптимизировать работу переводчика и сократить финансовые затраты на перевод. Подобная калькуляция также является частью подготовительного этапа перевода текста с применением памяти переводов.

2. Собственно перевод: предварительный перевод (pre-translation) представляет собой автоматическую замену найденных в базе данных точных соответствий сегментам исходного текста на их эквиваленты в языке перевода. При этом нечеткие совпадения обычно не включаются, так как затраты на пост-редактирование при таком подходе могут оказаться выше выгоды от использования базы примеров перевода. Сегменты текста, которые не были найдены в базе, переводятся вручную или - при наличии - с помощью системы машинного перевода.

Для перевода в узких предметных областях важным компонентом перевода является использование терминологических баз. Даже если при посегментном сравнении исходного текста и базы данных не найдено никаких соответствий, автоматическая замена терминов обеспечивает соблюдение языковой политики предприятия, единство терминологии и предоставляет релевантные в данной сфере эквиваленты терминов человеку-переводчику.

В связи с этим, ключевым аспектом применения TM-программ является создание глоссария, ориентированного на данного заказчика или предметную область, который может содержать в своей основе имеющиеся глоссарии или создаваться вновь. При этом создание базы терминов вручную - весьма трудоемкая задача. Поэтому при создании глоссариев прибегают к инструментарию для автоматического или полуавтоматического извлечения терминов из корпусов текстов, основанному на идентификации лексических единиц с применением лингвистического, статистического или - чаще - гибридного подходов [18-21]. В коммерческих TM-программах, как правило, имеются встроенные системы извлечения терминологии и состав-

ления глоссария терминов (SDL MultiTerm Extract, SDL MultiTerm, PROMT TerM, Mono-Conc Pro, Simple Concordance Program и др.).

«Сырой» текст, включающий автоматически замененные термины и сегменты текста на их переводные аналоги, на конечной стадии подвергается пост-редактированию.

3. Проверка качества: включает формальную проверку выполненного перевода на полноту, грамматическую правильность, корректный перевод релевантной терминологии, которая может осуществляться самим переводчиком, (возможно) заказчиком, а также на промежуточном звене, обеспечивающем связь между переводчиком и заказчиком. При этом большое значение имеет процесс фиксации выполненных правок в памяти переводов, иначе ошибки могут повторяться при последующих переводах.

Таким образом, при работе c TM-программой выделяются содержательный (включающий использования ряда функций по автоматизации переводческой деятельности), формальный и экономический аспекты перевода. Обозначенные аспекты являются важной составляющей использования памяти перевода в профессиональной деятельности переводчиков. В связи с этим каждый из указанных аспектов должен найти отражение при практическом обучении будущих переводчиков применению TM-программ в переводческой деятельности. При этом представляется необходимым «провести» будущего переводчика последовательно через все стадии реального процесса перевода в моделированных условиях, что ставит задачу разработки содержательно преемственных заданий при обучении применению TM-программ.

Обучение применению TM-программ

При обучении студентов в вузе мы считаем целесообразным использовать онлайн-версии TM-программ, так как такой подход обладает рядом преимуществ:

• Онлайн TM бесплатны, что упрощает их ввод в образовательный процесс.

• Онлайн TM можно использовать на различных устройствах (десктопы, ноутбуки, планшеты) и операционных системах (Windows, Linux, Mac OS).

• Онлайн TM можно использовать везде, где есть доступ в интернет, нет необходимости заранее устанавливать программу на определенное количество компьютеров. Такой подход позволяет значительно расширить количество обучаемых студентов. Например,

занятия можно проводить у студентов профильных специальностей (лингвистов, переводчиков), у студентов непрофильных специальностей (курсы дополнительного образования).

Работая с TM-программой, переводчик должен знать, как использовать и пополнять базу данных программы. Необходимо помнить, что любой инструмент работает лучше, если им правильно пользоваться.

Типы заданий, выполняемых студентами на занятиях, разнообразны и отражают специфику реальной работы переводчика. Перечислим некоторые задания.

Задание на составление корпуса текстов. Студентам задаются параметры текстов, которые необходимо включить в корпус (название предметной области, жанр, стиль текстов, даты создания и т. п.), и предлагается создать учебный корпус из нескольких текстов. Такое задание обусловлено мнением ряда авторов [22, 23] о том, что TM могут использоваться совместно с другими средствами обучения (например, корпусами текстов), что еще больше повышает эффективность проводимых занятий. При этом некоторые способы использования корпуса текстов при обучении иностранному языку [24] могут повторно использоваться при подготовке переводчиков.

В «мягком» варианте в качестве источника текстов предлагается некий общий корпус текстов, доступный онлайн (например, Национальный корпус русского языка, British National Corpus, Michigan Corpus of Academic Spoken English и т. д.). Во многих онлайн-корпусах имеется метаразметка текстов, которая классифицирует тексты по ряду параметров. В связи с этим отбор текстов из такого корпуса задача достаточно простая, затруднение может вызывать лишь процесс использования инструментария поиска по корпусу текстов. Поэтому использование поисковых механизмов корпусов текстов, доступных онлайн, должно быть неотъемлемой частью обучения профессионального переводчика.

«Жесткий» вариант направлен на решение более сложной задачи - самостоятельный поиск текстов по параметрам в сети интернет. Это, в свою очередь, ставит задачу использования возможностей поисковых машин интернета, и, следовательно, информационный поиск и инструменты поиска - также необходимы переводчику в профессиональной деятельности.

Созданные при выполнении этого задания

корпусы текстов могут использоваться для выполнения последующих заданий при обучении переводчиков.

Задание на составление глоссария текста. Студенты получают текст определенной предметной области и составляют по нему глоссарий терминов с переводом, чтобы применять этот глоссарий для контроля единообразия терминологии в выполняемом им переводе. Как упоминалось ранее, для отбора терминологии, как правило, используются средства автоматического извлечения лексических единиц из текстов, которые могут быть встроены в коммерческие ТМ-програм-мы, однако зачастую отсутствуют в онлайн-системах. Мы в процессе обучения предлагаем использовать инструмент извлечения именных групп [21], который может использоваться как для обучения иностранным языкам [25], так и являться неотъемлемым компонентом подготовки переводчиков. Ознакомление со способами использования средства автоматического извлечения терминологии из текстов представляет собой необходимую составляющую процесса обучения использованию программ памяти переводов в профессиональной деятельности.

Расширением такого задания может служить задание представить полученный глоссарий терминов структурированно, в форме лексической онтологии [26]. Наряду с памятью переводов терминологические онтологии разрабатываются как важный инструмент для соблюдения языковой политики предприятия [27]. Кроме того, существуют исследования по применению, сопоставлению терминологических онтологий различных языков для создания ресурса [28], применимого как в технологии памяти переводов, так и при автоматическом переводе текстов.

Задание на выравнивание текста и его

перевода. Студенты получают текст и его перевод и выполняют выравнивание текста, чтобы получить заполненную память перевода. Вариантом этого задания является использование автоматизированной интерактивной процедуры выравнивания терминов [29].

Задание на предварительный анализ эффективности использования ТМ. Студенту дается два текста и сообщается, что первый текст используется для создания памяти переводов, второй текст будет переводиться с применением памяти переводов. Студенту предлагается проанализировать, насколько эффективно применение памяти переводов для данной пары текстов. Примеры таких текстов представлены на рис. 2. Для сохранения преемственности заданий текст для создания ТМ может представлять собой подкорпус корпуса текстов, используемого для создания глоссария терминов.

Данное задание сводится к выявлению повторяющихся блоков в обоих текстах и вычислению доли таких блоков в тексте, используемому для перевода. Для решения этой задачи в расширенной версии задания возможно использование вспомогательных средств автоматизации (составление частотных списков, использование программ извлечения терминологии из текстов, средства для сравнительного анализа используемых лексических единиц и т. п.).

Задание на перевод текста с помощью ТМ. Студенты получают текст и самостоятельно его переводят с помощью ТМ. Текст дается из предметной области, используемой ранее для формирования глоссария и памяти переводов, что дает возможность использовать результаты, полученные при выполнении предыдущих заданий. Первоначально предлагается выполнить перевод текста, выданного при выполнении предыдущего задания. Далее

Текст для создания ТМ Текст для перевода с использованием ТМ

Изучается начально-краевая задача для уравнения Буссинеска-Лява, определенного на графе. Проводится редукция к абстрактной задаче Коши для уравнения соболевского типа второго порядка. Получена теорема о фазовом пространстве исходного уравнения. В работе рассматривается оптимальное управление решениями начально-конечной задачи для линейного уравнения соболевского типа с (Ь,р)-секториаль-ным оператором Рассматривается начально-конечная задача для уравнения Буссинеска-Лява, моделирующего продольные колебания балки. Проводится редукция к абстрактной начально-конечной задаче для уравнения соболевского типа второго порядка. Получены теоремы об однозначной разрешимости исходной и абстрактной задач

Рис. 2. Пример текстов для анализа эффективности использования ТМ

возможен вариант самостоятельного поиска текста из той же предметной области и попытка его перевести, используя ту же память переводов.

Задание на сравнение переводов, выполненных с использованием ТМ. Задание аналогично предыдущему. Однако студенты получают несколько текстов из различных предметных областей. Задание может выполняться в нескольких вариантах.

Вариант 1: студентам предлагается воспользоваться созданной ранее памятью переводов и «опробовать» перевод текстов различной тематики с ее помощью.

Вариант 2: студентам предлагается составить самостоятельно корпусы текстов для предметных областей, которым посвящены выданные тексты для перевода, использовать их для создания памяти переводов. И далее переводить каждый текст, используя релевантную для него память переводов.

В итоге студентам предлагается сравнить полученные переводы текстов на предмет полезности памяти переводов для перевода каждого из них. В первом варианте, очевидно, использование памяти переводов для перевода текста из той же предметной области, для которой составлялась ТМ, будет более эффективным, чем при переводе текстов из других предметных областей. Во втором случае возможны варианты. В зависимости от близости текстов, используемых в качестве корпуса, тексту для перевода эффективность созданной ТМ может варьироваться. В каждом из вариантов студентам предлагается объяснить, с чем связана разница в эффективности применения ТМ.

Методика оценки

результатов обучения

Для проверки результатов обучения применению ТМ-программ мы разработали следующую методику, основанную на принципе накопления ошибки - оцениваются неверно выполненные задания по ряду критериев. Для итогового контроля при обучении в качестве критериев используются:

• умение работать с программным обеспечением;

• качество выполняемого перевода.

Проводить оценку по первому критерию

целесообразно с теоретической и практической стороны. Теоретическая сторона оценки осуществляется в форме мини-теста множественного выбора, который включает общие вопросы по технологии ТМ и конкретные во-

просы по изучаемым компьютерным программам. Неправильный ответ оценивается в один балл.

Практическая сторона состоит в оценке умения использовать функции изучаемой ТМ-программы при самостоятельном выполнении заданий различных типов, описанных ранее в данной статье. Результат оценивается по бинарной шкале (задание выполнено / не выполнено). В случае невыполнения задания -в накопительную оценку студента добавляется 2 балла.

Пороговым коэффициентом ошибки, при котором контрольное задание признается выполненным, является 40 % от максимально возможного количества баллов, начисленных за ошибки (что эквивалентно 60 % корректности результатов). Так, если проверка включает 4 вопроса теста и оценку выполнения 2 практических заданий, приемлемый коэффициент ошибки составляет 3 балла.

Для оценки по второму критерию существует множество подходов, такие как субъективный подход, сравнение с оригиналом по определенным параметрам и другие.

Мы предлагаем использовать подход на основе взвешивания ошибок [32], который применяется в различных переводческих компаниях как зарубежных, например Lionbridge, так и российских, например Logrus, Ра1ех. В основе этого подхода лежит классификация ошибок в зависимости от того, насколько каждая ошибка препятствует успешной коммуникации. Переводческим ошибкам присваиваются «веса» - числовые меры, характеризующие степень влияния ошибки на процесс восприятия текста сообщения. Более серьезные ошибки, искажающие смысл сообщения, оцениваются более высоко. На рис. 3 приведен классификатор ошибок для использования в обучении.

При проверке перевода подсчитывается количество ошибок каждого типа и рассчитывается индекс качества перевода TQI по следующей формуле:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

TQI = (Е16 + Б2-2 + Е3 1) / W•1000, где Е1 - количество грубых ошибок, Е2 - количество средних ошибок, Е3 - количество незначительных ошибок, W - объем оригинального текста в словоупотреблениях.

Приемлемость перевода определяется пороговым значением коэффициента TQI, который может задаваться в зависимости от степени допустимости различных типов ошибок в переводе. Для учебных целей эмпирическим

Е1 (грубая ошибка) Е2 (средняя ошибка) E3 (незначительная ошибка)

Искажение смысла оригинала; неоправданный пропуск текста для перевода Неверный перевод термина; несогласованность терминологии в переводе; несоответствие глоссарию; несоответствие нормам языка цели Опечатки (например, отсутствие пробела)

Рис. 3. Классификатор ошибок

Рис. 4. Пример автоматизации при оценке качества перевода

путем мы установили допустимый коэффициент качества при итоговом контроле - менее 24 баллов, что эквивалентно 1 грубой ошибке или 3 средним ошибкам или 6 незначительным ошибкам на 250 словоупотреблений. Этот коэффициент может также использоваться для промежуточного контроля. Очевидно, что пороговое значение коэффициента можно ужесточать (уменьшать) с целью закрепления у студентов привычки стремиться к максимальной адекватности перевода или ослаблять (увеличивать) при оценке работы студентов на начальной стадии наработки навыков перевода с использованием ТМ.

Итоговый балл равен сумме баллов за умение работать с программным обеспечением и качество выполненного перевода. Чем меньше полученное число, тем результаты обучения успешнее. Мы рекомендуем составлять контрольно-измерительные материалы для итогового контроля таким образом, чтобы суммарный балл не менее чем на 80 % формировался на основе оценки критерия качества перевода. Так, при оценке умения работать с программным обеспечением с помощью 4 теоретических вопросов по использованию ТМ и 2 практических заданий по шкале «выполнил/не выполнил» и оценке качества одного текста перевода с помощью коэффициента TQI, допустимые коэффициенты ошибки распределяются в соотношении друг к другу 11 % (3 балла) и 89 % (24 балла).

Предложенная методика оценки результатов обучения имеет ряд преимуществ.

• Работа каждого студента оценивается индивидуально. Студент может видеть типы своих ошибок и работать над их исправлением. Более того, оценку качества перевода можно использовать отдельно на занятиях по письменному переводу, предварительно настроив классификатор ошибок на предметную область или типы текстов.

• Легко автоматизировать подсчет баллов по указанной методике. На рис. 4 приведен пример такой автоматизации при оценке качества перевода. Преподаватель заполняет электронную таблицу, указывая количество ошибок каждого типа. Общая оценка выводится автоматически.

• Как уже отмечалось ранее, в крупных переводческих компаниях применяют схожие методики оценки работы переводчика. Таким образом, при использовании данной методики моделируются реальные условия труда переводчика, что позволять подготовить студентов к реальным требованиям рынка.

Заключение

В заключение отметим, что использование TM-программ, как и применение любых информационных технологий, может сталкиваться с трудностями, вызванными проблемой неприятия нового. Особенно остро такая проблема стоит в условиях ментальности современного российского общества [30]. Вместе с тем, преодоление этого тормозящего фактора обусловлено веянием времени. По результатам исследования агентства переводов EnRus [31], одно из основных требований к перевод-

чику - наличие и умение пользоваться TM-программами. В связи с этим интеграция в учебный процесс методов и способов управления знаниями в программах памяти перевода на настоящий момент является вопросом конкурентоспособности будущего переводчика на рынке труда. Использование технологии памяти переводов в обучении, таким образом, является эффективным средством для выработки практических навыков у студентов и подготовки их к требованиям рынка.

Литература

1. Zhang, Y. Computer-aided translation teaching by means of modern information technology / Y. Zhang // 7th International Conference on Computer Science & Education (ICCSE). -Mudanjiang, 2012. - P. 1628-1632.

2. Поршнева, Е.Р. Подготовка профессиональных переводчиков в свете нового государственного стандарта / Е.Р. Поршнева, И.Ю. Зиновьева // Высшее образование в России. - 2011. - № 3. - С. 63-69.

3. Canovas, M. Open source software in translator training / M. Canovas, R. Samson // Tradumatica: traduccio i tecnologies de la in-formacio i la comunicacio. - 2011. - № 9. -P. 46-56.

4. Language and Machines - Computers in Translation and Linguistics : A LPA C report / National Academy of Sciences, National Research Council; John R. Pierce [et al.]. - Washington, DC, 1966. - 138 p.

5. Arthern, P.J. Machine Translation and Computerized Terminology Systems: A Translator’s Viewpoint / P.J. Arthern // Translating and the Computer, Proceedings of a Seminar / ed.

B.M. Snell. - London; Amsterdam, 1978. -P. 77-108.

6. The Proper Place of Men and Machines in Language Translation: Research report CSL-80-11 / Xerox Palo Alto Research Center; Martin Kay. - Palo Alto, CA, 1980. - 21 p.

7. MT2007. - http://mt2007-cat.ru/.

8. ABBYY Aligner. - http://www.abbyy.ru/ aligner/.

9. Сайт компании PROMT. - http://www. promt.ru/.

10. Российский сайт Deja Vu X2. - http:// www.tmemory.ru/.

11. Сайт компании T-Сервис. - http:// www.tra-service.ru/.

12. Google Translator Toolkit. - http:// translate.google.com/toolkit.

13. Wordfast Anywhere. - http://www. freetm. com/.

14. Macklovitch, E. Two Types of Translation Memory / Elliott Macklovitch // Proceedings of the Twenty-Second International Conference Translating and the Computer 22 (16-17 November 2000). - London: Aslib, 2000. - 15 p.

15. Ильнер, А. О. Подготовка переводчиков в России и за рубежом: сравнительный анализ / А. О. Ильнер // Образование и наука. -2010. - № 8. - С. 65-70.

16. Li, Q. Application of CAT in Translation Teaching / Qingjun Li, Likun Zhang // 2010 Second International Workshop on Education Technology and Computer Science (ETCS). -Wuhan, 2010. - Vol. 2. - P. 559-562.

17. Зеевальд-Хег, Ю. Локализация программного обеспечения, информационнотехнологические требования к переводчику в эпоху глобализации /Ю. Зеевальд-Хег // Вестник Перм. нац. исследоват. политехн. ун-та. Социально-экономические науки. - 2012. -№ 16. - С. 85-96.

18. Frantzi, K. Automatic Recognition of Multi-Word Terms: the C-value/NC-value Method / K. Frantzi, S. Ananiadou, H. Mima // International Journal on Digital Libraries. - 2000. -№ 3. - P. 115-130.

19. Combining Linguistics with Statistics for Multiword Term Extraction: A Fruitful Association? / Gael Dias, Sylvie Guillore, Jean-Claude Bassano, Jose Gabriel Pereira Lopes // Proceedings of the 6th International Conference Computer-Assisted Information Retrieval (Recherche d'Informations Assistee par Ordinateur) (RIA0'2000) / ed. Joseph-Jean Mariani, Donna Harman. - France: College de France, 2000. -P. 1473-1491.

20. Chen, J. A Multi-word Term Extraction System / Jisong Chen, Chung-Hsing Yeh, Rowena Chau // Proceedings of 9th Pacific Rim International Conference on Artificial Intelligence 2006: Trends in Artificial Intelligence / ed. Q. Yang,

G. Webb. - Guilin, 2006. - Lecture Notes in Computer Science/ - Vol. 4099. - P. 1160-1165.

21. Sheremetyeva, S. On extracting multiword NP terminology for MT / S. Sheremetyeva // EAMT-2009: Proceedings of the 13th Annual Conference of the European Association for Machine Translation / ed. Lluis Marquez and Harold Somers (14-15 May 2009). - Barcelona, Spain: Universitat Politecnica de Catalunya, 2009. - P. 205-212.

22. Ruiz Yepes, G. Parallel corpora in

translator education / G. Ruiz Yepes // Redit. Revista Electronica de Didactica de la Traduccion y la Interpretacion. - 2011. - № 7. - P. 65-80.

23. Zheng, W. Design of a CAI System for Translation Teaching / Wang Zheng // Proceedings of International Conference CESM 2011, Part II / еd. S. Lin and X. Huang. - Wuhan, 2011. -P. 457-462.

24. Бабина, О.И. Использование корпуса текстов для обучения иностранному языку / О.И. Бабина // Современная высшая школа: Инновационный аспект. - Челябинск: Изд-во ЧГИ, 2008. - № 1. - С. 21-24.

25. Шереметьева, С.О. Об использовании программ обработки текста для обучения иностранным языкам / С. О. Шереметьева // Вестник ЮУрГУ. Сер. «Лингвистика». -2012. - Вып. 15. - № 25 (284). - С. 56-59.

26. Хомутова, Т.Н. Научный текст: лингвокогнитивный подход / Т.Н. Хомутова, О.И. Бабина // Вестник ЮУрГУ. Сер. «Лингвистика». - 2009. - Вып. 9. - № 25 (158). -

С. 61-73.

27. Madsen, B.N. Principles of a system for terminological concept modeling / B.N. Madsen,

H.E. Thomsen, C. Vikner // Proceedings of the 4th International Conference on Language Resources and Evaluation (Lisbon, Portugal). -Lisbon: ELRA, 2004. - P. 15-19.

28. Gluckstad, F.K. Terminological Ontology and Cognitive Processes in Translation / F.K. Gluckstad // Procedings of the 24th Pacific Asia Conference on Language, Information and Computation / ed. by Ryo Otoguro, Kiyoshi Ishi-kawa, Hiroshi Umemoto, Key Yoshimoto, Yasu-nari Harada (Sendai, Japan, 4-7 November 2010). - Sendai: Tohoku University, 2010. -P. 629-636.

29. Дюмин, Н.Ю. Автоматическое выравнивание слов как способ построение двуязычных лексиконов / Н.Ю. Дюмин // Лингвистика в контексте культуры: материалы V междунар. науч.-практ. конф. (Челябинск, 28-30 ноября 2012 г.) /под общ. ред. Е.В. Харченко. - Челябинск: Издат. центр ЮУрГУ, 2012. - С. 92-94.

30. Петросян, А.Э. Умственная «слепота» (корни невосприимчивости к новым идеям) / А.Э. Петросян // Социология науки и технологий. - 2012. - Т. 3, № 3. - С. 24-42.

31. Шахова, Н. Как найти хорошего переводчика / Н. Шахова // Российский форум переводчиков, СПб., 23-25 сент. 2011 г. -http://www.enrus.ru/ru/publications/TFRussia_ru s.pdf.

32. Тишин, Д. Оценка качества переводов от TQI к компетенциям / Д. Тишин. -http://www.slideshare.net/justm/tqi.

Бабина Ольга Ивановна, кандидат филологических наук, доцент, доцент кафедры лингвистики и межкультурной коммуникации, Южно-Уральский государственный университет, [email protected].

Осминин Павел Григорьевич, аспирант кафедры лингвистики и межкультурной коммуникации, Южно-Уральский государственный университет, [email protected].

Bulletin of the South Ural State University Series “Education. Pedagogy” ________________________________________2013, vol. 5, no. 3, pp. 98-108

TRANSLATION MEMORY IN TRANSLATORS’ EDUCATION

O.l. Babina, P.G. Osminin

This paper deals with a topical issue of modern professional education consisting in teaching students to use special software in professional activity. The article presents a historical background of the development of Translation Memory (TM) software; most popular TM-software (including Russian achievements in this field) is exemplified and compared. The general process of utilizing TM-software in translators’ activity is described; typical spheres of translation memory usage are enumerated. The advantages of using the TM-software (increasing translators’ labour efficiency, alleviating terminology

unification in the text in target language) are shown. Some disadvantages of these computer programs (an ability to increase efficiency only within restricted domains in texts containing many repetitions, high price of the software, time for learning to use the software) are also mentioned. The use of translation memory software in education is grounded. Different types of tasks for students aimed at mastering their practical skills in using translation memory software are suggested. These tasks reflect a specific character of the translators’ work, which allows the alumni to gain competitive advantage at labor market. Procedure for evaluating training results is given. The results of the paper can be used for compiling academic guidelines for translators’ education.

Keywords: translation memory, professional education, translation, teaching translation, TM software.

Babina Olga, Candidate of Philology (PhD), Associate Professor, Associate Professor of the Chair of Linguistics and Intercultural Communication, South Ural State University (Chelyabinsk), babinaoi@ susu.ac.ru.

Osminin Pavel, postgraduate student of the Chair of Linguistics and Intercultural Communication, South Ural State University (Chelyabinsk), [email protected].

Поступила в редакцию 23 апреля 2013 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.