Научная статья на тему 'Параллельный корпус как справочная база данных в работе переводчика'

Параллельный корпус как справочная база данных в работе переводчика Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
681
317
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПАРАЛЛЕЛЬНЫЙ КОРПУС / ПЕРЕВОДЧИК / ТРУДНОСТИ ПЕРЕВОДА

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Волченкова К.Н.

В статье рассматривается использование возможностей параллельного корпуса в работе переводчика. Описываются трудности, с которыми сталкивается начинающий переводчик и способы их решении в процессе использования параллельного корпуса. Даются рекомендации преподавателям перевода по использованию параллельных корпусов в образовательном процессе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Параллельный корпус как справочная база данных в работе переводчика»

ПАРАЛЛЕЛЬНЫЙ КОРПУС КАК СПРАВОЧНАЯ БАЗА ДАННЫХ В РАБОТЕ ПЕРЕВОДЧИКА

© Волченкова К.Н.*

Южно-Уральский государственный университет, г. Челябинск

В статье рассматривается использование возможностей параллельного корпуса в работе переводчика. Описываются трудности, с которыми сталкивается начинающий переводчик и способы их решении в процессе использования параллельного корпуса. Даются рекомендации преподавателям перевода по использованию параллельных корпусов в образовательном процессе.

Ключевые слова параллельный корпус, переводчик, трудности перевода.

Параллельные двуязычные и многоязычные корпусы текстов в 21 веке активно интегрируются в глобальную сеть для разработки систем автоматического перевода, основанного на статистическом методе, являясь одним из направлений развития корпусной лингвистики - раздела языкознания, занимающегося созданием и использованием текстовых корпусов. Термин «корпусная лингвистика» появился в 60-х годах XX века. Причин для образования новой области лингвистики было несколько: появление первых компьютеров, а вместе с ними и возможности цифровой обработки текстов; необходимость анализа как грамматического, так и лексического состава языка для разработки систем машинного перевода, основанных на правилах; необходимость разработки компьютерных словарей.

В последнее время с развитием информационных технологий корпусная лингвистика начинает активно использоваться переводчиками в профессиональной деятельности. Если на начальном этапе развития данной науки основное внимание уделялось лингвистическим исследованиями в области грамматики, семантики языка, то в последнее время корпусы текстов, находящиеся в свободном доступе в Интернете, помогают решить переводчикам ряд переводческих трудностей, с которыми они сталкиваются в профессиональной деятельности. Использование корпусной лингвистики в переводо-ведении началось в 1993 году с работы Моны Бейкер «Corpus Linguistics and Translation Studies: Implications and Applications» [1].

Существует большое количество определений основного понятия данной науки. Под корпусом понимали и организованное определенным образом словесное единство, элементами которого являются тексты или специальным образом отобранные отрывки из текстов; и набор лингвистических данных из определенного языка в форме записанных высказываний или письменных текстов, доступный для анализа. Наиболее емким мы считаем

* Доцент кафедры Английского языка, кандидат педагогических наук.

определение корпуса, данное одним из основателей корпусной лингвистики Джоном Синклером. Он понимал под корпусом «... собрание отрывков текстов в электронной форме, отобранных в соответствии с внешними критериями, чтобы наиболее полно представлять язык или вариацию языка. Функционирует как источник данных для лингвистических исследований» [2].

Рыков В.В. приводит следующую классификацию корпусов текстов:

1. по степени организации и структурированности: электронный архив - это тексты на электронном носителе, но их форма не стандартизирована и не унифицирована; электронная библиотека - тексты представлены однородным и стандартизированным образом; корпус текстов - форма стандартизирована и унифицирована, тексты предназначены для отражения части лингвистической реальности; субкорпус - некоторая автономная часть корпуса.

2. по хронологическому признаку: синхронический; мониторный (текущее состояние языка); диахронический.

3. по индексации: простой; аннотированный.

4. по языку: одноязычный; двуязычный; многоязычный.

5. по способу применения и использования корпуса: исследовательский; иллюстративный; параллельный.

6. по способу существования корпуса: динамический; статический [3].

Корпусная лингвистика может оказать существенную помощь в подготовке будущих переводчиков. Существует целый ряд переводческих трудностей, с которыми начинающему переводчику справится довольно сложно. К ним относятся: проблема сочетаемости слов, проблема выбора стилистически верного синонима, проблема выбора артиклей. Так носители языка, редактирующие переводы научных статей, отмечают, что проблема использования артиклей при переводе с русского языка на английский является одной из самых трудных для переводчика и именно при использовании артиклей переводчик совершает наибольшее количество грамматических ошибок.

Поиск по корпусу может выдать:

- все употребления выбранного слова в непосредственном контексте, на основании чего переводчик может определиться с выбором синонима при переводе или с сочетаемостью слов;

- частотность употребления слова в определенной области знаний;

- слова, которые чаще всего стоят рядом с выбранным словом;

- интертекстуальность: значение слова как сумма его употреблений;

- развитие концептов во времени.

Многомиллионые корпусы переводных текстов могут помочь понять влияние внешних факторов на перевод. Translational English Corpus (TEC) Моны Бейкер состоит из письменных текстов, переведённых на английский с различных языков и насчитывает 10 миллионов словоупотреблений. Корпус аннотирован по экстралингвистическим характеристикам: пол переводчика, его национальность и профессия, исходный язык, кем издавался пе-

34

ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ РАЗВИТИЯ ОБРАЗОВАНИЯ В РОССИИ

ревод и так далее. По всем этим признакам в корпусе можно производить поиск. Это позволяет проводить довольно интересные исследования в рамках контекстуализации переводов. TEC свободно доступен в Интернете по адресу http ://www. monabaker.com/tsresources. htm.

Особый интерес для переводчиков также составляют битексты, корпусы на нескольких языках, где тексты являются переводами друг друга. Например, существует параллельный корпус текстов заседаний канадского парламента (английский / французский).

Многоязычные корпусы могут быть двух типов - выровненные (aligned) и не выровненные (not aligned). Синоним для выровненных корпусов - «параллельные». «Выровненность» означает, что в корпусе существует чёткая связь между единицами перевода, которые соответствуют друг другу: можно быстро найти, как то или иное слово или предложение переводилось на другой язык. Обычно такими единицами перевода служат предложения. Каждой фразе на одном языке соответствуют её эквиваленты на другом языке или языках.

Один из примеров выровненного многоязычного корпуса - база данных Acquis Communautaire Европейского Союза (http://langtech.jrc.it/DGT-TM.html). Это память переводов европейского законодательства на 22 языках, которая была выложена в открытый доступ в 2007 году. Всего в ней около миллиарда словоупотреблений, она выровнена по предложениям (sentence-aligned).

Параллельный корпус можно использовать для решения многих задач, связанных с переводоведением:

- выявление типичных переводческих приёмов и трансформаций;

- обучение статистических систем автоматического перевода (например, Google Translate);

- создание одноязычных и многоязычных словарей;

- автоматическая проверка правильности перевода;

- подбор возможных эквивалентов [5].

Задача корпусов в преподавании перевода - предоставить студентам-переводчикам инструментарий для проверки своих предположений о норме или узусе языка перевода. Как раз тут могут помочь большие корпусы того или иного языка. При помощи British National Corpus (http://www.natcorp. ox.ac.uk) можно быстро выяснить используется ли то или иное выражение в английском языке, какова частотность его употребления.

Корпусная лингвистика даёт точные количественные данные о том или ином языке - состав наиболее частотной лексики, вероятности употребления тех или иных грамматических конструкций и так далее. Всё это позволяет студентам-переводчикам более осмысленно подбирать терминологические и фразеологические эквиваленты, грамотно конструировать текст перевода.

Более того, используя современные программные средства, в частности программы конкордансеры, студенты сами могут выступить в роли создателей корпуса текстов. Путем подборки текстов из определенной из профессиональной области и поместив их в программу, они могут составить свою

базу данных, с помощью которой можно в дальнейшем разработать глоссарий ключевых терминов или проанализировать статистику словоупотребления в текстах определенной тематики.

Мы можем использовать в качестве корпуса весь интернет в целом. Ведь Интернет - это самый большой массив письменных текстов, когда-либо имевшийся в распоряжении человечества.

Параллельные двуязычные корпусы - ещё одно благодатное поле для студентов, которые могут использовать их для выполнения своих квалификационных работ. Корпус в данном случае понимается не как самостоятельная цель, а как инструмент для получения некоторых языковых данных. Таким образом, переводоведение получило в лице корпусной лингвистики прекрасный набор новых инструментов и методик, которые можно и нужно использовать для решения задач, связанных с изучением процесса перевода и подготовкой профессиональных переводчиков.

Список литературы:

1. Baker M. Corpus Linguistics and Translation Studies: Implications and Applications / M. Baker // Text and Technology: In Honour of John Sinclair. -Amsterdam & Philadelphia: John Benjamins, 1993. - pp. 233-250.

2. Sinclair J. Corpus, Concordance, Collocation / J. Sinclair. - Oxford: Oxford University Press, 1991.

3. Рыков В.В. Корпус текстов как новый тип словесного единства / В.В. Рыков // Труды Международного семинара. Диалог. - М.: Наука, 2003.

4. Tymoczko M. Computerized Corpora and the Future of Translation Studies // The Corpus-Based Approach, Ed. S. Laviosa, Special issue of Meta 43 - 4. -1998. - pp. 652-659.

5. Кутузов А.Б. Корпусные методики в переводовении и преподавании перевода / А.Б. Кутузов // Проблемы билингвизма в современном межкультурном дискурсе. Материалы межд. науч.-методич. коллоквиума. - Пермь: изд-во ПГТ., 2011. - С. 368-373.

ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНОЙ ГРАФИКИ В ОБРАЗОВАТЕЛЬНОЙ ДЕЯТЕЛЬНОСТИ СОВРЕМЕННОГО ПЕДАГОГА

© Коренной А.А.*, Шевчук М.В.*

Московский государственный областной университет, г. Москва

В статье разбираются вопросы использования различных графических систем для повышения уровня профессиональной компетентности

* Магистрант.

* Доцент.

i Надоели баннеры? Вы всегда можете отключить рекламу.