Моделирование трансформаций предикативных структур при французско-русском и русско-французском машинном переводе
Морозова Ю.И.
Институт проблем информатики РАН уи11а-1р1@уапйех. ги
Работа посвящена актуальным проблемам исследования трансформационных свойств языковых структур. В статье исследуются трансформации, происходящие при переводе предикативных структур с французского языка на русский язык. Основное внимание уделяется изменению категориальной принадлежности слов при переводе. Материалом исследования послужили патентные тексты на французском языке и их переводы на русский язык, выполненные специалистами-переводчиками.
Ключевые слова: машинный перевод, переводческие трансформации, многовариантная когнитивная трансферная грамматика
1. Теоретическое изучение переводческих трансформаций в отечественной лингвистике
Изучение явления переводческих трансформаций имеет длительную историю. Трансформациям, происходящим при переводе, посвящены многочисленные работы таких выдающихся ученых как Гак В. Г., Виноградов В. В., Комиссаров В. Н., Бархударов Л.С., Рецкер Я.И., Швейцер А. Д. и др.
Как отмечает Комиссаров В. Н., «наиболее разработанным методом изучения переводческого процесса является создание теоретических моделей перевода и описание различных типов преобразований (трансформаций), с помощью которых возможен переход от отрезка текста оригинала к отрезку текста перевода» [11].
Существуют различные определения понятия «переводческая трансформация», предложенные Бархударовым Л.С., Миньяр-Белоручевым Р. К., Рецкером Я.И., Швейцером А. Д., Щетинкиным В. Е., Латышевым Л. К., Комисаровым В. Н., Гаком В. Г. и другими лингвистами. Однако основополагающим принято считать определение Бархударова Л.С.: «Переводческие трансформации - многочисленные и качественно разнообразные межъязыковые преобразования, которые осуществляются для достижения переводческой эквивалентности вопреки расхождениям в формальных и семантических системах двух языков» [1]. По определению Гака В. Г. «переводческие трансформации - это отход от использования изоморфных средств, наличных в обоих языках».
В отечественной лингвистике проблема переводческих трансформаций изучалась, в основном, на примере перевода с английского языка на русский и в обратном направлении (см. теоретические работы [1], [2], [11], [12] и др.) Трансформации, происходящие при переводе с французского языка на русский и в обратном направлении были описаны во многочисленных практических пособиях по переводу (см. учебники [3-5], [7], [13] и др.)
Лингвистами, работающими в рамках теории перевода, были предложены различные классификации типов трансформаций, происходящих при переводе. Бархударов Л. С. выделяет четыре логических типа переводческих трансформаций: перестановки, замены, опущения и добавления [1]. При перестановке используется изменение порядка расположения компонентов сложного предложения, а также
изменение места слов и словосочетаний. Трансформации замены подразделяются на следующие типы:
- замена форм слова;
- замена части речи;
- замена членов предложения (выражается в перестройке синтаксической структуры);
- замена типов предложений;
- лексические замены (конкретизация, генерализация, антонимический перевод).
Трансформации одного типа очень редко встречаются изолированно, обычно
имеют место комплексные трансформации.
Как отмечает Комиссаров В.Н., «весьма распространенным видом грамматической замены при переводе является замена части речи» [11]. При этом в качестве наиболее типичных видов трансформаций при переводе с английского языка на русский автор выделяет трансформации «существительное -> глагол» и «прилагательное -> существительное».
Гак В. Г. изучал переводческие трансформации, происходящие при переводе с французского языка на русский и в обратном направлении. В статье [8] Гаком В. Г. было выделено 36 логических типов трансформаций частей речи при переводе с русского языка на французский язык. Была предложена матрица, столбцы и строки которой соответствуют частям речи (существительное, глагол, прилагательное, наречие и др.), а элементы матрицы соответствуют переводческим трансформациям. В статье [6] описаны наиболее типичные преобразования актантной структуры высказывания при переводе с французского языка на русский язык.
2. Изучение трансформаций для задач машинного перевода.
Особое значение изучение переводческих трансформаций приобретает в контексте задачи создания систем машинного перевода. Актуальность проблемы моделирования переводческих трансформаций для систем машинного перевода и извлечения знаний из текстов обусловлена тем, что эти явления мало исследованы с точки зрения возможностей их компьютерной реализации.
Изначально при создании систем МП использовался подход, заключавшийся в выборе переводческого эквивалента, наиболее близкого по форме к исходной языковой конструкции, так как «трансформации всегда приводят к появлению «шумов» и резкому увеличению вычислительных затрат и, соответственно, программистских усилий» [10]. Однако на современном этапе «отчетливо прослеживается тенденция к включению трансформаций» [10], так как во многих случаях лишь использование переводческой трансформации позволяет при переводе получить предложение, соответствующее грамматическим и стилистическим нормам языка перевода.
Результаты, полученные в рамках теоретического изучения переводческих трансформаций, не могут напрямую использоваться для моделирования процесса перевода с помощью компьютера по нескольким причинам:
- Условия, при которых происходит та или иная трансформация, описываются с использованием понятий семантического и коммуникативного уровней, которые на настоящий момент не могут быть смоделированы с помощью компьютера.
Например, в [7] описывается трансформация инверсии подлежащего при переводе на русский язык, которая происходит, если подлежащее обозначает новую информацию. Данное условие трудно воплотить в компьютерной реализации.
- В некоторых случаях предлагается несколько альтернативных вариантов перевода, и выбор предпочтительного варианта в каждом конкретном случае зависит от лексических свойств единиц, участвующих в трансформации. В случае отсутствия подробного лексико-семантического словаря одного из языков, участвующих в переводе, подобные трансформации также не могут быть реализованы с помощью компьютера.
- В рамках теоретического подхода к трансформациям описываются все наблюдаемые виды трансформаций, без учета их частотности и корреляции с жанром изучаемых текстов. На данный момент весь спектр трансформаций, происходящих при переводе с одного языка на другой, не может быть реализован с помощью компьютерной программы, поэтому для создания компьютерных реализаций необходимо выделить наиболее продуктивные и наиболее типичные для изучаемого текстового жанра трансформации.
Для моделирования переводческих трансформаций с целью создания систем машинного перевода и извлечения знаний из текстов Козеренко Е. Б. была предложена многовариантная когнитивная трансферная грамматика, которая является разновидностью унификационно-порождающей грамматики. Данная грамматика представляет собой многовариантные правила трансфера фразовых структур, при этом функциональные значения языковых единиц отражены в расширенной системе категориально-функциональных атрибутов. Структуры атрибутов и значений и правила их преобразования задаются в виде контекстно-свободных и мягко контекстно-зависимых продукционных правил. Отношения зависимости реализуются через механизм головных вершин фразовых структур, а сами фразовые структуры задают линейные последовательности языковых объектов. Многовариантные правила функционально-семантического переноса задают наиболее вероятные способы перевода рассматриваемых языковых структур.
Козеренко Е. Б. было выделено множество полей функционального переноса (ПФП), такие как ПФП первичной предикации, ПФП вторичной предикации, ПФП номинации и относительности, ПФП модальности и наклонения и пр. Были исследованы языковые конфигурации, используемые для передачи функциональных значений. «Переносимость фразовых структур обусловлена выбором языковых единиц исходного и целевого языка, принадлежащих к одним и тем же полям функционального переноса, не взирая на различия или сходство их традиционных категориальных значений» [9].
Например, инфинитивные конструкции в функции обстоятельства цели/следствия могут переводиться следующим образом: (20) Hydrogen and oxygen unite to form water. Водород и кислород соединяются, образуя воду. Водород и кислород соединяются и образуют воду. Водород и кислород соединяются с образованием воды.
Схема многовариантного англо-русского трансфера инфинитивной конструкции to form water выглядит следующим образом: [Category: VerbInf] {to form water } ® OR {[Category:ParticipleAdv]; {образуя воду} [Category: VerbFinit]; {образуют воду} [Category: VerbNounIng]} {с образованием воды} }
3. Переводческие трансформации предикативных структур (на примере русских и французских патентных текстов)
Целью нашей работы является моделирование трансформаций, характеризующихся изменением категориальной принадлежности слова при переводе с русского языка на французский, для задач машинного перевода и машинного обучения. Были рассмотрены взаимные трансформации слов следующих категорий: отглагольное существительное, личная форма глагола, инфинитив, причастие, деепричастие, герундий, прилагательное, краткое прилагательное.
Было проанализировано 500 пар предложений.
В результате анализа параллельных патентных текстов на русском и французском языках были выделены следующие типы трансформаций, происходящих при переводе (в порядке частотности):
♦♦♦ существительное (рус.) ® инфинитив (фр.)
♦♦♦ личный глагол (рус.) ® причастие (фр.)
♦♦♦ причастие (рус.) ® существительное (фр.)
♦♦♦ личный глагол (рус.) ® инфинитив (фр.)
♦♦♦ причастие в русском языке (рус.) ® прилагательное (фр.)
♦♦♦ личный глагол (рус.) ® существительное (фр.)
♦♦♦ существительное (рус.) ® причастие (фр.)
♦♦♦ причастие (рус.) ® личный глагол (фр.)
♦♦♦ личный глагол (рус.) ® прилагательное (фр.)
♦♦♦ деепричастие (рус.) ® инфинитив (фр.)
♦♦♦ инфинитив (рус.) ® существительное (фр).
♦♦♦ существительное (рус.) ® личный глагол (фр.)
♦♦♦ прилагательное (рус.) ® причастие (фр.)
♦♦♦ краткое прилагательное (рус.) ® личный глагол (фр.)
♦♦♦ деепричастие (рус.) ® причастие (фр.)
♦♦♦ деепричастие (рус.) ® герундий (фр.)
♦♦♦ прилагательное (рус.) ® личный глагол (фр.)
В процессе изучения переводческих трансформаций была создана база данных, которая содержит описание типа трансформации, сведения о частоте данной трансформации и конкретные пары предложений, в которых реализуется данная трансформация. Были изучены частотные характеристики трансформаций и выделены наиболее типичные из них. Самой характерной переводческой трансформацией для изучаемой пары языков является трансформация «отглагольное существительное в русском языке -> инфинитив во французском языке». Частотность данной трансформации зависит от контекста, в определенных контекстах она происходит с очень высокой частотой:
- обстоятельства цели (существительное с предлогами для, с целью) (в 70 % случаев)
Пример:
зазор для принятия клея -> une réserve pour recevoir la colle
N [nom, masc, sg] + Prep + N [gen, neutr, sg] + N[gen, masc, sg] — Art [indef, fem, sg] + N[fem, sg] + Prep + Inf + Art [def, fem, sg] + N [fem, sg]
- отрицание (существительное с предлогом без) (в б0 % случаев)
без возникновения люфта — sans induire un jeu
Prep + N[gen, neutr, sg] + N[gen, mas, sg] — Prep + Inf + Art[indef, masc, sg] + N[masc,sg]
- с глаголами «заключается в», «состоит в» (в 75 % случаев)
Изобретательский замысел заключается в выборе соединения. — La démarche inventive de la présente invention a consisté à faire le choix d'une liaison.
заключается в выборе — a consisté à faire le choix
V [ind, pres, act, 3 sg]+ Prep + N [prep, masc, sg] — V[have, ind, pres, act, 3 sg]+Part[past, masc,sg] + Prep + Inf + Art[def, masc, sg] + N[masc, sg]
В некоторых контекстах данная трансформация не является типичной, но является возможной:
- временная последовательность (существительное с предлогами после/перед ) (в 17% случаев)
перед использованием — avant d'être utilisée
Prep + N[ins, neutr, sg] — Perp + Prep + Inf[be] + Part[past, masc,sg]
4. Заключение
Моделирование трансформаций предикативных структур для задачи машинного перевода является актуальной задачей, так как это явление мало исследовано с точки зрения компьютерной реализации и недостаточно учтено в действующих системах МП.
В работе рассмотрены существующие классификации переводческих трансформаций и исследованы трансформации замены части речи (категории) на примере предикативных структур. Описана база данных трансформаций, созданная на основе изучения параллельных текстов научных патентов на русском и французском языках.
Дальнейшие исследования будут направлены на расширение числа типов трансформаций при русско-французском машинном переводе, изучением контекстов, в которых происходят данные трансформации и сбором статистической информации.
Литература
1. Бархударов Л.С. Язык и перевод (Вопросы общей и частной теории перевода). М., «Междунар. отношения», 1975.
2. Бреус Е. В. Теория и практика перевода с английского языка на русский. «УРАО», 200З
3. Гавриленко Н.Н. Теория и методика обучения переводу в сфере профессиональной коммуникации. - М.: НТО им. Вавилова, 2009.
4. Гак В.Г. Французский язык : учебник по переводу / В. Г. Гак ; Ин-т междунар. отношений, каф. романских яз. - М.: ИМО, 19б 1.
5. Гак В.Г., Львин Ю.И. Курс перевода: Французский язык. - М.: Междунар. отношения, 19S0.
6. Гак В. Г. Типология преобразований в актантной структуре высказывания при переводе. // Вопросы филологии, вып.1. М., 2002.
7. Гак В.Г., Григорьев Б.Б. Теория и практика перевода: Французский язык. - М.: Интердиалект, 1997.
8. Гак В. Г. Типология контекстуальных языковых преобразований при переводе. // Текст и перевод. М., 1988.
9. Козеренко Е.Б. Моделирование переноса функциональных значений для англо-русского машинного перевода// Труды Международной конференции Диалог'2004 "Компьютерная лингвистика и интеллектуальные технологии", М.: "Наука", 2004.
10. Козеренко Е. Б. Глагольно-именные трансформации при англо-русском машинном переводе. // Труды Международной конференции Диалог'2007 "Компьютерная лингвистика и интеллектуальные технологии", М.: "Наука", 2007.
11. Комиссаров В. Н. Современное переводоведение. Курс лекций. М., «ЭТС»,
1999.
12. Рецкер А. И. Теория перевода и переводческая практика // М., «Междунар. отношения», 1974.
13. Щетинкин В. Е. Пособие по переводу с французского языка на русский. М.,
1987.