Научная статья на тему 'Проблемы передачи пространственных отношений при машинном переводе. Выражение пространственных отношений в турецком языке'

Проблемы передачи пространственных отношений при машинном переводе. Выражение пространственных отношений в турецком языке Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY-NC-ND
454
168
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОЯЗЫЧНАЯ СИСТЕМА МАШИННОГО ПЕРЕВОДА / ПРИНЦИПЫ КЛАССИФИКАЦИИ / ГРАММАТИЧЕСКИЙ СТРОЙ / ПРОСТРАНСТВЕННЫЕ ОТНОШЕНИЯ / ПОСЛЕЛОГИ / ОРИЕНТИР / ПОСЕССИВНЫЕ ОТНОШЕНИЯ

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Мансурова Оксана Юрьевна

Проблемы передачи пространственных отношений в различных языках уже давно стали предметом изучения в лингвистике. Различные лингвистические школы предпринимали попытки описать и классифицировать их. Однако нерешенным пока остается целый комплекс проблем, связанный с компьютерной лингвистикой. В данной статье автор делает попытку разработать классификацию, которая была бы применима в алгоритме компьютерного перевода с английского языка на турецкий. В настоящее время этот алгоритм применяется в многоязычной системе компьютерного перевода «Кросслейтор». В статье прдставлены также способы выражения пространственных отношений в турецком языке (аффиксы) в сравнении с европейскими языками (предлоги или падежи).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Problems of Representation of Spatial Relations in a system of Computer Translation. Expressing Spatial Relations in Turkish

The problems of representation of spatial relations in different languages have already been under consideration for a long time. Linguists of different schools have tried to describe and classify them. But a number of problems remain unsolved, especially in the field of computer linguistics. In this article an attempt is undertaken to work out a classification which might be implemented in an algorithm for computer translation from English into Turkish. Currently such an algorithm is used in Crosslator, a multilingual system of computer translation. The article also presents the ways of expressing spatial relations in Turkish (through affixes) in comparison with European languages (through prepositions or/and cases).

Текст научной работы на тему «Проблемы передачи пространственных отношений при машинном переводе. Выражение пространственных отношений в турецком языке»

О.Ю. Мансурова

ПРОБЛЕМЫ ПЕРЕДАЧИ ПРОСТРАНСТВЕННЫХ ОТНОШЕНИЙ ПРИ МАШИННОМ ПЕРЕВОДЕ. ВЫРАЖЕНИЕ ПРОСТРАНСТВЕННЫХ ОТНОШЕНИЙ В ТУРЕЦКОМ ЯЗЫКЕ

Проблемы передачи пространственных отношений в различных языках уже давно стали предметом изучения в лингвистике. Различные лингвистические школы предпринимали попытки описать и классифицировать их. Однако нерешенным пока остается целый комплекс проблем, связанный с компьютерной лингвистикой. В данной статье автор делает попытку разработать классификацию, которая была бы применима в алгоритме компьютерного перевода с английского языка на турецкий. В настоящее время этот алгоритм применяется в многоязычной системе компьютерного перевода «Кросслейтор». В статье прдставлены также способы выражения пространственных отношений в турецком языке (аффиксы) в сравнении с европейскими языками (предлоги или падежи).

Ключевые слова: многоязычная система машинного перевода, принципы классификации, грамматический строй, пространственные отношения, послелоги, ориентир, посессивные отношения.

Настоящая статья является частью исследования1, посвященного выработке критериев классификации пространственных отношений в естественных языках, их представлению и передаче в многоязычной системе машинного перевода Кросслейтор2, а также разработке пространственных отношений языка - транслятора знаний между различными научными областями.

Пространственные отношения (далее ПрО) позволяют нам передать языковыми средствами информацию о взаиморасположении предметов в пространстве (их можно выразить тремя основными вопросами где? куда? откуда?, а также большим количеством более частных вопросов: из-за чего? на чем? под чем? из-под чего? перед чем? и др.).

В этой статье будут сформулированы принципы классификации ПрО, удобные для их использования в многоязычной системе

машинного перевода, а также на материале турецкого языка будут продемонстрированы способы выражения всех ПрО, выделенных в турецком языке.

1. ПАРАМЕТРЫ КЛАССИФИКАЦИИ ПрО

На тему ПрО написано большое количество работ, однако практически нет таких, где они были бы систематизированы и классифицированы с учетом особенностей их обработки в системах машинного перевода. Для многоязычных систем машинного перевода (далее МП), в которых осуществляется перевод с одного языка на несколько совершенно разных по своему грамматическому строю языков (особенно интересны в данном отношении восточные языки, в частности турецкий язык), нужно задать список ПрО. Этот список должен быть необходимым и достаточным для дифференциации пространственных значений в данных языках, т. е. включать в себя все релевантные для них оппозиции и только их.

Исследований, направленных преимущественно на разработку классификации пространственных отношений, т. е. на построение метаязыка для типологического анализа средств отображения пространства в естественных языках, очень мало. К ним можно отнести соответствующие разделы фундаментального «Курса общей морфологии» И.А. Мельчука3 и «Общей морфологии» В.А. Плунгяна4, а также работы последнего, посвященные категории глагольной ориен-тации5. Существует также несколько работ, в которых содержатся попытки построения классификаций языковых средств, выражающих ПрО в одном или нескольких языках (см. работы М.В. Всеволо-довой, И. Пете. Б. Комри и Н. Смита, а также А.Д. Великорецкого). Именно эти работы явились основной базой для создания списка ПрО в настоящем исследовании (см. раздел 1.2.).

1.1. Локальная ситуация и ее участники

Прежде чем приступать к описанию использованной в работе терминологии и выделению критериев описания ПрО, введем термин «локальная ситуация» и определим, что именно в данном исследовании будет иметься в виду под пространственными отношениями.

Пространственные отношения определяются разными исследователями по-разному. М.В. Всеволодова и О.Ю. Дементьева в

самом общем виде определяют ПрО как «соположение в пространстве какого-либо предмета, действия (события), признака и некоторого пространственного ориентира - локума»6. Иштван Пете пишет, что ПрО выражают локализацию предмета, действия или признака в определенном фрагменте действительности, т. е. в положении вещей7. В.Г. Гак определяет пространственное отношение в чистом виде формулой

S(O) + VI + г + и,

где S(O) - локализуемый объект, VI - глагол, в значение которого может входить пространственная сема (это, прежде всего, глаголы местопребывания и движения), г - конкретный тип локализации, выражаемый, например, предлогом, а и - локализатор, т. е. двухмерное или трехмерное пространство, в котором способен помещаться локализуемый объект8.

Рассмотрим теперь, что представляет собой локальная ситуация. Прежде всего нужно сказать, что локальная ситуация является тройственной - в сущности, мы имеем дело с тремя ситуациями:

1) местоположение: Книга лежит на столе. Папа - в гараже;

2) перемещение: Я положила книгу на стол. Товары были погружены на корабль.

3) движение: Мальчик идет в школу. Кошка вылезла из-под софы.

Центральной частью локальной ситуации является процесс.

Это ядро ситуации. В тексте оно обычно представлено глаголом или его формами: причастием, деепричастием или отглагольным существительным. (Мальчик идет в лес. Въезжающий в город экипаж был очень грязным. Проходя по улице, мы не заметили ничего интересного. Поездка в горы была очень занимательной.) Иногда действие может быть выражено в предложении неявно: Цветы в вазе были очень красивыми. Мое внимание привлекла огромная картина на стене. На синтаксическом уровне никакой глагольной формы в таких предложениях нет, но семантически действие всегда можно восстановить, используя предикативные слова «находившиеся», «висящая».

Далее необходимо различать двух основных участников ситуации перемещения: локализуемый объект (далее л-объект) - предмет, перемещение или местонахождение которого включает описываемая пространственная ситуация, и ориентир - предмет, относительно которого определяются пространственные координаты л-объекта или ситуации в целом (то место, где находится л-объект или куда/ откуда/ по которому и т. д. он перемещается: Книга - на столе. Мальчик идет в лес. Он вытащил книгу из-под стола). Так, например, в предло-

жении Книга упала на пол роль л-объекта играет участник, обозначенный именем книга, а роль ориентира играет участник, названный существительным пол. Ориентир при этом может указывать:

- на местонахождение л-объекта - место, в котором локализован объект или пространственная ситуация перемещения в целом (Книга лежит на столе; Мальчик гулял в парке/по парку);

- на исходный пункт движения/перемещения - точку, в которой объект находился до начала движения (Мальчик вышел из комнаты; Книга упала со стола);

- на конечный пункт движения/перемещения - точку, в которой объект оказался после окончания перемещения (Мальчик вошел в комнату; Книга упала на пол);

- на траекторию движения/перемещения - точки, которые последовательно занимал объект, перемещаясь от исходного пункта к конечному (Мальчик шел по лесу).

Наконец, необходимо определить тот конкретный участок пространства относительно ориентира, который непосредственно принимает участие в ситуации перемещения или местонахождения. Иными словами, ориентир рассматривается как предмет, который выбирается в качестве «начала координат» и позволяет определенным образом структурировать пространство. Относительно выбранного ориентира пространство членится на ряд топологических зон: поверхность ориентира, внутренняя область ориентира, окрестность (пространство около) ориентира, пространство перед ориентиром и т. д.

Семантически ПрО связывают л-объект и ориентир. На синтаксическом уровне ПрО устанавливаются между глаголом (или причастием, деепричастием, отглагольным существительным или обычным существительным - в дальнейшем будем условно обозначать V) и именной группой слова-ориентира: положить -— на стол, взгляд -— из-под ресниц, полет -— в космос.

Классический вариант локальной конструкции - это предикат, от которого, с одной стороны, зависит подлежащее, а с другой -предложно/послеложная группа:

идти-► мальчик

I-► в -► школа

или

класть -► мальчик

I-► книга

-► в -► ящик

Вместо глагола могут стоять причастие, деепричастие, отглагольное существительное или придаточное предложение:

мальчик мальчик

мальчик мальчик

мальчик мальчик

погрузка

на

идущий — кладущий

в -► школу

книгу

на

который который

летя -кладя

—► стол

идет -!

кладет

в -► школу

книгу

на -*

книгу

на — самолете

стол

на

стол

товаров

приезд

корабль —► Стамбул

в

При неявно выраженном действии именной группой слова-ориентира управляет существительное. Например: Цветы в вазе, стоящей на столе посреди комнаты, были просто изумительны (цветы —► в вазе).

1.2. Основы классификации ПрО.

Терминология

В данном исследовании я постаралась выделить те элементы существующих классификаций, которые позволили бы создать список ПрО, оптимальный для целей МП. Грамматика, построенная на базе такой классификации, должна, с одной стороны, охватывать все выделенные и описанные в литературе ПрО (хотя бы для некоторого набора языков), а с другой стороны, быть достаточно стройной и максимально обобщенной, чтобы ее легко было обрабатывать алгоритмически.

В работе используется в основном терминология И.А. Мельчука и В.А. Плунгяна: взаиморасположение предметов отображает параметр локализации, а характер ситуации (статичная или динамичная, если динамичная, то какой именно тип движения присутствует) - параметр ориентации. Метаязык описания ПрО должен быть максимально простым, логичным и хорошо запоминающимся, поэтому для обозначения категорий были выбраны предлоги русского языка как максимально мнемоничные для русскоязычных читателей.

Формально два ключевых параметра классификации можно определить следующим образом:

- параметр локализации указывает на область пространства относительно некоторого ориентира, в которой находится (в которую или из которой перемещается) участник ситуации;

- параметр ориентации характеризует взаимодействие между описываемым объектом и ориентиром в терминах приближения, удаления или покоя (отсутствия движения) объекта относительно ориентира.

Возьмем, например, словосочетание «положить книгу на стол»: локализация - «на чем-л.», а ориентация - перемещение «на стол». Еще пример: «пройти мимо здания» - локализация «перед или около» (здания), ориентация - «трасса».

Предлагаемый метаязык для описания семантики и инвентаризации средств выражения пространства представляет собой комбинацию параметров «локализация + ориентация», т. е. для описания пространственных отношений будем использовать следующее обозначение: ЛОК_'локализация', 'ориентация', при этом параметры «локализация» и «ориентация» принимают конкретные значения, например, ЛОК_около, старт, ЛОК_перед, трасса.

1.2.1. Параметр локализации, его значения

Пространство вокруг ориентира делится на ряд топологических зон. Обычно в качестве исходной точки для теоретических построений берется список логически возможных топологических зон ориентира: «в Х», «на Х», «под Х», «перед Х», «сзади Х», «на боковой стороне Х», «у/около Х», «вокруг Х», «между Х / среди Х» [Мельчук 1998: 53]. Языковое членение пространства, однако, далеко не всегда совпадает с логическим. Например, для обозначения одной и той же топологической зоны в языке может существовать более одного показателя, поэтому в данной работе различаются понятия топологической зоны ориентира и локализации. Первое из этих понятий применяется к логически мыслимым фрагментам пространства относительно ориентира, тогда как понятие локализации указывает

на членение пространства относительно ориентира по данным языка. Тем самым инвентарь возможных локализаций представляет собой максимально дробное разбиение пространства по данным представительной выборки языков. Другими словами, элементы «категории локализации указывают на определенную область пространства по отношению к некоторому ориентиру»9, т. е. эта категория описывает собственно местонахождение объекта или взаиморасположение объекта и ориентира.

В табл. 1 представлены все ПрО с незаполненным параметром ориентации, например: ЛОК_внутри может входить в состав таких ПрО, как ЛОК_внутри, стат., ЛОК_внутри, ненапр., ЛОК_внут-ри, старт, ЛОК_внутри, финиш, ЛОК_внутри, трасса.

В настоящей работе использовался принцип естественности метаязыка, выдвинутый А. Вежбицкой, для описания пространственных отношений было использовано подмножество слов естественного языка. В дальнейшем все параметры локализаций будут обозначаться русскими предлогами (внутренняя - ВНУТРИ, внешняя - ВНЕ и т. д.), исключением является общая локализация, которую можно было бы обозначить предлогом В, однако, чтобы подчеркнуть тот факт, что она является именно общей, в дальнейшем будем использоваться сокращение ОБЩ.

В первом столбце таблицы приведены типы локализации, во втором перечислены все значения параметра локализации, которые могут иметь ПрО, а в третьем приведены объяснения и примеры.

Таблица 1

Список локализаций

Параметр При статической Примеры

локализации ориентации

ЛОК_вдоль Л-объект располагается Лодка плыла вдоль

вдоль ориентира берега. Аллея идет

параллельно с берегом.

Мы шли параллельно

реке.

ЛОК_вне Л-объект располагается Он остался вне дома.

вне ориентира

ЛОК_внутри Л-объект располагается Он живет в лесу.

внутри замкнутого Человек вышел из дома.

пространства ориентира Человек вошел в дом.

Продолжение таблицы 1

ЛОК_ вокруг Л-объект располагается вокруг ориентира Дети сели вокруг костра. Кругом/вокруг костра сидели дети.

ЛОК_ далеко Л-объект располагается далеко от ориентира Вдалеке от дома виднелась высокая береза.

ЛОК_ _между10 Л-объект располагается между двумя ориентирами (или между несколькими ориентирами, которые рассматриваются как нечто самостоятельное и отдельное) Его посадили между двумя девушками. Между рогами оленя выросло вишневое дерево.

ЛОК_ на Л-объект располагается на горизонтальной поверхности ориентира Он положил книгу на стол. Книга лежит на столе. Он взял книгу со стола.

ЛОК_ над Л-объект располагается над ориентиром Он повесил лампу над кроватью.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЛОК_ наискосок Л-объект располагается по диагонали от ориентира Магазин находится наискось/наискосок от школы. Слон передвигается на любое число клеток по диагонали.

ЛОК_ напротив Л-объект располагается напротив ориентира Я сел в автобусе против/напротив отца. В автобусе я сидел против/напротив отца.

ЛОК_общ.11 Л-объект (Х) располагается в/на ориентире ^)12, Y не заполнен Х Я в школе. Папа на работе.

ЛОК_общ._ всеобщ. Л-объект располагается в/на ориентире, Y заполнен Х Я прошел по всему городу. Пришли поздравления со всей страны. По всему столу рассыпаны монеты.

ЛОК_ около Л-объект располагается около ориентира Рядом с домом много деревьев. Человек отошел от дома. Я иду к дому.

Продолжение таблицы 1

ЛОК_ перед Л-объект располагается перед ориентиром13 Он положил книгу перед учеником. Книга лежит перед учеником/спереди ученика. Он взял книгу у ученика.

ЛОК_ под_дист. Л-объект располагается под ориентиром (отсутствует контакт с поверхностью) Шофер подлез под машину. Шофер лежит под машиной. Шофер вылез из-под машины. Под ними жили музыканты.

ЛОК_ под_конт. Л-объект располагается непосредственно под ориентиром На столе под книгой ничего не было.

ЛОК_ позади Л-объект располагается позади ориентира Он стал за дерево. Он стоит за деревом. Он выскочил из-за дерева.

ЛОК_ поперек Л-объект располагается поперек ориентира Поперек дороги лежало бревно. Бежать наперерез бандиту.

ЛОК_ посередине Л-объект располагается посередине ориентира Он поставил стол посреди комнаты. Стол стоит посреди (посередине, в середине) комнаты. Передвинем стол с середины комнаты к окну.

ЛОК_сбоку Л-объект располагается сбоку от ориентира Он шел сбоку саней. Положи вилку сбоку от тарелки.

ЛОК_ слева Л-объект располагается слева от ориентира Он стоял слева от меня. Положу вилку слева от тарелки.

ЛОК_ справа Л-объект располагается справа от ориентира Он стоял справа от меня. Положи ложку справа от тарелки.

Окончание таблицы 1

ЛОК_среди

ЛОК_та_сторона

ЛОК_эта_сторона

Л-объект располагается между несколькими ориентирами (больше, чем два), которые рассматриваются как некоторая среда, масса, множество

Л-объект располагается по ту сторону от ориентира

Л-объект располагается по эту сторону от ориентира

1.2.2. Ориентации

Еще одним параметром, выделяемым при классификации ПрО, является параметр ориентации. Ориентация - категория, элементы которой характеризуют направление развертывания данного события по отношению к данному ориентиру.

Значения категории ориентации можно представить в виде схемы:

- статика;

- направленное движение - ориентир - начальная точка движения;

- ориентир - конечная точка движения;

- ориентир - траектория движения;

- ненаправленное движение/расположение.

Однако такое ступенчатое деление представляется не очень удобным для отражения в индексах, поэтому собственно значения параметра ориентации, которые будут использоваться в дальнейшем в качестве индексов ПрО, представлены в табл. 2.

Таблица 2

Значения категории «ориентация»

Ориентации Значение ориентации Примеры

стат. Нахождение л-объекта в покое жить в городе

по отношению к ориентиру лежать на столе

работать в школе

ненапр. Перемещение объекта по области бродить по городу

ориентира или расположение ездить по России

л-объекта в этой области

Окончание таблицы 2

директив-старт Перемещение л-объекта уехать из города

из области ориентира взять со стола

директив-финиш Перемещение л-объекта приехать в город

к области ориентира положить на стол

трасса Перемещение л-объекта идти по улице

через область ориентира пройти через мост

(путь, траектория, трасса) пронести через

проходную

Например, пространственное отношение ЛОК_перед, стат. означает, что объект находится в покое перед ориентиром: мальчик стоит перед дверью, the boy is standing in front of the door, erkek gocuk kapinin onünde duruyor.

Директив-старт и директив-финиш далее в названии ПрО будут обозначаться как старт и финиш.

ЛОК_под, финиш означает, что объект перемещается в пространство под ориентиром - положить коробку под стол, to put the box under the table, kutuyu masanin altina koymak.

Ниже для примера приведены пять пространственных отношений, имеющих одинаковое значение параметра локализации («НА») и разные значения параметра ориентации, и примеры их выражения в русском, английском и турецком языках.

Верхняя поверхность Языки

Русский Английский Турецкий

ЛОК_на, стат. ЛОК_на, ненапр. ЛОК_на, старт ЛОК_на, финиш ЛОК_на, трасса лежать на столе идти по траве взять со стола положить на стол идти по улице lay on the table walk on the grass take from the table put on the table go along the street masada durmak gimende gezmek masadan almak masaya koymak caddeden gegmek

Существенным плюсом предлагаемой классификации (с точки зрения использования ее в системе МП) является уменьшение количества правил, необходимых для передачи ПрО (их анализа или синтеза). Классификация ПрО по двум параметрам (ориентации и локализации) дает возможность в некоторых языках не писать правила для всех 125 выделенных ПрО, а уменьшить их количест-

во до 5 и 25. При автоматическом анализе/синтезе турецкого языка, например, параметры ориентации и локализации можно обрабатывать отдельно (т. е. в сумме писать всего 30 правил вместо 125). Если же в системе МП обрабатываются тексты на достаточно большом количестве языков, выигрыш в количестве правил получается существенным.

2. ВЫРАЖЕНИЕ ПрО В ТУРЕЦКОМ ЯЗЫКЕ

Существует достаточно много способов выражения ПрО в естественных языках: это и морфологические способы (добавление словоизменительных, т. е. падежных, или словообразовательных аффиксов), и синтаксические (использование предлогов/послелогов, изменение порядка слов, инкорпорация), и лексические (использование наречных лексем: далеко, близко и др.).

Турецкий язык, в отличие от русского и английского языков, является агглютинативным - в языках этого типа каждый аффикс выражает только одно грамматическое значение. Префиксов в турецком языке практически нет, всё выражается аффиксами, следующими за корнем слова. Если в русском и английском языках для выражения ПрО используются предлоги, то в турецком языке их функцию выполняют служебные имена и послелоги.

В турецком языке выделяется группа имен, которые представляют собой переходную категорию между послелогами с их специфическими чертами и самостоятельными словами с полной морфологической изменяемостью и предметной семантикой. Эта группа имен носит название служебных имен14. Служебные имена с управляющими ими словами синтаксически оформляются с помощью конструкции изафета или аффиксов принадлежности.

Служебные имена соответствуют строго определенной части русских предлогов, а именно: «вниз», «внизу», «вверху», «спереди», «сзади», «внутри», «снаружи», «около», «между» и др. Как видно из русских соответствий, служебные имена используются для выражения пространственных отношений, а поэтому и употребляются обязательно в оформлении падежей, передающих ПрО: дательный падеж (куда?), местный падеж (где?), исходный падеж (откуда?). Всего же в турецком языке выделяется шесть падежей.

Таблица 3

Падежи турецкого языка и их значения

Падеж Значения Падежные аффиксы

Основной (осн.) Падеж подлежащего и неопределенного прямого дополнения

Винительный (вин.) Падеж определенного прямого дополнения -yi, -yi, -yu, -yü, -i, -i, -u, -ü

Местный (мест.) Маркирует эссив - обозначает местонахождение объекта -da, -de, -ta, -te

Дательный (дат.) Падеж адресата и латива -маркирует конечный пункт передвижения/перемещения -ya, -ye, -a, -e

Исходный (исх.) Элатив - исходный пункт передвижения/перемещения -dan, -den, -tan, -ten

Родительный (род.) Падеж посессора -обладателя чего-л. -nin, -nin, -nun, -nün, -in, -in, -un, -ün

Например:

Осн. fil - слон anne - мама

Вин. fili - слона anneyi - маму

Мест. filde - на/в слоне annede - у мамы

Дат. file - (к) слону anneye - (к) маме

Исх. filden - со/из слона anneden - у/от мамы

Род. filin - слона annenin - мамы

К категории склонения функционально примыкают послелож-ные сочетания, например, с послелогом ile, который имеет также слитную форму -yla, -yle, -la, -le и может передавать инструментальное значение (инструмент или средство передвижения): fille (filile) - (со) слоном, на слоне; anneyle (anne ile) - с мамой. Многие исследователи называют эту форму творительным падежом.

В турецком языке ПрО могут быть выражены двумя способами: 1. Именной группой слова-ориентира, стоящей в определенном падеже; обычно падежами выражаются наиболее общие ПрО, имеющие локализацию ОБЩ. и НА: masa-da (мест. пад.) - на столе, masa-ya (дат. пад.) - на стол.

2. Именной группой слова-ориентира и служебным именем (которое стоит в определенном падеже и образует со словом-ориентиром изафетную конструкцию) или послелогом: masa-nin iç-in-de 'стола в его внутренности' - внутри стола; nehr-in öbür taraf-m-dan 'реки другой стороны-ее-с' - c другой стороны реки.

В обоих случаях для маркировки ориентации используются падежи: местный (направленное и ненаправленное движение), исходный (начальная точка и трасса) и дательный (конечная точка). Итак:

- статика и ненаправленное движение обозначаются местным падежом: ev-de - дома, в доме; orman-da gezmek (лес-в гулять) -гулять в лесу, koltuk-ta oturmak - (кресло-в сидеть) - сидеть в кресле; kutu-nun iç-in-de (коробка-род. внутренность-афф. принадлежности 3 л. ед. ч., мест.) - внутри коробки;

- директив-старт и траектория - исходным падежом: ev-den -из дома, мимо дома; ev-den çikmak (дом-из выходить) - выходить из дома, köprü-den geçmek (мост-по проходить) - проходить по мосту, kutu-nun iç-in-den (коробка-род. внутренность-афф. принадлежности 3 л. ед. ч., исх.) - изнутри коробки;

- директив-финиш - дательным (направительным) падежом: ev-e - к дому; orman-a gitmek (лес-в идти) - идти в лес, kitabi masaya koymak (книгу стол-на положить) - положить книгу на стол; kutu-nun iç-in-e (коробка-род. внутренность-афф. принадлежности 3 л. ед. ч., дат.) - внутрь коробки.

Таким образом, в конструкциях со служебными именами само служебное имя выражает локализацию, а падеж, в котором оно стоит, - ориентацию.

Masa-nin içinde - в столе; masa-nin üstünde - на столе - ориентация «статика»; masa-nin içinden - из стола; masa-nin üstünden -со стола - ориентация «старт»; masa-nin içine - в стол; masa-nin üstüüne - на стол - ориентация «финиш». Послелог boyunca передает значение параллельности: orman kenari boyunca - вдоль опушки леса. Слово-ориентир при этом послелоге ставится в основном падеже: nehir boyunca (река вдоль) - вдоль реки.

В турецком языке нет ярко выраженной оппозиции «внутри - на поверхности». Для русского языка оппозиция «внутри Y - на одной из поверхностей Y» облигаторна - мы должны обозначить положение Х внутри/на поверхности Y: Лампа в шкафу или на шкафу? Фотография в книге или на книге? В турецком же языке местный падеж обозначает общую локализацию: Lâmba dolapta (лампа шкаф-в/на), что может переводиться на русский язык как Лампа в шкафу, так и Лампа на шкафу. Однако существует возможность выразить местоположение л-объекта и более точно. Для этого в турецком языке используются служебные имена içinde - в, üstünde - на, üzerinde - над:

masanin içinde - в столе (внутри стола), masanin üstünde - на столе, masanin üzerinde - над столом. Значения служебных имен üstünde и üzerinde очень близки к значениям русских предлогов на и над, однако некоторые различия в их использовании все-таки есть. Служебное имя üstünde обозначает нахождение на поверхности ориентира, однако эта поверхность не должна быть расположена высоко. В противном же случае нахождение на горизонтальной поверхности, но расположенной где-то высоко, приравнивается к нахождению л-объекта над поверхностью. Ср.:

Kitap masanin üstünde. - Книга на столе.

Tablo masanin üzerinde. - Картина над столом.

Sapka dolabin üzerinde. - Шляпа на шкафу (дословно - над шкафом).

Одновременно следует учитывать, что на практике (в узусе) служебные имена üst и üzer часто взаимозаменяемы: suyun üzeri -поверхность воды, masanin üzeri tozlu или masanin üstü toz içinde - на столе пыль (поверхность стола пыльная); Bir dalga legeni üzerinde K1 ve K2 kaynaklari çalistmlarak su üzerinde dairesel dalgalar elde edilebilir - Возбуждая два источника К1 и К2 в корыте с водой, можно получить круговые волны на поверхности воды.

Традиционно служебными именами называют ограниченное множество слова: üst (верх), alt (низ), ön (перед), arka (зад), iç (внутренность), dis (вне). Однако помимо перечисленных выше слов для выражения ПрО в турецком языке используются еще и некоторые другие существительные. В данном исследовании они будут также рассматриваться и обрабатываться, как и традиционно выделяемые служебные имена.

Возьмем для примера слова taraf (сторона) и yer (место), использующиеся для выражения локализации ТА_СТОРОНА, ЭТА_СТО-РОНА и ОБЩ._всеобщ. Например: nehr-in bu taraf-in-da (река-род. п. этот сторона-афф. принадлежности-мест. п) - на этой стороне реки; nehr-in bu taraf-in-a (река-род. п. этот сторона-афф. принадлеж-ности-дат. п.) - на эту сторону реки. Единственное отличие этих слов заключается в том, что при выражении соответствующего ПрО они имеют при себе зависимое слово (определение «этот», «тот», «каждый»). Но в целом (такое решение оказывается очень удобным для создания базы правил синтеза и анализа в системе МП) можно считать сочетания bu tarafinda, o tarafinda, her yerinde такими же служебными именами, как и içinde, önünde и т. п.

В следующей таблице для каждого ПрО (которое получается путем пересечения строк-локализаций и столбцов-ориентаций) приводится его выражение в турецком языке.

Таблица 4

Способы выражения ПрО в турецком языке

Локализации Ориентации

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Статика Движение

Ненаправ- Направленное

ленное Старт Финиш Трасса

ОБЩ. Мест. Мест. Исх. Дат. Исх.

ОБЩ_всеобщ. Род. + her yerinde Род. + her yerinde Род. + her yerinden Род. + her yerine Род. + her yerinden15

ВДОЛЬ Осн.+ boyunca Осн.+ boyunca - - Осн. + boyunca

ВНЕ disinda disinda disindan Disina disindan

ВНУТРИ iginde iginde iginden Igine iginden

ВОКРУГ gevresinde/ etrafinda gevresinde/ etrafinda iginden Igine iginde

ДАЛЕКО uzakta uzakta uzaktan uzaga uzaktan

МЕЖДУ Y1 ile Y2 arasinda Y1 ile Y2 arasinda Y1 ile Y2 arasindan Y1 ile Y2 arasina Y1 ile Y2 arasindan

НА Мест. ustunde (uzerinde) Мест. ustunde (uzerinde) Исх. ustunden (uzerinden) Дат. ustun (uzerine) Исх. ustunden (uzerinden)

НАД uzerinde uzerinde uzerinden uzerine uzerinden

НАИСКОСОК gaprazina - - gaprazina gaprazina

НАПРОТИВ karsisinda karsisinda karsisindan karsisina karsisindan

ОКОЛО yaninda/ etrafinda yaninda/ etrafinda yanindan/ etrafindan yanina/ etrafina yanindan/ etrafindan

ПЕРЕД onunde onunde onunden onune onunden

ПОД-дист. altinda/ asagisinda altinda/ asagisinda altindan/ asagisinda altindan/ asagisina altindan/ asagisindan

ПОД-конт. altinda altinda altindan altina altindan

ПОЗАДИ arkasinda arkasinda arkasindan arkasina arkasindan

Окончание таблицы 4

ПОПЕРЕК karsisinda; - - Род. + bir Род. + bir

bir tarafindan tarafindan

tarafindan obur obur

obur tarafina tarafina

tarafina

ПОСЕРЕДИНЕ ortasinda, ortasindan, ortasindan ortasina ortasindan

enine kars idan

kars iya

enine

СБОКУ yaninda yaninda yanindan yanina yanindan

СЛЕВА solunda solunda solundan soluna solundan

СПРАВА sagSinda sagSinda sagSindan sagSina sagSindan

СРЕДИ Осн. + Осн. + Осн. + Осн. + Осн. +

arasinda16/ arasinda/ arasindan/ arasina/ arasindan/

iginde iginde iginden igine iginden

ТА_СТОРОНА otesinde/ otesinde/ otesinden/ otensine/ otesinden/

ardinda/ ardinda/ ardindan/ ardina/ ardindan/

obur obur obur obur obur

tarafinda tarafinda tarafindan tarafina tarafindan

ЭТА_СТОРОНА bu bu bu bu bu

tarafinda tarafinda tarafindan tarafina tarafindan

Слово-ориентир при всех служебных именах (если не указано иначе) ставится в родительном падеже, поэтому для наглядности и экономии места в таблице это не указывается.

Особняком стоит проблема перевода «быть-конструкций» и «иметь-конструкций». Глаголы «быть» и «иметь» занимают в любом языке особое положение.

Приведу сразу же примеры двух конструкций, имеющих одинаковые средства выражения в русском и английском языках, но по-разному кодирующихся в турецком:

1. I have a large family.

2. I have a newspaper.

Перевести их на русский язык не составляет проблем: в русском языке английскому глаголу «иметь» соответствует конструкция «у Х есть Y», которая также может обозначать любую принадлежность - как общую, так и временную: У меня есть большая семья; У меня есть газета.

При переводе же этих предложений на турецкий язык могут быть использованы две разные конструкции. С определенной степенью условности (приближения) можно сказать, что для обозначения постоянного обладания (У него большая семья; У него есть сестра) используется конструкция Х'т Y'l var17 (дословно «его большая семья есть», «его сестра есть»), а для временного обладания (У меня есть ручка; У меня с собой нет денег) - конструкция ХЧе Y var18 (дословно «у меня/во мне ручка есть», «при мне денег нет»). Более наглядно это можно представить следующим образом (табл. 5).

Таблица 5

Конструкции обладания

Обладание Английский язык Турецкий язык Русский язык

Постоянное (1) Временное (2) I have a car (Я имею машину) I have a newspaper (Я имею газету) АгаЬат vaг19 (Моя машина есть) Bende gazete vaг (У меня есть газета) У меня есть машина У меня есть газета

Из таблицы видно, что только в турецком языке разделяются конструкции 1 и 2 и что постоянное обладание часто выражается в турецком языке, как в английском («я имею машину»), а временное обладание - как в русском («у меня есть газета»).

Объекты обладания можно классифицировать следующим образом:

1) канонические (У нее есть машина);

2) неканонические:

- устранимый объект (У меня плохое настроение);

- неустранимый, партитивный (У нее красивые глаза);

- оценочный (У него твердый характер);

- объект распоряжения (У тебя тут в кастрюле кусок мяса).

Основное внимание в связи с передачей канонических посессивных отношений приходится уделять проблеме их синтеза с турецким языком. При анализе, например, английского предложения «X has Y» на выходе мы получаем конструкции типа X ^ ИМЕТЬ ^ Y. Основная проблема заключается в том, что в турецком предложении необходимо выбрать, каким способом конструкция Х - ИМЕТЬ - Y должна синтезироваться.

(1) X'te Y var (В X /при Х/ есть Y). Например: Bende para var. У меня есть (с собой) деньги. Onda gazete var. У него есть газета /с собой/).

(2) X'in Y'i var (У Х есть Y). Например: Arabam var. У меня есть машина. Kizkardeçi var. У него есть сестра.

Назовем конструкцию (1) конструкцией с устранимой посес-сивностью, а конструкцию (2) - с неустранимой посессивностью. Конечно, эти названия условны: машину могут украсть, сестра может умереть, однако для говорящего на момент речи эти объекты мыслятся как неотъемлемая собственность посессора.

Итак, постараемся найти условия, при которых нужно синтезировать первую конструкцию, а при каких - вторую.

В общем же можно записать следующие условия:

если Х (посессор) имеет семантическую характеристику (далее СХ) «неодушевленность» - то вторая конструкция (2);

если Х имеет СХ «одушевленность», то при условии, что Y имеет СХ «одушевленность», «жилище», «транспорт», «непредметность» - вторая конструкция (2), в ином случае (обычно если Y имеет СХ «предметность») - первая (1).

Некоторые предложения могут быть поняты двояко. Например, Я ^ ИМЕТЬ ^ ДЕНЬГИ может интерпретироваться как то, что человек имеет деньги вообще, так и то, что он их имеет в данную минуту при себе. Подобные конструкции с неустановленной окончательно семантикой будут синтезироваться всеми возможными способами - пользователь сможет сам решить, какой вариант ему подходит.

С каноническими посессивными конструкциями возникают проблемы только с переводом на турецкий язык. Неканонические же конструкции создают трудности и при переводе, например, с русского на английский язык. В большинстве случаев (за исключением партитивной конструкции) в системе МП нужно прописывать специальные правила, адекватно переводящие каждую конкретную конструкцию. Особенно сложным оказывается правильно проанализировать высказывания с объектом распоряжения типа русских разговорных «у меня тут у жены нога заболела», «у тебя тут в кастрюле кусок мяса». При всем своем маргинальном характере они демонстрируют важное свойство любой посессивной конструкции с двумя неустранимыми актантами - возможность несовпадения сферы обладания и сферы распоряжения. На английский и турецкий языки (ввиду невозможности донести полный смысл подобных конструкций) такие предложения должны переводиться как «у моей жены заболела нога», «в кастрюле кусок мяса».

***

В данной статье была сделана попытка выделить параметры классификации ПрО, релевантные для многоязычной системы МП Кросслейтор, а также подробно рассмотреть средства выражения ПрО в турецком языке. Приведенная в данной работе таблица 1, в которой каждому ПрО сопоставлен определенный способ его выражения в турецком языке, была заложена в основу алгоритмов анализа и синтеза ПрО в системе МП Кросслейтор.

Примечания

1 Исследование проводится в рамках гранта 06-01-00538-а «Разработка языка-транслятора знаний для задачи машинной трансляции знаний между различными научными областями».

2 Эта система машинного перевода разрабатывается с 2001 г. лабораторией автоматизированных систем обработки лингвистической информации в Институте прикладной математики им. М.В. Келдыша РАН. На данный момент в системе Кросслейтор в процессе разработки находятся модули трех языков: русский, английский и турецкий.

3 Мельчук И.А. Курс общей морфологии. Т. II. Ч. 2: Морфологические значени: Пер. с фр. М.: ЯРК, 1998.

4 Плунгян В.А. Общая морфология: Введение в проблематику. М.: УРСС, 2000.

5 Плунгян В.А. К типологии глагольной ориентации. М., 1999. С. 110; см. также: Плунгян В.А. О специфике выражения именных пространственных характеристик в глаголе: категория глагольной ориентации // Исследования по теории грамматики. Т. 2. Грамматикализация пространственных значений / Под ред. В.А. Плунгяна. М.: Русские словари, 2002. С. 57-98.

6 Всеволодова М.В., Дементьева ОЮ. Проблемы синтаксической парадигматики: коммуникативная структура предложений. М., 1997. С. 31.

7 Пете И. Пространственность, предлоги, локальные отношения, картины мира и явления асимметричности // Вестник Московского университета. Сер. 9. Филология. 2004. № 3. С. 61.

8 Гак В.Г. Пространство вне пространства // Логический анализ языка. Языки пространств. М.: Языки русской культуры, 2000. С. 132.

9 Плунгян В.А. Общая морфология. С. 175.

10 Отличие МЕЖДУ от СРЕДИ заключается в разном количестве ориентиров: для МЕЖДУ количество ориентиров равно двум, для СРЕДИ количество ориентиров больше или равно трем.

11 Отличия ОБЩ. от ВНУТРИ хорошо видно на примере английского языка, где ОБЩ. стандартно выражается при помощи «аЬ», а ВНУТРИ - «т». В турецком языке также видны различия: и ОБЩ., и ВНУТРИ можно выразить местным падежом, однако ВНУТРИ выражается также специальным служебным

именем «içinde». Местный падеж в турецком языке обозначает локализацию л-объекта «внутри» или «на поверхности». Например, masada может переводиться и «на столе», и «в столе».

1S Наиболее общая ориентация, когда не уточняется, находится ли л-объект «внутри» ориентира или «на» ориентире, передается в английском языке предлогом at, а в турецком - местным падежом.

13 При этом ПЕРЕД может определяться как антропоморфностью ориентира, наличием у него «фасада», так и зависеть от наблюдателя. Это понятие не вводилось в работу ввиду того, что на данный момент его достаточно сложно отразить при машинном переводе.

14 Кононов А.Н. Грамматика турецкого языка. btanbul: Milenyum Yayinlari Turan Kitabevi, SOOS. С. 198.

15 Падежи в случае трассы довольно условны: основное правило - «проходить по чему-либо» передается исх. п. (например, sokaktan geçmek - пройти по улице, köprüden gitmek - пройти по мосту. Однако ряд глаголов управляет другими падежами. Ср.: Bütün evi gezip çöpleri topladi. Пройдя по всему дому, он собрал весь мусор. Bütün evi gezip çöpleri topladi. Здесь «дом» стоит в винительном падеже.

16 Служебное имя arasinda используется в основном, когда ориентиры перечисляются, если же ориентир один (например, толпа), используется служебное имя içinde.

17 Дословно: «Х-овый Y есть».

18 Дословно: «в X-е У есть».

19 Дословно: «Моя машина имеется».

i Надоели баннеры? Вы всегда можете отключить рекламу.