Научная статья на тему 'Роль категории падежа в машинном переводе'

Роль категории падежа в машинном переводе Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
85
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЯЗЫКОЗНАНИЕ / МАШИННЫЙ ПЕРЕВОД / КАТЕГОРИЯ ПАДЕЖА

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Шеремет В. В.

Шеремет В.В. Роль категорії відмінку в машинному перекладі / В.В. Шеремет // Вчені записки Таврійського національного університету ім. В. І. Вернадського. Серія «Філологія. Соціальні комунікації». 2011. Т. 24 (63), № 3. С. 151-155.У статті розглядається місце категорії відмінку у машинному перекладі.Ключові слова: мовознавство, машинний переклад, категорія відмінку.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Sheremet V.V. The place of the case grammatical category in the machine translation / V.V. Sheremet // Scientific Notes of Taurida V. I. Vernadsky National University. Series: Philology. Social communications. 2011. Vol. 24 (63), No 3. P. 151-155.In the article the place of the case grammatical category in the process of the machine translation is observed.Key words: linguistics, machine translation, case grammatical category.

Текст научной работы на тему «Роль категории падежа в машинном переводе»

Ученые записки Таврического национального университета им. В. И. Вернадского Серия «Филология. Социальные коммуникации». Том 24 (63). № 3. 2011 г. С. 151-155.

УДК 811.161.1+811.411.21

РОЛЬ КАТЕГОРИИ ПАДЕЖА В МАШИННОМ ПЕРЕВОДЕ

Шеремет В. В.

Таврический национальный университет им. В.И. Вернадского, г. Симферополь, Украина

E-mail: sheremetvitaliy@gmail. com

В статье рассматривается место категории падежа в машинном переводе.

Ключевые слова: языкознание, машинный перевод, категория падежа.

Постановка проблемы. Основными методами работы с языковым материалом в прикладной лингвистике, на данный момент, являются методы моделирования, алгоритмизации - методы формального представления информации [1, 61]. Перевод, как один из способов представления языкового материала, также является объектом моделирования. Научные изыскания последнего десятилетия в этой области вскрывают неразрывную связь лингвистической стороны языка с экстралингвистической (типичные речевые ситуации, социальная стратификация и др.), без учета которой невозможна реализация электронного перевода на уровне, удовлетворяющем международным стандартам [2, 56]. В связи с этим машинный перевод предстает сложной, многоаспектной проблемой, требующей комплексного подхода. Категория падежа, как часть лингвистической системы, также учавствует в процессах формализации. Одно из основных требований, предъявляемых к корректному языковому моделированию, - точная запись элементов, обращение к конкретно-семантическому началу с целью последующей их идентификации и классификации [3, 79]. В современной лингвистике, как правило, вопрос формализации категории падежа решается при помощи грамматических таблиц, включающих в себя все возможные морфологические формы [4]. Недостаток существующих систем перевода -обращение к подобным таблицам, так как перевод представляется задачей, требующей комплексного (основанного на синергии всех уровней языка) решения.

Задачам комплексного решения данной проблемы отвечает подход, основывающийся на поиске лингвистических эквивалентов, позволяющий работать при переводе на разных языковых уровнях и на стыке грамматических категорий (что особенно важно для перевода с/на неблизкородственные языки). Именно поэтому изучение категории падежа на уровне лингвистических эквивалентов, как в близкородственных, так и в неблизкородственных языках играет важную роль для осуществления перевода машиной.

Работа в этой области практически не ведется: можно назвать только несколько изысканий, посвященных определенным аспектам вопроса перевода категории падежа [5; 6], ориентированных, прежде всего, на одноуровневые переводческие решения, что обуславливает новизну данного исследования.

Данные обстоятельства обусловили цель работы: выявить роль категории падежа в машинном переводе. Поэтапное достижение цели отражено в следующих задачах: 1) рассмотреть этапы развития машинного перевода через призму соответ-

ствующих пониманий категории падежа; 2) пронаблюдать на практике реализацию перевода категории падежа в электронных переводчиках на морфологическом, синтаксическом, стилистическом уровнях; 3) выявить роль категории падежа в машинном переводе.

1. Первым этап машинного перевода: 1949-1960 года. Доминирующими в этом периоде для прикладной лингвистике является концепция «текст-текст» и принцип дешифровки [7]. В теории перевода основное место занимает порождающая грамматика. Соответственно падеж, применительно к машинному переводу (МП), понимается исключительно в русле выразителя глубинных отношений [8]. В отрыве от перевода падеж изучается на морфо-семантическом уровне [9]. Следующий этап развития теории и практики перевода: 1960-1973 года. Его характеризуют: 1) накопление знаний о языковых формах (в частности, грамматический словарь А. А. Зализняка [10]); 2) появление теории эквивалентности [11]; 3) исследование семантики слов с целью достижения эквивалентного перевода (например, рассмотрение падежа как единицы, обладающей инвариантым значением со множетсвом вариантов [12]). Исследования, которые велись впоследствии, тяжело разделить на этапы, т. к. одновременно разрабатывалось множество теорий и подходов, как к падежу, так и к переводу. Общее положение дел заключается в привлечении все большего количества языковых и внеязыковых фактов [13;14], активном использовании наработанной базы для составления морфемных, синтаксических анализаторов (http://morpher.ru, http://company.yandex.ru/technology/mystem/ и др.), электронных переводчиков (http://russian.babylon.com/index.html, http://www.promt.ru/ и др.), систематизации теории перевода [15]. Наряду с этим образуются новые и оцениваются сформировавшиеся теории, описывающие категорию падежа [16;17;18;19;20;21].

Основными результатами эволюции теории и практики перевода стала алгоритмизация, разбиение переводческого процесса на этапы (морфологического анализа, анализа синтаксиса и т.д.), базирование на различных лексикографических массивах (представленных особым образом знаниях) [22, 214]. В плане категории падежа - успешное моделирование применительно к лексикографическим системам [23].

2. Анализ современного состояния практики перевода позволяет судить о роли категории падежа в машинном переводе (см.таб.1.1.).

Таблица 1.1. Сравнительный анализ результатов электронного перевода

Фраза ИЯ Фраза ПЯ

http://pereklad.online.ua/ Google translation Google

я стал врачом я став лжаркою Ben Ыг doktor oldu

во имя веры в iм'я вiри iman adma

через посредство новых законов через посредство нових закошв yeni yasa Не '¿^Л. ¿Л

я слышал, что ощущающему любовь человеку все подвластно я чув, що людиш, що ввдчувае любов, все шдвладно Ben Ыг кф a§k her §eyi 1яЫ hissediyorduydum ^ П11 ■ "

152

Так, например, переводная фраза неоднозначна, в отличие от фразы

ИЯ (исходного языка), очевидно, что во время перевода была допущена ошибка, ее источник - неправильная трансляция падежа.

Электронный переводчик в некоторых случаях не распознает сложные падежные конструкции (во имя) и переводит их дословно (тап а&па), в то время, как в ПЯ (переводящем языке) есть точный эквивалент: (Ыг §еу ugгunda). В связи с этим смысл выражения теряется.

В ряде случае при машинном переводе утрачивается стилистическая нагрузка фразы из-за подмены падежной конструкции (уеш уа8а Не вместо агасй^1у1а, уа8йа81у1а).

При переводе падежа в синтаксических конструкциях первоочередный статус синтаксиса можно наблюдать в русско-украинской трансляции, где причастная форма на -ущий, была заменена соответствующим ей придаточным оборотом. В турецком и арабском языках присутствует попытка пословного перевода, который ведет к смысловым потерям. Потеря языковой специфики (так, например, фраза

¿1 некорректна и требует добавления местоимения в именительном падеже, сочетание и^ является именным предложением, тогда как в случае перевода причастия на -ущий является необходимым изменить порядок слов и состояние подлежащего, либо использовать другую синтаксическую конструкцию. Схожая ситуация наблюдается и в машинном переводе на турецкий язык.

Роль категории падежа в МП заключается в следующем:

1) она уточняет общее значение фразы и позволяет более точно подобрать переводческий эквивалент;

2) она тесно связана с другими категориями различных языковых уровней (семантического, синтаксического, стилистического), что обуславливает ее важность для эквивалентного перевода конструкций, в состав которых она входит.

Выводы и перспективы. Теория перевода на данный момент располагает обширным материалом, собранным в процессе становления переводческой мысли. Недостатком сложившейся ситуации является то, что накопленные данные не реализованы в должной мере на практике. Так, например, является очевидным, что основным принципом работы с падежной категорией, внедренным в электронный переводчик, является эквивалентный перевод на простейшем уровне, зачастую - поэлементный. Важность роли категории падежа в МП не учитывается, в то время как, анализ показывает, что перевод падежа затрагивает область не только морфологии, но и семантики, синтаксиса, стилистики.

Рассмотренные в данной работе положения не исчерпали вопроса эквивалентного перевода категории падежа и предполагают дальнейшую их разработку в направлении оптимизации систем МП.

153

Список использованной литературы

1. Марчук Ю. Н. Компьютерная лингвистика / Марчук Ю. Н. - М.: Восток-Запад, 2007. - С. 61.

2. Марчук Ю. Н. Компьютерная лингвистика / Марчук Ю. Н. - М.: Восток-Запад, 2007. - С. 56.

3. Широков В. А. Елементи лексикографй / Широков В. А. - К.: Довiра, 2005. - C. 79.

4. Широков К. В. 1менна словозмша у сучаснш турецькш мовi / Широков К. В.- К. : Довiра, 2009.

- 318 с.

5. Савицкая Г. В. Функциональные эквиваленты русского творительного падежа (адвербиального) в немецком языке. : Дис. ... канд. филол. наук : 10.02.04 «германские языки» / Савицкая Галина Викторовна ; МНУ. - Минск, 1983. - 188 с.

6. Шуан Сунь. Семантическая интерпретация падежных форм в системах русско-китайского машинного перевода : на примере творительного падежа : дис. ... канд. филол. наук : 10.02.21 «Сравнительно-сопоставительное языкознание» / Сунь Шуан ; Моск. гос. ун-т им. М.В. Ломоносова. - Москва,

2009. - 198 с.

7. Fawcett P. Translation and Language: Linguistic Theories Explained / P. Fawcett. Manchester, - St. Jerome Publishing, 2003. - 224 p.

8. Ал-Самраи М. М. Р. Глубинные падежи и их реализация в поверхностной структуре персидского языка : Дис. ... канд. филол. наук : 10.02.22 : «Языки народов зарубежных стран Европы, Азии, Африки, аборигенов Америки и. Австралии» / Ал-Самраи Мохаммад Мухи Рашид ; Рос. ун-т дружбы народов. - Москва, 2004. - 194 c.

9. Якобсон Р. О. Избранные работы / Звегинцев В. А. - М. : Прогресс, 1985. - С. 169-172.

10. Зализняк А. А. Русское именное словоизменение / Зализняк А. А. - М. : Наука, 1973. - 370 с.

11. Бархударов Л. С. Язык и перевод (Вопросы общей и частной теории перевода) / Бархударов Л. С. - М. : «Междунар. отношения», 1975. - 240 с.

12. Падучева Е. В. Об описании падежной системы русского существительного (некоторые проблемы омонимии при машинном переводе) / Е. В. Падучева // Вопросы языкознания, 1960. - № 5. -С. 104-111.

13. Лангаккер Р. У. Когнитивная граматика / Лангаккер Р. У. - М., 1992. - 54 с.

14. Финкильберг Н. Д. Теория и технология перевода / Финкильберг Н. Д. - М.: Восточная книга,

2010. - 400 с.

15. Комиссаров В. Н. Теория перевода [электронный ресурс] / В. Н. Комиссаров. - Режим досутпа: http://www.classes.ru/grammar/43.Teoriya_perevoda_Lingvicticheskiye_aspekty/extfile/help2/html/unnamed _22.html.

16. Мельников Г. П. Системология и языковые аспекты кибернетики [электронный ресурс] / Г. П. Мельников. - Режим доступа: http://philologos.narod.ru/melnikov/melnikov.htm.

17. Дремов А. Ф. Роль падежей русского языка в обеспечении связности и компрессии текста : дис. ... канд. филол. наук : 10.02.01. «Русский язык» / Дремов Алексей Федорович ; Моск. гос. ун-т им. М.В. Ломоносова. - Москва, 2007. - 187 с.

18. Лаврентьев А. М. Типологический анализ категории падежа в русском языке : дис. ... канд. филол. наук : 10.02.01 «Русский язык» / Лаврентьев Алексей Михайлович ; Новосиб. гос.университ. -Новосибирск, 1999. - 229 с.

19. Кацнельсон С. Д. Типология языка и речевое мышление Кацнельсон С. Д. - Л. : Наука, 1972. -213 с.

20. Потье Б. Типология [электронный ресурс] / Б. Потье // Новое в зарубежной лингвистике. - Выпуск XXV. Контрастивная лингвтистика. - режим доступа: http://www.classes.ru/grammar/166.new-in-linguistics-25/source/worddocuments/_10.htm.

21. Филлмор Ч. Дело о падеже / Ч. Филлмор // Новое в зарубежной лингвистике. Лингвистическая семантика. - 1981. - № 10. - С. 305-340.

22. Марчук Ю. Н. Компьютерная лингвистика / Марчук Ю. Н. - М. : Восток-Запад, 2007. - 238 с.

- ISBN: 5-17-039480-2.

23. Широков К. В. 1менна словозмша у сучаснш турецькш мовi / Широков К. В.- К. : Довiра, 2009.

- 318 с.

154

Шеремет В.В. Роль категори ввдмшку в машинному перекладi / В В. Шеремет // Вчеш записки Тавршського нацiонального ушверситету îm. В. I. Вернадського. Серш «Фшолопя. Сощальт кому-шкацц». - 2011. - Т. 24 (63), № 3. - С. 151-155.

У статп розглядаеться мгсце категорiï вiдмiнку у машинному перекладг Ключовi слова: мовознавство, машинний переклад, категорiя вiдмiнку.

Sheremet V.V. The place of the case grammatical category in the machine translation

/ V.V. Sheremet // Scientific Notes of Taurida V. I. Vernadsky National University. - Series: Philology. Social communications. - 2011. - Vol. 24 (63), No 3. - P. 151-155.

In the article the place of the case grammatical category in the process of the machine translation is observed.

Key words: linguistics, machine translation, case grammatical category.

Поступила в редакцию 01.09.2011 г.

155

i Надоели баннеры? Вы всегда можете отключить рекламу.