Научная статья на тему 'Когнитивные лингвистические модели смешанного перевода в межкультурной коммуникации'

Когнитивные лингвистические модели смешанного перевода в межкультурной коммуникации Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
378
95
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОГНИТИВНАЯ МОДЕЛЬ / ДИСКУРС / КОММУНИКАЦИЯ / МОДЕЛЬ / КОГНИТИВНЫЙ / ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МАШИННЫЙ ПЕРЕВОД / СМЕШАННЫЙ ПЕРЕВОД / COGNITIVE MODEL / DISCOURSE / COMMUNICATION / MODEL / COGNITIVE / ARTIFICIAL INTELLIGENCE / MACHINE TRANSLATION / MACHINE-AIDED TRANSLATION

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Котельникова Е.В.

В статье рассматривается виртуальный характер идентичности агентов смешанного перевода межкультурной коммуникации семиотике переводного текста. В качестве виртуальных личностей интеллекта и искусственного интеллекта рассматриваются группы знаков продуцируемых текстов, анализируя которые и выбирая их лучшую комбинацию, удается снизить когнитивные усилия и избежать ряда трудностей коммуникации. Рассмотрены когнитивные модели и анализ когнитивных затрат смешанного перевода.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Cognitive linguistic models of machine-aided translation in intercultural communication

The article deals with virtual nature of identity agents of machine-aided translation semiotics of the text translation. In the produced texts, the groups of signs are regarded as virtual personalities of intelligence and artificial intelligence of machine-aided translation. Due analysis and choice of their best combination, we can reduce the cognitive effort and avoid some of the difficulties of intercultural communication. The paper considers model of the discourse, cognitive models and analyzes the cognitive effort of machine-aided translation.

Текст научной работы на тему «Когнитивные лингвистические модели смешанного перевода в межкультурной коммуникации»

ТЕОРИЯ ПЕРЕВОДА И МЕЖКУЛЬТУРНАЯ КОММУНИКАЦИЯ

THEORY OF TRANSLATION AND INTERCULTURAL COMMUNICATION

УДК 8142

Е. В. Котельникова E. V. Kotelnikova

Когнитивные лингвистические модели

смешанного перевода в межкультурной коммуникации

Cognitive linguistic models of machine-aided translation in intercultural communication

В статье рассматривается виртуальный характер идентичности агентов смешанного перевода межкультурной коммуникации семиотике переводного текста. В качестве виртуальных личностей интеллекта и искусственного интеллекта рассматриваются группы знаков продуцируемых текстов, анализируя которые и выбирая их лучшую комбинацию, удается снизить когнитивные усилия и избежать ряда трудностей коммуникации. Рассмотрены когнитивные модели и анализ когнитивных затрат смешанного перевода.

The article deals with virtual nature of identity agents of machine-aided translation semiotics of the text translation. In the produced texts, the groups of signs are regarded as virtual personalities of intelligence and artificial intelligence of machine-aided translation. Due analysis and choice of their best combination, we can reduce the cognitive effort and avoid some of the difficulties of intercultural communication. The paper considers model of the discourse, cognitive models and analyzes the cognitive effort of machine-aided translation.

Ключевые слова: когнитивная модель, дискурс, коммуникация, модель, когнитивный, искусственный интеллект, машинный перевод, смешанный перевод.

Key words: cognitive model, discourse, communication, model, cognitive, artificial intelligence, machine translation, machine-aided translation.

Соответствующая дискурсивной онтологии современная интерак-ционная концепция межкультурной коммуникации (МКК) представляется процессом демонстрации и интерпретации смыслов, феноменологическим пространством (ФП), принадлежащим множеству коммуникантов [7]. Когнитивно-дискурсивная парадигма рассматривает совместно процессы познания мира, структуризацию знания и опыта в восприятии, осмыслении окружающего мира и анализ

вербального поведения людей, где язык выступает главным средством объективации мышления, косвенным способом познания [6].

Когнитивная лингвистика (КЛ) наиболее глубоко в феноменологическом аспекте изучает язык и его употребление, «ментальные» основы понимания и продуцирования речи, при которых языковое знание участвует в переработке информации, описание и объяснение языковой способности и/или знаний языка как внутренней когнитивной структуры и динамики говорящего-слушающего [6]. В данном аспекте, в частности, предложен ряд моделей порождения и восприятия речи и комплексная коммуникационная модель дискурса [1].

Трудности МКК, связанные с возрастанием информационного объема моделей КЛ, преодолимы на пути усиления процедурной составляющей представления знаний, использования инновационных информационных технологий и искусственного интеллекта (ИИ), совместимых с новой интеракционной моделью МКК на основе эффективных сценариев взаимодействии человеческого и машинного ресурсов [2]. Моделирование языкового общения с использованием ИИ - одна из актуальных задач КЛ, исследования которой в состоянии предложить новые идеи обработки текста, недостающие технологиям ИИ. Семиотический характер текста облегчает применение ИИ, как комплекса компьютерных систем и устройств для решения лингвистических задач, присущих ранее исключительно ЕИ [4]. Применение языка в смешанном переводе (СП) [2] предполагает общение ЕИ с ИИ, где в роли реальности ИИ, аналога «бессубъектного дискурса» [9] выступают некие группы создателей лингвистической интеллектуальной среды: программисты, филологи, психологи, философы и т.д., создавшие иную, по сравнению с собственной ментальной, виртуальную реальность с другим бытием и законами существования. Общение с ней адресатно, учитывает интеракцию (взаимодействие ЕИ и ИИ на основе общих знаний, установок, ситуации и т. п.), ориентируется на ИИ как на управляемый виртуальный агент коммуникации и представляет особое явление: дискурс в дискурсе [4].

ЕИ в процессе СП опирается на психологическую виртуальную реальность как «...особого рода образ реальности, тем или другим путем формируемый в сознании, в отличие от обычных образов, продуктов сознания и воображения, он выступает как действитель-

ная среда определенной деятельности человека <...> эта реальность обладает характеристиками обычной эмпирической реальности, однако, <...> лишена части ее основных предикатов» [10].

Отражая и поддерживая основные принципы когнитивной деятельности интеллекта, фреймовые структуры виртуального пространства ИИ так или иначе использует принципы ЕИ в процедурах создания ПТ, ориентированных на восприятие знаков и речи, их распознание, морфологический, синтаксический и семантический анализ и синтез, проверку текста на уровнях метаязыка, обучение, диалогичность вербального взаимодействия, использование прототипов или шаблонов образцов речи, сохранение в памяти текста и речи, использование лексических словарей и др. Таким образом, в ФП СП включаются пересекающиеся во многом изоморфные в функциональном отношении виртуальные пространства ЕИ и ИИ, а ФП ИИ является дискретным и может быть составлено из ФП нескольких видов ИИ.

Поскольку обмен сообщениями между ЕИ и ИИ происходит в текстовом формате (ИТ, тексты образа данного ИИ, тексты управления и фрагменты ПТ), а о качестве систем МП в конечном итоге судят по ПТ, то ЕИ и ИИ могут быть представлены в виде продуцируемого ими текста как некие виртуальные личности (ВЛ), проявляющиеся в тексте, тождественные ему. ВЛ различных коммуникантов актуализируются в электронных текстах инструментами ВЛ, в виде принципов и механизмов функционирования (обработки текста) и репрезентируется множеством текстов ПТ которые даже при совпадении общего смысла не являются тождественными по форме. ЕИ продуцирует поле смыслов, маркированных модальностью, семантическими состояниями, интерпретационными возможностями, ассоциативными связями, а сети ИИ продуцируют кластеры текста, заполненные аккумулированными знаниями и множеством вариантов процедурных реализаций ИИ. Качество и особенности синтезируемых ЕИ текстов соответствует уровню компетенции, идиостилю и другим особенностям ВЛ. Лексические поля и пространства смыслов каждой из ВЛ дополняют друг друга.

В качестве ВЛ ИИ могут рассматриваться тексты МП на основе трансфера и параллельных текстов, онлайн МП, МП на основе примеров, гибридные системы МП, статистические МП, МП контент-

анализа и др. [11]. ВЛ ИИ определяет конкретный механизм обработки текста, формирующий определенный текст с присущими ему характеристиками и следовательно саму ВЛ. Применяя несколько ВЛ к лингвистическому элементу (ЛЭ), репрезентирующему языковую форму от слова до текста включительно, по результатам МП выбирается лучшая комбинация ВЛ, использующая сильные и компенсирующая слабые их стороны [12], проявляющаяся в продуцируемых ПТ, специфике создаваемых ими уровней языка.

Модель СП строится в феноменологическом пространстве ВЛ, где ИИ вместе с ЕИ участвуют в трансформации и продуцировании знания. Когнитивные модели СП образуются для определенных ВЛ или их сочетаний, актуализация которых осуществляется использованием формализованных сценариев СП в ИИ. ПТ делится на равные по объему смыслы, например, по объему понятий, но разные по размеру фрагменты, либо наоборот на равные по размеру фрагменты с разными объемами понятий, где в общем случае ВЛ ИИ:

= V: = и и 7СТ и В этом смысле ПТ - множество, состоящее из всех тех лингвистических элементов, которые принадлежат хотя бы одному из множеств фрагментов текста. Среди фрагментов ПТ (Т2) существуют фрагменты, полученные в результате совместной деятельности различных ВЛ, то есть, принадлежащие ЕИ и ИИ: Т2 = 7НИ п Уът. Фрагменты, образованные ИИ,

представляют множество фрагментов 1/Ш[, не содержащихся в кни: ТД ''е;: = 'Т = 11 '' ■'=;:). ПТ - универсальное множество, а

все рассмотренные множества являются его подмножествами. Фрагменты ПТ, не принадлежащие какой-либо ВЛ, но принадлежащие ПТ, имеют вид дополнения множества ВЛ: БЛ =ПГ\В. Трансформацией подстрочных и надстрочных знаков в тензорные индексы выражения сводятся к полностью формализованным моделям СП. В СП по составу когнитивных структур и компетенции просматриваются, как минимум, три разные области ЕИ, обеспечивающие соответствующие интеракции: у1г = и ух и У2.

Это компетенции: У0 - естественного перевода текста в электронной форме, 14 - управления ВЛ ИИ и 1/2 - осмысления и редактирования

ПТ МП. Из выражения для общих когнитивных усилий СП ^кгн - ^ем + ит, следует объем когниций ЕИ в виде разности

ит = ^кпЛ^ии и соответствующее время перевода ГЕИ = Гкг:1 Тш,

когда часть когниций ЕИ становится избыточной по сравнению с естественным переводом и заменяется процедурными знаниями ИИ. В общей модели оптимизации СП (рис. 1) вл отражает ЕИ,

ВЛ У22 ~ ИИ различных видов, У12,\2_, ~ интеракции ЕИ и ИИ.

Таблица

Матрица интеракций СП

j = 1 j = 2

i = 1 Когнитивная обработка ЛЭ Вербальное управление искусственным интеллектом

i = 2 Коррекция ПТ Машинная обработка ЛЭ

В интеракции У12 ВЛ Уг1 ЕИ через вербальные сообщения ВЛ получает ИТ и представление - образ ИИ, на основе которых и собственной цели вырабатывает управляющий текст для У22. В интеракциях у?21 п0 мере получения ПТ от У22 в форме вербальных сообщений Уп вносит формальные и смысловые изменения и посылает откорректированный ПТ в виде сообщения обратно У22, либо включается в интеракции У12 сообщениями о настройке У22 или

замене ее на другую ВЛ. Вопрос оптимизации решается в интеракциях У12-У21, т.е. посредством управления ВЛ У22 и коррекцией

ВЛ Уп текста МП, соответственно. Обычно предпочтительнее оптимально управлять СП в интеракциях У12, чем корректировать интеракциями у21 несоответствия в ПТ, так как обработка текста ВЛ ИИ в интеракциях у21 когнитивно осложнена и связана с несколькими уровнями понимания, синтезом текста и его последующей стилистической обработкой.

Преобразованию матрицы соответствует ряд когнитивно-коммуникационных операций и стратегий перевода. Транспонирование матрицы равносильно изменению направления перевода (коммуникации) на обратный (рис. 1, рис. 2). Диагональная матрица V-!) _ и), (рис. 3) соответствует раздельному независимому

переводу ЕИ (естественный перевод) (У22 - 0} и ИИ (МП) (уГ1 - 0}

при отсутствии интеракций между ЕИ и ИИ. Модель перевода ИИ \:22.часто используется для определения тематики, и получения

первого представления о смысловой картине текста. Верхняя треугольная матрица с элементами У22 (Уа1 ~~ 0)-отражает модель СП (рис. 4), с настройкой (У12) МП без этапа постредактирования ПТ (\г?: = 0), используемую для первоначального осмысления части текста, попытки интерпретации общего замысла (подразумевается наличие тематики текста, соответствующих словарей и баз данных).

VII — ^12

^21 <1 1

VII 1 V21 £

Vl2 ^ 1

VII

VII

VII Vl2

V22

Рис. 1 Рис. 2 Рис. 3 Рис. 4

Нечеткое время обработки /с-го лингвистического элемента [5] (значения /, у см. таблицу) представляет проекции в темпоральное пространство. Запись соответствует тензорно-матричной модели системы СП и позволяет суммировать по к накопленные затраты времени на отдельных позициях СП. Максимальное время перевода средних и больших по объему текстов типично для стратегий ЕИ: У±1 (У22 - 0), (рис. 3), минимальное для ИИ: У22 (Уи - 0).

В модели СП (рис. 4), имеющей интеракции начальной настройки (у12) МП, но не содержащей постредактирования (У21),время

интеракций, удовлетворяет неравенству: ги < г.12 для полной матрицы СП (рис. 1). Соотношения времен актуализации ВЛ, как правило, удовлетворяют неравенствам: ¿22 < ь12 < ь21 < где времена:

¿22 - естественного перевода, с_2 - вербальной настройки ИИ, 121 -

постредактирования, гг - МП.

В общей модели оптимизации СП (рис. 1) соотношения между когнитивными усилиями ЕИ и ресурсами ИИ качественно различны. Время ¿Х1 когнитивной обработки ЕИ лингвистическогоу'-го элемента

в большинстве случае значительно больше времен /:22 его МП (^и « и-}), а время совместной обработки элемента текста целиком определяется временем когниции ЕИ: (11г - ¿22.)^ = ^и'^ чт0 приводит к увеличению времени перевода, и существенной ментальной загруженности ЕИ (рис. 5). Для оптимизации СП необходимо снижать когнитивные усилия интерпретации текста 1/21, а также когнитивные усилия У12 общения с ИИ, что достигается, в частности,

упрощением интерфейса [5] с использованием визуальных возможностей объектно-ориентированного программирования.

ВЛ у22 с инструментами «электронных переводчиков» текстов,

на основе морфологического, синтаксического и семантического анализа ИТ и синтеза ПТ, в случае недостаточно тщательной подготовки ИИ к переводу требует значительных затрат ресурсов и высокой квалификации переводчиков при постредактировании. В этом случае интеракции у12 управления СП для повторяющихся морфологических конструкций и синтаксических структур текста используют регулярные выражения, препроцессоры, настраиваемые правила, опции резервации.

П родолж итель н ости естественного и СП /

совпадают у'

Превы шение времени естественного перевода над временем СП

/

Превы шение времени СП над временем естественного перевода

- Продолжительность естественного

перевода

- Время управления ИИ

Соотношение когниций

1

ЕИ и ИИ

О

П

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Рис. 5. Темпоральные соотношения естественного и смешанного перевода (п0 - количество лингвистических элементов, время естественного перевода которых соответствует времени СП)

Выделению смысловых кластеров в интеракциях группирующихся вокруг смысловых вех - ключевых концептов соответствует разделение текста на сегменты с применением функций сегментации. Интеракции У21, например, используются, в случае неудачного буквального перевода фразеологической единицы (ФЕ), когда возникает нарушение смысловой связанности предложения, фрагмента текста, мотива, контекста, нарушение правильности синтаксиса и стиля. Некорректный перевод ФЕ резко контрастирует с фоновыми знаниями описываемой ситуации, что свидетельствует о вероятном присутствия в тексте перевода ФЕ. Такие места ПТ идентифицируются компетенцией переводчика или программами проверки синтаксиса и стиля. В этом случае ВЛ \г£2, используя исходный

текст, осуществляет разбор предложения, проверяя каждую словарную единицу на фразеологическую сочетаемость с другими словарными единицами предложения по базе фразеологических словарей или корпусов текстов. В случае полного совпадения с существующей ФЕ осуществляется МП, в случае неполного или полного несовпадения решение вопроса предлагается У22 ЕИ [3].

В СП понятие глобальной макроструктуры - темы, центральное в семантике и прагматике дискурса, репрезентируется тематикой документа МП - набором изменяемых и сохраняемых лингвистических параметров, используемых при СП текстов определенной предметной области. К параметрам тематики относятся список ключевых слов, и шаблон тематики. Ключевые слова выявляют пропозиции, когнитивные единицы хранения информации. Шаблон тематики определяет список лексических словарей, зарезервированных слов, препроцессоров и баз знаний. Назначенные словари, как правило, образованы определяемыми семантически замкнутыми классами слов, что неизбежно допускает грубейшие семантические ошибки, поскольку близкие в семантических полях слова часто соответствуют отдельным фреймам. Так как ИИ не обладает мощной интерпретационной системой ЕИ, позволяющей имплицитно представлять значения и расположение языковых знаков понятийного поля для синтеза недостающих частей текста, необходимо использование лексических фреймов [8], частично представляемых изменяемыми пользовательскими словарями.

Интеракции \\2 и У21 целесообразно использовать для имитационного моделирования (вероятностного прогнозирования) с параллельной настройкой системы МП для учета возможных вариантов развития МП и подготовки соответствующих реакций ИИ. Внося в пользовательский словарь изменения, и подключая его к переводу в нужной тематике в интеракциях у12, можно исследовать

влияние этих изменений на ПТ в интеракции У21. Моделирование

проверки качества ПТ иногда осуществляется двойным - прямым и обратным переводом (рис. 1, рис. 2). Получение копии ИТ, при определенных допущениях часто свидетельствует о приемлемости соответствия ИТ и ПТ.

Таким образом, когнитивные модели СП отражают феноменологическое пространство речемыслительной переводческой деятельности с использованием ИИ, требуя при этом четкого представления виртуальных составляющих СП и рационального их использования.

Список литературы

1. Данюшина Ю.В. Коммуникативно-когнитивные аспекты моделирования дискурса. Вестник ЛГУ. - № 1. Т. 5, филология. - СПб., 2010. - С. 111-117.

2. Котельникова Е.В. Когнитивные аспекты смешанного перевода научно-инновационного текста / Татищевские чтения: Актуальные проблемы науки и практики // Материалы VII Международной научно-практической конференции. Тольятти, 2010. - С. 182-188.

3. Котельникова Е.В. Когнитивные сценарии смешанного перевода текста с фразеологизмами / Фразеологические чтения памяти профессора В.А.Лебединской. К 70-летию со дня рождения // Международная научная конференция. Вып. 5 / отв. ред. Н.Б. Усаченко. - Курган: Изд-во Курганского гос. унта. - 344 с.

4. Котельникова Е.В. Когнитивная модель смешанного дискурсивного перевода / Модернизация современного общества: проблемы, пути решения // Материалы I Международной научно-практической конференции. В двух частях (часть 2) - Ставрополь: Центр научного знания «Логос». 2011. - С. 95-99.

5. Котельникова Е.В. Когнитивная оценка оптимизации смешанного перевода. Вестник ЛГУ, № 1, т. 7, филология. - СПб., 2011. - С. 59-72.

6. Кубрякова Е.С. Язык и знание. На пути получения знаний о языке. Части речи с когнитивной точки зрения. Роль языка в познании мира / Рос. академия наук. Ин-т языкознания. - М.: Языки славянской культуры. 2004. - 560 с.

7. Макаров М.Л. Основы теории дискурса. - М.: ИТДТК «Гнозис», 2003. -280 с.

8. Филлмор Ч. Фреймы и семантика понимания // Новое в зарубежной лингвистике. Вып.23. Когнитивные аспекты языка. - М.: Прогресс, 1988. - С. 52-92.

9. Ревзина О. Язык и дискурс // Вестник МГУ. Сер. 9. Филология. - М., 1999. - № 1. - С. 25-33.

10.Хоружий С. Род или недород? Заметки к онтологии виртуальности [Электронный ресурс]:http://elenakosilova.narod.ru/studia/chor.htm (дата обращения 12.08.11).

11. Harold Somers. Overview of major MT technologies, problems and solutions. Intensive school on machine translation. Chelyabinsk, SUSU, Russia - 16-20 May 2011. [Электронный ресурс]: http://www.mtschool-susu.info/programme.asp (дата обращения 12.08.11).

12. Robert Frederking. System combination approaches for Multi-Engine MT. Intensive school on machine translation. Chelyabinsk, SUSU, Russia - 16-20 May 2011. [Электронный ресурс]: http://www.mtschool-susu.info/programme.asp (дата обращения 12.08.11).

i Надоели баннеры? Вы всегда можете отключить рекламу.