#
Russian Journal of Linguistics Вестник РУДН. Серия: ЛИНГВИСТИКА
2019 Vol. 23 No. 2 544—561
http://journals.rudn.ru/linguistics
DOI: 10.22363/2312-9182-2019-23-2-544-561
Working on Сomputer-Assisted Translation platforms: New advantages and new mistakes
Irina Ovchinnikova
Haifa University
199 Aba Khoushi Avenue, Mount Carmel, Haifa, 34978838, Israel First Moscow State Medical University, 8, b. 2, Trubetskaya str., Moscow, 119991, Russia
Abstract
The paper presents analysis of errors in translation on the CAT platform Smartcat, which accumulates all tools for computer-assisted translation (CAT) including a machine translation (MT) system and translation memory (TM). The research is conducted on the material of the translation on Smartcat platform (a joint project of a tourist guide translation (35,000 words) from Hebrew to Russian, English, and French). The errors on the CAT platform disclose difficulties in mastering text semantic coherence and stylistic features. The influence of English as lingua franca appears in peculiar orthographic and punctuation errors in the target text in Russian. Peculiar errors in translation on the CAT platform reveal the necessity of advanced technological competence in translators. The peculiar errors uncover problems associated with a source text segmentation into sentences. The segmentation can trigger a translator to preserve the sentence boundaries and use a Russian complicated compound sentence that provoke punctuation errors. Difficulties of the anaphora resolution in distant semantically coherent segments are also associated with the source text segmentation and working window formatting. A joint project presupposes different translators to translate different files of the source document. To generate the coherence, contiguity and integrity of the whole document, the files have to be revised by a third-party editor to avoid conflict of interest. The editor-reviser is also responsible for improving the target text pragmatic and genre characteristics while applying top-down strategy to target text analysis. Thus, the translator's errors while applying CAT tools reveal the effect of bottom-up text processing alongside with cross-language interference.
Keywords: CAT platform, text segmentation, translator's errors, cross-language interference For citation:
Ovchinnikova, Irina (2019). Working on Сomputer-Assisted Translation platforms: New advantages and new mistakes. Russian Journal of Linguistics, 23 (2), 544—561. doi: 10.22363/2312-9182-201923-2-544-561.
Использование компьютерных переводческих инструментов: новые возможности, новые ошибки
И.Г. Овчинникова
Хайфский университет 199 Aba Khoushi Avenue, Mount Carmel, Haifa, 34978838, Israel Первый Московский государственный медицинский университет ул. Трубецкая, д. 8, стр. 2, Москва, 119991, Россия
Аннотация
В статье обсуждаются причины переводческих ошибок на CAT платформе, позволяющей выполнять весь цикл работ, необходимых для перевода документов и доставки готового материала заказчику. Материал работы представляет собой завершенный проект перевода путеводителя (объемом
около 35 000 слов) с иврита на русский, английский и французский языки коллективом переводчиков, работавших на платформе Smartcat. Smartcat открывает пользователям доступ к машинному переводу, переводческой памяти, тезаурусам и пр. Ошибки перевода с иврита на русский язык выявили трудности в передаче семантической связности в рамках целого текста, придании ему стилевого единства и целостности. Частотность специфических орфографических и пунктуационных ошибок в тексте на русском языке во многом обусловлена влиянием английского языка как средства управления платформой и коммуникации между участниками проекта. Специфические ошибки перевода отражают как необходимость владения технологиями, так и доминирование анализа текста «снизу вверх» (от содержания единицы перевода, равной предложению, к смыслу целого текста). Ряд пунктуационных ошибок в тексте перевода обусловлен стремлением переводчика сохранить границы предложения исходного текста, приведенного в ячейке рабочей таблицы CAT платформы. Ошибки в разрешении анафоры отчасти предопределены форматированием рабочего окна, ограничивающего видимую часть исходного и переведенного текста (переводчик нередко ошибается в определении местоименной замены, полагаясь на память). Поскольку при работе с крупными проектами над разделами исходного документа работают разные переводчики, полный текст перевода нуждается в детальном редактировании независимым специалистом, анализирующим текст «сверху вниз» и восстанавливающим семантическую связность, придающим цельность и стилевое единство документу в целом. Таким образом, специфические ошибки в тексте перевода, возникающие в ходе работы на CAT платформе, отражают влияние навязанного интерфейсом восприятия текста, приводящего к доминированию стратегии «снизу вверх» при его смысловой обработке, и межъязыковую интерференцию с lingua franca.
Ключевые слова: платформа CAT, ошибки переводчиков, сегментированный текст, межъязыковая интерференция
Для цитирования:
Овчинникова И.Г. Использование компьютерных переводческих инструментов: новые возможности, новые ошибки // Вестник Российского университета дружбы народов. Серия: Лингвистика = Russian Journal of Linguistics. 2019. Т. 23. No 2. С. 544—561. doi: 10.22363/2312-91822019-23-2-544-561.
1. ВВЕДЕНИЕ
1.1. Особенности переводческой деятельности в условиях широкого распространения компьютерных инструментов для письменного перевода
Условия переводческой деятельности заметно изменились с появлением компьютерных инструментов для письменного перевода, благодаря которым переводчики получили доступ к параллельным корпусам текстов, словарям и тезаурусам, различным системам машинного перевода и совместно используемой машинной памяти на одной платформе.
Перевод при помощи компьютерных инструментов обозначают аббревиатурой CAT (Computer-Assisted Translation / Computer-Aided Translation). Размещение всех переводческих инструментов в открытом доступе на одной облачной платформе, в пределах которой можно организовать весь рабочий цикл — от поиска заказчика или исполнителя до получения оплаты выполненного задания, — упрощает организацию работы, а также технологические аспекты перевода и профессиональной коммуникации. Облачные технологии предназначены прежде всего для удаленной работы. Особенность удаленной работы заключается в невозможности получить быстрый отклик от коллег; обсуждение сложных случаев происходит непосредственно на платформе, что существенно отличается от живой
дискуссии и зачастую приводит к росту тревожности и снижению качества перевода (Sakamoto & Foedisch 2017). Облачные переводческие технологии не помогают определить цель использования переведенного текста в принимающей культуре и выбрать стратегию перевода — наиболее важные переводческие решения всегда принимает человек.
В наши дни переводчик выступает как посредник межкультурной коммуникации, сосредоточенный на передаче коммуникативных намерений и авторской оценки передаваемой информации в тексте на языке перевода в соответствии с принятыми в иной культуре правилами и нормами. Кроме того, переводчик проверяет информацию, представленную в исходном тексте, без чего невозможно передать смысл исходного сообщения на языке перевода: переводчик доставляет сообщение, а не заменяет один языковой код другим (Jakobson 1959: 233). Неслучайно в одной из актуальных теорий перевода Scopos theory во главу угла ставится цель сообщения, которую необходимо транслировать в принимающую культуру в виде текста, функционально равноценного и необязательно лингвистически эквивалентного исходному тексту (Nord 2014). Функциональная равноценность не может быть достигнута средствами CAT; соответствие требованиям принимающей культуры и нормам языка перевода тексту придает переводчик, обладающий лингвистической, культурной и текстовой компетенциями (Латышев, Семенов 2003), а также компетенцией в сфере межличностного и профессионального взаимодействия (European Masters in Translation Competence Framework — 2017: 10—11).
Как справедливо замечает А. Пим, под влиянием обращения к Интернету и применения компьютерных инструментов переводчикам чаще приходится выбирать из предлагаемых вариантов перевода, а не генерировать собственные (Pym 2013: 493). Этот сдвиг не отменяет «классические» требования к работе и профессиональной компетентности переводчика, а добавляет новые задачи, для решения которых необходимы новые знания, умения, навыки. Сдвиг от порождения к отбору готовых вариантов перевода в сущности подразумевает необходимость серьезной работы по редактированию завершенного текста перевода, отстранение от используемого при переводе режима «снизу вверх» и анализ исходного текста в режиме «сверху вниз», чтобы понять смысловую структуру текста и роль каждого из ее компонентов в достижении поставленной автором коммуникативной цели (Robin 2016).
С точки зрения анализа текста «сверху вниз» особую важность приобретают такие параметры текста, как цельность/целостность и завершенность.
Цельность речевого сообщения говорящий/пишущий считает главной характеристикой, квинтэссенцией субъективного видения мира, сохранной при перифразе, пересказе, компрессии до набора ключевых слов (Сахарный 1991: 222— 223). Цельность характеризует смысл текста посредством дистантных семантических связей (Леонтьев 1976); смысл вмещает авторскую оценку денотативного содержания и осознается при прочтении целого текста (Новиков 1999). Для детального смыслового анализа исходного текста и построения ментальной модели смысла переведенного текста инструменты CAT непригодны, поскольку нацелены на формально-семантическую обработку языкового материала и поиска соответ-
ствий в контактирующих языках. Таким образом, редактирование завершенного текста перевода представляет собой оценку адекватности выбора языковых средств целостной смысловой структуре текста, направленного на решение определенной коммуникативной задачи в принимающей культуре.
Важным требованием к профессиональному переводчику во втором десятилетии XXI века становится свободное владение английским языком как lingua franca межкультурной коммуникации. Для полноценной работы на CAT платформе, поиска и извлечения информации из Интернета необходимо свободное владение литературным английским языком: 54% из 10 млн наиболее посещаемых сайтов поставляют информацию на английском языке1. Значимость английского языка для профессиональной переводческой деятельности отражена в образовательных стандартах Евросоюза (European Masters in Translation Competence Framework — 2017: 2). В сущности, переводческая деятельность предполагает трилингвизм: помимо английского, большинство переводчиков в состоянии работать еще на двух языках, обеспечивая профессиональное общение в транснациональных корпорациях (Feely & Harzing 2003).
Таким образом, повсеместное использование CAT платформ привело к таким последствиям в профессиональной деятельности переводчиков:
— переориентация переводческой деятельности с индивидуальных проектов на удаленную работу в коллективных проектах в составе поликультурных профессиональных групп;
— смещение акцента в речемыслительной деятельности переводчика с поиска эквивалента в языке перевода на отбор и оценку готовых вариантов, на редактирование целого переведенного текста;
— востребованность когнитивной стратегии обработки языкового материала «сверху вниз» в сочетании с пристальным вниманием к деталям для обеспечения целостности текста на языке перевода;
— владение как минимум тремя языками (включая английский язык) на уровне, необходимом для обеспечения межкультурной профессиональной коммуникации.
Очевидно, развитие пригодных для перевода информационно-коммуникационных технологий, освободив переводчиков от черновой работы, позволяет использовать время и когнитивные ресурсы на решение более важных и сложных задач, связанных с обеспечением успешной межкультурной коммуникации посредством письменных текстов.
1.2. Задачи, материал и методы исследования
Обращение к CAT в повседневной переводческой практике выявило, помимо несомненных достоинств, существенные проблемы в использовании инструментов, которые приводят к появлению нового типа переводческих ошибок. В настоящей работе проанализированы ошибки перевода на платформе Smartcat2. Материал исследования составляет завершенный проект перевода с иврита на русский язык путеводителя «Ашдод», выполненный на платформе Smartcat профессиональными
1 https://w3techs.com/technologies/history_overview/content_language Last accessed 07.02.2019.
2 Smartcat Platform Inc. 2019 https://www.smartcat.ai/.
переводчиками в условиях удаленной работы. Исходный текст на иврите состоит из девяти глав и насчитывает примерно 35 000 словоупотреблений3. Текст перевода отредактирован, однако предусмотрена окончательная редакция, которую выполнит один из профессиональных израильских русскоязычных журналистов.
Для того чтобы установить причины появления новых ошибок в тексте перевода и выявить специфику переводческих ошибок при CAT, мы опишем особенности работы и кратко охарактеризуем Smartcat. Далее мы обсудим типы допущенных переводчиками отклонений от языковой нормы и разъясним наиболее вероятные причины их появления.
1.3. Краткая характеристика инструментов Smartcat
Работа на платформе предполагает сегментацию исходного текста по формальным основаниям: большие тексты, состоящие из глав, разделяются на файлы (по одной главе в каждом файле); в свою очередь, каждый файл помещается на платформе как последовательность предложений («от точки до точки»), по одному предложению в ячейке рабочей таблицы. Сегменты исходного текста приводятся в левой колонке таблицы; переводчику остается ввести перевод сегмента в правую колонку, сохраняя разметку исходного текста (на нее указывают цифры внутри оранжевых многогранников: см. рис. 1). Дизайн платформы отводит центральную часть экрана под рабочий стол переводчика, располагая управление исходным текстом и текстом перевода (навигация по таблице, поиск слов и выражений, установление фильтров и т.п.) в верхней строке рабочей таблицы. В правой части экрана находится справочный стол с доступом к тезаурусам, переводческой памяти и поиску по конкордансу. Нижняя часть экрана отведена коммуникации с коллегами. В процессе перевода можно использовать переводческую память, тезаурусы, создавать собственный словарь, искать повторяющиеся фрагменты текста в других ячейках таблицы файла (как на исходном языке, так и на языке перевода), а также обсуждать неоднозначные пассажи исходного текста с другими участниками проекта. В нижней части рис. 1 можно прочесть часть диалога между переводчиками, работавшими над проектом.
Рис. 1. Рабочее окно платформы Smartcat
3 Проект включал перевод с иврита на русский, английский и французский языки. Переводчики, принимавшие участие в проекте, помогали друг другу в поиске информации и проверке приведенных исторических данных.
Все предложенные варианты перевода сегмента сохраняются и остаются доступными до окончания работы над проектом благодаря опции Revision, однако в переводческую память Smartcat (пример справа от таблицы с сегментом исходного текста и его переводом на рис. 1) попадает только окончательный вариант. Вверху экрана высветилась строка с запретом дальнейшего редактирования текста перевода на платформе, поскольку данный вариант уже одобрен проектным менеджером и предназначен для выгрузки с платформы и окончательного редактирования профессиональным журналистом.
Для редактирования полного текста документа предусмотрена опция «Загрузить документ» (направленная вниз стрелочка в верхнем правом углу), позволяющая получить полный текст на языке перевода, который невозможно увидеть на экране компьютера целиком.
2. ХАРАКТЕРИСТИКА ОШИБОК ПРИ ПЕРЕВОДЕ С ИВРИТА НА РУССКИЙ ЯЗЫК НА ПЛАТФОРМЕ SMARTCAT
2.1. Проблема классификации ошибок
Для описания переводческих ошибок необходимо определиться с их классификацией. Принято разграничивать ошибки и переводческие трансформации, обусловленные типологическими различиями между исходным языком и языком перевода; об ошибках говорят в случае неоправданных трансформаций, логических нестыковок и при нарушении норм языка перевода (Бузаджи 2006). Хотя подход к классификации ошибок различен в академической среде и в переводческой практике, можно выделить категории ошибок, не вызывающие возражений ни у теоретиков, ни у практикующих специалистов. Такого рода общепринятая классификация предложена в работе Д.М. Бузаджи и соавторов (Бузаджи et al. 2009). Авторы предлагают разграничивать следующие категории ошибок:
♦ денотативные (искажение денотативного содержания текста, нарушение логики подачи информации),
♦ дискурсивные (искажение жанровых и стилевых особенностей, препятствующее функционированию текста в принимающей культуре),
♦ экспрессивные (искажение авторского отношения к объекту описания),
♦ нарушение нормы и узуса языка перевода.
Именно эту классификацию мы принимаем за основу, отдавая себе отчет в том, что применять ее к описанию ошибок в переводе, выполненном на CAT платформе, можно с некоторыми оговорками и дополнениями, выработанными в корпусной лингвистике для разметки параллельного учебного корпуса (Куни-ловская 2013).
Использование машинного перевода и переводческой памяти предполагает вероятность появления непереведенных сегментов исходного текста; именно такая ошибка оказывается наиболее частотной при машинном переводе (Burchardt et al. 2017). Пример Google translate с пропуском сегмента исходного текста на английский и русский языки показан на рис. 2. Непереведенные сегменты обведены в ячейке с исходным текстом на иврите.
Рис. 2. Google translate: пример с непереведенными сегментами исходного текста
Рис. 3. Яндекс-переводчик: пример буквального перевода исходного текста
Принципиальную возможность буквального машинного перевода любой синтаксической конструкции с иврита на английский и русский языки доказывает Яндекс-переводчик (см. рис. 3).
Пропуск сегментов исходного текста при машинном переводе отличается от ошибки опущения, которую нередко допускают переводчики. Машинные алгоритмы зачастую «не видят» конечные звенья цепочки синтаксических зависимостей и именно их упускают при переводе, не распознают несогласованные определения и не различают существительные и образованные от них прилагательные (Богуславский et al. 2008), в то время как опущение информации при переводе «вручную» обычно не связано с синтаксической позицией сегмента в исходном тексте. Возможность появления непереведенных сегментов при работе на Smartcat не исключена, поскольку платформа предлагает обращение к машинному переводу. Как раз в исходном тексте, приведенном на рис. 2 и 3, переводчик опустил второй из обведенных сегментов, переведенный в Яндекс как которым он управлял. Переводчик объяснил возможность опущения, сославшись на упомянутую ранее в тексте работу героя: менеджер гаража «Тайта-Ралекс»; однако редактор предпочел восстановить опущенную информацию.
Обсуждение данного примера позволяет вскрыть весьма важную особенность машинного перевода и его редактирования, связанную с дискурсивной характеристикой текста. Насколько оправданы смысловые повторы в тексте перевода, приводящие к усложнению синтаксиса? Публицистическому тексту в русской культуре не свойственна синтаксическая сложность.
Таким образом, при анализе переводческих погрешностей на CAT платформах необходимо учитывать специфические для машинного перевода ошибки.
2.2. Общая характеристика ошибок перевода на платформе Smartcat
В целом ошибок в завершенном проекте совсем немного: 410 на текст в 35 000 словоупотреблений. В сегментах, переведенных с ошибками, содержится около 1000 слов, что составляет около 3% всех словоупотреблений исходного текста. Например, сегмент исходного текста из 20 слов, приведенный на рис. 2 и 3, в Google translate переведен с четырьмя ошибками: неверный порядок слов и три непереведенных фрагмента.
Начнем с общего обсуждения ошибок различных типов, а в следующем разделе перейдем к подробному качественному анализу наиболее типичных специфических ошибок. Распределение ошибок по типам приведено в диаграмме на рис. 4. В исследуемом материале обнаружены денотативные и дискурсивные ошибки, а также нарушения норм и узуса языка перевода. Денотативных ошибок совсем немного (их доля не превышает 1%); допущенные переводчиком денотативные ошибки была замечены и исправлены редактором. Меж тем порой именно редакторская правка привносит ошибки в текст перевода. Обсудим пример допущенной редактором денотативной ошибки, в которой опущение информации приводит к нарушению узуса языка принимающей культуры:
(1) .ПУЗЛ таз П'тп^Ю птаап 'з^г nmfr пшз лпзо TIW Т^УП стрш
Исследователи приводят два возможных варианта жителей крепости, руины которой находятся на холме.
В исходном сегменте речь идет о двух теориях, объясняющих, кем были обитатели крепости, руины которой расположены на холме. Переводчик предлагал едва ли не более точный вариант: Исследователи приводят две теории, объясняющие природу человеческих останков в крепости, руины которой расположены на холме. Редактор, пытаясь исправить вольность лексического выбора (останки вместо обитатели/жители), добавил в перевод ошибку лексической сочетаемости и упустил важную информацию.
Наиболее часто встречаются дискурсивные ошибки, доля которых составляет 40% от всего количества ошибок (см. диаграмму распределения ошибок на рис. 4).
■ 1 12 13 14 ■ 5 16 ■ 7
Рис. 4. Распределение ошибок в переводе с иврита на русский язык на платформе Smartcat:
1 — орфографические (18%), 2 — пунктуационные (18%), 3 — грамматические (9%), 4 — дискурсивные (40%), 5 — лексические (14%), 6 — неточная передача информации (0,9%), 7 — добавление информации (0,1%)
Заметим, что подобные ошибки отнюдь не редки даже в художественном переводе (Ермолович 2013). Среди дискурсивных ошибок заметны стилистические: переводчик неоправданно переключается с одного стиля на другой. Смешение стилей, зачастую в рамках одного предложения, приводит к нарушению стилистических норм русского языка.
Рассмотрим один из наиболее ярких примеров дискурсивной ошибки:
(2) 7пю -yarn п'-опап лттиирз п'а'©-а awn пу ,л'аж^а'31 л'аж^ иап© ла^уа
Шахматная держава, национальная и международная, прославившаяся достижениями как в юношеской, так и и во взрослой категориях.
В исходном тексте говорится о городе Ашдод как о мощном государстве (сверхдержаве, сверхмощи) шахмат; номинативное предложение начинается с общеупотребительного в иврите сочетания, которое используется по отношению к странам и городам (Ашдоду, Ришону ле-Циону, Ашкелону). В русской культуре использование сочетания шахматная держава по отношению к городу ассоциируется с героем романа «12 стульев» Остапом Бендером и его планом развития городка Нью Васюки, что придает тексту перевода нежелательный иронический оттенок. Помимо невольной интертекстуальности в приведенном варианте перевода допущено смешение книжного стиля (держава) с официальным (юношеская и взрослая категории), употреблена разговорная частица таки, нарушены правила семантической сочетаемости (держава не может быть международной).
Лексические и грамматические ошибки регулярно встречаются в речи билингвов и, к сожалению, обычны для перевода (Дебренн 2006: 135). Обращение к CAT несколько снижает их частотность благодаря возможности использовать словари и переводческую память. Когда переводчик ошибается в выборе слов ограниченной сочетаемости, в тексте на русском языке появляются выражения инаугурация моста и имена рек и гор:
(3) .рхз cmni ст^га па© ^у ж-рз,п'уз©п ли© у^ахз npm© ,х"' узп лтпп Улицы района Йуд-Алеф, основанного в середине семидесятых, названы именами рек и гор Израиля.
Грамматические ошибки совпадают с отступлениями от норм русской грамматики, встречающимися в аутентичных текстах на русском языке: отступление от норм в спонтанной устной речи и на письме описано в антропоцентрической грамматике русского языка (Русакова 2013). Переводчики ошибаются при склонении числительных, оформлении синтаксической зависимости в обособленных оборотах и конструкциях с последовательным подчинением, используют деепричастный оборот в безличном предложении, как в приведенном ниже примере:
(4) ,пз'п П1пп ,пат ^тиз т©ап^ Г^ата рлхзз '1^'зп тлз
.п'^ П1п^> 'ау-'а грп гз лплаз©
Проведя время в парке, рекомендуется продолжить прогулку в южном направлении по прекрасной прогулочной дороге, ведущей от пляжа «Мей-Ами» к пляжу «Лидо».
Неожиданно высокой для перевода с использованием компьютерных инструментов оказывается доля орфографических и пунктуационных ошибок. Она
заметно выше зафиксированной для различных систем машинного перевода (Aranberri et al. 2016) и переводческой памяти (Barbu et al. 2016: 160). Чтобы определить категории орфографических и пунктуационных ошибок, необходим их детальный анализ.
2.3. Анализ орфографических и пунктуационных ошибок в тексте перевода, выполненного на платформе Smartcat
Представим все разнообразие орфографических ошибок, допущенных при переводе с использованием компьютерных инструментов на платформе Smartcat, в таблице 1. В последней колонке таблицы приведены наиболее простые объяснения для каждой категории ошибок.
Более чем три четверти орфографических ошибок обусловлены особенностями работы на CAT платформе. Основными причинами ошибок оказываются: недостаточная технологическая компетенция, не позволяющая переводчикам настроить словарь и проверку правописания необходимым образом; неуверенность в применении правил орфографии языка перевода; недостаточно развитая рефлексия, помешавшая отследить межязыковую интерференцию.
Похожими причинами вызваны пунктуационные ошибки. Примеры неверной расстановки запятых можно обнаружить в тексте перевода, приведенном на скриншоте (см. рис. 1). Под влиянием правил пунктуации английского языка переводчики и редакторы допускают такие отклонения от норм расстановки знаков препинания в русском языке:
♦ выделяют запятыми дополнения и обстоятельства в начале предложения:
(5) Ежегодно, накануне Дня независимости, в центре «Монарт» проводится торжественная церемония вручения награды мэра города «Золотая кисть» для продвижения искусства в обществе;
♦ используют двоеточие вместо тире в бессоюзном предложении:
(6) С окончанием первого крестового похода в 1099 крепость снова была заселена: на этот раз крестоносцами;
♦ опускают знаки препинания перед союзами в сложных предложениях:
(7) В те же годы был быстро отстроен в восточной части города и район Вав (6) чтобы принять большие волны репатриантов.
Специфические пометы для форматирования исходного текста, которые следует копировать в текст перевода, порой мешают переводчикам определить верную позицию для расстановки знаков препинания в трансляте. Наконец, сложность и неоднозначность некоторых правил русской пунктуации приводит к ошибкам в обособлении различных оборотов и вводных слов, пренебрежением правилами использования точки с запятой. Особо отметим ошибки, возникающие при редактировании текста перевода: редактор, поправляя одну часть предложения на языке перевода, упускает из виду необходимость проверить правильность расстановки знаков препинания в новом варианте переведенного предложения, тем самым невольно добавляя новые ошибки.
Таблица 1
Орфографические ошибки в тексте перевода и их объяснение
Описание ошибки Доля (в % к общему кол-ву орфогр. ошибок) Пример Вероятная причина Объяснение
Неоправданное употребление прописных букв 59% Война за Независимость Израиля Интерференция с правилами использования прописных букв в английском языке: Israel's War of Independence В иврите нет противопоставления прописных и строчных букв. Нормы употребления прописных букв в русском языке не так просты, как кажется на первый взгляд, особенно при написании названий событий и организаций, состоящих из нескольких слов. В английском языке прописные буквы пишутся во всех словах, входящих в номинации событий, организаций и пр. Вероятно, переводчик ошибается в употреблении прописных букв под влиянием английского языка, который участники проекта используют для общения на Smartcat и организации работы на платформе.
Отсутствие пробела между словами 27% в конце шестидесятых годов Наличие помет, указывающих на необходимое форматирование текста в исходном сегменте на иврите, маскирующих пробел между словами (пометы следует копировать в текст перевода) Ошибки встречаются из-за специфических помет для форматирования текста на платформе (вид отформатированного текста на выходе не соответствует тому, что переводчик видит на экране)
Ошибка в правописании слова 11% На территории центра действуют городская консерватория «Акадама», балетная школа и студия танца, местные ансамбли исполнителей и городские оркестры, а так же великолепный музеей искусств, известный по всей стране и за рубежом. Сложные правила русской орфографии подразумевают различное написание омонимичных наречиям частиц, союзов и существительных с предлогами Переводчики и редакторы нередко ошибаются в применении сложных правил русской орфографии, отражающих морфологический принцип. В частности, они ошиблись в определении части речи выделенного слова так же, написав его по правилам, регулирующим правописание омонимичного союзу также наречия так с частицей же. Подобные ошибки нередко встречаются в непереводных текстах, особенно в компьютерно-опосредованной коммуникации
Erratum in compound 3% Ультра-ортодоксальный Ошибки и описки в редких словах и терминах Ошибки в написании слов, подчиняющихся традиционному принципу русской орфографии
На наш взгляд, обилие пунктуационных ошибок отчасти спровоцировано сегментацией исходного текста для работы на платформе. В ячейку таблицы вводится одно предложение от точки до точки. Переводчики попадают под влияние тенденции сохранять границы предложения на языке перевода, пытаясь передать более компактную синтаксическую конструкцию иврита нагромождением обособленных оборотов в сложноподчиненном или сложносочиненном предложении. В таких случаях вполне уместна синтаксическая трансформация, позволяющая передать содержание исходного сегмента несколькими предложениями.
Таким образом, высокая доля орфографических и пунктуационных ошибок в тексте перевода обусловлена прежде всего человеческим фактором. Причем речь идет не столько о недостаточной компетентности переводчиков и редакторов, сколько о психологических проблемах работы с компьютерными программами, в том числе связанных с особенностями восприятия текста на рабочем столе CAT платформы. Облегчая определение единицы перевода за счет сегментации исходного текста, упрощая поиск эквивалентов благодаря наличию машинного перевода и накоплению переводческой памяти, компьютерные переводческие инструменты требуют совершения дополнительных операций — отслеживания помет форматирования текста, соединения предложенных переводческой памятью фрагментов в связное предложение, загрузки файла переведенного текста для его редактирования и т.п. Ошибки, возникающие под влиянием необходимости выполнять дополнительные операции, стоит рассмотреть особо.
3. ОБСУЖДЕНИЕ СПЕЦИФИЧЕСКИХ ОШИБОК ПЕРЕВОДА, ОБУСЛОВЛЕННЫХ РАБОТОЙ НА CAT ПЛАТФОРМЕ
К появлению новых неожиданных ошибок в переводах, выполненных на CAT платформах, приводят два основных фактора: во-первых, относительная технологическая сложность платформы для технически неподготовленного переводчика, требующая разделения внимания и одновременного выполнения различных операций; во-вторых, психологические особенности восприятия текста с экрана компьютера, доминирование стратегии обработки текста «снизу вверх» наряду с необходимостью отслеживать и подавлять межъязыковую интерференцию с английским языком, обеспечивающим доступ к различным функциям платформы, помимо естественной интерференции контактирующих языков.
Технологическая сложность обусловлена не столько объективной сложностью управления функциями поиска и извлечения необходимой информации, использования фильтров или навигации по документу — платформа Smartcat устроена очень рационально и удобна для пользователя, — сколько необходимостью отслеживать множество деталей, одновременно оценивая данные по целому ряду параметров. Выполнение нескольких процедур одновременно в условиях дефицита времени, отведенного на проект, ставит перед профессиональным переводчиком трудновыполнимые задачи и приводит к интерференции различных видов деятельности.
Появлению интерференции способствует невысокий уровень владения видом деятельности — в нашем случае управлением функциями CAT платформы, —
а также режим чередования задач (Созинов и др. 2013). Вероятность интерференции возрастает в случае необходимости быстрой смены решаемых задач, в нашем случае — в результате постоянного переключения с поиска эквивалентов в языке перевода на оценку предлагаемых машинной памятью вариантов, затем на управление платформой.
В частности, необходимое для расстановки знаков препинания произвольное внимание рассеивается из-за требования отслеживать и размещать в тексте перевода пометы, указывающие на форматирование текста. Пометы для форматирования затрудняют восприятие синтаксической структуры предложения на языке перевода, что также чревато пунктуационными ошибками. Примером переводческой неудачи такого рода может служить сегмент текста перевода на рис. 1:
(8) Например выражение «йа-хасра», буквально означает: «как не хватает» («Какая жалость», употребляемое в ностальгическом смысле).
В переводе отсутствует запятая после вводного слова, ошибочно помещенная между подлежащим и сказуемым; предложение перегружено уточняющим оборотом и лишними знаками препинания, неверно используется прописная буква. Отслеживание мелких деталей в процессе работы на платформе усложняет переход к стратегии обработки переведенного фрагмента «сверху вниз», необходимой для оценки семантической целостности, стилистической корректности и правильности синтаксического конструирования предложения на языке перевода.
Кроме того, поэлементность восприятия текста, распределенного по ячейкам, и ограниченное количество сегментов, доступных в рабочем окне одновременно, создают трудности в установлении семантических связей между удаленно расположенными сегментами текста, в том числе и при разрешении анафоры. Так, переводчик ошибается, называя гараж, упомянутый в сегментах на рис. 2 и 3, «Ралекс-Тайота», «Релекс-Тайота» и даже «Ролекс-Тайота» (очевидно, под влиянием ассоциации с известным брендом) в разных частях главы путеводителя, посвященной описанию музеев. Эта ошибка легко устраняется обращением к переводческой памяти, однако переводчик не замечает ошибки и не считает нужным проверять хрематоним в переводческой памяти. Подобным же образом пристань для яхт в порту Ашдода в разных абзацах текста называется «Голубая марина», «Синяя пристань», «Голубая пристань».
Легко устранимые ошибки при переводе хрематонимов оказываются довольно частотными в силу доминирования стратегии «снизу вверх», ограниченного объема рабочей памяти и распределения внимания переводчика между выполнением различных операций на Smartcat. Такого рода ошибки может исправить редактор. Гораздо сложнее выявить и поправить противоречия, возникшие в результате неверно установленных смысловых связей между дистантно расположенными сегментами текста. В нашем материале такие противоречия встретились, в частности, при описании экскурсий, в которых рассказы об одних и тех же местах и событиях на разных маршрутах прогулки по городу пополнялись взаимоисключающими деталями (блуждающие пески превращались в зыбучие). В случае использования редких слов или терминов трудно найти подсказку в переводческой памяти.
Переводческая память активируется при не менее чем пятидесятипроцентном совпадении словарного состава текущего исходного сегмента с уже переведенными, поэтому подсказка не всплывает автоматически в каждом случае употребления термина в исходном тексте. Однако Smartcat предлагает дополнительные функции для поиска различных словосочетаний как в исходном, так и в переведенном тексте. Распределение внимания между различными операциями, установка на решение текущей переводческой задачи и отсутствие целостного представления о документе на исходном языке не оставляют переводчику когнитивных ресурсов для полноценного использования всех возможностей CAT платформы.
При распределении разделов документа между несколькими переводчиками возрастает вероятность ошибок в установлении сквозных семантических связей. Такого рода ошибки исправляет редактор, придавая тексту целостный характер и стилевую завершенность.
В целом перевод на CAT платформах относится к сфере компьютерно-опосредованной коммуникации. В этой сфере сложились собственные нормы и жанры, а ошибки возникают чаще, чем при общении по другим каналам. Типы ошибок в основном совпадают с теми, что характерны для письменной и устной сфер общения; специфической переводческой ошибкой компьютерно-опосредованной коммуникации считают избыточное употребление англицизмов (Jiménez-Crespo 2010). Распространение англицизмов отражает влияние английского языка как lingua franca на всю компьютерно-опосредованную коммуникацию, поскольку английский язык доминирует в сети. С этой точки зрения проявление влияния английского языка на орфографические и пунктуационные ошибки в тексте перевода на русский язык с иврита вполне закономерно.
Специфика восприятия текста с экрана компьютера и его смысловой обработки при использовании CAT инструментов, а также зависимость успешности применения переводческих инструментов от меры владения технологиями хорошо известна специалистам (Zaretskaya et al. 2016).
За программирование последовательности операций в составе сложных действий, таких как алгоритм работы с компьютерными программами или комбинирование языковых единиц при порождении высказывания, ответствен, наряду с другими механизмами психики, синтагматический механизм (Ахутина 2012). В речемыслительной деятельности переводчика действие синтагматического механизма подвержено межъязыковой и внутриязыковой интерференции, в том числе вследствие весьма ограниченного объема оперативной памяти; ошибки, обусловленные сбоем работы синтагматического механизма, встречаются при переводе как на неродной, так и на родной язык переводчика (Овчинникова, Павлова 2016: 166).
Хотя специфика выполнения когнитивных операций при переводе текста на платформе CAT пока не описана, очевидна перегруженность оперативной памяти переводчика многоаспектными задачами, что неизбежно приводит к ошибкам. Вероятно, как раз ощущение истощения способности комбинировать языковые единицы, удерживая в памяти содержание переводимого фрагмента, и боязнь интерференции приводят к нежеланию переводчиков, работающих с инструментами CAT, активно использовать переводческую память (Zaretskaya et al. 2015).
Таким образом, работа на CAT платформе провоцирует ошибки, обусловленные: специфической сферой коммуникации, где распространено влияние английского языка; особенностями дизайна CAT платформ; сочетанием порождения высказывания с комбинированием предлагаемых переводческой памятью вариантов и их оценкой, что требует постоянного переключения со стратегии «снизу вверх» на стратегию «сверху вниз». Новым оказывается не особенный тип ошибок, а смешение известных переводческих промахов с неточностями машинного перевода и ошибками межъязыковой интерференции.
4. ЗАКЛЮЧЕНИЕ
В сущности, технологические и психологические предпосылки возникновения специфических ошибок перевода на CAT платформе так или иначе связаны с новыми компетенциями в области технологии и организации проектной работы в условиях межкультурной коммуникации, необходимыми современному профессиональному переводчику (European Masters in Translation Competence Framework — 2017). С другой стороны, наличие специфических ошибок перевода дает возможность разработчикам программного обеспечения определить проблемные места, увидеть перспективы совершенствования инструментов CAT и пользовательского интерфейса платформы.
Насколько мы можем судить по переводческим ошибкам на CAT платформе, базовые лингвистические и профессиональные компетенции переводчика играют решающую роль, а новые позволяют повысить скорость и эффективность работы. Обучение работе на Smartcat может быть введено в программу подготовки будущих переводчиков (Ivleva, Melekhina 2017). При работе на CAT платформе переводчику необходимо учиться осваивать технологические новшества по ходу работы, владеть навыками поиска и извлечения информации, вырабатывать аналитический когнитивный стиль, который проявляется во внимании к деталям и умении создавать четкие алгоритмы действий и придерживаться их. А. Пим обозначил в качестве наиболее важных способностей современного переводчика способность к самостоятельному освоению нового, способность проверять информацию и способность перерабатывать текст, не упуская из виду подробностей (Pym 2013).
Новые профессиональные требования обусловлены социальными факторами, характерными для текущего состояния межкультурной коммуникации в различных профессиональных сферах:
♦ общепринятой нормой сетевого общения на английском языке;
♦ совместной удаленной работой в многонациональном коллективе;
♦ распространением компьютерно-опосредованной профессиональной коммуникации;
♦ совершенствованием и широким распространением систем машинного перевода и CAT инструментов.
Компьютерные инструменты перевода не могут полностью заменить профессионального переводчика. Их использование позволяет сократить время, необ-
ходимое для работы над крупными проектами. Ключевой фигурой на CAT платформе оказывается переводчик-редактор, способный выбрать подходящие варианты перевода, соотнести содержание переведенного сегмента со смыслом и коммуникативной целью текста на языке перевода.
© И.Г. Овчинникова, 2019
СПИСОК ЛИТЕРАТУРЫ / REFERENCES
Ахутина Т.В. Порождение речи. Нейролингвистический анализ синтаксиса. 4-е изд. М.: Эди-ториал УРСС, 2012. [Ahutina, Tatyana V. (2012). Porozhdenie rechi. Neyrolingvisticheskiy analiz sintaksisa (Speech generating. Neurolinguistic analysis of syntax). 4th edition. Moskva: Editotial URSS (In Russ.)].
Богуславский И.М., Иомдин Л.Л., Валеев Д.Р., Сизов В.Г. Синтаксический анализатор системы ЭТАП и его оценка с помощью глубоко размеченного корпуса русских текстов. Труды Международной конференции «Корпусная лингвистика — 2008». СПб.: Санкт-Петербургский государственный университет, 2008. 56—74. [Boguslavskij, Igor M.; Iomdin, Leonid L.; Valeev, Denis R.; Sizov, Viktor G. (2008). Sintaksicheskiy analizator sistemy ETAP I ego otsenka s pomoshch'yu gluboko razmechennogo korpusa russkih tekstov (Syntax analyzer of the system ETAP and its evaluation by deeply annotated corpus of Russian texts). Trudy Mezhdunarodnoj konferentsii "Korpusnaja lingvistika — 2008". Saint-Petersburg: Saint-Petersburg State University. 56—74 (In Russ.)]. Бузаджи Д.М. Белые нитки. Логические аспекты перевода // Мосты. Журнал переводчиков, 2006, 3 (11), 36—47. [Buzadzhi, Dmitrij M. (2006). Belyje nitki. Logicheskije aspekty perevoda (Obvious to anyone. On logical aspects of translation). Mosty. Zhurnal perevodchikov, 3 (11), 36—47 (In Russ.)]. Бузаджи Д.М., Гусев В.В., Ланчиков В.К., Псурцев Д.В. Новый взгляд на классификацию переводческих ошибок. М.: Всероссийский центр переводов, 2009. [Buzadzhi, Dmitrij M.; Gusev, Vladimir V.; Lanchikov, Viktor K.; Psurtsev, Dmitrij V. (2009). Novyj vzglyad na klassifikatsiju perevodcheskih oshibok (New view on the classification of translation errors). Moskva: Vserossijskij tsentr perevodov (In Russ.)]. Дебренн М. Место межъязыковой девиатологии в общей теории ошибок. Труды международной конференции «Диалог 2006» Vol. 2006, 133—137). [Debrenne, Michele. Mesto mezhjazy-kovoj deviatologii v obschej teorii oshibok (The place of the deviatology in the general theory of speech errors). International Conference "Dialog 2006" Proceedings. Vol. 2006, pp. 133— 137 (In Russ.)].
Ермолович Д.И. Пение без звука: об итогах одного переводческого конкурса // Вестник Российского университета дружбы народов. Серия: Лингвистика. 2015, 1 (2015), 212—229. [Jermolovich, Dmitrij I. Penije bez zvuka: ob itogah odnogo perevodcheskogo konkursa (The logic can't be lost). Russian Journal of Linguistics. 1, 212—229. (In Russ.)].
Куниловская М.А. Классификация переводческих ошибок для создания разметки в учебном параллельном корпусе Russian Learner Translator Corpus. Lingua mobilis, 2013, 1 (40), 141— 159. [Kunilovskaja, Marija A. (2013). Klassifikatsija perevodcheskih oshibok dlya sozdanija razmatki v uchebnom parallelnom korpuse Russian Learner Translator Corpus (Classification of translation errors for annotating parallel Russian Learner Translator Corpus). Lingua mobilis, 1 (40), 141—159. (In Russ.)].
Латышев Л.К., Семенов А.Л. Перевод: теория, практика и методика преподавания. М.: Академия, 2003. [Latyshev L.K.; Semenov A.L. (2003). Perevod: teorija, praktika i metodika prepoda-vaniya (Translation: theory, practice and teaching). Moscow: Akademiya (In Russ.)].
Леонтьев А.А. Признаки связности и цельности текста. Лингвистика текста: Сборник научных трудов МГПИИЯ им. М. Тореза. Вып. 103. М.: МГПИИЯ им. М.Тореза, 1976. 60—70. [Leont'ev, Aleksey A. (1976). Priznaki svyaznosti i tsel'nosti teksta (Features of text coherence and integrity). Lingvistika teksta: Sbornik nauchnyh trudov MGPIIJA im. M. Toreza. Vyp. 103. Moscow: MGPIIJA. 60—70 (In Russ.)].
Новиков А.И. Смысл: семь дихотомических признаков. Теория и практика речевых исследований. М.: МГУ, 1999. 68—82. [Novikov, Anatolij I. (1999). Smysl: sem' dihotomicheskih priznakov (Sense: Seven dichotomous features). Teoriya i praktika rechevyh issledovaniy. Moscow: MGU. 68—82 (In Russ.)].
Овчинникова И.Г., Павлова А.В. Переводческий билингвизм: по материалам ошибок письменного перевода. М.: Флинта-Наука, 2016. Izdatel'stvo "FLINTA", 2016. [Ovchin-nikova, Irina G.; Pavlova, Anna V. (2016). Perevodcheskiy bilingvism: po materialam oshibok pis'mennogo perevoda (Bilingualism of translators (based on errors in text translation)). Moskva: Flinta-Nauka (In Russ.)].
Русакова М.В. Элементы антропоцентрической грамматики русского языка. М.: Языки славянских культур, 2013 [Rusakova, Marina V. (2013). Elementy antropocentricheskoy gramma-tiki russkogo yazyka (Elements of Russian anthropocentric grammar). Moskva: Jazyki slavyanskih kultur (In Russ)].
Сахарный Л.В. Тексты-примитивы и закономерности их порождения. Кубрякова Е.С., Шах-нарович А.М., Сахарный Л.В. Человеческий фактор в языке: язык и порождение речи. М.: Наука, 1991. 221—237. [Saharnyj, Leonid V. Teksty-primitivy i zakonomernosti ih porozhdenija (Incoherent texts and rules of text generating). Kubryakova, Elena S.; Shahna-rovich, Aleksandr M.; Saharnyj, Leonid V. Chelovecheskij factor v jazyke: jazyk i porozh-denije rechi. Moskva: Nauka, 1991. 221—237 (In Russ.)].
Созинов А.А., Крылов А.К., Александров Ю.И. Эффект интерференции в изучении психологических структур. Экспериментальная психология. 2013, 6, 1, 5—47. [Sozinov, Aleksej A.; Krylov, Anrej K.; Aleksandrov, Jurij I. (2013). Effekt interferentsii v izuchenii psychologi-cheskih struktur (Interference effect in the study of psychological structures). Eksperimental'naja psihologija, 6, 1, 5—47 (In Russ.)].
Aranberri, Nora et al. (2016). Tools and Guidelines for Principled Machine Translation Development. In LREC.
Barbu, Eduard et al. (2016). The first automatic translation memory cleaning shared task. Machine Translation, 30 (3—4), 145—166. doi.org/10.1007/s10590-016-9183-x.
Burchardt, Aljoscha et al. (2017). A linguistic evaluation of rule-based, phrase-based, and neural MT engines. The Prague Bulletin of Mathematical Linguistics, 108(1), 159—170. doi: 10.1515/pralin-2017-0017.
European Masters in Translation Competence Framework — 2017. European Commission, EU, 2017. Retrieved from: https:// ec.europa. eu/info/sites/info/files/emt_competence_fWk_2017_en_web .pdf.
Feely, Alan J. et al. (2003). Language management in multinational companies. Cross Cultural Management: An International Journal, 10 (2), 37—52. doi.org/10.1108/13527600310797586.
Ivleva, Marina A. et al. (2017, October). Cloud Platform SmartCAT in Teaching Future Translators. International Conference on Linguistic and Cultural Studies Springer, Cham. 155—160. doi: 10.1007/978-3-319-67843-6_19.
Jakobson, Roman. (1959). On linguistic aspects of translation. On translation, 3, 232—239.
Jiménez-Crespo, Miguel A. (2010). Localization and writing for a new medium: a review of digital style guides. Tradumatica: traducció i tecnologies de la informació i la comunicació, (8), 1—9. Retrieved from: https://www.raco.cat/index.php/Tradumatica/article/viewFile/225904/307315.
Nord, Christiane. (2014). Translating as a purposeful activity: Functionalist approaches explained. Routledge.
Pym, Anthony. (2013). Translation skill-sets in a machine-translation age. Meta: Journal des traducteurs/Meta: Translators' Journal, 58 (3), 487—503. doi:10.7202/1025047ar.
Robin, Edina. (2016). The Translator as Reviser. The Modern Translator and Interpreter. Budapest: ELTE Eôtvôs Kiado, 45—56. Retrieved from: http://www.eltereader.hu/media/2016/04/ HorvathTheModernTranslator.pdf#page=46. Sakamoto, Akiko et al. (2017). No news is good news? Translation Spaces, 6 (2), 333—352. doi.org/10.1075/ts.6.2.08sak.
Zaretskaya Anna et al. (2015). Integration of Machine Translation in CAT tools: State of the art, evaluation and user attitudes. Skase Journal of Translation and Interpretation, 8 (1), 76—89. Retrieved from: http://www.skase.sk/Volumes/JTI09/pdf_doc/04.pdf.
Article history:
Received: 21 December 2018 Revised: 27 February 2019 Accepted: 03 March 2019
История статьи:
Дата поступления в редакцию: 21 декабря 2018 Дата принятия к печати: 03 марта 2019
Сведения об авторе:
ОВЧИННИКОВА ИРИНА ГЕРМАНОВНА — доктор филологических наук, профессор, профессор Института лингвистики и межкультурной коммуникации Первого Московского государственного медицинского университета им. И.М. Сеченова. Сфера научных интересов: психолингвистика, межкультурная коммуникация, компьютерная лингвистика. Контактная информация: e-mail: ira.ovchi@gmail.com
Bionote:
OVCHINNIKOVA IRINA — Ph.D. (Advanced Doctorate), Professor; Professor of The Institute of Linguistics and Cross-cultural Communication at I.M. Sechenov First Moscow State Medical University. Research interests: cognitive linguistics, cross-cultural communication, bilingualism, information retrieval.
Contact information: e-mail: ira.ovchi@gmail.com