Научная статья на тему 'ПОСТРЕДАКТИРОВАНИЕ И ТИПИЧНЫЕ ОШИБКИ В АВТОМАТИЗИРОВАННОМ ПЕРЕВОДЕ НАУЧНО-ПУБЛИЦИСТИЧЕСКИХ ТЕКСТОВ'

ПОСТРЕДАКТИРОВАНИЕ И ТИПИЧНЫЕ ОШИБКИ В АВТОМАТИЗИРОВАННОМ ПЕРЕВОДЕ НАУЧНО-ПУБЛИЦИСТИЧЕСКИХ ТЕКСТОВ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1518
298
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАШИННЫЙ ПЕРЕВОД / ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА / PEMT / НЕЙРОННЫЙ ПЕРЕВОД

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Шевчук Екатерина Владимировна, Никифорова Жанна Александровна

В статье рассматриваются вопросы типизации ошибок, с которыми переводчик сталкивается в процессе постредактирования машинного перевода. Постмашинное редактирование или пост-редактирование, которое обозначается в английском языке аббревиатурой PEMT (post-edited machine translation) или MTPE (machine translation post-editing), на сегодняшний день стало неотъемлемой частью переводческого процесса. Причина этому - повсеместная практика использования машинного перевода. Огромное количество российских и зарубежных переводческих компаний признает и приветствует его использование. Более того, в настоящий момент набирает популярность профессия постредактора, поскольку зачастую заказчик и сам может осуществить машинный перевод, используя сервисы компаний Google, Yandex, Microsoft, Memsource и др., но не обладает достаточной степенью владения иностранным языком для осуществления постредактирования. В данной статье предпринята попытка категоризации типичных ошибок машинного перевода, с которыми может столкнуться постредактор при работе с научно-публицистическими текстами, а также даны рекомендации по сведению подобного рода ошибок к минимуму.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Шевчук Екатерина Владимировна, Никифорова Жанна Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

POST-EDITING AND TYPICAL MISTAKES IN THE COMPUTER-AIDED TRANSLATION OF ACADEMIC, SCIENTIFIC, AND JOURNALISTIC TEXTS

The article deals with typical errors in editing a computer-aided translation (CAT). Post-machine editing or post-editing (PEMT - post-edited machine translation or MTPE - machine translation post-editing) has now become an integral part of the translation process. The reason for this is the widespread practice of using computer-aided translation. A great deal of Russian and foreign translation companies recognize and welcome the use of CAT. Moreover, the job of post-editor is now gaining popularity, since the customer himself can often carry out computer-aided translation using the services of Google, Yandex, Microsoft, Memsource, etc., but does not have a sufficient degree of knowledge of a foreign language to perform post-editing. We have tried to categorize typical machine translation errors that a post-editor may encounter when working with academic, scientific, and journalistic texts, and provide recommendations for minimizing the number of such errors.

Текст научной работы на тему «ПОСТРЕДАКТИРОВАНИЕ И ТИПИЧНЫЕ ОШИБКИ В АВТОМАТИЗИРОВАННОМ ПЕРЕВОДЕ НАУЧНО-ПУБЛИЦИСТИЧЕСКИХ ТЕКСТОВ»

УДК 808.2 Б01: 10.18720/НиМ/К8К 2227-8591.39.04

Е.В. Шевчук, Ж.А. Никифорова

ПОСТРЕДАКТИРОВАНИЕ И ТИПИЧНЫЕ ОШИБКИ В АВТОМАТИЗИРОВАННОМ ПЕРЕВОДЕ НАУЧНО-ПУБЛИЦИСТИЧЕСКИХ ТЕКСТОВ

ШЕВЧУК Екатерина Владимировна - кандидат филологических наук, старший преподаватель Высшей школы сервиса и торговли, Института промышленного менеджмента, экономики и торговли; Санкт-Петербургский политехнический университет Петра Великого. ул. Политехническая, 29, Санкт-Петербург, 195251, Россия. e-mail: ekaterinashevchuk@yandex.ru

SHEVCHUK Ekaterina V. - Peter the Great St. Petersburg Polytechnic University. Politekhnicheskaya, 29, St. Petersburg, 195251, Russia. e-mail: ekaterinashevchuk@yandex.ru

НИКИФОРОВА Жанна Александровна - кандидат филологических наук, доцент Высшей школы сервиса и торговли Института промышленного менеджмента, экономики и торговли; Санкт-Петербургский политехнический университет Петра Великого.

Политехническая ул., 29, Санкт-Петербург, 195251, Россия. e-mail: nikiforovash@gmail.com

NIKIFOROVA Zhanna A. - Peter the Great St. Petersburg Polytechnic University. 29, Polytechnicheskaya, St. Petersburg, 195251, Russia. e-mail: nikiforovash@gmail.com

В статье рассматриваются вопросы типизации ошибок, с которыми переводчик сталкивается в процессе постредактирования машинного перевода. Постмашинное редактирование или постредактирование, которое обозначается в английском языке аббревиатурой PEMT (post-edited machine translation) или MTPE (machine translation post-editing), на сегодняшний день стало неотъемлемой частью переводческого процесса. Причина этому - повсеместная практика использования машинного перевода. Огромное количество российских и зарубежных переводческих компаний признает и приветствует его использование. Более того, в настоящий момент набирает популярность профессия постредактора, поскольку зачастую заказчик и сам может осуществить машинный перевод, используя сервисы компаний Google, Yandex, Microsoft, Memsource и др., но не обладает достаточной степенью владения иностранным языком для осуществления постредактирования. В данной статье предпринята попытка категоризации типичных ошибок машинного перевода, с которыми может столкнуться постредактор при работе с научно-публицистическими текстами, а также даны рекомендации по сведению подобного рода ошибок к минимуму.

МАШИННЫЙ ПЕРЕВОД; ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА; PEMT; НЕЙРОННЫЙ ПЕРЕВОД

Ссылка при цитировании: Шевчук Е.В., Никифорова Ж.А. Постредактирование и типичные ошибки в автоматизированном переводе научно-публицистических текстов // Вопросы методики преподавания в вузе. 2021. Т. 10. № 39. С. 46-54. Б01: 10.18720/НиМ/!88М 2227-8591.39.04

Введение. Согласно данным исследования Ричарда Уайзмена (Richard Wiseman), профессора психологии британского Университета Хертфордшира, скорость жизни за последние десятилетия растет на 1% в год [14]. Увеличение темпа скорости жизни диктует необходимость увеличивать скорость обмена информацией и, как следствие, скорость перевода текстов с одного языка на другой. Именно поэтому востребованность машинного перевода (МП) повсеместно возрастает.

Так, по данным отчета европейской переводческой отрасли за 2018 год, «более 50% переводческих компаний Европы и переводчиков-фрилансеров подтвердили, что используют МП в той или иной его форме [13], те же данные имеем и по России. Опросы показывают, что более 50 % российских ... переводческих компаний уже используют его в своей практике. Порядка 20 % переводческих компаний планируют начать внедрять эту технологию в свою деятельность в ближайшее время [5].

Актуальность. Актуальность исследования обусловлена тем, что хотя нейронный перевод и совершенствуется ежегодно вопрос качества и адекватности подобного перевода не утрачивает своей остроты. Безусловно, для общего понимания смысла переведенного текста иной раз достаточно применить так называемое легкое постредактирование (light postediting). Иными словами, достаточно только слегка отшлифовать результат МП [12]. Чаще приходится прибегать к полному постредактированию (full postediting), а в этом случае ожидания от качества те же, что и при традиционном способе перевода и редактирования. Однако и этот процесс во многом можно автоматизировать, или хотя бы отчасти упростить, используя соответствующие сервисы редактирования текстов,

а кроме того, имея некий «путеводитель» по типичным ошибкам, встречающимся в текстах научно-публицистического регистра.

Методы. При проведении исследования была проанализирована актуальная отечественная и зарубежная литература по теме. Определены ключевые особенности постмашинного редактирования, его специфика и отличие от традиционного перевода с последующим редактированием и корректурой. На основе массива из 56 научно-публицистических текстов, проанализированных авторами в рамках деятельности по языковому рецензированию текстов, предпринята попытка классификации типичных ошибок, встречающихся в текстах подобного рода и регистра, а также рекомендаций по их исправлению.

Понимая, на что в первую очередь следует обратить внимание, как заказчик процедуры постмашинного редактирования, так и сам постредактор смогут существенно сэкономить время работы с редактируемым текстом.

Анализ результатов. Машинный перевод представляет собой процесс перевода письменных текстов с одного естественного языка на другой с помощью специальной компьютерной программы [2; 4]. Хотя на сегодняшний день качество машинного перевода продвинулось далеко вперед, «вопрос адекватности таких переводов до сегодняшних дней остается актуальной и требующей дальнейшего изучения проблемой» [2].

К безусловным преимуществам машинного перевода относятся:

• экономия времени,

• проста доступа к услуге,

• удобство пользования,

• относительно высокое качество перевода (современные сервисы нейронного

перевода позволяют довольно точно передать смысл переводимого текста),

• большой спектр комбинаций «язык оригинала» - «язык перевода».

Нельзя не упомянуть и о недостатках, среди которых

• необходимость редактирования текста перевода для обеспечения высокого качества,

• интерференция синтаксиса языка оригинала в язык перевода, что затрудняет понимание изложенного или вовсе препятствует этому,

• лексико-семантические и морфологические ошибки,

• орфографическая, речевая, стилистическая и т. п. ошибка автора в языке оригинала игнорируется в процессе машинного перевода (то, что легко увидит и исправит человек, машина примет как данность согласно принципу GIGO (garbage in - garbage out),

• и некоторые другие.

Уже упомянутый ранее нейронный автоматический перевод, годом появления которого считается 2016, это именно то, что предлагают пользователям сервисы компаний Google, Яндекс, Microsoft и ПРОМТ.

Основываясь на модели переводных соответствий и на результатах эмпирических исследований, А. Семенов делит все ошибки компьютерного перевода на 2 большие группы [2; 6]:

• ошибки автоматического анализа (лексические, морфологические, синтаксические, текстовые);

• ошибки автоматического синтеза (текстовые, семантические, синтаксические, морфологические, лексические).

Так, например, к ошибкам лексического анализа можно отнести появление в выходном тексте непереведенных или некорректно переведенных слов. Это может быть связано с неполнотой словаря автоматизированной системы перевода, с оши-

бочным разрешением лексической омонимии и полисемии, а равно и с человеческим фактором: наличием орфографических ошибок или опечаток во входном тексте [8].

К ошибкам морфологического анализа относятся ошибки нарушения согласования и управления, что может быть вызвано неправильной работой не только морфологического, но и синтаксического, а также семантического блоков [8]. Примером могут служить неправильно заданное падежное управление [8], неверное согласование категорий числа, лица, рода.

Ошибками синтаксического анализа следует считать неправильное или неполное определение синтаксической структуры входного предложения, что ведет к неправильному синтезу выходного предложения [8].

За процедурой автоматического анализа следует этап автоматического синтеза. Здесь, как и при автоматическом анализе, системы допускают ряд ошибок. Наиболее распространенными является нарушение порядка слов в выходном тексте, а также упущение глагола-связки в составе именного сказуемого (Nominal predicate). Что касается ошибок морфологического синтеза, то к ним можно отнести неправильное употребление форм глаголов, в том числе видовременных, если перевод осуществляется на английский язык, ошибочное согласование подлежащего и сказуемого, некорректный синтез слов, принадлежащих к различным частям речи [8].

К сожалению, авторам данной статьи не представляется возможным привести конкретные примеры ошибок анализа, по причине отсутствия оригиналов исследуемых текстов. По этой причине приведем лишь некоторые примеры ошибок синтеза:

Таблица 1

Ошибки синтеза

Ошибка: Отредактированный текст:

Морфологическая ошибка The authors believe that the concept and essence of an organization's innovation ecosystem comes from digital transformation. The authors believe that the concept and essence of an organization's innovation ecosystem come from digital transformation.

Синтаксическая ошибка In the Russian Federation_, the site «counterparty.no», which contains links to official and private resources that allow you to check (both for a fee and for free) various information about legal entities and individuals. The proposed in the article an integrated approach to the use of digital technologies at all stages of supply management in procurement logistics... In the Russian Federation it is the site «counterparty.no», which contains links to official and private resources that allow you to check (both for a fee and for free) various information about legal entities and individuals. The integrated approach, that is proposed in the article, is aimed at the use of digital technologies at all stages of supply management in procurement logistics.

Лексико-грамматические ошибки в таких случаях возникают, как правило, на основе неправильного выбора определенных (одного или нескольких) параметров из множества [1], а синтаксические трудности - результат языковой интерференции при переводе текста [2]. П.Н. Хроменков отмечает, что «неправильная работа системы на этапе анализа и некорректное разрешение неоднозначностей ведут ... к появлению ошибок на этапе синтеза» [8].

Таким образом, как ошибки анализа, так и ошибки синтеза следует рассматривать системно, в том числе с привлечением дополнительных сведении о работе тех или иных алгоритмов перевода на каждом языке системы [8].

Тот факт, что машинный перевод используется все шире и активнее, привел к появлению новой профессии на переводческом рынке - постредактор машинного перевода. Цель постредактирования машинного перевода (postediting, PEMT) -довести выполненный машиной перевод до приемлемого качества, тем самым сэкономив время. От простого редактирования постредактирование отличается именно тем, что во втором случае перевод выполняется машиной, а далее редактуру выполняет человек, а в первом случае - как на

этапе перевода, так и на этапе редактирования задействованы люди [7]. Согласно данным отчета европейской переводческой отрасли от 2018 года, 37 % европейских переводческих компаний сообщают об увеличении доли использования РЕМТ в своей практике, а ещё 17 % заявляют, что намерены начать практиковать этот вид деятельности в ближайшее время [5; 7].

Следует отметить, что не всегда машинный перевод увеличивает скорость работы, ведь постредактирование перевода низкого качества займет больше времени, чем сам процесс перевода. Именно поэтому ассоциация TAUS (Translation Automation User Society) также выделяет цель постредактирования и задачу постредактора. Цель -сделать текст понятным реципиенту. Задача - улучшить результат МП с минимальным количеством усилий за минимальное количество времени [5]. Ключевым словом в данном случае становится «минимальное».

Еще один важный момент - уровень подготовки постредактора, зависящий и от уровня знаний испытуемого в конкретной предметной области, и от общих навыков работы с текстом, и от предыдущего опыта постредактирования, и от навыков работы с инструментами постредактирования [7; 9]. В ходе исследований были выявлены важ-

ные критерии эффективности постредактирования, к которым относятся:

1. предыдущий опыт,

2. соблюдение рекомендаций для постредактирования,

3. ориентация на качество, соответствующее цели перевода [10].

Остановимся подробнее на втором и третьем пунктах. Одной из действенных рекомендаций может стать ведение процесса постредактирования с учетом выявленной типологии ошибок. Что касается ориентации на качество, соответствующее цели перевода, стоит помнить о тех случаях, когда цель - добиться приемлемого, а не идеального качества перевода. Тем не менее, в иных случаях перевод должен соответствовать профессиональному переводу, выполненному человеком. Как раз таким случаем является перевод научно-публицистических текстов, особенно публикуемых в серьезных изданиях мирового уровня, поскольку такого рода тексты являются «имиджевым» продуктом не только для автора, но и для организации, которую он представляет.

С целью определения типологии ошибок в рамках процедуры языкового рецензирования были проанализированы 56 научно-публицистических текстов. Это

были статьи, присланные на конференцию ОБТМ-21, состоявшейся 29 и 30 сентября 2021 года в Санкт-Петербургском политехническом университете. Рабочий язык конференции - английский, так что все тексты переводились на английский язык. Мы не можем однозначно утверждать, что языком оригинала в каждом случае был русский, поскольку в числе соавторов нередко заявлены иностранные исследователи, равно как и утверждать, что статьи писались на русском языке и только потом переводились на английский, однако, в подавляющем большинстве случаев это были именно русскоговорящие коллеги и текст оригинала статьи изначально был написан на русском языке. Машинный перевод был в той или иной мере использован для перевода всех присланных трудов. Авторы признают, что машинный перевод существенно облегчает задачу, хотя бы даже и тем, что текст на английском языке не приходилось набирать на клавиатуре (что уже существенно экономит время).

Рассмотрим, какие ошибки оказались наиболее частотными. Для подсчета мы воспользовались корректорским онлайн сервисом Огашшаг1у, в основе работы которого лежит искусственный интеллект.

Таблица 2

Наиболее частотные ошибки. Артикли

Тип ошибки Кол-во

Пропущенный / избыточный артикль 136

Исходный вариант PEMT вариант

The term first appeared in 2006, in _ RenaultNissan case, as _ cost-effective, quick solution under limited resources. The term first appeared in 2006, in the RenaultNissan case, as a cost-effective, quick solution under limited resources.

The most important aspects of digitalization in _ mechanical engineering area are summarized to the categories. The most important aspects of digitization in the mechanical engineering area are summarized into categories.

Calculations of the digitalization level applied to three regions of _ Russian Federation namely _ Komi Republic, Murmansk, and Arkhangelsk Regions. Calculations of the digitalization level applied to three regions of the Russian Federation namely the Komi Republic, Murmansk, and Arkhangelsk Regions.

Таблица 2

Наиболее частотные ошибки. Артикли. Примеры

Отсутствие категории артикля в русском языке представляет собой особую сложность для носителей русского языка.

Таблица 3

Наиболее частотные ошибки. Пунктуация

Отметим, что пунктуационные правила расстановки запятых в английском языке существенно проще, чем в русском. Довольно часто в сложных предложениях запятая не нужна. Однако, есть и такие случаи, когда запятая нужна в английском варианте, при этом в русском переводе ее нет. Это касается так называемой «оксфордской» или «гарвардской» запятой, используемой в английском языке перед союзом (обычно and или or, а также nor), перед последним пунктом в списке из трёх или более элементов. Лингвисты спорят о ее обязательности, но большинство автоматизированных систем проверки орфографии и пунктуации (т. н. спеллчеркеры), рекомендуют ставить ее.

Таблица 3

Наиболее частотные ошибки. Пунктуация. Примеры

Исходный вариант PEMT вариант

Participants already know, what they're going to work on, but did not suspect what may be the solution. Participants already know_what they're going to work on but did not suspect what may be the solution.

Thus_it becomes possible not to overlook the information about the status of workplaces, equipment and service department operations. Thus, it becomes possible not to overlook the information about the status of workplaces, equipment, and service department operations.

Таблица 4

Наиболее частотные ошибки. Знаки кавычек

Тип ошибки Кол-во

Пунктуационные ошибки при употреблении кавычек и цитат 68

В американском и британском вариантах английского допускается использование одинарных и двойных кавычек. По две стороны океана правила немного различаются. Так, в американском английском двойные кавычки используются в первую очередь, а одинарные кавычки используются как вторые при цитировании внутри цитаты. В британском английском -наоборот. Но кавычки-«елочки» не используются ни в одном из вариантов английского.

Таблица 4

Наиболее частотные ошибки. Знаки кавычек. Примеры

Исходный вариант PEMT вариант

«What does NEETs mean and why is the concept so easily misinterpreted?» 'What does NEETs mean and why is the concept so easily misinterpreted?'

The United States is considered the «birthplace of downshifting», respectively, it is here that the movement has developed the fastest - in 1995, 28% of the population of America considered themselves downshifters The United States is considered the 'birthplace of downshifting', respectively, it is here that the movement has developed the fastest - in 1995, 28% of the population of America considered themselves downshifters

In Russia, the first references to downshifting as a «depression of millionaires» began to appear in 2004, mostly in the well-known business media. In Russia, the first references to downshifting as a 'depression of millionaires' began to appear in 2004, mostly in the well-known business media.

Тип ошибки Кол-во

Пунктуационные ошибки при использовании запятых. 73

Что касается синтаксических ошибок, была выявлена одна довольно интересная закономерность: хотя нейронный перевод развивается стремительно, но его уровень еще недостаточен, чтобы избежать языковой интерференции. Интересно, что на общее понимание смысла это кардинальным образом не влияет, скорее, является фактором «имиджевого» уровня.

Наиболее часто мы наблюдаем случай языковой интерференции русского синтаксиса на английский язык.

Таблица 5 Языковая интерференция. Примеры

Формат журнальной статьи не позволяет подробно осветить стилистические неточности при переводе и постредактировании научно-публицистических текстов, возможно, это станет материалом для дальнейших исследований.

Выводы. Машинный перевод стал частью ежедневной практики не только профессиональных переводчиков, но и тех,

кто регулярно осуществляет коммуникацию на иностранном языке: исследователей, бизнесменов, учащихся, проходящих обучение в зарубежных вузах.

Машинный перевод позволяет существенно сэкономить время и, в целом, современные системы нейронного перевода прекрасно справляются с задачей передачи общего смысла сообщения. Однако, они еще не достигли того уровня совершенства, когда участие человека из переводческого процесса полностью исключается. Именно по этой причине сегодня набирает популярность профессия постредактора: человека, который «доводит перевод до приемлемого уровня».

Во избежание ошибок анализа и синтеза текста, для получения более качественного результата и сокращения времени, которое впоследствии будет затрачено на постредактирование, рекомендуется провести предварительную работу с исходным текстом. Убедитесь, что в исходном тексте отсутствуют опечатки, орфографические и лексико-грамматические ошибки. Удостоверьтесь, что текст логичен, трактовка слов и словосочетаний однозначна. Упростите синтаксис и пунктуацию, поскольку в языке перевода действуют иные правила. Да, сегодняшний уровень развития систем нейронного перевода нередко перестраивает синтаксис в соответствии с правилами языка перевода, но не в том случае, когда предложение перегружено придаточными конструкциями.

Осуществляя постмашинное редактирование обратите особое внимание на отсутствие артиклей и пунктуацию, поскольку именно эти ошибки являются наиболее частотными при машинном переводе русскоязычных научно-публицистических текстов на английский язык.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Языковая интерференция синтаксиса исходного языка на язык перевода не всегда ведет к искажению смысла, но может затруднить понимание, тем самым сказав-

Исходный вариант PEMT вариант

Under the potential in the context of this study, we mean the socio-economic potential that unites public relations with the process of forming and using economic benefits. In the context of this study, the potential is understood as the socioeconomic potential uniting the public relations with the process of forming and using economic benefits.

The panel indicators that we have chosen -characteristics of the socioeconomic security of the region, on the basis of which we will draw a conclusion about the level of regional economic security, are presented in Table 1. The panel indicators that we have chosen show the characteristics of the socio-economic security of the region. These are presented in Table 1 and will enable us to decide on the level of regional economic security.

The most important aspects of digitization in mechanical engineering area summarized to the categories. The most important aspects of digitization in the mechanical engineering area are summarized into categories.

шись на имидже исследователей. Научно-публицистические тексты в английском, в отличие от русского языка, не изобилуют сложными предложениями. Наоборот, для английских текстов такого рода характер-

но преобладание простых предложений. Следует принимать во внимание данный фактор при подготовке текстов к машинному переводу и в процессе последующего постредактирования.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Байтин А. Поиск и машинный перевод // Российские интернет технологии: материалы профессиональной конференции веб-разработчиков 25-26 апреля. - М., 2011. [Электронный ресурс]. https://searchengines. guru/ru/articles/9566

2. Гритчин, А.Б., Дворак Е.В. Компьютерный перевод: качество и типичные ошибки // Молодежный вестник ИрГТУ. 2020. Т. 10. № 1.С. 152-156.

3. Кочеткова Н.С., Ревина Е.В. Особенности машинного перевода // Филологические науки. Вопросы теории и практики.2017. № 6-2. C. 106-109. ISSN 1997-2911.

4. Марчук Ю. Н. Проблемы машинного перевода. М.: Наука, 1983. 201 с.

5. Нечаева Н.В., Светова С.Ю. Постредактирование машинного перевода как актуальное направление подготовки переводчиков в вузах // Вопросы методики преподавания в вузе. 2018. Т. 7. № 25. С. 64-72. DOI: 10.18720/HUM/ISSN 2227-8591.25.07

6. Семенов А. Л. Современные информационные технологии и перевод: учебное пособие.- М.: Академия, 2008. 224 с. ISBN: 978-5-7695-4459-0

7. Худяков Н.А. Постредактирование машинного перевода: теоретические аспекты // Филологический аспект. 2019. №1 (45). С. 232239. eISSN: 2412-8953

8. Хроменков П.Н. Анализ и оценка эффективности современных систем машинного

перевода : автореф. дисс....канд. филол. -10.02.21. - М., 2000. - 28 с.

9. Koby, G.S. (2001). Editor's introduction. In Krings, H.P. Repairing Texts: Empirical Investigations of Machine Translation Post-editing Processes, Kent State University Press, pp.1-23

10. Koponen Maarit. Is machine translation post-editing worth the effort? A survey of research into post-editing and effort. - University of Helsinki. The Journal of Specialised Translation. Issue 25. January 2016. [Online] URL: http://www.jostrans. org/issue25/art_koponen.pdf

11. Temnikova Irina Cognitive Evaluation Approach for a Controlled Language Post-Editing

12. Experiment. Proceedings of the International Conference on Language Resources and Evaluation. European Language Resources Association (ELRA). - 2010. [Online] URL: https://www.research gate.net/publication/220746821_cognitive_evaluation _approach_for_a_controlled_language_post--editing_ experiment

13. PEMT [Online] URL: https://pemt.ru/pemt/].

14. 2018 Language Industry Survey - Expectations and Concerns of the European Language Industry [Online] URL: https:// ec.europa.eu/ info/ sites/info/files/2017_language_industry_survey_re port_en.pdf

15. В городах скорость жизни растет на один процент в год [Online] URL: https://lenta.ru/ news/2007/05/02/speed/].

REFERENCES

1. Bajtin A. Poisk i mashinnyj perevod // Rossijskie internet tehnologii: materialy professional'noj konferencii veb-razrabotchikov 25-26 apr. 2011. Moskva, [Jelektronnyj resurs]. https://sear chengines.guru/ru/articles/9566

2. Gritchin A.B., Dvorak E.V. Computer Translation: Quality and Common Mistakes. Young Researchers' Journal of ISTU. 2020. Vol.10. No 1. P. 152-156

3. Kochetkova N.S., Revina E.V. Osobennosti mashinnogo perevoda // Filologicheskie nauki. Voprosy teorii i praktiki. 2017. No 6-2(72). P. 106109. ISSN 1997-2911.

4. Marchuk Ju.N. Problemy mashinnogo perevoda. M.: Nauka, 1983. 201 s.

5. Nechaeva N.V., Svetova S.Y. Post-Editing Machine Translation as a New Activity for Teaching Translation at Universities. Teaching Methodology in

Higher Education. 2018. Vol. 7. No 25. P. 64-72. DOI: 10.18720/HUM/ISSN 2227-8591.25.07

6. Semenov A.L. Sovremennye informacionnye tehnologii i perevod: uchebnoe posobie. - M.: Akademija, 2008. 224 a ISBN: 978-5-7695-4459-0

7. Khudiakov N. A. Machine translation post-editing: theoretical aspect. Filologicheskij aspekt. 2019. No 1 (45). P. 232-239. elSSN: 2412-8953

8. Hromenkov P.N. Analiz i ocenka jeffektivnosti sovremennyh sistem mashinnogo perevoda : avtoref. diss....kand. filol. - 10.02.21. - M., 2000. - 28 s.

9. Koby, G.S.(2001) Editor's introduction. In Krings, H.P. Repairing Texts: Empirical Investigations of Machine Translation Post-editing Processes, Kent State University Press, pp: 1-23

10. Koponen Maarit. Is machine translation post-editing worth the effort? A survey of research into post-editing and effort. - University of Helsinki. The Journal of Specialised Translation. Issue 25.

January 2016. [Online] URL: http://www.jostrans. org/issue25/art_koponen.pdf

11. Temnikova Irina. Cognitive Evaluation Approach for a Controlled Language Post-Editing Experiment. Proceedings of the International Conference on Language Resources and Evaluation. European Language Resources Association (ELRA). - 2010. [Online] URL: https://www.re searchgate .net/publication/220746821_cognitive_eva luation_approach_for_a_controlled_language_post--editing_expe riment

12. PEMT [Online] URL: https://pemt.ru/pemt/].

13. 2018 Language Industry Survey -Expectations and Concerns of the European Language Industry [Online] URL: https://ec.eu ropa.eu/info/sites/info/files/2017_language_indust ry_survey_report_en.pdf

14. V gorodah skorost' zhizni rastet na odin procent v god [Online] URL: https://lenta.ru/news /2007/05/02/speed/].

Shevchuk Ekaterina V., Nikiforova Zhanna A. Post-editing and typical mistakes in the computer-aided translation of academic, scientific, and journalistic texts. The article deals with typical errors in editing a computer-aided translation (CAT). Post-machine editing or post-editing (PEMT - post-edited machine translation or MTPE - machine translation post-editing) has now become an integral part of the translation process. The reason for this is the widespread practice of using computer-aided translation. A great deal of Russian and foreign translation companies recognize and welcome the use of CAT. Moreover, the job of post-editor is now gaining popularity, since the customer himself can often carry out computer-aided translation using the services of Google, Yandex, Microsoft, Memsource, etc., but does not have a sufficient degree of knowledge of a foreign language to perform post-editing. We have tried to categorize typical machine translation errors that a post-editor may encounter when working with academic, scientific, and journalistic texts, and provide recommendations for minimizing the number of such errors.

COMPUTER-AIDED TRANSLATION; CAT; POST-EDITED MACHINE TRANSLATION; PEMT; NEURAL MACHINE TRANSLATION; NMT-GENERATED TRANSLATION

Статья поступила в редакцию 03.11.2021; одобрена после рецензирования 12.12.2021 принята к публикации 28.12.2021.

The article was submitted 03.11.2021; approved after reviewing 12.12.2021; accepted for publication 28.12.2021

Citation: Shevchuk E.V. Nikiforova Zh.A. Post-editing and typical mistakes in the computer-aided translation of academic, scientific, and journalistic texts. Teaching Methodology in Higher Education. 2021. Vol. 10. No 39. P. 46-54. DOI: 10.18720/HUM/ISSN 2227-8591.39.04

© Санкт-Петербургский политехнический университет Петра Великого, 2021

i Надоели баннеры? Вы всегда можете отключить рекламу.