Научная статья на тему 'ПРЕД- И ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА МЕДИЦИНСКИХ ТЕКСТОВ'

ПРЕД- И ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА МЕДИЦИНСКИХ ТЕКСТОВ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
1052
204
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинный перевод / предредактирование / легкое постредактирование / полное постредактирование / медицинский текст / machine translation / pre-editing / light post-editing / full post-editing / medical text

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Н А. Абросимова, Е А. Щелокова

Статья посвящена актуальной на сегодняшний день проблеме пред- и постредактирования машинного перевода медицинских текстов. Статья раскрывает содержание понятий пред- и постредактирования, а также медицинского текста. Основное внимание в работе акцентируется на лексико-грамматических особенностях медицинских текстов, которые необходимо учитывать при пред- и постредактировании машинного перевода. Целью статьи является изучение алгоритма действий применяемого в процессе предредактирования и стратегий постредактирования машинного перевода медицинских текстов. В статье проанализированы особенности медицинских текстов в процессе предредактирования машинного перевода и проведен анализ передачи особенностей медицинских текстов в процессе постредактирования машинного перевода на примере следующих систем машинного перевода: DeepL Переводчик, Google Переводчик и Яндекс.Переводчик.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PRE- AND POST-EDITING OF MACHINE TRANSLATION OF MEDICAL TEXTS

The article deals with the current problem of the pre- and post-editing of machine translation of medical texts. The article reveals the contents of notions of pre- and post-editing, as well as of a medical text. The focus of the work is made on lexical and grammatical peculiarities of medical texts that should be taken into account in pre- and post-editing of machine translation. The object of the article is to study the pre-editing algorithm and post-editing strategies of machine translation of medical texts. The article analyses the particularities of medical texts in the process of pre-editing of machine translation and analyses the transfer of the particularities of medical texts in post-editing of machine translation based on the following machine translation systems: DeepL Translate, Google Translate and Yandex Translate.

Текст научной работы на тему «ПРЕД- И ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА МЕДИЦИНСКИХ ТЕКСТОВ»

ФИЛОЛОГИЧЕСКИЕ НАУКИ

Редакторы раздела: Литературоведение

АЛЕКСЕЕВ ПАВЕЛ ВИКТОРОВИЧ - доктор филологических наук, профессор кафедры русского языка и литературы ФГБОУ ВО «Горно-Алтайский государственный университет» (г. Горно-Алтайск)

Языкознание

КУКУЕВА ГАЛИНА ВАСИЛЬЕВНА - доктор филологических наук, профессор кафедры филологического образования и журналистики, БУ ВО «Сургутский государственный педагогический университет» (г. Сургут)

УДК 81'322.4

Abrosimova N.A., Cand. of Sciences (Philology), senior lecturer, Herzen State Pedagogical University (St. Petersburg, Russia),

E-mail: [email protected]

Shchelokova E.A., BA student, Herzen State Pedagogical University (St. Petersburg, Russia), E-mail: [email protected]

PRE- AND POST-EDITING OF MACHINE TRANSLATION OF MEDICAL TEXTS. The article deals with the current problem of the pre- and post-editing of machine translation of medical texts. The article reveals the contents of notions of pre- and post-editing, as well as of a medical text. The focus of the work is made on lexical and grammatical peculiarities of medical texts that should be taken into account in pre- and post-editing of machine translation. The object of the article is to study the pre-editing algorithm and post-editing strategies of machine translation of medical texts. The article analyses the particularities of medical texts in the process of pre-editing of machine translation and analyses the transfer of the particularities of medical texts in post-editing of machine translation based on the following machine translation systems: DeepL Translate, Google Translate and Yandex Translate.

Key words: machine translation, pre-editing, light post-editing, full post-editing, medical text.

Н.А. Абросимова, канд. филол. наук, доц., Российский государственный педагогический университет имени А.И. Герцена, г. Санкт-Петербург,

E-mail: [email protected]

Е.А. Щелокова, бакалавр, Российский государственный педагогический университет имени А.И. Герцена, г. Санкт-Петербург,

E-mail: [email protected]

ПРЕД- И ПОСТРЕДАКТИРОВАНИЕ МАШИННОГО ПЕРЕВОДА МЕДИЦИНСКИХ ТЕКСТОВ

Статья посвящена актуальной на сегодняшний день проблеме пред- и постредактирования машинного перевода медицинских текстов. Статья раскрывает содержание понятий пред- и постредактирования, а также медицинского текста. Основное внимание в работе акцентируется на лексико-граммати-ческих особенностях медицинских текстов, которые необходимо учитывать при пред- и постредактировании машинного перевода. Целью статьи является изучение алгоритма действий применяемого в процессе предредактирования и стратегий постредактирования машинного перевода медицинских текстов. В статье проанализированы особенности медицинских текстов в процессе предредактирования машинного перевода и проведен анализ передачи особенностей медицинских текстов в процессе постредактирования машинного перевода на примере следующих систем машинного перевода: DeepL Переводчик, Google Переводчик и Яндекс.Переводчик.

Ключевые слова: машинный перевод, предредактирование, легкое постредактирование, полное постредактирование, медицинский текст.

В наше время перевод медицинских текстов является наиболее востребованным и трудоемким. Особую сложность при переводе данных текстов представляет передача их лексико-грамматических особенностей. Кроме того, объемы медицинского перевода постоянно увеличиваются, поэтому у переводчиков все чаще возникает необходимость обращаться к машинному переводу. Однако по качеству машинный перевод не всегда соответствует переводу, выполненному человеком. В связи с этим возникает необходимость тщательного изучения передачи особенностей медицинских текстов и определения алгоритма действий в процессе предредактирования и стратегий постредактирования, которые могут быть применены для повышения качества машинного перевода.

Пред- и постредактирование являются одними из наиболее популярных направлений для изучения. Это продиктовано значительным развитием систем машинного перевода. Однако даже самые современные лингвистические технологии пока что не достигли такого уровня развития, чтобы качественно выполнять перевод без вмешательства человека [1]. Усиление международных научных и производственных контактов в сфере медицины и медицинских технологий повышает потребность в специальном медицинском переводе. В то время как специфика и высокие требования, предъявляемые к качеству данного перевода, могут быть достигнуты только при совместной работе систем машинного перевода и человека, который осуществляет пред- и постредактирование - все это обусловливает актуальность настоящего исследования.

Цель работы состоит в выявлении алгоритма действий в процессе предредактирования и стратегий постредактирования машинного перевода медицинских текстов. Задачи исследования включают рассмотрение таких понятий, как

машинный перевод, предредактирование, постредактирование, определение алгоритма действий в процессе предредактирования и стратегий постредактирования, а также анализ особенностей медицинских текстов в процессе пред- и постредактирования машинного перевода.

Новизна работы обусловлена материалом исследования и заключается в том, что впервые предпринимается попытка анализа результатов пред- и постредактирования машинного перевода медицинских текстов.

Возможность использования результатов данной статьи в дальнейших исследованиях пред- и постредактирования МП медицинских текстов и в профессиональной деятельности переводчика - практическая значимость настоящего исследования.

Машинный перевод - это перевод текста с одного языка на другой, осуществляемый с помощью машины [2]. Существуют разные подходы к построению алгоритмов МП: машинный перевод, основанный на правилах, статистический МП, или основанный на статистике, нейронный машинный перевод, появившийся относительно недавно, и гибридные системы машинного перевода, сочетающие преимущества двух систем [3]. Многообразие подходов свидетельствует о непрекращающейся работе над улучшением систем машинного перевода для повышения качества перевода. В настоящее время наиболее распространены нейронные (DeepL Переводчик, GNMT) и гибридные (Яндекс.Переводчик - сочетает в себе статистический и нейронный машинный перевод) системы машинного перевода.

На этапе предредактирования человек приспосабливает текст к обработке машиной. Технология контролируемого языка предусматривает упрощение

исходного текста на лексическом и грамматическом уровнях. Контролируемый язык - это определенные правила, применяемые при написании контролируемых текстов. Правила помогают избежать лексической двусмысленности и сложных грамматических структур. Это облегчает пользователю чтение и понимание текста и, следовательно, упрощает использование технологий памяти переводов (ПП) или машинного перевода. Контролируемый язык сосредоточен в основном на лексике и грамматике и предназначен для очень узких областей [1]. Для сокращения объема нагрузки путем адаптации исходного документа при предре-дактировании машинного перевода применяется следующий алгоритм действий:

1) введение в текст артиклей там, где это необходимо или грамматически оправданно;

2) введение союзов при использовании бессоюзной связи между предложениями;

3) повторение элементов при сочинительной связи словосочетаний в предложении;

4) устранение конструкций в скобках в середине именной группы или в середине предложения;

5) приведение к единому виду конструкций, которые могут иметь разное написание;

6) замену окказиональных аббревиатур на полные наименования либо введение специальных символов, предотвращающее их перевод как обычных слов [4].

На лексическом уровне преобразования осуществляются в том случае, если это необходимо для «облегчения» структуры предложения [1]. Для того чтобы избежать грамматических ошибок, необходимо использовать простые конструкции и простые предложения, прямой порядок слов, активный залог Данные правила позволяют сделать текст «прозрачным» для систем МП, что положительно отражается на качестве готового перевода. Улучшение исходных результатов машинного перевода, а также повышение производительности являются целью предредактирования [1].

Постредактирование является процессом обработки машинного перевода для достижения необходимого уровня качества. Выделяются два вида постредактирования - легкое и полное. При легком постредактировании допустимо наличие стилистических ошибок, терминология предлагается компьютерной программой. Единственный критерий к качеству - возможность понять текст без обращения к оригиналу. В результате полного постредактирования должен получиться стилистически соответствующий исходному понятный текст, точное и законченное сообщение, не отличающееся от сделанного человеком [5].

К стратегиям, применяемым в постредактировании машинного перевода, относятся:

1) полное редактирование с проверкой каждого компонента текста по исходному фрагменту;

2) чтение МП и исправление вызывающих сомнения мест с обращением к исходному тексту;

3) использование МП исключительно в качестве подсказки по терминологии;

4) использование МП в качестве грамматического подстрочника с подбором синонимичных выражений;

5) чтение МП и исправление очевидных погрешностей без обращения к исходному тексту [6].

Критерии выбора стратегий постредактирования основываются на различных факторах, например, знание предметной области, степень владения языками, степень доверия и опыт работы с данной системой МП, сроки и предполагаемый объем постредактирования.

Материалом исследования послужили англоязычные медицинские тексты, которые были отобраны путем сплошной выборки из научной периодической литературы по медицине.

Медицинский текст - это специализированная медицинская публикация или текст частного характера, содержание которого связано с вопросами здоровья человека [7]. Медицинский текст служит для передачи когнитивной информации. Преобладание когнитивной информации в медицинском тексте диктует логический, а не ассоциативно-образный путь его построения. Обилие средств обеспечения логичности изложения представлены с запасом - это одна из доминирующих черт медицинского текста [8]. Специфика научных медицинских текстов заключается в их предназначении для узкого круга специалистов в области медицины. Цель медицинских текстов - обмен опытом и обнародование данных исследований [7]. Медицинский текст обладает следующими особенностями: строгим, однообразным, практически лишенным какой-либо экспрессивности стилем научного изложения с использованием терминологии и сокращений, обилием средств логичности изложения и разнообразными синтаксическими структурами, для передачи которых переводчик прибегает к использованию различных приемов и стратегий, чтобы избежать технических ошибок [8]. Из-за различий в структуре текстов, касающихся синтаксического и лексического уровня как исходного, так и целевого языка возникают лингвистические проблемы [9]. Они могут возникнуть из-за отсутствия грамматических и/или лингвостилистических знаний о нормах языка источника и целевого языка перевода или быть вызваны терминологической спецификой текста [9]. В медицинском тексте для передачи терминов используются однозначные, независимые от контекста соответствия,

эквиваленты. Большая часть эквивалентов содержится в специальных двуязычных словарях. Недопустима замена терминов близкими по значению словами. Большинству терминологических сокращений дано соответствие в словарях, именно его и нужно применять в переводе и ни в коем случае не изобретать собственное сокращение [8]. Если же в специальном словаре отсутствует необходимое сокращение, следует его расшифровать и дать в переводе как в полном, так и в сокращенном вариантах [8].

Доминантами перевода при переводе медицинских текстов, обеспечивающими инвариантность текста, будут средства, которые гарантируют объективность, логичность и компактность изложения. Распространенный вид соответствий - однозначный эквивалент; на втором месте - вариантное соответствие с равноправной вариативностью [8].

Рассмотрим пример предредактирования. Так, во вторую часть предложения оригинала был добавлен акроним HAS-BLED. HAS-BLED - это шкала для оценки риска кровотечения. На ПЯ используется искомый англоязычный акроним, поэтому, чтобы системы машинного перевода не переводили данную единицу, нужно поставить кавычки. После этого предложение было разделено на две части, поскольку так системам машинного перевода проще ориентироваться при переводе. Далее мы поменяли местами два предложения, поскольку так системам будет легче выстроить связь между ними при переводе на русский язык, а также выше вероятность, что они выполнят перевод максимально приближено к переводу, выполненному человеком. Так выглядит преобразованное предложение в контролируемом тексте.

Оригинал Предредактирование (контролируемый текст)

As the HAS-BLED score does not account for such asymptomatic MRI lesions, the score may underestimate bleeding risk in this population [10] The "HAS-BLED' score may underestimate bleeding risk in this population. As the "HAS-BLED' score does not account for such asymptomatic MRI lesions

После создания контролируемого текста он пропускался через три системы машинного перевода: DeepL Переводчик, GNMT и Яндекс.Переводчик. В следующей табл. представлен анализ того, как системы справились с переводом контролируемого текста.

DeepL Переводчик GNMT Яндекс.Переводчик

Показатель HAS-BLED может недооценивать риск кровотечения в этой популяции. Поскольку показатель HAS-BLED не учитывает такие бессимптомные поражения при МРТ Оценка HAS-BLED может недооценивать риск кровотечения в этой популяции. Поскольку оценка HAS-BLED не учитывает такие бессимптомные поражения на МРТ Показатель HAS-BLED может недооценивать риск кровотечения в этой популяции. Поскольку оценка HAS-BLED не учитывает такие бессимптомные МРТ-пораже-ния

Акроним HAS-BLED был правильно идентифицирован всеми анализируемыми в работе системами машинного перевода и трансплантирован в переводной текст, поскольку на ПЯ используется искомый англоязычный акроним. Тем не менее во всех трех системах машинного перевода к акрониму необходимо добавить поясняющее слово шкала, что повысит качество переведенной единицы до уровня перевода, выполненного человеком. Системы справились с передачей сокращения MRI, т. к. в русском языке используется эквивалентное сокращение «МРТ». Системы машинного перевода Google и Яндекс.Переводчик при передаче единицы asymptomatic MRI lesions - бессимптомные поражения на МРТ/бессимптомные МРТ-поражения нарушают смысл, что является серьезной ошибкой. У МРТ не может быть бессимптомных поражений, поскольку это прибор. Также нужно отметить, что в тексте говорится про пациентов, у которых можно выявить данные бессимптомные патологические изменения при использовании МРТ. Как было сказано ранее, в тексте речь идет о группе пациентов, а не о животных или растениях, поэтому использование термина популяция является неверным. Для единицы underestimate bleeding risk системы машинного перевода выбирают дословный перевод и передают ее как недооценивать риск кровотечения. Единицу стоит заменить на устоявшееся эквивалентное соответствие давать заниженную оценку риска кровотечения.

Рассмотрим еще один пример предредактирования. При создании контролируемого текста данное предложение было разделено на несколько частей без потери единиц и смысла. Данное действие было предпринято, поскольку простые предложения помогут системам машинного перевода избежать грамматических ошибок. После этого части предложений были поменены местами, чтобы при осуществлении машинного перевода контролируемого текста избежать сохранения структуры предложения на ИЯ, тем самым сохранив логику изложения. Кроме того, на ПЯ используется англоязычное сокращение, поэтому для адекватной передачи системами машинного перевода единица TOAST была взята в кавычки, как и в первом примере.

Оригинал Предредактирование (контролируемый текст)

In these circumstances, we analysed the MR/-confirmed and TOAST only (standard phenotyping) groups separately and divided the study controls between the two groups to avoid any sample overlap. [11] Therefore, the MR/-confirmed and "TOAST' only (standard phenotyping) groups were analysed separately. The study controls were divided between the two groups to avoid any sample overlap

После создания контролируемого текста он также пропускался через три анализируемые в работе системы машинного перевода. В следующей табл. представлен анализ того, как системы справились с переводом контролируемого текста.

DeepL Переводчик GNMT Яндекс.Переводчик

Поэтому группы, подтвержденные с помощью МРТ и только TOAST (стандартное фенотипирование), были проанализированы отдельно. Контрольные группы исследования были разделены между двумя группами во избежание дублирования выборки Поэтому группы с подтвержденным МРТ и только TOAST (стандартное фенотипиро-вание) анализировали отдельно. Контрольная группа исследования была разделена между двумя группами, чтобы избежать дублирования выборки Поэтому группы, подтвержденные МРТ и только для ТОСТОВ (стандартное фенотипирование), были проанализированы отдельно. Контрольные группы исследования были разделены между двумя группами, чтобы избежать какого-либо перекрытия выборки

Единицы, которые являются медицинскими терминами, а именно - MRI и standard phenotyping и имеют большое значение для данного типа текстов, были правильно идентифицированы всеми анализируемыми в работе системами МП, и при их передаче был использован правильный лексический эквивалент, МРТ и стандартноефенотипирование, соответственно. При переводе классификации TOAST системы МП DeepL и GNMT передают ее путем заимствования сокращения, т. к. данное сокращение не имеет эквивалентного соответствия на русском языке, что является верным вариантом. Однако система Яндекс.Переводчик неправильно идентифицировала данную единицу, несмотря на наличие кавычек. Согласно словарю Multitran, единица study controls имеет два значения в зависимости от контекста или контрольные группы, или контрольные образцы. Согласно нашему контексту применим вариант контрольные образцы, так как речь идет об анализах крови. Данная ошибка является серьезной, так как нарушает смысл текста. Единица sample overlap является термином из области информатики. Перевод единицы sample overlap предложенный системами МП DeepL и Google Переводчик как дублирования выборки является ошибкой, так как в тексте примера речь идет про пересечение элементов выборки, а не про удвоение одних и тех же данных выборки, поэтому при переводе нарушен смысл. С переводом данной единицы справилась система машинного перевода Яндекс.Переводчик, передав ее как перекрытия выборки, что полностью соответствует контексту.

Далее рассмотрим пример постредактирования машинного перевода медицинских текстов без применения предредактирования.

При передаче единицы CAA Google Переводчик передает ее как ВГА, а две другие системы машинного перевода заимствуют англоязычное сокращение, что также является неверным, поскольку на ПЯ существует собственный эквивалент ЦАА. Системы справились с передачей сокращения MRI. Единица передана путем подбора эквивалентного сокращения. Путем подбора устоявшегося лексического соответствия системы DeepL, Google Переводчик и Яндекс.Переводчик передают единицу atrial fibrillation как фибрилляция предсердий. Все терминологические единицы, вне зависимости от того, правильно ли их распознала система МП, требуют верификации. Однако постредактору необходимо исправить дословный перевод (клиницисты и дилеммам клинического ведения/управления) таких единиц, как clinicians и clinical management dilemmas, т. к. системы МП распознали их неверно. Клиницисты - ложный друг переводчика, в самом общем смысле clinicians в наших реалиях является врачом, и как раз эти самые врачи сталкиваются с проблемами при оказании клинической помощи, а не дилеммами клинического ведения/управления. При переводе системы справились с передачей предложения, не нарушив его смысл, однако сохранили структуру предложения на ИЯ, поэтому необходимо осуществить полное постредактирование. Предложение было разделено на две части. На ИЯ для того, чтобы разделить простые предложения в составе бессоюзного сложного предложения, используется «;». Поэтому на месте «;» можно поставить «.», тем самым получить простые предложения. Это положительно скажется на качестве перевода. Также был изменен порядок слов. После осуществления полного постредактирования читателю легче выстроить связь между элементами предложения, поскольку перевод максимально приближен к переводу, выполненному человеком. В таблице представлен результат полного постредактирования данного предложения.

Рассмотрим еще один пример постредактирования машинного перевода медицинских текстов без применения предредактирования.

Предложение оригинала данного примера передано всеми анализируемыми в статье системами машинного перевода дословно с сохранением структуры предложения на ИЯ. Также были отмечены нарушения в идентификации медицинских терминов. В данном фрагменте сохранен заложенный в него смысл, однако из-за ряда грубых ошибок требуется применить полное постредактирование. Так, например, сокращение TOAST было распознано системой Яндекс. Переводчик как слово тост, но передано с сохранением форматирования Caps Lock. В процессе постредактирования единица заменена на TOAST, то есть оставлена как в оригинале, поскольку в русском языке не существует эквивалентного сокращения, а используется оригинальная единица. Во фрагменте the TOASTonly group - из группы «Только ТОСТ» система Яндекс.Переводчик передает фрагмент фоновой лексики с заглавной буквы. Можно предположить, что система распознала единицу как название какой-либо группы и решила передать ее таким образом, что не является адекватным переводом, поэтому фрагмент был исправлен на группы TOAST. Перевод единицы individuáis - люди/ссоби/па-циенты, предложенный системами, являлся бы верным вне контекста данного фрагмента, однако, вникнув в смысл этого предложения, становится очевидным, что речь идет не про людей/особей/пациентов, а про контрольные образцы, которые были проанализированы один раз. Стоит отметить, что система DeepL не перевела фрагмент фоновой лексики, единицу only, которая не представляет никакой сложности при переводе. Также допустимым приемом было бы опущение данной единицы, однако система ее неправильно распознала и просто пропустила, оставив на ИЯ. После осуществленного анализа данного фрагмента и полного постредактирования с учетом всех деталей предложение было преоб-

Оригинал Deep Переводчик вЫМТ Яндекс.Переводчик Постредактура

Both CAA and atrial fibrillation increase significantly with age, and people may undergo brain MRIs for a variety of indications; therefore, clinicians are more commonly encountering patients with both atrial fibrillation and CAA, resulting in clinical management dilemmas [10] Как САА, так и фибрилляция предсердий значительно увеличиваются с возрастом, а люди могут проходить МРТ головного мозга по разным показаниям; поэтому клиницисты все чаще сталкиваются с пациентами как с фибрилляцией предсердий, так и с САА, что приводит к дилеммам клинического ведения Как ВГА, так и фибрилляция предсердий значительно увеличиваются с возрастом, и люди могут проходить МРТ головного мозга по разным показаниям; поэтому клиницисты чаще сталкиваются с пациентами как с фибрилляцией предсердий, так и с ВГА, что приводит к дилеммам клинического ведения Как САА, так и фибрилляция предсердий значительно увеличиваются с возрастом, и люди могут проходить МРТ головного мозга по различным показаниям; поэтому клиницисты чаще сталкиваются с пациентами как с фибрилляцией предсердий, так и с САА, что приводит к дилеммам клинического управления Пациенты могут проходить МРТ-обследование головного мозга по разным медицинским показаниям в связи с тем, что с возрастом возникновение риска ЦАА и фибрилляции предсердий существенно увеличивается. Врачи все чаще сталкиваются с проблемами при оказании клинической помощи пациентам как с фибрилляцией предсердий, так и с ЦАА

Оригинал DeepL Переводчик GNMT Яндекс.Переводчик Постредактура

Any cases with subsequent MR/ confirmation of lacunar stroke were omitted from the TOAST only group; all individuals were analysed only once [11] Все случаи с последующим МРГ-подтверждением лаку-нарного инсульта были исключены из группы TOAST only; все люди анализировались только один раз Любые случаи с последующим МРТ-подтверждением лакунарного инсульта были исключены из группы только TOAST; все особи были проанализированы только один раз Все случаи с последующим МРТ-подтверждением лаку-нарного инсульта были исключены из группы «Только ТОСТ»; все пациенты были проанализированы только один раз Все контрольные образцы случаев с последующим подтверждением лакунарного инсульта только при помощи МРТ были исключены из группы TOAST, и проанализированы один раз

разовано в следующий вид: «Все контрольные образцы случаев с последующим подтверждением лакунарного инсульта только при помощи МРТ были исключены из группы TOAST и проанализированы один раз».

Таким образом, в ходе работы были проанализированы особенности медицинских текстов в процессе предредактирования машинного перевода, проведен анализ передачи особенностей медицинских текстов в процессе постредактирования машинного перевода на примере следующих систем машинного перевода: DeepL Переводчик, Google Переводчик и Яндекс.Переводчик. В большинстве случаев предредактирование положительно влияло на качество машинного перевода благодаря применению определенного алгоритма действий. При разработке контролируемых текстов стоит уделять особое внимание синтаксису, поскольку из-за сохранения структуры предложения на ИЯ системы машинного перевода нарушают логические связи между элементами предложения, из-за чего при передаче терминов отсутствует единство. В случае с медицинскими терминами предредактирование осуществить не представляется возможным, поскольку данные единицы изменению не подлежат, следовательно, существует вероятность возникновения ошибок при переводе медицинских терминов. Случаи, где термины даны с расшифровкой, являются исключением.

Библиографический список

К машинному переводу медицинских текстов необходимо применять полное постредактирование в силу специфики данного типа текстов. Нами применялись следующие стратегии: чтение машинного перевода и исправление вызывающих сомнения мест с обращением к исходному тексту; верификация терминов, даже если системой они были правильно идентифицированы и переведены, поскольку системы МП не всегда учитывают тематику текста и подбирают соответствия из других областей; проверка каждого компонента текста по исходному фрагменту; исправление синтаксиса, т. к. системы МП оставляют синтаксис ИЯ, что нарушает смысл и является недопустимым при переводе медицинского текста. Было установлено, что анализируемые в работе системы подходят только для полного постредактирования, поскольку необходимо редактирование большого объема информации для достижения приемлемого качества перевода, чтобы обеспечить читающему должное восприятие и понимание текста.

Перспективность дальнейшего исследования заключается в возможности подключения систем автоматизированного перевода для более детального изучения особенностей пред- и постредактирования машинного перевода медицинских текстов.

1. Елизарова Л.В. Предредактирование как средство обеспечения качества машинного перевода = Pre-editing as a way for providing quality of machine translation. Иностранные языки: Герценовские чтения: сборник научных статей. Санкт-Петербург, 2018: 150 - 152.

2. Нелюбин Л.Л. Толковый переводческий словарь. Москва: Флинта, 2003.

3. Дроздова К.А. Машинный перевод: история, классификация, методы. Филологические науки в России и за рубежом: материалы III Международной научной конференции. Санкт-Петербург: Свое издательство, 2015: 139 - 141.

4. Беляева Л.Н. Машинный перевод в работе переводчика: практический аспект. Вестник ПНИПУ. Проблемы языкознания и педагогики. 2019; № 2. Available at: https:// cyberleninka.ru/article/n/mashinnyy-perevod-v-rabote-perevodchika-prakticheskiy-aspekt

5. Чакырова Ю.И. Постредактирование в транслатологической парадигме. Вестник ПНИПУ. Проблемы языкознания и педагогики. 2013; № 8: 137 - 144.

6. PROMT. Available at: https://www.promt.ru/images/postediting.pdf

7. Пономаренко Л.Н., Мишутинская Е.А., Злобина И.С. Лингвостилистические особенности медицинских текстов в переводческом аспекте. Гуманитарная парадигма. 2018; № 1 (4): 9 - 14.

8. Профессиональный тренинг переводчика: учебное пособие по устному и письменному переводу для переводчиков и преподавателей. Санкт-Петербург: Союз, 2001.

9. Стеблецова А.О., Торубарова И.И. Некоторые особенности перевода медицинских текстов: постпереводческий анализ научной статьи. Мир науки, культуры, образования. 2019; № 1 (74). Available at: https://cyberleninka.rU/article/n/nekotorye-osobennosti-perevoda-meditsinskih-tekstov-post-perevodcheskiy-analiz-nauchnoy-stati

10. Screening and management of atrial fibrillation in primary care. The BMJ. Available at: https://doi.org/10.1136/bmj.n379

11. Genetic basis of lacunar stroke: a pooled analysis of individual patient data and genome-wide association studies. The Lancet. Available at: https://doi.org/10.1016/S1474-4422(21)00031-4

References

1. Elizarova L.V. Predredaktirovanie kak sredstvo obespecheniya kachestva mashinnogo perevoda = Pre-editing as a way for providing quality of machine translation. Inostrannye yazyki: Gercenovskie chteniya: sbornik nauchnyh statej. Sankt-Peterburg, 2018: 150 - 152.

2. Nelyubin L.L. Tolkovyj perevodcheskij slovar'. Moskva: Flinta, 2003.

3. Drozdova K.A. Mashinnyj perevod: istoriya, klassifikaciya, metody. Filologicheskie nauki v Rossii i za rubezhom: materialy III Mezhdunarodnoj nauchnoj konferencii. Sankt-Peterburg: Svoe izdatel'stvo, 2015: 139 - 141.

4. Belyaeva L.N. Mashinnyj perevod v rabote perevodchika: prakticheskij aspekt. VestnikPNIPU. Problemyyazykoznaniya ipedagogiki. 2019; № 2. Available at: https://cyberleninka. ru/article/n/mashinnyy-perevod-v-rabote-perevodchika-prakticheskiy-aspekt

5. Chakyrova Yu.I. Postredaktirovanie v translatologicheskoj paradigme. Vestnik PNIPU. Problemy yazykoznaniya i pedagogiki. 2013; № 8: 137 - 144.

6. PROMT. Available at: https://www.promt.ru/images/postediting.pdf

7. Ponomarenko L.N., Mishutinskaya E.A., Zlobina I.S. Lingvostilisticheskie osobennosti medicinskih tekstov v perevodcheskom aspekte. Gumanitarnayaparadigma. 2018; № 1 (4): 9 - 14.

8. Professional'nyj trening perevodchika: uchebnoe posobie po ustnomu i pis'mennomu perevodu dlya perevodchikov i prepodavatelej. Sankt-Peterburg: Soyuz, 2001.

9. Steblecova A.O., Torubarova I.I. Nekotorye osobennosti perevoda medicinskih tekstov: postperevodcheskij analiz nauchnoj stat'i. Mir nauki, kul'tury, obrazovaniya. 2019; № 1 (74). Available at: https://cyberleninka.ru/article/n/nekotorye-osobennosti-perevoda-meditsinskih-tekstov-post-perevodcheskiy-analiz-nauchnoy-stati

10. Screening and management of atrial fibrillation in primary care. The BMJ. Available at: https://doi.org/10.1136/bmj.n379

11. Genetic basis of lacunar stroke: a pooled analysis of individual patient data and genome-wide association studies. The Lancet. Available at: https://doi.org/10.1016/S1474-4422(21)00031-4

Статья поступила в редакцию 04.07.22

УДК 81'37

Andreeva E.Yu., teacher, Financial University under the Government of the Russian Federation (Moscow, Russia), E-mail: [email protected] Glushkova N.M., Cand. of Sciences (Philology), senior teacher, Financial University under the Government of the Russian Federation (Moscow, Russia), E-mail: [email protected]

SYNTACTIC MEANS OF EXPRESSING EMOTIVITY IN AN ENGLISH LITERARY TEXT AND THEIR TRANSLATION INTO RUSSIAN. The article raises a problem of analysis of emotive means in a literary text, which is relevant for the modern linguistics. The purpose of the article is to study syntactic figures containing emotive components. In this article, the authors solve the following tasks: analysis of approaches to the definition of concepts "emotionality" and "emotivity", consideration of modern classifications of syntactic means of expressing emotions in a literary text, identification of various means of conveying the emotional state of the characters of a biographical novel at the syntactic level and their translation into Russian. The scientific novelty of this study lies in the fact that for the first time a comparative analysis of construction features of three works of the novel-biography genre and their translation into Russian at the level of emotive syntax is carried out. The practical value of this study lies in the idea that observations and conclusions proposed in this paper can be used in the development of special courses on linguistics of a literary text, as well as in preparation of course programs and manuals for teaching translators to use various syntactic techniques in the process of translating literary texts from English into Russian. The authors of the study believe that this work will serve as reason for further study of the linguistic features of the biographical genre from the point of view of their emotive components, and will also contribute to the comparative theory of the syntax of various languages. Key words: emotionality, emotiveness, biographical novel, syntax, means of emotiveness.

ЕЮ. Андреева, преп., Финансовый университет при Правительстве Российской Федерации, г. Москва, E-mail: [email protected] Н.М. Глушкова, канд. филол. наук, ст. преп., Финансовый университет при Правительстве Российской Федерации, г. Москва, E-mail: [email protected]

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.