Научная статья на тему 'Перспективы использования программ контент-анализа в переводческой практике'

Перспективы использования программ контент-анализа в переводческой практике Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
348
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ ЯЗЫКОВЫХ ДАННЫХ / КОНТЕНТ-АНАЛИЗ / ТОНАЛЬНОСТЬ ТЕКСТА / СЕМАНТИЧЕСКИЙ АНАЛИЗ / ФОНОСЕМАНТИКА / ПЕРЕВОДЧЕСКИЙ ПРИЁМ / INFORMATION TECHNOLOGIES FOR LANGUAGE DATA PROCESSING / CONTENT ANALYSIS / TEXT SENTIMENT / SEMANTIC ANALYSIS / PHONOSEMANTICS / TRANSLATION METHOD

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Иванова Анна Михайловна, Соболева Татьяна Александровна

В статье приводится описание электронных ресурсов цифровой обработки языковых данных применительно к полным текстам и фрагментам текста. Целью исследования является установление возможности применения результатов контент-анализа, полученных с использованием новых технологий, в переводческой практике и лингвистических исследованиях. Научная новизна исследования заключается в анализе плюсов и минусов использования разнотипных программ цифровой обработки текстов в переводческой перспективе. Полученные результаты показывают значительный потенциал программ анализа тональности текста, фоносемантического анализа и семантического анализа для письменного перевода, но целесообразность их применения определяется жанром и объёмом переводимого текста.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROSPECTS OF USING CONTENT ANALYSIS PROGRAMMES IN TRANSLATION PRACTICE

The article describes electronic resources for digital processing of language data with regard to full texts and text fragments. The purpose of the study is to determine whether the results of a content analysis obtained using new technologies can be applied in translation practice and linguistic research. Scientific novelty of the work lies in analysing advantages and disadvantages of using different types of programmes for digital text processing in respect to translation. The attained results reveal a considerable potential for using programmes for sentiment analysis, phonosemantic analysis and semantic analysis in translation but their applicability depends on the genre and length of the translated text.

Текст научной работы на тему «Перспективы использования программ контент-анализа в переводческой практике»

https://doi.Org/10.30853/filnauki.2020.8.53

Иванова Анна Михайловна, Соболева Татьяна Александровна

Перспективы использования программ контент-анализа в переводческой практике

В статье приводится описание электронных ресурсов цифровой обработки языковых данных применительно к полным текстам и фрагментам текста. Целью исследования является установление возможности применения результатов контент-анализа, полученных с использованием новых технологий, в переводческой практике и лингвистических исследованиях. Научная новизна исследования заключается в анализе плюсов и минусов использования разнотипных программ цифровой обработки текстов в переводческой перспективе. Полученные результаты показывают значительный потенциал программ анализа тональности текста, фоносемантического анализа и семантического анализа для письменного перевода, но целесообразность их применения определяется жанром и объемом переводимого текста.

Адрес статьи: www.gramota.net/materials/2/2020/8/53.html

Источник

Филологические науки. Вопросы теории и практики

Тамбов: Грамота, 2020. Том 13. Выпуск 8. C. 280-285. ISSN 1997-2911.

Адрес журнала: www.gramota.net/editions/2.html

Содержание данного номера журнала: www.gramota.net/materials/2/2020/8/

© Издательство "Грамота"

Информация о возможности публикации статей в журнале размещена на Интернет сайте издательства: www.gramota.net Вопросы, связанные с публикациями научных материалов, редакция просит направлять на адрес: [email protected]

Прикладная и математическая лингвистика

Applied and Mathematical Linguistics

https://doi.org/10.30853/filnauki.2020.8.53 Дата поступления рукописи: 16.06.2020

В статье приводится описание электронных ресурсов цифровой обработки языковых данных применительно к полным текстам и фрагментам текста. Целью исследования является установление возможности применения результатов контент-анализа, полученных с использованием новых технологий, в переводческой практике и лингвистических исследованиях. Научная новизна исследования заключается в анализе плюсов и минусов использования разнотипных программ цифровой обработки текстов в переводческой перспективе. Полученные результаты показывают значительный потенциал программ анализа тональности текста, фоносемантического анализа и семантического анализа для письменного перевода, но целесообразность их применения определяется жанром и объёмом переводимого текста.

Ключевые слова и фразы: информационные технологии обработки языковых данных; контент-анализ; тональность текста; семантический анализ; фоносемантика; переводческий приём.

Иванова Анна Михайловна, к. филол. н. Соболева Татьяна Александровна

Московский городской педагогический университет conraoi@yandex. ru; lange_tatyana@mail. ru

Перспективы использования программ контент-анализа в переводческой практике

Контент-анализ, понимаемый как метод сбора данных и количественно-качественный анализ текста [12], является популярной методикой изучения больших текстовых массивов на предмет установления разнообразных структурно-языковых характеристик (ключевые слова, основные структурные компоненты, частотные семантические категории и т.д.), а также характеристик автора текста (идиостиль, коммуникативные интенции) и целевой аудитории. Настоящее исследование призвано решить следующие задачи: 1) представить доступные и популярные электронные ресурсы контент-анализа трёх разных типов; 2) дать критическую оценку каждому продукту в плане эффективности его применения в практике перевода и при проведении научных лингвистических исследований на переводческую тематику.

Теоретическая база исследования. Стоит отметить, что вопрос применения современных цифровых технологий для повышения качества переводческой деятельности и в процессе обучения переводу в высшей школе в теоретической литературе освещается достаточно однобоко - в сфере письменного перевода в центре внимания исследователей находится проблема автоматизации процесса перевода через использование программ машинного перевода (Machine Translation) и «памяти переводов» (Translation Memory) (см., например, [3; 6; 9] и мн. др.). Тем не менее в источниках можно проследить общую мысль о том, что молодым переводчикам часто не хватает знаний о том, как эффективно пользоваться ресурсами Интернета для решения конкретных практических задач и как выбрать из обширного банка ресурсов самого разного качества и степени надёжности те, которые обеспечат нужный результат.

В настоящее время в помощь переводчику разработан целый ряд систем, которые выполняют перевод всего текста или отдельных его фрагментов: электронные словари, программы поддержки локализации, программы машинного перевода и т.д. Эти системы успешно применяются для автоматизации и ускорения рутинной части переводческого процесса, но не решают вопроса обеспечения качественных результатов. Однако для решения сложных задач переводчикам необходимо представление о вспомогательных электронных ресурсах, позволяющих установить и преодолеть конкретную переводческую трудность. В силу названных причин изучение возможного использования программ контент-анализа для быстрого ознакомления с лингвистическими, содержательными и прагматическими характеристиками подлежащего переводу текста является актуальным.

Хотя контент-анализ традиционно применяется в сфере маркетинга и в исследованиях медийного пространства [7; 10; 17], а также лингвистики [18], особенности данного метода делают его ценным инструментом

в арсенале практикующего переводчика. Во-первых, контент-анализ предполагает перевод вербальной информации в объективные невербальные (цифровые, количественно обработанные) данные, интерпретация которых позволяет исследователю выйти за пределы собственно текста и делать выводы о социальных аспектах окружающей действительности [13, с. 14]. Во-вторых, контент-анализ позволяет отметить ценностные и эмотивные характеристики участников коммуникации (автора текста и его аудитории), основные коммуникативные стратегии и тактики, выбираемые автором для реализации своих коммуникативных интенций, частотные персуазивные средства. Как следствие, интерпретируя результаты контент-анализа, практикующий переводчик сможет получить достаточно полное представление о прагматическом потенциале подлежащего переводу текста, выявить скрытые элементы содержания, отметить психологические и социальные характеристики автора и его аудитории - то есть узнать все то, что так или иначе влияет на ход процесса перевода и позволяет обеспечить максимально возможное качество конечного продукта.

Безусловно, на практике переводчикам не приходится выполнять глобальные исследовательские задачи по анализу больших массивов текстов определенного жанра с целью выявления частотности использования тех или иных семантических категорий [11] или стереотипов общественного сознания [4; 5]. Тем не менее в их распоряжении в настоящее время имеется значительное количество интересных электронных ресурсов, позволяющих оперативно проводить анализ квантитативных характеристик текстов любого объема (в том числе малых текстов, фрагментов текстов, отдельных словосочетаний и слов). Как представляется, студентов, обучающихся на направлении «Перевод и переводоведение», следует ознакомить с некоторыми из этих цифровых продуктов и тем, каким образом их использование может помочь им повысить качество создаваемых ими переводов.

Практическая значимость исследования определяется возможностью создания библиотеки соответствующих цифровых ресурсов, позволяющих оперативно обработать некоторый текст для решения определённой переводческой задачи. Основными методами исследования являются сравнительный метод и метод эмпирического наблюдения, подразумевающие сопоставление двух или более объектов наблюдения с целью регистрации и сопоставления их характеристик по необходимым параметрам.

Представляющие наибольший интерес программы контент-анализа можно поделить на три основные группы: 1) программы, осуществляющие анализ тональности (эмотивности) текста; 2) электронные продукты, предназначенные для фоносемантического анализа слова/текста; 3) более комплексное ПО, призванное осуществлять всесторонний семантический и грамматический анализ текста или массивов текстов. Рассмотрим, каким образом переводчики могут задействовать ресурсы из каждой категории, и насколько целесообразным представляется их использование в плане повышения качества перевода.

Анализ тональности текста (англ. Sentiment Analysis / Opinion Mining). Подобные программы могут рассматриваться как инструменты контент-анализа (хотя по сути таковыми не являются), так как настроены на поиск оценочной и эмотивной лексики в тексте по заранее составленным тональным словарям или правилам. По совокупности найденной «негативной» и «позитивной» лексики тональность текста оценивается по поляризованной балльной шкале, отображающей диапазон эмоциональной интенсивности высказывания (т.н. «сенти-мент») в цифрах со знаками «плюс» и «минус». Популярный ресурс в данной категории - бесплатный онлайн-сервис SentiStrength [25], предназначенный для анализа отдельных высказываний на английском и некоторых других языках (включая немецкий и русский), а также его полная платная версия (изначально алгоритм разрабатывался для анализа коротких неформальных высказываний в социальной сети MySpace). При автоматическом определении тональности текста программа в первую очередь анализирует лексическую составляющую (наличие в тексте лексики с оценочным и эмотивным значением, занесённой в базу программы с разметкой по степени интенсивности), а также пунктуацию (например, наличие в высказывании восклицательных знаков).

Для лингвиста природа программ типа «Анализ тональности» (Sentiment Analysis and Opinion Mining) может оказаться неочевидной, так как разработчики создают их не для решения лингвистических задач, а для проведения социологических, политологических, маркетинговых и психологических исследований в ходе мониторинга социальных сетей. Инструментом поиска и классификации тональности, понимаемой как субъективная позиция говорящего относительно темы высказывания (она определяется как «нейтральная», «положительная» или «отрицательная») [19], становится обработка естественного языка. Технологические подходы к установлению и классификации тональности в текстовых массивах различаются (основанный на правилах, основанный на словарях, машинное обучение и др.), но в случае с SentiStrength для анализа текста используются так называемые тональные словари (Affective Lexicons). В простом виде тональный словарь представляет собой список слов со значением тональности для каждого слова в виде цифры со знаком плюс или минус. Программа «находит» в анализируемом тексте те слова, что присутствуют в словаре, и присваивает им соответствующие значения тональности, после чего вычисляет общую тональность всего текста. Как следствие, программа может совершать следующие типы ошибок: 1) пропускать как «нейтральные» слова с оценочным/эмотивным значением, если они пока не представлены в тональном словаре (Doch as dürfte an der wachsenden Verachtung [? - рус. «презрение»] nichts ändern. / Возможно, это связано с усиливающимся презрением) (здесь и далее, где не указан иной источник, перевод осуществлен авторами статьи. - А. И., Т. С.); 2) оценивать нейтральные высказывания как «эмоционально заряженные» из-за наличия в них лексемы из тонального словаря (Could you advise me some interesting [оценка 2] book? / Можете посоветовать мне какую-нибудь интересную книгу?) и предложения с иронией и сарказмом (Просто потрясающе [оценка 4], всё опять придётся переделывать); 3) оценивать как эмоциональные нейтральные высказывания, содержащие оценочную/эмоциональную лексику, но говорящий высказывает не своё «заряженное» эмоциями мнение, а просто констатирует факт

(Despite her deep-rooted fear [оценка -4] of animals she adored [оценка 4] cats. / Животных она всегда боялась, но кошек обожала). Необходимо отметить, что примеры созданы авторами настоящей статьи для иллюстрации работы программы SentiStrength и совершаемых ошибок.

Кроме того, при проведении лингвистических исследований также следует учитывать, что тональность (sentiment) в компьютерной лингвистике понимается как мнение (ср. определение из Oxford Dictionary, где дефиниция sentiment - "a view or opinion that is held or expressed / general feeling or opinion / а feeling or emotion " [24] («имеющийся или выражаемый взгляд или мнение / общее ощущение или мнение / чувство или эмоция»)), что несколько расходится с традиционными лингвистическими представлениями об оценочности и эмо-тивности (оценочность - субъективное суждение о сущностных качествах объекта речи, в чистом виде рациональное, эмотивность - эмоциональное отношение к нему говорящего [15]). Хотя алгоритм прочно ассоциируется с определением эмоционального фона текста, в тональном словаре содержатся рациональные оценки без эмотивной составляющей (The results taken together would be more useful [оценка 2] than taken separately. / Более практично рассматривать данные результаты вместе, а не по отдельности). Как следствие, можно рекомендовать лингвистам контролировать процесс обработки текстов данной компьютерной программой и использовать её применительно к небольшим текстовым фрагментам, чтобы не произошла смена темы высказывания.

Хотя по умолчанию программа SentiStrength предназначена для анализа высказываний в социальных сетях и комментариев пользователей тех или иных сайтов, данный ресурс тем не менее можно эффективно задействовать в переводческой практике для сопоставления «градуса» оценочности/эмоциональности высказывания на языке оригинала и языке перевода. В переводческой практике первоочередную важность имеет корректная передача коммуникативной установки автора сообщения, при этом эквивалентность на уровне семантики отдельных единиц не является обязательным критерием качества перевода. SentiStrength позволяет сравнить тональности оригинального и переводного высказывания в целом и при необходимости внести соответствующие корректировки. Так, например, русскоязычный контекст «Запрет будет достаточно жёстким и для экономики тех стран, которые занимаются этой санкционной деятельностью» программа оценивает как «не позитивный» (оценка 1) и «средней степени негативный» (оценка -3). Предложенный профессиональным переводчиком английский вариант "The ban would have been quite a severe blow for countries that introduced sanctions " оценивается как «не позитивный» (оценка 1) и «немного негативный» (оценка -2). Если принимать во внимание данные результаты, то можно предположить, что при переводе был использован приём деинтенсификации (здесь и далее примеры перевода - с официального сайта президента России kremlin.ru [14]. - А. И., Т. С.).

В примере «Поэтому я считаю, наша позиция была изначально абсолютно выверенной и объективной». / "Therefore, I believe that our position was completely justified and objective from day one " эмоциональная тональность и русского, и английского предложений оценивается одинаково как нейтральная (оценки 1 и -1), то есть переводчик сохранил интенсивность оригинального высказывания. Русский контекст «Когда мы столкнулись с таким санкционным незаконным беспределом, в Правительстве начали думать о том, чем ответить» оценивается как «совсем не позитивный» (оценка 1) и «немного негативный» (оценка -2), тогда как предложенный английский эквивалент "When we came face to face with this outrageous sanctions regime, the Government started thinking about how to retaliate" - как «совсем не позитивный» (оценка 1) и «в значительной степени негативный» (оценка -4), то есть в данном случае имеет место интенсификация. Также приведём пример использования SentiStrength для анализа переводов с немецкого на русский язык (контекст из статьи в газете Frankfurter Allgemeine [23] в профессиональном переводе на русский [20] от сайта ИноСМИ. - А. И., Т. С.), ср.: Schon immer wurde gegen die zweite Gasleitung von Russland nach Deutschland protestiert [оценка -2]. / Против [оценка -2] второго газопровода из России в Германию протестовали всегда. В данном случае общая тональность немецкого и русского контекстов совпадает («немного негативный»), несмотря на то, что алгоритм оценивает как тональные разные слова (Рисунок 1).

J-SentiStrength

|The text 'Всегда протестовали против второго газопровода из России в Германию, has positive strength 1 and negative strength -2]

\Approximate classification rationale: Всегда протестовали против[-2] второго газопровода из России [proper noun] в Германию [proper nounl .[sentence: 1,-21 Г result: max + and - of any sentencelloverall result = -1 as posc-neg] (Russian)|

"^SentiStrength

[Tire text 'Sihon immer wurde gegen die zweite Gasleitung von Russland nach

Deutschland protegiert.'_

has positive strength 1 and negative strength -2|

Approximate classification rationale; :■ ^I;; i immer wurde gegen die zweite Gasleitung

[proper nounl von Russland [proper nounl nach Deutochland [proper nounl_

[imlphliprlf-^" .fspjitpiicH: 1,-^1 [ipMilt: mrtx t^ihI - r>L" d r I y • 11 p • 11 ^" [ t iv er --111 : p1-.1.111

-1 as pos^-negl 11^1;

Рисунок 1. Программа SentiStrength: оценка тональности оригинала и перевода

Таким образом, начинающим переводчикам можно рекомендовать сравнивать при помощи SentiStrength тональность (оценочно-эмоциональный потенциал) оригинального и переведённого контекстов, чтобы отдавать себе отчёт в использовании переводческих приёмов интенсификации и деинтенсификации оценки, а также чтобы получить более полное представление об интенциях автора и его психологическом настрое.

Фоносемантический анализ слов и малого текста. Программа VAAL - российская разработка, созданная для качественно-количественного анализа звуковой оставляющей того или иного высказывания. Программа изначально предназначена для маркетинговых исследований, так как позволяет, как утверждают разработчики, «прогнозировать эффект неосознаваемого воздействия текстов на массовую аудиторию» [16, с. 60] на основе их фоносемантических характеристик (прежде всего, «словаря» звуков того или иного языка и связанных

с ними ассоциаций в виде шкалы из 24 пар антонимичных прилагательных русского языка). Можно воспользоваться как бесплатным ПО для работы с отдельными словами и текстами любого объема, так и он-лайн-сервисом для отдельных слов.

Разработчики утверждают, что VAAL способен оценивать «неосознаваемое эмоциональное воздействие фонетической структуры текстов и отдельных слов на подсознание человека... прогнозировать эффект неосознаваемого воздействия текстов на массовую аудиторию, составлять тексты с заданным вектором воздействия, выявлять личностно-психологические качества авторов текста» [26]. В переводческой практике, как показывает опыт, данный сервис может пригодиться при переводе названий некоторой продукции и рекламных слоганов - так, в русском переводе «неудачные» слова (то есть вызывающие нежелательные ассоциации) могут быть заменены на более благозвучные варианты.

Так, например, согласно VAAL, звуковая составляющая рекламы кофе-капучино по-техасски в Макдональдс «Немного нежности для сурового ковбоя. Такого не найдешь ни в одном салуне! Попробуй капучино с пряными ореховыми нотками и взбитой пенкой. Воздушной, как облака на небе Техаса» [8] не вызовет у реципиента негативных ассоциаций, только положительные (такие ассоциации, как хороший, величественный, мужественный, сильный, громкий). Напротив, реклама помады от Maybelline «Попробуй суперстойкие оттенки жидкой помады SuperStay Matte Ink. Создай роскошный цвет с притягательным матовым эффектом с помощью уникального аппликатора» [22] характеризуется негативно - как вызывающая ощущение чего-то плохого, отталкивающего, тёмного, слабого, низменного, печального. Если содержание данного фрагмента переформулировать следующим образом: «Оцени новую суперстойкую жидкую помаду SuperStay Matte Ink и удобный аппликатор, гарантирующий идеальное нанесение. Выбери любой из соблазнительных оттенков с потрясающим матовым эффектом», - то фоносемантическая оценка текста получается положительной и включает такие ассоциации, как красивый, легкий, нежный, женственный и слабый. Данные изменения в оценках фоносемантики рекламного текста Maybelline отображены на Рисунке 2.

Попробуй суперстойкие оттенки жидкой помады SuperStay Matte Ink. Создай роскошный цвет с притягательным матовым эффектом с помощью уникального аппликатора

Оцени новую суперстойкую жидкую помаду SuperStay Matte Ink и удобный аппликатор, гарантирующий идеальное нанесение. Выбери любой из соблазнительных оттенков с потрясающим матовым эффектом

Рисунок 2. Оценка рекламного текста Maybelline программой VAAL: оригинал и изменённый вариант

Таким образом, студентам-переводчикам можно рекомендовать использовать данную программу для оценки персуазивного потенциала переведённых ими малых текстов рекламного характера.

Применительно к другим дискурсам и жанрам, кроме рекламного, использование VAAL представляется неэффективным, так как результаты анализа текстов значительного объёма (а иногда и отдельных слов) невозможно однозначно или просто логично интерпретировать. Ср. прилагательные-ассоциации к слову «котенок» - шероховатый, угловатый, тихий, подвижный, тусклый, печальный, а также к жизнерадостной моти-вационной статье из женского журнала Cosmopolitan «14 идей, как незабываемо провести майские праздники в Москве» [1] - плохой, отталкивающий, страшный, шероховатый, угловатый, злой, грубый, мужественный, подвижный. Основное возражение против использования данной программы для анализа текстов, не являющихся краткими рекламными описаниями или неймами, состоит в том, что их авторы используют другие разнообразные средства воздействия на аудиторию и не имеют потребности или возможности контролировать звуковой состав, а исследовать случайно возникающие эффекты нецелесообразно.

Семантический анализ текста посредством программ контент-анализа представляет собой комплексную процедуру семантической классификации элементов текста (представленной статистически), извлечения «ключевых» слов и структурно-лингвистического анализа содержания. Одна из самых популярных программ подобного типа - Tropes - доступна для бесплатного скачивания, но ограничена в своем функционале английским и французским языками. Tropes определяет: 1) стиль текста; 2) хронологию описываемых в нем событий; 3) ключевые слова (частотно повторяющиеся слова и словосочетания в тексте, описывающие его тематику и основное содержание); 4) коммуникантов и их роли (на основе количества личных местоимений);

5) части речи (класс, частотность); 6) главные эпизоды (структурные или дискуссионные блоки, этапы развития идеи); 7) модальность и мн. др. Как следствие, данная программа может выполнить более комплексную задачу, чем все предыдущие - «самостоятельно» определить тематику анализируемого текста, логику его построения, ключевые параметры на разных уровнях языка, дать характеристику идиостилю автора, выделить различные типы оценочной лексики.

Как и другие электронные продукты контент-анализа, программы семантического анализа текста по умолчанию предназначены для решения маркетинговых целей - в частности, для исследования эффективных рекламных кампаний с целью понять причины их успеха на вербальном уровне. Так, например, контент-анализ языкового содержания раздела "Made to Play" [21] на официальном сайте бренда Nike (раздел, рассказывающий о социальной инициативе Nike по стимулированию физической активности школьников) показывает, что текст в целом представляет собой описание (style rather descriptive) в настоящем времени (setting in the real), ключевые слова, представляющие тему, - sport, game, difference, world. Авторы отдают предпочтение глаголам состояния (37,7%), участники коммуникации - we и you представлены в одинаковой пропорции (по 33,3%), то есть имеет место имитация диалога между автором и читателем, прилагательные преобладают над числительными (17 и 7), когезия в тексте чаще представлена в варианте конструкций-сравнений (18,2%). Как представляется, большое количество обрабатываемых параметров делает Tropes ценным помощником в рамках разнообразных лингвистических исследований (не только в рамках рекламного дискурса, но и в других стилях, включая художественный). Для переводчиков Tropes представляет интерес как инструмент оценки прагматической составляющей и персуазивного потенциала переводимого англоязычного текста (стиль изложения, ассертивность автора, количество модальных единиц, оценочных прилагательных, глаголов действия и состояния, числительных и т.д.), а также определения доминант перевода - конкретных языковых элементов, наиболее важных как для понимания текста, так и для передачи его смыслов и коммуникативной задачи на другом языке (прежде всего, ключевые слова и включающие их семантические ряды). В процессе обучения переводу студентам можно предложить использовать данную программу контент-анализа на этапе предпереводческого анализа текста, так как получаемые с ее помощью данные во многом отвечают критериям, предъявляемым к результатам предпереводческого анализа (например, см. подробнее в [2]), при этом на обработку текста уходит незначительное количество времени.

Проведённый анализ позволяет сделать выводы о том, что цифровые воплощения метода контент-анализа больших массивов данных - программы, изначально разрабатываемые для проведения социологических, маркетинговых и психологических исследований, - могут найти своё применение в переводческой практике, так как позволяют получить представление о характеристиках того или иного текста на разных языковых уровнях и его прагматической составляющей. Тем не менее в силу первоначальной специфики их использование является максимально эффективным применительно к анализу интернет-дискурса и жанров массмедиального стиля, а результаты такого анализа требуют критического осмысления. Программа анализа тональности текста SentiStrength позволяет получить представление об эмоционально-оценочном фоне текста, с которым работает переводчик, и сравнивать эмоциональную напряжённость переводного контекста с оригиналом, но имеет определённые несовершенства, обусловленные недостаточным размером встроенного в неё словаря и сложностью аксиологической и эмоциональной сферы человеческой деятельности. Разработка VAAL может быть полезна при анализе и переводе наименований и малоформатных рекламных текстов, персуазивный эффект которых может задаваться на уровне их фонематического состава. ПО Tropes позволяет осуществлять достаточно полноценный предпереводческий анализ текста на содержательном и языковом уровнях, при этом могут анализироваться тексты не только массмедиального, но и других стилей и жанров. В качестве перспективы представляется возможным указать исследование других недавно появившихся цифровых технологий обработки текстов, потенциально способных помочь переводчикам выполнять высококачественные переводы, а лингвистам - эффективно исследовать большие массивы текстов на предмет наличия в них определённых закономерностей, формирующих квалитативный показатель.

В заключение хотелось бы еще раз подчеркнуть необходимость активного внедрения в процесс подготовки будущих переводчиков разнообразных электронных ресурсов, позволяющих быстро и качественно переводить тексты большого объема, так как это не столько «веяние моды» на всё высокотехнологичное и цифровое, сколько острая необходимость в автоматизации и оптимизации обработки растущих массивов текстовой информации и постоянном развитии своих компетенций в сфере высоких технологий для успешной конкуренции специалистов-гуманитариев на рынке труда будущего.

Список источников

1. 14 идей, как незабываемо провести майские праздники в Москве [Электронный ресурс] // Cosmopolitan. URL: https://www.cosmo.ru/lifestyle/travel/14-idey-kak-nezabyvaemo-provesti-mayskie-prazdniki-v-moskve/ (дата обращения: 15.05.2020).

2. Аникина О. В. Формирование умений предпереводческого анализа профессионально ориентированных текстов у студентов нелингвистических специальностей // Сибирский педагогический журнал. 2010. № 8. С. 66-78.

3. Беляева Л. Н. Машинный перевод в работе переводчика: практический аспект // Вестник Пермского национального исследовательского политехнического университета. Проблемы языкознания и педагогики. 2019. № 2. С. 8-20.

4. Бурганова Л. А., Ахмадеева К. Н. Гендерные стереотипы в управлении (анализ дискурсивных технологий СМИ) // Власть. 2010. № 3. С. 65-69.

5. Егорова Е. С. Социология рекламы и мультикультурализм // Современные проблемы науки и образования. 2011. № 5. С. 131-132.

6. Красавина О. И., Ветрова О. Г. Информационно-технологическая составляющая переводческой компетенции // Научно-технические ведомости Санкт-Петербургского государственного политехнического университета. Гуманитарные и общественные науки. 2011. № 1 (118). С. 79-83.

7. Кузьмина Е. А. Специфика коммуникативного воздействия визуальной политической рекламы: региональный аспект // Вестник Саратовского государственного социально-экономического университета. 2011. № 4 (38). С. 163-165.

8. Макдоналдс в России [Электронный ресурс]: официальный сайт. URL: https://mcdonalds.ru/ (дата обращения: 05.10.2019).

9. Морозкина Е. А., Шакирова Н. Р. Использование информационных технологий для оптимизации процесса перевода // Вестник Башкирского университета. 2012. Т. 17. № 1 (1). С. 544-546.

10. Московская Ю. М. Портрет современной семьи и характеристика межпоколенных связей в телевизионной рекламе // Социальные и гуманитарные науки: теория и практика. 2018. № 1 (2). С. 475-483.

11. Мышляева А. А. Семантика и синтактика рекламы парфюмерной продукции: опыт контент-аналитического исследования // Актуальные проблемы современной медиалингвистики и медиакритики в России и за рубежом: II Между-нар. науч. семинар (05-07 октября 2016 г.): сб. науч. работ. Белгород: ИД «Белгород», 2016. С. 121-127.

12. Ньюман Л. Неопросные методы исследования // Социологические исследования. 1998. № 6. С. 119-129.

13. Пашинян И. А. Контент-анализ как метод исследования: достоинства и ограничения // Научная периодика: проблемы и решения. 2012. № 3 (9). С. 13-18.

14. Президент России [Электронный ресурс]: официальный сайт. URL: http://www.kremlin.ru/ (дата обращения: 11.10.2019).

15. Солодилова И. А., Шепеля И. В. Оценочность и эмотивность в семантике слова // Вестник Оренбургского государственного университета. 2015. № 11 (186). С. 172-178.

16. Студенцова А. А., Голомзик Е. И. Контент-анализ рекламных текстов // Сборник работ 69-й научной конференции студентов и аспирантов Белорусского государственного университета (г. Минск, 14-17 мая 2012 г.): в 3-х ч. Мн.: БГУ, 2013. Ч. 2. С. 59-62.

17. Цветова Е. Р. Контент-анализ рекламы автомобильных компаний в глянцевых ежемесячных журналах в 2008 году // Телескоп: журнал социологических и маркетинговых исследований. 2009. № 5. С. 46-50.

18. Чернобровкина Е. П. Контент-анализ в лингвистических исследованиях // Вестник Бурятского государственного университета. 2011. № 11. С. 125-129.

19. Feldman R., Sanger J. The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data. Cambridge: Cambridge University Press, 2006. 424 р.

20. Frankfurter Allgemeine Zeitung (Германия): в возмущении Германии есть что-то лицемерное [Электронный ресурс] // ИноСМИ. URL: https://news.rambler.ru/europe/44352686-frankfurter-aUgemeine-zeitung-germaniya-v-vozmuschenii-germanii-est-chto-to-litsemernoe/?article_index=1 (дата обращения: 18.06.2020).

21. Made to Play [Электронный ресурс] // Nike.com. URL: https://www.nike.com/made-to-play/ (дата обращения: 20.11.2019).

22. Maybelline New York [Электронный ресурс]: официальный сайт. URL: https://www.maybelline.com.ru/ (дата обращения: 15.10.2019).

23. Nord Stream 2: Die deutsche Empörung hat etwas Heuchlerisches [Электронный ресурс] // Frankfurter Allgemeine. URL: https://www.faz.net/aktuell/politik/ausland/nord-stream-2-die-deutsche-empoerung-hat-etwas-heuchlerisches-16814326.html (дата обращения: 18.06.2020).

24. Oxford Advanced Learner's Dictionary [Электронный ресурс]. URL: https://www.oxfordlearnersdictionaries.com/ definition/english/ (дата обращения: 23.05.2020).

25. SentiStrength [Электронный ресурс]. URL: http://sentistrength.wlv.ac.uk/ (дата обращения: 10.06.2020).

26. VAAL [Электронный ресурс]. URL: http://www.vaal.ru/prog/free.php (дата обращения: 04.05.2020).

Prospects of Using Content Analysis Programmes in Translation Practice

Ivanova Anna Mikhailovna, PhD Soboleva Tatiana Aleksandrovna

Moscow City University conraoi@yandex. ru; lange_tatyana@mail. ru

The article describes electronic resources for digital processing of language data with regard to full texts and text fragments. The purpose of the study is to determine whether the results of a content analysis obtained using new technologies can be applied in translation practice and linguistic research. Scientific novelty of the work lies in analysing advantages and disadvantages of using different types of programmes for digital text processing in respect to translation. The attained results reveal a considerable potential for using programmes for sentiment analysis, phonosemantic analysis and semantic analysis in translation but their applicability depends on the genre and length of the translated text.

Key words and phrases: information technologies for language data processing; content analysis; text sentiment; semantic analysis; phonosemantics; translation method.

i Надоели баннеры? Вы всегда можете отключить рекламу.