Научная статья на тему 'ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНЫХ ПРОГРАММ ДЛЯ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ СЕМАНТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ ТЕКСТОВ КАК ФАКТОРА КОНФЛИКТА ИНТЕРПРЕТАЦИЙ'

ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНЫХ ПРОГРАММ ДЛЯ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ СЕМАНТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ ТЕКСТОВ КАК ФАКТОРА КОНФЛИКТА ИНТЕРПРЕТАЦИЙ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
смысловая неопределенность / двусмысленность / компьютерные программы / юридический дискурс / рекламный текст / конфликт интерпретаций / сравнение текстов по сходству / обратный машинный перевод / semantic uncertainty / ambiguity / computer programs / legal discourse / advertising text / interpretative conflict / text comparison by similarity / reverse machine translation

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Иркова Анна Валентиновна

Представленное исследование отражает изучение актуальных лингвоюридических проблем в сфере правового дискурса, медийной коммуникации. Предмет исследования связан с реализацией смысловой неоднозначности лексики. В рамках исследования обозначен авторский интерпретационный анализ с использованием компьютерных способов выявления и профилактики смысловой неопределенности текстов, при котором комбинируется сравнение исходного русского текста с текстом-ОМП для определения специфичности переводимого текста и установления степеней переводимости как свойств переводимых единиц (слов, словосочетаний и т. п.). В целом продемонстрирован новый взгляд на изучение проблем диффузной семантики законодательных текстов и потенциальной неопределенности рекламных текстов экологической направленности посредством лингвистического анализа, основанного на обработке данных, полученных при ОМП через переводчик Google на английский и китайский языки. Методология исследования носит комплексный характер и подходит для рассмотрения разных типов текста (художественных, законодательных, медийных, текстов социальных сетей и т. п.), может способствовать проведению грамотной лингвистической экспертизы текстов с целью выявления в них потенциальных генераторов конфликтов интерпретаций. Результаты исследования связаны с перспективами создания базы данных текстов, расширением материала для изучения, привлечением других систем автоматизированного перевода. Сформулированные выводы позволяют установить тенденции в зоне напряженности интерпретации медийных и правовых дискурсов рядовыми носителями языка; раскрывают фрагменты текстов с точки зрения наличия и (или) отсутствия в них неоднозначных речевых единиц. Отмечено воздействие дискурса на становление смысловой неопределенности в рамках корреляции степени переводимости и степени понятности текстов. Показано, что правовой дискурс наиболее переводим (71,07 %; язык-посредник: английский). При ОМП медийного дискурса наблюдалась наибольшая семантическая дистанция переведенных текстов от оригинала (38,31 %; язык-посредник: китайский). Представленные результаты и выводы исследования могут быть использованы в широком спектре научных и прикладных сфер лингвистической направленности с доминированием юридической составляющей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Иркова Анна Валентиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EMPLOYING COMPUTATIONAL TOOLS TO DETECT AND MITIGATE SEMANTIC UNCERTAINTY IN TEXTS AS A FACTOR OF INTERPRETATIVE CONFLICTS

Abstract. The presented research reflects the study of current linguistic and legal issues within legal discourse and media communication. The study focuses on the implementation of semantic ambiguity in vocabulary. It outlines the author's interpretive analysis using computer-based methods to identify and eradicate semantic uncertainty in texts. This involves comparing the original Russian text with the reverse machine translated one to determine the specificity of the translated text and establish the degrees of translatability as characteristics of the translated units (words, phrases, etc.). The study offers a new perspective on the diffuse semantics of legislative texts and the potential uncertainty in en vironmentally oriented advertising texts, employing linguistic analysis based on the data processed from reverse ma chine translation through Google Translate into English and Chinese. The research methodology is comprehensive and suitable for various text types (fiction, legislation, media, social network texts, etc.), aiding in the competent linguistic examination of texts to identify potential sources of interpretative conflicts. The research results relate to the prospects of creating a text database, expanding the material for study, and incorporating other automated translation systems. The drawn conclusions highlight trends in the interpretation of media and legal discourses by ordinary native speakers, iden tifying text segments in terms of the presence or absence of ambiguous language units. The discourse influence on se mantic uncertainty is discussed, noting the correlation between translatability and text comprehensibility. Legal dis course has been shown to be the most translatable (71.07%; intermediary language: English), while media discourse ex hibited the greatest semantic distance in the translations from the original (38.31%; intermediary language: Chinese). The findings and conclusions are applicable across a broad range of investigative and applied linguistic fields, particu larly those fields that are predominantly influenced by legal considerations.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНЫХ ПРОГРАММ ДЛЯ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ СЕМАНТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ ТЕКСТОВ КАК ФАКТОРА КОНФЛИКТА ИНТЕРПРЕТАЦИЙ»

Инновации и инновационные технологии в науке о языке Innovative technologies and approaches in linguistics

Научная статья

УДК 81'42

DOI: 10.14529/ling240308

ИСПОЛЬЗОВАНИЕ КОМПЬЮТЕРНЫХ ПРОГРАММ ДЛЯ ВЫЯВЛЕНИЯ И ПРЕДОТВРАЩЕНИЯ СЕМАНТИЧЕСКОЙ НЕОПРЕДЕЛЕННОСТИ ТЕКСТОВ КАК ФАКТОРА КОНФЛИКТА ИНТЕРПРЕТАЦИЙ

А.В. Иркова, [email protected]

Кемеровский государственный университет, Кемерово, Россия

Аннотация. Представленное исследование отражает изучение актуальных лингвоюридических проблем в сфере правового дискурса, медийной коммуникации. Предмет исследования связан с реализацией смысловой неоднозначности лексики. В рамках исследования обозначен авторский интерпретационный анализ с использованием компьютерных способов выявления и профилактики смысловой неопределенности текстов, при котором комбинируется сравнение исходного русского текста с текстом-ОМП для определения специфичности переводимого текста и установления степеней переводимости как свойств переводимых единиц (слов, словосочетаний и т. п.). В целом продемонстрирован новый взгляд на изучение проблем диффузной семантики законодательных текстов и потенциальной неопределенности рекламных текстов экологической направленности посредством лингвистического анализа, основанного на обработке данных, полученных при ОМП через переводчик Google на английский и китайский языки. Методология исследования носит комплексный характер и подходит для рассмотрения разных типов текста (художественных, законодательных, медийных, текстов социальных сетей и т. п.), может способствовать проведению грамотной лингвистической экспертизы текстов с целью выявления в них потенциальных генераторов конфликтов интерпретаций. Результаты исследования связаны с перспективами создания базы данных текстов, расширением материала для изучения, привлечением других систем автоматизированного перевода. Сформулированные выводы позволяют установить тенденции в зоне напряженности интерпретации медийных и правовых дискурсов рядовыми носителями языка; раскрывают фрагменты текстов с точки зрения наличия и (или) отсутствия в них неоднозначных речевых единиц. Отмечено воздействие дискурса на становление смысловой неопределенности в рамках корреляции степени переводимости и степени понятности текстов. Показано, что правовой дискурс наиболее переводим (71,07 %; язык-посредник: английский). При ОМП медийного дискурса наблюдалась наибольшая семантическая дистанция переведенных текстов от оригинала (38,31 %; язык-посредник: китайский). Представленные результаты и выводы исследования могут быть использованы в широком спектре научных и прикладных сфер лингвистической направленности с доминированием юридической составляющей.

Ключевые слова: смысловая неопределенность, двусмысленность, компьютерные программы, юридический дискурс, рекламный текст, конфликт интерпретаций, сравнение текстов по сходству, обратный машинный перевод

Для цитирования: Иркова А.В. Использование компьютерных программ для выявления и предотвращения семантической неопределенности текстов как фактора конфликта интерпретаций // Вестник ЮУрГУ. Серия «Лингвистика». 2024. Т. 21, № 3. С. 56-63. DOI: 10.14529/ling240308

Original article

DOI: 10.14529/ling240308

EMPLOYING COMPUTATIONAL TOOLS TO DETECT AND MITIGATE SEMANTIC UNCERTAINTY IN TEXTS AS A FACTOR OF INTERPRETATIVE CONFLICTS

A.V. Irkova, [email protected]

Kemerovo State University, Kemerovo, Russia

Abstract. The presented research reflects the study of current linguistic and legal issues within legal discourse and media communication. The study focuses on the implementation of semantic ambiguity in vocabulary. It outlines

© Иркова А.В., 2024.

the author's interpretive analysis using computer-based methods to identify and eradicate semantic uncertainty in texts. This involves comparing the original Russian text with the reverse machine translated one to determine the specificity of the translated text and establish the degrees of translatability as characteristics of the translated units (words, phrases, etc.). The study offers a new perspective on the diffuse semantics of legislative texts and the potential uncertainty in environmentally oriented advertising texts, employing linguistic analysis based on the data processed from reverse machine translation through Google Translate into English and Chinese. The research methodology is comprehensive and suitable for various text types (fiction, legislation, media, social network texts, etc.), aiding in the competent linguistic examination of texts to identify potential sources of interpretative conflicts. The research results relate to the prospects of creating a text database, expanding the material for study, and incorporating other automated translation systems. The drawn conclusions highlight trends in the interpretation of media and legal discourses by ordinary native speakers, identifying text segments in terms of the presence or absence of ambiguous language units. The discourse influence on semantic uncertainty is discussed, noting the correlation between translatability and text comprehensibility. Legal discourse has been shown to be the most translatable (71.07%; intermediary language: English), while media discourse exhibited the greatest semantic distance in the translations from the original (38.31%; intermediary language: Chinese). The findings and conclusions are applicable across a broad range of investigative and applied linguistic fields, particularly those fields that are predominantly influenced by legal considerations.

Keywords: semantic uncertainty, ambiguity, computer programs, legal discourse, advertising text, interpretative conflict, text comparison by similarity, reverse machine translation

For citation: Irkova A.V. Employing computational tools to detect and mitigate semantic uncertainty in texts as a factor of interpretative conflicts. Bulletin of the South Ural State University. Ser. Linguistics. 2024;21(3):56-63. (in Russ.). DOI: 10.14529/ling240308

Введение

Широкий спектр вопросов смысловой неопределенности лексики разнообразных текстов, в том числе юридических, обладает мировой актуальностью. В качестве объекта исследования выступают неопределенность и зона напряженности как факторы, которые могут стать источником противоречивых интерпретаций, вызвать социальный конфликт. Предметом изучения являются «точки напряжения» между планом содержания и планом выражения текста, которые при ознакомлении с ним адресата могут привести к двусмысленности понимания. Перевод рассматривается как метод исследования языка. Гипотеза работы заключается в следующем: обратный машинный перевод и сравнение текстов на предмет сходства являются методами, с помощью которых можно выявить зоны семантической неопределенности текста; установить роль дискурса в процессе формирования этих значений. Новизна работы состоит в сопоставлении двух дискурсов, а именно правового и рекламного.

В данной работе акцент сделан на практической составляющей изучения феномена смысловой нечеткости текста в сравнительном аспекте. Очерчена специфика лингвистической природы семантической неоднозначности лексики законодательных текстов и потенциальной неопределенности рекламных текстов одной экологической направленности. Выбор рекламных статей о туризме и текста регионального законодательства в области ООПТ РФ определяется их смысловым соотношением (медиатексты согласуются с законодательными). В намеченном плане дискурсивный анализ текстов позволяет наиболее глубоко оценить динамический процесс смыслообразования с точки зрения наличия и (или) отсутствия в них многозначных речевых единиц, а также рассмотреть ус-

ловия порождения семантической двойственности с использованием современных цифровых методов. Прикладное значение исследования состоит в возможности использования полученных результатов в рамках лингвистической, антикоррупционной экспертиз текстов законов, законопроектов и рекламных текстов с целью выявления в них потенциальных конфликтогенов, которые могут повлечь за собой конфликт интерпретаций.

Неопределенность и напряженность подвержены разностороннему анализу. В системе языка фигурируют разнообразные трактовки этих двух категорий: от грамматической, функционально -семантической до контекстуальной (текстовой). Особого внимания заслуживает семантическая неопределенность, которая реализуется в полисемии, смысловой размытости текста правовой нормы, что может осложнить юридическую коммуникацию. «Юридико-лингвистическая» неопределенность входит в бинарную оппозицию «определённость - неопределенность», отражает универсальные механизмы познания и восприятия действительности человеком. В последние десятилетия в современной лингвистике, развивающейся в русле антропологического направления, наметилась чёткая тенденция к изучению различных феноменов, в том числе правовых и языковых, с позиций междисциплинарного подхода. В связи с этим актуальность определяется также необходимостью всестороннего изучения этой категории [12].

В соответствии с научной традицией существует широкий спектр различных подходов к явлению неопределенности и конфликта. Истоки «многоэтажной» проблематики смысловой неопределенности восходят к исследованиям в области логики и философии (труды Б. Рассела [15], Г. Фреге [24] и многих других). В рамках мировой лингвистической науки представлены различные

направления исследований неоднозначности текстов [27, 28]. Рассматривается неопределенность как на уровне текстов и дискурсов (религиозных, поэтических, деловых, медийных, рекламных и многих других), так и на уровне отдельных языковых и речевых единиц (семантика прилагательных, словосочетаний, предложений, фраз и т. п.). Одним из актуальных вопросов является проблема «юридико-лингвистической» неопределенности правовых текстов в рамках проведения антикоррупционной экспертизы [16, 23].

Для семантического анализа неопределенности используются как классические [2], так и новые методики, в том числе современные системы автоматической обработки текстов, данных из социальных сетей и т. д. [1, 3, 11]. Актуально применение перевода в качестве метода изучения языковых закономерностей [7, 8]. Отметим, что концепция данного исследования входит в русло научной школы «Социально-когнитивное функционирование языка» (профессор Н.Д. Голев) [5, 6], в которой изучаются особенности проявления конфликта интерпретаций, транслятивного подхода к языку в широком смысле, обратного машинного перевода и многое другое. Технологии машинного перевода являются достаточно развитыми. При этом, безусловно, роль ученого, который пользуется тем или иным онлайн-переводчиком, в переводческом процессе неоценимо важна, поскольку перевод сопряжен с анализом текста, тематики, синтаксических структур, отдельных слов и фраз, подбором тех или иных контекстуально-необходимых вариантов и т. п. Существуют некоторые работы, которые посвящены этим вопросам. При этом методологический аспект комплексного использования различных способов и приемов при анализе смысловой неопределенности представлен не в полной мере, чем также оправдана актуальность работы. Предпринятое исследование вписывается в проблематику ряда современных направлений на стыке семасиологии, компьютерной лингвистики, ме-диалингвистики, лингвоконфликтологии, юридической лингвистики.

Целью работы является оценка эффективности использования компьютерных способов выявления и предотвращения смысловой неопределенности текста как фактора развития конфликта интерпретаций.

Методы и принципы исследования

Исследование основано на обработке данных, полученных при обратном машинном переводе (ОМП) через переводчик Google на английский и китайский языки [26], с использованием цифровых технологий для сравнения двух текстов по сходству [18, 19]. Первая программа выбрана нами вслед за учеными А.А. Колесниковым и Р.И. Баженовым, поскольку она позволяет определить степень схожести текстов в процентах [10]. Вторая программа при сопоставлении текстов выделяет

фрагменты, маркирующие схожесть и несхожесть компонентов. Изучение смысловой неопределенности осуществлялось по следующей методологии: использовался комплексный подход, при котором комбинируется сравнение исходного русского текста с текстом-ОМП с целью определения специфичности переводимого текста и установления степеней переводимости как свойств переводимых единиц (слов, словосочетаний, предложений и т. п.). Актуализированы данные, изъятые из статей «Шорский национальный парк. Галерея природных экспонатов» (текст 1) [22]; «Зелёный Кузбасс: экологический туризм» (блог с полезными советами для путешествий «Туристу на заметку») (текст 2) [20]; «В Шерегеше создадут особую экономическую зону с инвестициями более 40 млрд рублей» (текст 3) [4]; «Сергей Цивилев: в Ку2бассе будет разработан уникальный для России туристический маршрут» (текст 4) [21]; а также анализируется Статья 1. «Основные понятия...» (Закон Кемеровской области - Кузбасса № 5-ОЗ «О туристской деятельности» от 06 февраля 2009 года)» (текст 5) [17]. Оцениваются несколько параметров: сходство текста в процентах, %; наличие различающихся фрагментов. В качестве материала для дискурсивного и компонентного анализа некоторых лексем привлечены контексты из Национального корпуса русского языка (НКРЯ) [13], нормативные толковые словари современного русского литературного языка [9, 14].

Обсуждение полученных результатов

исследования

В рамках данного исследования раскрывался подход, при котором объединяются перевод как метод изучения языка и сравнение текстов по схожести. Результаты оценки двух методов при анализе смысловой неопределенности текстов тематики природопользования представлены в табл. 1, 2. Мы оцениваем несколько спецификаций и критериев.

Как видно из приведенных данных табл. 1, наибольшая близость переведенного текста-ОМП к исходному русскому тексту наблюдается у дискурса правовой направленности (текст 5; 71,07 %). Присутствие различных фрагментов минимально (51). Следовательно, эти тексты обладают высокой степенью понятности, которая изначально была задана жанром законодательной статьи. Высоким уровнем переводимости также обладает сообщение, опубликованное в сетевом редакционном формате, в котором представлены новости и ключевые события в деловых и государственных кругах региона (текст 3; 73,63 %). Далее по степени переводимости отмечаются заметки из блогосфе-ры (текст 1; 64,08 %; текст 2; 70,74 %) и новостной пресс-релиз (текст 4; 66,46 %) современного сетевого медиапространства, в котором раскрываются итоги рабочей поездки губернатора Кузбасса Сергея Цивилева с целью оценки потенциала Шорского национального парка. При проведении проце-

Таблица 1

Соотношение дискурсов с данными компьютерных программ (англ. яз.)

Параметры Текст 1 Текст 2 Текст 3 Текст 4 Текст 5

Сходство текста, % 64,08 70,74 73,63 66,46 71,07

Наличие различающихся фрагментов 202 176 67 63 51

Соотношение дискурсов с данными компьютерных программ (кит. яз.) Таблица 2

Параметры Текст 1 Текст 2 Текст 3 Текст 4 Текст 5

Сходство текста, % 40,51 44,18 46,7 38,31 40,14

Наличие различающихся фрагментов 320 282 103 104 105

дуры обратного машинного перевода в качестве языка-посредника использовался английский язык.

Исходя из представленных данных, как и в табл. 1, прослеживается подобная картина близости переведенного текста к оригиналу в юридическом дискурсе (текст 5; 40,14 %; 105 различающихся фрагментов), а также в некоторых медиатекстах с довольно жесткой композицией (текст 2; 44,18 %; текст 3; 46,7 %.). Затем по степени переводимости отображаются текст 1 (40,51 %), текст 4 (38,31 %). В обратном машинном переводе в качестве языка-посредника использовался китайский язык.

Таким образом, согласно имеющимся материалам, наблюдается снижение сходства текстов в зависимости от языка-посредника, используемого при обратном машинном переводе. Вид того или иного дискурса также воздействует на уровень переводимости текста в целом.

При сравнении текстов, проведенных через ОМП, программа выделяет неоднозначные лексемы, несовпадающие фрагменты переведенного текста (рис. 1, 2).

Семантические несоответствия переведенного и оригинального текстов, обнаруживаемые в первом (ОМП-текст), являются сигналом чрезмерной

сложности, расплывчатости выражения мысли или двусмысленности исходного текста. На основе этого мы предлагаем использовать для лингвистической, антикоррупционной, перлокутивной экспертиз текста законопроекта, рекламного текста обратный машинный перевод, программы сравнения тек-текстов на предмет сходства с целью предотвращения непонятности, недоступности, двусмысленности толкования текста закона и других текстов.

В очерченном плане семантическая неопределенность лексики изучаемых текстов распределяется следующим образом (табл. 3).

Следует уделить внимание анализу некоторых словарных дефиниций и их контекстной реализации. К таковым элементам с «размытой» семантикой относятся лексемы («водоем», «водохранилище», «резервуар»), у которых отсутствует чёткая юридическая интерпретация [25]. В процессе преобразования общеупотребительных слов в юридические термины выделяются различные этапы терминологизации (юридизации). Обращение к семантическим регистрам слова, реализованным в разнообразных дискурсах, способствует пониманию определенных правовых текстов в области природопользования.

Результат сравнения:

Экспортировать в Word

ЗАКОН КЕМЕРОВСКОЙ ОБЛАСТИ КУЗБАССА от вб февраля 2009 гояа] N 5-03 О туристской деятельности^ 1

Статья 1. Основные понятия, используемые в настоящем Законе^ 1

В настоящем Законе используются основные понятия, установленные Федеральным законом ^Об основах туристской дсятельностнзма в Российской Федерации^, а также следующие понятия:"!

ту ристская инфраструктура Еурп ;ма - объекты туристской индустрии 1\ рп системы и НслужиыД.

необходимые для экономического развития Кемеровской области и обеспечения безопасных условий дрожизнсдсятсльванестпя населения области;*!

Рис. 1. Сопоставление текста-ОМП и исходного русского текста (правовой дискурс; язык-посредник: английский)

Рис. 2. Сравнение текста-ОМП и исходного русского текста (медийный экологический дискурс; язык-посредник: английский)

Таблица 3

Смысловая нечёткость лексики

Результат сравнения:

Экспортировать в Word

ШОРСК1П1 НАЦИОНАЛЬНЫЙ ПАРК. Галерея природных экспонатов

На самом юге Кемеровской области, на стыке Алтая. Кузнецкого Алатау и Саян, еетьнаходится удивительный кран -у Горная Шорня. Здесь|в окружении высоких пиков горгорных вершин, раскинулись уютные долины с альпийскими лугами, а вокруг шумят кристально чистые реки и водопады.

Чтобы сохранить нетронутыми заповедные места, вД 1989 году был образован Шорский национальный парк с це тью сохранения ¡аповелных территории в нерво ¡данном виде. Как II сама Горная Шорня, она получила свое название от коренных жителей этих мест -| шорцев. Они веками жили в этих местах, сберегая пхохраняя свою первозданную красоту, и сохранили десятки легенд о земле своих предков.

Сама природа проложила по территории Шорского парка оптимальный туристический

по территории Щчрског" парка главная водная артерия охрппяемзаповелных земель, река Мрассу, соединяет самые интересные достопримечательности Горной Шории. Поэтому сплав по Мрассу—е—I самый популярный способ осмотреть «экспозицию» природного музея под открытым небом.

Лексемы, которые обладают конфликтогенным потенциалом Лексемы, которые не обладают конфликтогенным потенциалом

Оптимальный, лучший Горная Шория

Заповедник, водоем, резервуар, водохранилище В настоящем законе, инфраструктура

Горные вершины, экологический туризм, экоту-ризм и так далее Ознакомление, посещение, используемые и так далее

Компонентный состав указанных слов характеризуется следующими признаками.

«Водоем»: место скопления или хранения воды (озеро, бассейн, пруд, водохранилище), водный объект, природный или искусственный водоем, водоток либо иной объект, постоянное или временное сосредоточение вод в котором имеет характерные формы и признаки водного режима, рекреационная зона водоемов служит пространством для оказания услуг в сфере туризма, физической культуры и спорта, организации отдыха и оздоровления граждан (юридические, газетные, публицистические дискурсы и т. п.).

«Водохранилище»: искусственный водоем для накопления и хранения воды, поверхностный водный объект, образованный водоподпорным сооружением на водостоке с целью хранения воды и регулирования стока, крупный резервуар воды (юридические, газетные, публицистические дискурсы и т. п.).

«Резервуар»: вместилище для жидкостей и газов, сооружение, представляющее собой объемную, плоскостную или линейную строительную систему, имеющую наземную, надземную и (или) подземную части, состоящую из несущих, а в отдельных случаях и ограждающих строительных конструкций и предназначенную для хранения продукции, емкость для размещения и хранения дизельного топлива; перен. Источник чего-либо и т. п. (юридические, газетные, публицистические дискурсы и т. п.).

Заключение

Компьютерные технологии в процессе выявления и предотвращения смысловой неопределенности текста как фактора развития конфликта интерпретаций способны значительно повысить эффективность анализа лексики. Проведенное исследование позволило раскрыть зоны напряженности в процессе интерпретации рекламных и юридических дискурсов рядовыми носителями языка. При помощи обратного машинного перевода и сравнения текстов на сходство установлены различные фрагменты исходного русского текста и текста-ОМП с точки зрения наличия и (или) отсутствия в них неоднозначных речевых единиц. Доказана доминирующая роль фактора дискурса в формировании смысловой неопределенности в рамках корреляции степени переводимости и степени понятности текстов.

Сопоставление двух дискурсов одной тематической направленности природопользования позволило зафиксировать влияние контекста (дискурса) и языка-посредника на результаты обратного машинного перевода, степень переводимости текста. Правовой дискурс представляется одним из наиболее переводимых (сходство между текстами составило 71,07 % при 51 различающемся фрагменте), для процедуры ОМП был использован английский язык. Это продиктовано тем, что сам жанр текста имеет весьма жёсткую структуру законодательной статьи с юридическим пластом лексики, которая способствует грамотному и чет-

кому переводу. Лексикон текста изучаемой статьи отвечает существующим нормам современного русского литературного языка с учетом стилистического качества правового текста, поскольку в нем отсутствуют нецелесообразно громоздкие терминологические конструкции; выдерживается стилистическая нейтральность задействованной терминологии; отсутствуют лексемы разговорного характера, метафоры, эпитеты, сравнения, образные средства, жаргонизмы и т. п.

В свою очередь при обратном машинном переводе текстов по туризму, которые имеют рекламный характер, степень переводимости и, соответственно, понятности значительно снижалась. Так, при обратном машинном переводе экологического медийного текста наблюдалась наибольшая семантическая дистанция переведенных текстов от оригинала (38,31 %; 40,51 % при 104 и 320 различающихся фрагментах соответственно), для процедуры ОМП был использован китайский язык. Медиатексты, изученные нами, соответствуют существующим нормам современного русского языка с учетом стилистического качества текстов рекламной направленности, поскольку в них присутствует яркая метафорика; имеется лаконичное описание достопримечательностей Горной Шории,

туристических маршрутов с целью привлечения потенциальных потребителей туруслуг. В медийном экологическом дискурсе формируется определенный имидж туристических ресурсов Кузбасса в рамках других составляющих маркетингового комплекса. Так, в какой-то степени семантическая неопределенность может помешать потребителям однозначно понять и интерпретировать текст. К такого рода лексике с «расплывчатой» семантикой принадлежат слова «водоем», «водохранилище», «резервуар» и многие другие.

Представленные результаты апробации методики ОМП, сравнения сходства текстов и дискурсивного анализа актуальны, поскольку этот комплексный анализ универсален, подходит для рассмотрения разных типов текста (художественных, законодательных, медийных, текстов социальных сетей и так далее). Подобная идентификация смысловой неопределённости может способствовать проведению грамотной лингвистической экспертизы текстов с целью выявления в них потенциальных генераторов конфликтов интерпретаций. К перспективам поставленных вопросов относятся расширение материала для изучения, установление стиля машинного перевода, привлечение других систем автоматизированного перевода.

Список литературы

1. Белов С.Д. Обзор методов автоматической обработки текстов на естественном языке // Системный анализ в науке и образовании: сетевое научное издание. 2020. URL: http://sanse.ru/download/401 (дата обращения: 08.08.2023)

2. Блинова О.В. Языковая неоднозначность и неопределенность в русских правовых текстах // Вестник Санкт-Петербургского университета. 2020. № 4. С. 774-812. DOI: 10.21638/spbu14.2020.401

3. Галактионов В.А. Система машинного перевода «Кросслятор 2.0» и анализ ее функциональности для задачи трансляции знаний // Препринты ИПМ им. М.В. Келдыша. 2007. № 89. С. 1-28.

4. Ганьшин П. «В Шерегеше создадут особую экономическую зону с инвестициями более 40 млрд. рублей» [Электронный ресурс] // Континент Сибирь. 2023. URL: https://ksonline. ru/501485/v-sheregeshe-sozdadut-osobuyu-ekonomicheskuyu-zonu-s-investitsiyami-bolee-40-mlrd-rublej/ (дата обращения: 08.08.2023)

5. Голев Н.Д. Диктумно-модусный плюрализм виртуального диалогического дискурса (на материале интернет-комментариев) // Медиалингвистика. 2023. № 10 (1). С. 4-26. DOI: 10.21638/spbu22.2023.101.

6. Голев Н.Д. Об использовании обратного машинного перевода в юрислингвистической практике (постановка проблемы) // Современные тенденции развития науки: сборник тезисов национальной конференции / под ред. С.О. Гаврилов, Д.М. Бородулин. Кемерово: Изд-во Кемеровского государственного университета, 2018. С. 3-5.

7. Голев Н.Д. Транслятивная лингвистика (аспектуализированный обзор исходных положений). Часть 1. Гносеология перевода // Вестник Кемеровского государственного университета. 2022. № 6 (94). С. 717-734. DOI: 10.21603/2078-8975-2022-24-6-717-734.

8. Гращенко Л.А. Концептуальная модель системы русско-таджикского машинного перевода / Л.А. Гращенко, Э.С. Клышинский, С.Р. Тумковский, З.Д. Усманов // Доклады Академии наук Республики Таджикистан. 2011. № 4. С. 279-285.

9. Евгеньева А.П. Словарь русского языка: А-Й: в 4 т.; Т. 1. Изд. 3-е, стер. М.: Русский язык, 1985. 702 с.

10. Колесников А.А. Исследование систем онлайн-перевода // Постулат. 2017. № 1 (15). С. 10- 15.

11. Куличенко Ю.Н. Способы выражения оценки в медийном экологическом дискурсе // Медиалингвистика. 2023. № 10 (2). С. 166-178. DOI: 10.21638/spbu22.2023.202.

12. Лещева А.Н. Природа текстовой категории «неопределенность»: на материале лирики И. Бродского: автореф. дис. ... канд. филол. наук. Екатеринбург, 2010. 22 с.

13. Национальный корпус русского языка // Интернет-сервис. 2023. URL: https:// ruscorpora.ru/ (дата обращения: 08.08.2023)

14. Ожегов С.И. Толковый словарь русского языка: 80 000 слов и фразеологических выражений. М.: Азбуковник, 1999. 938 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15. Рассел Б. Философия логического атомизма. Томск: «Водолей», 1999. 192 с.

16. Родионова О.Н. Антикоррупционная экспертиза // Российский юридический журнал. 2010. № 1 (70). С. 158-162.

17. Российская Федерация. Закон Кемеровской области-Кузбасса «О туристской деятельности» (с изменениями на 6 апреля 2023 года): Закон субъектов Федерации № 5-ОЗ: [принят Законодательным Собранием Кемеровской области - Кузбасса 2009-02-06]. 2009. URL: https: /docs.cntd.ru/document/990308729 (дата обращения: 08.08.2023).

18. Сравнение текстов онлайн // Сайт. 2023. URL: http://text.num2word.ru/ (дата обращения: 08.08.2023).

19. Сравнение схожести текстов // Web-инструмент. 2023. URL: https://ciox.ru/ comparing_the_similarity_of_texts (дата обращения: 08.08.2023).

20. Статья «Зелёный Кузбасс: экологический туризм». «Туристу на заметку»: блог с полезными советами для путешествий // Официальный сайт «Туризм в Кузбассе». 2023. URL: https://visit-kuzbass.ru/blog/zelenyij-kuzbass-ekologicheskij-turizm-v-regione (дата обращения: 08.08.2023)

21. Статья «Сергей Цивилев: в Ку2бассе будет разработан уникальный для России туристический маршрут» // Официальный сайт Администрации Правительства Кузбасса. 2022. URL: https://ako.ru/news/detail/sergey-tsivilev-v-kuzbasse-budet-razrabotan-unikalnyy-dlya-rossii-turisticheskiy-marshrut (дата обращения: 08.08.2023)

22. Статья «Шорский национальный парк. Галерея природных экспонатов» // Официальный сайт «Туризм в Кузбассе». 2023. URL: https://visit-kuzbass.ru/guide/gde-otdoxnut/shorskij-mczpark-galereya-prirodnyix-eksponatov (дата обращения: 08.08.2023)

23. Тухватуллин Т.А. Антикоррупционная экспертиза нормативных правовых актов и их проектов: вопросы теории и практики // Российская юстиция. 2019. № 2. С. 9-11.

24. Фреге Г. Логико-философские труды. Новосибирск: Сибирское университетское изд-во, 2008. 281 с.

25. Шикалева П.В. Понятия «Пруд» и «Водохранилище» в водном праве России // Вестник Челябинского государственного университета. 2011. № 24 (239). С. 125-127.

26. Google Translate. 2023. URL: https://translate.google.ru (accessed: 08.08.2023)

27. Oyelade O. N. Enhancing reasoning through reduction of vagueness using fuzzy OWL-2 for representation of breast cancer ontologies // Neural Computing and Applications. 2022. № 34 (4). P. 1-26. DOI: 10.1007/s00521-021-06517-2.

28. Shapiro S. Vagueness and Context // Inquiry. 2016. № 59(4). P. 343-381.

References

1. Belov S.D., Zrelova D.P., Koren'kov V.V. [Overview of methods for automatic processing of texts in natural language]. Sistemnyj analiz v nauke i obrazovanii: setevoe nauchnoe izdanie [System analysis in science and education: online scientific edition], 2020. URL: http://sanse.ru/download/401 (accessed 8.08.2023). (in Russ.)

2. Blinova O.V., Belov S.A. [Linguistic ambiguity and vagueness in Russian legal texts]. Vestnik Sankt-Peterburgskogo universiteta [Vestnik of Saint Petersburg University], 2020, no. 4, pp. 774-812. (in Russ.) DOI: 10.21638/spbu14.2020.401

3. Galaktionov V.A. [The machine translation system "crocclator 2.0" and its functionality analysis for the knowledge translation purposes]. Preprinty IPM im. M.V. Keldysha [Keldysh institute preprints]. 2007, No. 89, pp. 1-28. (in Russ.)

4. Gan'shin P. "V Sheregeshe sozdadut osobuju ekonomicheskuju zonu s investitsijami bolee 40 mlrd rublej" ["A special economic zone will be created in Sheregesh with investments of more than 40 billion rubles"]. Kontinent Sibir' [Continent Siberia], 2023. URL: https://ksonline.ru/501485/v-sheregeshe-sozdadut-osobuyu-ekonomicheskuyu-zonu-s-investitsiyami-bolee-40-mlrd-rublej/ (accessed 8.08.2023).

5. Golev N.D., Kim L.G. [Dictum-modus pluralism in virtual dialogic discourse(based on Internet comments)]. Medialingvistika [Media Linguistics]. 2023, No. 10 (1), pp. 4-26. (in Russ.) DOI: 10.21638/spbu22.2023.101

6. Golev N.D. [On the use of reverse machine translation in legal and linguistic practice (statement of the problem)]. Sovremennye tendentsii razvitiya nauki: sbornik tezisov natsional'noj konferentsii [Modern trends in the development of science: collection of abstracts of the national conference]. Edited by Gavrilov S.O., Borodulin D.M. Kemerovo: Izd-vo Kemerovskogo gosudarstvennogo universiteta, 2018, pp. 3-5. (in Russ.)

7. Golev N.D. [Translative Linguistics (Aspectualized Review of Initial Propositions). Part 1. Epistemology of Translation]. Vestnik Kemerovskogo gosudarstvennogo universiteta [Bulletin of Kemerovo State University]. 2022, no. 6 (94), pp. 717-734. (in Russ.) DOI: 10.21603/2078-8975-2022-24-6-717-734.

8. Graschenko L.A., Klyshinskij E.S., Tumkovskij S.R., Usmanov Z.D. [Conceptual model of the russian-tajik machine translation system]. Doklady Akademii naukRespubliki Tadzhikistan [Reports of the National Acad-

9. Evgen'eva A.P. Slovar' russkogo jazyka: A-J: v 4 t.; T. 1. [Dictionary of the Russian language: A-Y: in 4 volumes; T. 1.]. Moscow, Russkij yazyk, 1985, 702 p.

10. Kolesnikov A.A., Bazhenov R.I. Issledovanie sistem onlajn-perevoda [Research online translation systems]. Postulate [Postulat]. 2017. No. 1 (15). Pp. 10-15.

11. Kulichenko Ju.N., Kurchenkova E.A. [Ways of Expressing Evaluation in Media Ecological Discourse]. Medialingvistika [Media Linguistics]. 2023, No. 10 (2), pp. 166-178. (in Russ.) DOI: 10.21638/ spbu22.2023.202

12. Lescheva A.N. Priroda tekstovoj kategorii "neopredelennost': na materiale liriki I. Brodskogo [The nature of the text category "uncertainty": on the material of I. Brodsky's lyrics]: abstract dis. ... cand. philol. sci. Ekaterinburg, 2010. 22 p.

13. Natsional'nyj korpus russkogo jazyka [Russian National Corpus]. Internet service, 2023. URL: https://ruscorpora.ru/ (accessed 8.08.2023).

14. Ozhegov S.I., Shvedova N.Ju. Tolkovyj slovar' russkogo jazyka: 80 000 slov i frazeologicheskih vyrazhe-nij [Explanatory dictionary of the Russian language: 80,000 words and phraseological expressions]. Moscow, Az-bukovnik, 1999, 938 p.

15. Rassel B. Filosofija logicheskogo atomizma [Philosophy of logical atomism]. Tomsk, Vodolej, 1999, 192 p.

16. Rodionova O.N. [Anticorruption expertise]. Rossijskij yuridicheskij zhurnal [Russian juridical journal]. 2010, no. 1 (70), pp. 158-162. (in Russ.)

17. Russian Federation. Zakon Kemerovskoj oblasti - Kuzbassa "O turistskoj dejatel'nosti "(s izmenenijami na 6 aprelja 2023 goda) [Law of the Kemerovo region-Kuzbass About tourism activities (as amended on April 6, 2023)], 2009. URL: https://docs.cntd.ru/document/990308729 (accessed 8.08.2023).

18. Sravnenie tekstov onlajn [Online text comparison]. Website, 2023. URL: http://text.num2word.ru/ (accessed 8.08.2023).

19. Sravnenie shozhesti tekstov [Comparison of similarity of texts]. Web Tool, 2023. URL: https://ciox.ru/comparing_the_similarity_of_texts (accessed 8.08.2023).

20. Statja Zelenyj Kuzbass: ekologicheskij turizm. Turistu na zametku: blog s poleznymi sovetami dlja pute-shestvij [Article Green Kuzbass: ecological tourism. Note to the tourist: a blog with useful travel tips]. Official site Tourism in Kuzbass, 2023. URL: https://visit-kuzbass.ru/blog/zelenyij-kuzbass-ekologicheskij-turizm-v-regione (accessed 8.08.2023).

21. Statja Sergej Tsivilev: v KuZbasse budet razrabotan unikal'nyj dlja Rossii turisticheskij marshrut [Article Sergey Tsivilev: a unique tourist route for Russia will be developed in Kuzbass]. Ofitsial'nyj sajt Administratsii Pravitel'stva Kuzbassa, 2022. URL: https://ako.ru/news/detail/sergey-tsivilev-v-kuzbasse-budet-razrabotan-unikalnyy-dlya-rossii-turisticheskiy-marshrut (accessed 8.08.2023).

22. Statja Shorskij natsional'nyj park. Galereja prirodnyh eksponatov [Article Shor National Park. Gallery of natural exhibits]. Official site Tourism in Kuzbass, 2023. URL: https://visit-kuzbass.ru/guide/gde-otdoxnut/shorskij -naczpark-galereya-prirodnyix-eksponatov (accessed 8.08.2023).

23. Tuhvatullin T.A. [Anti-corruption expertise of normative legal acts and their projects: theory and practices]. Rossijskayayustitsiya [Russian justice]. 2019, no. 2, pp. 9-11. (in Russ.)

24. Frege G. Logiko-filosofskie trudy [Logico-philosophical works]. Novosibirsk, Sibirskoe universitetskoe izd-vo, 2008, 281 p.

25. Shikaleva P.V. [The concepts of Pond and Reservoir in the water law of Russia]. Vestnik Chelyabinskogo go-sudarstvennogo universiteta [Bulletin of Chelyabinsk State University]. 2011, No. 24(239), pp. 125-127. (in Russ.)

26. Google Translate 2023. URL: https://translate.google.ru (accessed 8.08.2023).

27. Oyelade O.N., Ezugwu A.E., Adewuyi S.A. Enhancing reasoning through reduction of vagueness using fuzzy OWL-2 for representation of breast cancer ontologies. Neural Computing and Applications. 2022. No. 34 (4). P. 1-26. DOI: 10.1007/s00521-021-06517-2

28. Shapiro S., Snyder E. Vagueness and Context. Inquiry. 2016, No. 59(4), pp. 343-381.

Информация об авторе

Иркова Анна Валентиновна, кандидат филологических наук, старший преподаватель, Кемеровский государственный университет, Кемерово, Россия, [email protected]

Information about author

Anna V. Irkova, Candidate of Philological Sciences, Senior Lecturer, Kemerovo State University, Kemerovo, Russia, [email protected]

The article was submitted 25.10.2023.

Статья поступила в редакцию 25.10.2023.

i Надоели баннеры? Вы всегда можете отключить рекламу.