Научная статья на тему 'БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ: ВЛИЯНИЕ НА ПУБЛИЧНЫЙ ДИСКУРС И ОБЩЕСТВО В ЦЕЛОМ'

БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ: ВЛИЯНИЕ НА ПУБЛИЧНЫЙ ДИСКУРС И ОБЩЕСТВО В ЦЕЛОМ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
36
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
публичный дискурс / общество / коммуникация / Большие языковые модели / искусственный интеллект / обработка естественного языка / смешанные коммуникативные сообщества «человек-ИИ» / public discourse / society / communication / large language models / artificial intelligence / natural language processing / mixed human-AI communities

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Татьяна Викторовна Лягошина

Анализируется влияние Больших языковых моделей (LLM) на публичный дискурс. Рассматриваются структурные и содержательные изменения, которые LLM вносят в общественную коммуникацию, а также потенциальные риски и пре-имущества их использования. На основе примеров из разных социальных сфер показано влияние LLM на формирование общественного мнения, распространение информации, развитие новых форм коммуникации и пересмотр некоторых научных теорий. Отмечается, что, обогащая общественный дискурс, LLM одновременно порождают и новые этические дилеммы, связанные с достоверностью информации, авторскими правами и др.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Татьяна Викторовна Лягошина

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LARGE LANGUAGE MODELS: IMPACT ON PUBLIC DISCOURSE AND SOCIETY AS A WHOLE

The study analyzes the impact of big data-based Large language models (LLMs) on public discourse, having previously considered the principles of functioning and the possibilities for understanding natural language by these models. It is determined that LLMs, having the abilities of deep information processing, contextual understanding and self-learning, act as new social actors in the information society. These models play a key role in the creation, analysis and dissemination of content, contributing to the development of new forms of communication. They are actively used in social networks, SMM, journalism and other fields to moderate content, aggregate news and create personal recommendations. However, the accelerated generation of information leads to an information overload and the emergence of ethical issues related to the accuracy and impartiality of materials. The study notes that LLMs enrich public discourse while simultaneously creating new ethical dilemmas related to authorship and reliability of information. The Internet and LLM have a significant impact on public discussion, the structure of knowledge and the processes of knowledge acquisition. The emergence of mixed human-AI communities generates both new forms of social interaction and raises questions about information verification and critical analysis of sources. From epistemological point of view, new approaches to understanding and processing knowledge are required today. In the field of linguophilosophy and cognitive sciences, LLMs provide new perspectives for the study of language, consciousness and cognition, especially in the context of human interaction with machine-generated content. The development and wide spread of LLMs indicate profound changes in the social order, so that large language models acquire the property of social agency. This requires all participants in the information society to take a responsible approach to the use and development of such technologies.

Текст научной работы на тему «БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ: ВЛИЯНИЕ НА ПУБЛИЧНЫЙ ДИСКУРС И ОБЩЕСТВО В ЦЕЛОМ»

Вестник Томского государственного университета. Философия. Социология. Политология. 2024.

№ 79. С. 111-124.

Tomsk State University Journal of Philosophy, Sociology and Political Science. 2024. 79. pp. 111-124.

СОЦИАЛЬНАЯ ФИЛОСОФИЯ И ФИЛОСОФСКАЯ

АНТРОПОЛОГИЯ

Научная статья УДК 316.77

doi: 10.17223/1998863Х/79/11

БОЛЬШИЕ ЯЗЫКОВЫЕ МОДЕЛИ: ВЛИЯНИЕ НА ПУБЛИЧНЫЙ ДИСКУРС И ОБЩЕСТВО В ЦЕЛОМ

Татьяна Викторовна Лягошина

Национальный исследовательский Томский государственный университет, Томск, Россия,

lyagoshina. tatiana@gmail. сот

Аннотация. Анализируется влияние Больших языковых моделей (LLM) на публичный дискурс. Рассматриваются структурные и содержательные изменения, которые LLM вносят в общественную коммуникацию, а также потенциальные риски и преимущества их использования. На основе примеров из разных социальных сфер показано влияние LLM на формирование общественного мнения, распространение информации, развитие новых форм коммуникации и пересмотр некоторых научных теорий. Отмечается, что, обогащая общественный дискурс, LLM одновременно порождают и новые этические дилеммы, связанные с достоверностью информации, авторскими правами и др.

Ключевые слова: публичный дискурс, общество, коммуникация, Большие языковые модели, искусственный интеллект, обработка естественного языка, смешанные коммуникативные сообщества «человек-ИИ»

Для цитирования: Лягошина Т.В. Большие языковые модели: влияние на публичный дискурс и общество в целом // Вестник Томского государственного университета. Философия. Социология. Политология. 2024. № 79. С. 111-124. doi: 10.17223/1998863Х/79/11

SOCIAL PHILOSOPHY AND PHILOSOPHY OF HUMANITY TATIANA V. LYAGOSHINA

Original article

LARGE LANGUAGE MODELS: IMPACT ON PUBLIC DISCOURSE AND SOCIETY AS A WHOLE

Tatiana V. Lyagoshina

National Research Tomsk State University, Tomsk, Russian Federation, lyagoshina. tatiana@gmail. com

Abstract. The study analyzes the impact of big data-based Large language models (LLMs) on public discourse, having previously considered the principles of functioning and the possibilities for understanding natural language by these models. It is determined that LLMs,

© T.B. HaromHHa, 2024

having the abilities of deep information processing, contextual understanding and self-learning, act as new social actors in the information society. These models play a key role in the creation, analysis and dissemination of content, contributing to the development of new forms of communication. They are actively used in social networks, SMM, journalism and other fields to moderate content, aggregate news and create personal recommendations. However, the accelerated generation of information leads to an information overload and the emergence of ethical issues related to the accuracy and impartiality of materials. The study notes that LLMs enrich public discourse while simultaneously creating new ethical dilemmas related to authorship and reliability of information. The Internet and LLM have a significant impact on public discussion, the structure of knowledge and the processes of knowledge acquisition. The emergence of mixed human-AI communities generates both new forms of social interaction and raises questions about information verification and critical analysis of sources. From epistemological point of view, new approaches to understanding and processing knowledge are required today. In the field of linguophilosophy and cognitive sciences, LLMs provide new perspectives for the study of language, consciousness and cognition, especially in the context of human interaction with machine-generated content. The development and wide spread of LLMs indicate profound changes in the social order, so that large language models acquire the property of social agency. This requires all participants in the information society to take a responsible approach to the use and development of such technologies.

Keywords: public discourse, society, communication, large language models, artificial intelligence, natural language processing, mixed human-AI communities

For citation: Lyagoshina, T.V. (2024) Large language models: impact on public discourse and society as a whole. Vestnik Tomskogo gosudarstvennogo universiteta. Filosofiya. Sotsiologiya. Politologiya - Tomsk State University Journal of Philosophy, Sociology and Political Science. 79. pp. 111-124. (In Russian). doi: 10.17223/1998863Х/79/11

Публичный дискурс играет ключевую роль в жизни общества: формирует общественное мнение, участвует в продвижении политической и культурной повестки, способствует социальной консолидации. Однако и медиапро-странство, и общественная коммуникация ХХ и XXI вв., а соответственно, и их понимание, имеют существенные отличия. В XX в. подробный анализ и оригинальную интерпретацию публичного дискурса предложили М. Фуко и Ю. Хабермас. Первый рассматривает этот социальный феномен как комплекс правил и процедур, определяющих, что и кем может быть сказано, в каких условиях и с какими возможными последствиями. Он же вводит понятие «дискурсивных практик», определяющих способы, посредством которых знание и власть взаимосвязаны и проявляются в обществе через язык. Эта концепция особенно подробно исследуется в его работе «Археология знания» [1]. Фуко анализирует связь языка, знания и общества, способы формирования разных областей знания в различные исторические периоды, а также влияние этих знаниевых структур на публичный дискурс. Он утверждает, что дискурс не просто отражает или выражает социальные структуры, но и активно участвует в их конструировании и поддержании. Хабермас подробно изложил свои идеи о публичном дискурсе в работе «Структурное изменение публичной сферы: исследование категории буржуазного общества» [2]. В этой книге он проанализировал развитие публичной сферы, начиная с XVIII в., и ее влияние на демократию и социальное взаимодействие. В контрасте с акцентом Фуко на власти, Хабермас изучал потенциал публичного дискурса для достижения консенсуса и поддержки демократических идеалов. Он предложил концепцию «идеальной речевой ситуации», где каждый участник дискурса имеет равные возможности для высказывания своих идей без ограничений со стороны внешних сил или властной иерархий. Хабермас верил, что

в рамках такого идеализированного общения возможно достичь взаимопонимания и разрешить конфликты, что является фундаментом для демократического общества. При этом между Фуко и Хабермасом существовало согласие в понимании важности баланса между властью и свободой в дискурсе. Их работы подчеркивают, что публичный дискурс не только выявляет социальные проблемы и предоставляет платформу для их обсуждения, но и определяет восприятие обществом самого себя и своего места в истории. Таким образом, публичный дискурс является не просто средством коммуникации, но центральным элементом социальной структуры, который оказывает значительное влияние на культурные, политические и идеологические аспекты общественной жизни. Он определяет границы возможного и формирует будущее через непрерывный процесс информирования, дискуссий и переговоров.

Сегодня, как и прежде, публичный дискурс является критически важным элементом жизни общества и «направляющей» любых социальных процессов. Однако с прогрессом в области информационных технологий произошла, с одной стороны, серьезная трансформация характера публичного дискурса (его полимодальная гибридизация [3]), с другой - помимо развития и распространения Интернета возникли уникальные инструменты для работы с данными в публичном пространстве, в том числе и так называемые Большие языковые модели (англ. Large language models, LLM) - компьютерные программы, способные «понимать» и генерировать тексты на естественных человеческих языках. Примерами таких LLM, развиваемых сегодня группами разработчиков в разных странах, могут служить GPT, Gemini, PaLM, Llama, Falcon, Grok, YandexGPT, GigaChat и др.

С развитием кибернетики, компьютерных наук, информационных технологий, т.е. уже с первой половины ХХ в., началась «коэволюция» естественного/человеческого (ЕИ) и искусственного/машинного интеллектов (ИИ) и в настоящее время мы вынужденно сталкиваемся с необходимостью учитывать в наших философских изысканиях интенсивное развитие технологий ИИ, особенно в области создания программ обработки естественного языка (англ. Natural language processing, NLP), частью которых и является предмет нашего научного интереса - Большие языковые модели. Эти модели интенсивно развиваются и получают все более широкое распространение: доступ к большинству из них открыт (англ. open source) как для разработчиков, так и для пользователей и они ежедневно используются сотнями миллионов человек по всему миру как в личных, так и в профессиональных целях.

Говоря о трансформации публичного дискурса, вызванной распространением Интернета, социальных сетей и новыми технологиями работы с данными на естественных языках, мы должны подчеркнуть, что она стала одним из наиболее значительных явлений в общественной коммуникации современности, сделав последнюю более инклюзивной и разнообразной. В современных условиях каждый человек с доступом к сети имеет возможность не просто участвовать в обсуждении актуальных тем, но и становиться инициатором общественного диалога в любой момент времени из любой точки мира. Этот процесс можно охарактеризовать как демократизацию публичного дискурса в двух ключевых аспектах:

1. Генерация контента (текстового и смешанной природы материала): любой может стать автором любого контента и легко его опубликовать, мо-

жет выражать свое мнение и вести диалог со сколь угодно большой аудиторией, получая мгновенный отклик, без потребности в особом разрешении или в посредничестве традиционных медиа.

2. Форма сообщений: интернет-коммуникация чаще всего является неформальной и спонтанной, в ней происходит смешение жанров, языков, модальностей, культурных традиций, что делает общение более динамичным и разнообразным, но также и хаотичным или этически некорректным.

История развития Больших языковых моделей началась с простых программ обработки естественного языка. Одним из примеров таких программ стал виртуальный собеседник ELIZA, разработанный Джозефом Вейценбау-мом (Массачусетский технологический институт, США) в 1966 г. ELIZA «пародировала» (термин Вейценбаума) диалог с психотерапевтом, работающим в технике «активного слушания». На самом деле эта программа просто выделяла во входящей фразе значимые слова, которые подставляла в шаблонную фразу, по сути перефразируя высказывание пользователя, что часто выражалось в ответе вопросом на вопрос. Годом ранее, в 1965, в книге советских ученых Алексея Ивахненко и Валентина Лапы «Кибернетические предсказывающие устройства» был опубликован первый рабочий алгоритм для глубоких многослойных перцептронов прямого распространения, что по сути является базой для применяемой сегодня технологии «глубокого обучения» [4]. Рассуждая о перспективах развития искусственных интеллектуальных систем, авторы замечали: «Поскольку характер моделируемых в автоматических системах мыслительных способностей постоянно усложняется, следует при создании подобных систем учитывать одно из важных качеств, присущих человеческому мышлению, - способность обучаться предсказанию» [4. С. 3].

К концу последней декады ХХ в. стали появляться более интересные программы на сложных алгоритмах, выдающие вполне осмысленные ответы на вопросы пользователя (например, сервис вопросов-ответов Ask Jeeves), которые легли в основу «поисковых машин» типа Google, Yandex и т.п.

Современные программы, работающие с естественными языками, серьезно эволюционировали. Последние разработки в этой области получили название Больших языковых моделей. LLM по сути своей является математической моделью (способом обработки информации), реализуемой на искусственной нейронной сети со множественными параметрами. Это статистическая генеративная (в смысле генерирующая, создающая) модель, которая назначает вероятности определенным частям слов, словам или предложениям («токенам»), т.е. дискретным составляющим языка. Практика компьютерного моделирования показала, что с дискретными случайными переменными (в нашем случае - с языковыми «токенами») легко работать, поскольку они принимают значения из некоторого конечного набора. Актуализация каждого из этих значений связана с определенной вероятностью, характеризующей его «вес». Когда эти «веса» известны, не составляет труда рассчитать математическое ожидание и дисперсию.

Модель находит скрытые закономерности и структуру в данных без явных указаний-меток и впоследствии сама генерирует дополнительные неразмеченные данные с использованием «обучения без учителя». LLM являются новым этапом развития систем искусственного интеллекта, решающих задачи на естественных языках. Обучаясь на больших текстовых корпусах, они не

только извлекают сведения о структуре различных естественных языков, но и формируют общие знания о мире. Последние поколения LLM демонстрируют новые - эмерджентные - способности: работу с нулевым или крайне малом числом примеров (Few-Shot/Zero-Shot Leaming/Prompting) и способность к рассуждениям (Reasoning).

Начало моделям последних поколений было положено исследовательской командой Google. Подробный доклад о своей прорывной работе они сделали в статье «Attention Is All You Need» («Все, что вам нужно - это внимание») в 2017 г. [5]. В последние годы в развитии искусственного интеллекта в виде LLM на первый план вышла программная архитектура «трансфор-мер», приведшая к значительным изменениям в области обработки естественного языка. Эти изменения основаны прежде всего на способности ИИ определять паттерны в данных без последовательной обработки информации, которая имела место ранее. Модели, построенные на архитектуре «трансформер с механизмом внимания», демонстрируют значительные улучшения в понимании контекста и нюансов естественного языка.

Механизм внимания позволяет моделям фокусироваться на значимых связях между словами, по аналогии с тем, как человек сосредоточивается на ключевых элементах предложения для понимания его смысла. Механизм внимания, а точнее - «внимания к себе» (англ. self-attention) - это фундаментальный компонент «трансформера». Он позволяет модели фиксировать отношения между различными позициями в последовательности, назначая разные веса каждой позиции в зависимости от ее значимости для других позиций, сосредоточиться на наиболее важных частях входной последовательности и, в итоге, лучше понять контекст. Основные преимущества моделей на основе механизма внимания:

- улавливают сложные взаимосвязи в последовательности данных, что приводит к более глубокому пониманию контекста и имеет решающее значение для таких задач, как машинный перевод, где значение слова может сильно зависеть от окружающих слов;

- могут обрабатывать входные данные параллельно, что делает их высокоэффективными и масштабируемыми (распараллеливание ускоряет время обучения и логического вывода, делая их подходящими для решения задач в режиме реального времени);

- «прозрачны» для понимания (интерпретации) и коррекции их «поведения», что приводит к созданию более надежных и контролируемых систем ИИ.

- обладают высокой производительностью.

Обучаются LLM на больших объемах (корпусах) текста из всех доступных к моменту обучения источников, что до определенной степени напоминает обучение человека, только в сверхбыстром темпе. Способность LLM улавливать «дальние» зависимости сравнима с человеческой способностью понимать контекст за пределами слов, близко расположенных друг к другу в тексте. Технология глубокого обучения и использование множественных внутренних слоев нейросети позволяют ИИ извлекать закономерности из данных и аналогично нейросетям обучающегося человека модифицировать свою структуру (свойство пластичности).

Обычно LLM обучаются в два этапа: 1) предобучение на обширном корпусе текстов, обеспечивающее общие знания о мире; 2) выравнивание (align-

ment) языковой модели под требуемые характеристики (например: избегать дискриминационной, неэтичной лексики и оценок, риторики ненависти и вражды, выводов, противоречащих научным фактам и т.п.). Две основные техники выравнивания: prompt engineering - это оптимизация текстовых запросов (промптов, англ. prompts) к нейросетям в виде коротких предложений или фраз, которые содержат вводную информацию для LLM. На основе этой информации модель генерирует свой ответ; supervised fine-tuning - дообучение с тонкой настройкой. Используя эти техники, можно научить модель «соблюдать» правила этики, привнести в нее персонажность (генерацию текстов в индивидуальных авторских стилях) и придать ей другие полезные свойства, в том числе для решения специфических профессиональных задач.

Очевидно, что LLM на основе «трансформера с механизмом внимания» и последующие инновации в обучении ИИ открывают новые горизонты для обработки естественного языка, предоставляя беспрецедентные возможности для понимания и генерации машинами текстов на естественных языках. При этом существенные различия между природой машин и человека, соответственно, между машинным и человеческим обучением подчеркивают сложности и ограничения в попытках воспроизведения человеческого восприятия и понимания ИИ-системами. Однако посредством анализа методов обучения ИИ и его подходов к обработке информации можно не только наметить пути дальнейшего развития самого искусственного интеллекта, но и применить эти знания для лучшего понимания интеллекта человеческого.

В теоретическую базу для разработки LLM вошли: идеи структурной лингвистики (дистрибутивная гипотеза) и коннекционизма (подход в когнитивной науке и исследованиях ИИ, который изучает, как мозг может производить когнитивные функции через сети взаимосвязанных простых единиц -нейронов), а также Вычислительная теория сознания (ВТС). Последняя, также известная как Вычисляемость, полагает, что человеческий разум представляет собой сложную систему обработки информации и что сознание и процесс познания - это особая форма вычислений [6, 7]. В упомянутых теориях нам важно обратить внимание на три ключевых момента в обработке информации «думающим» объектом: структурирование, вычисление, распределение вероятности.

Первыми достаточно определенно о важности выявления структур, закономерностей их образования и связей в языке высказались Фердинанд де Соссюр и Людвиг Витгенштейн. В публикации «Курс общей лингвистики» Ф. де Соссюр представляет язык как систему знаков, где значения формируются в системе относительных различий. Он вводит концепцию языка как структуры, где каждая единица приобретает значение только в контексте других единиц, что послужило фундаментом для развития структурных и дескриптивных подходов в лингвистике [8].

Витгенштейн, хотя и не являлся лингвистом в традиционном смысле слова, оказал значительное влияние на философию языка и лингвистику: в «Философских исследованиях» он развивает идею языка как формы жизни и вводит понятие «языковые игры», чтобы продемонстрировать, как смыслы слов формируются через их использование в конкретных жизненных контекстах [9]. Его идеи подчеркивают важность контекста и социальной функции языка, что созвучно некоторым аспектам структурного подхода в линг-

вистике. Две упомянутые работы в совокупности предлагают широкий спектр идей, лежащих в основе структурного и дистрибутивного анализа в лингвистике, и до сих пор оказывают значительное влияние на исследования в этих областях.

Леонард Блумфилд, американский лингвист и основатель дескриптивного направления структурной лингвистики, разрабатывал данную проблему в 20-х гг. ХХ в. и подробно изложил идею дистрибутивного анализа в своей фундаментальной работе «Язык» [10]. В ней Блумфилд обсуждает, в частности, как можно анализировать язык, исследуя распределение (дистрибуцию) языковых единиц в больших массивах лингвистических данных. Он акцентировал внимание на важности формы над значением, чем заложил основы для дистрибутивного анализа в лингвистике. В данном методе к текстам изучаемого языка применяется упорядоченный набор универсальных процедур, что позволяет выделить основные единицы языка (фонемы, морфемы, слова, словосочетания), провести их классификацию и установить отношения сочетаемости между ними. Классификация основывается на принципе замещения: языковые единицы относятся к одному и тому же классу, если они могут выступать в одних и тех же контекстах.

В рамках дистрибутивного анализа имеет смысл выделить дистрибутивную семантику, современные подходы которой достаточно полно описаны в книге Алессандро Ленчи и Магнуса Зальгрена «Дистрибутивная семантика» [11]. Ключевая идея состоит в том, что слова, встречающиеся в схожих контекстах, имеют тенденцию нести схожие смыслы. Задачи дистрибутивной семантики можно представить в виде следующих функциональных блоков:

1. Контекст как ключ к значению.

2. Векторное представление слов.

3. Анализ распределения.

4. Определение неизвестных слов из контекста.

Дистрибутивная семантика основывается на дистрибутивной гипотезе: семантическое сходство между двумя лексемами является функцией сходства их лингвистических контекстов.

Экспериментальная психология подтвердила истинность данной гипотезы. Так, в одном из экспериментов участников просили высказать суждение о синонимичности пар слов. Затем данные опроса сравнивали с контекстами, в которых встречались изучаемые слова. Анализ данных показал наличие положительной корреляции между семантической близостью слов и схожестью контекстов [12].

Таким образом, дистрибутивная семантика предоставляет методологический и теоретический инструментарий для изучения семантики через анализ формы и распределения слов в тексте. Являясь мощными инструментами КЬР, модели дистрибутивной семантики находят широкое применение как в научных исследованиях, так и на практике, например: выявление семантической близости слов и словосочетаний; автоматическая кластеризация слов по степени их семантической близости; определение тематики документа; извлечение знаний из текстов; построение семантических карт предметных областей; автоматическая генерация тезаурусов и словарей; разрешение лексической неоднозначности; расширение запросов за счет ассоциативных связей; определение тональности высказывания и др. Это, кстати, позволяет ЬЬМ

генерировать тексты, которые вписываются в сложные контексты публичного дискурса.

Прежде чем подойти к анализу влияния LLM на публичный дискурс, нам пришлось рассмотреть вопросы, связанные с пониманием природы этих моделей и механизмов, с помощью которых реализуется функция «понимания» ими естественного человеческого языка. Без этой предварительной работы было бы сложно оценить возрастающую роль LLM как нового социального актора или агента, а именно таковыми они и являются, несмотря на всю «неполноценность» (или, вернее, «неполноту») их интеллекта в сравнении с человеческим. Очевидно, что современный публичный дискурс тесно связан с развитием ИИ. Системы искусственного интеллекта, обладающие способностью оперировать большим массивом данных и адаптироваться в соответствие с его изменениями, выполняют важную роль в отборе, анализе и производстве информации, становясь неотъемлемой частью коммуникативных процессов в информационном обществе.

Приведем характеристики LLM, которые считаем наиболее важными в контексте изучения их влияния на публичный дискурс:

1. Способность к глубокой обработке сложной информации: опираясь на вычислительные аналоги человеческого мышления, LLM могут анализировать и генерировать тексты, демонстрируя глубокое понимание (что бы ни подразумевал в контексте машин данный термин) языка и подтекста.

2. Контекстуальное понимание: исходя из принципов дистрибутивной лингвистики, LLM могут улавливать контекст слов и фраз, что делает генерируемый ими контент релевантным и согласующимся с темами обсуждения/вопросами пользователей.

3. Самообучение: способность подгружать из сети вновь появляющуюся информацию, производить соответствующие обновления своей «памяти» и учитывать данные такой модернизации для своей дальнейшей работы.

Уже только эти три упомянутые выше способности делают из LLM полноценного коммуниканта в диалоговых и полилоговых взаимодействиях на любые темы. Причем создание текста языковой моделью и его размещение в «инфосфере» могут быть реализованы автоматически по специальным дополнительным алгоритмам работы LLM в медиапространстве. Например, LLM может выполнять функции SMM-специалиста (менеджмент социальных сетей, англ. social media management, SMM), бот-журналиста, чат-бота, бота интерактивных историй (когда читатели могут влиять на ход сюжета, что позволяет сделать чтение более увлекательным).

Как мы видим, LLM способствуют развитию публичного дискурса, обеспечивая новые формы взаимодействия между людьми и информацией. Наиболее широко они используются в социальных сетях для модерации контента, автоматической агрегации новостей, а также для создания персонализированных информационных/рекламных рекомендаций. Генерация все новых и новых тем для общественной дискуссии и ускорение распространение информации приводят к информационному перенасыщению (когда избыток информации по своему эффекту на поведение человека равен ее полному отсутствию) и порождают вопросы, связанные с этическими аспектами, а именно с точностью и непредвзятостью генерируемых машиной материалов. Однако существуют ли законы, по которым сообщения/послания, сгенериро-

ванные ЬЬМ, приобретают статус интересных, актуальных, значимых и мотивирующих для общества (или какой-то его части), носит ли этот процесс спонтанный, хаотический характер - на эти вопросы нам еще предстоит ответить.

Проникая в поле общественной дискуссии, ЬЬМ может имитировать стиль и способы выражения самых разных людей, в том числе известных политиков, писателей, деятелей искусства и т.п., тем самым, с одной стороны, происходит обогащение публичного дискурса, - он становится более насыщенным, живым и даже более «научным» или забавным, с другой же - порождаются новые этические дилеммы, связанные с авторством/авторским правом и достоверностью информации. Приведем отрывок из ответов языковой модели ChatGPT на запрос определить стиль писателя и сочинить в этом стиле эссе на тему миграционного кризиса в Европе:

В стиле популярного российского писателя Виктора Пелевина. Характеристика стиля, данная языковой моделью:

Изучение творчества Виктора Пелевина позволяет выявить несколько ключевых особенностей его стиля: глубокая философская пропитанность текстов, ирония, склонность к аллегории и использование элементов постмодернизма. Пелевин мастерски смешивает реальность с фантастикой, осмысляя актуальные социокультурные вопросы через призму абсурда и сюрреализма. С учетом этих особенностей, попытаемся воплотить стилистические особенности Пелевина в эссе на тему современного миграционного кризиса в Европе.

Эссе:

Замерзший небосвод над Европой, как старый добрый Платонов свод, склонился над континентом, безмолвно наблюдая драму миграции. В двадцать первом веке, после того как мир пережил апокалипсисы всех мастей -от экономических катаклизмов до меметических пандемий - Европа стала ареной новой игры. Игры, что не имеет правил, кроме главного: «Кто не спрятался, мы не виноваты».

Поезда и корабли, переполненные людскими судьбами, словно караваны времен океанских путешествий, несут на себе тяжесть веков и надежду на будущее, запакованные в чемоданы и пластиковые пакеты. Они прокладывают путь через границы, сталкиваясь с невидимым забором законов. Они как антенны, которые ищут сигнал в космическом пространстве.

А между тем, в уютных кафе Берлина и Парижа, где кофе по-прежнему подается с круассанами, происходит дискуссия иной природы. Интеллектуалы в очках с толстыми стеклами и джинсах, которые стали новой униформой бунтаря, обсуждают миграционный кризис, как если бы это было новым сюжетом для Жана-Поля Сартра в его экзистенциальном романе.

- Ведь если подумать, то Европа - это такой же многоголосый роман, бесконечный и беспределенный, где каждый мигрант - это слово, а каждая судьба - это предложение, - размышляет один из них.

- Да, но что, если этот роман кто-то реально пишет? И что если этот кто-то - сами мигранты, не осознающие того? - возражает другой, укутываясь в дым сигареты, словно в плащ.

...Так что же это - миграционный кризис? Возможно, это последняя глава в книге истории человечества, написанная от руки невидимого и всемо-

гущего автора. Автора, играющего в игру без правил, где герои могут стать пешками, а пешки - королями, там, где время и пространство смешиваются в одном калейдоскопе событий.

Но главный вопрос остается без ответа: кто же все-таки напишет конец?

LLM могут оказывать как прямое, так и косвенное воздействие на самые разные социальные процессы, в том числе на политику и образование, например:

- Принятие решений: Большие языковые модели могут ускорить и углубить процесс сбора и анализа данных, что поможет принимать более взвешенные политические, социально-значимые решения. Это может повысить эффективность работы всех ветвей власти и государственного управления, например, в таких сферах, как городское планирование, общественное здравоохранение и общественная безопасность.

- Выработка стратегий коммуникации: LLM могут предложить персонализированные коммуникационные стратегии, в том числе для политических кампаний или социальных движений, повышая их воздействие на общественное мнение.

- Цензура и контроль информации: если воспринимать контроль за качественным наполнением и интенсивностью информационных потоков как нормальное регулятивное социальное действие (например, с целью противодействия терроризму, насилию и т.п.), то LLM могут сделать эту работу более действенной. Однако при несбалансированных, авторитарных режимах государственного управления, такая поддержка со стороны ИИ может оказать отрицательное влияние на свободу слова и демократические процессы.

- Персонализированное обучение: Использование языковых моделей может привести к созданию обучающих платформ, способных адаптироваться под нужды конкретного ученика/студента, ускоряя процесс обучения и делая его более эффективным.

- Автоматизация образовательного процесса: от автоматической оценки тестовых работ до создания интерактивных уроков, ИИ может значительно снизить нагрузку на преподавателей и повысить доступность образования.

- Онлайн-образование: Большие языковые модели могут улучшить интерактивность и персонализацию онлайн-курсов, что делает дистанционное образование более привлекательным и доступным.

- Новые навыки и программы/курсы обучения: развитие ИИ в целом и LLM в частности потребует от студентов овладения новыми навыками, включая аналитику данных, машинное обучение, промпт-инжиниринг, этику ИИ и предотвращение возможных негативных последствий его использования, что повлияет на содержание учебных программ.

Обрабатывая огромные объемы информации, LLM дают нам возможность, с одной стороны, принимать более обоснованные решения, основанные на более широком спектре точек зрения, с другой стороны, в связи с широким распространением LLM остро встают вопросы: помогут ли они нам лучше понять мир или будут способствовать формированию искаженного или предвзятого представления о реальности? О роли агентности, автономии и свободы воли в создании и использовании этих моделей - в какой степени

мы действительно контролируем эти машины и в какой степени они контролируют нас через вмешательство в наше человеческое инфополе?

Важно учитывать, что характер материалов, генерируемых LLM, зависит от данных, на которых они обучались. Если эти данные несбалансированных или содержат предвзятые мнения или не основанные на научных фактах утверждения, модели могут воспроизводить и усиливать эти предвзятости и неточности в публичном дискурсе. Соответственно, на сегодняшнем уровне развития LLM существует необходимость в постоянном мониторинге и корректировке как входных, так и выходных данных (англ. Reinforcement Learning from Human Feedback, RLHF). За рамками проверенных разработчиками и специальными экспертами-контролерами (англ. assessors) вопросов и ответов такие системы могут посоветовать пользователю что-то опасное, ложное, ввести в заблуждение, так как далеко не каждый пользователь обладает квалификацией и опытом для распознавания неадекватности ответа, а задать и проверить все возможные вопросы заранее по понятным причинам не представляется возможным.

Хотя в контексте публичной коммуникации LLM могут также служить инструментом и для борьбы с дезинформацией, автоматически выявляя данные/предложения, которые не соответствуют доказательной базе, все же есть опасения, что эти модели скорее и чаще могут быть использованы для создания убедительных, но ложных нарративов, что представляет собой немалую угрозу интеллектуальной честности/фактологичности публичного дискурса с потенциально деструктивными последствиями для реальной жизни общества.

Таким образом, как и любой мощный инструмент, LLM требуют ответственного и осознанного использования со стороны как разработчиков, так и конечных пользователей. Прозрачность алгоритмов, понимание их ограничений и активное включение широкого круга заинтересованных сторон в процесс обучения и регулирования является ключом к тому, чтобы эти технологии служили общественному благу и способствовали здоровому публичному дискурсу. Такой подход поможет обеспечить, чтобы LLM служили общественному благу и защищали целостность публичного дискурса. Это требует разработки новых стандартов и правил, гарантирующих подлинность и достоверность общественного диалога.

Развитие ИИ и больших языковых моделей бесспорно станет катализатором глубоких изменений во многих аспектах общественной жизни. Важно, чтобы все стороны - разработчики, пользователи, государственные регуляторы и образовательные учреждения - работали вместе для обеспечения этичного использования технологий и максимизации их позитивного влияния на все сферы общества.

Появление Интернета в свое время, а теперь и Больших языковых моделей можно рассматривать одновременно как причины и признаки трансформации глобального социального порядка. Этот порядок сегодня таков, что любая информация, возможность ее получения, создания и распространения, становятся доступными для широкого круга индивидов. Это перераспределение «информационной власти» от традиционных авторитетов (СМИ, политические фигуры, культурные или научные элиты и т.п.) к индивидуальным участникам может рассматриваться как усиление демократических процес-

сов, но также влечет за собой определенные риски и вызовы, такие как нерациональное и деструктивное использование этих технологий (например, намеренное или непреднамеренное введение в заблуждение, приводящее к негативным индивидуальным и(или) социальным последствиям, утечка личных данных и др.).

В целом Интернет и LLM представляют собой мощные инструменты, которые меняют не только способы ведения публичной дискуссии и качественное наполнение публичного дискурса, но и структуру общественного знания и процессы познания. Производство знаний становится более сложным, - в этом процессе теперь принимают участие не только люди, но и машины. Различие между знаниями, вырабатываемыми искусственным интеллектом и созданными человеком, становится все тоньше. Это требует нового подхода к верификации и критическому анализу источников.

Переход к смешанным коммуникативным сообществам «человек-ИИ» порождает новые формы социального взаимодействия; с эпистемологической стороны, он выдвигает вопросы о критериях и методах обоснования знания; а с гносеологической - призывает к исследованию, каким образом индивиды и общество в целом осваивают и интерпретируют информацию в эпоху цифровых технологий.

С точки зрения лингвофилософии и когнитивных наук, Большие языковые модели могут существенно повлиять на понимание феноменов языка, сознания и процесса познания. Нам предстоит исследовать, как люди интерпретируют информацию, представленную искусственным интеллектом, какие когнитивные процессы задействованы при взаимодействии с машинно-генерированным контентом, какова роль сознательности и интенционально-сти в производстве речи и познавательной функции языка, и как эта роль изменяется, когда человек имеет дело с информацией, созданной LLM, лишенными сознания и интенциональности в традиционном понимании?

Отдельно стоит перечислить наиболее вероятные потенциальные риски, связанные с использованием LLM в публичном дискурсе:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Распространение дезинформации: LLM могут генерировать фейковые новости, которые для большинства могут быть неотличимы от настоящих, что может способствовать поляризации общества, деградации доверия к информации и различным институтам. В этой связи также стоит отметить, что LLM способны «галлюцинировать» - обнаруживать ложные связи в наборе обучающих данных и, соответственно, генерировать на выходе «бред» - верный по синтаксической форме, но лишенный смысла текст.

Разжигание ненависти: LLM могут использоваться для создания контента, проповедующего дискриминацию того или иного типа и разжигающего ненависть к отдельным людям или группам людей, что может привести к росту экстремизма и насилия.

Манипулирование общественным мнением: LLM могут использоваться для создания ботов, которые будут искусственно «порождать» тренды в социальных сетях, распространять пропаганду, манипулировать общественным мнением, повышая степень несправедливой эксплуатации населения.

Проблема «стохастического попугая» или «коллапса моделей»: из-за нарастающего объема материалов, циркулирующих в Интернете, авторами которых являются LLM, возникает риск их обучения на «вторичных» данных,

содержащих в себе неисправленные ошибки ИИ, что приведет к переполнению инфосферы малоинформативной, заведомо ложной и(или) «бредоподобной» информационной продукцией, которая при существенном внешнем сходстве с той, что производят люди, может чрезвычайного затруднить деятельность последних. Эту проблему иногда иронично называют «ИИ Габсбургов», имея ввиду, что LLM способны выродится, как эта древняя правящая испанская династия, в результате «близкородственного кровосмешения».

Очевидно, что Большие языковые модели вносят сегодня значительный вклад в создание нового дискурсивного ландшафта. Их влияние на публичный дискурс многогранно и имеет как положительные, так и отрицательные стороны. По сути мы имеем дело с зарождением и развитием смешанных коммуникативных сообществ «человек-ИИ», и эти сообщества будут появляться и функционировать во всех сферах жизни человека, включая образование, науку, политику и др.

LLM имеют потенциал не только обогащать публичный дискурс как таковой, но и создавать новую социальную реальность, в которой границы между человеческим и машинным взаимодействием становятся все более размытыми. Подходя к развитию LLM ответственно, общество может использовать их для улучшения коммуникации и понимания на глобальном уровне, обеспечивая при этом сохранение критического мышления и подлинности межличностного общения.

Что касается социальных эффектов, то влияние LLM будет заключаться в изменении способов общения, появлении новых форм искусства и литературы, и самое главное - LLM могут изменить наше представление о мире как таковом и о нас самих.

Активное внедрение Больших языковых моделей может привести к значительным и даже радикальным изменениям в науках о языке и обществе. Влияние LLM будет только усиливаться, поэтому так важны междисциплинарные исследования ИИ технологий - важно понимать, какое совместное будущее нас ожидает, какую максимальную пользу мы можем из них извлечь и как минимизировать потенциальные риски и угрозы.

Список источников

1. Фуко М. Археология знания / пер. с фр. М.Б. Раковой, А.Ю. Серебрянниковой ; вступ. ст. А.С. Колесникова, СПб. : Гуманитарная Академия : Университетская книга, 2004. 416 с.

2. Хабермас Ю. Структурное изменение публичной сферы: Исследования относительно категории буржуазного общества. М. : Весь Мир, 2016. 344 с.

3. Лягошина Т.В. Гибридизация публичного дискурса в современном медиапространстве: социальные эффекты и исследовательская перспектива // Вестник Томского государственного университета. Философия. Социология. Политология. 2022. № 69. C. 94-103

4. Ивахненко А.Г., Лапа В.Г. Кибернетические предсказывающие устройства / Акад. наук УССР. Киев : Наукова думка, 1965. 214 с.

5. Vaswani A. et al. Attention Is All You Need // Proceedings of the 31st International Conference on Neural Information Processing Systems, NIPS 2017 (Long Beach, CA, USA), NY : Curran Associates Inc., 2017.

6. Putnam H. Minds and machines (edited by Alan Ross Anderson). New Jersey : Prentice-Hall, Inc., Englewood Cliffs, 1964. P. 72-97.

7. Fodor J. The Language of Thought. Cambridge, Massachusetts : MIT Press, 1975. 228 p.

8. Соссюр Ф. де. Курс общей лингвистики / ред. Ш. Балли, А. Сеше ; пер. с фр. А. Сухотина // Де Мауро Т. Биографические и критические заметки о Ф. де Соссюре; Примечания / пер. с фр. С.В. Чистяковой ; под общ. ред. М.Э. Рут. Екатеринбург : Изд-во Урал. ун-та, 1999. 432 с.

9. Витгенштейн Л. Философские исследования / пер. с нем. Л. Добросельского. М. : АСТ, 2018. 352 с.

10. Блумфилд Л. Language. Chicago : University of Chicago Press, 1984. 564 p.

11. Lenci, Alessandro; Sahlgren, Magnus. Distributional Semantics. Cambridge University Press, 2023. 452 р.

12. Rubenstein H., Goodenough J. Contextual correlates of synonymy // Commun. ACM. Vol. 8, Iss. 10, 1965. P. 627-633.

References

1. Foucault, M. (2004) Arkheologiya znaniya [Archeology of Knowledge]. Translated from French by M. Rakova, A. Serebryannikova. St. Petersburg: Gumanitarnaya Akademiya: Universi-tetskaya kniga.

2. Habermas, J. (2016) Strukturnoe izmenenie publichnoy sfery: Issledovaniya otnositel'no kategorii burzhuaznogo obshchestva [Structural change in the public sphere: Research on the category of bourgeois society]. Translated from German. Moscow: Ves' Mir.

3. Lyagoshina, T.V. (2022) Hybridisation of public discourse in the modern media space: social effects and research perspectives. Vestnik Tomskogo gosuniversiteta Filosofiya. Sotsiologiya. Politologiya - Tomsk State University Journal of Philosophy, Sociology and Political Science. 69. pp. 94-103. (In Russian). DOI: 10.17223/1998863X/69/11

4. Ivakhnenko, A.G. & Lapa, V.G. (1965) Kiberneticheskiye predskazyvayushchiye ustroystva [Cybernetic predictive devices]. Kiev: Naukova dumka.

5. Vaswani, A. et al. (2017) Attention Is All You Need. Proceedings of the 31st International Conference on Neural Information Processing Systems, NIPS 2017 (Long Beach, CA, USA), New York: Curran Associates Inc.

6. Putnam, H. (1964) Minds and Machines. Prentice-Hall, Inc., Englewood Cliffs, New Jersey. pp. 72-97.

7. Fodor, J. (1975) The Language of Thought. Cambridge, Massachusetts: MIT Press.

8. Saussure, F. de (1999) Kurs obshchey lingvistiki [Course in General Linguistics]. Translated from French by A. Sukhotin. Ekaterinburg: Ural State University.

9. Wittgenstein, L. (2018) Filosofskiye issledovaniya [Philosophical Studies]. Translated from German by L. Dobroselskiy. Moscow: AST.

10. Bloomfield, L. (1984) Language. Chicago: University of Chicago Press.

11. Lenci, A. & Sahlgren, M. (2023) Distributional Semantics. Cambridge University Press.

12. Rubenstein, H. & Goodenough, J. (1965) Contextual correlates of synonymy. Communications of the ACM. 8(10). pp. 627-633.

Сведения об авторе:

Лягошина Т.В. - аспирант кафедры истории философии и логики философского факультета Национального исследовательского Томского государственного университета (Томск, Россия). E-mail: [email protected]

Автор заявляет об отсутствии конфликта интересов.

Information about the author:

Lyagoshina T.V. - postgraduate student of the Department of History of Philosophy and Logic, Faculty of Philosophy, National Research Tomsk State University (Tomsk, Russian Federation). E-mail: lyago shina. tatiana@gmail .com

The author declares no conflicts of interests.

Статья поступила в редакцию 17.04.2022; одобрена после рецензирования 22.05.2024; принята к публикации

The article was submitted 17.04.2022; approved after reviewing 22.05.2024; accepted for publication

i Надоели баннеры? Вы всегда можете отключить рекламу.