Научная статья на тему 'Возможности методов искусственного интеллекта в психологических исследованиях сетевой коммуникации'

Возможности методов искусственного интеллекта в психологических исследованиях сетевой коммуникации Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
248
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
автоматический анализ текста / реляционно-ситуационный анализ / лексико-частотный анализ / психолингвистические показатели / сетевая коммуникация / automatic text analysis / relational-situational analysis / lexical-frequency analysis / psycholinguistic indicators / network communication

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Осипов Г. С., Чудова Н. В.

Представлена информация о новом инструменте ИИ, предназначенном для проведения исследований в социо-гуманитарных областях знания на основе автоматического анализа русскоязычных текстов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Осипов Г. С., Чудова Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A FEASIBILITY OF ARTIFICIAL INTELLIGENCE METHODS IN PSYCHOLOGICAL STUDIES OF NETWORK COMMUNICATION

The article is devoted to a new AI tool for socio-humanitarian research based on automatic analysis of texts in Russian.

Текст научной работы на тему «Возможности методов искусственного интеллекта в психологических исследованиях сетевой коммуникации»

УДК 159.9.078; 004.8

ВОЗМОЖНОСТИ МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА В ПСИХОЛОГИЧЕСКИХ ИССЛЕДОВАНИЯХ СЕТЕВОЙ КОММУНИКАЦИИ58

Осипов Г.С., Чудова Н.В.

Москва, Федеральный исследовательский центр «Информатика и управление» РАН

e-mail: nchudova@gmail.com

Аннотация. Представлена информация о новом инструменте ИИ, предназначенном для проведения исследований в социо-гуманитарных областях знания на основе автоматического анализа русскоязычных текстов.

Ключевые слова: автоматический анализ текста, реляционно-ситуационный анализ, лексико-частотный анализ, психолингвистические показатели, сетевая коммуникация.

A FEASIBILITY OF ARTIFICIAL INTELLIGENCE METHODS IN PSYCHOLOGICAL

STUDIES OF NETWORK COMMUNICATION Osipov G.S., Chudova N.V.

Moscow, Federal Research Center «Computer Science and Control» RAS e-mail: nchudova@gmail.com

Abstract. The article is devoted to a new AI tool for socio-humanitarian research based on automatic analysis of texts in Russian.

Keywords: automatic text analysis, relational-situational analysis, lexical-frequency analysis, psycholinguistic indicators, network communication.

Психологические исследования социальных медиа нуждаются в инструментах анализа поведения человека в условиях сетевой коммуникации, при этом особое значение имеет анализ сетевых дискуссий. В Институте проблем искусственного интеллекта ФИЦ ИУ РАН создан инструмент автоматического анализа текста для проведения гуманитарных исследований, в том числе, в области психологии интернета.

В развиваемом нами подходе в качестве основного средства анализа текста используется реляционно-ситуационный анализ (РСА). Метод РСА [6], опирается на синтаксемный анализ Г.А. Золотовой [3] и на аппарат неоднородных семантических сетей Г.С. Осипова [8]. «Синтаксемой называется минимальная, далее неделимая синтактико-семантическая единица русского языка, выступающая одновременно как носитель элементарного смысла и как конструктивный компонент более сложных синтаксических построений, характеризуемая, следовательно, определенным набором синтаксических функций» [7, с. 34]. В работе [8, с.41] значение этого термина раскрывается таким образом: «Так, например, в локативных формах в лесу, за лесом, над лесом, из леса, из-за леса, возле леса актуализируется значение места. ... В рассмотренных примерах синтаксемами с локативным значением являются «в+ предл. падеж» и «за+твор. падеж» и др. С другой стороны, в предложении «Старик (мальчик, рыбак) ловил неводом рыбу», имя старик невозможно заменить, на имя, например, свисток - это разрушит предложение. Слова старик, мальчик, рыбак имеют общее категориальное значение - значение лица, свисток же имеет категориальное значение предмета и не может выполнять функцию субъекта. Таким образом, кроме морфологической формы слова решающую роль играет обобщенное значение, то есть категориально-семантический класс слова». Как можно видеть, значение синтаксемы оказывается и шире значения отдельного слова (локативом могут служить самые разные предметы) и одновременно - уже, конкретнее, поскольку вычленяет в предмете только одну из его многочисленных ролей: «Существительное президент как личное существительное в разных синтаксических конструкциях может выражать значения: субъекта (президент подписал указ), объекта (доверять президенту), адре-

58 Работа выполнена при частичной финансовой поддержке РФФИ (грант №18-00-00233)

сата (обращение к президенту), делиберата (говорить о президенте), комитатива (Патриарх с президентом зашли в храм), предиката (Иванов - президент страны)» [8, с.43]. Таким образом, синтаксема, с одной стороны, представляет значение не одного предмета, а целого класса, но, с другой, - уточняет значение конкретного предмета в конкретной ситуации.

В психологии это представление о значении как продукте процесса обобщения, при том, что сам процесс обобщения обслуживает конкретную деятельности субъекта, развивается в культурно-историческом подходе. Л.С. Выготский прямо говорит о роли значения как единицы анализа речевого мышления: «есть все основания рассматривать значение слова ... как единство обобщения и общения, коммуникаций и мышления» [1]. А.Н. Леонтьев, развивая идеи Л.С.Выготского, определяет значение как тот компонент сознательного представления, в котором отражен общественно-исторический опыт использования предмета. Можно сказать, что важнейшее для культурно-исторического подхода представление о языковом опосредствовании высших психических функций человека нуждается именно в представлении о синтаксеме как о единице анализа речи. Ведь, в отличие от значения отдельного слова, лишь указывающего на предмет, синтаксема отражает ситуацию бытования предмета в культуре, она представляет обстоятельства его использования в человеческом обществе, характеризует тот класс предметов, которые являются эквивалентными по значению для исполняемого действия. В этом плане скорее значение, представленное в синтаксеме, чем словарное значение слова, является единицей речевого мышления - обобщению подвергается сам момент действования с предметом и предмет предстает в той роли, которую он играет в конкретной ситуации.

Однако для исследования структуры деятельности, отражённой в тексте, синтаксем-ного анализа недостаточно. Наряду с выявлением в высказывании предметов, играющих роли целей и условий деятельности, необходимо иметь возможность определять и саму активность субъекта - его действия и операции, выполняемые с этими предметами. В методе РСА такая функция предусмотрена. Как указано в [8], для анализа предложения важно не только знание значений встречающихся в нем синтаксем, но и их сочетаемость друг с другом. Эта сочетаемость определяется семейством бинарных отношений на множестве синтаксем. Реляционно-ситуационный анализ позволяет выявлять семантику текста, ставя в соответствие синтаксемную структуру предложения логической структуре действий, описанных в этом предложении. Главную роль здесь играют глаголы, имеющие, как правило, центральное положение в семантической структуре предложения и оказывающие решающее влияние на именные словосочетания и предложения, составляющее синтаксемные группы. Поэтому действия, типичные для бытовой, общественно-политической и исследовательской деятель-ностей, в виде глаголов, девербативов и причастий, наиболее часто встречающихся в информационно-новостных, публицистических и научных текстах, собираются разработчиками РСА в Словаре предикатных слов.

Именно такой анализ, ориентированный на вычленение принятых в культуре действий с предметами (предикатно-синтаксемный в лингвистической терминологии или операционально-предметный в психологической терминологии), релевантен задаче анализа текста как источника информации о человеческой деятельности и одновременно - задаче исследования текста как продукта речевой деятельности автора. Другими словами, метод РСА позволяет как эксплицировать картину объективной реальности, отражённой в тексте, так и реконструировать «картину мира» конкретного автора. Это направление лишь недавно начало развиваться, для его обозначения стало использоваться уточняющее название данной области автоматического анализа текстов - когнитивный анализ текста; для развития метода РСА в этом направлении был создан инструмент, получивший название «Машина РСА».

Разрабатываемый нами инструмент основан на методах реляционно-ситуационного анализа, лексико-частотного анализа и психолингвистического анализа русскоязычных текстов научного, публицистического и бытового жанров. Система работает на основе процессора Exactus Expert и в настоящий момент позволяет искать в тексте показатели трёх типов: предикатно-синтаксемные структуры, отражающие представления автора об объектах и со-

бытиях, а также о принимаемых и отвергаемых им сценариях поведения (75 семантических ролей и 32 семантические связи); показатели частотности в тексте лексических единиц, относящихся к определенным тематическим группам слов (29 ТГС, 52 тыс.словарных единиц); психолингвистические показатели, отражающие эмоциональное состояние автора (27 текстовых маркеров и 14 видов частей речи).

Машина РСА, построенная на так организованном автоматическом лингвистическом анализе, позволяет исследователям решать целый ряд задач, связанных с экспликацией представлений и отношений автора текста к реалиям, о которых он пишет.

I.Экспериментальная работа с текстом возможна при решении следующих задач:

• на основе анализа одного текста выяснять в каких семантических ролях и с какими предикатами встречается в тексте интересующий исследователя объект, т.е. описывать смысл объекта для автора;

• на основе исследования коллекции текстов автора представить его картину мира в виде системы значимых для него объектов и действий с ними;

• на основе изучения коллекций текстов разных авторов на заданную тему представить мнения авторов как пространство убеждений/отношений.

Для проверки гипотез о содержании индивидуальной или групповой картины мира исследователь обращается к следующим основным функциям машины РСА:

1. Поиск для заданного пользователем слова (списка слов) из Словаря предикатных слов, для которых слово является аргументом и заполняет ту или иную семантическую роль в тексте.

2. Поиск всех семантических ролей для заданного слова.

3. Поиск в тексте слов, присутствующих в лексиконе Машины (в виде ТГС). Есть возможность выбрать работу с одним ТГС или одновременно с несколькими ТГС.

4. Поиск в тексте и отображение на текстовой плоскости предикатных слов с заданным значением (движения, разрушения, мыслительной активности...) и их аргументов.

5. Отображение на текстовой плоскости всех предикатов со всеми аргументами, в том числе теми, для которых роли не установлены.

6. Поиск для заданного слова всех однокоренных слов разных частей речи.

7. Поиск для заданного слова синонимов, антонимов, гипонимов, конверсивов и т. д., встречающихся в тексте или корпусе текстов.

Результаты поиска представляются в том числе в виде конкордансов с указанием для искомой конструкции контекстов заданной длины и ссылок на тексты, в которых содержится конструкция. От конкорданса можно перейти к просмотру вхождения конструкции непосредственно в тексте.

Работы такого рода требуют от психологов освоения возможностей, предоставляемых Машиной РСА, а от специалистов по ИИ - интеграции полученных психологами результатов в систему когнитивного анализа текстов.

II. Частотный анализ текста.

Кроме поисковых функций, машина РСА реализует функции вычисления частотных и статистических характеристик для результатов поиска на корпусе или на отдельных текстах. Например, при поиске по заданному слову (функция 1) выводится упорядоченный по частотности список предикатных слов, для которых заданное слово является аргументом, и упорядоченный по частотности список семантических ролей, заполняемых заданным словом при указанных предикатных словах. Так же, как и при работе с реляционными базами данных, в машине РСА возможна группировка результатов поиска по различным полям и вычисление количества найденных результатов, среднего и т.п. с упорядочиванием по убыванию или возрастанию.

Сбор сравнительной статистики встречаемости текстовых показателей - это наиболее распространённый в последние годы способ использования данных автоматического анализа текстов. Авторским коллективом, создающим Машину РСА (сотрудники ФИЦ ИУ РАН, ИРЯ РАН, НЦПЗ РАН, ПермГУ), к настоящему времени обнаружены особенности текстов

больных шизофренией, больных депрессией, здоровых с повышенным уровнем враждебности, гневливости и склонности к физической агрессии и ряда других психологических особенностей (см., например, [4], [5]). Так же выявлены особенности сетевых текстов (постов и комментариев в соцсетях), написанных в состоянии фрустрации [2].

Отметим, что этот, уже ставший традиционным, путь сбора характерных для различных ситуаций и/или типов личности особенностей текстовой продукции, имеет ряд ограничений.

Во-первых, оценка состояния человека по созданному им тексту не может рассматриваться как результат психодиагностического обследования и применяться в задачах постановки диагноза. Полученные с помощью автоматического анализа текста оценки могут применяться в широком круге задач обеспечения информационно-психологической безопасности, выделения группы риска по социальным и психологическим стрессорам, в социотера-пии.

Во-вторых, следует учитывать, что на текст оказывают влияние три группы факторов: эмоциональное состояние пишущего, стабильные личностные особенности автора, а также та задача, которую он решает при создании текста. При этом каждый из этих общих факторов представляет собой совокупность взаимодействующих между собой частных факторов. Так, эмоциональное состояние может быть рассмотрено и как реакция на ситуацию (фрустрации, стресса, утомления и проч.), и как характеристика эмоциональной сферы личности; при этом эмоциональная реакция любого типа может быть функцией нормальной, дисфункциональной или патологически изменённой эмоциональной сферы личности. Аналогично, особенности задачи, решаемой человек с помощью создания текстовой продукции, не представляют собой одномерной гомогенной конструкции.

В-третьих, учёт в качестве текстовых характеристик не только особенностей языка как системы, и даже не только особенностей строения конкретного национального языка, но и речевой системности, начался не так давно. В настоящий момент большинство систем автоматического анализа текста опираются на показатели, выявляемые для англоязычных текстов; даже словари эмоциональной оценки, используемые при анализе русскоязычных текстов, в подавляющем большинстве систем являются калькой словарей, специфичных для английской языковой картины мира. Системность русского языка пока учитывается крайне скудно, метод РСА и ТГС оценочной лексики, используемые в Машине РСА пока остаются единственными средствами ИИ, специально созданными для работы с текстами, написанными по-русски. Речевая же системность начала привлекать внимание специалистов по ИИ лишь в последние два-три года в рамках совместных работ с руссистами-речеведами. Работы в этом направлении выполняются в рамках создания психолингвистических модулей Машины РСА

В целом, Машина РСА представляет собой инструмент изучения картины мира человека или группы людей, а так же исследования преобладающих эмоциональных реакций и личностных характеристик в популяционных исследованиях. В этом качестве она может быть использована в работах по экологической психологии и психологии Интернета. Распространение привычки к общению в социальных сетях предоставляет материал для выявления с помощью Машины РСА реакций населения на различные информационные поводы и для исследований сетевой коммуникации, проводимых в интересах поддержания информационно-психологической безопасности, психопрофилактики и социотерапии.

Список литературы

1. ВыготскийЛ.С. Мышление и речь. М.: Лабиринт, 1999

2. Ениколопов С.Н., Ковалёв А.К., Кузнецова Ю.М., Старостина Е.В., Чудова Н.В. Признаки, характерные для текстов, написанных в состоянии фрустрации // Вестник Московского университета. Серия 14. Психология. 2019. № 3. с. 66-85.

3. Золотова Г.А., Онипенко Н.К., Сидорова М.Ю. Коммуникативная грамматика русского языка // Институт русского языка РАН им. В. В. Виноградова. 2004.

4. Ковалёв А.К., Кузнецова Ю.М., Минин А.Н., Пенкина М.Ю., Смирнов И.В., Станкевич М.А., Чудова Н.В. Методы выявления по тексту психологических характеристик автора (на примере агрессивности) // Вопросы кибербезопасности. 2019. №4. С. 72-80.

5. Никитина Е.Н., Онипенко Н.К. Когнитивно-лингвистическая интерпретация результатов автоматического анализа текстов психически больных // Искусственный интеллект и принятие решений. 2019. №3. С.60-69.

6. Осипов Г.С., Смирнов И.В., Тихомиров И. Реляционно-ситуационный метод поиска и анализа текстов и его приложения // Искусственный интеллект и принятие решений. 2008. № 2. С.3-10

7. Осипов Г.С. Построение моделей предметных областей. Ч.1. Неоднородные семантические сети // Известия АН СССР. Техническая кибернетика. 1990. №5. С.32-45.

8. Осипов Г. С. Приобретение знаний интеллектуальными системами. // М.: Наука. Физматлит, 1997.

УДК 159.9.072.43

«HOMO INFORMATICUS»: ТРАНСФОРМАЦИЯ СУБЪЕКТ-СРЕДОВЫХ

ВЗАИМОДЕЙСТВИЙ ПОД ВЛИЯНИЕМ ИНФОРМАЦИОННОЙ СРЕДЫ59

Патраков Э.В.

ФГОУ ВО «Уральский федеральный университет», Екатеринбург, Россия

E-mail: e.v.patrakov@urfu.ru Батурина Л.И.

Университет Uninassau, Ресифи, Бразилия E-mail: Baturina l@yahoo.com Регина Селия Перейра де Мораес Уиверситетский центр Unicarioca, Рио-де-Жанейро, Бразилия E-mail: rmoraes@unicarioca.edu.br Роза Лидиси де Мораес Валим Университетский центр Unicarioca, Рио-де-Жанейро, Бразилия E-mail: rvalim@globo.com

Аннотация. Информационная среда фундаментально изменила субъекта, среду его жизнедеятельности. Основываясь на концепции субъект-средового взаимодействия (Панов В.И.), авторы раскрывают пять ключевых тенденций трансформации субъекта под влиянием информационной среды и их потенциальную рискогенность для субъекта.

Ключевые слова: информационная среда, психологические риски, «Homo informaticus», трансформация социальных отношений, взаимодействие человека и информационной среды, субъект-средовое взаимодействие.

«HOMO INFORMATICUS»: TRANSFORMATIONS OF SOCIAL RELATIONS UNDER THE INFLUENCE OF DIGITAL INFORMATION ENVIRONMENT

Patrakov E.V.

Ural Federal University, Ekaterinburg, Russia E-mail: e.v.patrakov@urfu.ru Batourina L.I. University Uninassau, Recife, Brazil E-mail: Baturina_l@yahoo.com Regina Celia Pereira de Moraes University center Unicarioca, Rio de Janeiro, Brazil E-mail: rmoraes@unicarioca.edu.br

59 Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 19-29-14067 мк.

i Надоели баннеры? Вы всегда можете отключить рекламу.