Научная статья на тему 'ПРИЗНАКИ, ХАРАКТЕРНЫЕ ДЛЯ ТЕКСТОВ, НАПИСАННЫХ В СОСТОЯНИИ ФРУСТРАЦИИ'

ПРИЗНАКИ, ХАРАКТЕРНЫЕ ДЛЯ ТЕКСТОВ, НАПИСАННЫХ В СОСТОЯНИИ ФРУСТРАЦИИ Текст научной статьи по специальности «Языкознание и литературоведение»

CC BY
195
35
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФРУСТРАЦИЯ / СОЦИАЛЬНЫЕ СЕТИ / АВТОМАТИЧЕСКИЙ АНАЛИЗ ТЕКСТА / ТЕКСТОВЫЕ ПРИЗНАКИ / МАШИННОЕ ОБУЧЕНИЕ / FRUSTRATION / SOCIAL NETWORKS / TEXT MINING / TEXT FEATURES / MACHINE LEARNING

Аннотация научной статьи по языкознанию и литературоведению, автор научной работы — Ениколопов Сергей Николаевич, Ковалёв Алексей Константинович, Кузнецова Юлия Михайловна, Чудова Наталья Владимировна, Старостина Елена Валериевна

Актуальность. Создание средств для выявления в сетевом контенте негативных психологических состояний относится к наиболее актуальным из задач, порожденных развитием информационных технологий. Имеются данные о том, что речь и текстовая деятельность человека в состоянии фрустрации отличаются рядом особенностей, однако для текстов на русском языке инструмента, позволяющего проводить мониторинговые исследования выраженности фрустрации в сетевом контенте, на настоящий момент не существует. цель. Формирование перечня текстовых признаков, позволяющих в ходе автоматического анализа сетевого контекста выделять тексты фрустрированных пользователей. методика. Материал исследования: посты и комментарии (в объеме 2-10 предложений) ста русскоязычных пользователей ЖЖ, Пикабу и Фейсбук из России, стран ближнего и дальнего зарубежья в возрасте 27-64 лет. Тексты были разделены на написанные в спокойном состоянии (СТ, 50 текстов каждого пользователя) и в состоянии фрустрации (ФТ, 50 текстов каждого). Метод автоматического анализа текста: созданная в ФИЦ ИУ РАН «Машина РСА», позволяющая определять 197 текстовых признаков. Методы математической обработки: задача классификации текстов решалась с применением алгоритмов машинного обучения. Результаты. Метод Random Forest с предварительной процедурой бинаризации выявил наиболее значимые признаки, наличие которых в тексте позволяет относить его к классу ФТ: тональность слов; частотность знаков препинания, отрицательных словоформ и местоимений первого лица; количество слов в семантических ролях каузатив, ликвидатив и деструктив; число частиц, инвектив слов и слов с семантикой сопротивления. выводы. Совокупность выявленных признаков позволяет достаточно эффективно выделять в сетевом контенте тексты, написанные в состоянии фрустрации; такая оценка носит статистический характер и, не имея индивидуально-диагностической направленности, может быть компонентом мониторинговых мероприятий в целях обеспечения информационно-психологической безопасности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по языкознанию и литературоведению , автор научной работы — Ениколопов Сергей Николаевич, Ковалёв Алексей Константинович, Кузнецова Юлия Михайловна, Чудова Наталья Владимировна, Старостина Елена Валериевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FEATURES OF TEXTS WRITTEN BY A FRUSTRATED PERSO

Te designing of tools to identify a psychological distress in network is one of the most signifcant challenges of the era of information technology. Tere are evidences of certain peculiarities of the speech and textual activity of frustrated person. However, for texts in Russian, any tool for monitoring of the intensity of frustration in online content does not currently exist. objective. Te purpose of our work is the listing of text features to carry out automatic analysis of the network content for detecting texts of frustrated users. methods. Te material of the study is a set of posts and comments of 2-10 sentences collected in social networks LiveJournal, Pikabu and Facebook were written by 100 Russian-speaking users aged 27-64 years. Te texts were divided as written by unexcited persons (500 texts) and by frustrated persons (500 texts). For automatic text analysis, the “RSA Machine” created in Federal Research Center “Computer Science and Control” of Russian Academy of Sciences was used, which allows to determine 197 text features, to compare texts, and to identify the most important dividing features. Mathematically, the texts were classifed using the machine learning. results. The Random Forest method with a preliminary binarization procedure revealed the most signifcant features of text written by frustrated person: the sentiment; the frequency of punctuation, negative word forms and frst-person pronouns; the number of semantic roles causative, liquidative and destructive; number of particles, invectives and words from the vocabulary of resistance. conclusions. Using the identifed features the network texts written by frustrated person can be confdently determined; it is applicable for monitoring in order to ensure information and psychological security.

Текст научной работы на тему «ПРИЗНАКИ, ХАРАКТЕРНЫЕ ДЛЯ ТЕКСТОВ, НАПИСАННЫХ В СОСТОЯНИИ ФРУСТРАЦИИ»

УДК 159.9.07; 004.8

doi: 10.11621/vsp.2019.03.66

признаки, характерные для текстов, написанных в состоянии фрустрации

С. Н. Ениколопов1, А. к. ковалёв2, ю. м. кузнецова2, Н. В. чудова2, Е. В. Старостина3

1 ФГБНУ «Научный центр психического здоровья», Москва, Россия

2 Федеральный исследовательский центр «Информатика и управление» РАН, Москва, Россия

3 Институт ядерной физики имени Г.И. Будкера СО РАН, Новосибирск, Россия Для контактов. E-mail: enikolopov@mail.ru

Актуальность. Создание средств для выявления в сетевом контенте негативных психологических состояний относится к наиболее актуальным из задач, порожденных развитием информационных технологий. Имеются данные о том, что речь и текстовая деятельность человека в состоянии фрустрации отличаются рядом особенностей, однако для текстов на русском языке инструмента, позволяющего проводить мониторинговые исследования выраженности фрустрации в сетевом контенте, на настоящий момент не существует.

цель. Формирование перечня текстовых признаков, позволяющих в ходе автоматического анализа сетевого контекста выделять тексты фру-стрированных пользователей.

методика. Материал исследования: посты и комментарии (в объеме 2—10 предложений) ста русскоязычных пользователей ЖЖ, Пикабу и Фейс-бук из России, стран ближнего и дальнего зарубежья в возрасте 27—64 лет. Тексты были разделены на написанные в спокойном состоянии (СТ, 50 текстов каждого пользователя) и в состоянии фрустрации (ФТ, 50 текстов каждого). Метод автоматического анализа текста: созданная в ФИЦ ИУ РАН «Машина РСА», позволяющая определять 197 текстовых признаков. Методы математической обработки: задача классификации текстов решалась с применением алгоритмов машинного обучения.

Результаты. Метод Random Forest с предварительной процедурой бинаризации выявил наиболее значимые признаки, наличие которых в тексте позволяет относить его к классу ФТ: тональность слов; частотность знаков

© 2019 ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова» © 2019 Lomonosov Moscow State University

препинания, отрицательных словоформ и местоимений первого лица; количество слов в семантических ролях каузатив, ликвидатив и деструктив; число частиц, инвектив слов и слов с семантикой сопротивления.

выводы. Совокупность выявленных признаков позволяет достаточно эффективно выделять в сетевом контенте тексты, написанные в состоянии фрустрации; такая оценка носит статистический характер и, не имея индивидуально-диагностической направленности, может быть компонентом мониторинговых мероприятий в целях обеспечения информационно-психологической безопасности.

Ключевые слова: фрустрация, социальные сети, автоматический анализ текста, текстовые признаки, машинное обучение.

Благодарности: Работа выполнена при поддержке РФФИ (проект № 17-29-02247).

Для цитирования: Ениколопов С.Н., Ковалёв А.К., Кузнецова Ю.М., Чудова Н.В., Старостина Е.В. Признаки, характерные для текстов, написанных в состоянии фрустрации // Вестник Московского университета. Серия 14. Психология. 2019. № 3. С. 66—85. doi: 10.n621Mp.2019.03.66

Поступила в редакцию 08.06.19/Принята к публикации 19.06.19

features of texts written by a frustrated person

Sergey N. Enikolopov1, Alexey K. Kovalev2, Juliya M. Kiznetsova2,

Natalia V. Chudova2, Elena V. Starostina3

1 Mental Health Research Center, Moscow, Russia

2 Federal Research Center "Computer Science and Control" of RAS, Moscow, Russia

3 Budker Institute of Nuclear Physics of SB RAS, Novosibirsk, Russia

Corresponding author. E-mail: enikolopov@mail.ru

Abstract

Relevance. The designing of tools to identify a psychological distress in network is one of the most significant challenges of the era of information technology. There are evidences of certain peculiarities of the speech and textual activity of frustrated person. However, for texts in Russian, any tool for monitoring of the intensity of frustration in online content does not currently exist.

objective. The purpose of our work is the listing of text features to carry out automatic analysis of the network content for detecting texts of frustrated users.

Methods. The material of the study is a set of posts and comments of 2-10 sentences collected in social networks LiveJournal, Pikabu and Facebook were written by 100 Russian-speaking users aged 27-64 years. The texts were divided as written by unexcited persons (500 texts) and by frustrated persons (500 texts). For automatic text analysis, the "RSA Machine" created in Federal Research Center "Computer Science and Control" of Russian Academy of Sciences was used, which allows to determine 197 text features, to compare texts, and to identify the most important dividing features. Mathematically, the texts were classified using the machine learning.

Results. The Random Forest method with a preliminary binarization procedure revealed the most significant features of text written by frustrated person: the sentiment; the frequency of punctuation, negative word forms and first-person pronouns; the number of semantic roles causative, liquidative and destructive; number of particles, invectives and words from the vocabulary of resistance.

conclusions. Using the identified features the network texts written by frustrated person can be confidently determined; it is applicable for monitoring in order to ensure information and psychological security.

Keywords: frustration, social networks, text mining, text features, machine learning.

Acknowledgements: This work was supported by the Russian Foundation for Basic Research (Grant No. 16-06-01082-0GN).

For citation: Enikolopov, S.N., Kovalev, A.K., Kiznetsova, J.M., Chudova, N.V., & Starostina, E.V. (2019). Features of texts written by a frustrated person. Vestnik Moskovskogo universiteta. Seriya 14. Psikhologiya = Moscow University Psychology Bulletin, 3, 66—85. doi: 10.11621/vsp.2019.03.66

Received: June 08, 2019/Accepted: June 19, 2019

введение

Данная работа продолжает исследование возможностей автоматического анализа русскоязычных текстов, проводимого в интересах психологии (Воронцова и др., 2018; Ениколопов и др., 2019; Кузнецова, Чудова, 2018а). В работе Ю.М. Кузнецовой и Н.В. Чудовой (2018б) представлены результаты пилотажного исследования применения лингвистического анализатора, компьютерного инструмента «Машина РСА», использующего реляционно-ситуа-

ционный анализ в работе с русскоязычными текстами (Осипов и др., 2008) для выявления речевых признаков фрустрации. Работы в этом направлении были продолжены и сейчас мы представляем данные исследования 1000 текстов — постов и комментариев 100 пользователей соцсетей.

Фундаментальной научной проблемой, в рамках которой ставились задачи настоящего исследования, является проблема речевых механизмов распространения фрустрации и агрессии. Информационный век породил увеличение числа социальных и информационных источников стресса, а в настоящий момент уже вполне всерьез говорится об информационно-психологическом воздействии как инструменте психической дестабилизации. В традиционной для психологии проблеме возникновения и распространения фрустрации появилась и проблематика, связанная с вопросом о методе выявления состояния фрустрации по текстам пользователей социальных сетей.

Предложенное С. Розенцвейгом системное описание причин, типов и проявлений фрустрации, вариантов реакции на нее, а также представление о фрустрационной толерантности не потеряли своей актуальности. Под фрустрацией С. Розенцвейг понимал реакцию на лишение возможности удовлетворения потребности (первичная фрустрация) или на наличие препятствий к удовлетворению потребности (вторичная фрустрация). С точки зрения теории поля К. Левина, состояние фрустрации, порождаемое наличием преграды на пути удовлетворения потребности, ведет к деструкции поведения и возникновению агрессивных, регрессивных или ирреалистичных форм поведения. Ф.Е. Василюк (1984) в рамках своей типологии кризисных ситуаций определяет фрустрацию как субъективную невозможность реализации существенно значимого мотива. Интересующий нас аспект — проявление состояния фрустрации в текстах — исследуется при анализе связей между типом фрустрационного реагирования и коммуникативной компетентностью (Жарких, 2009), а также в рамках изучения так называемого «языка фрустрации», отражающего широкий спектр отрицательных эмоций, таких, как недовольство, осуждение, неприязнь, отчаяние, тоска, гнев, агрессия, депрессия и т.д. (Колышкина, 2011; Харченко, Коренева, 2007; Хачересова, 2011). Имеются работы, в которых прослеживаются связи состояния фру-стрированности субъекта с особенностями его вербальной деятельности, в том числе сетевой (Комалова, 2013; Beatty, McCroskey 1997). Дж. Пеннбейкер опубликовал данные о значимом снижении частоты

употребления местоимений «я» и «мой» и увеличении частотности «мы» и «наш» в блогах американцев после воздушной атаки на башни-близнецы в Нью-Йорке (Pennebaker, 2011).

Проявление фрустрации в интернете изучается преимущественно в контексте проблемы депривации каких-либо потребностей пользователей — игровой (Вайнштейн, Смирнова, 2012), эмоционального общения (Ложкина, 2015) и т.п. — либо в связи с реализацией фрустрированности в предпочитаемых формах сетевого взаимодействия (Козлова, 2015). Отражение фрустрации в лингвистических и паралингвистических признаках, а также на уровне организации сетевого взаимодействия может исследоваться с помощью средств дискурсивного анализа (Yu, 2011). Однако наибольшее внимание при изучении процессов, происходящих в социальных сетях, уделяется развитию средств сентимент-анализа, позволяющего характеризовать эмоциональное содержание текста (Beigi et al., 2016; Fersini et al., 2016; Kolchyna et al., 2016; и др.). Распространение в сети аффектов — один из предметов исследования киберпсихологии. В частности, сообщается о количественных оценках «вирулентности» аффектогенных сообщений: негативный пост в соцсетях порождает в среднем 1.29 аналогичных сообщений среди друзей пользователя, позитивный — 1.75 (Biggs, 2014; Coviello et al., 2014). Имеются работы, посвященные распространению в интернете отдельных эмоциональных состояний, таких, как переживание одиночества (Cacioppo et al., 2009) или состояние депрессии (Rosenquist et al., 2011), а также различных форм аффективного поведения (Bond et al., 2012) и т.п.

В последнее десятилетие активно развиваются как средства компьютерного лингвистического анализа, проводимого в интересах психодиагностики, так и методы машинного обучения, используемого в задачах классификации текстов. Успехи в данной области можно отследить по результатам тематических shared tasks («открытые соревнования»). Формат открытых соревнований подразумевает, что организатор соревнования компьютерных программ подготавливает данные и выкладывает их в открытый доступ вместе с описанием проблемы. Участники (возможно как индивидуальное, так и командное участие) экспериментируют с различными методами и соревнуются друг с другом для создания лучшей модели/подхода, решающего поставленную проблему. Так, соревнование 2011 г., посвященное выявлению лингвистических особенностей предсмертных записок суицидентов, показало, что наилучших результатов можно добиться

с помощью гибридного подхода, сочетающего поиск ключевых слов по словарям и тезаурусам с методами разметки последовательностей на основе случайных полей. Результаты, полученные с помощью разных лингвистических анализаторов, комбинировались с помощью нескольких стратегий голосования (Yang et al., 2012). Соревнования CLPsych 2015 были направлены на определение наилучших методов идентификации признаков различных видов психического неблагополучия (депрессия, посттравматическое расстройство, сезонное аффективное расстройство и др.). Высокую эффективность показали такие средства, как метод автоматического выявления значимых символьных n-грамм (Pedersen, 2015), компьютерный лексический анализ, дополняемый анализом параграфических особенностей текста (Coppersmith, 2015), а также кластеризация и тематическое моделирование (Resnik, 2015). Для построения лексических кластеров при выявлении текстовых признаков депрессии и посттравматического синдрома (Preotiuc-Pietro, 2015) применялись следующие методы: кластеризация Брауна, основанная на алгоритме для вывода скрытой Марковской модели (Brown, 1992); спектральная кластеризация, основанная на расчете нормализованной матрицы PMI пар слов; спектральная кластеризация векторных представлений слов, построенных с помощью Word2Vec (Mikolov et al., 2013) и GloVe (Pennington et al., 2014); кластеризация на основе тематического моделирования с помощью LDA. Соревнование CLPsych 2016 также было посвящено задаче оценки степени выраженности в письменной речи признаков психологического неблагополучия автора (Milne et al., 2016). Хорошие результаты дало применение метода стохастического градиента (McKim et al., 2016), в качестве признаков для которого использовались униграммы, взвешенные с помощью TF-IDF и векторные представления текстов, полученные с помощью Sent2Vec (Le, 2014). Эффективен оказался также подход, построенный на ме-таклассификации (Malmasi et al., 2016): результаты предварительно обученных на большом пространстве признаков классификаторов на основе SVM использовались в качестве входных признаков для метаклассификатора на основе случайного леса деревьев решений (random forest). Такой метод позволил добиться более высокого качества классификации по сравнению с простым SVM классификатором с радиальным ядром. В ходе соревнований было показано, что не всегда сложные методы приводят к успеху. Так, в работе К. Брю (Brew, 2016) представлены попытки использовать дополнительно неразмеченные данные. Однако в итоге лучший результат показал простой

метод, основанный на SVM с радиальным ядром, который был обучен по размеченной выборке. В качестве признаков использовались униграммы и биграммы, взвешенные по TF-IDF. В соревновании

2017 г. CLEF eRisk 2017 (Losada et al., 2017) задача развития средств выявления признаков психологического неблагополучия уже была конкретизирована для текстов социальных сетей. Проведенное в

2018 г. соревнование "Toxic Comment Classification Challenge" (https:// www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge) было направлено на построение модели, способной обнаруживать различные виды агрессии — угрозы, непристойности, оскорбления. В качестве данных использовались комментарии из обсуждений правок страниц Википедии. Это соревнование получило развитие в 2019 г. "Jigsaw Unintended Bias in Toxicity Classification" (https://www. kaggle.com/c/jigsaw-unintended-bias-in-toxicity-classification). Задачей выступало построение такой модели определения агрессивности текста, которая была бы способна различать агрессию и грубоватость (например, использование лексики оскорбления без цели нанести оскорбление).

Как можно видеть из представленного обзора, большинство методов автоматического анализа текстов опираются в первую очередь на лексические признаки и редко учитывают синтаксическую и семантическую структуру текста. К тому же в развитии методов анализа русскоязычных текстов работы зарубежных авторов могут служить лишь ориентирами: лексический, синтаксический и семантический строй русского языка имеет свои особенности, изучаемые как в рамках особого направления лингвистики — исследований русской языковой картины мира (Арутюнова, 1987; Шмелёв, 2002), так и в рамках изучения стилистики русского языка (Золотова и др., 2004; Кожина, 2002). Применение средств автоматического анализа сетевого контента, созданных для изучения англоязычных текстов, в отечественных исследованиях наталкивается не только на проблему перевода (когда речь идет о словарях, например, эмотивной лексики), но и на общую для любых переводных методик проблему адаптации. Совершенствование методов искусственного интеллекта в области анализа текста на основе теоретических моделей и эмпирических данных лингвистов-русистов в настоящее время позволяет отечественным психологам не тратить время и силы на адаптацию иноязычных средств, а участвовать в разработке новых отечественных систем интеллектуального анализа текста или применять уже созданные системы.

цель данной работы — получение данных о специфике текстов, написанных пользователями социальных сетей в состоянии фрустрации, с помощью отечественного лингвистического анализатора Машины РСА.

методы

В социальных сетях ЖЖ, Пикабу и Фейсбук были собраны посты и комментарии 100 русскоязычных респондентов (граждане России, Украины, Белоруссии, Казахстана, а также русскоязычные граждане Израиля, Франции, Южной Кореи и США в возрасте от 27 до 64 лет). От каждого респондента были взяты 50 текстов, написанных им в спокойном состоянии (СТ), и 50 текстов, написанных в состоянии фрустрации (ФТ). Состояние респондента определялось экспертом, собиравшим тексты, на основе информации о событиях, происходивших в жизни респондента, и на основе оценки самим респондентом собственного состояния как «тяжелого», «взвинченного», «подавленного», «возмущенного» и т.п. Тексты представляют собой короткие посты (от 2 до 10 предложений) и развернутые комментарии (такого же размера). На данном этапе исследования тексты обрабатывались как единый массив, без привязки к автору.

Для автоматического анализа текстов применялся лингвистический анализатор Машины РСА (Ениколопов и др., 2019), позволяющий проводить лексический анализ (на основе специально созданных словарей общим объемом более 51 тыс. лексических единиц), морфологический анализ и частеречный анализ (в настоящий момент применяется 41 показатель, включая известные психолингвистические показатели), а также семантический анализ, опирающийся на работу Словаря предикатов (2.7 тыс. глаголов, причастий, деепричастий и девербативов) и Определителя семантических ролей (92 семантических отношения). Лингвистический анализатор Машины РСА работает с сетевым представлением текста и позволяет отражать текст в виде конструкции сложной графовой структуры, что отличает его от многих аналогичных инструментов, в которых структурные отношения между элементами языка не моделируются. В Машине РСА реализованы функции поиска, вычисления частотных и статистических характеристик для результатов поиска, корпусов или отдельных текстов, функции сравнения текстов или коллекций по их частотным и статистическим характеристикам с определением достоверности различий и выделением наиболее значимых разделяющих характеристик (Ениколопов и др., 2019).

Данные, полученные от Машины РСА, представляют собой набор из 197 признаков. Признаки разбиты на шесть групп:

1. Психолингвистические показатели (Psycholinguistic indicators, PI) — 27 признаков;

2. Семантические роли (Semantic roles, SR) — 92 признака;

3. Семантические связи (Semantic links, SL) — 35 признаков;

4. Словари оценки и состояния (Assessment and Condition Dictionaries, ACD) — 20 признаков;

5. Тематические словари (SubjectDictionaries, SD) — 9 признаков;

6. Части речи (Parts of Speech, PS) — 14 признаков.

Выборка состояла из 1000 текстов, 500 из которых принадлежали к группе ФТ (класс 1) и 500 — к группе СТ (класс 0). В качестве целевого признака выступала принадлежность текста к группе ФТ. Решалась задача классификации.

Проводилось два типа экспериментов. В первом случае обучение происходило на необработанных данных. Во втором случае текстовые признаки, которые принимали значение «ноль» в более чем 70% случаев, бинаризовались: значения, не равные нулю, приравнивались к единице и играли роль индикатора.

Сравнение результатов классификации

Группа признаков Без бинаризации С бинаризацией

SVM Random Forest SVM Random Forest

PI .727 ± .046 .712 ± .112 .727 ± .046 .728 ± .081

SR .545 ± .078 .598 ± .056 .459 ± .055 .594 ± .077

SL .539 ± .068 .554 ± .066 .559 ± .040 .520 ± .076

ACD .524 ± .072 .629 ± .102 .524 ± .072 .633 ± .089

SD .509 ± .033 .544 ± .042 .509 ± .033 .559 ± .034

PS .593 ± .103 .538 ± .128 .558 ± .079 .548 ± .127

TOP 5 .727 ± .046 .742 ± .040 .762 ± .073 .787 ± .065

ALL .738 ± .040 .697 ± .079 .673 ± .028 .697 ± .088

Примечание. Жирным шрифтом выделено наибольшее значение метрики качества.

В качестве алгоритмов бинарной классификации использовались метод опорных векторов (SVM) и случайный лес (Random Forest), реализованные в библиотеке scikit-learn, метрика качества — доля верных ответов (accuracy). Настройка гиперпараметров производилась подбором по сетке с 5-кратным скользящим контролем.

Эксперименты проводились отдельно для каждой группы признаков. С помощью оценки важности признаков в алгоритме Random Forest в каждой группе отбирались 5 признаков с наибольшими значениями важности. Совокупность этих признаков по всем группам составила группу наиболее важных признаков (TOP 5). Также были проведены эксперименты на всех признаках (ALL). Результаты экспериментов представлены в таблице.

Как видно из результатов, отбор наиболее важных признаков каждой группы (использование показателя TOP 5) и бинаризация признаков приводят к улучшению качества классификации по сравнению с обучением на всех необработанных признаках.

Результаты и их обсуждение

Проведенная обработка позволила выявить текстовые признаки, по которым можно отличить тексты в соцсетях, написанные людьми в состоянии фрустрации. Вот данные о 10 наиболее важных признаках таких текстов, полученные методом Random Forest с предварительной процедурой бинаризации (текстовые признаки перечислены по убыванию значимости):

— число знаков препинания / число слов;

— тональность слов;

— число отрицательных приставок и форм (не, ни, бес, без) / число слов;

— часть речи: частица;

— семантическая роль: каузатив;

— словарь: инвективы;

— семантическая роль: ликвидатив;

— доля местоимений 1-го лица;

— словарь: лексика сопротивления;

— семантическая роль: деструктив.

Как можно видеть, люди, находящиеся в состоянии фрустрации, часто говорят об объектах как об «испытывающих деструктивное воздействие» (семантическая роль: деструктив, согласно внутреннему определителю лингвистического анализатора РСА), а также о каузации (семантическая роль: каузатив), и объектах такого каузи-

рующего воздействия, «результатом которого является прекращение существования объекта» (семантическая роль: ликвидатив согласно внутреннему определителю лингвистического анализатора РСА). Кроме того, посты и комментарии в социальных сетях, написанные в состоянии фрустрации, содержат много слов с отрицательными приставками (ненадежный, бестолковый, безнадежно, нигде и никогда и т.п.), инвективы (например: подлецы, фрик, мерзкий, гопник, быдло, хапуга, тварь, гадость, солдафон, дурацкий, свинство и т.п.) и лексику сопротивления (например: борьба, возражаем, недопустимо, оппозиционер, критикуют, возмущение, бунтовать, голодовка, пикетировать, неподцензурный, протестовал и т.п.). Также в таком состоянии человек чаще говорит о себе и своей группе (например: нам, учителям; мои дети; я этого не люблю) и говорит при этом более эмоционально как на лексическом уровне (например: чудовищный, бравый, прекрасно, счастливый, хрень, чертовски, жахнуло, рад, орать, позор, стыдно, помойка, ужасно, офигеть, ад, вопли, страшный, стыд, забавный и т.п.), так и на синтаксическом (например: большое число знаков препинания).

В целом полученные результаты легко интерпретируемы и не требуют специального обсуждения. Отметим лишь, что использование уникального при автоматическом анализе текстов реляционно-ситуационного анализа, позволяющего выявлять семантические роли объектов, упоминаемых в тексте, показало свою значимость в изучаемой предметной области. Оказалось, что тексты, написанные в состоянии фрустрации, содержат повышенное число слов в семантических позициях «причина события», «объект разрушения» и «ликвидируемый объект». Также важными оказались использование текстовых параметров всех типов (лексических, морфологических, синтаксических, семантических) и обработка данных об их встречаемости в текстах с помощью метода Random Forest с бинаризацией.

заключение

Результаты, полученные с помощью нового инструмента автоматического анализа текста — Машины РСА, показывают, что ее лингвистический анализатор может применяться в задачах, требующих поиска сетевого контента, содержащего высказывания, сделанные людьми в состоянии фрустрации. Выявленные в исследовании текстовые характеристики позволяют с определенной долей

уверенности определять состояние автора в момент написания текста (при условии, что в распоряжении исследователя имеется коллекция текстов ФТ и СТ).

В завершение мы хотели бы подчеркнуть ограничения, существующие при использовании как наших результатов, так и любых результатов в данной области исследований. Во-первых, оценка состояния человека по созданному им тексту не может рассматриваться как результат психодиагностического обследования и применяться в задачах постановки диагноза. Полученные с помощью автоматического анализа текста оценки могут применяться в широком круге задач информационно-психологической безопасности, выделения группы риска по социальным и психологическим стрессорам, социотерапии. Во-вторых, следует учитывать, что помимо эмоционального состояния автора на текст оказывают влияние его стабильные личностные особенности и та задача, которую он решает при создании текста.

СПИСОК ЛИТЕРАТУРЫ

Арутюнова Н.Д. Аномалии и язык: К проблеме «языковой картины мира» // Вопросы языкознания. 1987. № 3. С. 3—19.

Вайнштейн С.В., Смирнова А.С. Фрустрация игрового желания и мотивация участников многопользовательских компьютерных ролевых игр: эмпирические основания для стратегий психологического консультирования // Вестник Пермского университета. Философия. Психология. Социология. 2012. № 2. С. 121—133.

Василюк Ф.Е. Психология переживания: Анализ преодоления критических ситуаций. М.: Изд-во Моск. ун-та, 1984.

Воронцова О.Ю., Ениколопов С.Н., Кузнецова Ю.М. и др. Лингвистические характеристики текстов психически больных и здоровых людей // Психологические исследования: электронный научный журнал. 2018. Т. 11. № 61. URL: http://psystudy.ru/index.php/num/2018v11n61/1622-enikolopov61.html (дата обращения: 25.07.2019)

Ениколопов С.Н., Кузнецова Ю.М., Смирнов И.В. и др. Создание инструмента автоматического анализа текста в интересах социогуманитарных исследований. Ч. 1. Методические и методологические аспекты // Искусственный интеллект и принятие решений. 2019. № 2. С. 28—38.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Жарких Н.Г. Коммуникативная компетентность студентов в ситуациях фрустрации // Известия РГПУ им. А.И. Герцена. 2009. № 109. С. 170—175.

Золотова Г.А., Онипенко Н.К., Сидорова М.Ю. Коммуникативная грамматика русского языка / Под общ. ред. д.ф.н. Г.А. Золотовой. М.: Наука, 2004.

Кожина М.Н. Речеведение и функциональная стилистика: вопросы теории. Пермь: Изд-во ПГУ; ПСИ; ПССГК, 2002.

Козлова Н.С. Взаимосвязь психических состояний и интернет-активности личности // Universum: психология и образование: электронный научный журнал. 2015. № 8(18). URL: http://7universum.com/ru/psy/archive/item/2512 (дата обращения: 25.07.2019)

Колышкина И.М. Концепт «Смерть» в концептосфере фрустрации (на примере произведений Л. Андреева // Функционально-коммуникативные и лингвокультурологические аспекты изучения текста и дискурса / Отв. ред. Е.А. Попова. Липецк: ЛГПУ, 2011. С. 99—112.

Комалова Л.Р. Вербальная реализация ответной агрессии в ситуации конфликта и фрустрации // Проблемы языка: взгляд молодых ученых. Сборник научных статей по материалам Второй конференции-школы / Отв. ред. Е.М. Девяткина. М.: Институт языкознания РАН, 2013. С. 187—198.

Кузнецова Ю.М., Чудова Н.В. Выявление текстовых показателей состояния фрустрации с помощью автоматического реляционно-ситуационного анализа // Психология состояний человека: актуальные теоретические и прикладные проблемы: Материалы Третьей Международной научной конференции (Казань, 8—10 ноября 2018 г.) / Отв. ред.: Б.С. Алишев, А.О. Прохоров, А.В. Чернов. Казань: Изд-во Казан. ун-та, 2018а. С. 279—282.

Кузнецова Ю.М., Чудова Н.В. Семантический подход к сетевой диагностике враждебности // Вестник Московского государственного областного университета: электронный журнал. 2018б. № 4. C. 162-172. URL: https://evestnik-mgou. ru/ru/Articles/View/933 (дата обращения: 25.07.2019)

Ложкина Л.И. Фрустрация эмоционального взаимодействия подростков в сети // Nauka-Rastudent.ru: электронный научно-практический журнал. 2015. № 7(19). С. 27. URL: https://elibrary.ru/item.asp?id=23825302 (дата обращения: 25.07.2019)

Осипов Г.С., Смирнов И.В., Тихомиров И.А. Реляционно-ситуационный метод поиска и анализа текстов и его приложения // Искусственный интеллект и принятие решений. 2008. № 2. С. 3—10.

Харченко В.К., КореневаЕ.Ю. Язык фрустрации: М. Лермонтов, М. Горький, О. Уальд, С. Есин. М.: Изд-во Литературного института им. А.М. Горького, 2007.

Хачересова Л.М. Некоторые аспекты языка фрустрации английского газетного текста // Вестник Пятигорского государственного лингвистического университета. 2011. № 4. С. 115—117.

Шмелёв А.Д. Русская языковая модель мира. Материалы к словарю. М.: Языки славянской культуры, 2002. (Язык. Семиотика. Культура. Series Minor).

Beatty M.J., McCroskeyJ.C. It's our nature: Verbal aggressiveness as temperamental expression // Communication Quarterly. 1997. Vol. 45. No. 4. P. 446—460. DOI: doi. org/10.1080/01463379709370076

Beigi G., Hu X., Maciejewski R., Liu H. An Overview of Sentiment Analysis in Social Media and its Applications in Disaster Relief // Sentiment Analysis and Ontology Engineering. Switzerland: Springer, 2016. P. 313—340. DOI: doi.org/10.1007/978-3-319-30319-2_13

Biggs J. Study: Feelings On Facebook Spread From Friend To Friend, 2014. URL: https://techcrunch.com/2014/03/13/study-feelings-on-facebook-spread-from-friend-to-friend/

Bond R.M., Fariss C.J., Jones J. et al. A 61-million-person experiment in social influence and political mobilization // Nature. 2012. No. 489. P. 295—298. DOI: doi. org/10.1038/nature11421

Brew C. Classifying ReachOut posts with a radial basis function SVM // Proceedings of the 3rd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (San Diego, CA, June 16), 2016. P. 138—132. DOI: doi.org/10.18653/v1/W16-0315

Brown P.F., deSouza P. V. et al. Class-based n-gram models of natural language // Computational Linguistics. 1992. Vol. 18. No. 4. P. 467—479.

Cacioppo J.T., Fowler J.H., Christakis N.A. Alone in the crowd: the structure and spread of loneliness in a large social network. Journal of Personality and Social Psychology. 2009. Vol. 97. No. 6. P. 977. DOI: doi.org/10.1037/a0016076

Coppersmith G., Dredze M., Harman C. et al. ClPsych 2015 shared task: depression and PTSD on twitter // Proceedings of the 2nd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (Denver, Colorado, May 31—June 5, 2015), 2015. P. 31—39. DOI: doi.org/10.3115/v1/W15-1204 Coviello L., Sohn Y., Kramer A. et al. Detecting Emotional Contagion in Massive Social Networks // PLOS ONE. 2014. Vol. 9. No. 3. P. 1—6. URL: https://journals.plos. org/plosone/article?id=10.1371/journal.pone.0090315 (date of retrieval: 25.07.2019) DOI: doi.org/10.1371/journal.pone.0090315

Fersini E., Pozzi F.A., Messina E. Approval network: a novel approach for sentiment analysis in social networks // World Wide Web, 2016. DOI: doi.org/10.1007/ s11280-016-0419-8

Kolchyna O., Souza T.T.P., Treleaven P.C., Aste T. Twitter Sentiment Analysis: Lexicon Method, Machine Learning Method and Their Combination, 2016. URL: https://arxiv.org/pdf/1507.00955.pdf

Le Q., Mikolov T. Distributed representations of sentences and documents // The 31th International Conference on Machine Learning, 2014. P. 1188—1196.

Losada D.E., Crestani F., Parapar J. eRISK 2017: CLEF Lab on Early Risk Prediction on the Internet: Experimental Foundations // Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2017. Lecture Notes in Computer Science / Ed. by G. Jones et al. Vol. 10456. Springer, Cham, 2017. DOI: doi.org/10.1007/978-3-319-65813-1_30

Malmasi S., Zampieri M., Dras M. Predicting post severity in mental health forums // Proceedings of the 3rd Workshop on Computational Linguistics and Clinical

Psychology (San Diego, CA, June 16), 2016. P. 133—137. DOI: doi.org/10.18653/v1/ W16-0314

McKim S., Wang Y. et al. Data61-csiro systems at the clpsych 2016 shared task // Proceedings of the 3rd Workshop on Computational Linguistics and Clinical Psychology (San Diego, CA, June 16), 2016. P. 128—132. DOI: doi.org/10.18653/ v1/W16-0313

Mikolov T., Yih W., Zweig G. Linguistic regularities in continuous space word representations // Proceedings of NAACL-HLT 2013 (Atlanta, Georgia, 9-14 June 2013). P. 746—751.

Milne D.N., Pink G. et al. CLPsych 2016 shared task: Triaging content in online peer-support forums // Proceedings of the 3rd Workshop on Computational Linguistics and Clinical Psychology (San Diego, CA, June 16), 2016. P. 118—127. DOI: doi. org/10.18653/v1/W16-0312

Pedersen T. Screening Twitter users for depression and PTSD with lexical decision lists // Proceedings of the Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality, 2015. P. 46—53. URL: https:// www.scilit.net/article/2b79fd2e82d4576617530b394ace825e DOI: doi.org/10.3115/ v1/W15-1206

Pennebaker J.W. The Secret Life of Pronouns. What Our Words Say About Us. N.Y.: Bloomsbury Press, 2011. DOI: doi.org/10.1016/S0262-4079(11)62167-2

Pennington J., Socher R., Manning C.D. GloVe: Global Vectors for Word Representation // Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing, EMNLP, 2014. URL: https://nlp.stanford.edu/pubs/glove.pdf DOI: doi.org/10.3115/v1/D14-1162

Preo^iuc-Pietro D., Sap M. et al. Mental illness detection at the world well-being project for the clpsych 2015 shared task // Proceedings of the 2nd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (Denver, Colorado, May 31—June 5, 2015). P. 40—45. DOI: doi.org/10.3115/ v1/W15-1205

Resnik P., Armstrong W. et al. Beyond LDA: exploring supervised topic modeling for depression related language in twitter // Proceedings of the 2nd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (Denver, Colorado, May 31—June 5, 2015). P. 99—107. DOI: doi. org/10.3115/v1/W15-1212

Rosenquist J.N., Fowler J.H., Christakis N.A. Social network determinants of depression // Molecular Psychiatry. 2011. Vol. 16. P. 273—281. DOI: doi.org/10.1038/ mp.2010.13

Yang H., Willis A., de Roeck A., Nuseibeh B. A Hybrid Model for Automatic Emotion Recognition in Suicide Notes // Biomedical Informatics Insights, 2012. Vol. 5. No. 1. P. 17—30. DOI: doi.org/10.4137/BII.S8948

Yu C. The display of frustration in arguments: A multimodal analysis // Journal of Pragmatics. 2011. Vol. 43. P. 2964—2981. DOI: doi.org/10.1016/j.pragma.2011.03.007

REFERENCES

Arutyunova, N.D. (1987). Anomalii i yazyk: K probleme «yazykovoy kartiny mira» [Anomalies and language: To the problem of "linguistic picture of the world"]. Voprosyyazykoznaniya [Questions of linguistics], 3, 3—19.

Beatty, M.J., & McCroskey, J.C. (1997). It's our nature: Verbal aggressiveness as temperamental expression. Communication Quarterly, 45, 4, 446—460. DOI: doi. org/10.1080/01463379709370076

Beigi, G., Hu, X., Maciejewski, R., & Liu, H. (2016). An Overview of Sentiment Analysis in Social Media and its Applications in Disaster Relief. In: Sentiment Analysis and Ontology Engineering (pp. 313—340). Switzerland: Springer. DOI: doi. org/10.1007/978-3-319-30319-2_13

Biggs, J. (2014). Study: Feelings On Facebook Spread From Friend To Friend. URL: https://techcrunch.com/2014/03/13/study-feelings-on-facebook-spread-from-friend-to-friend/

Bond, R.M., Fariss, C.J., Jones, J., et al. (2012). A 61-million-person experiment in social influence and political mobilization. Nature, 489, 295—298. DOI: doi. org/10.1038/nature11421

Brew, C. (2016). Classifying ReachOut posts with a radial basis function SVM. In: Proceedings of the 3rd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (San Diego, CA, June 16) (pp. 138—132). DOI: doi.org/10.18653/v1/W16-0315

Brown, P.F., deSouza, P.V., et al. (1992). Class-based n-gram models of natural language. Computational Linguistics, 18, 4, 467—479.

Cacioppo, J.T., Fowler, J.H., & Christakis, N.A. (2009). Alone in the crowd: the structure and spread of loneliness in a large social network. Journal of Personality and Social Psychology, 97, 6, 977. DOI: doi.org/10.1037/a0016076

Coppersmith, G., Dredze, M., Harman, C., et al. (2015). ClPsych 2015 shared task: depression and PTSD on twitter. In: Proceedings of the 2nd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (Denver, Colorado, May 31—June 5, 2015), 31—39. DOI: doi.org/10.3115/v1/W15-1204

Coviello, L., Sohn, Y., Kramer, A., et al. (2014). Detecting Emotional Contagion in Massive Social Networks. PLOS ONE, 9, 3, 1—6. URL: https://journals.plos.org/ plosone/article?id=10.1371/journal.pone.0090315 (date of retrieval: 25.07.2019) DOI: doi.org/10.1371/journal.pone.0090315

Enikolopov, S.N., Kuznetsova, Yu.M., Smirnov, I.V., et al. (2019). Sozdanie instrumenta avtomaticheskogo analiza teksta v interesakh sotsio-gumanitarnykh issledovaniy. Chast 1: Metodicheskie i metodologicheskie aspekty [Creating a tool for automatic text analysis in the interests of socio-humanitarian research. Part 1: Methodical and Methodological Aspects]. Iskusstvennyy intellekt iprinyatie resheniy [Artificial Intelligence and Decision Making], 2, 28—38.

Fersini, E., Pozzi, F.A., & Messina, E. Approval network: a novel approach for sentiment analysis in social networks. World Wide Web, 2016. DOI: doi.org/10.1007/ s11280-016-0419-8

Kharchenko, V.K., Koreneva, E.Yu. (2007). Yazyk frustratsii: M. Lermontov, M. Gor'kiy, O. Ual'd, S. Esenin [Language of frustration: M. Lermontov, M. Gorky, O. Wilde, S. Esenin]. Moscow: Izd-vo Literaturnogo instituta im. A.M. Gor'kogo.

Khacheresova, L.M. (2011). Nekotorye aspekty yazyka frustratsii angliyskogo gazetnogo teksta [Some Aspects of the Frustration of English Newspaper Text]. Vestnik Pyatigorskogogosudarstvennogo lingvisticheskogo universiteta [Bulletin of the Pyatigorsk State Linguistic University], 4, 115—117.

Kolchyna, O., Souza, T.T.P., Treleaven, P.C., & Aste, T. Twitter Sentiment Analysis: Lexicon Method, Machine Learning Method and Their Combination, 2016. URL: https:// arxiv.org/pdf/1507.00955.pdf

Kolyshkina, I.M. (2011). Kontsept «Smert'» v kontseptosfere frustratsii (na primere proizvedeniy L. Andreeva) [The concept of "Death" in the concept-sphere of frustration (for example, the works of L. Andreev)]. In E.A. Popova (Ed.), Funktsional'no-kommunikativnye i lingvokul'turologicheskie aspekty izucheniya teksta i diskursa [Functional-communicative and linguocultural aspects of the study of text and discourse] (pp. 99—112). Lipetsk: LGPU.

Komalova, L.R. (2013). Verbal'naya realizatsiya otvetnoy agressii v situatsii konflikta i frustratsii [Verbal realization of reciprocal aggression in a situation of conflict and frustration]. In E.M. Devyatkina (Es.), Problemy yazyka: vzglyad molodykh uchenykh. Sbornik nauchnykh stateypo materialam Vtoroy konferentsii-shkoly [Problems of language: a view of young scientists. Collection of scientific articles based on the materials of the Second Conference-School] (pp. 187—198). Moscow: Institut yazykoznaniya RAN.

Kozhina, M.N. (2002). Rechevedenie i funktsional'naya stilistika: voprosy teorii [Speech and Functional Stylistics: Theoretical Issues]. Perm': Izd-vo PGU; PSI; PSSGK.

Kozlova, N.S. (2015). Vzaimosvyaz' psikhicheskikh sostoyaniy i internet-aktivnosti lichnosti [The relationship of mental states and Internet activity of the individual]. Universum: psikhologiya i obrazovanie: ehlektronnyy nauchnyy zhurnal [Universum: psychology and education: electronic scientific journal], 8(18). URL: http://7universum.com/ru/psy/archive/item/2512 (date of retrieval: 25.07.2019)

Kuznetsova, Yu.M., Chudova, N.V. (2018a). Vyyavlenie tekstovykh pokazateley sostoyaniya frustratsii s pomoshch'yu avtomaticheskogo relyatsionno-situatsionnogo analiza [Identification of textual indicators of the state of frustration using automatic relational-situational analysis]. In: B.S. Alishev, A.O. Prokhorov, A.V. Chernov (Eds.), Psikhologiya sostoyaniy cheloveka: aktual'nye teoreticheskie i prikladnye problemy: Materialy Tret'ey Mezhdunarodnoy nauchnoy konferentsii (Kazan', 8—10 noyabrya 2018 g.) [Psychology of human condition: current theoretical and applied problems: Materials of the Third International Scientific Conference (Kazan, November 8-10, 2018)] (pp. 279—282). Kazan': Izd-vo Kazan. un-ta.

Kuznetsova, Yu.M., Chudova, N.V. (2018b). Semanticheskiy podkhod k setevoy diagnostike vrazhdebnosti [Semantic approach to network diagnosis of hostility]. Vestnik Moskovskogo gosudarstvennogo oblastnogo universiteta: ehlektronnyy zhurnal

[Bulletin of the Moscow State Regional University: electronic journal], 4, 162—172. URL: https://evestnik-mgou.ru/ru/Articles/View/933 (date of retrieval: 25.07.2019)

Le, Q., Mikolov, T. (2014). Distributed representations of sentences and documents. The 31th International Conference on Machine Learning (pp. 1188—1196).

Losada, D.E., Crestani, F., & Parapar, J. (2017). eRISK 2017: CLEF Lab on Early Risk Prediction on the Internet: Experimental Foundations. In: Jones G. et al. (eds.) Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2017. Lecture Notes in Computer Science, vol. 10456. Springer, Cham. DOI: doi.org/10.1007/978-3-319-65813-1_30

Lozhkina, L.I. (2015). Frustratsiya ehmotsional'nogo vzaimodeystviya podrost-kov v seti [Frustration of the emotional interaction of teenagers in the network]. Nauka-Rastudent.ru: ehlektronnyy nauchno-prakticheskiy zhurnal [Science-Rastudent.ru: electronic scientific journal], 7(19), 27. URL: https://elibrary.ru/item.asp?id=23825302 (date of retrieval: 25.07.2019)

Malmasi, S., Zampieri, M., & Dras, M. (2016). Predicting post severity in mental health forums. In: Proceedings of the 3rd Workshop on Computational Linguistics and Clinical Psychology (San Diego, CA, June 16) (pp. 133—137). DOI: doi.org/10.18653/ v1/W16-0314

McKim, S., Wang, Y., et al. (2016). Data61-csiro systems at the clpsych 2016 shared task. In: Proceedings of the 3rd Workshop on Computational Linguistics and Clinical Psychology (San Diego, CA, June 16) (pp. 128—132). DOI: doi.org/10.18653/ v1/W16-0313

Mikolov T., Yih W., & Zweig G. (2013). Linguistic regularities in continuous space word representations. Proceedings of NAACL-HLT2013, Atlanta, Georgia, 9-14 June 2013, 13, 746—751.

Milne, D.N., Pink, G., et al. (2016). CLPsych 2016 shared task: Triaging content in online peer-support forums. In: Proceedings of the Third 3rd Workshop on Computational Linguistics and Clinical Psychology (San Diego, CA, June 16) (pp. 118—127). DOI: doi.org/10.18653/v1/W16-0312

Osipov, G.S., Smirnov, I.V., Tikhomirov, I.A. (2008). Relyatsionno-situatsionnyy metod poiska i analiza tekstov i ego prilozheniya [Relational situational method for searching and analyzing texts and its applications]. Iskusstvennyy intellekt iprinyatie resheniy [Artificial Intelligence and Decision Making], 2, 3—10.

Pedersen, T. (2015). Screening Twitter users for depression and PTSD with lexical decision lists. In: Proceedings of the Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (pp. 46—53). URL: https:// www.scilit.net/article/2b79fd2e82d4576617530b394ace825e DOI: doi.org/10.3115/ v1/W15-1206

Pennebaker, J.W. (2011). The Secret Life of Pronouns. What Our Words Say About Us. N.Y.: Bloomsbury Press. DOI: doi.org/10.1016/S0262-4079(11)62167-2

Pennington, J., Socher, R., & Manning, C.D. (2014). GloVe: Global Vectors for Word Representation. In: Proceedings of the 2014 Conference on Empirical Methods in

Natural Language Processing, EMNLP. URL: https://nlp.stanford.edu/pubs/glove.pdf DOI: doi.org/10.3115/v1/D14-1162

Preopuc-Pietro, D., Sap, M., et al. Mental illness detection at the world well-being project for the clpsych 2015 shared task. In: Proceedings of the 2nd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (Denver, Colorado, May 31—June 5,2015) (pp. 40—45). DOI: doi.org/10.3115/ v1/W15-1205

Resnik, P., Armstrong, W., et al. (2015). Beyond LDA: exploring supervised topic modeling for depression related language in twitter. In: Proceedings of the 2nd Workshop on Computational Linguistics and Clinical Psychology: From Linguistic Signal to Clinical Reality (Denver, Colorado, May 31—June 5, 2015) (pp. 99-107) DOI: doi. org/10.3115/v1/W15-1212

Rosenquist, J.N., Fowler, J.H., & Christakis, N.A. (2011). Social network determinants of depression. Molecular Psychiatry, 16, 273—281. DOI: doi.org/10.1038/ mp.2010.13

Shmelyov, A.D. (2002). Russkaya yazykovaya model' mira. Materialy k slovaryu [Russian language model of the world. Dictionary materials]. Moscow: Yazyki slavy-anskoy kul'tury. (Yazyk. Semiotika. Kul'tura. Series Minor).

Vasilyuk, F.E. (1984). Psikhologiya perezhivaniya: Analiz preodoleniya kriticheskikh situatsiy [Psychology of experience: Analysis of coping with critical situations]. Moscow: MSU Press.

Vaynshteyn, S.V., Smirnova, A.S. (2012). Frustratsiya igrovogo zhelaniya i motivatsiya uchastnikov mnogopol'zovatel'skikh komp'yuternykh rolevykh igr: ehmpiricheskie osnovaniya dlya strategiy psikhologicheskogo konsul'tirovaniya [Frustration of the game desire and motivation of participants in multiplayer computer role-playing games:]. Vestnik Permskogo universiteta. Filosofiya. Psikhologiya. Sotsi-ologiya [Bulletin of Perm University. Philosophy. Psychology. Sociology], 2, 121—133.

Vorontsova, O.Yu., Enikolopov, S.N., Kuznetsova, Yu.M. et al. (2018). Lingvis-ticheskie kharakteristiki tekstov psikhicheski bol'nykh i zdorovykh lyudey [Linguistic characteristics of texts of mentally ill and healthy people]. Psikhologicheskie issledo-vaniya: ehlektronnyy nauchnyy zhurnal [Psychological research: electronic scientific journal], 11, № 61. URL: http://psystudy.ru/index.php/num/2018v11n61/1622-eniko-lopov61.html (date of retrieval: 25.07.2019)

Yang, H., Willis, A., de Roeck A., & Nuseibeh B. (2012). A Hybrid Model for Automatic Emotion Recognition in Suicide Notes. Biomedical Informatics Insights, 5, 1, 17—30. DOI: doi.org/10.4137/BII.S8948

Yu, C. (2011). The display of frustration in arguments: A multimodal analysis. Journal of Pragmatics, 43, 2964—2981. DOI: doi.org/10.1016/j.pragma.2011.03.007 Zharkikh, N.G. (2009). Kommunikativnaya kompetentnost' studentov v situ-atsiyakh frustratsii [Communicative competence of students in situations of frustration]. Izvestiya RGPU im. A.I. Gertsena [Proceedings of the Russian State Pedagogical University named after A.I. Herzen], 109, 170—175.

Zolotova, G.A., Onipenko, N.K., Sidorova, M.Yu. (2004). Kommunikativnaya grammatika russkogo yazyka [Communicative grammar of the Russian language] / Ed. by G.A. Zolotova. Moscow: Nauka.

информация об авторах

Ениколопов Сергей Николаевич — кандидат психологических наук, доцент, заведующий отделом медицинской психологии «Научного центра психического здоровья», Москва, Россия. E-mail: enikolopov@mail.ru

ковалёв Алексей константинович — младший научный сотрудник Института системного анализа Федерального исследовательского центра «Информатика и управление» РАН, Москва, Россия. E-mail: alexeykkov@gmail.com кузнецова юлия михайловна — кандидат психологических наук, старший научный сотрудник Института системного анализа Федерального исследовательского центра «Информатика и управление» РАН, Москва, Россия. E-mail: kuzjum@yandex.ru

чудова Наталья владимировна — кандидат психологических наук, старший научный сотрудник Института системного анализа Федерального исследовательского центра «Информатика и управление» РАН, Москва, Россия. E-mail: nchudova@gmail.com

Старостина Елена валериевна — младший научный сотрудник Института ядерной физики имени Г.И. Будкера Сибирского отделения РАН, Новосибирск, Россия. E-mail: E.V.Starostina@inp.nsk.su

INFORMATION ABOUT THE AUTHORs

Sergey N. Enikolopov, Cand. Sci. (Psychol.), Associate Professor, Head, Department of Medical Psychology, Mental Health Research Centre, Moscow, Russia. E-mail: enikolopov@mail.ru

Alexey K. Kovalev, Junior Researcher, Federal Research Center "Computer Science and Control", Russian Academy of Sciences, Moscow, Russia. Е-mail: alex-eykkov@gmail.com

Juliya M. kiznetsova, Cand. Sci. (Psychol.), Senior Researcher, Federal Research Center "Computer Science and Control" of Russian Academy of Sciences, Moscow, Russia. E-mail: kuzjum@yandex.ru

ntalia v. chudova, Cand. Sci. (Psychol.), Senior Researcher, Federal Research Center "Computer Science and Control" of Russian Academy of Sciences, Moscow, Russia. E-mail: nchudova@gmail.com

elena v. Starostina, Junior Researcher, Budker Institute of Nuclear Physics of Siberian Branch Russian Academy of Sciences, Novosibirsk, Russia. E-mail: E.V.Starostina@inp.nsk.su

i Надоели баннеры? Вы всегда можете отключить рекламу.