Описание информационного образа пользователя социальной сети с учетом его психологической характеристики
О.С. Крылова (Смирнова), Д.А. Власов, В.В. Шишков, А.С. Алымов, И.А. Ишин, И.Е. Колесников, А.И. Петров
Аннотация - В данной статье рассматривается формирование описания информационного образа пользователя социальной сети «Вконтакте» с учетом определения его психологической характеристики. Представлено подтверждение актуальности исследования на примере мирового опыта использования схожей методики, а также приведен сравнительный анализ российских аналогов. Описан эксперимент по определению типа темперамента на основе проанализированных с помощью разработанного программного обеспечения данных пользовательских профилей. Эксперимент проведен с участием добровольцев в рамках описания примера формирования обучающей выборки. Помимо этого, по результатам проведенного эксперимента представлены выявленные взаимосвязи между темпераментом пользователя и различными анализируемыми данными его профиля.
Ключевые слова — анализ данных, социальные сети, информационный образ, психоэмоциональное состояние, психометрика, социальное взаимодействие, социальный граф, тональность текста, бот-профиль, анализ музыкальных предпочтений, data mining, информационный след.
I ВВЕДЕНИЕ
За счет нарастающей интеграции социальных сетей в повседневную жизнь современных людей большинство активного населения осознанно оставляет значительное количество информации о себе в свободном доступе.
Статья получена 27.03.2018 г.
Исследование выполнено федеральным
государственным бюджетным образовательным учреждением высшего образования «Московский технологический университет» (МИРЭА) за счет гранта Российского фонда фундаментальных исследований (проект №16-37-00492).
О.С. Крылова (Смирнова), МИРЭА (e-mail: [email protected])
Д.А. Власов, МИРЭА (e-mail: [email protected]) В.В. Шишков, МИРЭА (e-mail: [email protected]) А.С. Алымов, МИРЭА (e-mail: [email protected]) И.А. Ишин, МИРЭА (e-mail: [email protected]) И.Е. Колесников, МИРЭА (e-mail: [email protected]) А.И. Петров, МИРЭА (e-mail: [email protected])
Данный факт не может не вызывать активного интереса у государственных структур и представителей
коммерческих организаций, и именно поэтому актуальность исследований социальных сетей с каждым годом возрастает. Подкрепление существующих систем мониторинга социальной активности данными по анализу психоэмоционального состояния пользователей позволит осуществлять более эффективное целенаправленное воздействие на развитие нежелательных ситуаций, возникающих в том числе при самоорганизации общества и его отдельных групп, а также при ведении бизнеса.
II ОПИСАНИЕ ИНФОРМАЦИОННОГО ОБРАЗА ПОЛЬЗОВАТЕЛЯ С УЧЕТОМ ОПРЕДЕЛЕНИЯ
ЕГО ПСИХОЭМОЦИОНАЛЬНОГО СОСТОЯНИЯ
Для формирования описания информационного образа пользователя с учетом определения его психоэмоционального состояния предлагается использовать разработанную в рамках раннее проведенного исследования методику, включающую описание создаваемого пользователем
информационного образа на основе первичных и вторичных (обработанных) данных, размещенных в открытом доступе, а также учитывающую непосредственное поведение пользователя, его истинные, «непоказные» интересы и пристрастия. Разработанная на основе данной методики система формирования описания информационного образа пользователя с учетом определения его психоэмоционального состояния будет представлять собой систему двойного назначения, предназначенную как для специального, так и для гражданского использования.
Целевое специальное назначение системы формирования описания информационного образа пользователя с учетом определения его психоэмоционального состояния:
- борьба с проявлениями терроризма и экстремизма в сети, как с точки зрения выявления очагов зарождения подобных течений (в рамках предыдущих исследований проведен анализ квестовой игры суицидального характера «Синий кит» [1 - 3]), так и с точки зрения воспитательных и профилактических целей;
- формирование ориентированной на человека системы образования и здравоохранения за счет правильной подачи информации о здоровом образе жизни, культурных и социальных ценностях. Частным примером может служить формирование соответствующего воздействия при выявленных случаях депрессивного состояния, симптомов психических
заболеваний и даже высокого риска волны самоубийств и многое другое.
Применение системы в гражданской сфере возможно в рамках:
- тартегированной рекламы;
- кредитного скоринга;
- кадрового планирования;
- рекомендательных систем различного назначения.
К данным пользователя, размещенным в свободном доступе можно отнести следующие сведения:
- личные данные (пол; возраст; семейное положение; религиозные и политические предпочтения; образование; профессия и т.д.);
- данные об активности пользователя (количественные характеристики дружественных связей; входящих/исходящих комментариев, лайков; периоды активности; геометки; посещаемые сообщества и информационные страницы и т.д.);
- генерируемый и используемый пользователем контент:
а) тексты (комментарии, записи со стены, заметки, статусы и т.д.);
б) изображения;
в) аудиозаписи;
г) видеозаписи.
Для формирования описания информационного образа пользователя с учетом определения его психоэмоционального состояния собранные данные требуют обработки с помощью специального программного обеспечения, в результате которой возможно получение следующей информации:
- количественные характеристики и другая сопутствующая информация по дружеским связям (соотношение полов среди друзей, возрастов, имеющиеся разграничения по категориям, соотношение реальных и бот-профилей в списке друзей и подписчиков и др.);
- публикационная активность пользователя (соотношение перепостов и собственных записей пользователя и др.);
- тональность входящих / исходящих комментариев, постов, статусов и других доступных текстовых объектов;
- популярность пользователя и его пристрастия;
- преобладающие жанры аудиозаписей и видеофильмов;
- преобладающие на фотографиях и видеозаписях эмоции пользователя;
- преобладающие цвета на изображениях;
- основные временные периоды пользовательской активности и многое другое.
Данный перечень уточняется в соответствии с имеющимися программно-аппаратными возможностями и тематической направленностью разрабатываемого программного обеспечения.
Описание истинных интересов и пристрастий пользователя строится за счет сбора информации о его лайках (от англ. «like», обозначение, помогающее пользователю выразить свое одобрение к контенту) и комментариях за всё время существования аккаунта.
Данную информацию о себе исказить значительно сложнее, нежели самостоятельно публикуемый и отслеживаемый контент (фотографии, тексты, аудио и видео данные и др.), на основе которого формируется информационный образ.
Далее для формирования обучающих выборок необходимо сопоставление проанализированных данных профилей пользователей социальных сетей с результатами их тестов на определение типа темперамента, IQ, политических взглядов, факторов по модели «большой пятерки» или любых других интересующих измерений знаний, способностей, взглядов и качеств личности. За счет подобного сопоставления возможно выявление присущих взаимосвязей показателей, что в дальнейшем позволяет определить интересующую целевую информацию, на основе которой прогнозировать уже поведение других пользователей.
III АНАЛОГИ В РОССИИ И В МИРЕ
Наиболее известным аналогом является система компании Cambridge Analytica (CA) [4], разработанная по методике Михаила Косински, которая использует технологии глубинного анализа данных (в частности, данных соц. сети «Facebook») для разработки стратегической коммуникации в ходе избирательных кампаний в Интернете. Специалисты CA предположительно оказали влияние на итоги голосования по выходу Великобритании из Европейского союза и на президентские выборы в 2016 г. в США, поддерживая кампанию Дональда Трампа.
В России данный подход решил использовать «Сбербанк», по словам Г. Грефа, опубликованным 25 января 2018 г., было решено применять методологию Михаила Косински при оценке клиентских рисков: «Мы взяли его методологию, включили в риск-модели. За некоторое время в прошлом году мы получили $15 млн. прибыли из ничего, только применяя эту методологию». Сбербанк планирует в 2018 году вести в промышленную эксплуатацию скоринг заемщиков по психометрическим моделям [5].
Сравнительный анализ российских разработок, анализирующих профили социальных сетей при помощи технологий big data [6 - 11], опубликованных в открытом доступе, представлен в таблице 1.
Таблица 1 - Сравнительный анализ российских разработок
Aldata Amber data Double data Relation hint Fors Skillaz
Функциональные возможности Сегментация аудитории на основе «умных данных», таргетированная реклама Сегментация аудитории, таргетированн ая реклама Определение надежности заемщиков; выявление мошенников; анализ социальных связей; выявление ботов Определение совместимости с пользователем (проект сейчас не поддерживается) Автоматический поиск и идентификация клиентов в социальных медиа; сбор и мониторинг информации о пользователях; обогащение данных о пользователях сетей; формирование общего профиля клиента; анализ и исследование клиентских данных; мониторинг данных, своевременное обновление информации Таргетированный поиск и подбор персонала на основе инф. следа пользователей, автоматическая оценка кандидата
Технологии Нет данных Нет данных MapReduce, Amazon Web Services, Hadoop Нет данных Oracle DB, Hadoop, NoSQL решения, R Python Нет данных
Сфера применения Реклама, маркетинг, консалтинг Реклама, маркетинг, консалтинг Банковские услуги, кредитная история Отношения и знакомства Анализ социальных сетей для целевого маркетинга Рекрутинг и подбор персонала
Клиенты / реализованные проекты Нет данных Нет данных Проекты с банками из Top-5 Нет данных РосЕвроБанк, ФМС России, Росфинмониторинг, Лукойл ГазПромНефть, UBER, Мегафон, EStaff, PepsiCo
Партнеры Eyeota, Lotame, Oracle Нет данных Нет данных Нет данных Oracle Нет данных
Анализируемые данные Сайты, агрегаторы, поисковые запросы, лайки и профили в соц.сетях Сайты, поисковые запросы,лайки и профили в соц. сетях Социальные сети Социальные сети Сайты, социальные сети (поддержка всех популярных сетей) Сайты, агрегаторы, поисковые запросы, лайки и профили в соц. сетях
Психометрика Нет данных Нет данных Нет данных Составление психологического портрета Нет данных Нет данных
На основе результатов анализа было отмечено, что в рассмотренных системах, эффективных для бизнеса, не акцентируется внимание, либо вовсе не используется, определение психометрик в рамках анализа социальных сетей. Единственная система («Relation hint»), которая указывает, что использует определение психометрик, на данный момент не поддерживается разработчиком. Таким образом, можно сделать вывод, что анализ психометрик по профилям пользователей актуален и сможет повысить эффективность исследования социальных сетей.
IV ДЕТАЛИЗАЦИЯ ЭКСПЕРИМЕНТА ПО ФОРМИРОВАНИЮ ОБУЧАЮЩИХ ВЫБОРОК В рамках описания примера формирования обучающей выборки рассмотрим эксперимент по определению типа темперамента с участием добровольцев. Краткая психологическая характеристики по типам темперамента, которую возможно использовать при описании пользователя, представлена в таблице 2 [12].
В рамках формирования обучающей выборки требуются результаты тестов на выявление преобладающего типа темперамента ряда пользователей социальной сети. Для этого выбрана наиболее широко распространенная методика Г. Айзека [13], позволяющая, в том числе, отслеживать искренность ответов респондентов на вопросы теста (рисунок 1).
Следующим шагом является анализ профилей пользователей, прошедших тестирование, с целью:
- определения социального взаимодействия;
- определения причастности пользователя к бот-сети (анализ на бот-активность друзей и подписчиков);
- определения тональности текстовых сообщений пользователя;
- анализа изображений пользователя на наличие определенной символики [14] или преобладающих цветов [15];
- определения музыкальных предпочтений пользователя.
Далее проводится определение взаимосвязей между результатами тестирования на выявление типа темперамента и определенными значениями анализируемых показателей профиля социальной сети.
Определение социального взаимодействия
Социальное взаимодействие - взаимосвязь личности с социумом, которая проявляется в социально продуктивной деятельности, общении, познании, результатом чего является развитие личности и изменение социальной среды [16].
В рамках проводимого исследования с целью описания социального взаимодействия пользователя осуществляется:
- сбор информации о количестве друзей;
- определение соотношения количества друзей старшего и младшего возраста;
- определение соотношения количества друзей того же и противоположеного пола;
- сбор информации о количестве подписчиков;
- сбор информации о количестве публикаций на стене;
- определение соотношения количества своих публикаций и репостов (также «перепост» -копирование без возможности изменения информационной заметки в социальных сетях со ссылкой на источник);
- сбор информации о количестве лайков;
- определение среднего количества лайков под публикацией;
- сбор информации о количестве комментариев;
- определение среднего количества комментариев под публикацией;
- построение и визуализация социального графа пользователя, участвующего в эксперименте (рисунок 2);
- определение причастности к бот-сетям.
Рис. 1 - Пример результата тестирования на определение типа темперамента
Таблица 2 - Психологическая характеристика типов темперамента
Критерий Холерик Сангвиник Флегматик Меланхолик
Тип нервной системы Сильный неуравновешенный Сильный уравновешенный подвижный Сильный уравновешенный инертный Слабый
Активность Активен. Человек быстрый, порывистый. Человек живой, подвижный, быстро отзывающийся на окружающие события. Медлительный, невозмутимый человек. Настороженность во взгляде, позе.
Поведение в обществе Лидер, легко устанавливает контакты, но с трудом поддерживает. Импульсивен, склонен к конфликтам. В центре внимания, пользуется уважением, легко устанавливает контакты С трудом устанавливает, но легко поддерживает знакомство. Предпочитает быть в стороне.
Настроение Склонен к бурным эмоциональным вспышкам, резким сменам настроения. Неуравновешен. Сравнительно легко переживает неудачи и неприятности. Слабое внешнее выражение душевного состояния. Более или менее постоянное настроение. Легко ранимый человек, склонен глубоко переживать даже незначительные неудачи, но внешне сдержан.
Работа Способен отдаваться делу с исключительной страстностью. Быстро включается в работу. В работу включается быстро, но до конца доводит при наличии интереса. Предпочитает все новое. Медленно включается в работу, но зато способен выдерживать значительные нагрузки. Быстро переутомляется. Характерно тщательное планирование и самоконтроль, поэтому в его работе мало ошибок.
Речь Громкая, резкая, бывает грубой. Живая, эмоциональная. Спокойная, размеренная, с паузами. Тихая, может снижаться до шепота.
Память Быстро запоминает, быстро забывает. Хорошая, схватывает на лету. Запоминает медленно, помнит долго. Запоминает быстро за счет высокой способности к анализу.
Внимание Развито переключение, быстро сосредотачивается. Развиты переключение, распределение, быстро сосредотачивается Развита устойчивость. Познавательная сфера может развиваться.
Определение тональности текстовых сообщений
Тональность - это эмоциональное отношение автора высказывания к некоторому объекту, выраженное в тексте [19, 20]. С использованием разработанного программного обеспечения [21] проанализируем профили пользователей, участвующих в эксперименте, на предмет тональности открытых текстовых сообщений (рисунок 3).
По результатам проведенного анализа было замечено, что тональность текста у большинства пользователей находится незначительно ниже среднего значения. В рассмотренной выборке у сангвиников и холериков в 2 раза больше сообщений с показателем тональности ниже среднего, у меланхоликов показатель тональности примерно равен среднему значению, при этом у флегматиков он наблюдался выше среднего значения.
Таким образом, при рассмотрении большей экспериментальной выборки можно выявить закономерность среднего значения тональности текстовых сообщений от интровертности и эмоциональной устойчивости пользователей.
Определение причастности пользователя к бот-сетям
Бот-профили - это часть программного обеспечения, которая предназначена для имитации поведения живого пользователя в социальных сетях. Они могут использоваться для выдачи себя за другого пользователя, путем хищения его персональных данных или для достижения иных целей в сети интернет, к примеру, для продвижения бренда или идеи, в том числе за счет имитации интереса большого количества людей к обсуждению какой-либо темы [22].
Для детектирования бот-профилей разработано программное обеспечение, оценивающее совокупность ряда различных параметров пользовательских профилей, результаты работы которого представлены на рисунке 4.
С помощью программного обеспечения оценивается соотношение бот-профилей и реальных пользователей в списке друзей пользователя. Данное соотношение у всех групп пользователей, распределенных по типам темперамента, кроме сангвиников, находится в пределах медианы. Только у сангвиников наблюдается небольшое отклонение в большую сторону, что может свидетельствовать о неразборчивости в контактах, либо целенаправленной раскрутке профиля.
Определение музыкальных и цветовых предпочтений
Дополнительными источником полезных данных о пользователе являются публикуемые или используемые им изображения, аудио и видео данные. В рамках данного эксперимента проведен анализ аудиозаписей пользователя с целью определения предпочитаемых жанров, а также изображений на определение преобладающих цветов.
Для анализа аудио данных пользователя социальной сети «Вконтакте» разработано программное обеспечение, позволяющее получать данные об аудио записях пользователя и, с целью определения жанра, сверять их с открытыми базами музыкальных
коллекций [23]. Результаты анализа на определение преобладающих музыкальных жанров, размещенных в пользовательском профиле, представлены на рисунке 5.
По полученным результатам анализа аудиозаписей пользователей, участвующих в эксперименте, можно сделать предположение о том, что холерики по большей части слушают поп и рок музыку, меланхолики -электронную. Сангвиники и флегматики предпочитают рэп, но при этом флегматики также слушают электронную музыку, а сангвиники одинаково положительно относятся к року, электронной и поп музыке.
Из оценки результатов анализа изображений рассматриваемой выборки можно сделать вывод, что у сангвиников и флегматиков преобладает на изображениях белый цвет. У холериков и меланхоликов - черный.
Результаты анализа
Описанный эксперимент выполнялся с участием добровольцев и на основе открытых данных их профилей в социальной сети «ВКонтакте». Примеры основных сводных результатов анализа приведены в таблицах 3 - 6.
Рис. 3 - Результат анализа тональности сообщений пользователей (1 - положительный эмоциональный окрас текста, 0 - негативный)
International Journal of Open Information Technologies ISSN: 2307-8162 vol. 6, no.4, 2018
Всего друзей: 808
QjemSctafeCWW) ПМкЙПв№| iÄS7i.j QbUanXotae. цдаио-П i.iuiivHj ;'Г5.:: Ц rWji 1Лно.|;И1ЙН|'" П ¿МП) N«»JM I MS®1" QiMaiitiMM.imt" QUNna Htrön ( JSJlU9"'r
Пйoft tu :■.'<_: II.'Q'".
Ц ■)■••:. • iZbl-"
Qi.cney GeiJHTT.1 •
□ KO'tfcs iJJ-^l™!
QveKeuwim-)
П ¡VlOcgtfiI 1.4;-!'S*™
П f, tttflUW,
□
Qcipa Kiytov* I «¿¡"'i
1(HL7S) 12(29.74)
ulD с™ус
□ 19"* Реальный пол ьзовател ь. Данны е загружены.
□ 58*** Реальный пол ь. Данны е загружены.
□ и— Реальный пол ь. Данны е загружены.
□ 152*" Реальный пол ьзовател ь. Данны е загружены.
□ 156*** Реальный пол ь. Данны е загружены.
□ 157*** Реальный пол ьзовател ь. Данны е загружены.
□ 157*** Бот польэоват ель. Дане )ые загружены,
□ 158*** Бот пользоеат ,„Ь.Д.„, ные загружены,
□ 158*** Реальный пол ьзовател ь. Данны е загружены.
□ 158*** Бот пользоеат ,„ь.Да„, ные загружены,
□ 158*** Реальный пол ьзовател ь. Данны е загружены.
□ 158*** Реальный пол ьзовател ь. Данны ■е загружены.
□ 158*** Бот пользоеат ель. Дане )ые загружены.
□ 158*** Реальный пол ьзовател ь. Данны ■е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны ■е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны ■е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Реальный пол ьзовател ь. Данны е загружены.
□ 159*** Бот пользоеат -Д" 1ые загружены,
□ □ 160*** 160*** Реальный пол Реальный пол ьзовател ь. Данны ь. Данны е загружены. ie загружены.
Рис. 4 - Результат анализа списка друзей пользователя на наличие бот-профилей с детализацией
Рис. 5 - Результаты анализа музыкальных предпочтений пользователя
Таблица 3 - Пример результатов анализа открытых данных 1 пользователя каждого типа темперамента (зеленый цвет - значение выше среднего, желтый - ниже среднего, серый - близкое к среднему)
Тип темперамента Кол-во друзей Соотношение друзей старше/младше Соотношение друзей другого пола/того же Соотношение бот-профилей и реальных пользователей в друзьях Среднее значение тональности сообщений Кол-во подписчиков Кол-во публикаци й Соотношение репостов/свои х публикаций Кол-во лайко в Среднее кол-во лайков
Сангвиник 1 809 350//236 == 151 405//338 181//627 (22,4%) 0,52 719 2637 141//355 5514 2,09
Сангвиник N
Холерик 1 102 42//23 == 33 42//57 10//87 (10,3%) 0,50 109 195 110//85 739 3,79
Холерик N
Флегматик 1 159 57//35 == 28 39//117 21//138 (13,2%) 0,57 149 412 44//368 2276 5,52
Флегматик N
Меланхолик 1 834 245//376 == 135 467//287 151//677 (18,2%) 0,49 214 885 310//565 4601 5,20
Меланхолик N
Таблица 4 - Пример результатов оценки социального взаимодействия пользователей разных типов темперамента
Количество друзей Соотношение друзья старшего/младшего возраста Соотношение друзей другого пола/того же Количество бот-профилей в списке друзей Количество подписчиков
Тип темперамента Среднее значение Выше среднего Ниже среднего Друзей младшего возраста больше Друзей старшего возраста больше Близко к среднему Нет данных Друзей того же пола больше Друзей другого пола больше Близко к среднему Среднее значение Выше среднего Ниже среднего Близко к среднему Нет данных Среднее значение Выше среднего Ниже среднего Близко к среднему
Сангвиник 478,3 60% 40% 40% 20% 20% 20% 60% 30% 10% 21,60% 50% 30% 20% 0% 248,0 40% 60% 0%
Холерик 357,5 30% 70% 30% 30% 0% 40% 70% 10% 20% 20,65% 40% 40% 10% 10% 193,8 20% 70% 10%
Флегматик 218,7 0% 100% 33% 33% 33% 0% 33% 33% 33% 15,80% 0% 33% 67% 0% 133,7 0% 67% 33%
Меланхолик 318 25% 75% 25% 75% 0% 0% 50% 50% 0% 17,28% 25% 25% 0% 50% 130,5 0% 50% 50%
Общее среднее значение 382,47 - 18,61% 208,5
International Journal of Open Information Technologies ISSN: 2307-8162 vol. 6, no.4, 2018 Таблица 5 - Пример результатов оценки публикационной активности пользователей разных типов темперамента
Тип темперамента Тональность текстовых сообщений Количество публикаций Своих публикаций больше, чем репостов Количество лайков
Среднее значение Выше среднего Ниже среднего Нет данных Среднее значение Выше среднего Ниже среднего Выше среднего Ниже среднего Близко к среднему Нет данных Среднее значение Выше среднего Ниже среднего
Сангвиник 0,57 30% 70% 0% 706,3 30% 70% 90% 10% 0% 0% 1763,8 50% 50%
Холерик 0,57 30% 60% 10% 823,3 40% 60% 50% 30% 10% 10% 1175,7 30% 70%
Флегматик 0,59 100% 0% 0% 307,3 0% 100% 100% 0% 0% 0% 1357,7 33% 67%
Меланхолик 0,49 25% 25% 50% 538,0 25% 75% 50% 0% 0% 50% 2708,0 25% 75%
Общее среднее значение 0,55 737,2 - 1823,5
Таблица 6 - Пример результатов анализа музыкальных предпочтений пользователей разных типов темперамента
Тип темперамента Рок Поп Электронная музыка Рэп Джаз и блюз Инди Рэгги Танцевальная музыка Классика
Сангвиник 18,20% 18,20% 18,20% 35,40% 6,50% 2,00% 1,50% 0,00% 0,00%
Холерик 26,70% 33,80% 7,70% 13,80% 11,10% 0,00% 2,50% 0,00% 4,40%
Флегматик 13,80% 17,20% 24,10% 31,00% 7,10% 3,40% 0,00% 3,40% 0,00%
Меланхолик 17,20% 20,70% 40,30% 20,70% 1,10% 0,00% 0,00% 0,00% 0,00%
Результаты исследования, помимо использования в качестве данных для обучающей выборки, позволяют сделать следующие наблюдения:
- больше всего друзей у сангвиников;
- у сангвиников количество бот-профилей в списке друзей в соотношении к реальным профилям выше, чем у пользователей других типов темперамента;
- у сангвиников и холериков больше подписчиков;
- у холериков и сангвиников больше друзей того же пола, чем противоположенного;
- у меланхоликов больше друзей старшего возраста;
- самая высокая тональность сообщений у флегматиков;
- наибольшая публикационная активность у холериков и сангвиников;
- у сангвиников и флегматиков больше своих публикаций, нежели перепостов чужих записей;
- наибольшее среднее значение количества лайков на одну публикацию у флегматиков и меланхоликов;
- холерики по большей части слушают поп и рок музыку, меланхолики - электронную, а сангвиники и флегматики в основном предпочитают рэп.
Стоит отметить, что выше представленные для примера результаты получены на основе анализа небольшого количества исходных данных, поэтому их точность может быть достаточно низкой. Для повышения точности исследования, следует значительно увеличить количество тестируемых и анализируемых пользователей, а также расширить количество собираемых и анализируемых параметров пользовательских профилей таких как, например, эмоции на фотографиях, время активности пользователя и другие. Благодаря этому точность результатов возрастет и возможно будет получить новые дополнительные факторы, влияющие на определение темперамента пользователя.
После определения типа темперамента пользователя возможен анализ по данной методике, но на совокупности других данных, его психологических состояний (например, депрессии) в различные временные периоды в зависимости от его поведения в сети.
V ЗАКЛЮЧЕНИЕ
Системы, основанные на методике формирования описания информационного образа пользователя с учетом определения его психоэмоционального состояния, могут быть использованы:
- в составе систем поддержки принятия решений для различных министерств и ведомств, как на федеральном, так и на региональном уровнях;
- в пользовательских приложениях, поскольку обладают высокой рыночной привлекательностью, как для конечного потребителя, так и для В2В сегмента.
Также следует отметить, что проанализированная при помощи предлагаемой методики информация за счет использования скрытых знаний, заключенных в пользовательском контенте, сможет найти практическое применение в различных областях, например: маркетинг, банковская сфера, кадровая отрасль, политология, социология, психология и другие.
БИБЛИОГРАФИЯ
[1] О.С. Смирнова. Определение группы риска аккаунтов социальной сети «Вконтакте», попадающих под влияние квестовой игры суицидального характера // Современные информационные технологии и ИТ-образование. 2017, Том 13, №3, с. 53-60.
[2] А.С. Алымов, О.С. Крылова. Проектирование системы определения группы риска аккаунтов, подверженных влиянию квестовой игры суицидального характера // International Journal of Open Information Technologies. 2017, vol. 5, no. 12. c. 39-48.
[3]Петров А.И., Смирнова О.С., Чумак Б.Б. Анализ контента социальной сети на примере квестовой игры суицидального характера, направленной на детей и подростков // International Journal of Open Information Technologies. 2017, vol. 5, no. 6. с. 12-15.
[4] Cambridge Analytica: [сайт]. URL: https://cambridgeanalytica.org (дата обращения 17.02.18).
[5] Сбербанк оценил возможную прибыль от использования искусственного интеллекта в $2-3 млрд. в год. Интерфакс. URL:
http://www.interfax.ru/business/597041 (дата обращения: 17.02.18).
[6] AIdata DMP: [сайт]. URL: http:// ru.aidata.me (дата обращения: 17.02.18).
[7] Amber Data - платформа для управления данными: [сайт]. URL: https://amberdata.ru (дата обращения: 17.02.18).
[8] Double data: [сайт]. URL: http:// doubledata.ru/ (дата обращения: 17.02.18).
[9] Relation hint: [сайт]. URL: https://rhint.ru (дата обращения: 17.02.18).
[10] ФОРС: [сайт]. URL: http://www.fors.ru (дата обращения: 17.02.18).
[11] Skillaz: [сайт]. URL: http://skillaz.co/ (дата обращения: 17.02.18).
[12] Психологическая характеристика типов темперамента. URL: https://studfiles.net/preview/3155974/ (дата обращения: 13.12.17).
[13] Личностный опросник Г. Айзенка. (Тест на темперамент EPI. Диагностика самооценки по Айзенку. Методика определения темперамента).
URL: http://psycabi.net/testy/369-lichnostnyj-oprosnik-g-ajzenka-test-na-temperament-epi-diagnostika-samootsenki-po-ajzenku-metodika-opredeleniya-temperamenta (дата обращения: 13.12.17).
[14] Колесников И.Е., Смирнова О.С. Основные вопросы разработки модуля определения специальной символики на изображениях социальной сети // Проблемы современной науки и образования. 2017. № 24 (106). с. 8 - 12.
[15] В.В. Баранюк, А.Д. Десяткова, О.С. Смирнова. Подходы к определению психоэмоциональных особенностей информационного образа пользователя социальных сетей. International Journal of Open Information Technologies. Том 4, №8, 2016, с. 61 - 65.
[16] Каргаполова Ю.В. Теоретический анализ основных подходов к определению понятия «социальная активность» // Молодой ученый. - 2014. - №21. - С.575
- 577. - URL: https://moluch.ru/archive/80/13979/ (дата обращения: 15.03.18).
[17] Смирнова О.С., Шишков В.В. Графовый подход при составлении характеристики социального объекта // International Journal of Open Information Technologies. 2017, vol. 5, no. 6. с. 12 - 15.
[18] Программное средство построения социального графа https://bitbucket.org/evil_sneer/vk_groups_analysis (дата обращения: 23.03.18).
[19] Olga Smirnova, Alexey Petrov, Georgy Babiychuk. Common techniques for social network analysis study. Selected Papers of the XI International Scientific-Practical Conference Modern Information Technologies and IT-Education (SITITO 2016), Moscow, Russia, November 2526, 2016, p. 262 - 269.
[20] О.С. Cмирнова, В.В. Шишков. Выбор топологии нейронных сетей и их применение для классификации коротких текстов. International Journal of Open Information Technologies. Том 4, №8, 2016, с. 50 - 54.
[21] Программное средство определения тональности сообщений. URL:
https://bitbucket.org/evil_sneer/newsentimen (дата обращения: 23.03.18).
[22] А.С. Алымов, В.В. Баранюк, О.С. Смирнова. Детектирование бот-программ, имитирующих поведение людей в социальной сети «Вконтакте». International Journal of Open Information Technologies. Том 4, №8,
2016, с. 55 - 60.
[23] О.С. Крылова, В.В. Баранюк, И.А. Ишин. Анализ аудио и видео коллекций пользователя социальной сети с целью описания его информационного образа // International Journal of Open Information Technologies.
2017, vol. 5, no. 12. c. 30-38.
Description of user's informational image of the social network with considering his psychological characteristic
O.S. Krylova (Smirnova), D.A. Vlasov, V.V. Shishkov, A.S. Alymov, I.A. Ishin,
I.E. Kolesnikov, A.I. Petrov
Annotation - In this article, we describe the formation of description of informational image of user of the social network "VKontakte" with considering the determination of his psychological characteristic. The article presents the confirmation of relevance of the study on the example of world experience of using a similar method, provides the comparative analysis of Russian analogs and describes the experiment on determination of the type of temperament based on analyzed data from users' profiles, obtained by developed software. The experiment was conducted with participation of volunteers as a description of the example of formation of training selection. In addition, there are presented revealed relationships between user's temperament and various analyzed data from his profile, based on the results of the experiment.
Keywords - Data analysis, social networks, informational image, psycho emotional state, psychometric, social interaction, social graph, sentiment analysis, bot profile, analysis of musical preferences, data mining, informational trace.