Исследование потенциала социальных сетей для выявления одаренных старшеклассников
Мацута Валерия Владимировна
кандидат психологических наук доцент, Национальный исследовательский Томский государственный университет 634028, Россия, Томская область, г. Томск, ул. Учебная, 18
Киселев Павел Борисович
соискатель, Психологический институт, Российская академия образования 125009, Россия, г. Москва, ул. Моховая, 9, стр. 4
Фещенко Артем Викторович
старший преподаватель, Национальный исследовательский Томский государственный университет
634050, Россия, Томская область, г. Томск, ул. Ленина, 36
Гойко Вячеслав Леонидович
аспирант, Национальный исследовательский Томский государственный университет 634050, Россия, Томская область, г. Томск, ул. Ленина, 36
Статья из рубрики "Непредсказуемое"
Аннотация. Работа посвящена оценке возможностей социальной сети «ВКонтакте» для выявления важных для определения одаренности психологических качеств и интересов старшеклассников. Актуальность связана с запросом региона, нацеленного на обеспечение высокого уровня подготовки будущих студентов и достижение значительных показателей поступления абитуриентов в свои вузы, и заинтересованного в поиске и привлечении одаренных учащихся старших классов - своих потенциальных абитуриентов. Одаренность в работе определена как сочетание интеллекта, креативности, мотивационно-личностных особенностей. Методы: психологическое тестирование (методика «#Профориентация»), анализ академической успеваемости, анализ структуры и содержания профилей в социальной сети, контент-анализ, процентильная нормализация, машинное обучение (бинарная классификация, метод опорных векторов). Выборка: 1692 человека - 969 девушек и 723 юноши -старшеклассники г. Томска. Новизна заключается в изучении данных пользователей социальной сети именно для определения одаренности. Применение машинного обучения, позволяющего учитывать большое количество испытуемых и признаков, дает возможность с удовлетворительной точностью идентифицировать испытуемых с высоким уровнем развития психологических качеств (компонентов одаренности) и устанавливать
связи между этим уровнем и принадлежностью к сообществам социальной сети. Прогнозирование осуществляется на основе региональных и федеральных сообществ-маркеров. Часть сообществ-маркеров ориентирована на пол испытуемых. Одаренные старшеклассники достаточно открыты и доступны для общения в социальной сети. Девушки ориентированы на сообщества с познавательным, социальным и коммерческим контентом, юноши - с развлекательным и познавательным. Девушки публикуют посты и репосты с целью информирования, развлечения, побуждения к действиям. Юноши - с целью информирования и развлечения.
Ключевые слова: одаренность, психологические качества, социальные сети, психологическое тестирование, анализ профиля, анализ больших данных, машинное обучение, бинарная классификация, метод опорных векторов, старшеклассники
DOI: 10.7256/2454-0722.2017.4.24931
Дата направления в редакцию: 08-12-2017
Дата рецензирования: 08-12-2017
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 17-16-70004.
Введение
В социальных сетях генерируются значительные потоки информации, которые характеризуются высоким уровнем динамичности и масштабности. Пропускная способность социальных сетей стабильно возрастает, и вместе с этим растет скорость передачи данных, а значит, и их обработки.
На основе использования современных технологий анализа больших данных получаемая из социальных сетей информация, которая на первый взгляд представляется разрозненной, может быть распределена по огромному количеству критериев - как общих для отдельных групп пользователей, так и персонально-ориентированных.
Эти критерии формулируются в соответствии с социальными и экономическими задачами, решаемыми как на национальном, так и на региональном уровне. Так, регионы, стремясь повысить качество системы высшего образования и расширить рынок предлагаемых образовательных услуг, нацелены на обеспечение высокого уровня подготовки будущих студентов и достижение значительных показателей поступления абитуриентов в региональные вузы, заинтересованы в поиске и привлечении одаренных учащихся старших классов - своих потенциальных абитуриентов.
Цель данного исследования - оценить, как социальные сети могут быть использованы для выявления важных для определения одаренности психологических качеств и интересов учащихся старших классов. Оценка производилась на основе анализа данных психологического тестирования и данных, представленных в профилях пользователей в социальной сети «ВКонтакте» («цифровых следов» пользователей).
Методологическими основаниями исследования послужили современные научные представления об одаренности, изложенные в работах отечественных и зарубежных ученых: концепции одаренности Ю. Д. Бабаевой, Д. Б. Богоявленской-^, Н. С. Лейтеса
[8], А. М. МатюшкинаА. А. Мелик-Пашаева115!, Д. В. Ушакова112!, М. А. Холодной В. Д. Шадрикова Н. Б. Шумаковой и^, Е. И. Щеблановой118!, В. С. Юркевич120-и др., многомерные модели одаренности Дж. Рензулли [10, 38], К. Хеллера [13, 29] и др.
В соответствии с указанными представлениями одаренность принято рассматривать как взаимодействие интеллекта, креативности и мотивационно-личностных особенностей. Одаренными считаются люди, обладающие высоким уровнем развития этих качеств или способные их развить и использовать в любой потенциально ценной деятельности I18!.
Общую выборку исследования составили 1692 человека - 969 девушек и 723 юноши -учащиеся старших классов средних общеобразовательных учебных заведений г. Томска.
Методы исследования. Методы сбора данных: психологическое тестирование, анализ академической успеваемости, «ручной» анализ структуры и содержания профилей в социальной сети.
Методы обработки и анализа данных: процентильная (нелинейная) нормализация, машинное обучение (бинарная классификация на основе моделей: метод опорных векторов, случайные леса и градиентный бустинг), контент-анализ.
На первом этапе исследования был произведен сбор данных с помощью метода психологического тестирования испытуемых, который является классическим для диагностики одаренности. Была применена компьютеризированная методика «#Профориентация», предназначенная для учащихся старших классов образовательных
учреждений разного вида
Кроме основной цели - определения общей направленности профессиональной ориентации - с помощью данной методики могут решаться задачи определения интеллектуального потенциала испытуемых, изучения их личностных свойств и качеств (эмоциональных, волевых, коммуникативных), профессиональных интересов и ценностей, а также карьерных ориентаций.
Для изучения интеллектуального компонента одаренности были использованы субтесты «Аналогии» и «Когнитивные стили». Для изучения креативного компонента одаренности были использованы субтесты «Самооценка креативности» и «Опросник креативного поведения». Для изучения мотивационно-личностного компонента одаренности были использованы субтесты «Волевые качества личности», «Социальный интеллект», «Мотивы выбора профессии».
Для изучения академической успеваемости испытуемых были проанализированы их оценки за последнее полугодие по учебным предметам, соответствующим гуманитарному (русский язык, литература, история, обществознание, иностранный язык), физико-математическому (алгебра, геометрия, физика, информатика) и естественнонаучному (биология, химия, география) направлениям обучения.
Результаты исследования и их обсуждение
На втором этапе исследования собранные данные подверглись процедуре процентильной (нелинейной) нормализации, благодаря которой были выделены группы испытуемых в зависимости от обнаруженных уровней развития интеллекта, креативности и мотивационно-личностных качеств.
На третьем этапе исследования были проведены анализ данных и интерпретация для
группы испытуемых, значения показателей которых вошли в верхний квартиль (от 75 до 100%).
Когнитивный компонент одаренности
В рамках когнитивного подхода, который является доминирующим и наиболее разработанным в изучении одаренности под одаренностью понимается высокий
уровень когнитивных способностей и / или интеллекта в целом.
Анализ данных показывает, что для 17,9% девушек и 25% юношей характерна способность устанавливать логико-функциональные связи между понятиями на основе различных видов отношений.
Для 25% девушек и 15% юношей характерен конвергентный когнитивный стиль -мышление, сознательно контролируемое и ориентированное на поиск единственно правильного решения.
Дивергентный когнитивный стиль характерен для 24,6% девушек и 23,4% юношей. Дж. Гилфорд связывает креативность именно со способностями к дивергентному мышлению, направленному на создание множества разнообразных новых, нетривиальных решений «открытых», т. е. не имеющих единственного решения проблем. Испытуемые с дивергентным когнитивным стилем обычно отличаются широтой интересов.
24,4% девушек и 23,7% юношей имеют высокие оценки по предметам, соответствующим естественнонаучному направлению, 25,4% девушек и 19,2% юношей - физико-математическому, 17,4% девушек и 18% юношей - гуманитарному. Полученные данные позволяют говорить о высоком уровне академической одаренности испытуемых, определяемой успешностью обучения.
Креативный компонент одаренности
В соответствии с концепцией Э. П. Торренса, основными параметрами креативности
являются беглость, гибкость, оригинальность и разработанность Г41~421. Беглость отражает способность к генерированию большого числа идей за единицу времени. Наличие этой способности отмечают у себя 18,3% девушек и 18,8% юношей.
Гибкость связана со способностью к выдвижению разных идей, переходу от одного аспекта проблемы к другому, использованию разных стратегий ее решения. Гибкость характерна для 13,9% девушек и 10,2% юношей.
Оригинальность - ключевая характеристика креативности, способность к выдвижению необычных, неординарных идей, отличающихся от очевидных, общепринятых или твердо установленных. Оригинальность характерна для 23,7% девушек и 9,4% юношей.
23,8% девушек и 18,8% юношей отличаются креативностью, высокой внутренней мотивацией к творческой активности и продуктивности.
Можно заключить, что, в целом, испытуемые-девушки оценивают себя как более креативных, чем испытуемые-юноши.
Мотивационно-личностный компонент одаренности
В рамках личностного подхода к изучению одаренности главное внимание уделяется мотивационным, эмоциональным и другим личностным характеристикам одаренных людей, рассматриваемым в качестве основных определяющих факторов и условий
развития и самореализации.
Познавательная мотивация рассматривается как общая характеристика и структурный компонент личности одаренного человека [2-3, 6, 10-11, 16, 20, 22-23, 25-28, 39-40, 43!. Она характерна для 6% девушек и 5,8% юношей. Они отличаются стремлением к познанию, постижению сущности деятельности и получению интеллектуального удовлетворения от деятельности.
Мотив самореализации выражен у 87% девушек и 82% юношей. Они стремятся к реализации в деятельности, которая рассматривается ими как возможность развития своих способностей. Полная самореализация человека, с точки зрения К. Г. Юнга, является конечной целью его жизни, однако этой цели достигают только самые
способные, высокообразованные и имеющие достаточный досуг люди А. Маслоу
считает, что только одаренные люди, составляющие менее 1% населения, достигают
реализации своего потенциала
Испытуемые отличаются выраженными качествами, характерными для одаренных людей и обеспечивающими эффективную реализацию деятельности [2-3, 6, 10-11, 16, 20, 2223, 25-28, 32, 39-40, 43!.
Так, инициативность как активная направленность личности на совершение действия характерна для 24,6% девушек и 22,8% юношей. Настойчивостью отличаются 24,1% девушек и 23,2% юношей - они умеют мобилизовать свои силы для устойчивого и длительного преодоления препятствий, возникающих на пути достижения цели. Решительность характерна для 19,9% девушек и 21,9% юношей. Они умеют принимать и реализовывать быстрые, обоснованные и твердые решения.
22,8% девушек и 18,9% юношей способны вступать в новые социальные ситуации, устанавливать контакты с новыми людьми и успешно социально адаптироваться.
Можно заключить, что одаренные старшеклассники обладают мотивационно-личностными качествами, которые принято считать прогностически благоприятными для значительных достижений в деятельности.
Анализ данных профилей пользователей в социальной сети «ВКонтакте»
На четвертом этапе исследования одаренные старшеклассники были идентифицированы в социальной сети «ВКонтакте». Были проанализированы следующие группы данных:
1. Профиль: фамилия, имя и псевдоним, контакты, образование и карьера, жизненная позиция, количество друзей.
2. Авторские записи (посты) и репосты.
3. Подписки на группы и интересные страницы.
Целостный анализ профиля позволяет говорить о том, что большинство одаренных девушек и юношей достаточно открыты, однако нельзя утверждать, что они неосторожны или излишне доверчивы, поскольку в их профилях отсутствует слишком большое количество личной и, тем более, интимной информации (как графической, так и текстовой).
Имя, фамилия и псевдоним пользователя
Поскольку указание реальных имени и фамилии является одним из обязательных
требований при регистрации в «ВКонтакте», у 100% испытуемых - девушек и юношей указаны реальные имя и фамилия. Однако следует отметить, что здесь речь идет о 73% идентифицированных в социальной сети пользователях с открытыми и закрытыми профилями (67%, n=1692 и 6%, n = 162, соответственно). 27% (n = 688) испытуемых не удалось идентифицировать в социальной сети, поскольку либо они в ней не зарегистрированы, либо используют псевдонимы.
Полное написание имени встречается у 84% девушек и 76,1% юношей. Уменьшительное написание имени встречается гораздо реже (16% девушек и 19,6% юношей), уменьшительно-ласкательное написание имени отсутствует полностью. Уменьшительно-ласкательное написание имени некоторые психологи считают проявлением инфантилизма. Основываясь на полученных данных, можно сказать, что для большинства испытуемых он не характерен.
4,3% юношей используют полное написание фамилии, имени и отчества, что может указывать на их на стремление подчеркнуть свою значимость.
Контактная информация пользователя
Представленность контактов может говорить об открытости или закрытости, доступности или недоступности пользователя для общения.
У 100% девушек и юношей указан город проживания. У 8% девушек и 8,7% юношей указан номер мобильного телефона, у 8,7% юношей этот номер указан, но скрыт для пользователей, не входящих в круг их друзей.
У 40% девушек и 13% юношей указана интеграция с сервисом Instagram, у 8% девушек и 4,3% юношей - с социальной сетью Twitter, 4% девушек и 2,2% юношей - с социальной сетью Facebook. У 8% девушек и 4,3% юношей указана ссылка на их сайт, у 4% девушек и 15,2% - логин в Skype.
Можно заключить, что, в целом, одаренные старшеклассники достаточно открыты и доступны для общения в социальной сети.
Образование и карьера
Данных об опыте обучения и работы у испытуемых не представлено. У 100% девушек и 65,2% юношей имеются сведения об образовательном учреждении, в котором они обучаются.
Жизненная позиция
Жизненная позиция обозначена у 16% девушек и 32,6% юношей. 8% девушек и 26,7% юношей разделяют православное мировоззрение, 8% девушек и 13,3% юношей -атеистическое.
12% девушек разделяют умеренные политические предпочтения, 6,7% юношей -либеральные, 6,7% юношей - социалистические и 6,7% юношей - коммунистические.
Главными жизненными ценностями 4% девушек считают совершенствование мира, 4% девушек и 33,3% юношей - семью и детей, 8% девушек и 20% юношей - развлечения и отдых, 13,3% юношей - саморазвитие, 6,7% юношей - красоту и искусство. Главные ценности в людях, по мнению 12% девушек и 33,3% юношей, это - доброта и честность, 4% девушек и 20% юношей - смелость и упорство, 20% юношей - юмор и жизнелюбие.
Негативно относятся к курению 66,7% юношей, к алкоголю - 33,3%. Нейтральным отношением к курению обладают 13,3% юношей, к алкоголю - 26,7%. Компромиссным отношением к алкоголю отличаются 20% юношей. В профилях у девушек данная информация не представлена.
Источниками вдохновения 36% девушек и 26,7% юношей считают музыку, 16% девушек - общение, 4% девушек и 13,3 юношей - путешествия, 4% девушек - кино, по 6,7% юношей - спорт, архитектуру и сериалы.
Друзья
Минимальное количество друзей у испытуемых-девушек - 1 человек, максимальное -489, у испытуемых-юношей - 5 человек, максимальное - 1349. В исследовании американских ученых показано, что в среднем у каждого пользователя социальной сети 150 друзей, что подтверждает известное в антропологии число Данбара (ограничение количества постоянных социальных связей, которые человек может поддерживать, ста
пятьюдесятью связями) В исследовании испанских ученых говорится, что
максимальное количество друзей в социальной сети не должно превышать 354. Если их
больше, это может сделать человека несчастливым и даже привести к депрессии
Если взять за нормативное значение вышеуказанное количество друзей, то можно сказать, что 96% девушек и 87% юношей имеют количество друзей, потенциально не опасное для развития депрессии и других негативных состояний. 40% девушек и 52,2% юношей имеют количество друзей в пределах указанного нормативного значения до 150 человек, 56% девушек и 34,8% юношей попадают в диапазон количества друзей от 150 до 354 человек.
На основании полученных данных можно предполагать, что даже для экстровертированных испытуемых не характерна поверхностность и неразборчивость общения, поскольку значительного превышения указанных нормативных значений не обнаружено.
Группы и интересные страницы
Группы - тематические сообщества друзей, коллег по работе и учебе. В социальной сети «ВКонтакте» создано более 16 миллионов групп, среди которых пользователи могут искать интересующие или создавать свои.
Среди групп у испытуемых-девушек лидируют сообщества с познавательным, социальным и коммерческим контентом (см. табл. 1).
Таблица 1.
Рейтинг сообществ по виду контента
№ Выборка девушек Выборка юношей
1 Познавательный контент Развлекательный контент
2 Социальный контент Познавательный контент
3 Коммерческие контент -
4 Развлекательный контент -
В категорию сообществ с познавательным контентом входят группы, в которых размещается такая информация, как обучающие статьи, инструкции, результаты исследований, записи мастер-классов, вебинаров, полезная инфографика, интервью с
экспертами и т. д.
В категорию сообществ с социальным контентом входят группы, в которых размещается информация о социальных (благотворительных, волонтерских) проектах и мероприятиях.
В категорию сообществ с коммерческим контентом входят группы, в которых размещаются каталоги с фото, описанием и ценами товаров, акции и конкурсы. У девушек, в основном, это сообщества, предлагающие приобрести одежду, обувь, косметику, товары для творчества, книги и канцелярию.
В категорию сообществ с развлекательным контентом входят группы, в которых размещается такая информация, как юмор, подборки красивых фото, открытки, интересные истории, анекдоты, мемы, мотиваторы и демотиваторы, открытки, загадки, цитаты, стихи, музыка, художественные фильмы и т. д.
В блоке «Интересные страницы» отображаются сообщества, в которых пользователи проявляют наибольшую активность: куда чаще заходят, какие фотографии, видеозаписи открывают, какие записи комментируют и пр. Количество таких страниц у девушек варьирует от 2 до 281, у юношей - от 3 до 325.
Сообщества с познавательным контентом являются лидирующими у всех испытуемых (см. табл. 2). 100% девушек и юношей интересны сообщества, позволяющие:
- повысить эрудицию и расширить кругозор за счет получения новых знаний, в т. ч. по определенным учебным предметам;
- подготовиться к сдаче ЕГЭ;
- научиться определенному виду деятельности, получить полезные навыки и т. п.
Таблица 2.
Рейтинг интересных страниц по виду контента
№ Выборка девушек Выборка юношей
1 Познавательные Познавательные
2 Социальные Развлекательные и полезные («мужские»)
3 Поле з ные и ра з в ле ка те л ьные («женские») Спортивные
4 Спортивные Городские
5 Городские Новостные
6 Новостные Коммерческие
7 Коммерческие
На втором месте у девушек находятся сообщества, задачами которых являются разработка и предложение социальных проектов (благотворительных, волонтерских), организация и проведение социальных мероприятий на постоянной и периодической основе.
У юношей вторыми идут сообщества с развлекательным контентом - кино, сериалы, музыка, юмор и комиксы. Интересно, что здесь у юношей лидируют сообщества категории 18 + , содержание которых отражает «традиционные» для мужчин темы: авто и мото, оружие, охота, рыбалка, спорт, тотализаторы, компьютерные игры, бои и драки, девушки, черный, грубый и пошлый юмор.
На третьем месте у девушек находятся так называемые «женские» сообщества, содержание которых отражает «традиционные» для женщин темы: беременность и материнство, отношения, забота о близких, здоровье, красота, мода, домоводство, творчество и рукоделие, работа.
У юношей третьими идут спортивные сообщества (обычно ограничены конкретным видом спорта или спортивным фан-клубом). У девушек они занимают четвертое место и являются фитнес-сообществами или сообществами определенных фитнес-клубов.
На пятом месте у девушек и четвертом у юношей находятся так называемые «городские» сообщества - сообщества людей, связанных общим местоположением, организацией или событием. Контент городских сообществ - городские новости, афиша, учебные заведения, черные и белые списки организаций, вакансии и возможности подработки.
Шестыми у девушек и пятыми у юношей идут новостные сообщества. Наконец, завершают список у всех испытуемых сообщества с коммерческим контентом.
Следует отметить, что такое разделение сообществ достаточно условно - многие из них являются смешанными. Так, например, сообщества учебных заведений одновременно являются и сообществами места и сообществами интересов.
Авторские посты и репосты
Авторские посты и репосты - универсальные инструменты распространения информации в социальной сети. Они могут содержать текст, изображение, аудио- или видеозапись, и отображаются в ленте новостей друзей и подписчиков пользователя.
Для 60% испытуемых-девушек характерна публикация постов, целями размещения которых являются информирование и развлечение (35%) и побуждение к действиям (40%). Для испытуемых-юношей характерна публикация постов, целью размещения которых является информирование и развлечение (40%). В основном, посты содержат фотографии, смешные картинки, иногда сопровождаемые авторскими комментариями.
Для испытуемых характерно ме ньшее количество репостов, чем постов. Целями размещения репостов, в основном, являются сохранение интересной и полезной информации (62% у девушек, 31% - у юношей), информирование и развлечение (52% у девушек, 36% - у юношей), а также побуждение к действиям (только у девушек - 48%). Репосты девушек обычно призывают помочь социально незащищенным категориям населения и бездомным животным.
На основании результатов «ручного» анализа структуры и содержания профилей испытуемых в социальной сети можно говорить о некоторых психологических качествах, свойственных одаренным старшеклассникам. Данный анализ был реализован и с целью разработки модели, благодаря которой будет возможен анализ профилей старшеклассников, не прошедших предварительного психологического тестирования для определения одаренности.
Однако у подобного анализа имеются ограничения, затрудняющие определение признаков одаренности в «цифровом следе» пользователей:
- специфика контекста развлекательной направленности, доминирующего в «ВКонтакте» при фактическом отсутствии «полезных» видов деятельности;
- специфика графического контента, доминирующего в «ВКонтакте» - методы
психолингвистики в этом случае не применимы, поскольку вместо авторского текста размещаются изображения;
- слишком большое количество признаков для проведения «ручного» анализа - у одного пользователя может быть только 200 подписок на группы и интересные страницы, и если анализировать еще и его тексты, связи, реакции и пр., таких признаков у одного пользователя может «накопиться» до нескольких сотен.
Поэтому для определения одаренных старшеклассников на пятом этапе исследования был применен метод, позволяющий проводить масштабные исследования как по количеству испытуемых, так и по количеству необходимых для анализа признаков, -метод машинного обучения.
Анализ данных профилей пользователей социальной сети «ВКонтакте» методами машинного обучения
В исследовании W. Pennebaker ^^ было показано, что именно методы машинного обучения помогают понять связь между данными о человеке и психологическими качествами. Это исследование было посвящено использованию метода опорных векторов для прогнозирования по авторским текстам личностных качеств опросника «Большая пятерка». Лучшим результатом стала точность 58% для шкалы «Нейротизм».
В другом исследовании S. Nowson, J. Oberlander, A. J. Gill [35] о связи текстов блогеров и личностных качеств опросника «Большая пятерка», показана значимая корреляция между характеристиками текста и результатами по шкалам «Открытость» и «Доброжелательность».
Широкую известность получили работы M. Kosinski и D. Stillwell при участии специалиста по машинному обучению T. Graepel. В рамках реализованного ими проекта Mypersonality были собраны данные социальных сетей и результаты заполнения различных психодиагностических опросников более чем семи миллионов пользователей i33!.
Исследователи благодаря использованию моделей машинного обучения показали, что у каждого пишущего пользователя социальных сетей (а не только у профессиональных писателей) есть своеобразный «языковой отпечаток», получивший название «stylome» [34]. Предполагается, что люди со схожими психологическими качествами имеют схожие
«языковые отпечатки» -t4^ Также предполагается, что все действия пользователя в информационных системах, будь то отметки «Нравится» в социальных сетях или перемещение по страницам Интернет-ресурсов, имеют свой «цифровой след», причем, «цифровые следы» пользователей со схожими психологическими качествами также похожи.
Сама возможность прогнозирования психологических качеств по данным социальных сетей обусловлена тем, что психологические качества влияют на «цифровой след»,
оставляемый пользователем i34!. Исследования [31] показали, что точность прогноза модели машинного обучения может составлять до 0,95, в зависимости от конкретного психологического качества.
Большинство исследований, посвященных прогнозированию психологических качеств по данным социальных сетей, включают в себя психологическую, техническую и математическую компоненты.
В данном исследовании психологическая компонента основана на уже упомянутых
психологических качествах, значимых для определения одаренности.
Техническая компонента основана на использовании компьютеризированной методики #Профориентация, которая обеспечивает проведение тестирования на любом персональном компьютере, подключенным к сети Интернет, сбор и анализ данных по результатам тестирования.
Математическая компонента исследования основана на методах машинного обучения. Применение машинного обучения требует определения трех основных составляющих: задач, признаков и моделей.
Аналогично исследованиям ^^—в качестве задачи была определена бинарная классификация испытуемых. К положительному классу будут относиться испытуемые, показавшие результаты выше среднего по конкретному психологическому качеству (зависимая переменная равна «1»), к отрицательному - испытуемые с результатами ниже среднего по данному качеству (зависимая переменная равна «0»). Таким образом, прогноз заключался в соотнесении испытуемого с одним из двух классов: с результатами выше и ниже среднего.
Для оценки качества решения задачи бинарной классификации был использован стандартный набор метрик: точность, F-мера и площадь под ROC-кривой.
В качестве признаков были определены пол испытуемых, принадлежность к группам «ВКонтакте», результаты по шкалам методики. Предполагалось, что подписчики определенной группы «ВКонтакте» могут обладать схожими психологическими качествами, что делает возможным использовать принадлежность к группе для прогноза
психологических качеств у ее подписчиков. Ранее было показано i^il, что принадлежность пользователей к сообществам в социальных сетях Facebook и Twitter может быть использована для прогнозирования психологических качеств подписчиков этих сообществ. Принадлежность к группам, как и тексты, является примером «цифрового следа» пользователя.
В качестве моделей были определены метод опорных векторов, случайные леса и градиентный бустинг. Реализация моделей выполнена при помощи библиотек Python.
Следует отметить, что в данном исследовании построение модели прогнозирования было реализовано для испытуемых с заранее известными характеристиками:
1. Учащиеся старших классов (n = 1240, из них: 698 девушек и 542 юноши). Это ограничение позволило упростить моделирование, отказаться от учета специфики пользователей разных возрастов. Кроме того, «ВКонтакте» является наиболее популярной социальной сетью именно среди пользователей-старшеклассников.
2. Учащиеся Томской области. Это ограничение позволило повысить качество моделирования за счет учета региональной специфики.
В зависимости от конкретного психологического качества, выбранная стратегия позволила обеспечить возможность прогноза для 50-76% испытуемых. Для 24-50% испытуемых объем данных оказался не достаточен для прогноза по психологическим качествам.
Сравнение моделей путем расчета площади под ROC-кривой показало, что наиболее эффективной для решения задачи бинарной классификации является модель на основе метода опорных векторов, поскольку значение площади под ROC-кривой для этого
метода оказалось набольшим (см. табл. 3).
При расчете площади под ЯОС-кривой использовалась кросс-валидация, выборка разделялась на пять равных частей, четыре части использовались для обучения модели, одна часть - для тестирования. Разделение выборки повторялось пять раз. Приведенные в табл. 3 результаты расчета площади под ЯОС-кривой являются усредненными по пяти итерациями обучения и тестирования модели.
Таблица 3
Сравнение моделей машинного обучения по значению площади под ROC-кривой
Шкала субтеста М е тод опорных векторов Случайные леса Градиентный бустинг
Аналогии 0,78 0,72 0,76
Дивергентный стиль 0,64 0,60 0,62
Конвергентный стиль 0,70 0,63 0,67
Беглость 0,67 0,61 0,65
Семантическая гибкость 0,69 0,64 0,69
Оригинальность 0,71 0,64 0,69
Креативное поведение 0,71 0,62 0,68
Инициативность 0,69 0,65 0,70
Решительность 0,71 0,67 0,70
Настойчивость 0,68 0,60 0,65
Мотив самореализации 0,76 0,68 0,72
Социальные навыки 0,74 0,69 0,73
Для модели на основе метода опорных векторов была дополнительно рассчитана точность бинарной классификации и F-мера (см. табл. 4).
Таблица 4
Метрики модели на основе метода опорных векторов
Шкала субтеста Точность F-мера Площадь под ROC-кривой
Аналогии 0,75 0,53 0,78
Дивергентный стиль 0,64 0,41 0,64
Конвергентный стиль 0,66 0,59 0,70
Беглость 0,62 0,37 0,67
Семантическая гибкость 0,67 0,57 0,69
Оригинальность 0,67 0,57 0,71
Креативное поведение 0,73 0,39 0,71
Инициативность 0,67 0,59 0,69
Решительность 0,67 0,64 0,71
Настойчивость 0,63 0,65 0,68
Мотив самореализации 0,65 0,76 0,76
Социальные навыки 0,65 0,76 0,74
Таким образом, средняя точность модели прогнозирования составила 0,67. Это дает основания говорить о том, что именно с такой точностью применение методов машинного
обучения позволяет идентифицировать испытуемых с высоким уровнем развития психологических качеств и устанавливать положительные и отрицательные связи между уровнем развития у испытуемых определенного качества и их принадлежностью к определенным сообществам в социальной сети.
Обнаружено, что прогнозирование осуществляется как на основе региональных, так и федеральных групп-маркеров. Часть групп-маркеров ориентирована на пол испытуемых (см. табл. 5-9).
Таблица 5
Примеры групп-маркеров для субтеста «Аналогии»
Принадлежность к группе положительно коррелирует с результатом по шкале Принадлежность к группе отрицательно коррелирует с результатом по шкале
Группа Количество подписчиков Группа Количество подписчиков
E-squire 2623459 АТАШОЛ 1514883
Просветленный 18 + 897852 Они тупые? 1281952
Твоя Доза Деградации 417047 КЕКС 958513
Институт Благородных Рокерш 341868 Наука дня 946901
какие-то биохимические мемы 65991 Ti_Shop Одежда в наличии Томск 11004
Абитуриент Томского государственного | ТГУ 1 2492 Томские сплетни NEW 5603
Следует отметить, что влияние группы-маркера на прогноз не следует напрямую из ее названия. Так, например, принадлежность к группе «Твоя Доза Деградации» положительно связана с результатом по шкале субтеста «Аналогии», а принадлежность к группе «Наука дня» - отрицательно.
Таблица 6
Примеры групп-маркеров для субтеста «Когнитивные стили»
(шкала «Дивергентное мышление»)
Принадлежность к группе положительно коррелирует с результатом по шкале Принадлежность к группе отрицательно коррелирует с результатом по шкале
Группа Количество подписчиков Группа Количество подписчиков
Практическая психология 2306945 Мужские мысли 3506768
Странный юмор 1589701 Comedy Club 3005152
Литература 1331898 Бот Анекдот 2254388
Интеллигенция 1245422 IQ - интеллектуальный журнал 1658866
Типичная девушка 1137582 подростки испорченного поколения 1116132
ТОРОБЗО ТПУ | Томский
«Содружество», г. 3812 политехнический 17811
Томск университет
Таблица 7
Примеры групп-маркеров для субтеста «Опросник креативного поведения»
Принадлежность к группе положительно коррелирует с результатом по шкале Принадлежность к группе отрицательно коррелирует с результатом по шкале
Группа Количество подписчиков Группа Количество подписчиков
Психология тишины 3039600 Без кота и жизнь не та V 3098869
Идеи для творчества и подарков своими руками 3019244 World of Tanks 3048934
Музыка 1695648 Интересные факты и тайны 2029990
Музыкальный бот 522224 Наука и техника 2003497
Типичный творческий 913811 КМД | Королевство Милых Дам 1682457
Музыкальный Томск 1906 Развлечения в Томске 30977
Таблица 8
Примеры групп-маркеров для субтеста «Социальный интеллект»
(шкала «Социальные навыки»)
Принадлежность к группе положительно коррелирует с результатом по шкале Принадлежность к группе отрицательно коррелирует с результатом по шкале
Группа Количество подписчиков Группа Количество подписчиков
Улыбнуло ^ 3379705 Дуревыбивалка 1795156
Академия Порядочных Парней □ 3269268 Повседневность 1465360
Шпильки | Женский Журнал 1699685 Обман зрения 1267323
Идеи для жизни 1430081 Ожидание & Реальность 673259
Ж изнь 1021622 Это мой английский юмор 249698
ВЕСТИ-ТОМСК 6923 РЕШУ ЕГЭ 225669
Таблица 9
Примеры групп-маркеров для субтеста «Мотивы выбора профессии» (шкала «Мотив самореализации»)
Принадлежность к группе I Принадлежность к группе
положительно коррелирует с результатом по шкале отрицательно коррелирует с результатом по шкале
Группа Количество подписчиков Группа Количество подписчиков
Искусство реальности 2691201 Анекдоты 2945138
Читающие 1488119 Дурь ► 1468814
Сделай сам (рецепты, уют, рукоделие) 1011127 AUTO 1466527
Современное ис кусс тв о 857486 Европейский Футбол | Спартак - Зенит 1349377
Academic Architecture 212921 Men's Classical 1209323
Вопросяшки в ТГУ 2359 Академия Порядочных Девиц 501066
Таким образом, можно заключить, что позволяет с удовлетворительной точностью уровнем развития психологических качеств,
применение методов машинного обучения идентифицировать пользователей с высоким значимых для определения одаренности.
Прогноз по данным социальных сетей не требует предварительного психологического тестирования и может быть подготовлен для испытуемых, с которыми не проводилась какая-либо работа по выявлению одаренности. Другими словами, разработанную в исследовании модель прогнозирования можно применять для определения одаренности у всех старшеклассниках Томской области, не прошедших психологического тестирования для определения одаренности. По «цифровому следу» испытуемых, которым, в частности, является их принадлежность к определенным сообществам в социальной сети, можно прогнозировать уровень развития у них психологических качеств, значимых для определения одаренности.
Выводы
Социальные сети могут быть достаточно эффективно использованы для выявления психологических качеств - интеллектуального, креативного и мотивационно-личностного компонентов одаренности. Применение методов машинного обучения, позволяющего учитывать большое количество испытуемых и признаков, дает возможность с удовлетворительной точностью идентифицировать пользователей социальной сети с высоким уровнем развития определенных психологических качеств и устанавливать связи между этим уровнем и принадлежностью пользователей к определенным сообществам социальной сети.
Новизна данной работы заключается в изучении данных пользователей социальной сети именно для определения одаренности: в отечественных и зарубежных работах представлены результаты анализа данных социальных сетей для исследования и прогнозирования пола, возраста, национальности, психологического типа пользователей, их политических предпочтений, но не одаренности.
Перспективы исследования связаны с возможностями применения методов машинного обучения для проведения масштабного, оперативного, лонгитюдного и менее затратного, по сравнению со стандартным бланковым, тестирования старшеклассников с целью определения значимых для успешной профессиональной реализации качеств и навыков, и отслеживания динамики их развития.
В план следующих исследований входит увеличение количества рассматриваемых в
социальной сети признаков: кроме подписок на в сообществах (отметки «Нравится», репосты), текстов на личной странице. Это позволит повысить ее точность.
сообщества учет реакций пользователей графов социальных связей и авторских усложнить модель прогнозирования и
Практическое применение разработанной модели прогнозирования заключается в возможности привлечения абитуриентов с выраженным когнитивным и личностным потенциалом. Кроме того, модель может быть использована для определения когнитивных, личностных качеств и компетенций обучающихся с целью проектирования индивидуальных траекторий обучения.
Библиография
1. Богдановская И. М. Компьютерная психодиагностика в профориентационной работе со старшеклассниками / И. М. Богдановская, П. Б. Киселев, А. Н. Кошелева, В. А. Рубан // Психологические проблемы образования и воспитания в современной России: материалы IV конференции психологов образования Сибири. - Иркутск, 2016. - С. 296-302.
2. Леонтьев Д. А. Личностное в личности: личностный потенциал как основа самодетерминации // Ученые записки кафедры общей психологии МГУ им. М. В. Ломоносова. - Вып. 1. - М. : Смысл, 2002. - С. 56-65.
3. Леонтьев Д. А. Личность как определяющий фактор // Воображение и творчество в образовании и профессиональной деятельности: материалы Четвертой международной конференции памяти Л. С. Выготского. - М. : РГГУ, 2004. - С. 214223.
4. Литвинова Т. А. К проблеме стабильности характеристик идиостиля // Известия Южного федерального университета. Филологические науки. - 2015. - №. 3. - С. 98-106.
5. Мальцев В. Не во френдах счастье [Электронный ресурс] // Expert Online. 2012. URL: http://expert.ru/2012/09/12/ne-vo-frendah-schaste (дата обращения: 04.12.2017).
6. Маслоу А. Мотивация и личность / А. Маслоу. - СПб. : Питер, 2011. - 352 с.
7. Матюшкин A. M. Мышление, обучение, творчество / А. М. Матюшкин. - М. : Изд-во МПСИ; Воронеж : НПО «МОДЭК», 2003. - 720 с.
8. Психология одаренности детей и подростков / под ред. Н. С. Лейтеса. - М : Издательский центр «Академия», 1996. - 416 с.
9. Рабочая концепция одаренности / Д. Б. Богоявленская [и др.]. - М. : Мин-во образования РФ, 2003. - 95 с.
10. Рензулли Дж. Модель обогащающего школьного обучения / Дж. Рензулли, С. М. Рис // Основные современные концепции творчества и одаренности. - М., 1997. - С. 214-242.
11. Стернберг Р. Д. Триархическая теория интеллекта // Иностранная психология. -1996. - № 6. - С. 54-61.
12. Ушаков Д. В. Структура и динамика интеллектуальных способностей : автореф. дис. ... д-ра психол. наук / Д. В. Ушаков. - М., 2004. - 48 с.
13. Хеллер К. А. Диагностика и развитие одаренных детей и подростков // Основные современные концепции творчества и одаренности. - М., 1997. - С. 243-264.
14. Холодная М. А. Психология интеллекта: парадоксы исследования / М. А. Холодная. - СПб. : Питер, 2002. - 272 с.
15. Художественная одаренность детей, ее выявление и развитие / A. A. Мелик-Пашаев [и др.]. - Дубна : Феникс + , 2006. - 112 с.
16. Шмелев А. Г. Психодиагностика личностных черт / А. Г. Шмелев. - СПб. : Речь, 2002. - 480 с.
17. Шумакова Н. Б. Обучение и развитие одаренных детей / Н. Б. Шумакова. - М. : Изд-во МПСИ; Воронеж : НПО «МОДЭК», 2004 а. - 336 с.
18. Щебланова Е. И. Одаренность как психологическая система: структура и динамика в школьном возрасте : дис. ... д-ра психол. наук / Е. И. Щебланова. - М., 2006. -311 с.
19. Юнг К. Г. Воспоминания, размышления, сновидения / К. Г. Юнг. - Минск : ООО «Харвест», 2003. - 496 с.
20. Юркевич В. С. Одаренный ребенок: иллюзии и реальность / В. С. Юркевич. - М. : Просвещение; Учебная литература, 1996. - 136 с.
21. A Societal Sentiment Analysis: Predicting the Values and Ethics of Individuals by Analysing Social Media Content / T. Maheshwari et al. // Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics. -2017. - Vol. 1. - P. 731-741.
22. Clark B. Growing up gifted / B. Clark. - New York : Macmillan, 1992. - 674 p.
23. Cropley A. J. Recognizing creative potential: an evaluation of the usefulness of creativity tests // High ability studies. The journal of the European Council for High Ability. - 1996. - Vol. 7. - № 2. - P. 203-219.
24. Dunbar R. I. M. How many friends does one person need?: Dunbar's number and other evolutionary quirks. - London : Faber and Faber, 2010. - 312 p.
25. Feldhusen J. F. A conception of giftedness. // Conceptions of giftedness. - Cambridge : Cambridge University Press, 1986. - P. 112-127.
26. Freeman J. Cultural influences on gifted gender achievement // High ability studies. The journal of the European Council for High Ability. - 2004. - № 1. - P. 7-23.
27. Freeman J. Gifted children growing up / J. Freeman. - London : Cassell, 1991.
28. Freeman J. Recent development for the high able in Britain // Education of the gifted in Europe: theoretical and research issues. - Amsterdam, 1992. - P. 58-70.
29. Heller K. A. International trends and issues of research into giftedness // Proceedings of the Second Asian Conference on giftedness: growing up gifted and talented. - 1992. - P. 93-110.
30. Large scale personality classification of bloggers / F. Iacobelli et al. // Affective computing and intelligent interaction. - Springer, Berlin, Heidelberg, 2011. - P. 568577.
31. Mining facebook data for predictive personality modeling / D. Markovikj et al. // Proceedings of the 7th international AAAI conference on Weblogs and Social Media (ICWSM 2013). - Boston, MA, USA. - 2013. - P. 23-26.
32. Monks F. J. Development of gifted children: The issue of identification and programming // Talent for the friture. - Assen, 1992. - P. 191-202.
33. myPersonality Project [Электронный ресурс] // URL: http://mypersonality.org/wiki/doku.php#mypersonality_in_numbers (дата обращения: 04.12.2017).
34. New machine learning methods demonstrate the existence of a human stylome / H. Van Halteren et al. // Journal of Quantitative Linguistics. - 2005. - Vol. 12. - № 1. -P. 65-77.
35- Nowson S. Weblogs, genres and individual differences / S. Nowson, J. Oberlander, A. J. Gill // Proceedings of the 27th Annual Conference of the Cognitive Science Society. -2005. - Vol. 1666. - P. 1671.
36. Pennebaker J. W. Linguistic styles: language use as an individual difference / J. W. Pennebaker, L. A. King // Journal of personality and social psychology. - 1999. - Vol. 77. - № 6. - P. 1296.
37. Personality, gender, and age in the language of social media: The open-vocabulary approach / H. A. Schwartz et al. // PloS one. - 2013. - Vol. 8. - № 9. - P. e73791.
38. Renzulli J. S. What is the thing called giftedness, and how do we develop it? A twenty-five year perspective // Journal for the education of the gifted. - 1999. - Vol. 23. - № 1. - P. 3-54.
39. Silverman L. K. Counseling the gifted and talented / L. K. Silverman. - Denver : Love publishing company, 1993.
40. Terman L. M. Mental and physical traits of a thousand gifted children // Genetic studies of genius. - 1925. - Vol. 1. - Stanford, CA: Stanford University Press.
41. Torrance E. P. The nature of creativity as manifest in its testing // The nature of creativity. Contemporary psychological perspectives. - Cambridge, 1988. - P. 43-75.
42. Torrance E. P. Torrance tests of creative thinking: Streamlined (revised) manual including norms and direction for administering and scoring figural A and B / E. P. Torrance, Ball O. E. - Benseville : Scholastic testing service, 1984.
43. Whitmore J. R. Giftedness, conflict and underachievement / J. R. Whitmore. - Boston : Allyn and Bacon, 1980