Научная статья на тему 'ПРИМЕНЕНИЕ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОФОРИЕНТАЦИИ АБИТУРИЕНТОВ ВЫСШЕГО УЧЕБНОГО ЗАВЕДЕНИЯ'

ПРИМЕНЕНИЕ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОФОРИЕНТАЦИИ АБИТУРИЕНТОВ ВЫСШЕГО УЧЕБНОГО ЗАВЕДЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
83
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АБИТУРИЕНТ / ВЫСШЕЕ УЧЕБНОЕ ЗАВЕДЕНИЕ / ПРОФОРИЕНТАЦИОННАЯ РАБОТА / НАВИГАЦИЯ / IT-ТЕХНОЛОГИИ / МАШИННОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Забокрицкая Любовь Дмитриевна, Орешкина Татьяна Анатольевна, Обабков Илья Николаевич, Чепуров Евгений Георгиевич

Представлено описание опыта разработки и внедрения собственного программного продукта по профориентации и навигации абитуриентов - Wizard УрФУ. Со стороны IT в статье решаются следующие задачи: дается описание основных методов, на которых может строиться работа программного продукта по профориентации и навигации абитуриентов; описывается алгоритм работы Wizard УрФУ; представлены результаты тестового этапа работы программного продукта. Со стороны социологии дается описание социально-демографического портрета пользователя Wizard УрФУ.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Забокрицкая Любовь Дмитриевна, Орешкина Татьяна Анатольевна, Обабков Илья Николаевич, Чепуров Евгений Георгиевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF MACHINE LEARNING ALGORITHM FOR CAREER GUIDANCE OF UNIVERSITY APPLICANTS

The aim of the article is to describe the experience of implementing our own software product (Wizard UrFU) for career guidance and navigation of university entrants. The importance of introducing digital technologies for career guidance and navigation of university entrants is substantiated. The article addresses both sociological and IT tasks. On the part of information technology, a description is given of the main methods on which the work of a software product for vocational guidance and navigation of applicants can be built. In particular, we have proved that the most promising is the complex method, which is based on a combination of several methods and algorithms for the operation of neural networks for vocational guidance and navigation of applicants. The article describes the algorithm of the software product developed by our team. We show that this algorithm is based on the analysis of digital traces of applicants in the social network VKontakte. The algorithm uses the machine learning method. We also show that the career guidance system in the Wizard web application is based on a comparison of profile data in the VKontakte social network and generalized data of university students successfully enrolled in one of the educational programs. We analyzed the statistics of recommendations of educational programs to UrFU applicants using the UrFU Wizard web application using the Yandex. Metrics. The socio-demographic portrait of the UrFU Wizard software product user is a young man (or woman) aged 18 to 24 from Yekaterinburg or Sverdlovsk Oblast. This description fully coincides with the main target audience of the Ural Federal University. As a result, 12,780 potential applicants of Ural Federal University started submitting documents through the web application. In addition, 32% or 15,293 applicants made a transition to the institutions' social networks and educational programs for a more detailed acquaintance. The analysis of the admission campaign results showed that all educational programs that were in the TOP of recommended areas had a significant increase in applicants compared to previous years. In general, Ural Federal University in 2021 held the most massive admission campaign among higher educational institutions in the Russian Federation. In our opinion, the use of services based on the work of artificial intelligence for career guidance and navigation of applicants of a higher educational institution allows a successful solution of the following tasks: to expand the geography of admission without holding face-to-face meetings with applicants; to increase the reach of the advertising campaign and personalize advertising offers; to attract creative and motivated youth; to help the applicant to make the right choice of the direction of training and thereby increase the motivation to study.

Текст научной работы на тему «ПРИМЕНЕНИЕ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОФОРИЕНТАЦИИ АБИТУРИЕНТОВ ВЫСШЕГО УЧЕБНОГО ЗАВЕДЕНИЯ»

Вестник Томского государственного университета. 2022. № 485. С. 217-225 Vestnik Tomskogo gosudarstvennogo universiteta - Tomsk State University Journal. 2022. 485. рр. 217-225

Научная статья

УДК 316.1; 316.4

doi: 10.17223/15617793/485/24

Применение алгоритма машинного обучения для профориентации абитуриентов высшего учебного заведения

Любовь Дмитриевна Забокрицкая1, Татьяна Анатольевна Орешкина2, Илья Николаевич Обабков3, Евгений Георгиевич Чепуров4

1,2, з,4 Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург, Россия

1 zabokritskaya@urfu.ru

2 t.a.oreshkina@urfu.ru

3 I.N.Obabkov@urfu.ru

4 evgeny.chepurov@urfu.ru

Аннотация. Представлено описание опыта разработки и внедрения собственного программного продукта по профориентации и навигации абитуриентов - Wizard УрФУ. Со стороны IT в статье решаются следующие задачи: дается описание основных методов, на которых может строиться работа программного продукта по профориентации и навигации абитуриентов; описывается алгоритм работы Wizard УрФУ; представлены результаты тестового этапа работы программного продукта. Со стороны социологии дается описание социально-демографического портрета пользователя Wizard УрФУ.

Ключевые слова: абитуриент, высшее учебное заведение, профориентационная работа, навигация, IT-технологии, машинное обучение

Для цитирования: Забокрицкая Л.Д., Орешкина Т.А., Обабков И.Н., Чепуров Е.Г. Применение алгоритма машинного обучения для профориентации абитуриентов высшего учебного заведения // Вестник Томского государственного университета. 2022. № 485. С. 217-225. doi: 10.17223/15617793/485/24

Original article

doi: 10.17223/15617793/485/24

Application of machine learning algorithm for career guidance of university applicants

Lyubov D. Zabokritskaya1, Tatyana A. Oreshkina2, Ilya N. Obabkov3, Evgeny G. Chepurov4

1, 2, 3, 4 Ural Federal University, Yekaterinburg, Russian Federation

1 zabokritskaya@urfu.ru

2 t.a.oreshkina@urfu.ru

3 I.N.Obabkov@urfu.ru

4 evgeny.chepurov@urfu.ru

Abstract. The aim of the article is to describe the experience of implementing our own software product (Wizard UrFU) for career guidance and navigation of university entrants. The importance of introducing digital technologies for career guidance and navigation of university entrants is substantiated. The article addresses both sociological and IT tasks. On the part of information technology, a description is given of the main methods on which the work of a software product for vocational guidance and navigation of applicants can be built. In particular, we have proved that the most promising is the complex method, which is based on a combination of several methods and algorithms for the operation of neural networks for vocational guidance and navigation of applicants. The article describes the algorithm of the software product developed by our team. We show that this algorithm is based on the analysis of digital traces of applicants in the social network VKontakte. The algorithm uses the machine learning method. We also show that the career guidance system in the Wizard web application is based on a comparison of profile data in the VKontakte social network and generalized data of university students successfully enrolled in one of the educational programs. We analyzed the statistics of recommendations of educational programs to UrFU applicants using the UrFU Wizard web application using the Yandex. Metrics. The socio-demographic portrait of the UrFU Wizard software product user is a young man (or woman) aged 18 to 24 from Yekaterinburg or Sverdlovsk Oblast. This description fully coincides with the main target audience of the Ural Federal University. As a result, 12,780 potential applicants of Ural Federal University started submitting documents through the web application. In addition, 32% or 15,293 applicants made a transition to the institutions' social networks and educational programs for a more detailed acquaintance. The analysis of the admission campaign results showed that all educational programs that were in the TOP of recommended areas had a significant increase in applicants compared to previous

© Забокрицкая Л.Д., Орешкина Т. А., Обабков И.Н., Чепуров Е.Г., 2022

years. In general, Ural Federal University in 2021 held the most massive admission campaign among higher educational institutions in the Russian Federation. In our opinion, the use of services based on the work of artificial intelligence for career guidance and navigation of applicants of a higher educational institution allows a successful solution of the following tasks: to expand the geography of admission without holding face-to-face meetings with applicants; to increase the reach of the advertising campaign and personalize advertising offers; to attract creative and motivated youth; to help the applicant to make the right choice of the direction of training and thereby increase the motivation to study.

Keywords: applicant, higher educational institution, career guidance, navigation, IT, machine learning

For citation: Zabokritskaya, L.D., Oreshkina, T.A., Obabkov, I.N. & Chepurov, E.G. (2022) Application of machine learning algorithm for career guidance of university applicants. Vestnik Tomskogo gosudarstvennogo universiteta -Tomsk State University Journal. 485. рр. 217-225. (In Russian). doi: 10.17223/15617793/485/24

Введение. Каждое высшее учебное заведение ведет активную работу по привлечению абитуриентов, и с каждым годом уровень конкурентной борьбы за абитуриентов только возрастает. Для привлечения абитуриентов и осуществления с ними про-фориентационной работы на российском рынке появляются разные, порой весьма контрастные предложения со множеством нюансов: от узконишевых, специализированных до сложных комплексных решений; различных форматов - онлайн/офлайн, живые профпробы и мастер-классы; профориентаци-онные лагеря, квесты, экскурсии и т.д. [1]. В данной публикации мы не будем анализировать все перечисленные предложения, а лишь остановимся на решениях, основанных на применении цифровых технологий, в том числе алгоритмов машинного обучения.

Актуальность внедрения цифровых технологий для профориентации и навигации абитуриентов высшего учебного заведения мы связываем с тем, что:

Во-первых, анализ исследований ученых относительно состояния цифровой среды ведущих университетов России показал, что существует выраженная недостаточность развития интерактивных форм онлайн-сопровождения абитуриентов российских вузов. В российских университетах цифровые технологии, ориентированные на информирование, существенным образом доминируют над цифровыми технологиями, нацеленными на коммуникацию, интерактивные форматы [2]. Действительно, высшие учебные заведения активно размещают на своих сайтах описание специальностей, направлений подготовки, дисциплин и другую общую информацию, но дальнейший выбор остается за абитуриентом. Большие объемы информации часто не помогают, а запутывают абитуриентов, в результате чего выбор осуществляется интуитивно, основываясь на мнении третьих лиц либо по итогам проведения иных профориентационных мероприятий. Вследствие этого возрастает вероятность неверного выбора будущей профессии со всеми негативными последствиями, в том числе снижения мотивации к учебе.

Во-вторых, абитуриенты считают онлайн-среду для обучения даже более комфортной. Сегодняшние абитуриенты - это, прежде всего, люди, родившиеся после 2000-х гг. Они относятся к поколению зумеров (поколение 2), для которых характерна приверженность цифровым технологиям, естественны нахожде-

ние в онлайн среде, желание воспринимать информацию визуально [3]. Исследования показывают, что порядка 90% студентов используют интернет в выборе профессии и подавляющее большинство (более 70%) в целом положительно относится к перспективе использования искусственного интеллекта для помощи в профориентации [4]. Помимо прочего, исследователи отмечают, что грамотное построение процесса обучения, цифровизация приемной кампании и готовность к диалогу с абитуриентом являются важным фактором формирования имиджа учебного заведения [5]. Именно поэтому для современных студентов создание цифровых профориентационных ресурсов становится не просто желаемым, а необходимым.

В-третьих, существуют общие тренды в образовательной реальности, связанные с тотальной цифрови-зацией современного образовательного пространства. Эти тренды исходят как от государства, так и из потребностей самого общества. Важнейшим содержанием образовательной реальности в ближайшем будущем станет постановка и решение обществом и образованием задач по синхронизации и цифровой репликации данных обо всех объектах, акторах, а также о связях, свойствах, отношениях и закономерностях виртуального, реального и социального миров [6].

Постановка проблемы. Вследствие указанных перспектив высшие учебные заведения для профориентации и навигации абитуриентов стремятся разрабатывать, внедрять и использовать цифровые сервисы. Так, команда из УрФУ разработала свой сервис для профориентации и навигации абитуриентов -«Визард».

Надо отметить, что сам процесс разработки и внедрения цифровых сервисов, а особенно с использованием технологий искусственного интеллекта, является достаточно ресурсоемким, в связи с чем в настоящее время в Российской Федерации практически отсутствуют примеры использования цифровых ресурсов, применяемых для профориентации и навигации абитуриентов. В качестве такого примера можно назвать математическую модель, предназначенную для выявления способностей людей к научной деятельности, описанную Л.Н. Ясницким с соавторами. В основе модели лежит нейронная сеть, обученная на психологических, социологических, биологических и биографических данных некоторых выдающихся ученых ХУШ-ХХ вв. Авторы отмечают, что компьютерная программа, реализующая разработанную математическую модель, может быть использована как ин-

струмент психофизиологической диагностики и профориентации [7]. К недостаткам подобной модели можно отнести то, что современного молодого ученого сравнивают с учеными из других поколений и стран, а также то, что вносимых для подсчета данных нейросети недостаточно для того, чтобы составить достоверную профориентационную модель или осуществить психофизиологическую диагностику.

Единственным прямым конкурентом разработанного нами сервиса «Визард» является разработка Томского государственного университета «Робот-профориентатор», представленная в соцсети «ВКон-такте» как приложение. (адрес:

https://vk.com/app6877638; разработчики:

https://vk.com/ career.assistance). Ключевое отличие сервиса «Визард» от «Робота-профориентатора» состоит в работе алгоритма. Так, «Робот-профориен-татор» определяет психотип по методологии MBTI и строит рекомендации по выбору профессии, исходя из психотипа абитуриента. А «Визард» сопоставляет данные профиля абитуриента в социальной сети «ВКонтакте» и обобщенные данные студентов Уральского федерального университета, успешно обучающихся на одной из 138 образовательных программ, и рекомендует конкретную образовательную программу вуза.

Также косвенными конкурентами сервиса «Визард» являются различные профориентационные и карьерные консультации, которые проводятся лично или онлайн.

С точки зрения международных конкурентов после скандала с Cambridge Analytics развитие данных сервисов за рубежом приостановилось, тем не менее можно отметить сервис анализа (см.: https://applymagicsauce.com/), представляющий собой разработку Кембриджского центра психометрии и позволяющий определить не только личностные черты, но и профессиональные склонности; однако к недостаткам данного сервиса можно отнести то, что он ориентирован на работу с сетями Twitter и Facebook, а не с самой популярной в России сетью - Вконтакте.

Целью данной работы является описание опыта внедрения собственного программного продукта по профориентации и навигации абитуриентов. Для достижения поставленной цели потребовалось решить задачи как в области IT-решения, так и социологии. Со стороны IT перед нами стояли задачи: во-первых, дать описание основных методов, на которых может строиться работа программного продукта по профориентации и навигации абитуриентов; во-вторых, описать алгоритм работы разработанного нами программного продукта; в-третьих, представить основные результаты тестового этапа его работы. Со стороны социологии требовалось описать социально-демографический портрета пользователя профориен-тационного программного продукта.

Описание методов работы нейронных сетей по профориентации и навигации абитуриентов. Отметим, что под искусственным интеллектом мы понимаем свойство интеллектуальных систем к творческим работам, установлению сложных причинно-след-

ственных связей. Такая творческая работа становится возможной благодаря нейросетям.

Первоочередной задачей для осуществления верной профориентации абитуриентов является получение максимально полной, быстрой и объективной информации о самом абитуриенте, его интересах и ожиданиях. В настоящее время одним из основных источников информации об абитуриентах являются социальные сети, которые во многом становятся цифровыми двойниками реальных социальных объектов. В связи с этим изучение контентных интересов пользователей социальных сетей является весьма приоритетной задачей. Данные об интересах пользователей активно используются исследователями и маркетологами из различных областей. Интересы пользователей служат основанием для персональных рекомендаций, а также используются для решения образовательных задач, обеспечения информационной безопасности и в иных областях.

Существуют различные методы и алгоритмы извлечения и дальнейшего анализа контентных интересов пользователей социальных сетей, и все их можно разделить на три группы:

1. Метод идентификации интересов пользователей социальных сетей на основе анализа их профиля.

Профиль пользователя социальной сети содержит информацию, явно предоставленную им самим. Очень часто в процессе заполнения личной информации пользователи ссылаются на свои профили в других социальных сетях. Исследования показывают, что пользователи имеют сходство в данных профиля в разных социальных сетях, т.е. в таких данных наблюдается сходство [8]. Как следствие, исследователи используют данные профиля или нескольких профилей для проведения исследований.

Один из возможных алгоритмов анализа по данному методу (для социальной сети «ВКонтакте») выглядит следующим образом:

1) посредством API-интерфейса социальной сети (например, ВКонтакте) с помощью методов users.search и итеративного перебора по интересам отбираются и загружаются профили (заполнившие свои интересы и имеющие открытый профиль);

2) полученный список ID опрашивается с помощью метода users.get (с использованием дополнительного параметра вывода - personal);

3) собранные данные обрабатываются с помощью статистических программ и приемов;

4) данные анализируются исследователем исходя из поставленных целей и задач [9].

Отметим, что метод идентификации интересов пользователей социальных сетей на основе анализа их профиля является наиболее изученным, его общий алгоритм хорошо известен и отработан. Но для каждой социальной сети и используемого языка имеются свои небольшие нюансы и особенности работы.

К основным недостаткам данного метода относится невозможность получение информации об интересах пользователя из закрытых аккаунтов, а также намеренное искажение информации пользователем в своем профиле социальной сети [10].

Именно поэтому стали развиваться альтернативные методы.

2. Метод идентификации интересов пользователей социальных сетей на основе анализа их дружественных связей.

Данный метод основывается на том, что социальное окружение пользователя и его социальная среда в целом дают достаточно точное представление об интересах пользователя социальной сети. Эта гипотеза была доказана в контексте поиска профилей пользователей в социальных сетях, а также определения интересов пользователей по их окружению [11]. Связь пользователей может быть как явной (дружеские отношения), так и неявной (например, пользователи, которые взаимодействуют на одном ресурсе, пользователи, разделяющие общие интересы). Сегодня дружественные связи также анализируют с целью сбора недостающих данных о пользователе или группе пользователей [12].

Идентификация пользователя на основе информации о дружественных связях относится к методам, в которых дружеские отношения между пользователями рассматриваются как эквивалентные топологии сети, что позволяет выполнять сопоставление сходства между узлами. Топология сети, сформированная пользователями, имеет определенное сходство в разных социальных сетях.

Существуют различные алгоритмы, позволяющие идентифицировать интересы пользователей по их дружеским контактам; так, например, известен алгоритм идентификации пользователей на основе дружеских отношений без предварительного знания (FRUI-P). FRUI-P сначала извлекает функцию «друг» каждого пользователя, а затем вычисляет сходство всех потенциальных идентичных пользователей между двумя SNS. То есть алгоритм извлекает характеристики друзей каждой учетной записи в социальной сети в виде вектора характеристик, а затем вычисляет сходство между всеми потенциальными пользователями. Наконец, разрабатывается индивидуальная схема карты для идентификации пользователей на основе сходства и их интересы. Эффективность FRUI-P доказана и апробирована [13].

3. Метод идентификации интересов пользователя на основе контента.

Под контентом понимается все многообразие содержания странички пользователя - от картинок до текстов и тегов. То есть контент может быть любого типа (URL-адреса, видео, изображения, и т.д.). Анализируя как отдельные элементы контента, так и несколько элементов в комплексе, мы можем получить достаточно полное представление о пользователе и его интересах. Интересы выводятся на основе объектов/ресурсов, к которым обращается пользователь.

У данного метода или, вернее, группы методов имеется достаточно много алгоритмов реализации. Так, например, Y. Sha и соавторы [14] предложили анализировать статусы и комментарии, размещенные пользователями, для идентификации пользователей и изучения их интересов. R. Roedler с соавторами [15] применили информацию о геометках, сгенери-

рованную мобильными устройствами, для построения персонализированной модели социального поведения, определения приоритетов через места посещений. R.W. White и соавторы [16] предложили изучать интересы исходя из данных о посещении пользователями определенных ресурсах и времени, проведенном на этих ресурсах, страницах. А.М. Mezghani и соавторы [17] предложили анализировать интересы по тегам.

Для анализа содержимого профиля существуют различные алгоритмы и методики, такие как индексация, которая используется для извлечения значимых терминов из профиля. После индексации профиля к нему может быть применена другая функция, например, оценки терминов и их отнесение к сферам интересов. Точность запроса (относительно профиля и терминов) может быть оценена с помощью различных функций оценки, применяемых при поиске информации, таких как TF*IDF, BM25 и т.д. Эти оценки являются результатом процесса индексирования, который вызывает запрос и набор ресурсов. Использование этих методик показало их полезность и надежность при поиске информации.

В целом методы, ориентированные на ресурсы, достаточно надежны из-за достаточно богатой информации, содержащейся в ресурсах. Наиболее же надежным считается комплексный метод, т.е. использующий комбинацию из нескольких описанных выше методов и алгоритмов.

Описание применяемого алгоритма. При разработке нашей методики (программа Wizard) были выгружены следующие типы данных:

- социально-демографическая информация;

- жизненные ценности;

- информация о подписках;

- обобщенные данные других студентов вуза, обучающихся на специальностях.

Таким образом, анализировались контент, профиль и связи пользователей социальной сети. За счет сочетания данных методик мы достигли более высокой точности и надежности предоставляемых результатов. Таким образом, для выгрузки данных об интересах (выраженных в подписках на интересующие пользователя страницы) был использован метод (см.: https: https://vk. com/dev/users.getSubscriptions).

Если рассматривать проделанную работу в виде технологических этапов, то на первом этапе пользователь вводил данные о своей учетной записи в программу Wizard. На втором этапе на основании методов машинного обучения устанавливается сфера интересов данного пользователя социальной сети. Отметим, что на тестовых испытаниях алгоритмов классификации лучше всего себя показал алгоритм на основе логистической регрессии. Именно он был задействован в качестве основного в машинном обучении. На третьем этапе соотносились интересы пользователя и информация об уже обучающихся по программам вуза студентах (их интересах), а также обобщенные данные о программах обучения в УрФУ. На основании максимального совпадения выдаются рекомендации о приоритет-

ных специальностях для поступления. Отметим, что в основе алгоритма машинного обучения, выполняющего распределение профилей пользователей по списку образовательных программ вуза, лежит доказанная возможность использования перечня подписок пользователя Вконтакте для формирования вектора его интересов, а данные об интересах в социальных сетях могут быть использованы для оценки и профессионального ориентирования студентов разных направлений подготовки. Для обучения нейронной сети используются данные конкретного вуза, включающие обезличенный список студентов, с разбивкой по образовательным программам.

Таким образом, анализ цифровых следов абитуриентов в социальной сети «ВКонтакте» с помощью алгоритма машинного обучения позволяет выявить жизненные ценности, образовательные интересы и индивидуальные психологические особенности пользователя и рекомендовать подходящее ему направление подготовки конкретного вуза. Система профессиональной ориентации основана на сопоставлении данных профиля в социальной сети «ВКонтакте» и обобщенных данных студентов вуза, успешно обучающихся на одной из образовательных программ.

Результаты исследования и обсуждение. Анализ статистики рекомендаций образовательных программ абитуриентам УрФУ посредством веб-приложения Wizard УрФУ (https://wizard.urfu.ru/) проводился с помощью интернет-сервиса «Яндекс. Метрика». «Яндекс. Метрика» - это бесплатный интернет-сервис компании «Яндекс», предназначенный для оценки посещаемости веб-сайтов и анализа поведения пользователей. Отметим, что на данный момент «Яндекс. Метрика» является третьей по размеру системой веб-аналитики в Европе.

Проведенный анализ показывает, что за все время работы сервиса (с 1 июля 2021 г. по 25 ноября 2021 г.) сервис посетило 47 672 потенциальных абитуриента УрФУ. Считаем, что низкие объемы трафика веб-приложения связаны с достаточно поздним сроком введения сервиса в эксплуатацию. Приемная кампания уже проходила, и самые активные абитуриенты определились с приоритетными образовательными программами. Тем не менее введение в эксплуатацию сервиса помогло осуществить его тестовый запуск в полном объеме.

Основными источниками посещений стали: переходы из поисковых систем (31,1%), переходы по прямым ссылкам с сайтов (30,9%), переходы из социальных сетей (27,3%). Такие источники посещений, как прямые заходы (почти 10%), реклама (0,66%), показали гораздо меньшую эффективность.

Полученные данные будут использованы для выбора каналов продвижения веб-приложения. Именно поэтому нас интересует конкретика в источниках посещений.

Если говорить о социальных сетях, то самыми результативными оказались «ВКонтакте» (49,9%), Insta-gram (25,3%) и Fasebook (24,7%). Наименее результа-

тивной оказалась социальная сеть «Одноклассники» (всего 0,04%).

Если рассматривать статистику внешних посещений, то самым результативным оказался сайт приемной кампании УрФУ (42,2%), в остальном достаточно хороший результат дали другие станочки портала УрФУ и новостные страницы.

Что касается типа электронного устройства, с которого осуществлялись переходы, то здесь статистика выглядит следующим образом: главным типом электронного устройства являются персональные компьютеры (57,8%), на втором месте оказались смартфоны (38,2%).

Поскольку смартфоны, как и персональные компьютеры, являются весьма популярными источниками, с которых осуществляется посещение веб-приложения, то целесообразно поддерживать версию Wizard УрФУ для мобильных устройств.

Основная возрастная группа посетителей веб-приложения - это абитуриенты в возрасте от 18 до 24 лет (44,8%). Доля пользователей в возрасте до 18 лет составила 25,7%, от 25 до 34 лет - 11,1%, от 35 до 44 лет - 8,9%, от 45 до 54 лет - 4,7%, и доля остальных составила 4,8%. Распределение по полу не показало существенных перекосов и соотносится с генеральной совокупностью в целом. Таким образом, мы видим интерес к нашему приложению среди абитуриентов, их родителей, а также учеников школ. То, что активными пользователями веб-приложения являются граждане младше 18 лет, говорит о достаточно высоком интересе выпускников к Wizard УрФУ и вопросу выбора ОП на будущее.

На основании данных о регионах и городах, из которых осуществлялось посещение веб-приложения, можно констатировать, что Wizard УрФУ вызывает интерес и отклик не только у абитуриентов Свердловской области, но и из других, в первую очередь близлежащих регионов, таких как Челябинская область (18,1%), Москва и Московская область (9,72%), Тюменская область (5,92%) и др. Как следствие можно констатировать, что Wizard УрФУ является достаточно эффективным инструментом продвижения бренда и ОП УрФУ в других регионах страны.

Таким образом, социально-демографический портрет пользователя программного продукта Wizard УрФУ можно описать как молодого человека или молодую девушку преимущественно в возрасте от 18 до 24 лет из города Екатеринбурга либо Свердловской области. Данное описание полностью совпадает с основной целевой аудиторией Уральского федерального университета.

Также нами была выгружена статистика выданных рекомендаций абитуриентам по направлениям образовательных программ. Так, с 01.07.2021 по 01.12.2021 веб-приложением было выдано 32 214 рекомендаций абитуриенту. В каждой рекомендации выдавалось шесть образовательных программ, максимально подходящих абитуриенту, исходя из данных работы алгоритма искусственного интеллекта и результатов профориентационного те-

ста. Таким образом, каждая их образовательных программ могла быть рекомендована веб-приложением значительное число раз, и общий объем всех рекомендованных/показанных ОП составил 193 284 рекомендации.

На основании выдаваемых абитуриентам рекомендаций были составлены ТОПы. Для упрощения процесса визуализации было проведено отсеивание непопулярных программ за счет того, что для построения ТОПа общих рекомендаций отбирались только те ОП, по которым было выдано более 1 000 рекомендаций, а для ТОПов рекомендаций первого, второго и третьего мест - более 500 рекомендаций соответственно. Проценты распределялись между этими программами.

Общий ТОП первой десятки рекомендованных направлений выглядит следующим образом:

1. Информационная безопасность - 9%.

2. Радиотехника - 8%.

3. Электроника радиотехника и системы связи - 8%.

4. Математическое обеспечение и администрирование информационных систем - 8%.

5. Сервис - 7%.

6. История - 7%;

7. Мировая экономика и международный бизнес - 6%.

8. Международный и корпоративный менеджмент - 6%.

9. Электроника и автоматика физических установок - 6%.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Физическая культура - 5%.

Также посчитали эффект работы Wizard УрФУ в виде конверсии. Отметим, что под Конверсий веб-приложения понимается отношение числа посетителей веб-приложения, выполнивших в нем какие-либо целевые действия, к общему числу посетителей веб-приложения, выраженному в процентах. В данном случае наиболее важными являются конверсии конкретных совершенных действий абитуриентами такие как: подача документов и переход на сайты рекомендованных образовательных программ для более детального ознакомления с ними.

Так, кнопку подать документы непосредственно со стартовой страницы нажали 8,14% посетителей сайта (или 3 880 человек). После получения рекомендаций кнопку подать документы нажали 18,67% посетителей веб-приложения (или 8 900 человек). При этом пик активности подачи документов приходился на июль месяц. Таким образом, благодаря веб-приложению перешли к подаче документов 12 780 потенциальных абитуриента УрФУ. А дополнительно совершили переход в социальные сети институтов и образовательных программ, для более детального ознакомления с ними еще 32,08% или 15 293 абитуриента.

Заключение. Веб-приложение Wizard УрФУ за время работы показало высокий потенциал, как один из инструментов проведения приемной кампании. Также были доказаны качество и надежность выбранных алгоритмов работы. Проведенные теоретические и практические исследования методов и алгоритмов анализа контентных интересов пользователей соци-

альных сетей показали, что используемый в веб-приложении Wizard УрФУ комплексный метод является одним из наиболее надежных, с максимальными показателями эффективности.

Целевая аудитория посетителей веб-приложения полностью совпадает с типичным портретом абитуриента УрФУ. Именно поэтому веб-приложение Wizard УрФУ является чрезвычайно востребованным и актуальным для абитуриентов, особенно в период проведения приемной кампании. Благодаря веб-приложению перешли к подаче документов 12 780 потенциальных абитуриента УрФУ. А дополнительно совершили переход в социальные сети институтов и образовательных программ, для более детального ознакомления с ними еще 32,08% или 15 293 абитуриента.

В свою очередь анализ статистики итогов приемной компании показал, что все образовательные программы, которые попали в ТОП рекомендованных направлений имели существенный прирост абитуриентов по сравнению с предыдущими годами. В целом Уральский федеральный университет в 2021 г. провел самую массовую приемную компанию среди высших учебных заведений в Российской Федерации.

По нашему мнению, использование сервисов, основанных на работе искусственного интеллекта для профориентации и навигации абитуриентов высшего учебного заведения, позволяет успешно решать стоящие перед университетами задачи, а именно:

- расширить географию приема без проведения очных встреч с абитуриентами;

- увеличить охват рекламной кампании и персонализировать рекламные предложения;

- привлечь креативную и мотивированную молодежь;

- помогать абитуриенту сделать правильный выбор направления подготовки и тем самым увеличить его мотивацию к учебе.

С точки зрения управления и принятия управленческих решений в образовании использование цифровых сервисов в высших учебных заведениях способствует более естественному и привычному способу работы и восприятия информации людей поколения Z, а также созданию и удержанию имиджа образовательного учреждения.

Как показали исследования коллег из Томского государственного университета по гранту «Исследование потенциала социальных сетей для выявления, привлечения и закрепления талантливой молодежи в региональных вузах на основе анализа больших данных» (номер гранта № 17-16-70-004), использование данных социальных сетей и инструментов профориентации на их основе позволяет добиться таких характеристик, как повышение среднего балла на 8% в первый год обучения, снижение отчисляемости на 50% в первый год обучения, уменьшение доли студентов со средним баллом, близким к 3,0, на 36% в сравнении со студентами, привлеченными и профори-ентированными иным способом.

Главной возможностью, предоставляемой предлагаемым сервисом, является масштабирование, поскольку классические методики имеют множество

ограничений, препятствующих их эффективному масштабированию.

Одним из трендов образования будущего является персонализация, реализуемая через возможность построение индивидуальной траектории образования. Модель образования будущего опирается на новый (желательный) тип обучающегося - «самоуправляемого ученика», его осознанный, самостоятельный и ответственный выбор направления своего образования [4]. И первым шагом на этом пути становится правильная профориентация, которую возможно упростить посредством применения современных цифровых технологий в образовании.

Сегодня, по мнению Е. Бабкина [8, 19], в области разработки моделей принятия решений на основе нейронных сетей, а также в исследовании социальных явлений и процессов коммуникации в сети Интернет накоплен положительный опыт, который может быть востребован для разработки математических моделей и алгоритмов генерации профориентационных рекомендаций на основе искусственных нейронных сетей.

Уже создан новый класс прогностических моделей, адаптированных к условиям принятия решений в ситуации профессионального выбора.

Эффективные сервисы, основанные на искусственном интеллекте, предназначенные для профориентации и навигации абитуриентов высшего учебного заведения, должны строиться на комплексных методах работы нейронных сетей. Цифровые технологии должны быть включены в целостный процесс профориентации, навигации и сопровождения абитуриентов, уже имеющейся в высшем учебном заведении.

Считаем, что представленный нами опыт создания и применения сервиса Wizard, основанный на искусственном интеллекте и предназначенный для профориентации и навигации абитуриентов и студентов университета при выборе образовательной программы и индивидуальной образовательной траектории, будет интересен и полезен как для управленцев, так и разработчиков программного обеспечения.

Список источников

1. Комаров Р.В., Шаповалов И.В. Тренды, тенденции и модели развития профориентации // Вестник Московского городского педагогиче-

ского университета. Серия: Педагогика и психология. 2018. № 2(44). С. 18-30.

2. Цифровая среда ведущих университетов мира и РФ: результаты сравнительного анализа данных сайтов / Е.В. Бродовская, А.Ю. Дом-

бровская, Т.Э. Петрова [и др.] // Высшее образование в России. 2019. Т. 28, № 12. С. 9-22. doi: 10.31992/0869-3617-2019-28-12-9-22

3. Степанова Л. Н. Предикторы специфики познавательного и личностного развития представителей цифрового поколения // Вопросы педа-

гогики. 2021. № 11-1. С. 406-409.

4. Зинина С. М. Цифровые технологии как средство профессионального выбора: будущее и настоящее // Актуальные проблемы педагогики

и психологии. 2020. Т. 1, № 3. С. 38-49.

5. Ануфриева Е.В., Ефимов Е.Г., Овчар Н.А., Небыков И.А. Модели поведения абитуриентов в условиях пандемии (на материале фокус-

групп) // Вестник педагогических наук. 2021. № 5. С. 40-45.

6. Вихман В.В., Ромм М.В. «Цифровые двойники» в образовании: перспективы и реальность // Высшее образование в России. 2021. Т. 30,

№ 2. С. 22-32. doi: 10.31992/0869-3617-2021-30-2-22-32

7. Ясницкий Л.Н., Байдин Д.Ю., Макурина Т.В., Черепанов Ф.М. Возможности выявления способности людей к научной деятельности

методами искусственного интеллекта // Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века : сб. ст. по материалам Всерос. науч.-практ. конф., г. Пермь, 18-19 мая 2016 года. Пермь : Перм. гос. нац. исслед. ун-т, 2016. С. 193-200.

8. Li Y.J., Peng Y., Ji W.L., Zhang Z., Xu Q.Q. User identification based on the display name across online social network sites // IEEE Access.

2017. Vol. 5. P. 17342-17353.

9. Забокрицкая Л.Д., Хлебников Н.А., Орешкина Т.А., Комоцкий Е.И. Возможности изучения ценностей молодежи через профиль социаль-

ной сети «Вконтакте» // Мониторинг общественного мнения: экономические и социальные перемены. 2020. № 2 (156). С. 148-167. doi: 10.14515/monitoring.2020.2.692

10. Zhou X.P., Liang X., Zhang H.Y., Ma Y.F. Cross-platform identification of anonymous identical users in multiple social media networks // IEEE Transactions on Knowledge and Data Engineering. 2016. Vol. 28. P. 411-424.

11. Tchuente D., Canut M.-F., Jessel N., Peninou A., Sedes F. A community-based algorithm for deriving users' profiles from egocentrics networks: experiment on Facebook and DBLP // Social Network Analysis and Mining. 2013. Vol. 3. P. 667-683

12. Кавеева А.Д., Гурин К.Е. Локальные сети дружбы «ВКонтакте»: восстановление пропущенных данных о городе проживания пользователей // Мониторинг общественного мнения: Экономические и социальные перемены. 2018. № 3. С. 78-90. doi: 10.14515/monitoring.2018.3.05

13. Zhou X., Liang X., Du X., Zhao J. Structure Based User Identification across Social Networks // IEEE Transactions on Knowledge and Data Engineering. 2018. Vol. 30. P. 1178-1191.

14. Sha Y., Liang Q., Zheng K.J. Matching user accounts across social networks based on users message // Procedia Computer Science. 2016. Vol. 80. P. 2423-2427.

15. Roedler R., Kergl D., Rodosek G.D. Profile matching across online social networks based on geo-tag // Advances in Nature and Biologically Inspired Computing. 2016. Vol. 419. P. 417-428.

16. White R.W., Bailey P., Chen L. Predicting user interests from contextual information // Proceedings of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval, SIGIR '09. New York, NY, USA, 2009. P. 363-370. doi: 10.1145/1571941.1572005

17. Mezghani M., Peninou A., Zayani C.A., Amous I., Sedes F. Producing relevant interests from social networks by mining users' tagging behaviour: A first step towards adapting social information // Data & Knowledge Engineering. 2017. Vol. 108. P. 15-29. doi: 10.1016/j.datak.2016.12.003

18. Babkin E., Babkina T., Demidovskij А. Hybrid neural network and bi-criteria tabu-machine: comparison of new approaches to maximum clique problem // Big Data Intelligence. 2018. Vol. 5, № 3. URL: https://publications.hse.ru/articles/225135427

19. Babkin E., Demidovskij A. Developing a distributed linguistic decision making system // Business Informatics. 2019. Vol. 13, № 1. P. 18-32. URL: https://bijournal.hse.ru/en/2019--1%20Vol.13/269673867.html

References

1. Komarov, R.V. & Shapovalov, I.V. (2018) Trendy, tendentsii i modeli razvitiya proforientatsii [Trends, tendencies and models of career guidance

development]. VestnikMoskovskogo gorodskogopedagogicheskogo universiteta. Seriya: Pedagogika i psikhologiya. 2(44). pp. 18-30.

2. Brodovskaya, E.V. et al. (2019) Tsifrovaya sreda vedushchikh universitetov mira i RF: rezul'taty sravnitel'nogo analiza dannykh saytov [Digital

environment of the leading universities of the world and the Russian Federation: results of a comparative analysis of site data]. Vysshee obrazovanie v Rossii. 12 (28). pp. 9-2 2. doi: 10.31992/0869-3617-2019-28-12-9-22

3. Stepanova, L.N. (2021) Prediktory spetsifiki poznavatel'nogo i lichnostnogo razvitiya predstaviteley tsifrovogo pokoleniya [Predictors of the

specifics of cognitive and personal development of representatives of the digital generation]. Voprosy pedagogiki. 11-1. pp. 406-409.

4. Zinina, S.M. (2020) Tsifrovye tekhnologii kak sredstvo professional'nogo vybora: budushchee i nastoyashchee [Digital technologies as a means of

professional choice: the future and the presen]. Aktual'nyeproblemypedagogiki ipsikhologii. 3 (1). pp. 38-49.

5. Anufrieva, E.V. et al. (2021) Modeli povedeniya abiturientov v usloviyakh pandemii (na materiale fokus-grupp) [Models of Applicants' Behavior

in a Pandemic (on the Material of Focus Groups)]. Vestnikpedagogicheskikh nauk. 5. pp. 40-45.

6. Vikhman, V.V. & Romm, M.V. (2021) "Tsifrovye dvoyniki" v obrazovanii: perspektivy i real'nost' ["Digital Twins" in Education: Prospects and

Reality]. Vysshee obrazovanie v Rossii. 2 (30). pp. 22-32. doi: 10.31992/0869-3617-2021-30-2-22-32

7. Yasnitskiy, L.N. et al. (2016) [Possibilities of identifying the ability of people to scientific activity by artificial intelligence methods]. Iskusstvennyy

intellekt v reshenii aktual'nykh sotsial'nykh i ekonomicheskikh problem XXI veka [Artificial Intelligence in Solving Actual Social and Economic Problems of the 21st Century]. Proceedings of the All-Russian Conference. Perm. 18-19 May 2016. Perm: Perm State University. pp. 193-200. (In Russian).

8. Li, Y.J. et al. (2017) User identification based on the display name across online social network sites. IEEE Access. 5. pp. 17342-17353.

9. Zabokritskaya, L.D. et al. (2020) Vozmozhnosti izucheniya tsennostey molodezhi cherez profil' sotsial'noy seti "Vkontakte" [Opportunities to

study the values of young people through the profile of the social network "Vkontakte"]. Monitoring obshchestvennogo mneniya: ekonomicheskie i sotsial'nyeperemeny. 2 (156). pp. 148-167. doi: 10.14515/monitoring.2020.2.692

10. Zhou, X.P. et al. (2016) Cross-platform identification of anonymous identical users in multiple social media networks. IEEE Transactions on Knowledge and Data Engineering. 28. pp. 411-424.

11. Tchuente, D. et al. (2013) A community-based algorithm for deriving users' profiles from egocentrics networks: experiment on Facebook and DBLP. Social Network Analysis and Mining. 3. pp. 667-683.

12. Kaveeva, A.D. & Gurin, K.E. (2018) Lokal'nye seti druzhby "VKontakte": vosstanovlenie propushchennykh dannykh o gorode prozhivaniya pol'zovateley [Local friendship networks "VKontakte": recovery of missing data about the city of residence of users]. Monitoring obshchestvennogo mneniya: Ekonomicheskie i sotsial'nye peremeny. 3. pp. 78-90. doi: 10.14515/monitoring.2018.3.05

13. Zhou, X. et al. (2018) Structure Based User Identification across Social Networks. IEEE Transactions on Knowledge and Data Engineering. 30. pp. 1178-1191.

14. Sha, Y., Liang, Q. & Zheng, K.J. (2016) Matching user accounts across social networks based on users message. Procedia Computer Science. 80. pp. 2423-2427.

15. Roedler, R., Kergl, D. & Rodosek, G.D. (2016) Profile matching across online social networks based on geo-tag. Advances in Nature and Biologically Inspired Computing. 419. pp. 417-428.

16. White, R.W., Bailey, P. & Chen, L. (2009) [Predicting user interests from contextual information]. SIGIR '09. Proceedings of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval. Boston, MA. 19-23 July 2009. New York: Association for Computing Machinery. pp. 363-370. doi: 10.1145/1571941.1572005

17. Mezghani, M. et al. (2017) Producing relevant interests from social networks by mining users' tagging behaviour: A first step towards adapting social information. Data & Knowledge Engineering. 108. pp. 15-29. doi: 10.1016/j.datak.2016.12.003

18. Babkin, E., Babkina, T. & Demidovskij, A. (2018) Hybrid neural network and bi-criteria tabu-machine: comparison of new approaches to maximum clique problem. Big Data Intelligence. 3 (5). [Online] Available from: https://publications.hse.ru/articles/225135427.

19. Babkin, E. & Demidovskij, A. (2019) Developing a distributed linguistic decision making system. Business Informatics. 1 (13). pp. 18-32. [Online] Available from: https://bijournal.hse.ru/en/2019--1%20Vol.13/269673867.html.

Информация об авторах:

Забокрицкая Л.Д. - канд. социол. наук, доцент кафедры социологии и технологий государственного и муниципального управления Уральского федерального университета имени первого Президента России Б.Н. Ельцина (Екатеринбург, Россия). E-mail: zabokritskaya@urfu.ru

Орешкина Т.А. - канд. социол. наук, доцент кафедры социологии и технологий государственного и муниципального управления, первый заместитель директора Института фундаментального образования Уральского федерального университета имени первого Президента России Б.Н. Ельцина (Екатеринбург, Россия). E-mail: t.a.oreshkina@urfu.ru Обабков И.Н. - канд. техн. наук, доцент, зав. кафедрой интеллектуальных информационных технологий, директор Института радиоэлектроники и информационных технологий Уральского федерального университета имени первого Президента России Б.Н. Ельцина (Екатеринбург, Россия). E-mail: I.N.Obabkov@urfu.ru

Чепуров Е.Г. - зав. учебной лабораторией робототехники и автоматизированных систем управления технологических процессов Уральского федерального университета имени первого Президента России Б.Н. Ельцина (Екатеринбург, Россия). E-mail: evgeny.chepurov@urfu.ru

Авторы заявляют об отсутствии конфликта интересов. Information about the authors:

L.D. Zabokritskaya, Cand. Sci. (Sociology), associate professor, Ural Federal University (Yekaterinburg, Russian Federation). Email: zabokritskaya@urfu.ru

T.A. Oreshkina, Cand. Sci. (Sociology), associate professor, first deputy director of the Institute for Fundamental Education, Ural Federal University (Yekaterinburg, Russian Federation). E-mail: t.a.oreshkina@urfu.ru

I.N. Obabkov, Cand. Sci. (Engineering), docent, head of the Intelligent Information Technologies Department; director of the Engineering School of Information Technologies, Telecommunications and Control Systems; Ural Federal University (Yekaterinburg, Russian Federation). E-mail: I.N.Obabkov@urfu.ru

E.G. Chepurov, head, Laboratory of Robotic Engineering and Automated Industrial Process Control Systems, Ural Federal University (Yekaterinburg, Russian Federation). E-mail: evgeny.chepurov@urfu.ru

The authors declare no conflicts of interests.

Статья поступила в редакцию 25.05.2022; одобрена после рецензирования 12.12.2022; принята к публикации 30.12.2022.

The article was submitted 25.05.2022; approved after reviewing 12.12.2022; accepted for publication 30.12.2022.

i Надоели баннеры? Вы всегда можете отключить рекламу.