Научная статья на тему 'КЛАССИФИКАЦИЯ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ ПО ПРОФЕССИОНАЛЬНОЙ ОРИЕНТАЦИИ'

КЛАССИФИКАЦИЯ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ ПО ПРОФЕССИОНАЛЬНОЙ ОРИЕНТАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
56
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ / АЛГОРИТМЫ КЛАССИФИКАЦИИ / ПРОФОРИЕНТОЛОГИЯ / СОЦИАЛЬНЫЕ СЕТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Обрубова Василиса Денисовна, Озерова Марина Игоревна

В статье рассматривается комплексная постановка темы классификации пользователей социальных сетей для определения профессиональной ориентации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Обрубова Василиса Денисовна, Озерова Марина Игоревна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SOCIAL NETWORKS USER CLASSIFICATION FOR PROFESSIONAL ORIENTATION

The article deals with a complex formulation of the topic social networks users classification to determine professional orientation.

Текст научной работы на тему «КЛАССИФИКАЦИЯ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ ПО ПРОФЕССИОНАЛЬНОЙ ОРИЕНТАЦИИ»

Список литературы: Annual Reviews in Control. — 2019. — Vol. 14. — P.

1. Dozat, T. Incorporating Nesterov Momentum 200-230.

into Adam / T. Dozat // ICLR Workshop. — 2016. 3. Kingma, D. Adam: A Method for Stochastic

2. Dupond, S. A thorough review on the current Optimization / D. Kingma, J. Ba // ICLR. — 2014. advance of neural network structures / S. Dupond //

КЛАССИФИКАЦИЯ ПОЛЬЗОВАТЕЛЕЙ СОЦИАЛЬНЫХ СЕТЕЙ ПО ПРОФЕССИОНАЛЬНОЙ ОРИЕНТАЦИИ

Обрубова Василиса Денисовна

Магистрант 2 курса кафедры информационных систем и программной инженерии "Владимирский государственный университет имени Александра Григорьевича и Николая

Григорьевича Столетовых" (ВлГУ), город Владимир Озерова Марина Игоревна кандидат технических наук, доцент "Владимирский государственный университет имени Александра Григорьевича и Николая

Григорьевича Столетовых" (ВлГУ), город Владимир

SOCIAL NETWORKS USER CLASSIFICATION FOR PROFESSIONAL ORIENTATION

Obrubova Vasilisa Denisovna

2nd year master's student of the Department of Information Systems and Software Engineering "Vladimir State University named after Alexander Grigorievich and Nikolai Grigorievich Stoletovs"

(VlSU), Vladimir

Ozerova Marina Igorevna

candidate of technical sciences, associate professor "Vladimir State University named after Alexander Grigorievich and Nikolai Grigorievich Stoletovs"

(VlSU), Vladimir

DOI: 10.31618/nas.2413-5291.2021.2.68.451

АННОТАЦИЯ

В статье рассматривается комплексная постановка темы классификации пользователей социальных сетей для определения профессиональной ориентации.

ABSTRACT

The article deals with a complex formulation of the topic social networks users classification to determine professional orientation.

Ключевые слова: классификация; алгоритмы классификации; профориентология; социальные сети. Keywords: classification; classification algorithms; vocational guidance; social networks.

Предметная область по данной теме находится профориентология. Второе направление - это

на стыке трех направлений (рисунок 1). Первое исследование социальных сетей. И третье

направление - это профессиональное направление - это сам подход по решению, а

ориентирование или так называемая наука именно машинное обучение.

Рисунок 1. Предметная область

Профориентология - это дисциплина, важной применять в психологических, социологических и

частью которой является профессиональное прочих методах профессионального

ориентирование [3]. Данное направление активно ориентирования.

развивается и начинает затрагивать сферу Одним из подходов к обработке информации

социальных сетей, так как именно социальные сети может служить машинное обучение.

содержат в себе неисчерпаемое количество Математическую модель можно представить в

информации о человеке которое можно активно следующем виде:

где CLS - функция-классификатор, ставящая в соответствие профилю и признаку классификации конкретное значение профессии. Каждому профилю и! должно соответствовать множество значений признаков и^ { с^ } [1].

Система признаков для классификации пользователей по социальным сетям ^ имеет следующий вид:

• должность;

• образование;

• год рождения;

• пол;

• языки;

• подписки - страницы на которые подписан пользователь;

• группы - группы на которые подписан пользователь.

Используя данные признаки выполняется обучение классификатора. Для проверки классификаторов предлагается использовать инструмент Weka, который отлично подходит для начала изучения различных алгоритмов и выбора наиболее подходящего, для решения поставленной задачи [2].

В помощь, при выборе классификатора, в Weka есть инструмент Experimenter. Он позволяет выбрать различные алгоритмы на одном и том же наборе данных для оценки модели. Результаты проведения проверки представлены на рисунке 2.

Рисунок 2. Точность оценки алгоритмов классификации

Оцениваемые классификаторы:

• NaiveBayes - метод Байеса;

• BayesNet - Байесовская сеть;

• IBk - k-Ближайшие соседи;

• SMO - машины опорных векторов;

• J48 - дерево решений;

• RandomTree - комитет решающих деревьев;

• Bagging - метаалгоритм композиционного обучения машин, предназначенный для улучшения стабильности и точности алгоритмов машинного обучения;

• MultilayerPerceptron и Dl4jMlpClassifier -искусственные нейронные сети.

В результате проверки заявленных моделей выявлено, что наибольшей точностью, под текущий набор данных, обладает RandomTree. Данная модель подходит по всем критериям. Стоит заметить, что данные для обучения могут изменяться, соответственно стоит предусмотреть гибкую смену алгоритмов.

В данной работе кратко рассмотрены все три направления на стыке которых представлена

заявленная тема, данный подход рассмотрения каждой составляющей в отдельности позволяет изучить предметную область подробно за ограниченное время. Математическая модель представляет нам схему решения задачи, на базе которой выполнено применение распространенных алгоритмов классификации и выбран наиболее точный.

Список литературы

1. Tang B. et al. A Bayesian classification approach using class-specific features for text categorization // IEEE Transactions on Knowledge and Data Engineering. - 2016. - Т. 28. - № 6. - С. 16021606.

2. Weka Wiki - режим доступа: https://waikato.github.io/weka-wiki/

3. Зеер, Э. Ф. Профориентология : теория и практика : учеб. пособие для студентов вузов / Э. Ф. Зеер, А. М. Павлова, Н. О. Садовникова ; Э. Ф. Зеер, А. М. Павлова, Н. О. Садовникова. - Москва : Акад. проект ;, 2006. - (Учебное пособие для высшей школы). - ISBN 5829106841.

i Надоели баннеры? Вы всегда можете отключить рекламу.