Научная статья на тему 'АЛГОРИТМ ПОИСКА СПЕЦИАЛИСТОВ С УНИКАЛЬНЫМИ НАВЫКАМИ НА ОСНОВЕ ЦИФРОВОГО СЛЕДА'

АЛГОРИТМ ПОИСКА СПЕЦИАЛИСТОВ С УНИКАЛЬНЫМИ НАВЫКАМИ НА ОСНОВЕ ЦИФРОВОГО СЛЕДА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
53
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УНИКАЛЬНЫЙ СПЕЦИАЛИСТ / БЛАГОНАДЕЖНОСТЬ / ПРОТИВОРЕЧИВЫЕ ДАННЫЕ / ОБОБЩЕННАЯ ЛИНЕЙНАЯ МОДЕЛЬ / СЕРВИС ПОИСКА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Леонов А.С., Лаптев А.А., Лаушкина А.А., Синько М.В., Басов О.О.

В последние годы из-за значительных изменений на рынке труда компании стали чаще сталкиваться с различными проблемами при поиске и отборе кандидатов. Основной причиной данных проблем является то, что существующие интернет-ресурсы для поиска кандидатов не позволяют найти специалиста с требуемым набором компетенций и полноценно оценить его опыт, навыки, достижения и личностные характеристики. В результате, необходимым становится создание сервиса для поиска эксклюзивных специалистов. Большая часть подобных специалистов не имеют резюме в открытом доступе, не ищут работу, но готовы рассматривать интересные предложения. В результате, данная работа посвящена изучению возможности поиска специалистов с уникальными компетенциями в сети Интернет на основе анализа их цифрового следа. Гипотеза заключается в том, что возможно получить полный профиль уникального специалиста, если собрать, объединить и проанализировать данные из различных источников. В ходе настоящей работы были проанализированы возможности, предоставляемые открытыми источниками данных в сети Интернет, а также определены наукометрические показатели специалиста и параметры его благонадежности. Составлен алгоритм поиска требуемых специалистов на основе этих данных, спроектирована, разработана и протестирована автоматизированная система, реализующая данный поиск.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Леонов А.С., Лаптев А.А., Лаушкина А.А., Синько М.В., Басов О.О.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ALGORITHM FOR FINDING SPECIALISTS WITH UNIQUE SKILLS BASED ON A DIGITAL FOOTPRINT

In recent years, due to significant changes in the labor market, companies have become more likely to face various problems when searching and selecting candidates. The main reason for these problems is that the existing Internet resources for finding candidates do not allow you to find a specialist with the required set of competencies and fully evaluate his experience, skills, achievements and personal characteristics. As a result, it becomes necessary to create a service for finding exclusive specialists. Most of these specialists do not have a resume in the public domain, are not looking for a job, but are ready to consider interesting offers. As a result, this work is devoted to the study of the possibility of finding specialists with unique competencies on the Internet based on the analysis of their digital footprint. The hypothesis is that it is possible to get a complete profile of a unique specialist if you collect, combine and analyze data from various sources. In the course of this work, the possibilities provided by open data sources on the Internet were analyzed, as well as the scientometric indicators of a specialist and the parameters of his reliability were determined. An algorithm for searching for the required specialists based on these data has been compiled, an automated system implementing this search has been designed, developed and tested.

Текст научной работы на тему «АЛГОРИТМ ПОИСКА СПЕЦИАЛИСТОВ С УНИКАЛЬНЫМИ НАВЫКАМИ НА ОСНОВЕ ЦИФРОВОГО СЛЕДА»

DOI: 10.15514/ISPRAS-2022-34(4)-12

Алгоритм поиска специалистов с уникальными навыками на основе цифрового следа

1 А.С. Леонов, ORCID: 0000-0002-7904-182X<alex.thunder@tut.by> 1 А.А. Лаптев, ORCID: 0000-0003-1754-6643 <nickname.avast@gmail.com> 1 А.А. Лаушкина, ORCID: 0000-0001-7887-3299 <nastasjalausckina@mail.ru> 1 М.В. Синько, ORCID: 0000-0001-6075-9594 <michael.v.sinko@gmail.com> 1-2 О.О. Басов, ORCID: 0000-0001-5788-4845 <oobasov@mail.ru> 1 Национальный исследовательский университет ИТМО, 197101, Россия, г. г. Санкт-Петербург, Кронверкский пр., д. 49, лит А 2 Институт системного программирования им. В.П. Иванникова РАН, 109004, Россия, г. Москва, ул. А. Солженицына, д. 25

Аннотация. В последние годы из-за значительных изменений на рынке труда компании стали чаще сталкиваться с различными проблемами при поиске и отборе кандидатов. Основной причиной данных проблем является то, что существующие интернет-ресурсы для поиска кандидатов не позволяют найти специалиста с требуемым набором компетенций и полноценно оценить его опыт, навыки, достижения и личностные характеристики. В результате, необходимым становится создание сервиса для поиска эксклюзивных специалистов. Большая часть подобных специалистов не имеют резюме в открытом доступе, не ищут работу, но готовы рассматривать интересные предложения. В результате, данная работа посвящена изучению возможности поиска специалистов с уникальными компетенциями в сети Интернет на основе анализа их цифрового следа. Гипотеза заключается в том, что возможно получить полный профиль уникального специалиста, если собрать, объединить и проанализировать данные из различных источников. В ходе настоящей работы были проанализированы возможности, предоставляемые открытыми источниками данных в сети Интернет, а также определены наукометрические показатели специалиста и параметры его благонадежности. Составлен алгоритм поиска требуемых специалистов на основе этих данных, спроектирована, разработана и протестирована автоматизированная система, реализующая данный поиск.

Ключевые слова: уникальный специалист; благонадежность; противоречивые данные; обобщенная линейная модель; сервис поиска

Для цитирования: Леонов А.С., Лаптев А.А., Лаушкина А.А., Синько М.В., Басов О.О. Алгоритм поиска специалистов с уникальными навыками на основе цифрового следа. Труды ИСП РАН, том 34, вып. 4, 2022 г., стр. 173-186. DOI: 10.15514/ISPRAS-2022-34(4)-12

Благодарности: Исследование выполнено за счет гранта Российского научного фонда (проект № 2221-00604).

Algorithm for finding specialists with unique skills based on a digital

footprint

1 A.S. Leonov, ORCID: 0000-0002-7904-182X<alex.thunder@tut.by> 1 A.A. Laptev, ORCID: 0000-0003-1754-6643 <nickname.avast@gmail.com> 1 A.A. Laushkina, ORCID: 0000-0001-7887-3299 <nastasjalausckina@mail.ru> 1 M.V. Sinko, ORCID: 0000-0001-6075-9594 <michael.v.sinko@gmail.com> 1,2 O.O. Basov, ORCID: 0000-0001-5788-4845 <oobasov@mail.ru>

1ITMO University, 49-A, Kronverkskiyprospekt, St. Petersburg, 197101, Russia 2 Ivannikov Institute for System Programming of the Russian Academy of Sciences, 25, Alexander Solzhenitsyn st., Moscow, 109004, Russia

Abstract. In recent years, due to significant changes in the labor market, companies have become more likely to face various problems when searching and selecting candidates. The main reason for these problems is that the existing Internet resources for finding candidates do not allow you to find a specialist with the required set of competencies and fully evaluate his experience, skills, achievements and personal characteristics. As a result, it becomes necessary to create a service for finding exclusive specialists. Most of these specialists do not have a resume in the public domain, are not looking for a job, but are ready to consider interesting offers. As a result, this work is devoted to the study of the possibility of finding specialists with unique competencies on the Internet based on the analysis of their digital footprint. The hypothesis is that it is possible to get a complete profile of a unique specialist if you collect, combine and analyze data from various sources. In the course of this work, the possibilities provided by open data sources on the Internet were analyzed, as well as the scientometric indicators of a specialist and the parameters of his reliability were determined. An algorithm for searching for the required specialists based on these data has been compiled, an automated system implementing this search has been designed, developed and tested.

Keywords: unique specialist; trustworthiness; contradictory data; generalized linear model; search service

For citation: Leonov A.S., Laptev A.A., Laushkina A.A., Sinko M.V., Basov O.O. An algorithm for finding specialists with unique skills based on a digital footprint. Trudy ISP RAN/Proc. ISP RAS, vol. 34, issue 4, 2022. pp. 173-186 (in Russian). DOI: 10.15514/ISPRAS-2022-34(4)-12

Acknowledgements. The research was carried out at the expense of a grant from the Russian Science Foundation (project No. 22-21-00604).

1. Введение

В последние годы рынок труда претерпел значительные изменения как со стороны работодателей, так и со стороны соискателей. Компании сталкиваются с различными проблемами при поиске и отборе кандидатов, поскольку существующие интернет-ресурсы не приносят результатов [1]. Часто кандидаты, которые соответствуют запросу работодателя, не заинтересованы в смене места работы, из-за чего их резюме отсутствует в общем доступе. Нестандартные интернет-платформы для поиска работников мало применяются организациями, поскольку данные ресурсы малоизвестны и не включают в себя необходимые требования, такие, как поиск по множеству предметных областей, а также возможность проведения анализа благонадежности кандидата. Сложности подбора специалистов усугубляются высоким процентом миграции выпускников университетов, ученых и исследователей за рубеж (см. рис. 1).

Состояние современной экономики и условия трудового рынка создают несоответствие между требованиями работодателей и того, что могут предложить существующие ресурсы по поиску работников. Данные сервисы по большей части ориентированы на поиск работников, не менявших свою сферу деятельности и имеющих лишь одну специальность.

} Миграция выпускников ВУЗов из России {тыс. человек)

^ «Отток» кадров из России (%}

Маркетинг, реклама, коммуникации

Рис. 1. Миграция выпускников ВУЗов из России и отток кадров Fig. 1. Migration of university graduates from Russia and staff outflow

В результате наступившей пандемии COVID-19 начали появляться новые запросы и тенденции [2, 3, 4]. Согласно исследованию Boston Consulting Group (BCG), в начале 2021 года, 89% работников предпочтут удаленный формат работы. Такой формат позволяет привлекать к работе людей из разных точек мира, что делает работников, знающих иностранные языки и готовых к межкультурному сотрудничеству, более востребованными. Такие специалисты имеют уникальные междисциплинарные навыки и чаще всего их сложно найти. С внедрением новых информационно-коммуникационных технологий работодатели все чаще проводят проверку в социальных сетях, также известную как киберпроверка, как часть процесса найма [5]. Цифровая трансформация, ускоряющаяся под влиянием пандемии Covid-19, развивает и цифровые HR-технологии, использование которых необходимо в условиях усиливающейся конкуренции в борьбе за лучших сотрудников [6]. Поскольку текущие ресурсы не позволяют отбирать соответствующих запросу работодателя соискателей, поиск подобных сотрудников, которые обладают набором определенных навыков, усложняется и требует автоматизации — необходимо создать сервис по поиску эксклюзивных специалистов. Такой специалист не имеет резюме, не ищет работу, работает на стыке областей, а также имеет выраженный цифровой след. Автоматизированная система должна учитывать требования к искомому специалисту, предоставлять пользователю метрики благонадежности и общую оценку кандидата, находить с помощью различных источников, в том числе социальных сетей, недостающие данные.

Уникальный специалист - это специалист, который имеет уникальный набор знаний, компетенций и навыков в различных сферах [7].

Рассматривая уникального специалиста в научной сфере, уровень его квалификации можно определить благодаря его публикационной активности и наукометрическим показателям: цитируемость, количество соавторов, количество статей, h-индекс. Такие специалисты зачастую делятся своими работами и жизнью в социальных сетях [8]. Соответственно некоторые данные, которые невозможно узнать из базы научных статей, можно получить через цифровой след специалиста. Объединив данные из различных источников, можно получить некий описательный портрет найденного специалиста и с помощью цифрового следа дополнить недостающие данные.

Таким образом, целью работы является экспериментальное исследование возможности поиска человека с уникальными компетенциями в сети Интернет, используя ключевые слова и специально разработанный web-ресурс, а также возможность использования различных источников данных для составления цифрового портрета человека и принятия решения на основе полученных данных.

2. Объекты и методы исследования

Данные об уникальном специалисте могут быть неполными или отсутствовать, поэтому используется несколько общедоступных источников для получения информации о кандидате:

• база данных рецензируемой научной литературы Scopus [9];

• база данных рецензируемой научной литературы Web of Sciences;

• социальная сеть "ВКонтакте";

• поиск в сети Интернет;

• Российский научный фонд (РНФ) [10];

• Федеральный институт промышленной собственности (ФИПС) [11].

С технической точки зрения характеристики уникального специалиста определяются соответствием его показателей набору ключевых слов, которые система получает как начальные данные от пользователя.

Алгоритм поиска информации о специалисте был условно разделен на первичный и вторичный поиск. Первичный - поиск основной информации. Вторичный - поиск дополнительной информации.

Иванов Иван Иванович

О

Профиль личности

Ф Санкт-Петербург, Россия Университет: ИТМО к.т.н, профессор

+79513456478

анализ больших объемов даннь

h-индекс: 3

Публикации: статьи (PHHU/Scopus<-WoS) - 54/42 Количество цитирований: 375 Количество соавторов: 25

Researcherl D: А-3606-2014 AuthorlD (Scopus): 56004884100 OR Cl D: 0000-0001-9745-1489 AuthorlD (РИНЦ): 6065-7638

ix машинное обучение нейронные сети

Fl) Кандидат прошел интервью (11.02.202212:32)

ОЦЕНКА НАУКОМЕТРИЧЕСКИХ ПОКАЗАТЕЛЕЙ КАНДИДАТА НА ДОЛЖНОСТЬ АНАЛИТИК

Публикационная ахтивость Проектная деятельность Руководство ... Патенты в грантах

43 ^ 23 52 t 12 *

Статистика А Документация ^

Публикации / проекты по годам

J i h L

Васильев Денис Игоревич

Петроа Виктар Алексеевич Иванова Вера Петровна Иванова Полина Петровна Петров Виктор Алексеевич

I

2017 2018 2019 2020 2021

01/01/2О15- 01/01/2021

i I I 1 I

О 2015 201Б 2617 201Й

2020 2021 2022

Рис. 2. Наукометрические показатели Fig. 2. Scientometric indicators На первичном этапе для поиска специалиста используются средство сбора данных "Модуль взаимодействия с API Scopus". На вход подаются ключевые слова от пользователя, которые требуются для поиска специалиста. По данным ключевым словам, с помощью API 176

(Application Programming Interface) производится получение списка статей, по id которых загружается список авторов. Зная id автора, можно получить следующую информацию о нем: ФИО, Scopus ID, Orcid ID, места аффилиации, список публикаций за последние 10 лет, H-индекс, количество цитирований, список соавторов.

Рис. 3. Показатели благонадежности первичного анализа Fig. 3. Reliability indicators of the primary analysis

Рис. 4. Показатели благонадежности вторичного анализа Fig. 4. Reliability indicators of secondary analysis Алгоритм вторичного поиска информации использует следующие модули: модуль поиска информации о патентах РНФ и ФИПС, модуль поиска фото, модуль анализа страниц, модуль поиска по социальной сети ВК, модуль поиска в масс-медиа. На основе полученных данных и их анализа формируется цифровой профиль кандидата, который, помимо собранных

данных, включает в себя наукометрические показатели (см. рис. 2) и показатели неблагонадежности (см. рис. 3, 4).

Стрелки в блоках наукометрических данных кандидата показывают положение относительно других кандидатов в данной области. Графики наглядно отображают количество публикаций кандидата в научных журналах и его уровень цитируемости по введенным ключевым словам. Справа от графиков пользователь может ознакомиться со списком соавторов кандидата и при нажатии - ознакомиться с их профилем в Scopus.

2.1 Первичная оценка благонадежности кандидата

Благонадежность - соблюдение правил, законов и готовность согласиться с действующими требованиями общества/компании. Неблагонадежность - это поведение (или готовность к нему), в результате которого человек нарушает установленные нормы поведения. К показателям неблагонадежности относятся: уровень агрессивности, причастность к уголовным преступлениям, причастность к наркотикам, увлеченность азартными играми, причастность к финансовым махинациям [12, 13, 14, 15].

Показатель благонадежности кандидата определяется наличием или отсутствием факторов неблагонадежности в два этапа.

Оценка первичной благонадежности (ПБ) реализовывалась с помощью сбора данных из социальных сетей по:

1) агрессивности - на основе автоматического поиска слов ненормативной лексики;

2) алкогольной зависимости - на основе автоматического поиска слов, относящихся к категории алкоголь;

3) наркотической зависимости - по употреблению слов рядом со словами, относящихся к категории наркотики;

4) негативному отношению к морально-нравственным ценностям - анализ тональности по отношению к словам, которые могут быть употреблены в тексте постов, опубликованных на странице в социальной сети ВК;

5) игровой зависимости - по употреблению слов рядом со словами, относящихся к категории игр;

6) тенденциям к суициду - оценка депрессивного состояние по фотографиям из социальной сети Instagram;

7) наличию финансовых махинаций - наличие человека в реестре недобросовестных лиц (ФНС).

Формула подсчета оценки первичной благонадежности (1):

ПБ = ^(КОЭФ.ЗНАЧ; * Б1;), (1)

где Б1£ - благонадежность до интервью по параметрам i из пунктов 1-7, КОЭФ. ЗНАЧ; -коэффициент значимости параметра i, который выбирает сам пользователь системы.

На первом этапе использовался автоматизированный сбор и анализ постов из социальной сети кандидата [16, 17]. Было предположено, что алгоритмы машинного обучения на основе различных показателей, извлеченных из активности пользователей социальных сетей, способны предсказывать типы/черты личности с высокой точностью [18, 19]. Для оценки типа личности кандидата было предложено моделировать результаты прохождения кандидатом теста Айзенка версии EPI [20]. По количеству информации, публикуемой в социальных сетях, были отобраны тренировочная и контрольная группы по 120 и 30 человек соответственно для создания обучающего набора данных и оценки эффективности алгоритмов. (см. рис. 5). В 99,3% случаях алгоритм KNN (k-nearest neighbors) верно определял тип личности.

■ KNN ■ Random Forest SVG ■ Naive Bayes S CNN

100%

0% -

10 50 100 250

Рис. 5. Сравнение точности алгоритмов Fig. 5. Comparison of algorithm accuracy

2.2 Вторичная оценка благонадежности кандидата

Оценка вторичной благонадежности (ВБ) реализовывалась с помощью сбора данных на

основе онлайн-интервью, в процессе которого выделялись аналогичные показатели, включая

оценку лживости:

1) агрессивность - на основе выделения поведенческих маркеров вербальной и невербальной агрессии, согласно классификации Басса-Дарки;

2) алкогольная зависимость - на основе оценки истинности и ложности ответов на поставленные вопросы (Как вы думаете, насколько частое употребление алкоголя и какого может являться алкогольной зависимостью? Аргументируйте это. Как часто вы употребляете алкоголь?);

3) наркотическая зависимость - на основе оценки истинности и ложности ответов на поставленные вопросы (Считаете ли вы зависимость проблемой? Есть ли в вашем окружении люди, которые употребляют или употребляли наркотические вещества? Как вы относитесь к людям, которые употребляют наркотические вещества? Аргументируйте свою позицию);

4) негативное отношение к морально - нравственным ценностям - на основе оценки истинности и ложности ответов на поставленные вопросы (Как вы относитесь к {фактор был признан негативным}?);

5) игровая зависимость - на основе оценки истинности и ложности ответов на поставленные вопросы (Считаете ли вы игровую зависимость социальной проблемой? Что по вашему мнению, является игровой зависимостью? Если ли в вашем окружении люди, о которых можно сказать, что у них есть игровая зависимость? Как вы относитесь к людям, которые играют в игры больше четырех раз в день? Аргументируйте свою позицию);

6) тенденции к суициду - на основе оценки истинности и ложности ответов на поставленные вопросы (Были ли у вас случаи глубокой депрессии? Расскажите об этом Как по вашему мнению, есть ли оправдание самоубийству? Аргументируйте свою позицию);

7) тенденции к правонарушениям - на основе оценки истинности и ложности ответов на поставленные вопросы (Есть ли у вас родственники, которые были судимы? Расскажите об этом. Бывали ли у вас случаи нарушения закона? Есть ли у вас факты административного правонарушения? Расскажите об этом.) В случае, если человек был найден в реестре недобросовестных лиц, то также задается вопрос: "Расскажите, пожалуйста, почему вы были включены в реестр дисквалифицированных лиц?";

8) лживость - оценка истинности или ложности ответов кандидата на основе анализа вербальных и невербальных признаков онлайн-интервью.

Формула подсчета оценки вторичной благонадежности (2):

ПБ = ^(КОЭФ.ЗНАЧ; * Б2;), (2)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где Б2; - благонадежность до интервью по параметрам i из пунктов 1-8, КОЭФ. ЗНАЧ; -коэффициент значимости параметра i, который выбирает сам пользователь системы.

Оценка истинности или ложности ответов во втором этапе заключалась в устранении противоречий на основе анализа вербальных и невербальных признаков. Для исследования использовались видеоматериалы общей продолжительностью более 15 часов, которые были собраны в процессе интервьюирования 88 человек.

Для анализа видеоряда был использован вектор мимики лица с двумя компонентами. Первый компонент - это вектор выражения лица, второй компонент - это вектор, который содержит углы поворота головы. Для получения данных векторов используется сверточная нейронная сеть BlazeFace. Определение пространственных координат лицевых ориентиров вокруг осей трехмерного пространства позволяет построить карту глубины изображения для определения рельефа лица, поворота и наклона головы человека. Поток полученных карт объектов содержит информацию об изменениях выражений лица с течением времени и позволяет исследовать ее.

Для извлечения и анализа аудиоряда был разработан алгоритм, выделяющий следующие особенности речевого сигнала:

1) доля повышения/понижения громкости голоса для каждого фрагмента относительно среднего значения;

2) доля повышения/понижения тона голоса для каждого фрагмента относительно среднего значения;

3) уровень дрожания частоты (jitter);

4) значение темпа (количество произносимых слов в минуту);

5) доля сигнала, не связанного с речью (зашумленность аудио);

6) категориальный признак (молчание);

7) класс эмоций (7 классов: гнев, скука, тревога, радость, печаль, отвращение, отсутствие эмоций.

После чего была обучена модель сверточной нейронной сети с полностью подключенным классификатором (на наборе данных Emo-DB), который принимает аудио сигнал в качестве входного значения в форме MFCC для извлечения класса эмоций из спектрограммы. Класс эмоций извлекается ежесекундно, фрагменты меньшей длительности дополняются нулями до требуемого размера.

Рис. 6. Генерация персонализированных вопросов Fig. 6. Generating personalized questions

Далее происходит конкатенация извлеченных векторов видео и аудио признаков в одну последовательность. После чего эта последовательность передается на вход нейронной сети класса "Трансформер", которая на выходе имеет два значения: "правда" или "ложь". Сбор данных для второго этапа производился в несколько итераций интервьюирования. На первой - кандидату требовалось ответить на ряд общих вопросов. На основе анализа результатов, полученных после первого интервью, производилась генерация персонализированных вопросов для второй итерации (см. рис. 6).

После прохождения и анализа результатов интервьюирования, информация об уровне неблагонадежности и типе личности в его карточке обновляется и дополняется. Уведомление о прохождении опроса и результатах анализа отправляются на почту пользователю, который пригласил кандидата.

3. Разработка программного решения

В качестве архитектуры программной системы был выбран микросервисный подход на основе REST API, который заключается в том, что вся система разбивается на некоторое количество автономных изолированных программных модулей, обладающих слабым зацеплением и сильной связностью. Данный подход помогает реализовать архитектуру любой сложности в силу того, что сами микросервисы слабо зависят друг от друга в функциональном плане, важен лишь только формат данных, который они передают между собой.

Рис 7. Архитектура программного решения Fig. 7. Architecture of the software solution Архитектура программного решения (см. рис. 7) представляет из себя конвейер из микросервисов и СУБД (Системы Управления Базами Данных) (DBMS). В состав системы входят следующие микросервисы [21, 22, 23]:

• exclusive_api - главный (управляющий) микросервис, который принимает запросы на поиск, запускает другие микросервисы и получает от них результат работы;

• exclusive_frontend - клиентская часть системы;

• exclusive_interview_back - микросервис, который отвечает за запись видео во время интервью и сохранение его, а также ответов кандидата, в DBMS;

• exneuralcore - клиентская часть сервиса;

• lie_detector - микросервис, который анализирует видеоответ кандидата и определяет, лгал человек или нет;

• mm_info_scraper - микросервис, извлекающий данные о человеке из кода страниц web-сайтов;

• mm_searcher - микросервис поиска информации о человеке на сайтах habr.com, vc.ru, medium.com;

• patents_searcher - микросервис поиска патентов человека на сайтах РНФ и ФИПС;

• photos_searcher - микросервис поиска фотографий кандидата на сайтах его аффиляций;

• scopus_searcher - микросервис поиска статей и авторов посредством Scopus API;

• vk_searcher - микросервис поиска профиля человека в социальной сети ВКонтакте;

• vk_analyzer - микросервис анализа профиля человека, найденного в социальной сети ВКонтакте;

• user_api - микросервис, отвечающий за пользовательскую часть сайта: регистрация, авторизация, восстановление паролей, заполнение информации о пользователе;

• DBMS - система управления баз данных, которая хранит в себе БД с информацией о кандидатах.

Разработка серверной части велась на языке программирования Python 3 и использованием фреймворка FastAPI, а также таких инструментов как git, Docker, Nginx, MySQL. Клиентская часть была написана с использованием фреймворка React.js и языка программирования JavaScript.

4. Заключение

В ходе данной работы были изучены возможности поиска специалистов с уникальными компетенциями в сети Интернет на основе цифрового следа. В основу работы была положена гипотеза о том, что специалисты с уникальными компетенциями имеют цифровой след, по которому можно собрать информацию о них, достаточную для того, чтобы предоставить работодателю для принятия решения о найме.

Для того, чтобы проверить эту гипотезу, было проведено экспериментальное исследование возможности поиска человека с уникальными компетенциями в сети Интернет на основе заданных ключевых слов, а также возможность использования различных источников данных для составления цифрового портрета человека.

В рамках достижения цели исследования было решено разделить поиск специалиста на 2 этапа, первичный и вторичный.

В ходе первичного поиска происходит поиск информации по заданным ключевым словам. В качестве источника данных для первичного поиска был выбран Scopus API, который позволяет получить информацию о научных статьях и их авторах на основе заданных ключевых слов, что полностью соответствует поставленной задаче.

В ходе вторичного поиска происходит дополнение информации, полученной в ходе первичного поиска. Для каждого найденного человека производится:

- поиск фотографии через поисковую систему Google на основе его ФИО и сайта аффиляции;

- поиск контактных данных на основе страницы, с которой была получена фотография;

- поиск патентов в системах РНФ и ФИПС;

- поиск профиля в социальной сети ВКонтакте;

- поиск упоминаний на сайтах масс-медиа, в качестве таковых были выбраны habr.com, vc.ru, medium.com.

Было реализован веб-ресурс, предоставляющий пользователю интерфейс для поиска специалистов по указанным алгоритмам и вывод найденной информации в виде карточек кандидатов. Кроме того, ресурс позволяет работодателю отправлять приглашение на онлайн-интервью заинтересовавшему его кандитату, а также принимать решение о дальнейшем найме на основе анализа вербальных и невербальных характеристик кандидата с учетом оценки его благонадежности.

На данный момент сервис позволяет находить кандидатов только из научной сферы деятельности, что позволяет оценить узкий круг специалистов. В дальнейшем полученную систему можно усовершенствовать путем добавления новых источников данных и расширения предметной области, что позволит получать еще более полные данные о людях с уникальными компетенциями.

Список литературы / References

[1]. Dekay S. Are business-oriented social networking web sites useful resources for locating passive jobseekers? Results of a recent study. Business Communication Quarterly, vol. 72, issue 1, 2009, pp. 101105.

[2]. Романович М. А., Мохсени Х. и др. Актуальные вопросы и анализ рынка образовательных услуг в постпандемийный период. Экономика. Информатика, том 48, вып. 4, 2022 г., стр. 717-725 / Romanovich M.A., Hossein Mohseni H. et al. 2021. Current issues and analysis of the educational services market in the post-pandemic period. Economics. Information technologies, vol. 48, issue 4, 2022, pp. 717725 (in Russian).

[3]. Jinghui Y. The Effects of COVID-19 on the Labor Market. Journal of Economics Business and Management, vol. 10, issue 1, 2022, pp. 65-71.

[4]. Ando S., Balakrishnan R. et al. European Labor Markets and the COVID-19 Pandemic: Fallout and the Path Ahead. International Monetary Fund, issue 4, 2022, 96 p.

[5]. Jacobson J., Gruzd A. Cybervetting job applicants on social media: the new normal? Ethics and Information Technology, vol. 22, issue 2, 2020, pp. 175-195.

[6]. Peshkova O.A. Digital Footprint Analysis Technology: Some Aspects of Its Application in Recruitment. Lecture Notes in Networks and Systems, vol. 397, 2022, pp. 368-375.

[7]. Marin G.D., Nila C. Branding in social media. Using LinkedIn in personal brand communication: A study on communications/marketing and recruitment/human resources specialists perception. Social Sciences & Humanities Open, vol. 4, issue 1, 2021, article no. 100174.

[8]. Bohnert D., Ross W.H. The influence of social networking web sites on the evaluation of job candidates. Cyberpsychology, Behavior, and Social Networking, vol. 13, issue 3, 2010, pp. 341-347.

[9]. Индексы научного цитирования / Science citation indices. Available at: https://www.econ.msu.ru/elibrary/consulting/index/ (in Russian), accessed 04.05.2022.

[10]. Российский научный фонд, Создавая фундамент будущего / Russian Science Foundation. Laying Groundwork for Future. Available at: https://www.rscf.ru/, accessed 05.05 2022.

[11]. Федеральный институт промышленной собственности / Federal Institute of Industrial Property. Available at: https://www.fips.ru/, accessed 05.05.2022.

[12]. Иванова О.Ф. Проявления агрессии у представителей различных национальных культур. Вестник Евразии, no. 1, 2004 г., стр. 34-54 / Ivanova O.F. Manifestations of aggression among representatives of various national cultures. Bulletin of Eurasia, no. 1, 2004, pp. 34-54 (in Russian).

[13]. Bohnert D., Ross W.H. The influence of social networking web sites on the evaluation of job candidates. Cyberpsychology, Behavior, and Social Networking, vol. 13, issue 3, 2010, pp. 341-347.

[14]. Шумский П.П., Иванова Л.Н. Эмоции как процесс, влияющий на деятельность человека. Мозырь. 1998, 324 стр. / Shumsky P.P., Ivanova L.N. Emotions as a process that affects human activity. Mozyr. 1998, 324 p. (in Russian).

[15]. Яшенева А.С. Психолингвистические признаки агрессивной речи. Наука и образование сегодня, том 8, вып. 19, 2017, стр. 67-69 / Yasheneva A.S. Psycholinguistic signs of aggressive speech. Science and Education Today, vol. 8, issue. 19, 2017, pp. 67-69 (in Russian).

[16]. Kowsari K., Meimandi K.J. et al. Text classification algorithms: A survey. Information, vol. 10, issue 4, 2019, 68 p.

[17]. Rachman F.H., Sarno R., Fatichah С. CBE: Corpus-based of emotion for emotion detection in text document. In Proc. of the 3rd International Conference on Information Technology, Computer, and Electrical Engineering (ICITACEE), 2016, pp. 331-335.

[18]. Lima A.C., de Castro L.N. A multi-label, semi-supervised classification approach applied to personality prediction in social media. Neural Networks, vol. 58, 2014, pp. 122-130.

[19]. Pratama B. Y., Sarno R. Personality classification based on Twitter text using Naive Bayes, KNN and SVM. In Proc. of the International Conference on Data and Software Engineering (ICoDSE), 2021, pp. 170-174.

[20]. Тест-опросник Г. Айзенка epi (адаптация Г. Шмелева)/ Test questionnaire epi by G. Eysenck (adapted by G. Shmelev). Available at: http://test-metod.ru/index.php/metodiki-i-testy/1/48-test-oprosnik-g-ajzenka-epi-adaptatsiya-g-shmeleva (in Russian), accessed 04.05.2022.

[21]. Newman S. Newman S. Building Microservices: Designing Fine-Grained Systems. O'Reilly Media, 2021, 280 p.

[22]. Richardson C. Microservices patterns: with examples in Java. Manning, 2018, 540 p.

[23]. Richardson L., Amundsen M., Ruby S. RESTful Web APIs: Services for a Changing World. O'Reilly Media, 2013. 406 p.

Информация об авторах / Information about authors

Александр Сергеевич ЛЕОНОВ - магистрант 2-го года обучения факультета ИКТ Университета ИТМО, инженер исследовательского центра в сфере искусственного интеллекта "Сильный искусственный интеллект в промышленности". Сфера научных интересов: информационные и когнитивные технологии.

Alesander Sergeevich LEONOV is a 2nd year master's student at the Faculty of the Faculty of Infocommunication Technologies at ITMO University, an engineer at the research center in the field of artificial Intelligence "Strong Artificial Intelligence in Industry". Research interests: information technology.

Андрей Александрович ЛАПТЕВ - аспирант 2-го года обучения факультета ЦТ Университета ИТМО, инженер исследовательского центра в сфере искусственного интеллекта "Сильный искусственный интеллект в промышленности". Его научные интересы включают области сотрШвг science, проектирование сложных систем, построение математических моделей.

Andrey Aleksandrovich LAPTEV is a PhD student at the Faculty of Digital Transformation of ITMO University, an engineer at the research center in the field of artificial intelligence "Strong Artificial Intelligence in Industry". His research interests include computer science, design of complex systems, construction of mathematical models.

Анастасия Александровна ЛАУШКИНА - аспирант 2-го года обучения факультета ЦТ Университета ИТМО, инженер исследовательского центра в сфере искусственного интеллекта "Сильный искусственный интеллект в промышленности". Научные интересы включают когнитивную психологию, построение математических моделей.

Anastasia Alexandrovna LAUSHKINA is a PhD student at the Faculty of Digital Transformation of ITMO University, an engineer of the research center in the field of artificial intelligence "Strong Artificial Intelligence in Industry". His research interests include cognitive psychology, the construction of mathematical models.

Михаил Витальевич СИНЬКО - аспирант 2-го года обучения факультета ЦТ Университета ИТМО, инженер исследовательского центра в сфере искусственного интеллекта "Сильный искусственный интеллект в промышленности". Сфера научных интересов: компьютерное зрение, обработка аудиосигналов, генеративные состязательные сети, рекомендательные модели.

Mikhail Vitalievich SINKO is a PhD student at the at the Faculty of Digital Transformation of ITMO University, an engineer of the research center in the field of artificial intelligence "Strong Artificial Intelligence in Industry". Research interests: computer vision, audio signal processing, generative adversarial networks, recommendation models.

Олег Олегович БАСОВ - доктор технических наук, профессор факультета цифровых трансформаций Университета ИТМО, специалист, 02.1 сектор сопровождения научно -исследовательских работ и образовательной деятельности, Федеральное государственное бюджетное учреждение науки Институт системного программирования им. В.П. Иванникова Российской академии наук. Сфера научных интересов: полимодальные инфокоммуникационные системы, квантовые коммуникации, интеллектуальные транспортные системы, беспилотные летательные аппараты, робототехника.

Oleg Olegovich BASOV - Doctor of Technical Sciences, Professor of the Faculty of Digital Transformations at ITMO University, specialist, 02.1 sector of support for Research and Educational activities, Federal State Budgetary Institution of Science V.P. Ivannikov Institute of System Programming of the Russian Academy of Sciences. Research interests: polymodal infocommunication systems, quantum communications, intelligent transport systems, unmanned aerial vehicles, robotics.

i Надоели баннеры? Вы всегда можете отключить рекламу.