УДК 331.101.1:519.6
DOI: 10.30987/2658-4026-2021 -2-140-144
А.А. Тищенко
Разработка чат-бота в качестве виртуального помощника для мотивации студентов к получению профессии
Одним из актуальных направлений исследований в профориентологии и эргономике является процесс разработки чат-бота для поиска работы, способного обрабатывать любой запрос на естественном языке и повышать мотивацию студентов для получения той или иной профессии в виртуальной информационной среде. Приведена диаграмма взаимодействия компонентов разработанной программы с пользователями. Перспективным направлением дальнейших исследований является обоснование эргономических требований к чат-ботам как в процессе их разработки, так и в последующей эксплуатации. В последующей версии чат-бота планируется согласование его возможностей для поступления в магистратуру и аспирантуру по различным направлениям и профилям подготовки.
Ключевые слова: вакансия, чат-бот, анализ естественных языков, студенты ,трудоустройство.
A.A. Tishchenko
Developing a chatbot as a virtual assistant to motivate students
to get a profession
One of the relevant areas of research in vocational guidance and ergonomics is the process of developing a chatbot for finding a job, capable ofprocessing any request in a natural language and increasing students' motivation to obtain a particular profession in a virtual information environment. The diagram of interaction of the developed programme components with users is given. A promising area of further research is the substantiation of the ergonomic requirements for chat bots both in the process of their development and in the subsequent operation. In the next version of the chatbot, it is planned to agree on its possibilities for undertaking master's and postgraduate's degrees in various areas and training profiles.
Keywords: vacancy, chatbot, natural language analysis, students, employment.
Целый ряд исследований в сфере психологии труда, инженерной психологии и эргономики посвящён разработке методов и средств профессиональной ориентации и трудоустройства студенческой молодёжи (Т.Н. Кро-тенко, 2019 [2], Н.Ю. Матвеева, А.В. Золота-рюк, 2018 [3], О.С. Сухарев, В.В. Спасенни-ков, 2020 [4] и др.).
Сегодня в условиях нестабильной экономической ситуации проблема трудоустройства особенно актуальна. Поэтому создание помощника для поиска работы было бы крайне полезно для многих пользователей. Особенно интересен, может быть разрабатываемый чат-бот, в качестве виртуального помощника для повышения мотивации при получении студентами будущей профессии с учётом эргономических требований (А. К^тепко, S. Kondratenko, К. Dergachev, V. Spasennikov, 2020 [6]; V. Бравепшкоу, К. Androsov, О. Оо-1иЬеуа, 2020, [8]).
В настоящее время проблема трудоустройства стоит достаточно остро, особенно - в пе-
риод кризисных ситуаций в стране. Нестабильность экономики страны приводит к большому числу сокращений рабочих мест, что вынуждает людей заняться активным поиском новой работы. Кроме того у обучающихся на фоне данных тенденций резко снижается мотивация в получении знаний и профессиональных компетенций.
Системы поиска и фильтрации в имеющихся сервисах хоть и удобны, но не позволяют обработать запросы пользователя на естественном языке. Поэтому сейчас наблюдается тенденция создания чат-ботов для поиска работы, способных обрабатывать любой запрос на естественном языке. Особенно это важно при создании виртуального помощника для студентов. Они могут на естественном языке задать запрос, формулируя так как им более понятно и интересно, не имея часто полного понимания функциональных особенностей будущей профессии. Также можно задать на естественном языке ту деятельность, которая студенту во время обучения стала наиболее
ближе и понятнее.
В данной разработке была поставлена задача разработки чат-бота для поиска работы с применением интеллектуального алгоритма. Поскольку для чат-бота характерно общение с помощью человекоподобной речи, то в работе будут использованы методы обработки естественного языка.
Обработка естественного языка (NLP — Natural language processing) - область, находящаяся на пересечении компьютерных технологий, искусственного интеллекта и лингвистики. Цель заключается в обработке и понимании текстов на естественном языке. С развитием голосовых интерфейсов и чат-ботов, NLP стала одной из самых важных технологий искусственного интеллекта.
Поставленная в данной работе задача относится к информационному поиску, поскольку чат-бот осуществляет поиск вакансии, в большей степени соответствующей запросу пользователя на естественном языке.
Для решения вышеописанных задач, используются огромный набор инструментов и техник анализа естественного языка. В данной разработке для обработки пользовательских запросов на естественном языке по поиску работы был выбран алгоритм tf-idf.
В данном проекте tf-idf используется как критерий релевантности подобранной чат-ботом вакансии по запросу пользователя на естественном языке.
Для решения поставленной задачи была выбрана среда программирования Microsoft Visual Studio, обладающая всеми необходимыми наборами функций. Visual Studio является мощной интегрированной средой разработки, предоставляющей средства с открытым кодом для поддержки языка Python, в том числе рабочие нагрузки разработки Python и обработки и анализа данных.
В качестве языка программирования был выбран Python - высокоуровневый скрипто-вый язык программирования. Язык отличается надежностью, гибкостью и простотой освоения. Его можно бесплатно использовать на любых операционных системах. Кроме того, для Python доступно множество бесплатных библиотек, в том числе для машинного обучения и обработки естественного языка.
При создании данного проекта были использованы библиотеки для обработки естественного языка, среди которых наиболее популярные:
1. NLTK - базовая библиотека для создания NLP-программ на Python. У нее есть легкие в
использовании интерфейсы для многих языковых корпусов, а также библиотеки для обработки текстов для классификации, токени-зации, стемминга, разметки и фильтрации.
2. pymorphy2 - морфологический анализатор на языке Python. Выполняет лемматиза-цию и анализ слов, способен осуществлять склонение по заданным грамматическим характеристикам слов. Работает со словарём OpenCorpora. Поддерживаются русский и украинский языки.
3. Scikit-learn - библиотека, которая специализируется на алгоритмах машинного обучения для решения задач классификации, регрессии, кластеризации, понижения размерности и обнаружения противоречий [7].
В качестве платформы для размещения проекта был выбран мессенджер Telegram. Telegram - отличная и безопасная платформа для самых сложных ботов. Алгоритм работы бота на данной платформе следующий: сообщения, команды и запросы, отправленные пользователями, передаются на программное обеспечение, запущенное на серверах разработчиков. Посреднический анонимный сервер Telegram обрабатывает шифрование и осуществляет обратную связь между ботом и пользователем [5].
Чат-бот с искусственным интеллектом основан на создании модели машинного обучения, получаемой при обучении алгоритма интеллектуального анализа данных. Для обучения необходимо подать на вход алгоритму исходные данные. В данной рзработке проекте в качестве исходных данных используется набор вакансий.
Набор вакансий был получен путем пар-синга с информационного ресурса «Работа.ру» и импортирован в базу данных.
Парсинг вакансий выполнен по категориям. Каждая вакансия содержит базовую информацию о работе. Для понимания алгоритма работы чат-бота для поиска вакансий необходимо описать взаимодействие описанных ранее программных компонентов. Взаимодействие рассмотрено на примере команды поиска вакансии по ее описанию и представлено на рисунке 1.
Пользователь отправляет описание желаемой вакансии чат-боту. При получении первого запроса программа запускает импорт вакансий из базы данных в класс Vacancy. Полученные вакансии и запрос пользователя проходят процесс предобработки и передаются на вход алгоритму tf-idf. Алгоритм возвращает релевантную вакансию, имеющую наиболь-
шую близость с запросом пользователя, В результате релевантная вакансия отправляется
пользователю с описанием ее базовых характеристик.
Рис. 1. Диаграмма взаимодействия компонентов программы
Для размещения проекта чат-бота на платформе Telegram используется библиотека tele-bot на Python [7]. Чат-бот должен быть удобен и понятен при взаимодействии с пользователем. При запуске бота пользователь должен иметь возможность ознакомиться со всеми
возможными командами. При разработке чат-бота для поиска работы были использованы 7 команд, представленных на диаграмме сценариев взаимодействия с пользователем (см. рисунок 2).
Рис. 2. Диаграмма сценариев взаимодействия с пользователем
К вспомогательным командам относятся команда start, hello и help. Также есть блок
«Поиск вакансии», включающие два основные команды:
1. search_by_description - поиск по описанию вакансии, когда пользователь может ввести запрос в неструктурированном виде.
2. search_by name - поиск по названию вакансии, когда бот подбирает вакансию по точному совпадению.
Используя команду search_by_name у пользователя еще есть возможность указать минимальный размер желаемой заработной платы, выбрав команду set_min salary. При этом если заработная плата не важна для пользователя, он может просто пропустить этот пункт с помощью команды anysalary.
В результате выполнения команды search_by_name бот отправит вакансию, соответствующую пользовательским критериям.
Также у пользователя есть возможность найти вакансию по ее описанию, выполнив команду search by description (см. рисунок 3).
При чем данная команда позволяет пользователю отправить запрос в неструктурированном виде, используя любые формулировки. В результате будет возращена вакансия, которая имеет наибольшую схожесть с запросом пользователя.
В соответствии с задачей данной разработки был разработан чат-бот в мессенджере Telegram для поиска работы с применением интеллектуального алгоритма.
Были выполнен обзор существующих программных решений и описание методов решения поставленной задачи, благодаря чему был определен перечень функциональных требований для чат-бота.
Таким образом, был разработан чат-бот для поиска работы и размещен на платформе Telegram в соответствии с заявленными требованиями. На данный момент программа ориентирована на русскоговорящих пользователей, что тоже является ее несомненным плюсом, так как русский язык имеет проблемы по формализации и анализу. Данная разработка может применяться как виртуальный помощник для студентов по получению пони-
мания о востребованности на рынке труда будущей профессии, в рамках дальнейшей разработки предполагается добавить в чат бот информацию о прогнозах востребованности соответсвующей профессии. Перспективными направлениями дальнейших исследований является обоснование эргономических требований к чат-ботам как в процессе их разработки, а также модификация версии чат-бота для согласования его возможностей при поступлении в магистратуру и аспирантуру по различным направлениям и профилям подготовки.
/search_by_descrîption 12:26
VS
Введи описание желаемой вакансии...
P.S. Можешь использовать любые формулировки!
Работа с клиентами в Тинькофф
12:26
Название: Представитель Тинькофф
Зарплата: от 30 ООО руб. Компания: Тинькофф
Ссылка: hítps://brvansk.rabota.ru /vacancy/43462217/ bryansk.rabota.ru
Вакансия Представитель Тинькофф в Брянске с зарплатой 30 ООО руб, работа в компании Тинькофф для студентов
Работа Представитель Тинькофф, с зарплатой до Р 30 ООО, без опыта работы, свежая вакансия компании Тинькофф на Rabota.ru
Представитель Тинькофф
Брянск Тинькофф
ОТ 30 ООО Р
Рис. 1. Результат выполнения команды search_by_description
СПИСОК ЛИТЕРАТУРЫ
REFERENCES
1. Аверченков, А. В. Разработка математической модели информационной системы для инвентаризации и мониторинга программного и аппаратного обеспечения на основе методов нечеткой логики / А. В. Аверченков, Р. А. Филиппов, Л. Б. Филиппова, А. С. Сазонова, С. А. Шептунов. — Текст: непосредственный // Качество. Инновации. Образование. — 2018. — № 7. — Москва: Европейский центр по качеству , C. 105-112. — ISSN: 1999-513X. - Библиогр.: с. 112 (5 назв.).
1. Averchenkov, A. V. Development of Mathematical Model of Information System for Inventory and Monitoring of Hardware and Software Based on Fuzzy Logic / A. V. Averchenkov, R. A. Filippov, L. B. Filippova, A. S. Sazonova , S. A. Sheptu-nov. - Text: direct // Quality. Innovation. Education. - 2018. -no. 7. - Moscow: European Centre for Quality, pp. 105-112. -ISSN: 1999-513X. - Bibliography: P. 112 (5 titles).
2. Кротенко, Т. Н. Соотношение понятий профессия, специальность, рабочее место с позиций профориенто-логии и эргономики / Т. Н. Кротенко // Эргодизайн. - 2019. - №4 (06). - С. 162-172. - doi: 10.30987/2619-1512-2019-2019-4-162172. - Библиогр.: с. 170-172 (26 назв.).
3. Матвеева, Н. Ю. Технологии создания и применения чат-ботов / Н.Ю. Матвеева, А.В. Золотарюк // Научные записки молодых исследователей - 2018 - №1. - С. 28-30. -Библиогр.: с. 30 (3 назв.).
4. Сухарев, О. С. Трансформация высшего образования: преодоление конфликта компетенций и фундаментальности [Текст] / О. С. Сухарев, В. В. Спасенников // Эргодизайн. - 2020. - №3 (09). - С. 107-119. - doi: 10.30987/26584026-2020-3-107-119. - Библиогр.: с. 117-119 (28 назв.).
5. Халимова, Э. Р. Чат-бот мессенджера Telegram («Medicine-Bot») / Э. Р. Халимова, И. Ю. Карякин, Л. Н. Ба-кановская, О. С. Вунш. - Программа для ЭВМ. Свидетельство RU2018663280. Заявка 2018660323 от 25.09.2018. Дата публикации: 27.10.2018, Бюл. №11.
6. Kuzmenko, A. Ergonomic support for logo development based on deep learning / A. Kuzmenko, S. Kondratenko, K. Der-gachev, V. Spasennikov // CEUR Workshop Proceedings. 30. Сер. "GraphiCon 2020 - Proceedings of the 30th International Conference on Computer Graphics and Machine Vision" 2020.
7. Language Processing and Python. - Текст : электронный. - URL: http://www.nltk.org/book/ch01.html (Дата обращения: 10.01.2021).
8. Spasennikov, V. Ergonomic factors in patenting computer systems for personnel's selection and training / V. Spasennikov, K. Androsov, G. Golubeva // CEUR Workshop Proceedings. 30. Сер. "GraphiCon 2020 - Proceedings of the 30th International Conference on Computer Graphics and Machine Vision" 2020.
2. Krotenko, T. N. The Ratio of the Concepts of Profession, Specialty, Workplace from the Standpoint of Vocational Guidance and Ergonomics / T. N. Krotenko // Ergodesign. - 2019. -no. 4 (06). - pp. 162-172. - doi: 10.30987 / 2619-1512-20192019-4-162-172. - Bibliography: pp. 170-172 (26 titles).
3. Matveeva, N. Yu. Technologies of Creating and Using Chat Bots / N. Yu. Matveeva, A. V. Zolotaryuk // Scientific Notes of Young Scientists. - 2018 - no1. - pp. 28-30. - Bibliography^. 30 (3 titles).
4. Sukharev, O. S. Transformation of Higher Education: Overcoming the Conflict of Competences and Fundamentality [Text] / O. S. Sukharev, V. V. Spasennikov // Ergodesign. -2020. - no. 3 (09). - pp. 107-119. - doi: 10.30987 / 2658-40262020-3-107-119. - Bibliography: pp. 117-119 (28 titles).
5. Halimova, E. R. Chatbot of the Telegram Messenger ("Medicine-Bot") / E. R. Khalimova, I. Yu. Karjakin, L. N. Ba-kanovskaya, O. S. Vunsh. - Computer Programme. Certificate RU2018663280. Application 2018660323 from 25.09.2018. Date of publication: 27 October 2018, Bul. no. 11.
6. Kuzmenko, A. Ergonomic support for logo development based on deep learning / A. Kuzmenko, S. Kondratenko, K. Der-gachev, V. Spasennikov // CEUR Workshop Proceedings. 30. Сер. "GraphiCon 2020 - Proceedings of the 30th International Conference on Computer Graphics and Machine Vision" 2020.
7. Language Processing and Python. - Text.: electronic. -URL: http://www.nltk.org/book/ch01.html (Accessed: 10.01.2021).
8. Spasennikov, V. Ergonomic factors in patenting computer systems for personnel's selection and training / V. Spasennikov, K. Androsov, G. Golubeva // CEUR Workshop Proceedings. 30. Сер. "GraphiCon 2020 - Proceedings of the 30th International Conference on Computer Graphics and Machine Vision" 2020.
Ссылка для цитирования:
Тищенко А.А. Разработка чат-бота в качестве виртуального помощника для мотивации студентов к получению профессии /А.А. Тищенко //Эргодизайн. - 2021 - №2 (12). - С. 140-144. - DOI: 10.30987/2658-4026-2021-2-140-144.
Сведения об авторах:
Тищенко Анастасия Анатольевна
Брянский государственный технический университет
канд. техн. наук, доцент E-mail: [email protected] ORCID
Abstracts: A.A. Tishchenko
Bryansk State Technical University
Candidate of Technical Sciences, Associate Professor
E-mail: [email protected]
ORCID
Статья поступила в редколлегию 03.03.2021 г.
Рецензент: д.пс.н., профессор Брянского государственного технического университета главный редактор журнала «Эргодизайн» Спасенников В.В. Принята к публикации 11.03.2021 г.