Научная статья на тему 'ОБРАБОТКА ИНФОРМАЦИИ О ВЫПУСКНИКАХ С ПОМОЩЬЮ МЕТОДОВ АНАЛИЗА BIG DATA'

ОБРАБОТКА ИНФОРМАЦИИ О ВЫПУСКНИКАХ С ПОМОЩЬЮ МЕТОДОВ АНАЛИЗА BIG DATA Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
11
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Обработка данных / карьера выпускников / большие данные / Data processing / graduate careers / big data

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — О А. Тахтай, Ю Б. Козлова

Предполагается проектный подход для решения задач обработки данных о выпускниках. Рассматривается актуальность данной проблемы и опыт российских вузов по работе с выпускниками. Рассматриваются методы для обработки больших данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROCESSING INFORMATION ABOUT GRADUATES USING BIG DATA ANALYSIS METHODS

A project approach is proposed to solve the problems of processing data about graduates. The article considers the relevance of this problem and the experience of Russian universities in working with graduates. Methods for processing big data are considered.

Текст научной работы на тему «ОБРАБОТКА ИНФОРМАЦИИ О ВЫПУСКНИКАХ С ПОМОЩЬЮ МЕТОДОВ АНАЛИЗА BIG DATA»

УДК 004.04

ОБРАБОТКА ИНФОРМАЦИИ О ВЫПУСКНИКАХ С ПОМОЩЬЮ МЕТОДОВ

АНАЛИЗА BIG DATA

О. А. Тахтай*, Ю.Б. Козлова

Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева Российская федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

*E-mail: olesya.tahtai@yandex.ru

Предполагается проектный подход для решения задач обработки данных о выпускниках. Рассматривается актуальность данной проблемы и опыт российских вузов по работе с выпускниками. Рассматриваются методы для обработки больших данных.

Ключевые слова: Обработка данных, карьера выпускников, большие данные

PROCESSING INFORMATION ABOUT GRADUATES USING BIG DATA ANALYSIS

METHODS

O. A. Takhtay*, Yu. B. Kozlova

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation *E-mail: olesya.tahtai@yandex.ru

A project approach is proposed to solve the problems of processing data about graduates. The article considers the relevance of this problem and the experience of Russian universities in working with graduates. Methods for processing big data are considered.

Keyword: Data processing, graduate careers, big data

На сегодняшний день ведущие российские университеты активно ведут работу с выпускниками вузов. Известных, успешных выпускников университеты приглашают на встречи со студентами, для того чтобы они замотивировали будущее поколение. Многие успешные выпускники после окончания университета поступают в аспирантуру и строят преподавательскую карьеру в университетах. Но потенциал сотрудничества с выпускниками гораздо шире.

Активное взаимодействие с выпускниками уже давно стали обычной практикой во многих зарубежных вузах. Их опыт показывает, что имидж учебного заведения напрямую зависит от отзывов выпускников и является действенным инструментом для привлечения абитуриентов.

После выпуска из вузов, выпускники, придя к работодателю, сталкиваются с новыми для себя требованиями и знаниями, необходимыми для хорошей и высокооплачиваемой работы. Проблема заключается в том, что навыки, полученные выпускниками, отличаются от современных требований работодателя.

Изучаемая тема, обработка информации о выпускниках с помощью методов анализа Big Data, актуальна потому что организация обратной связи очень полезна в обоих направлениях: для выпускников - способ организовать и использовать свои

Актуальные проблемы авиации и космонавтики - 2021. Том 2

профессиональные и социальные связи, находить нужных им людей и развивать контакты, для вуза — привлечение большего количества абитуриентов, актуальная информация о требованиях работодателей на рынке труда.

В высших учебных заведениях обучаются тысячи студентов, все эти студенты есть в базах данных своих вузов и имеют такие данные как номер зачетки, фамилия имя отчество, номер группы, направление обучения и так далее. Эта информация объемна. Также университеты собирают информацию о выпускниках вузов, чтобы анализировать статистику и приманивать больше абитуриентов. Выпускники имеют такие данные как год выпуска, место работы, ФИО, номер группы, направление обучения. Для анализа статистики эти данные необходимо обрабатывать, но делать это весьма трудоемко.

Большие данные - это широкое понятие для набора данных, насколько объемных и сложных, что традиционные приложения для обработки данных не способны справиться с ними. Проблемы включают в себя анализ, хранение, поиск, совместное использование, передачу, визуализацию и конфиденциальность информации [1].

Обработка больших данных (Big Data) — совокупность методов обработки огромных потоков информации, как структурированных, так и неструктурированных данных для выявления сути и смысла исходных данных, их анализа и распределения [2].

Огромные объёмы данных обрабатываются для того, чтобы человек мог получить конкретные и нужные ему результаты для их дальнейшего эффективного применения.

Обработка данных может включать различные процессы, в том числе: проверка, сортировка, обобщение, агрегация, анализ, отчетность, классификация.

Анализ набора данных позволяет находить новые корреляции, выявлять тенденции развития бизнеса, предотвращать заболевания, бороться с преступностью и так далее.

Анализ больших данных начинается с их сбора. Информацию получают отовсюду: смартфонов, кредитных карт, мобильных приложений, автомобилей, датчиков и так далее. Из-за разных форматов и путей возникновения большие данные отличаются рядом характеристик «Три V» (Volume, Variety, Velocity). Это непосредственно объем информации, быстродействие ее обработки и разнообразие сведений, хранящихся в массиве.

К основным методам анализа и обработки данных относят следующие методы [3].

Data Mining - это процесс, цель которого - обнаружить новые значимые корреляции, образцы и тенденции в результате просеивания большого объема хранимых данных с использованием методик распознавания образцов плюс применение статистических и математических методов.

Краудсорсинг - эта методика позволяет получать данные из нескольких источников.

А/В-тестирование - это маркетинговый метод, использующийся для оценки и управления эффективностью веб-страницы.

Прогнозная аналитика - специалисты в данной области стараются заранее предугадать и распланировать то, как будет вести себя подконтрольный объект, чтобы принять наиболее выгодное в этой ситуации решение.

Машинное обучение (искусственный интеллект) - основывается на эмпирическом анализе информации и последующем построении алгоритмов самообучения систем.

Сетевой анализ - наиболее распространенный метод для исследования социальных сетей -после получения статистических данных анализируются созданные в сетке узлы, то есть взаимодействия между отдельными пользователями и их сообществами.

Ключевой задачей нашего исследования является обработка данных о выпускниках. Планируется собрать данные о выпускниках, создать базу данных. На основе полученных данных о выпускниках будет реализован один из методов Big Data, а именно Data Mining.

Библиографические ссылки

1. Технологии Big Data: как использовать большие данные [Электронный ресурс] URL: https://www.uplab.ru/blog/big-data-technologies/ (Дата обращения 02.04.2021)

2. Big Data - что такое системы больших данных? Развитие технологий Big Data [Электронный ресурс] URL: https://promdevelop.ru/industry/big-data-chto-takoe-sistemy-bolshih-dannyh/ (Дата обращения 02.04.2021)

3. Технологии обработки больших данных [Электронный ресурс] URL: https://moluch.ru/archive/183/46957/ (Дата обращения 02.04.2021)

© Тахтай О.А., Козлова Ю.Б., 2021

i Надоели баннеры? Вы всегда можете отключить рекламу.