ИНТЕЛЛЕКТУАЛЬНЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ
УСПЕВАЕМОСТИ УЧАЩИХСЯ КОЛЛЕДЖА 1 2 Герат Е.А. , Шухман А.Е. Email: Gerat666@scientifictext.ru
1Герат Екатерина Александровна - магистрант;
2Шухман Александр Евгеньевич - кандидат педагогических наук, доцент, заведующий кафедрой, кафедра геометрии и компьютерных наук, Оренбургский государственный университет, г. Оренбург
Аннотация: в статье проведен теоретический и экспериментальный анализ интеллектуальных методов прогнозирования успеваемости учащихся на наборе данных о студентах Оренбургского автотранспортного колледжа. Для анализа выбрано два метода - дерево решений и многослойные нейронные сети. Деревья решения демонстрируют более высокую точность, чем нейронные сети, кроме того, они дают возможность интерпретировать результаты прогнозирования. Основной вклад в прогноз вносит успеваемость за предыдущий семестр и текущая успеваемость студента.
Ключевые слова: интеллектуальный анализ данных, прогнозирование успеваемости учащихся.
INTELLIGENT METHODS TO PREDICT PERFORMANCE OF
COLLEGE STUDENTS Gerat E.A.1, Shukhman A.E.2
1Gerat Ekaterina Aleksandrovna - Undergraduate;
2Shukhman Alexander Evgenevich - PhD in Education Sciences, Associate Professor,
Head of Department, DEPARTMENT OF GEOMETRY AND COMPUTER SCIENCES, ORENBURG STATE UNIVERSITY, ORENBURG
Abstract: article presents a theoretical and experimental analysis of intelligent methods to predict student's performance on a student data set of the Orenburg Transport College. Two methods were chosen for analysis - decision trees and multilayer neural networks. Decision trees demonstrate higher accuracy than neural networks, in addition, they provide an opportunity to interpret the prediction results. The main contribution to the forecast is made by the previous semester performance and the current progress of the student. Keywords: educational data mining, predicting student performance.
УДК 004.89
Успеваемость учащихся - важный критерий качества профессионального образования. Кроме оценки качества обучения, успеваемость играет важную роль в повышении мотивации учащихся преподавателей. В наше время используется много различных методов для прогнозирования успеваемости учащихся. Наиболее популярны методы на основе интеллектуального анализа данных.
В результате анализа публикаций [1, 2, 3, 4, 5] выявлены наиболее важные показатели для прогнозирования успеваемости студентов. Наиболее часто в публикациях используется текущий средний балл студентов. Очень важным параметром является посещаемость студентов. Также очень часто для прогнозирования успеваемости студентов учитывают внешние факторы, такие как возраст, пол, семейное положение.
Анализ научных публикаций показал, что нейронные сети дают самую высокую точность прогнозирования (98%) [1], несколько менее точны деревья решений (91%) [2]. Методы опорных векторов и к ближайших соседей дают одинаковую точность (83%) [3, 4]. Наконец, наивный байесовский классификатор дает самую низкую точность прогнозирования (76%) [5].
Нейронные сети дают наивысшую точность только при учете множества признаков, включая текущие оценки студентов и внешние факторы. При учете только текущих оценок точность прогнозирования значительно снижается до 81%. Вторым по точности прогнозирования является метод деревьев решений (91%). Важнейший показатель, который дает высокую точность прогнозирования, - средний балл. Преимущество деревьев решения - способность работать как с числовыми, так и категориальными признаками. Также важным достоинством дерева решений является возможность интерпретации взаимосвязи между показателями.
Для прогнозирования успеваемости учащихся на основе психологических измерений целесообразно использовать метод опорных векторов с точностью около 83%. Метод к ближайших соседей демонстрирует такую же точность, но при комбинации множества признаков, включая текущие оценки, внешние показатели и внеучебную активность студентов.
Для экспериментального исследования была поставлена задача прогнозирования итоговой оценки по дисциплине «Информатика и информационно -коммуникационные технологии» во втором семестре 1 года обучения для учащихся различных направлений подготовки Оренбургского автотранспортного колледжа.
Общее количество записей в наборе данных составило 132 записи об учащихся. Для подготовки набора данных использовались анкеты с данными об учащихся; социальный паспорт группы, включающий сводные данные по анкетам студентов; журналы и ведомости успеваемости; журналы посещаемости учащихся.
Анализируемые показатели включали долю пропущенных занятий, средний балл за предыдущий семестр, текущий средний балл, внешние факторы: анкетные данные о студентах.
Для исследования использовалась полносвязная нейронная сеть с двумя скрытыми слоями по 30 нейронов. Входной слой содержал от 6 до 12 входов в зависимости от эксперимента. Отметим, что использование только внешних факторов не дает возможности точного прогнозирования успеваемости студентов - точность составляет только 57%. Значительный интерес представляет возможность прогнозирования успеваемости в начале семестра. Эксперименты показывают, что даже через месяц с начала семестра по текущим оценкам точность прогнозирования составляет 67%, через два месяца - достигает приемлемой величины 78%.
Недостаток метода нейронных сетей - невозможность интерпретации результатов эксперимента, потому что невозможно определить влияние различных факторов.
Деревья решений также плохо применимы для прогнозирования на основе внешних факторов. Основным внешним фактором, который оказывает влияние на успеваемость учащихся, стало проживание в общежитии: средний балл учащихся, проживающих в общежитии, составляет около 3,7, в то же время другие студенты имеют средний балл больше 4,3.
При использовании данных об успеваемости основной вклад в результат вносит успеваемость за предыдущий семестр и текущая успеваемость студента. Так же, как в случае нейронных сетей, деревья решений позволяют прогнозировать успеваемость в начале семестра. Эксперименты показывают, что через месяц с начала семестра по текущим оценкам точность прогнозирования составляет 84%, через два месяца -достигает величины 88%.
Таким образом, экспериментальное исследование методов прогнозирования успеваемости студентов показывает, что деревья решения демонстрируют более высокую точность, чем нейронные сети, кроме того, они дают возможность
интерпретировать результаты прогнозирования в терминах правил. Продемонстрирована возможность достаточно точного прогноза успеваемости в начале учебного семестра.
Применение интеллектуальных методов для прогнозирования успеваемости учащихся колледжа будет способствовать повышению успеваемости. Педагоги получают возможность оценить, какие методы обучения наиболее эффективны. Студенты будут вовремя предупреждены о проблемах в процессе обучения.
Список литературы /References
1. Bin Mat U., Buniyamin N., Arsad P.M., Kassim R. An overview of using academic analytics to predict and improve students' achievement: A proposed proactive intelligent intervention // IEEE 5th Conference on Engineering Education (ICEED), 2013. С. 126-130.
2. Jishan S.T. et al. Improving accuracy of students' final grade prediction model using optimal equal width binning and synthetic minority over-sampling technique // Decision Analytics, 2015. Т. 2. № 1.
3. Mayilvaganan M., Kalpanadevi D. Comparison of classification techniques for predicting the performance of students academic environment // IEEE International Conference on Communication and Network Technologies (ICCNT), 2014. С. 113-118.
4. Sembiring S., Zarlis M., Hartama D., Ramliana S., Wani E. Prediction of student academic performance by an application of data mining techniques // International Conference on Management and Artificial Intelligence IPEDR, 2011. Т. 6. С. 110-114.
5. Oladokun V., Adebanjo A., Charles-Owaba O. Predicting students academic performance using artificial neural network: A case study of an engineering course // The Pacific Journal of Science and Technology, 2008. Т. 9 (1). С. 72-79.