УДК 519. 237.8
МОДЕЛИРОВАНИЕ УСПЕВАЕМОСТИ СТУДЕНТОВ ИНСТИТУТА КОСМИЧЕСКОЙ ТЕХНИКИ СИБГАУ
С. Р. Вишневская, Е. Д. Зиборов, И. П. Солодилов, Е. И. Яковлев*
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31
E-mail: [email protected]
В настоящей заметке с применением технологий кластерного анализа данных решаются задачи оценки связи между успеваемостью студентов по различным предметам.
Ключевые слова: кластерный анализ, метод ближайшего соседа, метод K-средних, оценка знаний.
MODELING THE PROGRESS OF STUDENTS OF 1ST SIBGAU
S. R. Vishnevskaya, E. D. Ziborov, I. P. Solodilov, E. I. Yakovlev*
Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation
E-mail: [email protected]
In this note using technology cluster analysis of the data solved the problem assess the relationship between the academic performance of students in various subjects.
Keywords: cluster analysis, nearest neighbor, method K-means, assessment of knowledge.
В настоящей заметке предпринимается попытка классифицировать успеваемость студентов по различным общеобразовательным дисциплинам, преподаваемым в вузе. Выяснить, какие из дисциплин «близки по успеваемости» между собой и могут быть отнесены в один класс. Такую же классификацию проведем для школьных предметов и сравним полученные результаты.
В ходе анализа публикаций был сделан вывод, что для достоверного прогнозирования успеваемости студентов больше всего подходят методы кластерного анализа, поскольку кластерный анализ позволяет производить разбиение объектов не по одному параметру, а по целому набору признаков (см. [1; 2]). Кроме того, кластерный анализ позволяет рассматривать множество исходных данных практически произвольной природы.
В обследовании были задействованы данные 248 студентов ИКТ СибГАУ различных специальностей. Обследование проводилось с помощью электронных таблиц Excel и статистической программы программа Statistica 12 версии фирмы StatSoft Inc [3; 4].
Среди обследованных было 16 % девушек и 84 % юношей (рис. 1).
Рис. 1. Процент обследуемых юношей (М) и девушек (Ж)
Секция «Прикладная математика»
Для лучшего понимания связи успеваемости по предметам, как «школьных», так и вузовских дисциплин, постараемся более наглядно представить, полученные данные.
Гистограмма на рис. 2 отражает процентный состав оценок по «школьным» предметам.
Рис. 2. Процентный состав оценок по «школьным» предметам
Приведем средние баллы по предметам в школе: литература - 4,32; информатика - 4,65; математика - 4,18; история - 4,33; физика - 4,26; химия - 4,26; биология - 4,35; иностранный -4,34; ОБЖ - 4,84; физкультура - 4,88.
Гистограмма на рис. 2 отражает процентный состав оценок по предметам в вузе.
Рис. 3. Процентный состав оценок по предметам в вузе
Приведем средние баллы по предметам в вузе: история - 4,1; линейная алгебра - 3,8, математический анализ - 3,8; химия - 4,45; иностранный - 4,43; физика - 3,86.
Проведем кластерный анализ вышеприведенных дисциплин. В методе древовидной кластеризации использовались метод ближайшего соседа. Результаты приведены ниже на древовидной диаграмме (рис. 4).
Особенно наглядно разделены «школьные» и «вузовские» дисциплины на два самых больших кластера. Среди самых малых кластеров понятны объединения в один кластер математического анализа и линейной алгебры, русского языка, литературы и иностранного языка, ОБЖ и физической культуры.
Single Linkage Euclidean distances
Рис. 4. Кластерный анализ вузовских и школьных предметов
Проглядывает тенденция «завышения» «школьных» оценок по сравнению с «вузовскими». Это ярко выражено на естественнонаучных дисциплинах математике, химии и особенно физике.
Библиографические ссылки
1. Майер Р. В. Классификация учебных фактов методом кластерного анализа. Проблемы учебного физического эксперимента : сб. науч. и метод. работ. 1998. Вып. 5. С. 12-19.
2. Шевченко В. О. Прогнозирование успеваемости студентов на основе методов кластерного анлиза // ХНАДУ. 2015. Вып. 58. С. 15-18.
3. Халафян А. А. Современные статистич. методы медицинских исследований : монография. 3-е изд. М. : Ленкид, 2014. 320 с.
4. Тюрин Ю. Н., Макаров А. А. Анализ данных на компьютере / под ред. В. Э. Фигурнова. М. : Инфра-М, 2002. 528 с.
© Вишневская С. Р., Зиборов Е. Д., Солодилов И. П., Яковлев Е. И., 2017