136 Вестник Нижегородского университета им. Н.и. Лобачевского. Серия: Социальный науки, 2016, № 2 (42), с. 136-143
УДК 316
ВЫЯВЛЕНИЕ АКАДЕМИЧЕСКИ НЕУСПЕШНЫХ СТУДЕНТОВ НА ПЕРВОМ ГОДУ ОБУЧЕНИЯ В УНИВЕРСИТЕТЕ НА ПРИМЕРЕ НИУ ВШЭ - НИЖНИЙ НОВГОРОД
© 2016 г. П.А. Булычева, О.Е. Ошмарина, Е.В. Шадрина
Национальный исследовательский университет «Высшая школа экономики», Нижегородский филиал
Статья поступила в редакцию 30.10.2015 Статья принята к публикации 25.04.2016
Предлагается анализ факторов, влияющих на академическую успешность студентов первого года обучения в университете. Анализ выполнен с помощью статистических методов и методов интеллектуального анализа данных. Исходными данными для исследования является информация о студентах, собранная с помощью онлайн-системы поддержки учебного процесса в НИУ ВШЭ - LMS (Learning Management System). В ходе исследования были найдены рискованные студенты, у кого велик риск получить академическую задолженность. Результатом исследования стали рекомендации учебному офису соответствующей образовательной программы обратить внимание на данных студентов, т.е. оказать им учебную помощь (индивидуальные рекомендации преподавателей, дополнительные занятия и т.п.).
Ключевые слова: интеллектуальный анализ данных, дерево принятия решений, онлайн-анкетирование, академическая успеваемость в университете.
Введение
Такая проблема, как прогнозирование успеваемости студента, затронутая в данной работе, очень актуальна в современной университетской среде. Из опыта преподавателей на факультете информатики, математики и компьютерных наук в Национальном исследовательском университете «Высшая школа экономики» -Нижний Новгород (НИУ ВШЭ - Нижний Новгород) было замечено, например, что более активные студенты и более дружные студенческие группы как правило академически успешнее. Студенты активно взаимодействуют во внеучебное время, консультируются друг с другом, повышая мотивацию к учебе всей студенческой группы. Соответственно, появилась необходимость выявить тех студентов, кому нужна помощь, найти факторы, которые влияют на академическую успешность студента. Основная сложность для первокурсника состоит в том, что сессия начинается раньше, чем студенты успевают наладить крепкие дружественные связи внутри группы, поэтому академически рискованные студенты - это в основном студенты первого курса.
Наша цель - выявление таких рискованных студентов, у кого возможны проблемы со сдачей зачетов, экзаменов, контрольных работ. Для этого использованы статистические методы и методы интеллектуального анализа данных. Для проведения исследования нам необходимы такие
данные, как сведения о предыдущем образовании, семейном положении, условиях проживания, материальном благополучии, увлечениях и т.п. Материалом для исследования является информация о студентах, которая была собрана с помощью опроса через онлайн-систему поддержки учебного процесса в НИУ ВШЭ - LMS (Learning Management System).
Результатом исследования являются рекомендации учебному офису обратить внимание на определенных студентов с целью оказания им учебной помощи (индивидуальные рекомендации и материалы от профессоров, дополнительные занятия с преподавателями и т. п.).
Анализ существующих методологических подходов
Вопрос социальных исследований в вузах очень актуален для российских и зарубежных ученых. Факторами, влияющими на успешность студентов, интересовались многие ученые. В частности, в работах [1-4] проведены разносторонние исследования по этой теме. Д.-Ф. Супербай с соавторами в статье [5] проводит исследование в трех бельгийских университетах. Авторы показывают, что на успешность первокурсников влияют в основном такие факторы, как текущая посещаемость, регулярное выполнение домашней работы, успешность и количество часов математики и экономики на предыдущем месте учебы, вера в собственный
успех и вера в правильный выбор, образование родителей, отсутствие вредных привычек и некоторые другие. Изучая влияющие на успешность студентов факторы, А. Арулсельван с соавторами [1] приходят к выводу, что все факторы - «довузовские» характеристики, финансовое состояние и дисциплина в учебе - влияют и на студентов из США, и на иностранных, хотя и по-разному. Исследуя процесс поступления в Белгородский государственный национальный исследовательский университет, М. Соколов с соавторами [6] приходят к выводу, что успешность абитуриентов зависит не только от баллов за ЕГЭ, но в большей степени от профессиональной и в меньшей от классовой и ситуационной ориентации.
Другая группа исследований посвящена анализу поведения студентов и школьников в малых группах, взаимодействия их между собой и с другими участниками образовательного процесса [7-9]. Такие исследования проводятся в основном с помощью методов социально-сетевого анализа и направлены на оценку распространения опыта и экспертизы [8], на прогнозирование взаимодействия студентов, преподавателей и других акторов образовательной системы [10, 11]. Например, в работах [9, 12] исследуются эффекты сообучения: оценивается влияние, которое социальное окружение оказывает на индивидуальные достижения учащихся. Д.Р. Валеева с соавторами рассматривают также факторы формирования дружеских связей между студентами, одним из которых названа близость характеристик студентов [12]. Интересно, что попав в определенный круг общения студенты интенсивнее развиваются как личности и лучше учатся [9]. Кроме того, студенты могут выбирать себе круг общения и тем самым способствовать собственной успешности [13]. А.С. Пронин с соавторами [14] исследуют возможность формирования учебных групп на основе дружеских связей студентов и предполагают, что при этом наблюдается улучшение успеваемости и повышение среднего уровня усвоения материала.
Обобщая многие исследования, пытаясь объяснить академическую успеваемость студента, предсказать успех или провал, можно выявить ряд объясняющих факторов, связанных со студентом. Все их мы разделили на три группы, рассмотрим их подробнее.
В литературе по социологии и психологии образования ([5, 6, 10, 15] и др.) были отмечены причины успехов и неудач на первом году обучения в вузе: студент, попадая из школьной среды в университетскую, испытывает серьезные изменения как в личной, так и в социокуль-
турной среде, серьезная учебная нагрузка - все это вызывает стресс и требует адаптационного периода. Факторы, относящиеся к личной истории студента, были отнесены нами к первой группе (личность, семья, академическая успешность в прошлом и т.д.).
Ко второй группе были отнесены факторы, отражающие отношение студента к учебе или его поведение по отношению к исследовательской деятельности (участие в дополнительных учебных мероприятиях, семинарах, встречах с профессорами, участие в мастер-классах).
К третьей группе были отнесены факторы восприятия студентом учебы в вузе (каким образом он воспринимает в академическом контексте своих профессоров, систему обучения, нравится ли ему учиться и т.д.).
Для более подробного анализа данных факторов, влияющих на студентов в исследуемом вузе, мы подготовили анкету. Вопросы были составлены так, чтобы каждый ответ содержал максимальное количество переменных для анализа. В 2012-2014 гг. был проведен опрос сначала среди студентов Нижегородской области из разных вузов, а затем среди студентов 1-2-го курса факультета информатики, математики и компьютерных наук в НИУ ВШЭ - Нижний Новгород, обучающихся по направлениям «Бизнес-информатика», «Прикладная математика и информатика» и «Программная инженерия». Чтобы преодолеть недостатки анкетирования, мы совместили его с дневниковым методом [16], а также использовали другие независимые источники количественных и качественных данных о студентах. Поэтому часть вопросов для студентов НИУ ВШЭ - Нижний Новгород не была включена в анкету, ведь существует возможность получить данные из внутренней базы данных «АСАВ (Абитуриент, студент, аспирант, выпускник)».
Заполненные анкеты студентов и данные из системы «АСАВ» были обработаны и представлены в базе данных: возраст, уровень образования его/ее родителей, средний балл в школе, количество баллов ЕГЭ при поступлении, наличие пересдач на первом году учебы в университете, восприятие студентом университетской среды и т. д.
Одним из способов качественной и количественной оценки полученных данных о студентах является метод их интеллектуального анализа [17, 18], который позволяет выявить скрытые шаблоны поведения, понять причины и проявление различных процессов в социальной среде. Подобные шаблоны можно затем встроить в модель и получить возможность предсказывать поведение системы и ее акторов с достаточной точностью [2, 5]. В исследовании образования используются все методы анализа дан-
ных: классификация [5, 19], категоризация [1, 12], оценка [20] и визуализация [21]. Для нашего исследования необходимо оценить влияние факторов на успешность студентов НИУ ВШЭ -Нижний Новгород и разбить студентов на категории по степени риска получить академическую задолженность.
Для оценки влияния факторов на академические успехи студентов наиболее подходит корреляционный анализ данных. Он позволяет оценить меру наличия взаимосвязи между двумя или более величинами и достаточно успешно используется в социологии образования [5].
Для категоризации данных используются различные методы кластеризации [20], факторный анализ (анализ данных без учителя), а также деревья принятия решений [5, 22], генетические алгоритмы (анализ данных с учителем) [17]. Так как у нас имеются предварительные данные об успехах студентов Нижегородской области и студентов 2-го курса НИУ ВШЭ - Нижний Новгород и достаточно большое количество входных переменных, использование деревьев принятия решений наиболее целесообразно.
Предварительный анализ данных о студентах
Для обобщенного анализа возможных факторов, влияющих на успеваемость студентов, в 2012-2014 гг. был проведен опрос студентов Нижнего Новгорода и Нижегородской области. Всего ответили на вопросы 145 человек. Анализ полученных данных позволил выявить зависимость между значением среднего балла студента и остальными его данными, выявить, какие данные влияют на средний балл, и использовать эти вопросы в анкете для студентов 1-го и 2-го курсов факультета информатики, математики и компьютерных наук в НИУ ВШЭ - Нижний Новгород.
Вопросы, представленные в анкете, можно разделить на несколько групп:
1) данные о предыдущем образовании (уровень успеваемости, баллы за ЕГЭ);
2) данные о текущем образовании (уровень успеваемости, специальность, университет);
3) финансовое положение;
4) уровень самостоятельности (условия проживания, наличие работы);
5) круг интересов (хобби, отношение к занятиям спортом);
6) личные вопросы (возраст, пол).
В результате опроса были получены следующие данные:
1) средний возраст опрашиваемых студентов - 18-20 лет, следовательно, студенты учатся в среднем на 2-3-м курсах;
2) большинство студентов окончили школу с оценками 4-5, только 10% окончили школу с оценками 3-4;
3) около 80% респондентов поступили в университет по результатам ЕГЭ и обучаются на бюджетной основе;
4) более 70% студентов ответили, что они живут с обоими родителями, у 33% студентов есть сестра, а у 23% - брат.
Для обработки данных опроса все данные были переведены в булевы переменные. В итоге мы получили 119 переменных. Далее был использован корреляционный анализ для оценки зависимости успеваемости и наличия пересдач от различных факторов. В результате мы выявили, что наиболее важными, с точки зрения влияния на успеваемость и наличие пересдач, являются ответы на следующие вопросы:
1. На какой основе Вы обучаетесь? (бюджет, внебюджет);
2. Посещаете ли Вы дополнительные занятия? (да, нет);
3. Участвуете ли Вы в олимпиадах? (да, нет);
4. Какую школу Вы окончили? (общеобразовательная; лицей, гимназия, школа со спец. уклоном; колледж; школа-интернат);
5. Где была расположена школа? (за границей; в крупном городе; в небольшом городе, селе);
6. С какими оценками Вы окончили школу? (3-4, 4-5, медаль);
7. Ходили ли Вы на подготовительные курсы перед поступлением? (да, нет);
8. Брали ли Вы академический отпуск? (да, нет);
9. Сколько времени Вы уделяете самостоятельной подготовке к занятиям? (все свободное время, от 1 до 3 часов в день, более 3 часов в день, меньше 7 часов в неделю, готовлюсь перед занятиями);
10. Бывают ли у Вас долги по экзаменам/зачетам? (всегда, 1-2 раза в год, 1-2 раза в семестр, нет);
11. Оцените, как Вам нравится учиться (5-балльная шкала);
12. Каковы условия Вашего проживания? (живу в общежитии, в собственной квартире один, с родителями, с друзьями/супругом на съемной квартире);
13. На какие средства Вы живете? (работаю, получаю стипендию, деньги дают родители);
14. Увлекаетесь ли Вы спортом? (профессиональные тренировки; фитнес, бассейн, домашние занятия; не занимаюсь);
15. Каково образование Ваших родителей? (высшее, среднее, нет, сирота);
16. Какая у Вас семья? (оба родителя; только один родитель; родители в разводе; сирота);
17. Как много Вы пропускаете аудиторных занятий? (регулярно пропускаю, среднее количество пропусков, не пропускаю).
Часть данных о студентах НИУ ВШЭ -Нижний Новгород уже присутствует во внутренней базе данных «АСАВ», так что финальная анкета была еще короче. Некоторые вопросы подразумевают множественные ответы, другие -только один ответ.
Стоит отметить, что особое влияние оказывает показатель того, занимается ли студент спортом. Те, кто занимаются спортом, показывают очень хорошие результаты в учебе и в целом в других жизненных ситуациях.
Можно сделать вывод и о том, что следующие вопросы вообще не влияют на успешность студентов: данные о существующих сбережениях, банковской карте, среднемесячный показатель доходов, университет, в котором учится студент, данные о переводе студента на другую специальность, наличие или отсутствие перерыва между школой и университетом.
Выявление студентов с высоким риском получения академической задолженности
Следующим этапом исследования является анализ опроса студентов факультета информатики, математики и компьютерных наук НИУ ВШЭ - Нижний Новгород с целью выявления потенциальных должников на ближайшую сессию. Часть данных были взяты из внутренней базы данных «АСАВ» (ФИО, курс, возраст, номер школы, баллы за ЕГЭ, др.), остальные данные (условия проживания, наличие работы, помощь родителей, занятия спортом, участие в олимпиадах, нравится ли учиться, образование родителей, время подготовки к занятиям, число пропусков) были получены в ходе опроса. В опросе приняли участие 110 человек: студенты 1-го и 2-го курсов. Все полученные данные были переведены в булевы переменные. Опрос был проведен в третьем модуле, т.е. студенты-первокурсники уже прошли 2 зачетные недели, имеют средний балл и некоторые уже имеют академические задолженности. Поэтому все данные были использованы для корреляционного анализа, что позволило выявить факторы, влияющие на наличие пересдач у выделенной группы студентов.
Следует отметить, что все ответившие студенты учатся на бюджетной основе и находятся на очной форме обучения. Очень интересный факт - многие из ответивших первокурсников уже имеют задолженности, хотя большинство
ответивших второкурсников находятся в верхушке рейтинга. Из этого следует, что, возможно, первокурсникам сложнее адаптироваться в новой для них университетской среде.
Для анализа результатов мы разделили студентов на две группы - студенты первого и второго курсов. Затем была использована система «обучение с учителем», где в качестве «учителя» использовались ответы студентов второго курса. Студенты-второкурсники были разбиты на три категории - Good, Medium, Bad в соответствии с их рейтингом успеваемости. Студенты, которые входят в первые 30% рейтинга, не имеющие задолженности, входят в категорию Good, студенты, которые входят во вторые 30%, не имеющие задолженности, входили в категорию Medium, остальные студенты входили в категорию Bad.
Далее на основе алгоритма классификации с учителем было построено дерево принятия решений (рис. 1), которое разделяет студентов по параметрам «Наличие пересдач» и «Средний балл». Такое разделение не позволяет отразить влияние всех параметров на качество учебы студента. Кроме того, влияние именно на эти параметры имеют остальные факторы. Поэтому мы убрали из списка параметров для обучения алгоритма эти факторы и построили дерево принятия решений заново (рис. 2).
Из рис. 2 можно сделать вывод, что алгоритм принимает во внимание наличие стипендии у студента, увлечение спортом, оценки, с которыми студент окончил школу, количество пропусков, отношение к учебе и состав семьи. Действительно, студент, который не получает стипендию, не увлекается спортом и окончил школу с плохими оценками, не является успевающим и, как следствие, находится в конце рейтинга.
Итак, теперь алгоритм обучен, и можно его использовать для оценки успеваемости студентов первого курса. Результатом анализа является разделение студентов по трем группам: Bad, Medium и Good (таблица 1). В целях нераспространения личной информации о студентах ФИО каждого было замещено условным Студент 1, Студент 2, .., Студент N. Мы получили, что в категорию рискованных студентов попали 11 человек из 32, в категорию Medium - 12 студентов, в категорию Good - 9 студентов. Итак, вот студенты, которые с большой вероятностью будут иметь задолженности в предстоящую сессию: Студент 1, Студент 2, Студент 3, Студент 4, Студент 5, Студент 6, Студент 7, Студент 8, Студент 9.
После итоговой сессии в 4-м модуле появилась возможность проверить результаты иссле-
.........JZ
<6.29
Bad
1 г
Да. были
г
Bad
i
1 <7.845 i
I >7.845
Нет, не было
1
Medium
Good
Рис. 1. Дерево принятия решений (1)
Рис. 2. Дерево принятия решений (2)
дования. В таблице 1 также представлены данные о реальном рейтинге и наличии пересдач студентов по итогам первого года обучения.
Следует отметить, что некоторые «неуспешные» студенты находятся в первых 30% рейтинга (а именно Студент 19 и Студент 20), но действия алгоритма обусловлены тем, что у данных студентов имеются также и удовлетворитель-
ные оценки, что влияет на получение стипендии, а фактор «Наличие стипендии» имеет большой удельный вес в процессе анализа.
В таблице 2 представлены обобщенные данные результатов исследования. В категорию Bad попали 11 студентов, и по результатам летней сессии эти же 11 студентов имели академические задолженности и 7 из них (64%) в итоге
Таблица 1
Результат анализа_
Студент Категория Средний балл Фактическое наличие пересдач
Студент1 Bad 4.63 Да
Студент2 Bad 5.38 Да
СтудентЗ Bad 5.5 Да
Студент4 Bad 5.75 Да
Студент5 Bad 6 Да
Студентб Bad 6 Да
Студент7 Bad 6.63 Да
Студент8 Bad 6.88 Да
Студент9 Bad 7.13 Да
Студент10 Medium 5.56 Да
Студент11 Medium 5.56 Да
Студент12 Medium 6.63 Да
Студент13 Medium 6.67 Да
Студент14 Medium 6.88 Да
Студент15 Medium 6.88 Да
Студент16 Medium 6.89 Да
Студент17 Medium 7.11 Да
Студент18 Medium 7.5 Да
Студент19 Bad 7.63 Нет
Студент20 Bad 8 Нет
Студент21 Good 6.89 Нет
Студент22 Good 7.63 Нет
Студент23 Good 7.75 Нет
Студент24 Good 7.88 Нет
Студент25 Good 7.88 Нет
Студент2б Good 7.88 Нет
Студент27 Good 8 Нет
Студент28 Good 8.44 Нет
Студент29 Good 8.75 Нет
СтудентЗО Medium 6.38 Нет
СтудентЗ 1 Medium 7.63 Нет
Студент32 Medium 8.63 Нет
Таблица 2
Обобщение данных_
Категория Всего студентов Студентов с пересдачами Студентов отчислено Высокий средний балл (больше 7.5)
чел. % чел. % чел. %
Bad 11 11 100 7 64 2 18
Medium 12 8 67 2 17 4 33
Good 9 3 33 0 0 8 89
отчислены. В категорию Medium попало 12 студентов, по результатам летней сессии 8 человек (67%) имели пересдачи, а двое из них (17%) отчислены. Среди студентов, попавших в категорию Good, пересдачи были лишь у трех (33%) и никто из студентов этой категории не был отчислен.
Таким образом, можно сделать вывод, что результат распределения студентов хорошо согласовывается с реальной ситуацией. Следует также заметить, что успеваемость студентов соответствует распределению по группам: студентов с высоким средним баллом
больше в категории Good и меньше в категории Bad.
В результате проведенного исследования были даны следующие рекомендации учебному офису факультета информатики, математики и компьютерных наук НИУ ВШЭ - Нижний Новгород: обратить особое внимание на студентов из категории Bad и уделить дополнительное внимание студентам из категории Medium c невысоким средним баллом после первого учебного полугодия.
Выводы
В данном исследовании были определены факторы, влияющие на успеваемость студентов, проведен корреляционный анализ, позволивший выявить факторы, максимально влияющие на наличие пересдач у выделенной группы студентов. Затем с помощью дерева принятия решений проведено разделение студентов-первокурсников на три категории: Good, Medium, Bad. В результате исследования были найдены рискованные студенты, у которых велик риск получить академические задолженности. Результатом исследования стали рекомендации учебному офису обратить внимание на рискованных студентов, т.е. оказать им учебную помощь (индивидуальные рекомендации преподавателей, дополнительные занятия и т.п.).
Список литературы
1. Arulselvan A. и др. Predicting the nexus between post-secondary education affordability and student success: An application of network-based approaches // Social Network Analysis and Mining, 2009. ASONAM'09. International Conference on Advances in. IEEE, 2009. P. 149-154.
2. Morris L.V., Wu S.-S., Finnegan C.L. Predicting Retention in Online General Education Courses // Am. J. Distance Educ. 2005. V. 19. № 1. P. 23-36.
3. Campbell J.P. Utilizing student data within the course management system to determine undergraduate student academic success: An exploratory study. ProQuest, 2007. rhD diss. Purdue University.
4. Pal S. Mining Educational Data Using Classification to Decrease Dropout Rate of Students // CoRR. 2012. V. abs/1206.3078. Р. 35-39.
5. Superby J.-F., Vandamme J., Meskens N. Determination of factors influencing the achievement of the first-year university students using data mining methods // Workshop on Educational Data Mining. 2006. P. 37-44.
6. Соколов М., Кнорре А., Сафонова М. Теории высшего образования и процесс выбор специально-
сти абитуриентами: Социально-сетевой анализ // Университетское управление: практика и анализ. 2014. Т. 90, № 2. С. 6-25.
7. Dawson S. A study of the relationship between student social networks and sense of community // J. Educ. Technol. Soc. 2008. V. 11, № 3. P. 224-238.
8. Penuel W.R. et al. Investigating the potential of using social network analysis in educational evaluation // Am. J. Eval. 2006. V. 27, № 4. P. 437-451.
9. Креховец Е.В., Польдин О.В. Социальные сети студентов: факторы формирования и влияние на учёбу // Вопросы образования. 2013. № 4. С. 127144.
10. Hawe P., Ghali L. Use of social network analysis to map the social relationships of staff and teachers at school // Health Educ. Res. 2008. V. 23, № 1. P. 62-69.
11. Black E.W., Dawson K., Priem J. Data for free: Using LMS activity logs to measure community in online courses // Internet High. Educ. 2008. V. 11. № 2. P. 65-70.
12. Валеева Д.Р., Польдин О.В., Юдкевич М.М. Связи дружбы и помощи при обучении в университете // Вопросы образования. 2013. № 4. С. 70-84.
13. Докука С.В., Валеева Д.Р., Юдкевич М.М. Коэволюция социальных сетей и академических достижений студентов // Вопросы образования. 2015. № 3. С. 44-65.
14. Пронин А.С., Веретенник Е.В., Семенов А.В. Формирование учебных групп в университете с помощью анализа социальных сетей // Вопросы образования. 2014. № 3. С. 54-73.
15. Горбунова Е.В. Адаптация студентов первого -третьего курсов бакалавриата / специалитета к университетской жизни // Univ. Журнал о жизни университетов. 2013. № 1 (Том 1). С. 48-64.
16. Гладарев Б.С. Дневниковый метод в изучении социальных сетей // Социология: методология, методы и математическое моделирование (Социология 4М). 2002. № 14. С. 53-69.
17. Luan J. Data mining and its applications in higher education // New Dir. Institutional Res. 2002. V. 2002, № 113. P. 17-36.
18. Baepler P., Murdoch C.J. Academic analytics and data mining in higher education // Int. J. Scholarsh. Teach. Learn. 2010. V. 4. № 2. Р. 1-9.
19. Romero C. et al. Data mining algorithms to classify students // Educational Data Mining. 2008. Р. 8-17.
20. Garcia E. et al. An architecture for making recommendations to courseware authors using association rule mining and collaborative filtering // User Model. User-Adapt. Interact. 2009. V. 19. № 1-2. P. 99-132.
21. Долинина О., Печенкин В., Тарасова В. Использование графовых моделей для визуализации социальных сетей образовательной организации // Вестник СГТУ. 2009. № 4 (43). Вып. 2. С. 210-214.
22. Friedl M.A., Brodley C.E. Decision tree classification of land cover from remotely sensed data // Remote Sens. Environ. 1997. V. 61, № 3. P. 399-409.
IDENTIFYING ACADEMICALLY «UNSUCCESSFUL» FIRST-YEAR UNIVERSITY STUDENTS: A CASE STUDY OF HIGHER SCHOOL OF ECONOMICS - NIZHNI NOVGOROD
P.A. Bulycheva, O.E. Oshmarina, E.V. Shadrina
National Research University Higher School of Economics - Nizhni Novgorod
The article presents the results of our analysis of the factors influencing academic success of the first-year university students. The analysis was performed with the help of statistical methods and data mining techniques. The source data for this research was in the form of information about students collected by the LMS (Learning Management System), an online system supporting the educational process in the Higher School of Economics. In the course of research, we have identified those students who were under the risk of academic failure. The results of the research were presented in the form of recommendations to the supervisors of the respective educational programs who should pay attention to the students under the risk and help them in their studies (by organizing individual consultations of faculty members, additional lessons, etc.).
Keywords: data mining, decision tree, on-line questionnaire, academic success in the university.