■ SIS4a *
УДК 378
ПРОГНОЗИРОВАНИЕ УСПЕВАЕМОСТИ СТУДЕНТОВ ПЕРВОГО КУРСА ПО РЕЗУЛЬТАТАМ СДАЧИ ЕДИНОГО ГОСУДАРСТВЕННОГО ЭКЗАМЕНА
THE PREDICTION OF ACADEMIC PERFORMANCE OF STUDENTS OF THE FIRST COURSE BY RESULTS OF UNIFIED STATE EXAM
Харламова Ирина Юрьевна
кандидат технических наук, доцент, доцент кафедры прикладной математики и системного анализа, Саратовский государственный технический университет им. Ю. А. Гагарина.
Irina Yu. Kharlamova
PhD (Technical), Associate Professor, Department of Applied Mathematics and Systems Analysis, Saratov State Technical University.
Аннотация. Проведено исследование статистических зависимостей среднего балла студентов первого курса от результатов их вступительных испытаний на примере физико-технического факультета Саратовского государственного технического университета им. Ю. А. Гагарина. С помощью корреляционного анализа определена теснота связи между параметрами, характеризующимирезультаты сдачи ЕГЭ и результаты сда чи сессии. Рассмотрены две спецификации уравнений регрессии на средний балл. В первой модели факторным признаком является суммарный балл ЕГЭ, во второй модели в качестве факторов выступают баллы по отдельным дисциплинам.
Ключевые слова: образование, вступительные испытания, корреляционный анализ.
И iii2605@yahoo.com
Abstract. A study of the statistical dependencies of the average score of first-year students from the results of their entrance examinations on the example of physical-technical faculty, Saratov state technical University Yu. A. Gagarin. With the help of the correlation analysis determined the correlation between the parameters characterizing the results of the exam and the results of the exam session. We consider two specifications of the regression equations for the average score. In the first model the factor attribute is the total score of the exam, in the second model, the factors are points in individual disciplines.
Key words: education, entrance test, correlation analysis.
В Российской Федерации приём в государственные вузы осуществляется на конкурсной основе, через вступительные испытания. С 2009 года в качестве такого рода испытаний используются результаты единого государственного экзамена (ЕГЭ). Накопленные статистические данные сделали возможным исследовать связь результатов ЕГЭ с последующей успеваемостью в вузе. Такие исследования важны для анализа эффективности процедуры отбора студентов, что и делает их актуальными.
В России в настоящее время ранжирование абитуриентов происходит на основе суммирования баллов результатов ЕГЭ, полученных по нескольким предметам. Перечень предметов из трёх или четырёх вступительных испытаний по каждому образовательному направлению определяется Министерством образования и науки Российской Федерации. В их число обязательно входит экзамен по русскому языку и профильному общеобразовательному предмету.
Выбор оптимального набора дисциплин и их весов может быть основан на регрессионном анализе модели, результативным признаком здесь является показатель вузовской успеваемости (средний балл), а факторами - итоги вступительных испытаний.
На первом этапе работы были проведены исследования с целью установления тесноты корреляционной связи между результатами сдачи ЕГЭ и сессий на первом курсе [3, с. 33]. Сделан вывод, что учёт результатов всех трёх экзаменов при отборе абитуриентов даёт лучший прогноз, чем аналогичный результат без учёта по одной из дисциплин. При равном суммарном балле по ЕГЭ предпочтение следует отдать тем абитуриентам, у которых выше итоги сдачи экзамена по дисциплине «Математика».
На следующем этапе рассматривались две спецификации уравнений регрессии на средний балл. В первой модели в качестве факторного признака выступал суммарный балл ЕГЭ. Именно этот показатель использовался для кон-
Научно-практический журнал. ISSN 2587-8042
■ З^®*
<
2Е
О.
О ш
ш
X
<
ш
о
со
2Е
ш
о
ш О X
_а
сц <
X
о ^
о о ш
е о
о.
курсного отбора на физико-технический факультет (ФТФ) Саратовского государственного технического университета (СГТУ) им. Ю. А. Гагарина. Однако несомненный интерес представляет вопрос о том, какая линей-
значимыми, о чем можно судить по показателям Р-значение, которые меньше заданного уровня значимости а=0,05.
Значимость коэффициентов регрессии подтверждается и ¿-критерием Стьюдента. Для рассматриваемой модели £^=2,011. Как видно
Таблица 1
Коэффициенты Значения Стандартная ошибка ¿-статистика Р-значение
ао 1,475243135 0,368501 4,003365 0,000215704
а 0,015340475 0,002231 6,877261 1Д3417Е-08
ная комбинация дисциплин ЕГЭ дает наилучший прогноз. Для ответа на этот вопрос рассматривалась модель, в которой факторами выступали баллы по отдельным дисциплинам.
1 модель
Факторный признак - суммарный балл ЕГЭ по трем дисциплинам, результативный - средний балл успеваемости за первый курс.
Рассчитанные коэффициенты регрессии позволяют построить уравнение парной регрессии, выражающее зависимость среднего балла успеваемости за первый курс — Y от суммарного балла ЕГЭ - X:
Г=0,0153405Х+1,4752431.
Значение множественного коэффициента детерминации R2 = 0,50 показывает, что 50% общей вариации результативного признака объясняется вариацией факторного.
Рассчитанный уровень значимости ар = 1Д34Х10-8 < 0,05 подтверждает значимость R2.
Проведена также проверка статистической значимости коэффициента детерминации R2 на основе Р-критерия Фишера. Для данной модели Рр=47,3, F =4,04. Так как F >F ,то гипотеза
кр ^ р кр
о незначимости коэффициента детерминации отвергается.
Показатель средней ошибки аппроксимации 8=7,18% также подтверждает достаточно высокую адекватность построенного уравнения.
Следующим этапом является проверка значимости коэффициентов регрессии.
В таблице 1 приведены значения коэффициентов, их стандартные ошибки, ¿-статистика и Р-значение.
Стандартные ошибки коэффициентов меньше их абсолютных значений. К тому же эти коэффициенты являются
из таблицы, для обоих коэффициентов |£р| > |£кр|, таким образом, гипотеза о незначимости коэффициентов регрессии отвергается.
2 модель
Факторные признаки: баллы ЕГЭ по математике, русскому языку, физике.
Результативный признак - средний балл успеваемости за первый курс.
С целью выявления мультиколлинеарнос-ти между факторными признаками рассчитаны коэффициенты парной корреляции (табл. 2).
Таблица 2
Дисциплины Математика Русский язык Физика
Математика 1,000 0,607 0,667
Русский язык 0,607 1,000 0,511
Физика 0,667 0,511 1,000
Так как все коэффициенты парной корреляции < 0,8, то можно считать, что явление мультиколлинеарности не установлено.
Рассчитанные коэффициенты регрессии позволяют построить уравнение, выражающее зависимость среднего балла успеваемости за первый курс У от результатов сдачи ЕГЭ по математике - X, русскому языку - Х2, физике - Х3.
Значение множественного коэффициента детерминации R2 = 0,50 показывает, что 50% общей вариации результативного признака объясняется вариацией факторных признаков X, X, X.
1' 2' 3
Y=0,0l5l28•Xl+0,0l6875•X2+0,0l4l64•Xз+l,45l492.
Рассчитанный уровень значимости ар=5,4бх10-7<0,05 подтверждает значимость R2.
Проведена также проверка статистической значимости коэффициента детерминации R2 на основе Р-критерия Фишера. Для данной модели F =15,14, Р =2,81. Так как Р > Р , то гипотеза
р ^7 кр ' р кр'
Базис. 2017. № 1(1). www.engels.ruc.su/science/basis/
Таблица 3
Коэффициенты Значения Стандартная ошибка t-статистика Р-значение
a 0 1,451492 0,435109 3,335930669 0,001688556
a 1 0,015128 0,00729 2,075127913 0,043594592
a 2 0,016875 0,008293 2,034813572 0,047656606
a 3 0,014164 0,00882 1,605903465 0,115139138
о незначимости коэффициента детерминации отвергается.
Показатель средней ошибки аппроксимации г=7,21% также подтверждает достаточно высокую адекватность построенного уравнения регрессии.
Следующим этапом является проверка значимости коэффициентов регрессии.
Нами приведены значения коэффициентов, их стандартные ошибки, f-статистика и Р-значение (табл. 3).
Стандартные ошибки всех коэффициентов меньше их абсолютных значений.
Коэффициенты aо, a , a2 являются значимыми, о чем можно судить по показателю Р-значение, которое меньше заданного уровня значимости а=0,05.
Значимость коэффициентов ао, a , a2 регрессии подтверждается и i-критерием Стьюдента. Для рассматриваемой модели £кр=2,013. Как видно из таблицы 3, для этих коэффициентов | tp | > 11 |, таким образом, гипотеза о незначимости коэффициентов регрессии отвергается.
В тоже время значимость коэффициента a3 не подтверждается ни Р-значением, которое больше заданного уровня значимости а=0,05, ни i-критерием Стьюдента: | tp| < 11 |. Уровень значимости данного коэффициента а=0,15.
Библиографический
1. Официальный информационный портал ЕГЭ [Электронный ресурс]. URL: http://www.ege.edu. ru (дата обращения: 20.04.2017).
2. Польдин, О. В. Прогнозирование успеваемости в вузе по результатам ЕГЭ / О. В. Польдин / / Прикладная эконометрика. 2011. № 1 (21). С. 5669. ISSN 1993-7601.
3. Харламова, И. Ю. Исследование корреляционной зависимости результатов сдачи ЕГЭ успеваемости студентов первого курса / И. Ю. Харламова // Междунар. научное периодическое издание «Новая наука: опыт, традиции, инновации» по итогам Междунар. науч.-практ. конф. Стерлитамак : АМИ, 2016. С. 33-35. ISSN 2412-9747.
4. Kobrin, J. L., Patterson, B. F., Shaw, E J., Mattem, K. D., Burbuti, S. M. (2008). Valibity of the SAT for predicting first-year college grade point average. College Board Report, 2008-5. New York, The College Board.
Далее приведены значения множественных коэффициентов корреляции, коэффициентов детерминации, средних ошибок аппроксимации для обеих моделей (табл. 4). Сравнение данных характеристик говорит о том, что качество подбора по обеим моделям примерно одинаково.
Таблица 4
Параметры 1 модель 2 модель
Множественный коэффициент корреляции R 0,704 0,705
R-квадрат 0,496 0,497
Средняя ошибка аппроксимации 7,183 7,212
Рассмотрены две регрессионные модели. В первой модели в качестве факторного признака выступал суммарный балл ЕГЭ, во второй - баллы по отдельным дисциплинам. Сравнение статистических характеристик по двум моделям позволяет сделать вывод, что при отборе абитуриентов достаточно ограничиться суммарным средним баллом по результатам ЕГЭ.
Материалы поступили в редакцию 28.04.2017 г. список (References)
1. Ofi-caVnyj informacionnyj portalEGJe. Available at: http://www.ege.edu.ru (accessed 20 April, 2017).
2. Pol'din, O. V. (2011). Prognozirovanie uspevaemosti v vuze po rezul'tatam EGJe [Forecasting the academic achievement in the university by the results of USE]. Prikladnaja jekonometrika. No 1 (21). P. 56-69. ISSN 1993-7601.
3. Harlamova, I. Yu. (2016). Issledovanie korreljacionnoj zavisimosti rezul'tatov sdachi EGJe uspevaemosti studentov pervogo kursa [Investigation of the correlation dependence of the results of passing the USE performance of first-year students]. Novaja nauka: opyt, tradicii, innovacii, po itogam mezhdunar. nauchno-prakt. konf. Sterlitamak: AMI. P. 33-35. ISSN 2412-9747.
4. Kobrin, J. L., Patterson, B. F., Shaw, E J., Mattem, K. D., Burbuti, S. M. (2008). Valibity of the SAT for predicting first-year college grade point average. College Board Report, 2008-5. New York, The College Board.
Научно-практический журнал. ISSN2587-8042