УДК 330.4
DOI: 10.24412/2071-6168-2021-9-228-231
СРАВНИТЕЛЬНАЯ ОЦЕНКА ЗНАЧИМОСТИ ПРЕДИКТОРОВ ПРИ ИСПОЛЬЗОВАНИИ РАЗЛИЧНЫХ МЕТОДОВ ИДЕНТИФИКАЦИИ ПАРАМЕТРОВ РЕГРЕССИОННОЙ МОДЕЛИ
СИ. Носков
В работе построена линейная регрессионная модель зависимости производства электроэнергии на АЭС России от их суммарной мощности и объема ВВП. Идентификация параметров модели произведена методами наименьших квадратов, модулей, антиробастного и смешанного оценивания. Рассчитаны диапазоны значений вкладов предикторов в правую часть модели. Оказалось, что, во-первых, производство электроэнергии на АЭС во многом, примерно на три четверти, определяется технологическими возможностями атомной энергетики и лишь на четверть - потребностями экономики страны в атомной энергии. И, во-вторых, поскольку вклады факторов в модельных вариантах меняются в относительно узких диапазонах, можно утверждать, что этот вывод вполне адекватен и соответствует фактическому состоянию дел в данной отрасли.
Ключевые слова: регрессионная модель, предикторы, вклады факторов, атомная энергетика, адекватность, методы антиробастного и смешанного оценивания.
В научной литературе по регрессионному анализу принято считать исключительно важной сравнительную оценку важности (значимости) входных (независимых) переменных, называемых также предикторами, по степени их влияния на выходной фактор (см., например, [1-3]. Так, в работе [4] представлен новый численный метод вычисления несмещенных оценок так называемых р-значений для предикторов линейных регрессионных моделей с учетом числа потенциальных объясняющих переменных, их дисперсионно-ковариационной матрицы и степени ее неопределенности, и основанный на числе рассматриваемых наблюдений. В [5] описана экономико-математическая модель влияния факторов эффективности микрологистической системы предприятия на показатели его экономического развития. В [6] рассмотрена многошаговая процедура анализа норм расхода материалов на изделия упрощенным методом случайного поиска с использованием F-критерия остановки. В работе [7] предложен способ отбора оптимального числа информативных регрессоров (предикторов) в регрессионных моделях, основанный на использовании скорректированного коэффициента детерминации и сводящийся к задаче частично целочисленного линейного программирования. В [8] описан способ устранения мультиколлинеарности между независимыми переменными в двухфакторной модели регрессии. Некоторые важные аспекты соотнесения значимости предикторов в регрессионных моделях рассмотрены в [9, 10].
В настоящей работе оценку значимости предикторов в регрессионной модели будем производить посредством вычисления вкладов независимых факторов, как это предложено в работе [11]. В качестве объекта анализа примем совместное влияние на производство электроэнергии на атомных электростанциях (АЭС) России (выходная переменная у, млрд. кВт*ч) их суммарной мощности (независимая переменная хъ млн. кВт.) и валового внутреннего продукта (ВВП) России (независимая переменная х2, млрд. долл. США).
Будем изучать оценки вкладов указанных факторов в линейной регрессионной модели
у= а0 +а1х1+а2х2. (1)
В качестве ее информационной базы будем использовать статистическую информацию по выделенным показателям за 2001-2014 годы [12]. При этом оценки параметров а;, 1=0,2 будем производить с помощью методов наименьших квадратов (МНК), модулей (МНМ), антиробастного (МАО) и смешанного оценивания (МСО) (см., например, [13]). При этом используем соответствующую программу для ЭВМ [14].
Оценки вкладов р(х;) независимых переменных в правую часть модели (1) будем рассчитывать по формуле [11]:
р(х0 = 100%Кх?|/ ЕУа^!, (2)
где х;* — максимальное на всей выборке значение j-ой переменной.
Построим модель (1) с помощью всех четырех упомянутых выше методов.
Системный анализ, управление и обработка информации
а). МНК.
у= 70.374+2.927x^0.015x2, Е=1.88. Здесь Е - средняя относительная ошибка аппроксимации (в %).
Р(Х1) = 71.1, Р(х2) = 28.9.
б). МНМ
у= 26.688+4.871x^0.013x2, Е=1.80. Р(Х1^ 81.2, р(х2) = 18.8.
в). МАО
у= 62.409+3.334хх+0.014х2, Е=2.00. Р(Х1^ 76, Р(х2) = 24.
г). МСО
у= 73.816+2.806хх+0.015х2, Е=1.97. р(хг) = 72.4, Р(х2) = 27.6.
Перед тем, как приступить к анализу как вариантов модели, так и вкладов факторов, остановимся на их обобщенном содержательном смысле. Переменная хг характеризует технологические возможности атомной энергетики страны по производству электроэнергии. Переменная же х2 служит, в частности, своеобразным индикатором потребности в электроэнергии экономики России.
Приведем диапазоны значений параметров всех четырех вариантов модели:
а0 £[26.688, 73.816], аг £[2.806, 4.871], а2 £[0.013, 0.015].
Отсюда следует, что наиболее стабилен (инвариантен относительно метода оценивания) параметр а2, наименее - свободный член модели.
Диапазоны значений вкладов предикторов имеют вид:
р(хг)£ [71.1, 81.2], р(х2)е [18.8, 28.9].
Это означает, что, во-первых, производство электроэнергии на АЭС во многом, примерно на три четверти, определяется технологическими возможностями атомной энергетики и лишь на четверть - потребностями страны в атомной энергии. И, во-вторых, поскольку вклады факторов в модельных вариантах меняются в относительно узких диапазонах, можно утверждать, что этот вывод вполне адекватен и соответствует фактическому состоянию в данной отрасли.
Заключение. В работе построена линейная регрессионная модель зависимости производства электроэнергии на АЭС России от их суммарной мощности и объема ВВП. Идентификация параметров модели произведена методами наименьших квадратов, модулей, антиробаст-ного и смешанного оценивания. Рассчитаны диапазоны значений вкладов предикторов в правую часть модели. Оказалось, что, во-первых, производство электроэнергии на АЭС во многом, примерно на три четверти, определяется технологическими возможностями атомной энергетики и лишь на четверть - потребностями страны в атомной энергии. И, во-вторых, поскольку вклады факторов в модельных вариантах меняются в относительно узких диапазонах, можно утверждать, что этот вывод вполне адекватен и соответствует фактическому состоянию в данной отрасли.
Список литературы
1. Федосеев В.В. Оценка вклада погодных факторов в варьирование урожайности зерновых культур в лесостепи оренбургского Предуралья //Аграрный вестник Урала. 2010. № 7 (73). С. 69-72.
2. Моисеев Н.А. Методы повышения достоверности прогнозных эконометрических исследований. Москва. 2019.
3. Орлов А.И. Вероятностно-статистические модели корреляции и регрессии //Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2020. № 160. С. 130-162.
4. Моисеев Н.А. Вычисление истинного уровня значимости предикторов при проведении процедуры спецификации уравнения регрессии // Статистика и Экономика. 2017. № 3. С. 10-20.
5. Лапковская П.И. Экономико-математическая модель влияния показателей эффективности микрологистической системы предприятия на его экономические показатели развития //Вестник Полоцкого государственного университета. Серия D. Экономические и юридические науки. 2018. № 5. С. 61-65.
6. Дайитбегов Д.М. Многошаговый регрессионный анализ норм расхода материалов на изделия упрощенным методом случайного поиска с использованием F-критерия остановки // РИСК: Ресурсы, Информация, Снабжение, Конкуренция. 2010. № 3. С. 234-239.
7. Базилевский М.П. Отбор оптимального числа информативных регрессоров по скорректированному коэффициенту детерминации в регрессионных моделях как задача частично целочисленного линейного программирования // Прикладная математика и вопросы управления. 2020. № 2. С. 41-54.
8. Базилевский М.П. Об одном способе устранения мультиколлинеарности в двухфак-торной модели регрессии // Информационные технологии и проблемы математического моделирования сложных систем. 2017. № 18. С. 93-98.
9. Базилевский М.П. Отбор информативных операций при построении линейно-неэлементарных регрессионных моделей // International Journal of Open Information Technologies. 2021. Т. 9. № 5. С. 30-35.
10. Базилевский М.П. Мультипликативный критерий детерминации-автокорреляции в регрессионном анализе // Continuum. Математика. Информатика. Образование. 2018. № 2 (10). С. 23-28.
11. Носков С.И., Врублевский И.П. Анализ регрессионной модели грузооборота железнодорожного транспорта // Вестник транспорта Поволжья. 2020. № 1 (79). С. 86-90.
12. Дебрянская Е.А., Янова Е.А. Корреляционно-регрессионный анализ показателей деятельности атомных электростанций Российской Федерации // Интерактивная наука. 2016. № 4.С. 118-121.
13. Носков С.И. О методе смешанного оценивания параметров линейной регрессии // Информационные технологии и математическое моделирование в управлении сложными системами. 2019. №1. С. 14-20.
14. Свидетельство о государственной регистрации программы для ЭВМ № 2021613497 Российская Федерация. Программный комплекс построения регрессионных уравнений методом смешанного оценивания с использованием критерия смещения: № 2021612560: заявл. 01.03.2021 : опубл. 09.03.2021 / С. И. Носков, К. С. Перфильева ; заявитель Федеральное государственное бюджетное образовательное учреждение высшего образования «Иркутский государственный университет путей сообщения».
Носков Сергей Иванович, д-р. техн. наук, профессор, sergey. noskov. 5 7mail. ru, Россия, Иркутск, Иркутский государственный университет путей сообщения
COMPARATIVE ESTIMATION OF THE SIGNIFICANCE OF THE PREDICTORS USING DIFFERENT METHODS FOR IDENTIFICATION OF THE PARAMETERS OF THE REGRESSION
MODEL
S.I. Noskov
The paper builds a linear regression model of the dependence of electricity production at Russian NPPs on their total capacity and GDP. The model parameters were identified by the methods of least squares, moduli, anti-robust and mixed estimation. The ranges of values of the contributions of predictors to the right side of the model are calculated. It turned out that, firstly, the production of electricity at nuclear power plants is largely, by about three quarters, determined by the technological capabilities of nuclear energy and only a quarter - by the needs of the country's economy for atomic energy. And, secondly, since the contributions of factors in the model variants vary in relatively narrow ranges, it can be argued that this conclusion is quite adequate and corresponds to the actual state of affairs in this industry.
Key words: regression model, predictors, contributions of factors, nuclear power, adequacy, anti-robust and mixed estimation methods.