ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ТЕЛЕКОММУНИКАЦИИ INFORMATION TECHNOLOGY AND TELECOMMUNICATIONS
УДК 519.852
DOI: 10.21822/2073-6185-2023-50-1-123-129 Оригинальная статья/Original Paper
Вариантное регрессионное моделирование производства электроэнергии
в Российской Федерации
С.И. Носков1, Е.С. Попов1, С.П. Середкин1, В.В. Тирских1, В.Д. Торопов2
1 Иркутский государственный университет путей сообщения,
1664074, г. Иркутск, ул. Чернышевского, 15, Россия,
2 Байкальский государственный университет, 2
664003, г. Иркутск, ул. Ленина, 11, Россия
Резюме. Цель. Целью исследования является построение линейной регрессионной модели производства электроэнергии в Российской Федерации в зависимости от ресурсных показателей, к которым относятся: объем добычи угля и газа, производство мазута. В качестве информационной базы исследования использованы статистические данные за 2005 - 2020 г. г. Метод. Оценивание неизвестных параметров модели осуществляется с использованием трех методов - наименьших квадратов, модулей и антиробастного оценивания. Они ведут себя по-разному по отношению к выбросам - наблюдениям, не согласующимся с выборкой данных в целом. Второй из них вообще не реагирует на выбросы, полностью игнорируя их, а третий, напротив, сильно к ним тяготеет, следовательно, эти методы являются своего рода антагонистами друг по отношению к другу. Результат. Получены три альтернативных модели линейной регрессионной модели производства электроэнергии, обладающие высокой точностью. Рассчитано значение индекса параметрической стабильности выборки данных, основанного на свойствах методов оценивания параметров. Выделены наблюдения, в максимальной и минимальной степени соответствующие линейной модели на анализируемой выборке. Вычислены значения вкладов факторов в правые части моделей. Вывод. Три построенных различными методами варианта модели могут успешно использоваться для решения задач, связанных с прогнозированием производства электроэнергии в стране. При этом вариант, построенный методом наименьших квадратов, является своего рода компромиссным.
Ключевые слова: производство электроэнергии, линейная регрессионная модель, методы наименьших квадратов, модулей, антиробастного оценивания, индекс параметрической однородности, вклады факторов
Для цитирования: С.И. Носков, Е С. Попов, С.П. Середкин, В.В. Тирских, В.Д. Торопов. Вариантное регрессионное моделирование производства электроэнергии в Российской Федерации. Вестник Дагестанского государственного технического университета. Технические науки. 2023; 50(1):123-129. DOI:10.21822/2073-6185-2023-50-1-123-129
Variant regression modeling of electricity production in the Russian Federation S.I. Noskov1, E.S. Popov1, S.P. Seredkin1, V.V. Tirskikh1, V.D. Toropov2
1 Irkutsk State Transport University, 115 Chernyshevskogo St., Irkutsk 664074, Russia 2 Baikal State University, 211 Lenina Str., Irkutsk 664003, Russia
Abstract. Objective. The aim of the study is to build a linear regression model of electricity generation in the Russian Federation depending on resource indicators, which include: the volume of coal and gas production, the production of fuel oil. Statistical data for 2005 - 2020 were used as the information base of the study. Method. Estimation of unknown parameters of the linear model is carried out using three methods - least squares, modules and anti-robust esti-
mation. They behave differently with respect to outliers in the data. The second of them does not react to outliers at all, completely ignoring them, and the third, on the contrary, strongly gravitates towards them, therefore, these methods are a kind of antagonists in relation to each other. Result. Three alternative models of a linear regression model of electricity production with high accuracy are obtained. The value of the parametric stability index of the data sample, based on the properties of the parameter estimation methods, is calculated. Observations are identified that correspond to the maximum and minimum extent to the linear model on the analyzed sample. The values of the contributions of the factors to the right parts of the models are calculated. Conclusion. Three versions of the model built by different methods can be successfully used to solve problems related to forecasting the production of electricity in the country. At the same time, the variant constructed by the least squares method is a kind of compromise.
Keywords: electricity generation, linear regression model, least squares, moduli, antirobust estimation, parametric homogeneity index, factor contributions
For citation: S.I. Noskov, E.S. Popov, S.P. Seredkin, V.V. Tirskikh, V.D. Toropov. Variant regression modeling of electricity production in the Russian Federation. Herald of the Daghestan State Technical University. Technical Science. 2023; 50(1):123-129. DOI:10.21822/2073-6185-2023-50-1-123-129
Введение. Методы математического моделирования, в частности, регрессионного, активно используются в современной науке для анализа сложных технических и экономических систем. Весьма эффективны они и при исследовании энергетики. Так, в работе [1] разрабатываются регрессионные модели для оценки изменений в эффективности более тысячи генераторов, работающих на угле и природном газе, в зависимости от температуры окружающего воздуха и рабочих переменных для различных типов топлива, первичных двигателей, систем охлаждения и климатических зон в течение нескольких лет - с 2008 по 2017 годы. В [2] модель полиномиальной регрессии используется для анализа нерегулируемого рынка электроэнергии Нигерии. В статье [3] регрессионная модель Тобита используется при выборе типа ветряной турбины для оценки эффективности электростанций. Работа [4] посвящена разработке регрессионной модели для сопоставления данных о производстве электроэнергии и выбросов, и разработке на этой основе алгоритма диспетчеризации выработки электроэнергии в режиме реального времени для сокращения общего объема выбросов загрязняющих веществ. В [5] на основе построения многофакторной регрессионной модели доказано, что значимыми факторами при прогнозировании объема потребления электрической энергии являются тариф рынка на сутки вперед, среднесуточная температура окружающей среды и рабочие/нерабочие дни недели. В [6] рассматривается применение регрессионных методов прогнозирования детерминированных временных рядов для формирования графика нагрузки электрооборудования. Статья [7] посвящена применению методов регрессионного анализа для исследования потребления тепловой энергии населением, промышленными и социальными объектами. Представлены результаты исследования зависимости изменения теплопотребления от ряда социальных, технических и экономических параметров. По результатам проведенных исследований описана ретроспективная динамика изменения теплопотребления с помощью одно- и многопараметрических линейных и нелинейных регрессионных уравнений. Полученные регрессионные модели апробированы при прогнозировании уровня теплопотребления на средне- и краткосрочную перспективу.
Постановка задачи. Энергетика является важнейшей отраслью экономики Российской Федерации. При этом примерно две трети электроэнергии вырабатывается тепловыми электростанциями (ТЭС), а одна треть - и при этом почти поровну, - атомными и гидростанциями. Целью исследования является построение линейной регрессионной модели производства электроэнергии в Российской Федерации в зависимости от ресурсных показателей. Сформулируем задачу оценки степени влияния ресурсных показателей (газ, уголь, мазут) функционирования ТЭС на производство электроэнергии методами регрес-
124
сионного анализа. Такое влияние может быть формализовано построением линейной регрессионной модели (уравнения) вида:
У k = Ш 1 a i*ki + £к, к = 1 п, (!)
где у - зависимая, а Xi - i-ая независимая переменные, a i - i-ый подлежащий оцениванию параметр, £к - ошибки аппроксимации, k - номер наблюдения, n - длина выборки данных.
Будем полагать, что все переменные и ошибки в уравнении (1) детерминированы. Уравнение (1) представим в векторной форме:
у = Ха + а,
где у = (у i,...,уп)Т , a = (a 1,...,am)r, s = (£i,...,£п)т, X- (пхт)- матрица с компонентами X к i.
Введем следующие обозначения:
у - производство электроэнергии в Российской Федерации (млн. кВтв); х1 - объем добычи угля (млн.т); х2 - производство мазута (млн.т.); х3 - объем добычи газа (млрд. м 3).
Таким образом, конкретизируем уравнение (1) в форме:
У к = a 1X1+a2X2 + a3Хз+Sk, к = 1,п. (2)
В качестве информационной базы исследования будем использовать статистические данные по Российской Федерации за 2005 - 2020 г. г. [8-13], представленные в табл.1.
Таблица 1. Статистические данные Table 1. Statistical data
Год у
2005 299.8 56.7 641 219.2
2006 309.4 59.3 656 221.4
2007 314.1 62.4 653 224
2008 328.9 63.9 665.1 225.5
2009 302.6 64.1 583.1 226.1
2010 323 68.7 650.7 230
2011 336.7 73.4 670.7 233.3
2012 354.9 74.2 654.5 239.7
2013 352 76.9 667.8 242.2
2014 359 78.4 642 256
2015 374 71 635.5 257.1
2016 385.7 56.9 640.2 258.7
2017 411.2 51.2 691.1 261.6
2018 439.3 48 725.4 265.6
2019 441.4 45.8 738 269.8
2020 401.3 40.8 692.3 270.2
Таким образом, п=16.
Методы исследования. Широкий класс методов оценивания параметров а / = 1,т линейного регрессионного уравнения (1) связан с минимизацией функции потерь вида [14]:
а)=Гк=,1гк1\у>1 .
В качестве методов идентификации параметров уравнения (2) будем использовать методы наименьших квадратов (МНК) [14], модулей (МНМ) [15] и антиробастного оценивания (МАО) [16]. Отметим, что эти методы показали свою эффективность при исследовании сложных объектов различной природы, в частности, в работе [17] они применены
для построения дискретной модели производства алюминия. Использование указанных методов приводит в данном случае к решению следующих задач:
- МНК: I 2( а)=£к6 1^2-т т;
- МНМ: I ^ а) = £¿6 11 £к| - тт;
- МАО: I оо( а) = 1 1 т^ - оо£к6 1 |е£| =тах кбЦбЫ - тт.
Их реализация для модели (2) приводит к следующим линейным модельным соотношениям:
а). МНК
у = 0.43 2х1 + 0 . 5х2 + 0 . О 8 7х3, (3)
R= 0.998, F= 4309, E=2.6%.
Здесь R - критерий множественной детерминации, F - критерий Фишера, Е - средняя относительная ошибка аппроксимации.
б). МНМ:
, (4)
E=2.6%.
в). МАО:
у = 0.295х1 + 0.2 38х2 + 0 . 1 8 8х3, (5)
E=2.9%.
Обсуждение результатов. Для МНМ и МАО не приведены значения критериев R и F, поскольку они по отношению к этим методам неприменимы. Очевидно, что модели (3) - (5) обладают весьма высокой точностью - см., в частности, рис.1. Вместе с тем, их параметры весьма существенно различаются. Степень этого различия по отношению к модели (1) можно оценить индексом параметрической стабильности (ИПС) Е [18]:
т
у
у 1=1
где а м нм и а мао - оценки параметров, вычисленные с применением МНМ и МАО соответственно, а X - средние на выборке значения независимых переменных:
Fig. 1. Actual and calculated values of the dependent variable
Такой способ представления ИПС объясняется тем, что МНМ вообще не реагирует на выбросы (наблюдения, не согласующиеся с выборкой в целом), полностью игнорируя их, а МАО, напротив, сильно к ним тяготеет, следовательно, эти методы являются своего рода антагонистами по отношению друг к другу. Значение ИПС для модели (2) по отношению к данным, представленным в табл. 1, нельзя признать низким, т.е. вполне удовлетворительным: £=0.2459.
Проанализируем значения ошибок аппроксимации , для всех трех моде-
лей, представленных в табл. 2.
Таблица 2. Ошибки аппроксимации Table 2. Approximation errors
Номера наблюдений МНК МНМ МАО
1 5.493 6.653 -3.345
2 0.938 1.737 -7.418
3 0.218 0 -6.375
4 -6.480 -6.994 -11.872
5 12.522 9.654 11.872
6 -0.580 -2.714 -4.064
7 -7.292 -10.249 -9.686
8 -7.743 -11.892 -5.788
9 -6.500 -10.813 -5.581
10 5.773 0 10.658
11 4.663 0.241 10.324
12 7.857 6.995 10.948
13 -1.839 0 -1.895
14 -11.362 -8.117 -11.872
15 -8.066 -3.852 -10.140
16 16.138 20.941 11.872
Воспользуемся для этого свойствами оценок МНМ и МАО [19, 16] по отношению к модели (1), состоящие в следующем. Число нулевых ошибок аппроксимации при использовании МНМ равно т, а число максимальных по модулю ошибок при применении МАО не меньше т+1. Это означает, что в максимальной степени модель (2) соответствует наблюдениям с номерами 3, 10, 13 (для МНМ соответствующие им ошибки равны нулю), а в минимальной - наблюдениям с номерами 4, 5, 14, 16 (для МАО соответствующие им ошибки максимальны по модулю). Наконец, исследуем значимость независимых переменных в моделях (3) - (5), т.е. вкладов X, / = 1, 3 в их правые части [20]. Эти вклады, выраженные в процентах, представлены в табл. 3.
Таблица 3. Вклады независимых переменных в правые части моделей Table 3. Contributions of independent variables to the right hand sides of the models
Метод Переменная
хл X?.
МНК 42% 49% 9%
МНМ 36% 60% 4%
МАО 41% 33% 26%
Таким образом, вклад переменной X! меняется в пределах от 36% до 42% (т.е. достаточно стабилен), х2 - от 33% до 60% и, наконец, X 3 - от 4% до 26%. Следовательно, наименьшее влияние на производство электроэнергии имеет объем добычи газа, влияние же объемов производство угля и мазута существенно выше и примерно сопоставимо.
Отметим одно важное обстоятельство. Вследствие того, что МНК является своего рода компромиссом между МНМ и МАО по отношению к реакции на выбросы, для практического использования можно рекомендовать модель (3), хотя модели (4) и (5) также могут найти свое применение для решения соответствующих задач.
Вывод. В работе поставлена задача построения линейной регрессионной модели производства электроэнергии в Российской Федерации в зависимости от ресурсных показателей с использованием трех методов идентификации параметров - наименьших квадратов, модулей и антиробастного оценивания. Получены следующие результаты:
1. Построены три альтернативных модели, обладающие высокой точностью.
2. Рассчитано значение индекса параметрической стабильности выборки данных.
3. На основе свойств методов выделены наблюдения, в максимальной и минимальной степени соответствующие линейной модели.
4. Вычислены значения вкладов факторов в правые части моделей.
Библиографический список:
1. Meng M., Sanders K.T. A data-driven approach to investigate the impact of air temperature on the efficiencies of coal and natural gas generators //Applied Energy. - 2019.- 253.-113486.
2. Adebisi O.I., Adejumobi I.A. Development of a Load Management Scheme for the Nigerian Deregulated Electricity Market Using Regression Model // IEEE PES/IAS Power Africa Conference: Power Economics and Energy Innovation in Africa, Power Africa. - 2019.- 8928928.- рр. 682-687.
3. Saglam Ü. Assessment of the productive efficiency of large wind farms in the United States: An application of two-stage data envelopment analysis // Energy, Conversion and Management. - 2017- 153.- рр. 188214.
4. Ke Y., Yang X., Xiong Y., Liang X. Power generation dispatching for environmental protection based on recursive neural network and ant colony optimization algorithm//Information and Control. - 2017- 46(4).-рр. 415-421.
5. Мохов В.Г., Демьяненко Т.С. Определение значимых факторов при прогнозировании объема потребления электроэнергии по объединенной энергосистеме Урала на основе регрессионного анализа // Вестник УрФУ. Серия: Экономика и управление. - 2017. - Т. 16. - № 4. - С. 642-662.
6. Зуева В.Н. Регрессионные методы прогнозирования графика нагрузки электрооборудования // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. - 2017. - № 126. - С. 119-130.
7. Стенников В.А., Добровольская Т.В. Методы регрессионного анализа в исследованиях теплопо-требления в России // Вестник Российского экономического университета имени Г.В. Плеханова. -2018. - № 2 (98). - С. 142-153.
8. Официальный портал Федеральной службы государственной статистики. [Электронный ресурс] URL: https://rosstat.gov.ru (дата обращения: 21.12.2022).
9. Сайт статистики и аналитики: Мировые финансы. Добыча газа. [Электронный ресурс] URL: http://global-finances.ru/dobycha-gaza-v-rossii-po-godam/ (дата обращения: 21.12.2022).
10. Сайт статистики и аналитики: Мировые финансы. Добыча угля. [Электронный ресурс] URL: http://global-finances.ru/dobycha-uglya-v-rossii-po-godam/ (дата обращения: 19.12.2022).
11. Официальный сайт Министерства энергетики Российской Федерации (Минэнерго России). [Электронный ресурс] URL: https://minenergo.gov.ru/node/1212 (дата обращения: 21.12.2022).
12. Витрина статистических данных статистики. [Электронный ресурс] URL: https://showdata.gks.ru/finder (дата обращения: 2.12.2022).
13. Официальный портал Единой межведомственной информационно-статистической системы (ЕМИСС). [Электронный ресурс] URL: https://www.fedstat.ru/ (дата обращения: 21.12.2022).
14. Демиденко Е.З. Линейная и нелинейная регрессии. - М.: Финансы и статистика.- 1981. - 302с.
15. Носков, С.И. О методе смешанного оценивания параметров линейной регрессии / С.И. Носков // Информационные технологии и математическое моделирование в управлении сложными системами. - 2019. - № 1. - С. 14-20.
16. Носков С. И. Метод антиробастного оценивания параметров линейной регрессии: число максимальных по модулю ошибок аппроксимации // Южно-Сибирский научный вестник. - 2020.- № 1. - С. 5154.
17. Носков С.И. Дискретная модель производства алюминия в Российской Федерации // Вестник Технологического университета. - 2022. - Т.25. - № 2. - С. 80-82.
18. Носков С.И. Индекс параметрической стабильности регрессионной модели // Вестник транспорта Поволжья. - 2021. - № 2 (86). - С. 74-77.
19. Носков С. И., Ильюшонок Д. М. Подход к кластеризации выборки данных на основе метода наименьших модулей // Южно-Сибирский научный вестник. - 2020. - № 6. - С. 255-259.
20. Носков С.И. Оценка динамики вкладов факторов в линейной регрессионной модели // Вестник Воронежского государственного технического университета. - 2021. - Т. 17. - № 5. - С. 15-19.
References:
1. Meng M., Sanders K.T. A data-driven approach to investigate the impact of air temperature on the efficiencies of coal and natural gas generatorsApplied Energy. 2019;253:113486.
2. Adebisi O.I., Adejumobi I.A. Development of a Load Management Scheme for the Nigerian Deregulated Electricity Market Using Regression Model. IEEE PES/IAS Power Africa Conference: Power Economics and Energy Innovation in Africa, Power Africa. 2019; 8928928: 682-687.
3. SaglamÜ. Assessment of the productive efficiency of large wind farms in the United States: An application of two-stage data envelopment analysis. Energy, Conversion and Management. 2017; 153:. 188-214.
4. Ke Y., Yang X., Xiong Y., Liang X. Power generation dispatching for environmental protection based on recursive neural network and ant colony optimization algorithm. Information and Control. 2017; 46(4): 415-421.
5. Mokhov V.G., Demyanenko T.S. Determination of significant factors in forecasting the volume of electricity consumption in the unified energy system of the Urals based on regression analysis. Vestnik UrFU. Series: Economics and Management. 2017; 16(4): 642-662. [In Russ]
6. Zueva V.N. Regression methods for predicting the load schedule of electrical equipment. Polythematic network electronic scientific journal ofthe Kuban State Agrarian University. 2017; 126: 119-130. [In Russ]
7. Stennikov V.A., Dobrovolskaya T.V. Methods of regression analysis in studies of heat consumption in Russia. Bulletin of the Russian University of Economics named after G.V. Plekhanov. 201S; 2 (9S):. 142153. [In Russ]
S. Official portal of the Federal State Statistics Service. [Electronic resource] URL: https://rosstat.gov.ru (date of access: 12/21/2022). [In Russ]
9. Site of statistics and analytics: World finance. Gas production. [Electronic resource] URL: http://global-finances.ru/dobycha-gaza-v-rossii-po-godam/ (date of access: 12/21/2022). [In Russ]
10. Site of statistics and analytics: World finance. Coal mining. [Electronic resource] URL: http://global-finances.ru/dobycha-uglya-v-rossii-po-godam/ (date of access: 12/19/2022). [In Russ]
11. Official website of the Ministry of Energy of the Russian Federation (Ministry of Energy of Russia). [Electronic resource] URL: https://minenergo.gov.ru/node/1212 (date of access: 12/21/2022). [In Russ]
12. Showcase of statistical data statistics. [Electronic resource] URL: https://showdata.gks.ru/finder (date of access: 2.12.2022). [In Russ]
13. Official portal of the Unified Interdepartmental Information and Statistical System (EMISS). [Electronic resource] URL: https://www.fedstat.ru/ (date of access: 12/21/2022). [In Russ]
14. Demidenko E.Z. Linear and non-linear regression. M.: Finance and statistics. 19S1;302. [In Russ]
15. Noskov S.I. On the method of mixed estimation of linear regression parameters. Information technology and mathematical modeling in the management of complex systems. 2019; 1:14-20. [In Russ]
16. S. I. Noskov. "An anti-robust estimation method for linear regression parameters: the number of approximation errors that are maximal in modulus," South Siberian Scientific Bulletin. 2020;1:51-54. [In Russ]
17. Noskov S.I. Discrete model of aluminum production in the Russian Federation. Bulletin of the Technological University. 2022;25( 2):S0-S2. [In Russ]
1S. Noskov S.I. Index of parametric stability of the regression model. Bulletin of transport of the Volga region. 2021; 2 (S6): 74-77. [In Russ]
19. Noskov S. I., Ilyushonok D. M. An approach to clustering a data sample based on the method of least modules. South Siberian Scientific Bulletin. 2020; 6: 255-259. [In Russ]
20. Noskov S.I. Evaluation of the dynamics of the contributions of factors in a linear regression model. Bulletin ofthe Voronezh State Technical University. 2021;17( 5):15-19. [In Russ]
Сведения об авторах:
Носков Сергей Иванович, доктор технических наук, профессор, профессор кафедры информационных технологий и защиты информации; [email protected]
Попов Егор Сергеевич, магистрант кафедры информационных технологий и защиты информации; [email protected]
Серёдкин Сергей Петрович, кандидат экономических наук, доцент кафедры информационных технологий и защиты информации; [email protected]
Тирских Владимир Викторович, кандидат физико-математических наук, доцент кафедры информационных технологий и защиты информации; [email protected]
Торопов Виктор Дмитриевич, кандидат технических наук, доцент кафедры государственного управления и управления человеческими ресурсами; [email protected] Information about authors:
Sergey I. Noskov, Dr. Sci. (Eng), Prof., Prof., Department of Information Technologies and Information Security; [email protected]
Egor S. Popov, Undergraduate, Department of Information Technologies and Information Security; [email protected]
Sergey P. Seredkin, Cand. Sci. (Economic), Assoc. Prof., Department of Information Technologies and Information Security; [email protected]
Vladimir V. Tirskikh, Cand. Sci. (Physico-Mathematical), Assoc. Prof., Department of Information Technologies and Information Security; [email protected]
Viktor D. Toropov, Cand. Sci. (Eng), Assoc. Prof., Department of Public Administration and Human Resources Management; [email protected]
Конфликт интересов/Conflict of interest.
Авторы заявляют об отсутствии конфликта интересов/The authors declare no conflict of interest. Поступила в редакцию/ Received 20.12.2022. Одобрена после рецензирования / Reviced 21.01.2023. Принята в печать /Accepted for publication 21.01.2023.