Научная статья на тему 'Прогнозирование часов пик энергопотребления региональных энергосистем'

Прогнозирование часов пик энергопотребления региональных энергосистем Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
21
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
машинное обучение / прогнозирование / часы пиковой нагрузки / коммерческий оператор / рынки электрической энергии и мощности / оптимизация издержек / machine learning / forecasting / peak hours / commercial operator / electricity and capacity markets / cost optimization

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — С Р. Саитов, Н Д. Чичирова, А А. Филимонова, Н Б. Карницкий

Вторым товаром на рынках электрической энергии является электрическая мощность. Для потребителей тарифицируемый объем «генераторной» мощности определяется как среднее из часовых объемов потребления в рабочие дни в часы пиковой нагрузки в регионе. Стоимость мощности в отдельных регионах может достигать 40 % от конечного тарифа, поэтому снижение нагрузки в пиковые часы на 10 % может привести к уменьшению ежемесячных платежей на 3 %. Однако такой способ экономии для потребителя недоступен – коммерческий оператор оптового рынка электрической энергии и мощности публикует часы пиковой нагрузки регионов после 10-го числа следующего месяца, когда данная информация уже не актуальна. Своевременное прогнозирование часов пиковой нагрузки позволит, с одной стороны, снизить издержки потребителей на платежах за электрическую мощность, с другой – сгладить суточный график электрической нагрузки энергосистемы, оптимизировав тем самым работу генерирующего оборудования станций и сетей системного оператора. В статье приводится исследование эффективности методов машинного обучения в контексте прогнозирования пикового часа региональной энергосистемы. Исследование затрагивает временной период с ноября 2011-го по октябрь 2023 г., охватывает 76 регионов Российской Федерации, включая субъекты ценовых (1-й и 2-й) и неценовых зон и насчитывает 10 методов машинного обучения. Результаты исследования показали, что статистически метод кластеризации K-ближайших соседей оказывается наиболее точным, хоть и не универсальным. Высокую эффективность (с точки зрения точности и быстродействия) продемонстрировали методы опорных векторов и классификация деревьями. В ходе исследований также было опровергнуто предположение о том, что наибольшую ценность при прогнозировании пикового часа оказывают наиболее близкие, с позиции временного ряда, данные.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — С Р. Саитов, Н Д. Чичирова, А А. Филимонова, Н Б. Карницкий

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Forecasting Peak Hours for Energy Consumption in Regional Power Systems

Electrical power is the second most important commodity in electrical energy markets. For consumers, the charged amount of “generator” power is determined as the average value of hourly consumption amounts on working days during peak hours in the region. The cost of power in some regions can reach 40 % of the final tariff, so reducing the load during peak hours by 10 % can lead to a decrease in monthly consumer payments by 3 %. However, such a way of saving money is not available to the consumer since the commercial operator of the wholesale market of electricity and capacity publishes the peak hours of the regions after the 10th day of the next month, when this information is no longer relevant. Timely forecasting of peak hours will make it possible, on the one hand, to reduce consumer costs for payments for electric power, and on the other hand, to smooth out the daily schedule of electric load of the power system, thereby optimizing the operation of generating equipment of stations and networks of the system operator. The article presents a study of the effectiveness of machine learning methods in the context of forecasting the peak hour of a regional power system. The study concerns the period from November 2011 to October 2023, covers 76 regions of the Russian Federation, including subjects of price (1st and 2nd) and non-price zones and includes 10 machine-learning methods. The results of the study showed that statistically, the K-nearest neighbors clustering method turns out to be the most accurate, although not universal. Support Vector Classifier and Decision Tree Classifier have demonstrated high efficiency (in terms of accuracy and speed). The study also refuted the assumption that the closest data in terms of time series has the greatest value in predicting peak hours.

Текст научной работы на тему «Прогнозирование часов пик энергопотребления региональных энергосистем»

Энергетика. Изв. высш. учеб. заведений и энерг. объединений СНГ. Т. 67, № 1 (2024), с. 78-91 78 Епе^ейка. Proc. CIS Higher Educ. Inst. and Power Eng. Assoc. V. 67, No 1 (2024), pp. 78-91

https://doi.org/10.21122/1029-7448-2024-67-1-78-91 УДК 621.31, 004.852

Прогнозирование часов пик энергопотребления региональных энергосистем

С. Р. Саитов1*, Н. Д. Чичирова1*, А. А. Филимонова1*, Н. Б. Карницкий2)

'-Казанский государственный энергетический университет (Казань, Российская Федерация), ^Белорусский национальный технический университет (Минск, Республика Беларусь)

© Белорусский национальный технический университет, 2024 Belarusian National Technical University, 2024

Реферат. Вторым товаром на рынках электрической энергии является электрическая мощность. Для потребителей тарифицируемый объем «генераторной» мощности определяется как среднее из часовых объемов потребления в рабочие дни в часы пиковой нагрузки в регионе. Стоимость мощности в отдельных регионах может достигать 40 % от конечного тарифа, поэтому снижение нагрузки в пиковые часы на 10 % может привести к уменьшению ежемесячных платежей на 3 %. Однако такой способ экономии для потребителя недоступен - коммерческий оператор оптового рынка электрической энергии и мощности публикует часы пиковой нагрузки регионов после 10-го числа следующего месяца, когда данная информация уже не актуальна. Своевременное прогнозирование часов пиковой нагрузки позволит, с одной стороны, снизить издержки потребителей на платежах за электрическую мощность, с другой - сгладить суточный график электрической нагрузки энергосистемы, оптимизировав тем самым работу генерирующего оборудования станций и сетей системного оператора. В статье приводится исследование эффективности методов машинного обучения в контексте прогнозирования пикового часа региональной энергосистемы. Исследование затрагивает временной период с ноября 2011-го по октябрь 2023 г., охватывает 76 регионов Российской Федерации, включая субъекты ценовых (1-й и 2-й) и неценовых зон и насчитывает 10 методов машинного обучения. Результаты исследования показали, что статистически метод кластеризации K-ближайших соседей оказывается наиболее точным, хоть и не универсальным. Высокую эффективность (с точки зрения точности и быстродействия) продемонстрировали методы опорных векторов и классификация деревьями. В ходе исследований также было опровергнуто предположение о том, что наибольшую ценность при прогнозировании пикового часа оказывают наиболее близкие, с позиции временного ряда, данные.

Ключевые слова: машинное обучение, прогнозирование, часы пиковой нагрузки, коммерческий оператор, рынки электрической энергии и мощности, оптимизация издержек

Для цитирования: Прогнозирование часов пик энергопотребления региональных энергосистем / С. Р. Саитов [и др.] // Энергетика. Изв. высш. учеб. заведений и энерг. объединений СНГ. 2024. Т. 67, № 1. С. 78-91. https://doi.org/10.21122/1029-7448-2024-67-1-78-91

Адрес для переписки

Саитов Станислав Радикович

Казанский государственный

энергетический университет

ул. Красносельская, 51,

420066, г. Казань, Российская Федерация

Тел.: +7 843 519-42-20

caapel@mail.ru

Address for correspondence

Saitov Stanislav R.

Kazan State Power

Engineering University

51, Krasnoselskaya str.,

420066, Kazan, Russian Federation

Tel.: +7 843 519-42-20

caapel@mail.ru

Forecasting Peak Hours for Energy Consumption in Regional Power Systems

S. R. Saitov", N. D. Chichirova4, A. A. Filimonova", N. B. Karnitsky2)

'-Kazan State Power Engineering University (Kazan, Russian Federation), '^Belarusian National Technical University (Minsk, Republic of Belarus)

Abstract. Electrical power is the second most important commodity in electrical energy markets. For consumers, the charged amount of "generator" power is determined as the average value of hourly consumption amounts on working days during peak hours in the region. The cost of power in some regions can reach 40 % of the final tariff, so reducing the load during peak hours by 10 % can lead to a decrease in monthly consumer payments by 3 %. However, such a way of saving money is not available to the consumer since the commercial operator of the wholesale market of electricity and capacity publishes the peak hours of the regions after the 10th day of the next month, when this information is no longer relevant. Timely forecasting of peak hours will make it possible, on the one hand, to reduce consumer costs for payments for electric power, and on the other hand, to smooth out the daily schedule of electric load of the power system, thereby optimizing the operation of generating equipment of stations and networks of the system operator. The article presents a study of the effectiveness of machine learning methods in the context of forecasting the peak hour of a regional power system. The study concerns the period from November 2011 to October 2023, covers 76 regions of the Russian Federation, including subjects of price (1st and 2nd) and non-price zones and includes 10 machine-learning methods. The results of the study showed that statistically, the K-nearest neighbors clustering method turns out to be the most accurate, although not universal. Support Vector Classifier and Decision Tree Classifier have demonstrated high efficiency (in terms of accuracy and speed). The study also refuted the assumption that the closest data in terms of time series has the greatest value in predicting peak hours.

Keywords: machine learning, forecasting, peak hours, commercial operator, electricity and capacity markets, cost optimization

For citation: Saitov S. R., Chichirova N. D., Filimonova A. A., Karnitsky N. B. (2024) Forecasting Peak Hours for Energy Consumption in Regional Power Systems. Energetika. Proc. CIS Higher Educ. Inst. and Power Eng. Assoc. 67 (1), 78-91. https://doi.org/10.21122/1029-7448-2024-67-1-78-91 (in Russian)

Введение

Согласно постановлению Правительства Российской Федерации № 442 от 04.05.2012 (в ред. от 28.09.2023), класс потребителей, относящихся к «прочим потребителям» (все юридические лица, за исключением сетевых компаний), максимальная мощность энергопринимающих устройств которых в границах балансовой принадлежности составляет не менее 670 кВт, обязан рассчитываться с гарантирующим поставщиком за электрическую мощность как за отдельный товар.

Размер оплаты за «генераторную» мощность для потребителя в таком случае зависит от тарифов на электрическую мощность и от объемов его потребления в рабочие дни в пиковые часы нагрузки региона. Плановая разгрузка энергопотребляющих устройств в эти часы на 100 кВт способна принести ежемесячную экономию потребителю в размере 70-190 тыс. руб. (в соответствии с тарифами на мощность 2023 г. [1]). Проблема заключает-

ся в том, что пиковые часы регионов публикуются на сайте [2] администратора торговой системы (АТС) по итогу месяца, уже после даты потребления. Таким образом подобный способ оптимизации издержек для потребителя становится недоступным.

Для решения этой проблемы авторы исследования [3] предприняли попытку установить корреляционную зависимость между предшествующими и будущими часами пиковой нагрузки. Исследование проводилось для 262 энергосбытовых компаний, входящих в реестр гарантирующих поставщиков. Искомый пиковый час рассматривался как целочисленное значение, лежащее в диапазоне от 0 до 23, и описывался законом распределения дискретной случайной величины. Гипотеза авторов состояла в том, что на прогнозируемый пиковый час наибольшее влияние оказывают пиковые часы текущего дня и месяца за предыдущие годы. Точность прогноза оценивалась по соотношению совпавших планируемых и фактических пиковых часов к общему количеству рабочих дней.

Исследователи пришли к следующим выводам: 1) прогноз на основании только лишь пиковых часов текущих суток предыдущих лет дает сомнительный результат - точность прогноза по этой методике в 2021 г. в среднем по 81 региону РФ составила 39,4 %; 2) отсутствует какая-либо связь между ценовыми зонами и точностью прогноза; 3) разница в точности прогноза между ценовой (38,7 %) и неценовой (43,1 %) зонами не существенная; 4) в ряде регионов прослеживается прямая зависимость между предсказуемостью пиковых часов и сезонными условиями.

Схожий подход прогнозирования часов пиковой нагрузки с применением наивных методов описывается в работе [4]. В этом исследовании авторы затронули субъекты РФ, относящиеся к ценовым зонам (67 регионов). Период исследования: 2020-2022 гг. Были предложены и исследованы 10 наивных моделей. Точность прогноза оценивалась аналогично работе [3].

В результате исследования было установлено, что наилучший результат достигается для моделей, принимающих в качестве прогнозного значения: 1) наиболее частный пиковый час соответствующего месяца прошлого года - 43 %; 2) наиболее частный пиковый час скользящего окна в одну (44 %), две (44 %) и три (42 %) недели со смещением на год. Экономический эффект на каждый процент роста точности прогноза авторы оценили в размере 97,92 ± 15,84 руб./(кВтгод), исходя из тарифов на электрическую мощность в регионах.

В исследовании [5] часы пик определялись косвенным методом - на основании экстремумов планируемых суточных графиков электропотребления. По замыслу авторов, точность прогнозирования пиковых часов в таком случае будет зависеть от точности прогнозирования суммарного энергопотребления в регионе.

Прогнозирование энергопотребления выполнялось для Ярославской области с помощью методов нейросетевого моделирования, в частности MLP (Multi-Layer Perceptron), LSTM (Long Short Term Memory)

и CNN (Convolutional Neural Networks). Период исследования: 2016-2021 гг. Несмотря на относительно низкую погрешность этих методов (MAPE = = 3,43 %), точность прогноза часов пиковой нагрузки оказалась в пределах 27-36 %.

В этом же исследовании авторы предложили совместить свой метод с наивной моделью, описанной в работе [3] для прогнозирования двухчасового интервала вместо одночасового. В результате этого точность прогнозирования ожидаемо выросла и составила 74 %. Вместе с тем в исследовании [4] наглядно продемонстрировано, что расширение интервала прогнозирования приводит к резкому сокращению связанного экономического эффекта, а потому не имеет смысла.

Попытка установить более сложную зависимость между исходными данными и целевым признаком предпринята в работе [6]. В качестве исходных данных были рассмотрены не только календарные признаки (год, квартал, месяц, неделя, день), но и смещенные значения целевой переменной (смещение на 1 месяц и 1 год, мода по интервалу в 1 неделю и 1 месяц со смещением в 1 месяц и 1 год), астрономические (время восхода и заката, длительность светового дня, солнечный полдень и т.д.), метеорологические (температура воздуха, скорость ветра и т.п.) и энергосистемные (динамика энергопотребления на балансирующем рынке) признаки.

Исследование выполнялось для Краснодарского края с помощью методов машинного обучения (Machine Learning - ML): Decision Tree Classifier (DTC), Extra Trees Classifier (ETC), MLP Classifier (MLP) и Random Forest Classifier (RFC). Обучающая выборка включала данные за период 2014-2021 гг., тестовая - за 2023 г. Наилучший результат (62,7 %) для одночасового интервала был получен методом RFC при учете энергосистемных признаков с окном агрегирования данных 24 часа. Авторами сделан вывод, что при долгосрочном планировании значимыми оказываются лишь календарные признаки и смещенные значения целевой переменной.

О практической значимости рассматриваемой проблемы свидетельствует массовая регистрация программ для ЭВМ [7-13] российскими научными коллективами и крупными промышленными предприятиями в относительно короткий период времени - с 2021 по 2023 г.

Вместе с тем задача прогнозирования часов пиковой нагрузки не является популярной для зарубежных исследователей. Это связано со спецификой ценообразования на Российском розничном рынке электроэнергии и мощности (РРЭМ) [5].

Цель, стоящая перед авторами настоящей работы, - исследовать эффективность различных методов машинного обучения в контексте прогнозирования часов пита энергопотребления в масштабах всего РРЭМ Российской Федерации, включая ценовые (1-я и 2-я) и неценовые зоны, за более широкий временной интервал (2011-2023 гг.), с учетом ранее накопленного опыта.

Дополнительной задачей исследования также является оценка влияния гиперпараметров рассматриваемых моделей на конечный результат.

Материалы

Для исследования эффективности технологии машинного обучения была сформирована база данных (БД) пиковых часов 76 регионов Российской Федерации. Данные для БД получены из открытого источника - сайта коммерческого оператора Оптового рынка электрической энергии и мощности (ОРЭМ) [2]. Учитывая опыт работы [6] исходные данные были ограничены календарными (день, месяц, год) и целевым признаками (час). Исследуемый интервал (ноябрь 2011-го - октябрь 2023 г.) определялся временным диапазоном, доступным в источнике [2] на момент написания статьи.

Для возможности верификации моделей машинного обучения генеральная совокупность данных была разделена на две выборки: обучающую (2011-2022 гг.) и тестовую (2023 г.). Обучающая выборка для одного региона включала в себя 2654 записи, тестовая - 183.

Первичный анализ

Первичный анализ данных, выполненный на примере Ивановской области, показал, что:

• распределение пиковых часов внутри генеральной совокупности данных приближено к нормальному распределению Гаусса-Лапласа (рис. 1), что соответствует центральной предельной теореме [14];

• влияние исходных данных на целевой признак (пиковый час) распределено в следующем порядке: день (41,1 %), месяц (33,2 %) и год (25,7 %);

• отсутствует какая-либо существенная корреляционная связь между целевым признаком и исходными параметрами (табл. 1).

1800

9 10 11 12 13 14 15 16 17 18 19 20 21

Часы

Рис. 1. Распределение часов пиковой нагрузки в генеральной совокупности данных

Fig. 1. Distribution of peak hours in the population of data

Учитывая результаты первичного анализа, структуру БД, а также характер взаимодействия исследуемых признаков (рис. 2), приходим к выводу, что перед нами типичная задача классификации.

Таблица 1

Корреляция исходных данных с целевым признаком Correlation of source data with target feature

Период Год Месяц День Час

Год 1 -0,042776 0,009258 -0,176807

Месяц -0,042776 1 -0,041755 0,232005

День 0,009258 -0,041755 1 0,000965

Час -0,176807 0,232005 0,000965 1

2010 2015 2020 2025 Year

шшжшш йштш mm mm ««« «<:<•:« швтт

<Ж№*№ • • 9>

««»Ш r IB

Month Day

Рис. 2. Взаимосвязь исходных данных с целевым признаком Fig. 2. Relationship between source data and target feature

Hour • 10 12 14 16 18 • 20

Методы

Для решения задачи классификации применены следующие МЬ-ме-тоды:

• решающие деревья (DecisionTreeClassifier - БТС, рис. 3);

• градиентный бустинг Scikit (GradientBoostingClassifier);

• градиентный бустинг XgBoost (XGBClassifier);

• градиентный бустинг CatBoost (CatBoostClassifier);

• градиентный бустинг AdaBoost (AdaBoostClassifier);

• опорные векторы (SupportVectorClassifier - SVC);

• случайный лес (RandomForestClassifier - RFC);

• ансамбль Bagging Classifier (DTC);

• ансамбль Bagging Classifier (SVC);

• K-ближайших соседей (KNeighbors Classifier).

Рис. 3. Пример структуры решающего дерева Fig. 3. Example of decision tree structure

Построение прогнозных моделей осуществлялось по схеме, изображенной на рис. 4, с помощью программы для ЭВМ [13].

Настройка оптимальных гиперпараметров ML-моделей производилась методами кросс-валидации: через рандомизированный поиск (Randomized-SearchCV) для SVC и Bagging Classifier (SVC) и с помощью сетки гиперпараметров (GridSearchCV) для остальных ML-методов. В параметрах самой кросс-валидации было задано пять разрезов данных (n_splits = 5).

В процессе кросс-валидации для метода SVC проводился рандомизированный поиск констант ядра у и регуляризации С в диапазонах 0,01-100,0 и 0,01-1,0 соответственно. Среди вариантов ядра (kernel) рассматривались только линейное (rbf) и радиальное (linear) ядра, поскольку полиноминальное (poly) ядро резко снижало быстродействие алгоритма, не повышая при этом качества модели. Полученные гиперпараметры (kernel, у, C) также передавались в метод BaggingClassifier(SVC), ускоряя работу этого алгоритма за счет исключения потребности в повторном рандомизированном поиске.

В целях минимизации объема алгоритма кросс-валидации для ML-методов DTC, RFC и Bagging(DTC) строилась сетка лишь из одного гиперпа-

раметра - «глубина дерева» (max_depth). В работе [15] показано, что параметр «количество деревьев» (n_estimators) незначительно влияет на качество модели, поэтому в сетку не включался и был оставлен по умолчанию (default = 100).

В методе KNeighborsClassifier настройка проводилась для двух гиперпараметров - типа весов (weigths) и количество соседей (n_neighbors). Тип весов выбирался из однородных (uniform) и неоднородных (distance), количество соседей ступенчато варьировалось от 2 до 100.

Обучение и оценка моделей осуществлялись как при полном наборе исходных признаков, так и при частичном их отборе (рис. 4, табл. 2).

Рис. 4. Схема разработки прогнозной модели Fig. 4. Scheme for developing a predictive model

Таблица 2

Оценка моделей на примере данных Ивановской области Evaluation of models using data from the Ivanovo region as an example

Метод Метрика (Точность) / Гиперпараметр (глубина)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Д + М + Г1 Д + М Д + Г М + Г

Naive Models [3] - - 62,63 % -

DTC 67,21 %/6 63,39 %/2 63,39 %/2 63,39 %/6

Gradient boost 63,39 % 63,39 % 63,39 % 63,39 %

Xgboost 52,46 % 63,39 % 57,92 % 63,39 %

CatBoost 60,66 % 63,39 % 58,47 % 63,39 %

AdaBoost 63,39 % 57,38 % 63,39 % 63,39 %

SVC2 71,58 % - - -

RFC 63,39 %/2 63,39 %/2 63,39 %/4 63,39 %/9

Bagging(DTC) 57,92 %/4 63,39 %/4 59,02 %/18 69,95 %/3

Bagging(SVC) 59,56 %/4 63,39 %/2 61,2 %/11 71,58 %/4

KNeighbors3 66,12 %/25 63,39 %/6 65,57 %/66 69,95 %/20

1Д - день, М - месяц, Г - год. 2kernel = rbf, у = 0,4986865424754635, C = 77,06343825607371, r = 0,5. 3MinMaxScaler, weights = uniform.

Предварительная обработка данных в виде стандартизации (Standard-Scaler) и нормализации (MinMaxScaler) оказывала какой-либо эффект на модель только для методов KNeighbors и SVC, поэтому для других ML-ме-тодов не применялась.

Так как перед авторами стояла задача мультиклассовой классификации (пример на рис. 1 - 11 уникальных классов), из всех возможных метрик качества моделей (accuracy, precision, recall, specificity, И-мера и др.) была выбрана лишь одна - accuracy. В контексте прогноза сущность этой оценки соответствует понятию «точность» из статьи [3]. Пример такой оценки, выполненной по схеме на рис. 4, представлен в табл. 2.

Обсуждение результатов

Исследование, выполненное по схеме 4 для БД 76 регионов РФ, показало, что применение моделей, построенных на ML-методах, приводит к росту точности прогнозирования в среднем на 13,54 % (рис. 5) по сравнению с наивными моделями, описанными в работах [3, 4]. Лучший результат был получен для Кемеровской области - в этом регионе точность прогноза выросла на 29,4 %: с 41,05 до 70,45 %. Снижение точности прогноза при использовании ML-методов произошло лишь в одном регионе - Оренбургской области. Падение здесь составило 1,88 %.

100 90 80 70605040-

g 30-o

% 20-o

H 10 H

o4

tf И

О &

M О

¡5

о &

0,2

0,4

0,6

0,8

—I

1,0

Доля регионов с точностью прогнозирования меньше значения по оси Y

Рис. 5. Распределения точности прогноза между регионами РФ Fig. 5. Distribution of forecast accuracy by regions of the Russian Federation

В процессе выбора наилучших методов (рис. 6), в случае совпадения результатов, предпочтение отдавалось более быстрым (с точки зрения скорости вычислений).

Статистически KNeighbors оказывался лучшим методом прогнозирования, однако, как видно из диаграммы (рис. 6), универсальным его назвать нельзя. Наибольшей интерпретируемостью и быстродействием обладает метод DTC. Метод SVC показывал отличные результаты при оценке модели, но при этом расходовал значительное время на рандомизированный поиск гиперпараметров. Наиболее «дорогими», с точки зрения процессорного времени, и наименее эффективными (рис. 6) оказывались Bagging-и Boosting-методы. Это делает их непригодными в контексте решения нашей задачи.

31

13 ь

(3

о н Q

Рис. 6. Частота классификации метода как наилучшего Fig. 6. Distribution of best methods for peak hour estimation

0

Параллельно с процессом исследования эффективности ML-моделей проводилась проверка гипотезы, выдвинутой в работах [3-6], согласно которой наибольшую ценность при прогнозировании пикового часа имеют ближайшие, с позиции временного ряда, данные. Для этого фиксировался гиперпараметр weights метода KNeighbors, при котором последний давал наилучший результат (рис. 7).

38

indifferent uniform distance

Рис. 7. Тип весов при высшей метрике метода K-ближайших соседей Fig. 7. Type of weights at the highest metric of the K-Nearest Neighbors method

Проверка показала, что в большинстве случаев (38/76) моделям был безразличен тип весов. При этом в некоторых регионах (22/76) модель с однородными весами даже демонстрировала большую эффективность. Данное наблюдение свидетельствует о том, что ценность исходных данных не зависит от их близости к целевому признаку.

ВЫВОДЫ

1. Применение технологии машинного обучения в задачах прогнозирования часов пик энергопотребления региональных энергосистем позволяет повысить точность прогнозирования (в среднем по РРЭМ) на 13,54 % по сравнению с существующими наивными моделями.

2. Наиболее подходящими методами для решения таких задач являются KNeighbors Classifier, Decision Tree Classifier и Support Vector Classifier библиотеки Scikit Learn.

3. Близость, с позиции временного ряда, исходных данных к искомому целевому признаку в большинстве случаев не влияет на их ценность.

4. Несмотря на рост прогнозируемости моделей вследствие применения технологии машинного обучения, их средняя точность остается на уровне 51,83 %, что свидетельствует о проблемах, связанных с самой базой данных, а точнее, с ее объемом.

Исследование выполнено при финансовой поддержке Министерства науки и высшего образования Российской Федерации в рамках проекта «Изучение процессов в гибридной энергетической установке "топливный элемент - газовая турбина"» (шифр проекта: FZSW-2022-0001).

ЛИТЕРАТУРА

1. Составляющие предельных уровней нерегулируемых цен // АО «Администратор торговой системы» [Электронный ресурс]. 2002-2023. - Режим доступа: https://www.ats energo.ru/results/market/svnc. Дата доступа: 01.11.2023.

2. Часы пиковой нагрузки // АО «Администратор торговой системы» [Электронный ресурс]. 2002-2023. - Режим доступа: https://www.atsenergo.ru/results/market/calcfacthour. Дата доступа: 01.11.2023.

3. Саитов, С. Р. Прогнозирование пиковых часов энергосбытовых компаний, входящих в реестр гарантирующих поставщиков АО «АТС» / С. Р. Саитов, Б. Р. Карачурин, М. В. Сидоров // Вестник Казанского государственного энергетического университета. 2022. Т. 14, № 4 (56). С. 59-68.

4. Воронин, В. А. Прогнозирование часов пиковой нагрузки региональных энергосистем с использованием наивных моделей / В. А. Воронин, Ф. С. Непша // Интеллектуальная электротехника. 2023. № 3 (23). С. 111-124. https://doi.org/10.46960/2658-6754_2023_3_111.

5. Марьясин, О. Ю. Прогнозирование рыночных цен на электроэнергию и часов пиковой нагрузки для региона Российской Федерации / О. Ю. Марьясин, А. И. Лукашов, Н. А. Смирнов // Управление большими системами. 2022. Вып. 99. С. 81-113. https://doi. org/10.25728/ubs. 2022.99.4

6. Воронин, В. А. Прогнозирование часов пиковой нагрузки региональной энергосистемы с использованием методов машинного обучения / В. А. Воронин, Ф. С. Непша // Цифровые технологии и платформенные решения для управления развитием электроэнергетики: cб. науч. тр. I Всерос. науч.-практ. конф., Севастополь, 23 марта 2023 г. / Сев. гос. ун-т. Севастополь, 2023. С. 107-113.

7. Программа для краткосрочного прогнозирования значений временного ряда часов максимальной пиковой нагрузки: а. с. 2021617818 Рос. Федерация / В. С. Журавлев, Е. А. Шаповалов. Опубл. 19.05.2021.

8. Программа для определения оптимального профиля энергопотребления с учетом цен на электроэнергию и часов пиковой нагрузки: cвидетельство о государственной регистрации программы для ЭВМ № 2021669137 Рос. Федерация / Н. А. Смирнов, О. Ю. Марьясин. Опубл. 24.11.2021.

9. «EMAS.FORECAST»: cвидетельство о государственной регистрации программы для ЭВМ № 2021617882 Рос. Федерация / С. А. Шатунова; заявитель ООО «НБИ-ЛАБ». Опубл. 20.05.2021.

10. Электронно-математическая модель (ЭММ) прогнозирования фактических часов пиковой нагрузки, устанавливаемых коммерческим оператором для определения объема фактического пикового потребления гарантирующего поставщика: Свидетельство о государственной регистрации программы для ЭВМ № 2022668587 Рос. Федерация / А. Н. Сагаян, Р. А. Травников. Опубл. 10.10.2022.

11. ЦПУС.04 «Программа для краткосрочного и долгосрочного прогнозирования DA, ША, МА электрической нагрузки»: Свидетельство о государственной регистрации программы для ЭВМ № 2022666925 Рос. Федерация / С. В. Грибанов, А. В. Кычкин. Опубл. 12.09.2022.

12. Программное обеспечение по прогнозированию часов пиковых нагрузок региона и объекта потребления, а также формированию графика нагрузки на объектах производственно-хозяйственных нужд (включая СНЭ) в целях оптимизации стоимости покупной электрической мощности у энергоснабжающей организации: cвидетельство о государственной регистрации программы для ЭВМ 2023662409 Рос. Федерация / Л. С. Бируля, Т. П. Олиянчук, Д. Г. Роднев, Е. И. Смирнова, И. Н. Широков; заявители АО «Атом-энергопромсбыт», ПАО «Россети Центр и Приволжье». Опубл. 07.06.2023.

13. Программа расчета прогнозных значений пиковых часов коммерческого оператора ОРЭМ: cвидетельство о государственной регистрации программы для ЭВМ № 2023618806 Рос. Федерация / С. Р. Саитов, Н. Д. Чичирова, А. А. Филимонова; заявитель ФГБОУ ВО «Казанский гос. энергетический ун-т». Опубл. 28.04.2023.

14. Central limit theorem [Electronic Resource] // Wikipedia. - Mode of access: https://en.wiki pedia.org/wiki/Normal_distribution. - Date of access: 01.11.2023.

15. Rank Analysis and Ensemble Machine Learning Model for Load Forecasting in the Nodes of the Central Mongolian Power System / T. Osgonbaatar, P. Matrenin, M. Safaraliev, I. Zicmane, A. Rusina // Inventions. - 2023. № 8(114). P. 1-20. https://doi.org/10.3390/inven tions8050114.

16. Повышение точности прогнозирования генерации фотоэлектрических станций на основе алгоритмов ¿-средних и ¿-ближайших соседей / П. В. Матренин [и др.] // Энергетика. Изв. высш. учеб. заведений и энерг. объединений СНГ. 2023. Т. 66, № 4. С. 305-321. https://doi.org/10.21122/1029-7448-2023-66-4-305-321.

17. Оптимизация топологии сети с ВИЭ-генерацией на основе модифицированного адаптированного генетического алгоритма / А. М. Брамм [и др.] // Энергетика. Изв. высш. учеб. заведений и энерг. объединений СНГ. 2022. Т. 65, № 4. С. 341-354. https://doi.org/10. 21122/1029-7448-2022-65-4-341-354.

18. Румянцев, Ю. В. Определение насыщения трансформатора тока на основе использования искусственной нейронной сети / Ю. В. Румянцев // Энергетика. Изв. высш. учеб. заведений и энерг. объединений СНГ. 2023. Т. 66, № 3. С. 233-245. https://doi.org/10. 21122/1029-7448-2023-66-3-233-245.

Поступила 17.10.2023 Подписана в печать 19.12.2023 Опубликована онлайн 31.01.2024 REFERENCES

1. Components of the Maximum Levels of Unregulated Prices. JSC "Administrator of the Trading System". 2002-2023. Available at: https://www.atsenergo.ru/results/market/svnc. (accessed 01 November 2023) (in Russian).

2. Peak Hours. JSC "Administrator of the Trading System". 2002-2023. Available at: https://www.atsenergo.ru/results/market/calcfacthour (accessed 01 November 2023) (in Russian).

3. Saitov S R., Karachurin B R., Sidorov M. V. (2022) Forecasting Electricity Consumption Peak Hours of Energy Supply Company Included in the Registry of Public Corporation ATSEN-ERGO. Vestnik Kazanskogo Gosudarstvennogo Energeticheskogo Universiteta = Kazan State Power Engineering University Bulletin, 14 (4), 59-68 (in Russian).

4. Voronin V. A., Nepsha F. S. (2023) Forecasting Peak Load Hours of Regional Power Systems Using Naive Models. Smart Electrical Engineering, (3), 111-124. https://doi.org/10.46960/ 2658-6754_2023_3_111 (in Russian).

5. Maryasin O., Lukashov A., Smirnov N. (2022) Market Electricity Prices and Peak Load Hours Forecasting for a Region of the Russian Federation. Upravlenie Bol'shimi Sistemami = Large-Scale Systems Control, 99, 81-113. https://doi.org/10.25728/ubs.2022.994 (in Russian).

6. Voronin V. A., Nepsha F. S. (2023) Forecasting Load Hours of the Regional Energy System Using Machine Learning Methods. Tsifrovye Tekhnologii i Platformennye Resheniya Dlya Up-ravleniya Razvitiem Elektroenergetiki: Sb. Nauch. Tr. I Vseros. Nauch.-Prakt. Konf., Sevastopol', 23 Marta 2023 Goda [Digital Technologies and Platform Solutions for Managing the Development of the Electric Power Industry: Collection of Scientific Papers of the I All-Russian Scientific and Practical Conference, Sevastopol, March 23, 2023]. Sevastopol, 107-113 (in Russian).

7. Zhuravlev V. S., Shapovalov E. A. (2021) A Program for Short-Term Forecasting of the Values of the Time Series of Hours of Maximum Peak Load. Certificate of State Registration of a Computer Program No RU 2021617818 (in Russian).

8. Smirnov N. A., Maryasin O. Y. (2021) A Program for Determining the Optimal Energy Consumption Profile, Taking into Account Electricity Prices and Peak Hours. Certificate of State Registration of a Computer Program No RU 2021669137 (in Russian).

9. Shatunova S. A. (2021) "EMAS.FORECAST". Certificate of State Registration of a Computer Program No RU 2021617882 (in Russian).

10. Sagayan A. N., Travnikov R. A. (2021) An Electronic Mathematical Model (EMM) for Forecasting the Actual Peak Hours Set by a Commercial Operator to Determine the Volume of Actual Peak Consumption of a Guaranteeing Supplier. Certificate of State Registration of a Computer Program No RU 2022668587 (in Russian).

11. Gribanov S. V., Kychkin A. V. (2022) DPDM.04 "Program for Short-Term and Long-Term Forecasting of DA, WA, MA Electrical Load". Certificate of State Registration of a Computer Program No RU 2022666925 (in Russian).

12. Birulya L. S., Oliyanchuk T. P., Rodnev D. G., Smirnova E. I., Shirokov I. N. (2023) Software for Forecasting Peak Hours of the Region and the Object of Consumption, as Well as for Formation of a Load Schedule at Production and Economic Facilities (including ESS) in Order to Optimize the Cost of Purchased Electrical Power from an Energy Supply Organization. Certificate of State Registration of a Computer Program No RU 2023662409 (in Russian).

13. Saitov S. R., Chichirova N. D., Filimonova A. A. (2023) The Program for Calculating the Forecast Values of Peak of the OREM Commercial Operator. Certificate of State Registration of a Computer Program No RU 2023618806 (in Russian).

14. Normal Distribution. Wikipedia. Available at: https://en.wikipedia.org/wiki/Normal_distribu tion (accessed 01 November 2023).

15. Osgonbaatar T., Matrenin P., Safaraliev M., Zicmane I., Rusina A. (2023) A Rank Analysis and Ensemble Machine Learning Model for Load Forecasting in the Nodes of the Central Mongolian Power System. Inventions, 8 (5), 114. https://doi.org/10.3390/inventions8050114.

16. Matrenin P. V., Khalyasmaa A. I., Gamaley V. V., Eroshenko S. A., Papkova N. A., Sekatski D. A., Potachits Y. V. (2023) Improving of the Generation Accuracy Forecasting of Photovoltaic Plants Based on k-Means and k-Nearest Neighbors Algorithms. Energetika. Izvestiya Vys-shikh Uchebnykh Zavedenii i Energeticheskikh Ob'edinenii SNG = Energetika. Proceedings of CIS Higher Education Institutions and Power Engineering Associations, 66 (4), 305-321. https://doi.org/10.21122/1029-7448-2023-66-4-305-321 (in Russian).

17. Bramm A. M., Khalyasmaa A. I., Eroshenko S. A., Matrenin P. V., Papkova N. A., Sekatski D. A. (2022) Topology Optimization of the Network with Renewable Energy Sources Generation Based on a Modified Adapted Genetic Algorithm. Energetika. Izvestiya Vysshikh Uchebnykh Zavedenii i Energeticheskikh Ob'edinenii SNG = Energetika. Proceedings of CIS Higher Education Institutions and Power Engineering Associations, 65 (4), 341-354. https://doi.org/10. 21122/1029-7448-2022-65-4-341-354 (in Russian).

18. Rumiantsev Yu. V. (2023) Current Transformer Saturation Detection Method Based on Artificial Neural Network. Energetika. Izvestiya Vysshikh Uchebnykh Zavedenii i Energeticheskikh Ob'edinenii SNG = Energetika. Proceedings of CIS Higher Education Institutions and Power Engineering Associations. 66 (3), 233-245. https://doi.org/10.21122/1029-7448-2023-66-3-233-245 (in Russian). Date of Access: 04.01.2024.

Received: 17 October 2023 Accepted: 19 December 2023 Published online: 31 January 2024

i Надоели баннеры? Вы всегда можете отключить рекламу.