Научная статья на тему 'ПРОГНОЗИРОВАНИЕ ПЛАНОВОГО ПОТРЕБЛЕНИЯ ЭЛЕКТРОЭНЕРГИИ ДЛЯ ОБЪЕДИНЕННОЙ ЭНЕРГОСИСТЕМЫ С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ'

ПРОГНОЗИРОВАНИЕ ПЛАНОВОГО ПОТРЕБЛЕНИЯ ЭЛЕКТРОЭНЕРГИИ ДЛЯ ОБЪЕДИНЕННОЙ ЭНЕРГОСИСТЕМЫ С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
254
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОПОТРЕБЛЕНИЕ / ПРОГНОЗИРОВАНИЕ / ГРАДИЕНТНЫЙ БУСТИНГ / ИСКУССТВЕННАЯ НЕЙРОННАЯ СЕТЬ / МАШИННОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Клюев Р.В., Моргоева А.Д., Гаврина О.А., Босиков И.И., Моргоев И.Д.

Представлены результаты исследований по разработке прогностических моделей по ретроспективным данным о плановом потреблении электроэнергии в регионе со значительной долей предприятий минерально-сырьевого комплекса. Поскольку энергоемкость промышленности остается довольно высокой, актуальна задача по рационализации потребления электроэнергии. Одним из путей повышения точности управления при планировании расходов на электроэнергию является прогнозирование электрических нагрузок. Несмотря на большое количество научных работ по теме прогнозирования электропотребления, данная проблема остается актуальной из-за изменяющихся требований оптового рынка электроэнергии и мощности к точности прогнозов. Поэтому цель настоящего исследования - поддержка управленческих решений в процессе планирования объемов электропотребления. Для этого необходимо создать прогностическую модель и определить перспективное электропотребление энергосистемы. С этой целью проведен сбор и анализ исходных данных, их предобработка, отбор признаков, создание моделей и их оптимизация. Созданные модели основаны на ретроспективных данных о плановом электропотреблении, показателях работы энергосистемы (частоте), а также метеорологических данных. Методы исследований - ансамблевые методы машинного обучения (алгоритмы случайного леса, градиентного бустинга XGBoost и CatBoost), а также модель рекуррентной нейронной сети долгой краткосрочной памяти (LSTM). Полученные модели позволяют с достаточно высокой точностью создавать краткосрочные прогнозы электропотребления (на период от одних суток до недели). Применение моделей, основанных на алгоритмах градиентного бустинга, и моделей нейронных сетей дали прогноз с погрешностью менее 1 %, что позволяет рекомендовать их для применения при прогнозировании планового электропотребления объединенных энергосистем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Клюев Р.В., Моргоева А.Д., Гаврина О.А., Босиков И.И., Моргоев И.Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING PLANNED ELECTRICITY CONSUMPTION FOR THE UNITED POWER SYSTEM USING MACHINE LEARNING

The paper presents the results of studies of the predictive models development based on retrospective data on planned electricity consumption in the region with a significant share of enterprises in the mineral resource complex. Since the energy intensity of the industry remains quite high, the task of rationalizing the consumption of electricity is relevant. One of the ways to improve control accuracy when planning energy costs is to forecast electrical loads. Despite the large number of scientific papers on the topic of electricity consumption forecasting, this problem remains relevant due to the changing requirements of the wholesale electricity and power market to the accuracy of forecasts. Therefore, the purpose of this study is to support management decisions in the process of planning the volume of electricity consumption. To realize this, it is necessary to create a predictive model and determine the prospective power consumption of the power system. For this purpose, the collection and analysis of initial data, their preprocessing, selection of features, creation of models, and their optimization were carried out. The created models are based on historical data on planned power consumption, power system performance (frequency), as well as meteorological data. The research methods were: ensemble methods of machine learning (random forest, gradient boosting algorithms, such as XGBoost and CatBoost) and a long short-term memory recurrent neural network model (LSTM). The models obtained as a result of the conducted studies allow creating short-term forecasts of power consumption with a fairly high precision (for a period from one day to a week). The use of models based on gradient boosting algorithms and neural network models made it possible to obtain a forecast with an error of less than 1 %, which makes it possible to recommend the models described in the paper for use in forecasting the planned electricity power consumption of united power systems.

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ ПЛАНОВОГО ПОТРЕБЛЕНИЯ ЭЛЕКТРОЭНЕРГИИ ДЛЯ ОБЪЕДИНЕННОЙ ЭНЕРГОСИСТЕМЫ С ПОМОЩЬЮ МАШИННОГО ОБУЧЕНИЯ»

Научная статья

Прогнозирование планового потребления электроэнергии для объединенной энергосистемы с помощью машинного обучения

Р.В.КЛЮЕВ1, А.Д.МОРГОЕВА2Н, О.А.ГАВРИНА2, И.И.БОСИКОВ2, И.Д.МОРГОЕВ2

1 Московский политехнический университет, Москва, Россия

2 Северо-Кавказский горно-металлургический институт (государственный технологический университет), Владикавказ, Россия

Как цитировать эту статью: Клюев Р.В., Моргоева А.Д., Гаврина О.А., Босиков И.И., Моргоев И.Д. Прогнозирование планового потребления электроэнергии для объединенной энергосистемы с помощью машинного обучения // Записки Горного института. 2023. Т. 261. С. 392-402. EDN FJGZTV

Аннотация. Представлены результаты исследований по разработке прогностических моделей по ретроспективным данным о плановом потреблении электроэнергии в регионе со значительной долей предприятий минерально-сырьевого комплекса. Поскольку энергоемкость промышленности остается довольно высокой, актуальна задача по рационализации потребления электроэнергии. Одним из путей повышения точности управления при планировании расходов на электроэнергию является прогнозирование электрических нагрузок. Несмотря на большое количество научных работ по теме прогнозирования электропотребления, данная проблема остается актуальной из-за изменяющихся требований оптового рынка электроэнергии и мощности к точности прогнозов. Поэтому цель настоящего исследования - поддержка управленческих решений в процессе планирования объемов электропотребления. Для этого необходимо создать прогностическую модель и определить перспективное электропотребление энергосистемы. С этой целью проведен сбор и анализ исходных данных, их предобработка, отбор признаков, создание моделей и их оптимизация. Созданные модели основаны на ретроспективных данных о плановом электропотреблении, показателях работы энергосистемы (частоте), а также метеорологических данных. Методы исследований - ансамблевые методы машинного обучения (алгоритмы случайного леса, градиентного бустинга XGBoost и CatBoost), а также модель рекуррентной нейронной сети долгой краткосрочной памяти (LSTM). Полученные модели позволяют с достаточно высокой точностью создавать краткосрочные прогнозы электропотребления (на период от одних суток до недели). Применение моделей, основанных на алгоритмах градиентного бустинга, и моделей нейронных сетей дали прогноз с погрешностью менее 1 %, что позволяет рекомендовать их для применения при прогнозировании планового электропотребления объединенных энергосистем.

Ключевые слова: электропотребление; прогнозирование; градиентный бустинг; искусственная нейронная сеть; машинное обучение

Поступила: 14.03.2023 Принята: 20.06.2023 Онлайн: 19.07.2023 Опубликована: 19.07.2023

Введение. Энергосберегающие подходы занимают важное место в современном мире. Одним из направлений исследований в области энергосбережения, имеющим высокую практическую и научную значимость, является прогнозирование электропотребления. Это связано прежде всего с тем, что электрическая энергия является ресурсом, необходимым для обеспечения всех сфер жизнедеятельности общества. Особенно большое электропотребление наблюдается в промышленности, в частности на предприятиях минерально-сырьевого комплекса. При этом прогнозирование электропотребления применяется в решении различных задач, каждая из которых непременно подчинена одной цели - оптимальному управлению электропотреблением, т.е. минимизации потребления электроэнергии с сохранением необходимого уровня качества выполнения основных функциональных процессов.

В соответствие с концепцией ценозависимого потребления электроэнергии, известной под термином demand response [1, 2], стало возможным создавать экономически выгодные для всех участников рынка электроэнергии условия производства, распределения и потребления электроэнергии: генерирующих и электросетевых компаний, крупных потребителей электроэнергии и др.

Во многих странах на текущий момент функционируют оптовые рынки электроэнергии и мощности (ОРЭМ), на которых предлагаются различные условия покупки электроэнергии. Рынок на сутки вперед и балансирующий рынок являются сегментами ОРЭМ, и основное условие, необходимое для участия в них, - наличие достоверного прогноза электропотребления. В этой связи прогнозирование - актуальная производственная и научная задача, решение которой определяет экономическую эффективность для всех участников ОРЭМ и способствует развитию методов прогнозирования в целом.

Эффективность энергосбережения за счет прогнозирования электропотребления отражена во многих научных работах [3-5]. При этом исследователи применяют различные методы прогнозирования электропотребления, такие как методы классического и глубокого машинного обучения [6-8], математические модели с нечеткой логикой [9], а также модели, учитывающие сезонность временных рядов электропотребления [10] и другие подходы [11, 12]. В обзоре [13] приведены результаты сравнительного анализа методов прогнозирования электропотребления в соответствии с классификацией применяемых методов в зависимости от горизонта прогноза. Стоит отметить, что, несмотря на большое разнообразие методов прогнозирования электропотребления, отсутствуют универсальные подходы, позволяющие для каждой предметной области получать достоверный прогноз электропотребления. Обусловлено это главным образом изменяющимися требованиями к точности прогнозирования, необходимостью учета большого количества факторов, характеризующих специфику предметной области, для которой проводится прогнозирование, а также прогрессом в области технологий интеллектуального анализа данных, позволяющим эффективнее, чем традиционные методы математической статистики (экспоненциальное сглаживание, скользящее среднее и др.), обрабатывать большие массивы данных, и др. причинами. Поэтому было принято решение провести прикладное исследование, заключающееся в прогнозировании электропотребления с помощью современных средств интеллектуального анализа данных для объединенной энергосистемы с большой долей предприятий минерально-сырьевого комплекса. Таким образом, цель данной работы - прогнозирование планового потребления электроэнергии, оценка точности прогнозирования и разработка рекомендаций по практическому применению некоторых из предложенных методов прогнозирования, а также по необходимости учета факторов, характеризующих электропотребление.

Прогнозирование потребления электроэнергии было проведено на примере объединенной энергосистемы Урала - региона с большой концентрацией предприятий минерально-сырьевого комплекса, являющихся на оптовом рынке электроэнергии и мощности крупными потребителями электроэнергии. На рис.1 представлена структура потребления электроэнергии за 2021 г. по данным Единой межведомственной информационно-статистической системы* для Уральского федерального округа (УФО). Из рис. 1 видно, что наибольшее потребление электроэнергии приходится на добычу полезных ископаемых (70888,4 ГВт-ч).

Метрополитен Трамвайный, троллейбусный транспорт Деятельность прочего сухопутного транспорта Транспортирование газа и продуктов его переработки

Строительство

Транспортирование нефти и нефтепродуктов Бытовое потребление сельского населения Электротяга на железнодорожном транспорте Деятельность железнодорожного транспорта Прочие виды экономической деятельности На собственные нужды электростанции Потери в электросетях общего пользования Бытовое потребление городского населения Потребление населением Обрабатывающие производства

Добыча полезных ископаемых

0

10000

30000 50000

Электропотребление, ГВтч

Рис.1. Структура потребления электроэнергии в УФО за 2021 г.

70000

Единая межведомственная информационно-статистическая система. URL: https://www.fedstat.ru/indicator/43277 (дата обращения 12.03.2023).

Отклонение фактических значений от плановых ведет к увеличению издержек для всех участников оптового рынка электроэнергии [14-16]. Поэтому цель данного исследования связана с поддержкой управленческих решений в процессе определения оптимальных значений выработки и потребления электроэнергии за счет почасового прогнозирования планового потребления и генерации электроэнергии на период от суток до недели. Поставленная цель была реализована в несколько этапов: проанализирован предшествующий мировой опыт применения различных подходов к прогнозированию электропотребления; получены ретроспективные данные о плановом электропотреблении, погодные данные и данные индикаторов работы рассматриваемой энергосистемы, произведен их анализ; построены прогностические модели и оценена их достоверность, сформулированы основные выводы по исследованию. Научная новизна работы - исследование факторов, влияющих на величину потребления электроэнергии объеденной энергосистемы, а также создание прогностических моделей, основанных на современных алгоритмах градиентного бустинга и искусственных нейронных сетей и их оптимизации. Конечным результатом исследования, представляющим научную ценность, являются рекомендации по применению факторов экономического и метеорологического характера при разработке прогнозных моделей для крупных энергосистем с потребителями - предприятиями минерально-сырьевого комплекса, а также опыт применения конкретных алгоритмов машинного обучения и полученные в результате исследования конфигурационные параметры моделей.

Методы. Перед описанием конкретных методов, примененных в данном исследовании, отметим несколько наиболее современных подходов к прогнозированию электропотребления. С этой целью проведен поиск по базе данных научных публикаций на сайтах ScienceDirect.com и Re-searchGate.net по ключевым словам: forecasting, energy power consumption, machine learning, deep learning, modeling, short-term forecasting, mining industry и др. Результаты поиска содержат более 1000 научных публикаций. Была рассмотрена часть из этих работ, наиболее соответствующая целям настоящего исследования, и составлена таблица с результатами анализа некоторых из существующих методов прогнозирования (табл.1), в которой анализируемые исследования сгруппированы по применяемым методам прогнозирования, а также отражены такие количественные и качественные характеристики результатов исследований, как глубина прогноза, входные и выходные данные, краткое описание объекта, прогнозирование электропотребления которого проводится, погрешность прогноза.

Таблица 1

Анализ методов прогнозирования электропотребления

Методы Объект исследования Глубина прогноза Качество прогноза Входные/выходные данные Источник

Модель с долгой краткосрочной памятью ^ТМ) Порт Пусан, Южная Корея 1 мес R2 = 0,973 RMSE = 107105 Входные данные: прогноз ежемесячной пропускной способности порта. Прогнозируемая величина: потребление электроэнергии [17]

Гибридный: сезонная и трендовая декомпозиция с использованием локально-взвешенной регрессии, градиентного бустинга XGBoost и регрессии опорных векторов Оператор оптового рынка электроэнергии в Австралии 12 ч 24 ч sMAPE = 0,75-3,18 % sMAPE = 1,56-7,72 % Входные данные: временной ряд электрической нагрузки. Прогнозируемая величина: электрическая нагрузка [18]

Ансамблевая модель: LSTM, GRU и TCN Данные электросетевой компании Беджая, Алжир 1 мес MAPEmm = 0,64 % MAPEmax = 10,16 % Входные данные: данные электропотребления за предыдущие 12 мес. Выходные данные: потребление электроэнергии [19]

В представленных в табл. 1 исследованиях применялись различные подходы при прогнозировании электропотребления. В работах [18, 19] использованы ретроспективные данные электропотребления в качестве предикторов, в статье [17] исследован фактор, значительно влияющий на величину потребления электроэнергии. Однако в указанных работах не исследованы экзогенные факторы, нелинейно влияющие на величину потребления электроэнергии, такие как метеорологические, социальные, экономические и др.

В работе [20] представлены результаты прогнозирования продаж электроэнергии на основе глубокой пространственно-временной остаточной нейронной сети (Deep Spatio-Temporal Residual Network - ST-ResNet). Прогнозирование продаж напрямую связано с планированием выработки электроэнергии, поэтому эта актуальная задача была эффективно решена. Применение искусственной нейронной сети ST-ResNet позволило сократить величину средней абсолютной процентной ошибки прогнозирования более, чем на 2,5 % по сравнению с применением различных моделей прогнозирования (рекуррентных нейронных сетей, скользящего среднего, экспоненциального сглаживания и др.) при краткосрочном (1 сут) и среднесрочном прогнозировании (1 неделя). При прогнозировании авторы использовали погодные данные, бинарный признак типа дня недели (рабочий/выходной день), данные о продажах, электропотреблении 1 ч назад.

Прогнозирование позволяет оптимально управлять режимами работы накопителей электроэнергии, что способствует ее более рациональному использованию. В исследовании [21] приведены результаты прогнозирования электропотребления с помощью модели деревьев решений при использовании экзогенных переменных. Полученные результаты прогнозирования используются в системе поддержки принятия решений в процессе определения оптимальной емкости накопителя электроэнергии в промышленных масштабах.

Результаты сравнительного анализа методов машинного обучения и традиционных методов прогнозирования электропотребления, проведенного в статье [22], подтверждают значительное превосходство методов машинного обучения по показателям точности прогнозов, что свидетельствует об актуальности разработок прогностических моделей на основе нейронных сетей и алгоритмов классического машинного обучения. Однако, как отмечено в работе [23], основным недостатком применения этих методов является вычислительная сложность, что делает задачу повышения эффективности алгоритмов интеллектуального анализа данных особенно актуальной.

В исследовании [24] были построены модели машинного обучения для прогнозирования электропотребления небольшого промышленного объекта. Наилучшей оказалась модель на основе алгоритма градиентного бустинга библиотеки CatBoost.

В статье [25] разработана гибридная модель, сочетающая применение сингулярного спектрального анализа для разбиения временного рядя электропотребления и полносвязной нейронной сети. Описанная модель позволила улучшить результаты прогнозирования электропотребления горно-металлургического завода по сравнению с применением нейронной сети (без сингулярного спектрального анализа) для прогнозирования. Применение методов интеллектуального анализа данных и передового опыта их внедрения приведены в статье [26]. Перспективным направлением является применение гибридных моделей прогнозирования, использующих комбинацию нескольких методов интеллектуального анализа [27-29]. Однако и при наиболее современных подходах для прогнозирования электропотребления [30] ученые отмечают ограничения в применении некоторых методов [31]. Это лишь подтверждает необходимость проведения исследований для модернизации и расширения методологического арсенала при решении задачи прогнозирования электропотребления. Применительно к предприятиям горной промышленности результаты исследований приведены в работах [32, 33].

Таким образом, целесообразно проведение систематических обзоров, как, например, в статьях [13, 34], отражающих современное состояние исследований в области прогнозирования электропотребления. С учетом неугасающего интереса научного сообщества к вопросам энергосбережения, прогресса средств и методов интеллектуальной обработки данных и высокой практической значимости развития энергосберегающих технологий, необходимо проведение прикладных исследований с целью разработки рекомендаций по возможности применения различных методов прогнозирования.

Исследование было выполнено на языке программирования Python (v. 3.10.0) в среде программирования Jupyter Notebook. Использованы библиотеки NumPy и Pandas для вычислений и манипуляций с данными, Matplotlib, Seaborn - визуализации данных, SKLearn, XGBoost и CatBoost - предобработки данных и загрузки экземпляров моделей регрессии, tensorFlow.keras -создания искусственных нейронных сетей. Выбор алгоритмов обоснован рекомендациями в литературе [8, 19, 24] и необходимостью проведения сравнительного анализа применения различных алгоритмов в одинаковых условиях. Достоинствами ансамблевых подходов и нейронных сетей являются высокая обобщающая способность, небольшая переобучаемость моделей. Алгоритмы линейной регрессии и ^-ближайших соседей были выбраны для подтверждения нелинейности исходных данных и сравнения результатов с более сложными методами.

Исходными для исследования стали почасовые данные за период с 04.03.2020 по 04.03.2023: о плановом потреблении электроэнергии объединенной энергосистемы Урала, индикатора работы энергосистемы (частота); производственного календаря о типе дня (рабочий/нерабочий/предпраздничный); об отопительном периоде. Все они взяты из открытых источников. Поскольку в исследовании [35] проведен анализ влияния климатических факторов, подтверждающий их существенное влияние на величину электропотребления, было принято решение добавить в качестве исходных фактические метеорологические данные административного центра - Екатеринбурга.

При создании прогнозных моделей были выполнены следующие допущения: использованы фактические метеорологические факторы административного центра, несмотря на то, что округ занимает обширную территорию, относящуюся к различным климатическим поясам; фактические данные о частоте в энергосистеме.

На рис.2 представлен график планового потребления электроэнергии, а на рис.3 приведен пример недельного графика планового электропотребления. На рис.3 по оси абсцисс отложен индекс (порядковый номер) временного интервала, по оси ординат - величина планового электропотребления. Анализ графиков позволяет заключить, что величина электропотребления зависит от времени суток и времени года.

S-

Ш

36000

32000

U S о я

СО Ц

0 ^

я ю

1 8, 28000

24000

2020-05 2020-09 2021-01 2021-05 2021-09 2022-01 2022-05 2022-09 2023-01

Год, месяц

Рис.2. График планового электропотребления

ш

3300

« S

о я

м 2

о ^

о= ^

С о с

3200

3100

8 3000

2900

50

100

150

Рис.3. Недельный график планового электропотребления

С целью оценки влияния метеорологических факторов и возможности их дальнейшего использования при создании прогностических моделей был проведен корреляционный анализ. По формуле парного коэффициента корреляции Пирсона вычислены коэффициенты корреляции между признаками и целевой переменной. Приведены обозначения и описание факторов и целевой переменной (табл.2), матрица корреляций (рис.4):

xy - xy

r = —-— ,

** o(x)o(y) '

0

где х и у - попарно перебираемые признаки и целевая переменная.

Таблица 2

Описание целевой переменной и факторов

Название Единицы измерения Обозначение

Объем планового потребления электроэнергии МВт-ч У

Частота Гц X1

Индекс равновесных цен на покупку электроэнергии руб./МВт-ч X2

Индекс равновесных цен на продажу электроэнергии руб./МВт-ч Х3

Максимальный индекс равновесной цены руб./МВт-ч Х4

Минимальный индекс равновесной цены руб./МВт-ч Х5

Отопительный сезон в Екатеринбурге (да 1/нет 0) - Х6

Тип дня (рабочий 0/нерабочий 1/предпраздничный 2) - Х7

Температура °С Х8

Относительная влажность % Х9

Направление ветра румбы Х10

Скорость ветра м/с Х11

Общая облачность % Х12

Горизонтальная дальность видимости км Х13

Температура точки росы °С Х14

День - Х15

Месяц - Х16

Год - Х17

Час - Х18

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

У

Х1 Х2 ХЗ Х4 Х5 Х6 Х7 Х8 Х9 Х10 Х11 Х12 Х13 Х14 Х15 Х16 Х17 Х18

0.04 0.5 0.04 —■ 0 08 0.5 0.08 ■ 0.5 0.07 I 0.2 0.07 И 0.4 0.03 | 0.008 -0.02 -0.06 -0.03 -0.06 4)8 0.01 0.05 0.3 -0.04 -0.2 0.06 0.007 0.004 0.2 0.02 0.1 0.1 0.009 0.1 -0.2 0.01 0.2 -0.8 -0.003 -0.02 0.02 0.006 0.02 -0.1 -0.003 0.03 0.4 0.02 0.4 0.1 0.1 0.4

-0.06 -0.8 0.3 0.06 0.2 0.008 -0.03 0.01 -0.04 0.007 0.02

I-0.02 -0.06 0.05 -0.2 0.004 0.1 -0.01 -0.05 0.04 -0.2 0.003 0.1 -0.2 -0.1 0.2 -0.2 0.01 0.03 | 0.05 0.03 -0.09 -0.02 -0.01 0.08 ДД 0.09 -0.8 0.3 0.09 0.2 0 09 ИИ -О 04 -0 0? 0.05 0.02 I -0.8 -0.04 ИИ -0.5 0.01 -0.1 0.3 -0.02 -0.5 ДИ -0.05 -0.08 0.09 0.05 0.01 -0.05 И -0.07 0.2 0.02 -0.1 -0.08 -0.07 И 0.08 0.04 -0.05 0.2 0.06 0.2 -0.3 -0.0002 0.4 -0.5 -0.05 0.1 -0.8 -0 06 ГОШ -0.1 -0.01 -0.2 -0.03 -0.07 -0.002-0.006-0.0003 0.05 -0.1 -0.1 0.1 0.1 -0.07 -0.03 0.1 -0.05 -0.2 0.06 0.02 -0.002 -0.0001-2е-16 0.1 -0.3 0.008 0.1

0.1 -0.2 -0.8 0.02 -0.1 0.4 0.1 0.009 0.01 -0.003 0.006-0.003 0.02 0.1 0.1 0.2 -0.02 0.02 0.03 0.4 0.4 0.1 0.2 -0.03 0.02 0.03 0.4 0.4 0.05 0.2 0.1 -0.02 0.04 0.2 0.4 0.08 0.04 -0.1 0.02 0.03 0.4 0.2 0.08 -0.3 -0.8 -0.03 -0.1 0.1 -0.000' 0.04-0.0002-0.06 -0.07 -0.1 -0.05-2е-16 -0.05 0.4 ■«■•■-0.002 0.1 -0.2 0.1 0.2 -0.5 -0.1 -0.006 0.1 0.06 -0.3 0.06 -0.05 -0.01-0.0003-0.07 0.02 0.008 0.2 0.1 -0.2 0.05 -0.03 -0.002 0.1 ДД -0.1 0.06 0.02 -0.01 0.04 0.07 -0.1 И 0.2 0.02 -0.06 -0.2 0.2 0.06 0-2 ММ 0.001 0.2 -0.2 -0.006 0.02 0.02 0.001 ИИ 0.01 -0.03 7е-18 -0.01 -0.06 0.2 ""1 ДД ""1Г 0.04 -0.2 -0.2 -0.03 -0.3 ДД-Зе-15 0.07 0.2 -0.006 7е-18 4е-16-Зе-15

1

0,8 0,6 0,4 0,2 0 -0,2 -0,4 -0,6

у XI Х2 ХЗ Х4 Х5 Хб X/ Х8 Х9 ХЮ Х11 Х12 Х13 Х14 Х15 Х18 Х1"/ Х18 Рис.4. Матрица корреляции признаков и целевой переменной

В результате анализа матрицы корреляции было принято решение исключить из дальнейшего исследования факторы Х3-Х6, Х14 из-за наличия мультиколлинеарности признаков. Все остальные факторы использованы в качестве входных признаков в прогностических моделях.

Следующим этапом была проведена нормализация признаков с помощью функции МтМах8са1ег библиотеки 8КЬеагп. Путем нормализации значения всех признаков были приведены к одинаковому масштабу

х - Хт:„

где x - фактическое значение признака; Xmin и Xmax - минимальное и максимальное значения.

Для создания предсказательных моделей были иотользованы следующие алгоритмы библиотеки SKLearn: линейная регрессия Linear Regression (LR), ^-ближайших соседей KNeighborsRegres-sor (KNN), случайный лес RandomForestRegressor (RFR). Также применены ансамблевые методы (экстремальный градиентный бустинг XGBRegressor и градиентный бустинг CatBoostRegressor)

x

и создана модель рекуррентной нейронной сети долгой краткосрочной памяти LSTM в tensorFlow.keras. Использованы различные по сложности алгоритмы: от линейной регрессии до ансамблевых методов и нейронных сетей. Выбор указанных алгоритмов машинного обучения обусловлен необходимостью проведения их сравнительного анализа, примененного при одних и тех же условиях. Достоверность некоторых из использованных методов находит подтверждение в работах [12, 24, 36].

Модель нейронной сети была создана путем выполнения серии экспериментов по подбору параметров и выбору оптимальной структуры сети. Наилучшая из подобранных конфигураций сети следующая: два слоя LSTM по 30 и 25 нейронов соответственно с функцией активации гиперболический тангенс (tanh), один линейный слой, включающий 25 нейронов, выходной слой. В качестве оптимизатора использован алгоритм оптимизации Adam, в качестве функции потерь -среднеквадратичная ошибка. Обучение модели нейронной сети происходило с разбиением на батчи, оптимальный размер которого оказался равным 5, сходимость результата наблюдается при 1000 итерациях.

В качестве метрик качества прогнозов были выбраны средняя абсолютная ошибка в процентах (MAPE) и коэффициент детерминации (R2):

„ 1 «-i| y - y, | MAPE(y, y) = - X1 ^ • 100 %;

n 1=0 yt

п „ ?

Т (У - У )2 у, у) = 1 - -'

Т (У - У)2

¿=1

где у и у - фактические и прогнозные значения объема планового электропотребления; п - длина временного ряда.

Обучающая и тестовая выборки (датасеты) были разделены в соотношении 80:20. В табл.3 приведены соответствующие значения качества прогнозных моделей. Подбор параметров для моделей RFR, XGBoost и CatBoost осуществлялся с помощью инструмента перекрестной проверки GridSearchCV.

Таблица 3

Оценка качества прогнозных моделей

Модель Метрики качества прогноза

Обучающий датасет Тестовый датасет MAPE прогноза на n дней, % (n 1,7)

MAPE, % R2 MAPE, % R2 n = 1 n = 2 n = 3 n = 4 n = 5 n = 6 n = 7

LR 3,37 0,86 3,39 0,86 2,08 2,09 1,93 1,79 1,89 2,16 2,22

KNN 1,26 0,97 1,66 0,96 1,10 1,25 1,50 1,55 1,79 1,93 1,84

RFR 0,41 0,99 0,78 0,99 1,39 1,31 1,41 1,37 1,59 1,64 1,59

XGBoost 0,73 0,99 0,82 0,99 0,47 0,63 0,71 0,74 1,07 1,20 1,17

CatBoost 0,17 0,99 0,36 0,99 0,42 0,86 0,75 0,71 0,71 0,68 0,64

LSTM 0,36 0,99 0,40 0,99 0,36 0,74 0,64 0,62 0,59 0,59 0,55

Для указанных моделей было проведено прогнозирование на период от одного дня до недели. Значения ошибок прогноза для каждого периода (п) прогнозирования указаны в табл.3. Так, при п = 1 получены 24 прогнозных значения (1 сут), при п = 2 прогноз выполнен на 48 точек (2 сут) и т.д. до 7 сут. Как видно из табл.3, с увеличением горизонта прогнозирования точность прогноза уменьшается, но при этом ошибка не превышает 1 -2 %. Наилучшую точность показала модель рекуррентной нейронной сети LSTM, MAPE которой менее 1 % для недельного периода упреждения. Полученные результаты позволяют считать модель достоверной.

ЕйЫ

Записки Горного института. 2023. Т. 261. С. 392-402 в

© Р.В.Клюев, АДМоргоева, О.А.Гаврина, И.И.Босиков, ИД.Моргоев, 2023 _

—Ь8ТМ

хаво(^

---Са1Воо81

О 25 50 75 100 125 150 175

Порядковый номер часа недели

Рис.5. Фактические и прогнозные значения

На рис.5. приведены графики объемов планового электропотребления (у) и его прогнозные значения, полученные разными моделями на неделю вперед. Наибольшие отклонения прогнозных значений от фактических наблюдаются у модели ХОВоо81 при прогнозе на период от 4 до 7 дней. При горизонте прогноза до 4 дней величина ошибки сопоставима с другими методами. Поэтому можно предположить, что на недельный период лучше использовать модели нейронных сетей Ь8ТМ и ансамблевый алгоритм Са1Воо81 Возможно, что объединение анализируемых моделей по технологии стекинга позволит получать наименьшую погрешность прогноза.

В работе [33] приведены результаты прогнозирования электропотребления с помощью метода Холта - Уинтерса на два дня вперед. При этом МАРЕ составила 1,08 %. При математическом моделировании электропотребления на основе выборки максимального правдоподобия, описанном в статье [14], величина погрешности прогноза 2,19 %. А при прогнозировании электропотребления с помощью многофакторной регрессионной модели ошибка прогнозирования оказалась равной 3,32 % [37].

С помощью рассмотренных моделей можно уменьшить погрешность прогноза (при прогнозировании на два дня вперед при применении модели XGBoost значение МАРЕ составило 0,63 %, модели на основе алгоритма CatBoost - 0,86 %, модели нейронной сети LSTM - 0,74 %), что подтверждает эффективность применения ансамблевых методов и методов глубокого машинного обучения при проведении прогнозирования электропотребления.

Обсуждение результатов. В процессе проведенного исследования были созданы модели машинного обучения, позволяющие получить краткосрочный прогноз планового электропотребления (от суток до недели) с погрешностью 0,63 %. Полученные результаты позволят в процессе принятия управленческих решений при формировании заявок на производство и потребление электроэнергии учитывать прогнозные данные, полученные с помощью описанных в данном исследовании моделей, что позволит принимать более обоснованные решения при планировании объемов потребления электроэнергии. Таким образом, наличие достоверного прогноза должно способствовать сокращению величины отклонения фактических объемов электропотребления от плановых за счет интеллектуального анализа ретроспективных данных и учета большого числа факторов погодного (Х8-Х13), технического (Х1, Х7), экономического (Х2) характера и др. Отметим, что без допущения, принятого в данном исследовании относительно погодных факторов, погрешность прогноза может измениться. С одной стороны, при использовании более детальных климатических данных, например нескольких населенных пунктов с разными климатическими условиями, ошибка прогноза, вероятно, должна уменьшиться. С другой стороны, в исследовании были использованы фактические климатические данные, а не прогнозные. Следовательно, при наличии прогнозных данных величина погрешности прогноза электропотребления увеличится за счет погрешности прогноза погоды. Поэтому одним из перспективных направлений является дальнейшее исследование метеофакторов и их влияния на целевой результат.

Факторы экономического характера подвержены влиянию макро- и микроэкономических показателей. В том числе стоит оценивать риски возникновения непредвиденных ситуаций, относящихся

к понятию так называемого черного лебедя (аварии, санкции и т.д.). С учетом того, что в данном исследовании прогнозирование электропотребления происходит на основе прошедших событий и установившихся корреляций между факторами, новые события могут быть учтены на основе обнаружения большой ошибки рассогласования в моменте, когда появится «черный лебедь». В таком случае ошибка возникнет сразу и, обнаружив ее, можно исследовать влияние нового фактора, вызванного непредвиденной ситуацией, и оценить его проявляющуюся связь на прогноз электропотребления напрямую. Затем с учетом нового фактора провести перестроение модели. Если же происходит изменение экономического фактора (X2) или какого-либо другого, уже существующего в модели, вызванное резкими изменениями экономической ситуации, то необходимо обновление весов в моделях, подбор оптимальных гиперпараметров и переобучение моделей.

Так как одна из проблем при прогнозировании электропотребления - отсутствие универсальных моделей, подходящих для всех предметных областей и различных периодов упреждения прогнозов, перспективным направлением исследования является поиск универсальных подходов к созданию прогнозных моделей. Таким образом, результаты настоящего исследования, в частности структура входных переменных-предикторов, могут быть использованы в аналогичных исследованиях. К рекомендациям, полученным в настоящем исследовании, можно отнести эффективность применения моделей градиентного бустинга и нейронных сетей при прогнозировании электропотребления.

Заключение. Получены выводы практического и теоретического характера. Разработаны прогностические модели, проведен их сравнительный анализ по метрикам качества прогнозных значений. Можно утверждать, что применение ансамблевых (алгоритмов градиентного бустинга CatBoost и XGBoost) и модели нейронной сети LSTM показали близкие результаты. Однако при лучшей обобщающей способности нейронной сети и, как следствие, более точных результатов, недостатком этого метода по сравнению с ансамблевыми является большая вычислительная сложность и большие временные затраты на обучение модели. Направление будущих исследований -увеличение горизонта прогнозирования, сравнение методов прогнозирования по величине времени выполнения прогноза, оптимизация параметров моделей. Практическая значимость исследования состоит в использовании результатов прогнозирования при принятии управленческих решений в процессе составления заявок на ОРЭМ. Разработанные в настоящем исследовании модели могут быть внедрены в систему поддержки принятия решений участников оптовых рынков электроэнергии, в частности АО «Администратор торговой системы», занимающихся расчетом объема полного планового потребления электроэнергии. Также результаты исследования могут быть использованы при разработке подсистем поддержки принятия решений генерирующими компаниями при прогнозировании спроса на электроэнергию и крупными промышленными предприятиями при расчете планового потребления электроэнергии.

ЛИТЕРАТУРА

1. FariaP., Vale Z. Demand Response in Smart Grids // Energies. 2023. Vol. 16. Iss. 2. № 863. DOI: 10.3390/en16020863

2. Zhukovskiy Yu.L., KovalchukM.S., BatuevaD.E., SenchiloN.D. Development of an Algorithm for Regulating the Load Schedule of Educational Institutions Based on the Forecast of Electric Consumption within the Framework of Application of the Demand Response // Sustainability. 2021. Vol. 13. Iss. 24. № 13801. DOI: 10.3390/su132413801

3. Iftikhar H., Bibi N., Canas Rodrigues P., Lopez-Gonzales J.L. Multiple Novel Decomposition Techniques for Time Series Forecasting: Application to Monthly Forecasting of Electricity Consumption in Pakistan // Energies. 2023. Vol. 16. Iss. 6. № 2579. DOI: 10.3390/en16062579

4. Almuhaini S.H., Sultana N. Forecasting Long-Term Electricity Consumption in Saudi Arabia Based on Statistical and Machine Learning Algorithms to Enhance Electric Power Supply Management // Energies. 2023. Vol. 16. Iss. 4. № 2035. DOI: 10.3390/en16042035

5. Weijie Zhou, Huihui Tao, Jiaxin Chang et al. Forecasting Chinese Electricity Consumption Based on Grey Seasonal Model with New Information Priority // Sustainability. 2023. Vol. 15. Iss. 4. № 3521. DOI: 10.3390/su15043521

6. Sayed H.A., William A., Said A.M. Smart Electricity Meter Load Prediction in Dubai Using MLR, ANN, RF, and ARIMA // Electronics. 2023. Vol. 12. Iss. 2. № 389. DOI: 10.3390/electronics12020389

7. Lin Pan, Sheng Wang, Jiying Wang et al. Research on Central Air Conditioning Systems and an Intelligent Prediction Model of Building Energy Load // Energies. 2022. Vol. 15. Iss. 24. № 9295. DOI: 10.3390/en15249295

8. Alsharekh M.F., Habib S., Dewi D.A. et al. Improving the Efficiency of Multistep Short-Term Electricity Load Forecasting via R-CNN with ML-LSTM // Sensors. 2022. Vol. 22. Iss. 18. № 6913. DOI: 10.3390/s22186913

9. Poczeta K., Papageorgiou E.I. Energy Use Forecasting with the Use of a Nested Structure Based on Fuzzy Cognitive Maps and Artificial Neural Networks // Energies. 2022. Vol. 15. Iss. 20. № 7542. DOI: 10.3390/en15207542

10. Вялкова С.А., Надтока И.И. Анализ шумовой составляющей суточных графиков активной мощности энергосистемы и метеофакторов при краткосрочном прогнозировании // Интеллектуальная электротехника. 2018. № 4. С. 25-34. DOI: 10.46960/2658-6754_2018_4_25

11. Yotov K., Hadzhikolev E., Hadzhikoleva S., Cheresharov S. Neuro-Cybernetic System for Forecasting Electricity Consumption in the Bulgarian National Power System // Sustainability. 2022. Vol. 14. Iss. 17. № 11074. DOI: 10.3390/su141711074

12. Xin Hu, Keyi Li, Jingfu Li et al. Load forecasting model consisting of data mining based orthogonal greedy algorithm and long short-term memory network // Energy Reports. 2022. Vol. 8. S. 5. P. 235-242. DOI: 10.1016/j.egyr.2022.02.110

13. Klyuev R. V., Morgoev I.D., Morgoeva A.D. et al. Methods of Forecasting Electric Energy Consumption: A Literature Review // Energies. 2022. Vol. 15. Iss. 23. № 8919. DOI: 10.3390/en15238919

14. Мохов В.Г., Демьяненко Т.С. Прогнозирование потребления электрической энергии на оптовом рынке электроэнергии и мощности // Вестник Южно-Уральского государственного университета. Серия: Экономика и менеджмент. 2014. Т. 8. № 2.С. 86-92.

15. Карпенко С.М., Карпенко Н.В., Безгинов Г.Ю. Прогнозирование электропотребления на горнопромышленных предприятиях с использованием статистических методов // Горная промышленность. 2022. № 1. С. 82-88. DOI: 10.30686/1609-9192-2022-1-82-88

16. Полуянович Н.К., Дубяго М.Н. Оценка воздействующих факторов и прогнозирование электропотребления в региональной энергосистеме с учетом режима ее эксплуатации // Известия ЮФУ. Технические науки. 2022. № 2. С. 31-46. DOI: 10.18522/2311-3103-2022-2-31-46

17. Geunsub Kim, Gunwoo Lee, Seunghyun An, Joowon Lee. Forecasting future electric power consumption in Busan New Port using a deep learning model // The Asian Journal of Shipping and Logistics. 2023. Vol. 39. Iss. 2. P. 78-93. DOI: 10.1016/j.ajsl.2023.04.001

18. RibeiroM.H.D.M., Gomes da Silva R., Ribeiro G.T. et al. Cooperative ensemble learning model improves electric short-term load forecasting // Chaos, Solitons & Fractals. 2023. Vol. 166. № 112982. DOI: 10.1016/j.chaos.2022.112982

19. Hadjout D., Torres J.F., Troncoso A. et al. Electricity consumption forecasting based on ensemble deep learning with application to the Algerian market // Energy. 2022. Vol. 243. № 123060. DOI: 10.1016/j.energy.2021.123060

20. Min Cao, Jinfeng Wang, Xiaochen Sun et al. Short-Term and Medium-Term Electricity Sales Forecasting Method Based on Deep Spatio-Temporal Residual Network // Energies. 2022. Vol. 15. Iss. 23. № 8844. DOI: 10.3390/en15238844

21. Senchilo N.D., Ustinov D.A. Method for Determining the Optimal Capacity of Energy Storage Systems with a Long-Term Forecast of Power Consumption // Energies. 2021. Vol. 14. № 21. № 7098. DOI: 10.3390/en14217098

22. HabbakH., MahmoudM., Metwally K. et al. Load Forecasting Techniques and Their Applications in Smart Grids // Energies. 2023. Vol. 16. Iss. 3. № 1480. DOI: 10.3390/en16031480

23. SzczepaniukH., SzczepaniukE.K. Applications of Artificial Intelligence Algorithms in the Energy Sector // Energies. 2023. Vol. 16. Iss. 1. № 347. DOI: 10.3390/en16010347

24. Моргоева А.Д., Моргоев И.Д., Клюев Р.В., Гаврина О.А. Прогнозирование потребления электрической энергии промышленным предприятием с помощью методов машинного обучения // Известия Томского политехнического университета. Инжиниринг георесурсов. 2022. Т. 333. № 7. С. 115-125. DOI: 10.18799/24131830/2022/7/3527

25. Вялкова С.А., Моргоева А.Д., Гаврина О.А. Разработка гибридной модели прогнозирования потребления электрической энергии для горно-металлургического предприятия // Устойчивое развитие горных территорий. 2022. Т. 14. № 3 (53). С. 486-493. DOI: 10.21177/1998-4502-2022-14-3-486-493

26. Yuhan Xie, Yunfei Yang, Lifeng Wu. Power Consumption Forecast of Three Major Industries in China Based on Fractional Grey Model // Axioms. 2022. Vol. 11. Iss. 8. № 407. DOI: 10.3390/axioms11080407

27. Qingyong Zhang, Changwu Li, Conghui Yin et al. A Hybrid Framework Model Based on Wavelet Neural Network with Improved Fruit Fly Optimization Algorithm for Traffic Flow Prediction // Symmetry. 2022. Vol. 14. Iss. 7. № 1333. DOI: 10.3390/sym14071333

28. Zichao He, Chunna Zhao, Yaqun Huang. Multivariate Time Series Deep Spatiotemporal Forecasting with Graph Neural Network // Applied Sciences. 2022. Vol. 12. Iss. 11. № 5731. DOI: 10.3390/app12115731

29. QiangXiao, Hongshuang Wang. Prediction of WEEE Recycling in China Based on an Improved Grey Prediction Model // Sustainability. 2022. Vol. 14. Iss. 11. № 6789. DOI: 10.3390/su14116789

30. Narwariya J., Verma C., Malhotra P. et al. Electricity Consumption Forecasting for Out-of-Distribution Time-of-Use Tariffs // Computer Sciences & Mathematics Forum. 2022. Vol. 3. Iss. 1. № 1. DOI: 10.3390/cmsf2022003001

31. Frikha M., Taouil K., Fakhfakh A., Derbel F. Limitation of Deep-Learning Algorithm for Prediction of Power Consumption // Engineering Proceedings. 2022. Vol. 18. Iss. 1. № 26. DOI: 10.3390/engproc2022018026

32. Жуковский Ю.Л., Семенюк А.В., Алиева Л.З., Арапова Е.Г. Цифровые платформы на основе блокчейн для снижения углеродного следа горных предприятий // Горный информационно-аналитический бюллетень. 2022. № 6-1. С. 361-378. DOI: 10.25018/0236_1493_2022_61_0_361

33. Senchilo N., Babanova I. Improving the Energy Efficiency of Electricity Distribution in the Mining Industry Using Distributed Generation by Forecasting Energy Consumption Using Machine Learning // International Multi-Conference on Industrial Engineering and Modern Technologies (Far East Con), 06-09 October 2020, Vladivostok, Russia. IEEE, 2020. P. 1-7. DOI: 10.1109/FarEastCon50210.2020.9271335

Статья опубликована в открытом доступе по лицензии СС BY 4.0

34. Aguiar-Pérez J.M., Pérez-Juárez MA. An Insight of Deep Learning Based Demand Forecasting in Smart Grids // Sensors. 2023. Vol. 23. Iss. 3. № 1467. DOI: 10.3390/s23031467

35. Shklyarskiy J.E., Batueva D.E. The influence of external climatic factors on the accuracy of the forecast of energy consumption // E3S Web of Conferences. 2019. Vol. 140. № 04014. DOI: 10.1051/e3sconf/201914004014

36. Aseeri A.O. Effective RNN-Based Forecasting Methodology Design for Improving Short-Term Power Load Forecasts: Application to Large-Scale Power-Grid Time Series // Journal of Computational Science. 2023. Vol. 68. № 101984. DOI: 10.1016/j.jocs.2023.101984

37. Мохов В.Г., Демьяненко Т.С. Определение значимых факторов при прогнозировании объема потребления электроэнергии по объединенной энергосистеме Урала на основе регрессионного анализа // Вестник УрФУ. Серия: Экономика и управление. 2017. Т. 16. № 4. С. 642-662. DOI: 10.15826/vestnik.2017.16.4.031

Авторы: Р.В.Клюев, д-р техн. наук, профессор, https://orcid.org/0000-0003-3777-7203 (Московский политехнический университет, Москва, Россия), А.Д.Моргоева, аспирант, m.angelika-m@yandex.ru, https://orcid.org/0000-0003-2949-1993 (Северо-Кавказский горно-металлургический институт (государственный технологический университет), Владикавказ, Россия), О.А.Гаврина, канд. техн. наук, доцент, https://orcid.org/0000-0002-9712-9075 (Северо-Кавказский горно-металлургический институт (государственный технологический университет), Владикавказ, Россия), И.И.Босиков, канд. техн. наук, заведующий кафедрой, https://orcid.org/0000-0001-8930-4112 (Северо-Кавказский горно-металлургический институт (государственный технологический университет), Владикавказ, Россия), И.Д.Моргоев, аспирант, https://orcid.org/0000-0003-4390-5662 (Северо-Кавказский горно-металлургический институт (государственный технологический университет), Владикавказ, Россия).

Авторы заявляют об отсутствии конфликта интересов.

i Надоели баннеры? Вы всегда можете отключить рекламу.