Научная статья на тему 'МЕТОДИКА ФОРМИРОВАНИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ В ЗАДАЧАХ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ ГАРАНТИРУЮЩЕГО ПОСТАВЩИКА'

МЕТОДИКА ФОРМИРОВАНИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ В ЗАДАЧАХ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ ГАРАНТИРУЮЩЕГО ПОСТАВЩИКА Текст научной статьи по специальности «Строительство и архитектура»

CC BY
138
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННАЯ НЕЙРОННАЯ СЕТЬ / ОБУЧАЮЩАЯ ВЫБОРКА / ПРОГНОЗИРОВАНИЕ ЭЛЕКТРОПОТРЕБЛЕНИЯ / АНАЛИЗ ФАКТОРОВ

Аннотация научной статьи по строительству и архитектуре, автор научной работы — Хомутов Станислав Олегович, Хамитов Рустам Нуриманович, Грицай Александр Сергеевич, Серебряков Николай Александрович

Рассмотрена методика формирования выборки данных, необходимой для обучения и тестирования нейросетевых алгоритмов краткосрочного прогнозирования электропотребления. Предложенная методика основывается на проведенном авторами анализе факторов, влияющих на почасовое электропотребление гарантирующего поставщика или энергосбытовой компании, а также методах улучшения сходимости алгоритмов обучения искусственных нейронных сетей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по строительству и архитектуре , автор научной работы — Хомутов Станислав Олегович, Хамитов Рустам Нуриманович, Грицай Александр Сергеевич, Серебряков Николай Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODOLOGY OF THE TRAINING DATA FORMATION IN THE PROBLEMS OF SHORT-TERM LOAD FORECASTING OF THE DEFAULT PROVIDER

The methodology of forming a data sample required for training and testing neural network algorithms for short-term load forecasting are considered. The proposed methodology is based on the authors' analysis of the factors influencing the hourly power consumption of a default provider or a energy sales company, as well as methods for improving the convergence of artificial neural networks learning algorithms.

Текст научной работы на тему «МЕТОДИКА ФОРМИРОВАНИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ В ЗАДАЧАХ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ ГАРАНТИРУЮЩЕГО ПОСТАВЩИКА»

УДК 004.896

МЕТОДИКА ФОРМИРОВАНИЯ ОБУЧАЮЩЕЙ ВЫБОРКИ В ЗАДАЧАХ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ ЭЛЕКТРОПОТРЕБЛЕНИЯ ГАРАНТИРУЮЩЕГО ПОСТАВЩИКА

С.О. Хомутов, Р.Н. Хамитов, А.С. Грицай, Н.А. Серебряков

Рассмотрена методика формирования выборки данных, необходимой для обучения и тестирования нейросетевых алгоритмов краткосрочного прогнозирования электропотребления. Предложенная методика основывается на проведенном авторами анализе факторов, влияющих на почасовое электропотребление гарантирующего поставщика или энергосбытовой компании, а также методах улучшения сходимости алгоритмов обучения искусственных нейронных сетей.

Ключевые слова: искусственная нейронная сеть, обучающая выборка, прогнозирование электропотребления, анализ факторов.

Важнейшим условием надежного функционирования энергосистемы является соблюдение в любой момент времени баланса потребления и выработки электроэнергии. Большая часть генерирующего оборудования в энергосистеме маломаневренная, то есть процесс вывода в работу данного оборудования занимает более 8-ми часов. В связи с чем, для эффективного управления режимом энергосистемы необходима прогнозная информация о почасовом электропотреблении всех потребителей. Закупка электрической энергии на оптовом рынке электроэнергии и мощности (ОРЭМ) требует краткосрочного прогнозирование почасового электропотребления (short-term load forecasting - STLF). В условиях функционирования рынка электроэнергии точность прогнозов потребления существенно влияет на технологические и экономические показатели энергосистемы [1]. Торговля отклонениями фактического электропотребления от прогнозного на ОРЭМ происходит на балансирующем рынке по невыгодной цене. Помимо убытков для участников ОРЭМ, ошибки прогнозирования приводят к увеличению стоимости электрической энергии для потребителей на розничных рынках электроэнергии за счет увеличения стоимостного рыночного небаланса.

К числу основных покупателей электроэнергии на ОРЭМ относятся гарантирующие поставщики электроэнергии (ГП), осуществляющие покупку электроэнергии с помощью групп точек поставки (ГТП). ГТП представляет собой условную точку, которая может включать несколько электрических подстанций напряжением 110 кВ и выше, которые относятся к одному узлу расчётной модели Единой энергосистемы. Как было выяснено в [2], почасовое электропотребление ГТП ГП зависит от большого количества факторов, некоторые из которых носят недетерминированный характер. В связи с этим, задача краткосрочного прогнозирования электропотребления относится к слабоформализуемым. В условиях неопределенности традиционные методы математической статистики или имитационного моделирования не позволяют строить адекватные модели объектов [3]. В настоящее стремительно развиваются технологии искусственного интелекта и глубокого машинного обучения. Рассмотренные информационные технологии являются высокоэффективным инструментом для решения широкого перечня задач, которые относятся к слабоформализуемым или неформализуемым [4].

Точность краткосрочного прогнозирования электропотребления зависит от прогнозного алгоритма, а также от качества выборки связанных статистических данных [5]. Выбор высококоррелированных исходных данных имеет решающее значение для моделей прогнозирования электропотребления, основанных на искусственном интеллекте [6]. Следовательно, вопросам формирования обучающей выборки, при краткосрочном прогнозировании электропотребления ГТП ГП с помощью инструментов машинного обучения, необходимо уделить особое внимание.

Методика формирования выборки данных, предназначенной для обучения и тестирования нейросетевых алгоритмов прогнозирования электропотребления.

В работе [2] выяснено, что поведение временного ряда почасового электропотребления ГТП ГП в краткосрочной перспективе определяют:

- факторы времени (время года, день недели, час суток, длина светового дня, праздники, митинги, каникулы в образовательных учреждениях и т.п.);

- факторы, связанные с надежностью электро-, водо- и теплоснабжения потребителей, относящихся к данной ГТП;

-метеорологические факторы;

- фактор, учитывающий режим работы мощных потребителей электроэнергии, относящихся к данной ГТП.

Временные факторы носят детерминированный характер. Статистические данные о величине временных факторов включаются в обучающую выборку в виде порядковых номеров дня в году, часа суток, дня недели и т.д., а также признаков каникул, праздничных и предпраздничных дней, митингов и т. д.

Факторы надежности электро-, водо- и теплоснабжения потребителей включаются в обучающую выборку в виде признаков наличия горячего и холодного водоснабжения, центрального отопления. Объемы недопоставки электроэнергии, в следствии плановых отключений линий электропередачи, питающих потребителей (фидера), можно определить среднее за несколько типовых дней часовое электропотребление:

V недопост _ 1 (1)

' '

п

где у1недопост - объем недопоставки электроэнергии, в следствии отключения питающего фидера в час '; п- количество типовых дней, по которым производится усреднение; У^ - объем электропотребления по отключаемому фидеру в час ' суток].

При рассмотрении метеорологических факторов стоит отметить, что температура наружного воздуха является наиболее значимым внешним фактором при краткосрочном прогнозировании электропотребления [6]. В работе [7] выяснено, что для уменьшения размерности факторного пространства обучающей выборки, целесообразнее учитывать факторы температуры и скорости ветра с помощью ветро-холодового индекса Стедмана [8]:

Тс _ 1,41 -1,162• У + 0,98• Т + 0,0124• У2 + 0.0185• ТУ, (2)

где Т№с - ветро-холодовой индекс; У - скорость ветра, м/с; Т - температура наружного воздуха, °С.

Также, в исследовании [7] выяснено, что изменения электрической нагрузки ГТП ГП запаздывают к изменениям температуры воздуха. Данный факт обуславливается инерционностью тепловых процессов зданий и сооружений. Перепады температуры в отапливаемых помещениях отстают во времени от изменений температуры наружного воздуха. Следовательно, потребность в изменении режима климатических приборов возникает с запозданием к изменениям температуры окружающей среды.

Предлагается учитывать фактор инерционности изменений электропотребления, вызванных перепадами температуры окружающей среды с помощью дисперсии суточных величин температуры воздуха:

к _ (-1)п • в _ (-1)п •!■ X (^ -1), (3)

24 'еХ-1

где п

0, если

1, если

I ^ 1 V— X 1 X 1

24 ' 24

^ 'еХ-1 'еХ-2

II

— X 1 <— X 1

24 ' 24

^ 'еХ-1 ^ 'еХ-2

поправочный коэффициент, учитывающий направле-

ние изменений температуры; В - выборочная дисперсия последних 24-х значений тем-

228

пературы воздуха; - температура воздуха в час , в сутки Х-1(Х-2); г - выборочное среднее.

Рост величины к сигнализирует о сильных перепадах температуры окружающей среды. При незначительных или кратковременных изменениях температуры, рост дисперсии суточных величин температуры окружающей среды будет небольшим. Также, за счет поправочного коэффициента п, данный фактор позволяет определить направление изменений температуры (потепление или похолодание).

Помимо температуры воздуха и скорости ветра, наиболее влиятельным метеорологическим фактором, который влияет на электропотребление ГТП ГП в светлое время суток, является естественная освещенность. Однако, в настоящее время, в свободном доступе практически отсутствуют данные об естественной освещенности. Естественная освещенность, в основном, зависит от состояния неба, но между временными рядами электропотребления и общей облачности, или количества осадков, имеется слабая корреляционная связь. Включение данных факторов обучающую выборку снижает точность прогнозных алгоритмов. В ходе данного исследования предложено учитывать фактор естественной освещенности на основании следующего выражения:

где Рк — закодированное значение осадков; р - количество осадков, выпавших в светлое время суток (с 7-го по 19- ый часы), мм.

В основу данного выражения легло предположение о зависимости естественной освещенности от следующих погодных явлений:

- ясно или переменная облачность (осадки менее 0,5 мм/12часов) - устойчивого снижения естественной освещенности не наблюдается;

- моросящие или непродолжительный обложные осадки (осадки в диапазоне [0,5; 1] мм/12часов) - незначительное снижение естественной освещенности;

- обложные осадки (осадки в диапазоне (1;2] мм/12часов) - значительное снижение естественной освещенности;

- ливневые осадки (осадки более 2 мм/12часов) - очень сильное снижение естественной освещенности.

Оценим взаимосвязь временных рядов электропотребления и факторов общей облачности, осадков и осадков, закодированных с помощью выражения 4. В табл. 1 представлены данные расчета коэффициента корреляции Пирсона между временными рядами дневного электропотребления ГТП «Южная» и факторов общей облачности, осадков и закодированных осадков в г. Рубцовск за 2018 год.

Коэффициент корреляции вычисляется на основании выражения:

где у, — значение фактора в сутки ,; Е{ - суточное электропотребление ГТП «Южная» в

сутки ,; у, Е - выборочные средние.

Как мы видим из табл. 1, кодирование фактора осадков с помощью выражения (4) позволяет добиться увеличения обусловленности при БТЬБ.

Учет фактора режима работы потребителей, при формировании обучающей выборки данных, зависит от равномерности профиля электропотребления данного потребителя. Для потребителей с равномерным графиком электропотребления, учет режима работы данного потребителя при БТЬБ возможно осуществить с помощью признака включения (отключения) основного технологического оборудования, потребля-

0, если Р < 0,5

1,если0,5 < Р < 2

<

2, если 1 < Р < 2 '

3, если Р > 2

(4)

г =

I (у,- -у)(Е - Е)

(5)

ющего электроэнергию. Для потребителей с неравномерным суточным графиком электропотребления, необходимо учитывать почасовую нагрузку данного потребителя как отдельный фактор при прогнозировании почасового электропотребления ГТП ГП.

Таблица 1

Коэффициент корреляции Пирсона между временными рядами дневного электропотребления ГТП «Южная» и факторов общей облачности, осадков _и закодированных осадков в г. Рубцовск за 2018 год_

Фактор Закодированные осадки Рк Осадки Р Общая облачность N

Коэффициент корреляции Пирсона, г 0.133 0.072 0.106

Так как, статистическая информация о величине всех влияющих факторов имеет различную величину (от единиц до десятков тысяч) и единицы измерения, то при БТЬБ ГТП ГП с помощью инструментов искусственного интеллекта статистический ряд данных об электрической нагрузке и величине основных влияющих факторов должен быть нормализован к диапазону [0; 1] [9]. Также, для улучшения сходимости алгоритма обучения нейросетевых прогнозных моделей необходимо сдвинуть границы диапазона нормализации из зоны насыщения вблизи границ области определения сиг-моидальной функции активации. На основании вышеизложенного, выражение для нормализации статических данных примет вид:

х - х.

х

норм

тт ■■ 0,9 + 0,05, (6)

х - х

тах тт

где хнорм - нормализованное значение статистических данных; х - фактическое значение статистических данных; хтП, хтах - минимальное и максимальное значения ряда статистических данных.

В табл. 2 представлен фрагмент нормализованных данных обучающей выборки.

Таблица 2

Фрагмент нормализованных данных обучающей выборки

Наименование фактора Величина фактора, отн ед.

Порядковый номер дня в году 0.87 0.87 0.87 0.87 0.87 0.87

Час суток 0.05 0.09 0.13 0.17 0.21 0.25

Электропотребление 0.16 0.19 0.30 0.40 0.46 0.48

Ветро-холодовой индекс 0.60 0.59 0.59 0.58 0.59 0.59

Дисперсия температуры 0.90 0.89 0.88 0.87 0.86 0.86

День недели 0.18 0.18 0.18 0.18 0.18 0.18

Признак праздничного и предпраздничного дня 0.35 0.35 0.35 0.35 0.35 0.35

Признак каникул 0.95 0.95 0.95 0.95 0.95 0.95

Количество осадков 0.05 0.05 0.05 0.05 0.05 0.28

Длина светового дня 0.07 0.07 0.07 0.07 0.07 0.07

Признак наличия центрального отопления 0.95 0.95 0.95 0.95 0.95 0.95

Признак наличия горячей воды 0.95 0.95 0.95 0.95 0.95 0.95

Режим работы крупного потребителя Э/Э 0.95 0.95 0.95 0.95 0.95 0.95

После нормализации, весь массив обучающих данных должен быть произвольным образом разделен на выборки данных, предназначенных для обучение и тестирования прогнозного алгоритма, в соотношении 9:1. Соответственно, обучение нейросе-тевой модели происходит на данных обучающей выборке, а ассоциативная способность нейросети оценивается на данных из тестовой выборки, неизвестные нейронной сети после окончания процесса обучения.

Результаты и их обсуждение. Качество обучающей выборки было оценено с помощью нейронной сети, которая представляет собой трехслойный персептрон, обучаемый с помощью метода адаптивной инерции (adaptive momentum estimation -ADAM) [10]. Структурная трехслойного персептрона представлена на рис. 1. Данная нейронная сеть состоит из:

входного слоя размером 312 сенсорных элементов входного слоя; первого скрытого слоя размером 96 нейронов с сигмоидальной функцией активации и 1 порога активации;

второго скрытого слоя размером 48 нейронов с сигмоидальной функцией активации и 1 порога активации;

выходного слоя размером 24 нейрона с сигмоидальной функцией активации.

Model: "model 1"

Layer (type) Output Shape Param #

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

input_l (InputLayer) (None, 312) e

dense_l (Dense) (None, 97) 30361

dense_2 (Dense) (None, 49) 4802

dense_3 (Dense) (None, 24) 1200

Total params: 36,363 Trainable params: 36,363 Non-trainable params: 0

Рис. 1. Структурная схема трехслойного персептрона, предназначенного для краткосрочного прогнозирования электропотребления

На рис. 2 представлены кривые изменения средней абсолютной процентной ошибки краткосрочного прогнозирования электропотребления при различном наборе факторов в обучающей выборке. Средняя абсолютная процентная ошибка прогноза почасового электропотребления ГТП ГП вычислялась на основании выражения:

MAPE = YY

N 24 „факт _ прогноз

pik Pik

k =1 i=1

p факт

Pik

(7)

где МАРЕ — средняя абсолютная процентная ошибка прогноза электропотребления; Р'фкт — фактическое электропотребление в час г суток к; рПрогно3 — прогнозное электропотребление в час г суток к; N - количество суток в обучающей выборке.

а б

Рис. 2. Кривые изменения средней абсолютной процентной ошибки краткосрочного прогнозирования электропотребления при различном наборе факторов в обучающей выборке на: а — тренировочных данных; б — на тестовых данных

Включение в обучающую выборку фактора дисперсии суточных значений температуры наружного воздуха, рассчитанного на основании выражения (3), позволяет добиться снижения ошибки прогнозирования. Включение в обучающую выборку всех факторов, рассмотренных в предыдущем пункте, позволило снизить ошибку краткосрочного почасового прогнозирования электропотребления на тестовой выборке данных после 50-ти эпох обучающего цикла на 0,41 %, по сравнению с ошибкой прогнозирования, полученной на основании стандартной обучающей выборки, состоящей только из временных и метеорологических факторов.

Заключение. Важным аспектом, при краткосрочном прогнозировании почасового электропотребления с помощью инструментов искусственных нейронных сетей, является качество обучающей выборки данных. Отбор факторов, имеющих достаточно сильную корреляционную связь с электропотреблением, а также предварительная обработка данных при формировании обучающей выборки способствует значительному увеличению точности прогнозирования. Применение предложенной методики формирования обучающей выборки позволило снизить среднюю абсолютную процентную ошибку краткосрочного прогнозирования почасового электропотребления группы точек поставки гарантирующего поставщика на 0,41%.

Список литературы

1. Доманов В.И., Билалова А.И. Прогнозирование объемов энергопотребления в зависимости от исходной информации // Вестник ЮУрГУ. Серия: Энергетика. 2016. Т. 16. № 2. С. 59-65. DOI: 10.14529/power160208.

2. Хамитов Р.Н. Краткосрочное прогнозирование электропотребления на сутки вперед для энергосбытовой компании методом аппроксимации / Р.Н. Хамитов, А.С. Грицай, Д.А. Тюньков, Г.Э. Синицин // Промышленная энергетика. 2017. № 3. С. 2-8.

3. Катасёв А.С. Нейронечеткая модель формирования нечетких правил для оценки состояния объектов в условиях неопределенности // Компьютерные исследования и моделирование. 2019. Т. 11. № 3. С. 477-492. DOI: 10.20537/2076-7633-2019-11-3477-492.

4. Станкевич Т.С. Разработка метода оперативного прогнозирования динамики развития лесного пожара посредством искусственного интеллекта и глубокого машинного обучения // Вестник Иркутского государственного технического университета. 2018. Т. 22, № 9 (140). С. 111-120. DOI: 10.21285/1814-3520-2018-9-111-120.

5. Ming-Wei Li, Jing Geng, Wei-Chiang Hong, Yang Zhang. Hybridizing Chaotic and Quantum Mechanisms and Fruit Fly Optimization Algorithm with Least Squares Support Vector Regression Model in Electric Load Forecasting // Energies. 2018. Vol. 11. No. 9. P. 2226. DOI: 10.3390/en11092226.

6. Дугин Д.Д., Грицай А.С. Использование температурно-ветрового индекса в задачах краткосрочного прогнозирования электропотребления // Материалы Всероссийской научной конференции студентов, магистрантов, аспирантов «Актуальные вопросы энергетики». 2016. С. 51-56.

7. Хомутов С.О., Сташко В.И., Серебряков Н.А. Повышение точности краткосрочного прогнозирования электропотребления групп точек поставки электроэнергии гарантирующих поставщиков второго уровня // Известия ТПУ. Инжиниринг георесурсов. 2020. Т. 331. № 6. С. 128-140. DOI: 10.18799/24131830/2020/6/2682.

8. Quayle R.G., Steadman R.G. The Steadman wind chill: an improvement over present scales // Amer. Meteorological Soc. 1998. V. 13. P. 1187-1193.

9. Liu N., Tang Q., Zhang J., Fan W., Liu J. A hybrid forecasting model with parameter optimization for short-term load forecasting of micro-grids // Applied Energy. 2014. V. 129. P. 336-345.

10. Kingma D.P., Lei Ba J. ADAM: a method for stochastic optimization // ArXiv.org. 2015. [Электронный ресурс] URL: https://arxiv.org/abs/1412.6980 (дата обращения 12.12.2019).

Хомутов Станислав Олегович, д-р техн. наук, заведующий кафедрой, homutov.so@yandex.ru, Россия, Барнаул, Алтайский государственный технический университет им. И.И. Ползунова,

Хамитов Рустам Нуриманович, д-р техн. наук, профессор, apple_2 7@list. ru, Россия, Омск, Омский государственный технический университет,

Грицай Александр Сергеевич, канд. техн. наук, заведующий кафедрой, aleksandr.gritsayaigmail.com, Россия, Омск, Омский государственный технический университет,

Серебряков Николай Александрович, аспирант, na_serebryakov@altke. ru, Россия, Барнаул, Алтайский государственный технический университет им. И.И. Пол-зунова

METHODOLOGY OF THE TRAINING DATA FORMATION IN THE PROBLEMS OF SHORT-TERM LOAD FORECASTING OF THE DEFAULT PROVIDER

S.O. Khomutov, RN. Khamitov, A.S. Gritsay, N.A. Serebryakov

The methodology offorming a data sample required for training and testing neural network algorithms for short-term load forecasting are considered. The proposed methodology is based on the authors' analysis of the factors influencing the hourly power consumption of a default provider or a energy sales company, as well as methods for improving the convergence of artificial neural networks learning algorithms.

Key words: artificial neural network, training data, load forecasting, analysis offac-

tors.

Khomutov Stanislav Olegovich, doctor of technical sciences, head of chair, homutov. soa,yandex. ru, Russia, Barnaul, Polzunov Altai State Technical University,

Khamitov Rustam Nurimanovich, doctor of technical sciences, professor, apple_2 7@,list. ru, Russia, Omsk, Omsk State Technical University,

Gritsay Alexander Sergeevich, candidate of technical sciences, head of chair, aleksandr. gritsay@gmail. com, Russia, Omsk, Omsk State Technical University,

Serebryakov Nikolai Aleksandrovich, postgraduate, na serebryakovai altke. ru, Russia, Barnaul, Polzunov Altai State Technical University

i Надоели баннеры? Вы всегда можете отключить рекламу.