УДК 621.31+519.2
АНАЛИЗ МАЛОЙ ВЫБОРКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ ПРИ УПРАВЛЕНИИ ЭНЕРГОСНАБЖЕНИЕМ И ЭНЕРГОСБЕРЕЖЕНИЕМ
РЕГИОНА
А.М. КУМАРИТОВ, А.Э. ДЗГОЕВ, М.С. БЕТРОЗОВ, Е.Н. БОЧКОР
Северо-Кавказский горно-металлургический институт (Государственный технологический университет) СКГМИ (ГТУ), г. Владикавказ
Аннотация: Проведен анализ малой выборки экспериментальных данных по потреблению электроэнергии, позволяющий принимать верные решения по прогнозированию электропотребления при управлении энергоснабжением и энергосбережением в регионе. Разработаны новые полезные адекватные регрессионные модели, которые используются для прогнозирования электропотребления.
Ключевые слова: малая выборка данных, анализ экспериментальных данных, прогнозирование электропотребления, математическая статистика.
Введение
В настоящее время у субъектов электроэнергетической отрасли возникает необходимость более глубокого понимания тех факторов, которые влияют на принятие единственного верного решения энергосбытовыми организациями. При этом своевременный анализ малой выборки экспериментальных данных и прогнозирование электропотребления - одно из важнейших условий качественного управления электроснабжением и энергосбережением региона [1].
Прогнозные оценки электропотребления составляют основную информацию для принятия решений о планировании энергопотребления и развития энергоснабжения и энергосбережения в регионе. Оперативное прогнозирование потребления электроэнергии является основой для формирования энергосбытовой компанией заявки на необходимые объемы электроэнергии, подаваемой администратору торговой системы (АТС). Точность подаваемой заявки напрямую зависит от корректного прогнозирования электропотребления.
Методика исследования
В научной публикации [2] подробно описан новый разработанный метод прогнозирования, названный, «методом скользящей матрицы» [2, 3, 4, 5], который заключается в непрерывном обновлении коэффициентов регрессионной модели путём удаления строки с устаревшими данными и ввода новой строки с данными в прогнозируемой точке. Данный метод был использован в настоящей работе при анализе экспериментальных данных и для прогнозирования электропотребления.
Для проведения анализа и прогнозирования использованы экспериментальные данные фактического потребления электроэнергии (кВт*ч) двадцати дней, за определенный временной интервал - 1 час.
Расчеты проведены в программе MathCad 14.
Результаты исследования и их обсуждение
В качестве независимых переменных (Х) были выбраны время и температура окружающей среды (по данным метеослужбы), а зависимой - потребление электроэнергии (Г).
Число статистических наблюдений было выбрано равным двадцати дням (N = 20) исходя из того, что минимальное значение наблюдений для проверки наличия
© А.М. Кумаритов, А.Э. Дзгоев, М.С. Бетрозов, Е.Н.Бочкор Проблемы энергетики, 2013, № 9-10
автокорреляции во временном ряду по методу Дарбина-Уотсона [6] не должно быть менее 15. С другой стороны, при N > 20 возрастает число «устаревших» экспериментальных данных и их негативное влияние при формировании регрессионных моделей, которые будут использованы для прогнозирования электропотребления.
Для проведения аппроксимации экспериментальных данных использовались линейные и нелинейные регрессионные уравнения второй степени. Но разработанные регрессионные модели оказались неадекватными, появлялась автокорреляция во временном ряду, а также наблюдалось увеличение абсолютной ошибки прогноза.
Установлено, что ошибка прогноза будет меньше, если описывать экспериментальные данные неполным полиномом второй степени, который представлен в виде регрессионной модели 1:
У = В0 + В1 • Х1 + В2 • Х12 + В3 • Х2 + В4 • Х1 • Х2, (1)
Рассмотрим метод обработки информации на основе скользящей матрицы независимых и зависимых переменных [2]:
а) формирование матрицы независимых переменных Х и вектора-столбца зависимой переменной У представлено на рис. 1. Проведен экспериментальный расчет. М= 20; к:= 5,
где N - число опытов; к - число коэффициентов регрессии в уравнении, включая свободный член; X - матрица независимых переменных, У - вектор - столбец зависимой переменной (потребление электроэнергии).
При оценке множественной регрессии для обеспечения статистической надежности требуется, чтобы число наблюдений, по крайней мере, в 3-4 раза превосходило число оцениваемых параметров [7].
Г
Х =
1 1 16 16 Л Г 126.884 >
2 4 15 зо 135 .635
3 9 15 45 134.286
4 16 14 56 135.03 1
5 25 16 80 134.640
6 36 17 Ю2 136.887
7 49 16 1 12 135.027
8 64 15 120 137.964
9 81 18 162 138.005
10 100 17 170 128.273
У
1 1 121 16 176 137.625
12 144 13 156 135 140
13 169 12 156 140.462
14 196 14 196 143 .3 13
15 225 14 2 10 139.243
16 256 13 208 146.821
17 289 13 221 145 .395
18 324 10 180 146.805
19 361 13 247 145.700
20 400 12 240 V 145 .505 у
Рис. 1. Матрица независимых переменных Х и вектор-столбец зависимой переменной У - расчет коэффициентов регрессионной модели производился по формуле
В = (ХТХ )_1 ХТУ,
где В - коэффициенты регрессионного уравнения.
© Проблемы энергетики, 2013, № 9-10
В результате получено 5 коэффициентов регрессии:
В =
С 140.024 Л 0.61
-3
9.239 х 10 -0.541 -0.01
Разработана новая полезная регрессионная модель, которая представлена в виде формулы
У = 140.024 + 0.61 • Х1 + 0.009239 • Х12 - 0.541 • Х2 - 0.01 • Х1 • Х2. (3)
б) удаление первой строки в матрице независимых переменных (Х) и в вектор-столбце зависимой переменной (У), а также добавление двадцатой строки в матрицы (Х) и (У) представлено на рис.3 [2].
Добавленные в матрицы (Х) и (У) значения независимых переменных и потребление электроэнергии в прогнозной точке находятся в конце матрицы на 21 день. Х^ - фиктивная переменная, для формирования свободного члена коэффициента
2 2
регрессии; Х1 - время (дни); Х1 - время ; Х2 - температура окружающей среды (по
данным метеослужбы), электроэнергии, кВт-ч.
оС; Х3 - произведение Х1 • Х2; У - потребление
Х0 Хг
Г 1—з—
Х1 Х 2
Х :
1 б
X,
16 л
2
3
4
5
6
7
8 9 Ю 1 1 12
13
14
15
16
4
9 16 25 36 49 64 81 ЮО 121 144 169 196 225 256
17 289
18 324
19 361
20 400
21 441
ЗО 45 56 80 Ю2 1 12 120 162 170 176 156 156 196 2Ю 208 221 180 247 12 240 9 189 у
15
15
14
16
17 16
15
18 17
16
13 12
14 14 13 13
ю
13
7
С 126.884
У
135.635 134.286 135.ОЗ 1 134.640 136.887 135.027 137.964 138.005 128.273 137.625 135.140 140.462 143.3 13 139.243 146.82 1 145.395 146.805 145.700 145.505 V 159.350
Рис. 2. Исключение первой строки матрицы (Х) и (У), а также добавление
двадцатой строки
Далее проведен анализ наличия автокорреляции во временном ряду. Проведена проверка экспериментальных данных по потреблению электроэнергии на наличие автокорреляции. Наличие автокорреляции свидетельствует о том, что данные не пригодны для прогнозирования.
Отклонения расчетных значений зависимой переменной от экспериментальных данных рассчитывались по формуле
е = У - УЯ, (4)
где е - отклонения расчетных значений зависимой переменной (У) от экспериментальных данных (УЯ).
Результат расчета отклонений показан на рис. 3.
УЯ =
1
1 131.821
2 132.853
3 133.353
4 134.453
5 133.814
6 133.755
7 134.922
8 136.128
9 134.834
10 136.076
11 137.359
12 140.012
13 141.394
14 140.754
15 141.486
16 142.944
17 143.723
18 146.706
19 145.336
20 146.92
£ =
1
1 -4.937
2 2.782
3 0.933
4 0.578
5 0.826
6 3.132
7 0.105
8 1.836
9 3.171
10 -7.803
11 0.266
12 -4.872
13 -0.932
14 2.559
15 -2.243
16 3.877
17 1.672
18 0.099
19 0.364
20 -1.415
Рис. 3. Таблица значений УЯ и е
Далее рассчитаны отклонения с лагом = 1. г := 1..19; Л1:= е^ К1:= е1+1; согг(А,К) - коэффициент корреляции между А и К.
Результаты расчета представлены на рис. 4 (А и К - отклонения с лагом =1).
Расчет автокорреляции во временном ряду рассчитан по формуле Дарбина-Уотсона (5):
^ТМ-КК9_ (5)
I е2
По таблице критических значений ^-статистики для N = 20 (двадцать дней) на уровне значимости 0,05 имеем: йн = 1,20 (нижнее) и йв = 1,41 (верхнее).
А =
1
1 -4.937
2 2.782
3 0.933
4 0.578
5 0.826
б 3.132
7 0.105
8 1.836
9 3.171
10 -7.803
11 0.266
12 -4.872
13 -0.932
14 2.559
15 -2.243
16 3.877
17 1.672
18 0.099
19 0.364
K =
1
1 2.782
2 0.933
3 0.578
4 0.826
5 3.132
6 0.105
7 1.836
8 3.171
9 -7.803
10 0.266
11 -4.872
12 -0.932
13 2.559
14 -2.243
15 3.877
16 1.672
17 0.099
18 0.364
19 -1.415
corr(A,K)=-0.224
Рис. 4 - Матрицы значений A и K
В результате расчета коэффициент Дарбина-Уотсона составил d=2,255, что свидетельствует об отсутствии автокорреляции, так как d находится в интервале < d < (4 - dв) или 1,41 < 2,255 < 2,59 [6].
Включение в состав регрессионного уравнения времени позволило существенно снизить опасность возникновения автокорреляции во временном ряду.
Проведена проверка разработанной регрессионной модели на ее адекватность.
Адекватность регрессионных моделей экспериментальным данным по потреблению электроэнергии определена с помощью F - критерия Фишера при уровне значимости 0,05:
FR - —,
Dad
F - gF(0.95, N-1, N - к),
r - corr(Y ,YR),
£ (Y - YSR)2
DY -YSR -
N -1
Ц
N '
N - к YR = X ■ B,
F = 2,34 FR = 2,87,
где FR — расчётное значение F — статистики; F — табличное значение F - критерия Фишера; r — коэффициент корреляции между экспериментальной и расчётной значениями зависимой переменной; DY — дисперсия зависимой переменной; Dad — дисперсия адекватности.
Вывод: в связи с тем, что FR > F, регрессионная модель признана адекватной экспериментальным данным.
Ошибка прогноза и доверительный интервал коридора ошибок рассчитаны по формулам:
- ошибка прогноза
где ? - табличное значение критерия Стьюдента.
У т1п = УР - SN N, У тах = УР + SN N - коридор ошибок в прогнозной точке.
УР = 150.063 кВт-ч - прогнозное значение;
S20 20 = 8.602 кВт-ч - интервал коридора ошибок;
УМАХ := УР + S20,20,
УМЛХ = 158.666 кВт-ч - максимальное значение коридора ошибок в прогнозной
точке;
УММ := УР - S20,20,
УМ0^ = 141.461 кВт-ч - Минимальное значение коридора ошибок в прогнозной
точке.
Результаты проведенного анализа малой выборки экспериментальных данных, а также расчеты прогнозных оценок электропотребления на 6 дней вперед (30% от 20 дней) представлены в табл. 1, где УфАКТ - фактические значения потребления электроэнергии, кВт • ч; УдРОГНОЗ - прогнозные значения электропотребления, кВт • ч; АУ - абсолютная ошибка кВт • ч; е - относительная ошибка прогнозной оценки, %; FЯ-Я - знак «>» показывает, что расчетное значение критерия Фишера ^Я) больше табличного значения F-статистики - следовательно, разработанные новые полезные адекватные регрессионные модели адекватны, г -коэффициент корреляции между зависимой переменной (У) и расчетным значением зависимой переменной (УЯ). В табл. 1 отсутствуют данные за 08.10.2011 и 09.10.2011 г., так как это выходные дни, прогнозные оценки для которых рассчитываются только по соответствующим экспериментальным данным (прогнозирование электропотребления на выходные дни в данной статье не рассматривается).
DP := X(XTX)-1 XT,
(6)
- интервал коридора ошибок
(7)
Таблица 1
Результаты проведенного анализа экспериментальных данных
Дата Диапазон времени t°,C Y 1 ФАКТ. Y 1 ПРОГНОЗ. A Y s ,% FRF r
03.10.2011 00-01 9 159,35 150,063 9,287 5,828051 > 0,851
04.10.2011 00-01 7 169,107 163,788 5,319 3,145346 > 0,912
05.10.2011 00-01 10 168,68 159,846 8,834 5,237135 > 0,951
06.10.2011 00-01 12 174,026 161,405 12,621 7,252365 > 0,995
07.10.2011 00-01 15 169,915 171,126 1,211 0,712709 > 0,956
10.10.2011 00-01 14 153,417 176,746 23,329 15,20627 > 0,965
е = 6,23%, где е среднее значениеотносительной ошибки для N=6. Во всех случаях автокорреляция в экспериментальных данных отсутствовала. Графики фактических данных потребления электроэнергии, прогнозных значений электропотребления и выбранный полиномиальный тренд второй степени показаны на
00-01 00-01 00-01 00-01 00-01 00-01 Диапазон
времени (часы)
03.10.2011 04.10.2011 05.10.2011 06.10.2011 07.10.2011 10.10.2011 Календарные дни
Рис. 5. Графики фактических, прогнозных значений электропотребления и выбранный
тренд (рабочие дни)
Аналогично производится прогнозирование потребления электроэнергии на 22-й день за последующие часовые периоды.
Выводы
В результате анализа малой выборки экспериментальных данных были разработаны новые полезные адекватные регрессионные модели, на основе которых рассчитаны прогнозные оценки электропотребления, необходимые энергосбытовым компаниям для подачи заявки на оптовый рынок электроэнергии и мощности, а также для эффективного управления энергоснабжением и энергосбережением в регионе.
Summary
Analyzed the experimental data on the consumption of electricity, allowing the right decisions on the prediction of power consumption in the management of energy supply and energy efficiency in the region. Developed new useful adequate regression models are used to predict energy consumption.
© Проблемы энергетики, 2013, № 9-10
Key words: analysis of experimental data prediction of electric energy consumption, mathematical statistics.
Литература
1. Кумаритов А.М., Хузмиев И.М., Дзгоев А.Э. Разработка структурной схемы технологического процесса обработки информации системы распределения электроэнергии // Вестник Воронежского государственного технического университета. Т.6. №1. 2010. С. 155-159.
2. Алкацев М.И., Дзгоев А.Э., Бетрозов М.С. Исследование и разработка метода прогнозирования потребления электроэнергии в системе управления электроснабжением региона // Известия вузов. Проблемы энергетики. №5-6. 2012. С.30-37.
3. Свидетельство о государственной регистрации программы для ЭВМ. 2011613131. Экспертная система «Математические расчёты краткосрочного прогнозирования потребления электроэнергии для электрораспределительных сетевых компаний» / А.М.Кумаритов, М.И.Алкацев, А.Э.Дзгоев, М.С.Бетрозов, И.М.Хузмиев, Добаев А.З. 2011.
4. Свидетельство о государственной регистрации программы для ЭВМ. 2011618576. «Математические расчёты краткосрочного программирования потребления электроэнергии для предприятий» / А.М.Кумаритов, М.И.Алкацев, А.Э.Дзгоев, М.С.Бетрозов, И.М.Хузмиев, Добаев А.З. 2011.
5. Свидетельство о государственной регистрации программы для ЭВМ. 2013614024. Скользящая матрица как метод статистического анализа динамических рядов / А.М.Кумаритов, М.И.Алкацев, А.Э.Дзгоев, М.С.Бетрозов, И.М.Хузмиев, Добаев А.З. 2013.
6. Кремер Н. Ш. Теория вероятностей и математическая статистика: Учебник для вузов. 2-е изд., перераб. и доп.М.: ЮНИТИ-ДАНА, 2004. 573 с.
7. Замков О.О., Толстопятенко А.В., Черемных Ю.Н. Математические методы в экономике: Учебник. М.: МГУ им. М.В. Ломоносова, Издательство «ДИС», 1997. 368 с.
Поступила в редакцию 05 июля 2013 г.
Кумаритов Алан Мелитонович - д-р техн. наук, профессор, заведующий кафедрой «Информационные системы в экономике» СКГМИ (ГТУ), г. Владикавказ. Тел: 8(901)4976099. E-mail: Power74@yandex.ru.
Дзгоев Алан Эдуардович - канд. техн. наук, доцент кафедры «Информационные системы в экономике» СКГМИ (ГТУ), г. Владикавказ. Тел: 8(919)4228473. E-mail: Dzgoev_alan@mail.ru.
Бетрозов Марат Сергеевич - аспирант кафедры «Информационные системы в экономике» СКГМИ (ГТУ), г. Владикавказ. Тел.: 8(918)7271235. E-mail: betrozm@mail.ru.
Бочкор Елена Николаевна - аспирант кафедры «Информационные системы в экономике» СКГМИ (ГТУ), г. Владикавказ. Тел: 8(988)9228688. E-mail: jersey-01@mail.ru.