Научная статья на тему 'Метод экспоненциального сглаживания линии тренда временного ряда в сочетании с методом индексов сезонности при краткосрочном прогнозировании электропотребления'

Метод экспоненциального сглаживания линии тренда временного ряда в сочетании с методом индексов сезонности при краткосрочном прогнозировании электропотребления Текст научной статьи по специальности «Математика»

CC BY
234
23
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Алексеева И. Ю., Степанов В. П., Ведерников А. С.

Проведен анализ бытового электропотребления населением г. Чапаевска Самарской губернии с учетом сезонных колебаний по методу экспоненциального сглаживания линии тренда в сочетании с методом индексов сезонности за период 2004-2006 гг. на основе формы статистической отчетности № 46ЭС «Полезный отпуск электрической и тепловой энергии» энергосистемы ОАО «Самараэнерго».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Алексеева И. Ю., Степанов В. П., Ведерников А. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод экспоненциального сглаживания линии тренда временного ряда в сочетании с методом индексов сезонности при краткосрочном прогнозировании электропотребления»

Электротехника

УДК 621.311.031:621.331.153

И.Ю. Алексеева, В.П. Степанов, А. С. Ведерников

МЕТОД ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ ЛИНИИ ТРЕНДА ВРЕМЕННОГО РЯДА В СОЧЕТАНИИ С МЕТОДОМ ИНДЕКСОВ СЕЗОННОСТИ ПРИ КРАТКОСРОЧНОМ ПРОГНОЗИРОВАНИИ ЭЛЕКТРОПОТРЕБЛЕНИЯ

Проведен анализ бытового электропотребления населением г. Чапаевска Самарской губернии с учетом сезонных колебаний по методу экспоненциального сглаживания линии тренда в сочетании с методом индексов сезонности за период 2004-2006 гг. на основе формы статистической отчетности №46ЭС «Полезный отпуск электрической и тепловой энергии» энергосистемы ОАО «Самараэнерго».

Современные методики построения прогнозных моделей базируются на статистическом анализе и моделировании временных рядов [1]. Многие явления характеризуются периодически повторяющимися сезонными эффектами. Соответственно временные ряды, их отражающие, содержат периодические сезонные колебания. Временной ряд, подчиняющийся сезонным колебаниям, будем считать нестационарным случайным процессом. Нестационарный случайный процесс можно представить в виде моделей двух типов [1]:

- модель с мультипликативными коэффициентами сезонности;

- модель с аддитивными коэффициентами сезонности.

Мультипликативная модель имеет вид

X = х +е х

где х1: - функция, описывающая нестационарный случайный процесс, X - детерминированная функция (тренд), а1л - величина, характеризующая тенденцию развития процесса; /-1,., /¡„¡+1 -

коэффициенты сезонности; I — количество фаз в полном сезонном цикле (при месячных данных ¡=12, при квартальных - ¡=4); е1 - неавтокоррелированный шум с нулевым математическим ожиданием.

Аддитивная модель имеет вид

X = х + е х = а1,( +

где gt, gt-l,..., gt-¡+l - аддитивные коэффициенты сезонности.

Если сезонная модель прогнозирования, структура которой не содержит элементов для отражения какой-либо тенденции роста, применяется для прогнозирования ряда, характеризующегося ярко выраженной тенденцией, то коэффициенты ^ ^) перестают быть простыми коэффициентами сезонности и вбирают в себя в определенной мере эффект роста. Если ряд имеет тенденцию, то в модель необходимо ввести специфический член, учитывающий эту тенденцию.

Таким образом, используется множество комбинаций различных типов тенденций и циклических явлений аддитивного и мультипликативного типа, представленных в виде девяти возможных моделей, которые могут быть выражены одной формулой:

а1( = а1ё1 + (1 - а1 )ё2,

где а1л - текущий уровень ряда после элиминирования сезонных колебаний; а1 - параметр сглаживания, 0 < а1 < 1; С1, с12 - значения, которые характеризуют ту или иную модель.

Девять вышеуказанных моделей составляют три группы по три варианта в каждой. Первую группу образуют модели:

- без тренда;

- с аддитивным линейным трендом;

- с мультипликативным (экспоненциальным) трендом.

Вторую группу составляют три модели из первой группы с наложенным на них аддитивным сезонным эффектом. Третью группу - три модели из первой группы с наложенным на них мультипликативным сезонным эффектом.

В электроэнергетике наиболее широко применяется аддитивная модель для прогнозирования суточных, недельных графиков электрической нагрузки; мультипликативные модели имеют ограниченное применение [1].

Прогнозируемый полезный отпуск электроэнергии населению определяется на предстоящий год в разбивке на кварталы или месяцы. Для примера в табл. 1 представлены данные (в о.е.) о полезном отпуске электроэнергии населению г. Чапаевска Самарской губернии на основе формы статистической отчетности №46ЭС «Полезный отпуск электрической и тепловой энергии» энергосистемы ОАО «Самараэнерго». Данные приведены в о.е. [2], так как фактические показатели электропотребления по форме отчетности №46ЭС представляют собой коммерческую тайну и являются недоступными. Соответствующий график показан на рисунке. Временной ряд, представленный на рис. 1, подчиняется сезонным колебаниям. Полезный отпуск увеличивается в зимние месяцы и уменьшается в летние. Для прогнозирования электропотребления в работе использована модель экспоненциального сглаживания линии тренда временного ряда, сезонные значения вычисляются при этом методом индексов сезонности [1], [2].

Аппроксимация фактических значений электропотребления линией тренда. С целью отражения общей тенденции изменения требуемого параметра его фактические значения аппроксимируются при помощи линии тренда. Для аппроксимации фактических значений временного ряда, подверженного сезонным колебаниям, эффективной оказывается линия тренда, пересекающая все сезонные колебания, сглаживая их. Эта линия тренда может быть получена последовательным осреднением всех р точек, где р - число временных интервалов (сезонов), методом скользящей средней [2].

Пусть зафиксировано N фактических значений электропотребления для моментов времени

/=0,1,2,..., N-1, для удобства изложения метода начальная точка исходных данных обозначена как

нуль. В этом случае начальный момент времени tнач, для которого возможно вычисление значения линии тренда методом скользящей средней, определяется по выражению

нач = (Р - 1)/2. (1)

Момент времени для конечной точки находится по формуле

кн = ^-1) -(Р -1)/2 . (2)

Скользящие средние могут быть простыми и взвешенными [2].

Т а б л и ц а 1

Данные по месяцам о полезном отпуске электроэнергии населению г. Чапаевска

за период 2004 - 2006 гг., в о.е.

Месяц 2004 г. 2005 г. 2006 г.

Январь 3,03 2,70 2,86

Февраль 2,43 3,00 3,36

Март 2,40 2,86 3,22

Апрель 2,15 2,68 2,82

Май 2,04 2,43 2,75

Июнь 2,00 2,34 2,43

Июль 1,04 2,41 2,69

Август 2,07 2,47 2,89

Сентябрь 2,20 2,62 3,12

Октябрь 2,22 2,68 3,70

Ноябрь 2,48 2,86 3,74

Декабрь 3,18 3,70 4,80

Если число р нечетное, то пользуются простой скользящей средней ру, которая вычисляется простым последовательным осреднением каждых р точек [3]:

г+(р-1)/2

Еъ

р = /=(г-(р-1)/2) , (3)

р

где г - момент времени, для которого вычисляется значение скользящей средней, гнач < г < гкон ; -

фактические значения электропотребления, зафиксированные в момент времени / (/=0.. .N-1).

Простую скользящую среднюю можно использовать и при четном количестве временных интервалов р. Однако значения скользящей средней будут вычислены в промежуточные моменты времени. Например, для р=12 и N=36 (см. табл. 1 - помесячные данные за 3 года) в соответствии с формулами (2) и (3) гнач=5,5, гкон=29,5. Поэтому, чтобы рассчитать скользящую среднюю при значениях абсцисс, равных абсциссам фактических значений /, применяют так называемую взвешенную скользящую среднюю ру с числом временных интервалов р1 [3]:

г+(р1 -1)/2

Е

Г,У, = '="-рр1 -1,/2‘, (4)

Е V,

,=1

гдер1=р+1; V,- члены ряда весовых коэффициентов (множителей) р1У, = (у1,у2,...,ур).

Первая осредняемая на данном шаге фактическая точка умножается на весовой коэффициент, равный V.;, последняя - на vp.

Например, для случая помесячных данных за 3 года (см. табл. 1) следует вычислять взвешен -ную скользящую среднюю с числом временных интервалов р1=13 и рядом весовых коэффициентов 13У,=(1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 1). Результаты сводим в табл. 2. Тогда гнач=6; гкон=29 (см. рис. 1, точки в интервале 6 < г < 29 ).

Вычисление индексов сезонности. Предварительно для каждого из сезонов (кварталов или месяцев) общим количеством 5 в течение временного ряда от гнач до гкон вычисляется 1ь -отношение фактического значения Ъ,к, отмеченного в данный момент времени г и соответствующего сезону к, к значению тренда у, полученного для того же момента времени методом скользящей средней:

ъ,к

4 = —, (5)

уг

где г гнач. гкон; к=1 . 5.

Индекс (коэффициент) сезонности Jk для сезона к вычисляется теперь как усредненное значение полученных для него по формуле (5) отношений для ряда лет п:

Jk =Е(!к)./п , (6)

п,

/=1

где (4 )/ - отношение, полученное для данного сезона к за ряд лет / при помощи формулы (5); к=1 ...я.

Результаты сведены в табл. 2.

Удаление сезонных колебаний. В диапазоне от гнач до гкон значения линии тренда получаются методом скользящей средней. Крайние же ее точки могут быть определены методом удаления сезонных колебаний, при котором фактические значения делятся на индексы сезонности:

Уг =-гк, (7)

¿к

где уг - значения тренда, получаемые путем удаления сезонных колебаний; Ъгк - фактические значения электропотребления, зафиксированные в момент времени г и соответствующие сезону к; гк -индекс сезонности для сезона к; 0 < г < (гнаЧ -1), (гкон +1) < г < ^ -1).

Результаты сведены в табл. 2. Вид части линии тренда, полученной методом удаления сезонных колебаний, представлен на рис. 1, г < 5, г > 30.

Прогнозирование линии тренда. Прогнозирование линии тренда выполняется методом экспоненциального сглаживания [2]. Сущность метода состоит в том, что линия тренда временного ряда сглаживается с помощью взвешенной скользящей средней, в которой весовые коэффициенты подчиняются экспоненциальному закону, т.е. эта средняя может служить для

Потребление электроэнергии, в о.е.

Фактическая кривая —»—Линия тренда

Временной ряд полезного отпуска электроэнергии населению г. Чапаевска за период 2004-2006 гг.

оценки и текущей коррекции математического ожидания процесса. Взвешенная скользящая средняя с экспоненциально распределенными весовыми коэффициентами характеризует значение процесса на конце интервала сглаживания, являясь средней характеристикой последних уровней ряда. Имен -но это свойство используется при прогнозировании. Для проведения сглаживания необходимо задать величину параметра сглаживания а , определяющего скорость убывания весовых коэффициентов значений линии тренда у. Параметр а может принимать значения 0<а<1. Если а »1, то при прогнозе учитывается в основном влияние лишь последних наблюдений, и, наоборот, при а » 0 весовые коэффициенты, по которым взвешиваются уровни временного ряда, убывают медленно, и при прогнозе в значительной степени учитываются все или почти все прошлые наблюдения.

Пусть имеется линия тренда временного ряда уг 0=1,2,...,Щ, которая описывается полиномом степени р:

а2 2 ар р

у/ = +—— / +... +-------/ + е, (8)

2! р!

где е/ - случайная величина с нулевым средним и дисперсией 0[е].

Требуется составить прогноз на моменты времени (N+1), (1=1,2,.,V).

Основной целью экспоненциального сглаживания при этом является вычисление рекуррентных поправок к оценкам уравнения вида (8).

Для линейной модели у( = ао + а^ + е( оценки коэффициентов рассчитываются следующим образом:

а 0

= 2Б[1](у) - Б[2](у);

1 1 1 -а

а [У1'(у) -

где к ] - экспоненциальные средние ¿-того порядка в точке /,

8[1] = а +(1 - а)5[—1(у);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Б[к] = аБ[к-1] (у) + (1 - а)8[к' (у) . (9)

Величина Б[к1 называется начальным условием и обозначается 8[к' .

Начальные условия для линейной модели определяются в соответствии с выражениями

8[1](у) = ао- 1—^а1;

а

8[2](у) = ао - 2(1 а а1.

а

Прогноз рассчитывается по формуле

у+ = а о + 1а 1,

а ошибка прогноза составляет величину

а . = ---а—-¡1 + 4(1 -а) + 5(1 -а)2 + 2а(4 -3а)1 + 2а212],

у<+> В\ (2-а)31 -1

г=2

где =

е " N - 3

Ниже приведены формулы для определения оценок коэффициентов, начальных условий,

12

прогнозных значений и точности прогноза для квадратичной модели у/ = ао + а/ + 2а2/ + е/:

а о = з\б[1] (у) - Б[2](у) + Б[3] (у)] ;

' а ¡(6 - 5а)Б[1](у) - 2(5 - 4а)Б[2](у) + (4 - 3а)Б[3](у)

а 1 =

1 2 1 2(1 -а )2

Результаты расчетов

Прогнозный месяц Значения линии тренда у,, о.е. Фактические значения электропотребления, о.е. Индекс сезонности Jk

Январь 2004 2,91 3,03 1,04

Февраль 2004 2,09 2,43 1,16

Март 2004 2,18 2,40 1,10

Апрель 2004 2,19 2,15 0,98

Май 2004 2,27 2,04 0,90

Июнь 2004 2,47 2,00 -

Июль 2004 2,26 1,04 -

Август 2004 2,27 2,07 -

Сентябрь 2004 2,31 2,20 -

Октябрь 2004 2,35 2,22 -

Ноябрь 2004 2,39 2,48 -

Декабрь 2004 2,42 3,18 -

Январь 2005 2,49 2,70 -

Февраль 2005 2,56 3,00 -

Март 2005 2,60 2,86 -

Апрель 2005 2,63 2,68 -

Май 2005 2,67 2,43 -

Июнь 2005 2,71 2,34 -

Июль 2005 2,73 2,41 -

Август 2005 2,76 2,47 -

Сентябрь 2005 2,79 2,62 -

Октябрь 2005 2,81 2,68 -

Ноябрь 2005 2,83 2,86 -

Декабрь 2005 2,84 3,70 -

Январь 2006 2,86 2,86 -

Февраль 2006 2,89 3,36 -

Март 2006 2,93 3,22 -

Апрель 2006 2,99 2,82 -

Май 2006 3,07 2,75 -

Июнь 2006 3,15 2,43 0,81

Июль 2006 4,01 2,69 0,67

Август 2006 3,21 2,89 0,90

Сентябрь 2006 3,30 3,12 0,94

Октябрь 2006 3,91 3,70 0,94

Ноябрь 2006 3,67 3,74 1,02

Декабрь 2006 3,69 4,80 1,30

(1 -а )2

\§[1](у) - 2.Ч[2](у) + Ь[3](у)];

41](у> = Щ - — + (1 -а*]^ а,,

а 2а 2

[ 2 ] 2( 1 - а ) ( 1 - а )( 3 - 2а )

ь[ ](у) = ао —!--------- а1 + '-------^--------^2;

а1 +- 2 а а2

1 T 2 2 ■а 2а

* , , 1 , ,2 yt +l = а0 + Oll + 2a2l ;

s * » se V2а + 3а2 + 3a3l2

yt+l s>

N

yt ~ " '2

где aB = " t=2

N - 4

Экспоненциальные средние при этом определяются в соответствии с выражением (9).

Получение сезонных прогнозных значений. После получения L прогнозных значений трен -довой линии yt они умножаются на соответствующий индекс сезонности:

W*k = У* ■ Jk, (10)

где W ¡к - искомое прогнозное значение электропотребления в сезоне (месяце, квартале) k; y l -

прогнозное значение тренда, полученное при помощи экспоненциального сглаживания; l=1______L; Jk -

индекс сезонности, рассчитанный для сезона к по формуле (6).

Результат W ¡к , полученный при помощи (10), является конечной целью прогнозирования и позволяет узнать, какое значение прогнозируемой величины электропотребления ожидается в том или ином сезоне.

Имеются два существенных недостатка данного метода прогнозирования [2]:

- результаты прогноза сильно зависят от параметра сглаживания. Интервал, в пределах которого изменяется параметр сглаживания, довольно велик и меняется при прогнозировании различных временных рядов, поэтому выработать четкие рекомендации по выбору этого параметра не удается;

- если отношения Ik , вычисленные по (5) для данного сезона, год от года заметно отличаются друг от друга, то характер линии тренда в той ее части, которая получена методом удаления сезонных колебаний, будет резко переменный, в отличие от части, полученной методом скользящей средней (см. рис. 1).

Такое положение затрудняет использование метода, особенно если учесть, что при прогнозе точкам, находящимся в конце интервала сглаживания, придается максимальный вес.

Таким образом, два указанных недостатка в сочетании делают практически невозможным использование этого метода для прогнозирования сезонных величин полезного отпуска электроэнергии.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Седов А.В., Надтока И.И. Системы контроля, распознавания и прогнозирования электропотребления: модели, методы, алгоритмы и средства. Ростов-н/ Д: Изд-во Ростовского ун-та, 2002. 320 с.

2. Почебут Д.В. Анализ, моделирование и прогнозирование бытового электропотребления в региональной энергосистеме: Дис. ... канд. техн. наук. Новочеркасск, 2001. 170 с.

Статья поступила в редакцию 17 марта 2008 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.