УДК 621.311: 621.331 Раевский Николай Владимирович,
к.т.н., доцент, зам. директора ЗабИЖТ, г. Чита,
тел.: 21-46-71
Литвинцев Виталий Геннадьевич,
ст. преподаватель, ЗабИЖТ, г. Чита, тел.: 89145027890
ПОСТРОЕНИЕ МОДЕЛИ ПРОГНОЗИРОВАНИЯ ТЯГОВОГО ЭЛЕКТРОПОТРЕБЛЕНИЯ НА ОСНОВЕ ИНТЕРВАЛЬНОЙ РЕГРЕССИИ
N.V. Raevski, V.G. Litvitsev
TRACTION POWER CONSUMPTION FORECASTING MODEL CONSTRUCTION ON THE BASIS OF INTERVAL REGRESS
Аннотация. В статье дано обоснование появления причин несовершенства и неточности применяемых методов прогнозирования электропотребления на тягу поездов. Предложен алгоритм прогнозирования ЭП с учетом экспертного решения. Предложена математическая модель построения прогноза расхода электрической энергии с учетом неопределенности исходных данных.
Ключевые слова: модели прогнозирования, электропотребление, интервальная регрессия.
Abstract. In article the substantiation of the reasons of discrepancy of applied methods of forecasting of a power consumption on draft of trains is given. The algorithm of forecasting taking into account the expert decision is offered. The mathematical model of construction of the forecast of the expense of electric energy taking into account uncertainty of the initial data is offered.
Keywords: forecasting model, power consumption, interval regress.
Введение
В настоящее время наблюдается заметный рост исследований по вопросу прогнозирования электропотребления (ЭП) на тягу поездов. Существует большое количество статистических методов определения зависимости между исследуемыми параметрами, влияющими на тяговое ЭП, и самим уровнем электропотребления.
Долгосрочное и краткосрочное прогнозирование ЭП на тягу поездов предлагалось осуществлять на базе идентификации с показателями поездной работы, используя многофакторное регрес-
сионное уравнение [1]. В ходе корреляционного анализа и процесса ранжирования факторов в качестве исследуемых параметров работы участка железной дороги выбирались семь наиболее значимых показателей, на основе которых предлагается осуществлять прогнозирование ЭП. Однако такой подход к планированию электропотребления является весьма трудоемким процессом, так как невозможно с необходимой точностью запланировать на предстоящий период в совокупности всё многообразие рассматриваемых факторов, особенно такие показатели работы, как процент пробега порожних вагонов, ваг-км, включая вагоны при одиночно следующих локомотивах, и т. д. Использование некорректных значений параметров в многофакторной модели может привести к большой погрешности на выходе.
Специалисты СП «Энергосбыт» ОАО «РЖД» при краткосрочном (от суток до несколько дней) прогнозировании ЭП на тягу поездов с помощью автоматизированной системы управления приобретением и потреблением электроэнергии (АСУ ППЭ) ограничиваются осредненными значениями нагрузок за прошлые периоды. Такое упрощенное прогнозирование ЭП также приводит к высоким значениям математического ожидания ошибок, что неприменимо для быстрых оперативных расчетов.
Причинами появления больших ошибок при прогнозировании тягового ЭП могут являться неточности при ведении базы данных об электропотреблении, несвоевременность снятия показаний со счетчиков электрической энергии (ЭЭ) тяговых
Системный анализ. Моделирование. Транспорт. Энергетика. Строительство
подстанций, несовершенство учета ЭЭ, работа счетчиков ЭЭ и трансформаторов тока и напряжения вне своего класса точности, ошибки при обработке информации о потреблении электрической энергии, аварийные ситуации и т. д. Неточности при ведении базы данных о перевозках могут возникать в результате некорректного ведения графиков движения поездов диспетчерами, сбоев в работе автоматизированной системы ведения и анализа графика исполненного движения (ГИД), планирования коммерческих ниток или вследствие субъективных причин.
Все применяемые вероятностно-статистические методы прогнозирования ЭП на тягу поездов (нейросетевые алгоритмы, авторегрессионные модели, различного вида фильтры и др.) в качестве конечного результата прогнозирования на выходе модели имеют точечные значения.
В силу приведенных причин трудно дать точную прогнозную оценку потребления энергии на тягу поездов, совпадающую с фактической величиной. Поэтому становится целесообразным давать не точечную оценку прогнозного значения электропотребления, а интервальную - с указанием доверительных границ, которые накрывают с заданным уровнем надежности неизвестное действительное прогнозное значение потребления электроэнергии [2].
Модель прогнозирования тягового электропотребления
Наиболее перспективным для краткосрочного прогнозирования ЭП на тягу поездов в условиях возможной неопределенности является интервальный линейный регрессионный анализ, основная идея которого - нахождение влияния погрешностей измерений и наблюдений на свойства алгоритмов регрессионного анализа и составление интервального уравнения для прогнозирования заданного параметра с учетом неопределенности и неточности выборочных данных. Алгоритм прогнозирования приведен на рис. 1.
Расход электрической энергии на тягу поездов определяется большим числом одновременно и совокупно действующих факторов. В связи с этим возникает задача исследования зависимости электропотребления на тягу поездов Жт от нескольких объясняющих переменных х1, х2,... хп (средней участковой скорости, средней массы состава, количества поездов, грузооборота и т. д.) с помощью статистического анализа для определения тесноты взаимосвязи каждого в отдельности фактора на зависимую переменную и между фак-
торами друг на друга. Это выполняется посредством следующего алгоритма:
1. Определяется теснота связи между каждым отдельным фактором х и электропотреблением на тягу поездов Жт при помощи коэффициента корреляции гхШ [3] как
и
(1)
где те. = X т " X • ;
Ё (X - X. )2
'2 _ к =1
=
2 _ 1=1
Ё (ИТ,- - &т )2
-• V2 = ; =
2. Определяется средняя погрешность аппроксимации функции регрессии по выражению
а=1£ (жТ' - ИТ)
И,
(2)
п 1 =1 ИТ1
3. Рассчитывается стандартная ошибка коэффициента парной корреляции между эксплуатационными показателями работы анализируемого участка и объемом тягового электропотребления:
1 - Г 2
& х.,Ж = < Г 1 т
п - 2
(3)
В первом приближении нужно, чтобы а'/^т < Гхггт . Значимость ^ проверяется его сопоставлением с а , при этом необходимо полу-
чить
Определение влияющих факторов
Определение рационального объема выборки Оценка автокорреляционной связи
Нахождение коэффициентов множественной регрессии
Составление уравнения множественной регрессии
Проверка параметров уравнения на статистическую значимость
Составление прогностического интервального уравнения
Экспертная оценка
Получение прогнозного значения электропотребления Рис. 1. Алгоритм прогнозирования ЭП на тягу поездов
Т
Гх т
1 ' 'Т
Т
Т
ИРКУТСКИМ государственный университет путей сообщения
/ = Г
расч х;Жт
п — 2
1 - Г
(4)
где ^ - расчетное значение I -критерия, которое
сравнивается с табличным значением критерия Стьюдента (?табл) для заданного уровня вероятности а и (п — 2) степеней свободы.
Подобным же образом на основе соответствующих формул рассчитывается стандартная ошибка параметров уравнения регрессии, а затем и /-критерии для каждого параметра. Важно проверить, чтобы соблюдалось условие ^ > ¿табл . В
противном случае нецелесообразно доверять полученной оценке параметра.
4. Определяется оценка ^-критерия Фишера для определения правильности выбора вида взаи-
мосвязи
Б =
расч
:( п — т )
(1 — < )•( т —1)'
(5)
циента детерминации г : 1
г2 = 1 —
I (ИТ — Ж Т)
V 2
(6)
6. Для анализа построенной и оценённой модели используется средний показатель эластичности
Х;
Э i = Ь-
Ж т
(7)
После того как найдено оптимальное число влияющих на потребление электрической энергии на тягу поездов факторов, составляется уравнение множественной регрессии за сутки на основе часовых значений, имеющее следующий общий матричный вид
Ж = X •р+е,
(8)
где X - матрица размерности 24 х (р +1) значений объясняющих переменных;
Р - матрица-столбец размера (р +1) параметров;
е - вектор возмущений (случайных ошибок или остатков, причины появления которых приведены выше) размера п.
Составляется матрица-столбец значений зависимой переменной и матрица значений объясняющих переменных.
ж =
где т - число параметров уравнения регрессии.
-^расч также должно быть больше ^ при
V =( т — 1) и V =( п — т) степенях свободы. В противном случае пересматривается форма уравнения, перечень переменных и т. д.
5. Характеристика прогностической силы регрессионной модели, а именно мера качества подгонки регрессионной модели к наблюдаемым значениям ЖТ1, оценивается при помощи коэффи-
wT
V 'т24 У
и X =
Г1 1
Х[2
... х
1 р
... х.
2 р
1 Х24,1 Х24,2 ... Х24 р у
. (9)
Применив метод наименьших квадратов, увидим, что решением уравнения (8) будет являться вектор неизвестных параметров р . Для этого
определяется произведение матриц X и X как
X X =
(1 1
Х11 Х21
Л (
24 р
1 Х11 Х12
1 х.
24
24
I Х;1
124 х
i=1
24
I Х
24,1 24,2 24
2р
24 р
.. I х
24 24
I Хр I хпх
V /=1 /=1
и произведение матриц X и Ж,
I хр
i=l у
(10)
показывающий, на сколько процентов изменится Жт при увеличении (уменьшении) влияющего на ЭП фактора х на 1 %.
Важным шагом статистического анализа является нахождение рационального объема выборки при помощи центральной предельной теоремы.
Для определения взаимосвязи между соседними значениями выборочных данных тягового электропотребления в разрезе суток и месяца проводится автокорреляционный анализ временного ряда с помощью тестов Дарбина - Уотсона и Бре-уша - Годфри.
X •ж =
Г1 1
Х11 Х->1
V Х1р Х2р
1 ^ Г' \
I 'т; ;=1 п
I 'ТЛ-1
V ;=1
. (11)
Следующим шагом расчетов находится обратная матрица (X • X) 1. При умножении этой
Т
1
Х
Х
24,1
Х1 р 2 р
Т
Системный анализ. Моделирование. Транспорт. Энергетика. Строительство
матрицы на вектор X • Жт получаются компоненты вектора ¡3 линейной регрессии
¡3 = (XX )-1 х Щ =
¡1
3;
(12)
тогда модель множественной линейной регрессии (8) в зависимости от количества влияющих на электропотребление на тягу поездов факторов примет вид
Ж =3 + ¡Л +¡2х2 +... + 3рх,р + е,. (13)
Полученное уравнение множественной регрессии в качестве прогнозного значения ЭП дает только точечный результат. Однако на практике при прогнозировании потребления электрической энергии на тягу поездов целесообразно вносить поправку относительно этого значения с учетом непредвиденных погрешностей и ошибок а . В этом случае весьма важным является заменить точечную оценку интервальной величиной прогнозируемого электропотребления с основным уровнем надежности (доверием).
Таким образом, доверительный интервал для индивидуальных прогнозных значений зависимой переменной Щ0 имеет вид
[ЖТ0 ^
-а;п-р-1 щ'
; Ж0 + р-1 • V], (14)
^. = ^1 + х; • (X • X)-1 • X0 ;
где Ж
X,', = (1 х10 х20 ... х^0) - вектор задаваемых экспертом часовых эксплуатационных параметров работы определенного участка.
Графическое изображение доверительного интервала для уравнения регрессии с заданным уровнем надежности приведено на рис. 2.
0
"V
а
"V-
а
wт■
Wт
Рис. 2. Графическое изображение границ доверительного интервала для функции регрессии
Из рисунка видно, что границы доверительного интервала 1р при некотором Щ0 будут
ж = ж*
''Т2 жТ0
а.
Полученный доверительный интервал для функции регрессии является основой для окончательного принятия решения экспертом в условиях оперативного и краткосрочного прогноза ЭП. В зависимости от изменяющихся факторов (напри-
мер, резкое увеличение или снижение грузооборота) варьируются значения прогноза ЭП в пределах найденного коридора, что дает гибкость и надежность оценки планируемого электропотребления в течение суток или на сутки вперед.
Предложенная модель была рассмотрена и апробирована при оценке прогнозирования электропотребления на тягу поездов в зависимости от поездной работы на существующем участке.
В качестве примера реализации данного метода была собрана почасовая статистическая информация по электропотреблению на тягу поездов (Ж), участковой скорости движения (V , км/ч),
количеству поездов, одновременно находящихся на участке (N, шт.), средней массе состава (тср , т) и грузообороту линии (Ё (р х Ь), тыс.
ткм брутто) на участке Петровский Завод - Шилка (НОД1) Забайкальской железной дороги за февраль 2009 года.
В ходе тщательного корреляционного анализа оказалось, что самая тесная связь наблюдается между электропотреблением на тягу поездов и грузооборотом по НОД1: коэффициент корреляции находится в пределах 0,72-0,76. Самый низкий показатель взаимодействия - между электропотреблением и скоростью движения по рассматриваемому участку (0,23-0,33). Достаточно большое влияние на электропотребление оказывает количество поездов, одновременно находящихся на участке. Таким образом, для дальнейших расчетов рассматриваются только два эксплуатационных показателя - грузооборот линии и количество поездов.
На основе вышеприведенной схемы, рассчитаны ошибки прогнозирования ЭП по всем месяцам 2009 года. На рис. 3 представлена гистограмма погрешностей прогноза для февраля. Из рисунка видно, что максимальная отрицательная погрешность за рассматриваемый период равна -3,89 %, а максимальная положительная 3,78 %. Необходимо заметить, что среднемесячная ошибка составляет 0,32 %, что говорит о высокой точности прогнозирования электропотребления на тягу поездов методом интервальной регрессии на основе планов грузооборота по участку.
Следует отметить, что одним из важных критериев краткосрочного и оперативного прогнозирования потребления ЭЭ на тягу поездов данным методом является то, что эксперт вправе сам принимать решение о том, в каком интервале построенного доверительного коридора или вне его он может прорисовывать канву графика электропотребления на предстоящие сутки.
I
3
Рис. 3. Ошибки прогнозирования электрической энергии на тягу поездов за февраль по НОД-1
Это прежде всего зависит от экономической ситуации региона или страны в целом, условий эксплуатации участка железной дороги (незапланированные «окна», резкое снижение грузооборота по сравнению с предстоящими сутками, резкое снижение температуры окружающей среды и др.). Рассматриваемый метод дает гибкость и надежность оценки планируемого значения электропотребления в течение суток или на сутки вперед.
В этом случае ошибка прогноза может быть сведена к минимуму.
Заключение
1. Дано обоснование появления причин несовершенства и неточности применяемых методов прогнозирования электропотребления на тягу поездов.
2. Предложен алгоритм прогнозирования ЭП с учетом экспертного решения.
3. Предложена математическая модель построения прогноза расхода электрической энергии с учетом неопределенности исходных данных.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Митрофанов А.Н. Прогнозирование и управление электропотреблением тяги поездов [Текст]: дис. ... д-ра техн. наук / А.Н. Митрофанов. - Самара, 2006. - 501 с.
2. Раевский Н.В. Интервальное оценивание статистических данных при прогнозировании электропотребления на тягу поездов [Текст] / Н.В. Раевский, Д.А. Яковлев, В.Г. Литвинцев // Вестник по материалам I международной научно-практической конференции «Ресурсосбережение и возобновляемые источники энергии: экономика, экология, опыт применения». Международная академия наук экологии и безопасности жизнедеятельности. Приложение: Т. 13. - 2008. - № 3. - С. 67-69.
3. Кремер Н.Ш. Эконометрика / Н.Ш. Кремер, Б.А. Путко. - М. : ЮНИТИ-ДАНА, 2002. - 311 с.