Научная статья на тему 'Использование вариационного сглаживающего сплайна в задаче краткосрочного прогнозирования'

Использование вариационного сглаживающего сплайна в задаче краткосрочного прогнозирования Текст научной статьи по специальности «Математика»

CC BY
367
99
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Кочегурова Е. А., Шебеко Е. В.

Предложен метод краткосрочного прогнозирования с помощью вариационного сглаживающего сплайна, позволяющий оперировать большим числом настраиваемых параметров. Исследована зависимость погрешности прогнозирования от значения параметров и найдены их оптимальные значения. Проведен сравнительный анализ метода с аппаратом искусственных нейронных сетей в задаче краткосрочного прогнозирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Кочегурова Е. А., Шебеко Е. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Usage of Variation Smoothing Spline in the Problem of Short

The method of short-term forecasting by means of variation smoothing spline permitting to operate a large number of set up parameters has been suggested. The dependence of forecasting inaccuracy on the parameter values is investigated and their optimal values are found. The comparative analysis of the method with apparatus of artificial neural network in the problem of short-term forecasting is performed.

Текст научной работы на тему «Использование вариационного сглаживающего сплайна в задаче краткосрочного прогнозирования»

УДК 681.513.54

ИСПОЛЬЗОВАНИЕ ВАРИАЦИОННОГО СГЛАЖИВАЮЩЕГО СПЛАЙНА В ЗАДАЧЕ КРАТКОСРОЧНОГО ПРОГНОЗИРОВАНИЯ

Е.А. Кочегурова, Е.В. Шебеко

Томский политехнический университет E-mail: aelirenn@mail.ru

Предложен метод краткосрочного прогнозирования с помощью вариационного сглаживающего сплайна, позволяющий оперировать большим числом настраиваемых параметров. Исследована зависимость погрешности прогнозирования от значения параметров и найдены их оптимальные значения. Проведен сравнительный анализ метода с аппаратом искусственных нейронных сетей в задаче краткосрочного прогнозирования.

Постановка задачи

Во многих задачах обработки измерений, таких, как интерпретация физических экспериментов или анализ статистических данных, возникает необходимость исследовать полученную зависимость с целью выявления характерных признаков и построения прогнозирующей кривой. В настоящее время существует немало различных методов прогнозирования, основные из них подробно рассмотрены в

[1]. Среди математических методов прогнозирования выделяют методы: экстраполяции, экспоненциального сглаживания, прогнозирования по огибающей кривой, производственных функций, исследования операций, множественного регрессионного анализа, сетевые методы, а также эконометрические модели. Одним из отличий предложенного в [2] подхода к прогнозированию стало использование аппроксимирующих кусочно-полиномиальных функций, которые заменили регрессионные соотношения при моделировании и анализе процессов, что весьма важно для поиска экстремумов, прогнозирования и других задач обработки информации. Из всех кусочно-полиномиальных функций предпочтение отдается сплайн-функциям. Отличительная особенность сплайнов заключается в том, что они состоят из отрезков степенного полинома малого порядка (степени), которые сопряжены (склеены) в заданных узловых точках процесса (узлах решётчатой функции).

Для формального (трендового, детерминированного) прогнозирования важен тип исследуемого процесса. Например, при одних внешних условий процесс показывает экспоненциальный рост, а при смене их динамика показателя становится линейно-падающей, что обнаруживает существенную не-стационарность. Чтобы собрать статистику поведения показателей и продолжить её в прогнозном построении, требуется сделать отчётный период достаточно долгим. Однако на длинном периоде увеличивается вероятность изменений внешних условий, он неизбежно делится на отдельные «куски», внутри которых поведение процесса может кардинально меняться. Поэтому особую актуальность в моделировании, анализе и прогнозировании приобретает выбор единой (унифицированной, универсальной) системы приближающих функций.

В настоящей работе рассмотрены существующие методы прогнозирования, проведен сравнительный анализ эффективности применения нейронных сетей и вариационного сглаживающего сплайна (ВСС) при решении задачи прогнозирования. Также исследованы возможные режимы прогнозирования в реальном масштабе времени на основе ВСС для различных входных модельных данных и найдены оптимальные значения параметров ВСС.

Расчетная схема и режимы функционирования

вариационного сглаживающего сплайна

Исследования, проведенные в [2], показали хорошую адаптивность сплайнов к моделированию, анализу и прогнозированию различных процессов. Унифицированный аппарат сплайн-функций заменил широкий спектр аппроксимирующих многочленов. Сплайны на интервалах имеют инвариантную внутреннюю структуру, универсальную математическую форму, они самоподобны (как фракталы), поэтому удачно аналитически преобразуются и реализуются, образуя после сопряжения единый аппроксимирующий ансамбль.

Предложенный в данной работе подход предполагает построение ВСС на основе данных, поступающих в реальном масштабе времени и последующее вычисление прогнозируемых значений. В работе использовалась рекуррентная процедура построения ВСС для обработки текущих измерений, изложенная в [3]. Экстремальный функционал А.Н. Тихонова /($) для предлагаемого сплайна имеет вид [4]:

И

IV) = (1 -р)(Ш )2 {[Я ’’(/)]2 Л + Ррт^ (/)) - у(/))]2,

4 )=0

где р - весовой множитель, устанавливающий компромисс между сглаживающими и интерполяционными свойствами сплайна £(/), ре [0,1]; Д/ -

V -

интервал дискретизации измерений; И = И ° -

число измерений внутри /-го звена сплайна, в дальнейшем И=сош1;, для любого /; //, 4“ - начало и конец /-го звена соответственно; уф^/^+Щ) - измерения, представляющие собой смесь полезного

низкочастотного сигнала /(/) и широкополосной помехи £(/). В задаче прогноза возможны исследования и в условиях отсутствия помехи. Вариационный подход и дал название сплайну.

Значение сплайна в любой внутренней точке т для /-го звена определяется

S¡ (т) = а0 + а‘1т + а'2т2 + а‘3т3,

0 < т < И -1.

Разрывные коэффициенты сплайна находятся из условия минимума целевого функционала в зависимости от дефекта сплайна й, то есть числа разрывных производных. Для дефекта й=2 разрывными являются коэффициенты а2/ и а3/, для дефекта й=1 соответственно только а3'. Непрерывные коэффициенты находятся из условия сопряжения звеньев сплайна. Расчетные формулы для всех коэффициентов приведены в [3].

Другим параметром ВСС является момент сопряжения звеньев сплайна д. Возможно несколько режимов использования ВСС в зависимости от соотношения параметров д и т. В данной работе используется только текущий режим функционирования ВСС, при котором вычисление ВСС осуществляется при поступлении каждого измерения с использованием (И-1) предыдущих измерений, сопряжение при этом осуществляется в момент времени /д-11=/д“, где д - номер дискретного отсчета ) /-го звена, в котором осуществляется сопряжение непрерывных производных сплайна. Схематично такой режим изображен на рис. 1.

ясно, что число измерений звена сплайна И - один из главных параметров настройки ВСС. Пусть необходимо спрогнозировать процесс вперед на г шагов квантования при известных И—г измерениях. Однако, алгоритм вычисления коэффициентов ВСС требует, чтобы все измерения в звене были известны. Для решения возникшей задачи сократим интервал вычисления до И—г, используя главную особенность ВСС - возможность сопряжения звеньев сплайна в любой внутренней точке. При этом интервал построения сплайна остается прежним. Таким образом, при построении прогнозируемой кривой ВСС строится на всем интервале ИД а коэффициенты вычисляются только для интервала (И-г).Д/. Данный способ вычисления схематично изображен на рис. 2.

Рис. 2. Построение кривой прогноза: Д значения

прогнозируемые

Рис. 1. Текущий режим ВСС: * - измерения, • - вычисленные значения, □ - момент д сопряжения звеньев ВСС

Запаздывание результата в при обработке информации для момента времени т (Рт) складывается из двух слагаемых: собственного времени вычисления оценок коэффициентов и значений ВСС в0 и времени запаздывания вычисления по отношению к текущему времени, т. е. в=в0+(И-т)Д/.

Для получения прогнозных значений использование ВСС имеет ряд особенностей. Интуитивно

Влияние параметров вариационного сглаживающего сплайна на качество прогноза

Используемый для прогнозирования ВСС имеет несколько параметров настройки, существенно определяющих его свойства. Этими параметрами являются: сглаживающий множитель р, число измерений звена сплайна И, число прогнозируемых точек г. Определим некоторый набор оптимальных значений указанных параметров и полученное при этом качество прогноза.

В работе для исследования параметров ВСС были выбраны две модельные функции:

3 (1)

= 8 + 8,4 • I - 0,2 • 12 +1,33-10-3 • /3,

£ = 10 • БШ

2лt

100

(2)

Для оценки качества прогнозирующих свойств сплайна использована приведенная среднеквадратическая погрешность, выраженная в процентах стпр, %. Данная погрешность определяет меру близости между модельными функциями (1) или (2) и результатом прогноза.

В работе проведен анализ влияния параметров ВСС на погрешность прогнозирования. Изменения значения ошибки прогнозирования при различных р показаны на рис. 3 для функции (1).

Вообще говоря, выбор параметров ВСС основывается на требуемом соотношении качество прогноза/длительность прогноза. Увеличивая число точек прогноза, мы тем самым снижаем его качество. Однако, предложенный нами способ позволяет получить высокое качество прогноза при достаточно широком выборе количества прогнозируемых значений. Пример зависимости погрешности от длительности прогноза при Н=10 и р=0,9 для функции (1) показан на рис. 5.

Рис. 3. Влияние параметра р на ошибку

Прогноз при этом составляет три точки (г=3) при Н=10. Как видно, качество прогноза повышается с увеличением р, т. е. при переходе ВСС в интерполяционный сплайн. Минимальное значение ошибки при этом достигает 0,48 %. Для функции (2) кривая зависимости имеет тот же вид, но значения ошибки выше 1,19...11,25 %. Таким образом, для периодической входной зависимости погрешность увеличивается примерно в два раза.

Интересная закономерность наблюдается при изменении интервала Н при постоянном числе точек прогнозирования. Оптимальное значение данного параметра всегда составляет удвоенное количество точек прогноза, т. е. непосредственно зависит от параметра г. Данное свойство можно наблюдать на рис. 4 при г=3.

1 2 3 4 5 6

Рис. 5. Влияние параметра г на ошибку

Как видно, при прогнозировании первых трех точек погрешность держится примерно на одном уровне и составляет всего около 0,35 %. Для периодической функции - около 0,7 %.

При проведении данного исследования также было выявлено, что при г, меньшем или равном половине интервала Н, оптимальное значение сглаживающего множителя составляют 0,6...0,8, т. е. уже оказывают существенное влияние сглаживающие свойства ВСС.

Видно, что функция зависимости имеет один экстремум при Н=2г. При ре[0,6;0,8] ошибка несколько снижается при увеличении Н, однако экстремум остается. Результаты аналогичны для обеих функций, при этом погрешность для функции

(2) также выше в два раза по сравнению с функцией (1). Для других соотношений Н и г данная закономерность сохраняется. Возможно, это следует из теоремы Котельникова, так как анализируемые данные дискретизированы. Однако в других задачах анализа информации (фильтрация, сглаживание) с использованием ВВС подобных эффектов не наблюдалось [3].

Рис. 6. Построение прогнозируемой кривой: — — — - входная функция; - прогнозируемые значения

Добавим к задаче прогнозирования задачу сглаживания входного сигнала (как известно, ВСС решает ее весьма эффективно), в том числе и в реальном масштабе времени. Для этого внесем в исходные данные помеху, составляющей 10 % от максимального значения функции. С увеличением длительности прогноза погрешность прогнозирования увеличивается: при изменении г от 1 до 6 ошибка изменяется от 1,8 % до 4 % при оптимально подобранных параметрах. Таким образом, при прогнозировании трех точек ошибка составляет всего 2,2 %, что является неплохим результатом, учитывая, что входной сигнал искажен помехой. Полученные значения указаны

2

I

для функции (1). Для функции (2) значение погрешности прогнозирования в среднем в два раза больше при аналогичных значениях параметров.

Для наглядного представления построения прогнозируемой кривой приведем часть экспериментальных данных (рис. 6).

На данном рисунке представлен фрагмент функции (1), не искаженной помехой, и прогнозируемые значения на каждом интервале, й=10, z=3.

Анализ эффективности нейронных сетей

и ВСС при решении задачи прогнозирования

Сопоставим эффективность ВСС и искусственных нейронных сетей в задаче краткосрочного прогнозирования. Построение нейронных сетей проводилось в программе-эмуляторе Neural Network Wizard (NNW). В программе реализована многослойная нейронная сеть, обучаемая по алгоритму обратного распространения ошибки. На базе NNW были разработаны некоторые системы прогнозирования.

При работе с нейронной сетью самым важным этапом является сбор статистики по процессу и обработка входных данных. Обычно стараются собрать как можно больше данных, в какой-то мере влияющих на исследуемый процесс, а затем, в случае необходимости, отсеять ненужные. Однако в случае краткосрочного прогноза набор входных данных невелик, чаще всего это несколько временных значений.

Пусть необходимо спрогнозировать зависимость, подобную функции (1). На вход сети мы можем подать только текущий момент времени, характеристики процесса и условия его протекания нам неизвестны. Создадим выборку из первых ста значений функции, в качестве обучающей выборки используем 50 % данных из нее, остальные данные будут тестовыми. На выходе необходимо получить значение функции в некоторый момент времени. Эксперимент показал, что сеть может найти значение функции с точность до 0,5 % в 98 % случаев. Однако сеть работает только в границах обучающей выборки, «в будущее» она смотреть не способна. Это является существенным ограничением нейронной сети, несмотря на то, что с задачей интерполяции она справилась хорошо, восстановив 50 % промежуточных значений функции.

СПИСОК ЛИТЕРАТУРЫ

1. Глущенко В. В. Прогнозирование. - М.: Вузовская книга, 2000. - 205 с.

2. Тимошенко П.Н., Яковенко В.С. Экономические циклы - новые подходы к обнаружению, анализу, прогнозированию. -Ставрополь: Изд-во СГаУ, 2003. - 152 с.

3. Агеев Ю.М., Кочегурова Е.А. Частотные свойства рекуррентных сглаживающих сплайнов // Известия вузов. Приборостроение. - 1990. - № 3. - С. 3-8.

4. Гребенников А.И. Метод сплайнов и решение некорректных задач теории приближений. - Изд-во МГУ, 1983. - 206 с.

5. Кочегурова Е.А., Шебеко Е.В. Выбор параметров вариацион-

Если же провести подобный эксперимент над синусоидальной функцией (2), то в качестве обучающей выборки необходимо задать более половины имеющихся значений, иначе сеть не обнаружит пики синусоиды.

Вообще, как показал эксперимент, чтобы нейронная сеть прогнозировала будущее, ей необходимо большое количество информации, как в процессе обучения, так и в процессе работы, т. е. она применима для долгосрочного прогнозирования, когда имеется достаточная статистика по процессу. Например, если мы узнаем период синусоиды и подадим его на вход сети, она сможет и в будущем распознать данную функцию.

Таким образом, главное отличие ВСС и нейронной сети заключается в представлении входных данных. ВСС требует только последовательные набор измеренных значений сигнала, и по ним, в силу гладкости входной функции, может построить участок функции «в будущем». При этом ВСС не сможет обнаружить периодичность функции, что также доказал наш эксперимент: в случае синусоиды результаты прогнозирования оказались существенно хуже.

Нейронная сеть требует характеристики процесса, зависящие от периода, а не конкретного значения времени. Она хорошо применима для периодических процессов, если входные данные содержат информацию о периодичности. Только в этом случае, нейронная сеть распознает синусоиду (2).

В заключение отметим, что области эффективного применения ВСС и искусственных нейронных сетей существенно различны. Нейронные сети предъявляют высокие требования к входным данным, необходимы большие затраты времени и ресурсов на их обучение. При этом нейронная сеть будет работать только в пределах обучающей выборки, т. е. будет применима лишь для того процесса, на котором была обучена. Использование ВСС для прогнозирования универсально, поэтому данный метод может быть применен в любой области, для любого процесса при минимальном наборе входных данных и без предварительных затрат времени. Однако в силу своей природы, ВСС более эффективен для прогнозирования нестационарных процессов, чем периодических функций.

ного сглаживающего сплайна // Научная сессия трудов ТУ-СУР-2006: Матер. докл. Всеросс. научно-техн. конф. студентов, аспирантов, и молодых ученых. - Томск: Изд-во «В-Спектр», 2006. - Ч. 4. - С. 220-223.

6. Воскобойников Ю.Е., Колкер А.Б. Аппроксимация изолиний изображений сглаживающими сплайнами // Автометрия. -2003. - Т. 39. - № 4. - С. 3-12.

7. Brumback B.A., Rice J. Smoothing spline models for the analysis of nested and crossed samples of curves // Journal ofthe American Statistical Association. - 1998. - V. 93. - P. 961-976.

8. Ramsay TO. Spline smoothing over difficult regions // Journal ofthe Royal Statistical Society. Series B. - 2002. - V. 64. - P. 307-319.

i Надоели баннеры? Вы всегда можете отключить рекламу.