Прогнозирование процессов и сигналов на основе определения их оптимальных базовых параметров

Кирьянов Кирилл Геннадьевич; Кузнецов Егор Сергеевич

Статистическая радиофизика Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, № 5 (3), с. 196-200

УДК 004.942

ПРОГНОЗИРОВАНИЕ ПРОЦЕССОВ И СИГНАЛОВ НА ОСНОВЕ ОПРЕДЕЛЕНИЯ ИХ ОПТИМАЛЬНЫХ БАЗОВЫХ ПАРАМЕТРОВ

1 Нижегородский госуниверситет им. Н.И. Лобачевского 2 Нижегородский государственный технический университет им. Р.Е. Алексеева

kkg83@sandy.ru

Поступила в редакцию 25.05.2011

Рассмотрены особенности нового метода и алгоритмов прогнозирования, основанных на определении оптимальных базовых параметров (ОБП) процессов и сигналов, особым образом дискретизованных по уровню и времени во временные ряды. Показано, что информационные системы прогнозирования (ИСП), разработанные на основе этого метода, позволяют эффективно прогнозировать процессы и сигналы различных классов.

Ключевые слова: модель исходных данных, оптимальная дискретизация данных, оптимальные базовые параметры данных, прогнозирующие операторы, прогнозирование.

2

Введение

Развитие прогностики как науки в последние десятилетия привело к созданию множества методов, процедур, приемов прогнозирования (см., например, работы [1-3]). По оценкам зарубежных и отечественных систематиков прогностики насчитывается свыше ста методов прогнозирования, в связи с чем перед радиофизиками, как и перед другими специалистами, возникает задача выбора методов, которые давали бы адекватные прогнозы для изучаемых систем и связанных с ними процессов. При этом в многочисленных публикациях по методам прогнозирования наблюдается далеко не всегда единая терминология, например, рекомендуемая в словаре [4] по терминологии прогностики под редакцией акад. В.И. Сифорова, что затрудняет сравнение возможностей существующих методов. Опыт показывает, что собственную оценку сложности реализации конкретного метода (не входя в многочисленные неясно как влияющие на эффективность прогноза детали) можно выполнить, если иметь (для написания программы прогнозирования и практической реализации) чёткое математическое описание (математическую модель - ММ) конкретного метода, например, на языке прогнозирующего оператора (ПО), преобразователя (Т), отображения Д) : «Дмножества исходных данных и используемых параметров) ——^ (прогнозируемые выборки)».

Замечания по выбору традиционных методов прогнозирования

Как показано, методы прогнозирования удобнее сравнивать по особенностям их ПО:

/ (&};{р}) -—Му*}. (1)

Здесь {у}, /е[1М] - исходный прогнозируемый ряд данных длины М, {р^},

ру- е[р15р2,■ ■,рт]- подбираемые параметры

или оптимизируемые по выбранному критерию оптимальности, {у/}, з/е [1, 2,..., Ь] - прогнозируемые выборки ряда, / - прогнозирующий оператор, характеризующий каждую из известных групп методов.

В группу методов прогнозной экстраполяции включают методы наименьших квадратов, экспоненциального сглаживания, вероятностного моделирования и адаптивного сглаживания. К группе системно-структурных методов относят методы функционально-иерархического моделирования, морфологического анализа, сетевого моделирования, структурной аналогии. Ассоциативные методы можно разделить на методы имитационного моделирования и историкологического анализа. В группу методов опережающей информации включают методы анализа потоков публикаций, оценки значимости изобретений и анализа патентной информации. Методы этих групп однозначно привести к ПО в форме (1) затруднительно.

В практических исследованиях в качестве модели ПО, в основном, используют следую-

щие функции /: линейную (ARMA, ARIMA),

квадратичную, степенную, показательную, экспоненциальную (экспоненциального сглаживания), логистическую. При этом не все процессы удаётся прогнозировать такими моделями, хотя в ряде случаев их можно заменять линейной комбинацией гармонических или иных функций. Например, в методе группового учета аргументов (МГУА) Ивахненко А.Г. [2] достижима более точная, но трудоёмкая оптимизация ПО в виде полинома Колмогорова-Габора:

П П П

/ = Ро + Е РгУг + ЕЕ РцУіУ] +

г =1 і =1 і=г

П П П

+ХЕЕ РікУг У]Ук+■■■, п=т

і=1 і=ік = і

Анализ группы ПО, выполняемых в виде многослойных нейронных сетей и алгоритмов их обучения, позволил выявить их главный недостаток [3] - неопределенность в выборе числа слоев и количества нейронных элементов в слое. Поэтому чаще используются такие модели ПО, сложность идентификации параметров которых не сильно зависит от вида их нелинейностей.

Одной из главных задач в моделях прогнозирования является нахождение порядка п ПО, который зависит преимущественно от числа её коэффициентов р^ є[я1 ,а2,...,ап] и определяет

точность прогноза.

Заметим, что на практике чаще требуется прогнозировать непрерывные (аналоговые) процессы конечной длительности T. Во многих таких случаях при дальнейших расчётах не меняется частота дискретизации исходного сигнала /), которая редко выбирается в соответствии с теоремой В.А. Котельникова. Чаще она выбирается из соображений практики кратной секунде, минуте, часу и т.д., что свидетельствует

о возможной потере необходимой информации в исходных данных уже на стадии дискретизации сигнала. Выбор / по Котельникову осложняется еще и тем, что не всегда просто указать верхнюю частоту /Д. В нашем случае, как увидим далее, при поиске ОБП, модель ПО настраивается на оптимальную / =1/Д?, учитывающую минимум потерь исходной информации.

Метод прогнозирования на основе ОБП

В рассмотренных выше методах определение порядка модели и подбор значений других параметров прогнозирующего оператора, влияющих на точность прогнозирования модели,

осуществляется независимыми между собой способами (только для п или только для ДО.

Поэтому нами выбрана такая модель ПО, при которой её параметры были бы согласованы (!) между собой и находились (идентифицировались) по единому критерию оптимизации БП [5-7].

Модель основана на предварительной дискретизации исходных векторных процессов продолжительности Т одновременно по времени, с периодом ДХ=Т/Ы и по значению в q-уровневые временные ряды исходной длины М:

К}-к е[0,М-1],у е[1,г], (3)

где г — количество компонент векторного процесса.

Определение значений ОБП заключается в нахождении такой тройки или пары БП { чг, порг} (если есть доверие к дискретизации исходных данных и Морг = М), при которой

энтропия (4) по БП временного ряда {у1} будет минимальна:

Е =

у;тгп

тт 1об2 ЩМ4,п:У1фм ]) =1 и

г т г т » г \ г ~ Ь2^ у;тп

Ч е [Чтгп - Чтах]> п е [птп - Птах]>М = М

= Пу;орг • 10ё2Чу,орО (4)

где

N = аПу;ор‘ (5)

у1;тт Чу;орг-

ПО на основе ОБП Морг, чорг, порг представим в виде:

({угг } {Мор{, Чорг, пор} } . (6)

Если изначально дан дискретный процесс с фиксированным шагом At, то для прогнозирования определяются только q0pt и порг. Если же изначально имеется выборка из непрерывного процесса с неоптимальным и требующим уточнения шагом At, то по имеющимся М отсчетам сигнал методом сплайнов восстанавливается в «непрерывный». Затем образуются новые наборы выборок процессов с разными шагами дискретизации в интервале Т/Мтах<А^Т/Мшп.

Тот набор из упомянутых наборов БП будет иметь число компонент Мор= Т /Д1орЬ на котором параметры q, п дают среди всех наборов выборок процессов наименьшее значение критерия (4). Так определяется вся оптимальная

тР°йка М.ор^ qopt, порЬ.

Таблица 1

а)y={yLy1,...y} r=1,M=1001; lomz-y1.txt

б)y={y ,y ,...,yr} r =3 lomz-y1.txt lomz-y2.txt lomz-y3.txt_____________________________________

Исходные данные /источник/

Дата 07.05.2011 20:22:00; программа Forecast 2011-02-08

нач. установки: Н1 из [Н0,Н1]; М=1001; п из [1,30] q из [300,1100]; индивидуальная кван-товка из [индивидуальная, общая];

1 .Динамических параметров и характеристик исходных данных

1.Формулы и

результаты

предоброботки

ИСХОДНЫХ

данных (шаги

алгоритма)

а) ОБПу: пу=З из [1,30]; qyr=1026 из

[300,1100]; E=rnlog(qy)=30.0084450; rlog(qy)=10.0028150

б) ОБПу: ny=1 из [1,30]; q^Um

[300,1100];

E= rnlog(qy)=8.2807708; rlog(qy)=8.2807708

2. Прогнозирования внутри и вне интервала наблюдения

2. Результаты вычисления целевых характеристик

а)

it ин гервала ооучєни»

б

За. Точность прогнозирования: 8 (s)=(y(s)-y'(s))/(y'max-y'min)

s 1 3 5 7 9 11 13 15

8(s) 0 0.01 0.03 0.06 0.076 0.07 0.02 -0.04

3б. Точность прогнозироЪШШ.:8(з)=(у(з)-у'(з)У(у'тах-у'тт)

s 1 3 5 7 9 11 13 15

8(s) -0.01 -0.013 -0.013 -0.013 -0.006 0 0.006 0.006

Построение прогнозирующего оператора при к<М

Предлагаемый метод прогнозирования, используя только динамические параметры исходных данных, позволяет построить по ряду (3) ПО для любого к = п, п+1, ... , М-1 в виде q-значной логической функции с оптимальными БП - М, q, п

(у k+1,■■■,y k+l) = f((y k-n+1,■■■,y ^п+\) ,

/1 г \Т /1 г \Т \ г

(yk-n+2,■■■,y k-п+2 ) , ...,(yk ,■■■,y k ) ) = Jk

или эквивалентной таблицы истинности (ТИ) [6].

Строки ТИ ПО строятся по всем идущим подряд п членам ряда отсчетов и следующего за ними отсчета в качестве прогнозируемого ими значения. Величина п является порядком математической модели ПО данных (3).

Порядок прогнозирующего оператора может определяться как минимальное п, при котором

по одной и той же п последовательности отсчетов прогнозируются одинаковые значения.

Когда числа п и q — оптимальные БП, то ТИ оказывается непротиворечивой и ПО может допускать минимизацию в базисах функций q-значной алгебры логики.

Модификация прогнозирующего оператора.

Прогнозирование при к>М

Для прогнозирования неизвестных выборок вне заданного ряда (3) при к>М требуется модификации алгоритма (7).

Прогнозирование при к>М заключается в пошаговом построении продолжения ТИ с М--п+1-й по M+sf-ю строку, где sf=1,..., Ь, а Ь -номер максимального шага прогнозирования или так называемого «прогнозного горизонта» для пополнения выборок данных (7), имеющихся в исходной ТИ.

Таблица 2

у={уГу2,..,уг} г=1; М=302; 1. Ring302.txt

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Исходные данные

Дата 07.05.2011 20:22:00; программа F orecast 2011 -02-08

нач. установки: Н1 из [Н0,Н1]; М=302; п из [1,30]; q из [2,100]; индивидуальная квантовка из [индивидуальная, общая]

1 .Формулы и результаты предоброботки ИСХОДНЫХ данных (шаги алгоритма)

1 .Динамических параметров и характеристик исходных данных

ОБПУ: пу=4 из [1,30]; q/=25 из [2,100]; E=mlog(qy)= 18.5754248; ^^у)= = 4.6438562

2. Прогнозирования внутри и вне интервала наблюдения

2. Результаты вычисления целевых характеристик

3. Точность прогнозирования 8(^)=(у(д)-у '(д)У( Утах-Утіп)

5 1 2 3 4 5 6 7 8

ад 0 -0.04 -0.04 0.04 -0.25 0.04 -0.4 -0.04

Для определения ум+.у используется последовательное сравнение М-п+./-й ^последовательности со всеми п-последовательностями, уже имеющимися в исходной таблице, рассматриваемыми как опорные («эталонные») по критерию «минимума расстояния» между ними [7].

Возможна модификация формулы (7) с учетом классов эквивалентности, каждому из которых соответствует одинаковое прогнозируемое значение уУк исходного ряда [8].

При определении числа возможных продолжений q-уровневого ряда на заданную длину при условии неизменности ОБП было найдено соотношение для теоретической ошибки прогноза и для предельного прогнозного горизонта [9].

Отличительные особенности предложенного метода

1. Предложен и проверен экспериментально на информационной системе прогнозирования метод на основе предварительной оптимальной дискретизации («оптимального загрубления») исходных данных во временные ряды.

2. ОБП (M,q,n) находятся одновременно по единому энтропийному критерию, а не по различным известным ранее критериям оптимальности каждого из параметров, например,

Н. Акаіке (только для п) и В.А. Котельникова (только для ДО.

3. Прогнозирующий оператор един как для скалярных, так и для векторных процессов.

4. Метод позволяет уточнить частоту дискретизации исходных данных, если она была выбрана не оптимально.

5 Прогнозирующий оператор определяется в общем случае в виде нелинейной q-значной логической функции для любого прогнозируемого процесса.

6. Большая точность прогнозирования с ИСП достигается на искусственных временных рядах, полученных моделированием на ЭВМ и имеющих более высокую точность выборок по сравнению с природными.

Результаты экспериментов

В качестве экспериментальных данных были выбраны выборки популярных и часто цитиру-

емых процессов. При этом оценка точности прогноза проводилась по формуле

b(s)=(y(s)-y'(s))/(y'max-ymm), (8)

где у' - исходный (реальный) процесс, s - шаг прогноза. Сравнивались исходный процесс (y'(s), se[M-Z,M-1]) и спрогнозированный процесс (y(s), s^[M-L,M-1]) на основе исходного процесса с отброшенным концом (y'(s),se [0,M-

-L-1]).

Результаты экспериментов, полученные с помощью программы Forecast, представляются в виде таблиц. В табл. 1 представлен прогноз и результаты предобработки компонент аттрактора Лоренца. Слева (а) - прогноз и результаты предобработки одной первой компоненты состояния аттрактора, справа (б) - прогноз одной первой компоненты состояния аттрактора на основе результатов предобработки и учёта оптимальных БП всех трёх компонент состояния.

В табл. 2 представлен прогноз и результаты предобработки годового прироста ширины колец деревьев за 302 года.

Выводы

1. Предложен и опробован новый метод прогнозирования, основанный на оптимальной дискретизации данных и определении оптимальных базовых параметров процесса.

2. Исследования, проведенные с помощью разработанной информационной системы прогнозирования, показали сопоставимую с известными популярными методами прогнозирования точность использования метода при прогнозировании процессов различных классов (природных, модельных и др.).

Список литературы

1. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. М.: Мир, 1974.

2. Ивахненко А.Г. Индуктивный метод самоорганизации моделей сложных систем. Киев: Наукова думка, 1981.

3. Калан Р. Основные концепции нейронных сетей. М.: Вильямс, 2001. 288 с.

4. Прогностика. Технология. / Под ред. В.И. Си-форова. М.: Наука, 1990. 56 с.

5. Кирьянов К.Г. // Труды 3-й Междунар. конф. ИПУ РАН. М., 2004. С. 187-208.

6. Кирьянов К.Г. // Вестник Нижегородского университета им. Н.И. Лобачевского. 2010. Вып. 3(1). С. 68-78.

7. Кирьянов К.Г., Кузнецов Е.С. // Труды 14-й Научной конференции по радиофизике. ННГУ. Н. Новгород, 2010. С. 278-279.

8. Кирьянов К.Г., Кузнецов Е.С. // Труды 12-й Научной конференции по радиофизике. ННГУ. Н. Новгород, 2008. С. 271-273.

9. Кирьянов К.Г., Кузнецов Е.С. // Труды 13-й Научной конференции по радиофизике. ННГУ. Н. Новгород, 2009. С. 214-216.

FORECASTING PROCESSES AND SIGNALS ON THE BASIS OF DEFINITION OF THEIR OPTIMAL BASIC PARAMETERS | K. G. Kiryanov [ E.S. Kuznetsov

Features of a new forecasting method and the algorithms based on the definition of optimal basic parameters of processes and signals (optimally sampled by level and time in time series) are considered. It is shown that forecasting information systems developed on the basis of this method can effectively predict processes and signals of various classes.

Keywords: initial data model, optimum data sampling, optimum data base parameters, predictive operators, forecasting.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кирьянов Кирилл Геннадьевич, Кузнецов Егор Сергеевич

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кирьянов Кирилл Геннадьевич, Кузнецов Егор Сергеевич

FORECASTING PROCESSES AND SIGNALS ON THE BASIS OF DEFINITION OF THEIR OPTIMAL BASIC PARAMETERS

Текст научной работы на тему «Прогнозирование процессов и сигналов на основе определения их оптимальных базовых параметров»