Научная статья на тему 'Особенности прогнозирования экономических процессов на основе определения их оптимальных базовых параметров'

Особенности прогнозирования экономических процессов на основе определения их оптимальных базовых параметров Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY-NC-ND
242
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ ИСХОДНЫХ ДАННЫХ / ОПТИМАЛЬНАЯ ДИСКРЕТИЗАЦИЯ ДАННЫХ / ОПТИМАЛЬНЫЕ БАЗОВЫЕ ПАРАМЕТРЫ ДАННЫХ / ПРОГНОЗИРУЮЩИЕ ОПЕРАТОРЫ / ПРОГНОЗИРОВАНИЕ ПРОГНОЗИРУЕМОСТЬ / MODEL OF THE INITIAL DATA / OPTIMUM DIGITIZATION OF THE DATA / OPTIMUM DATA BASE PARAMETERS / PREDICTING OPERATORS / FORECAST

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузнецов Е. С.

Рассмотрены особенности нового метода и алгоритмов прогнозирования, основанных на определении оптимальных базовых параметров процессов, оптимально дискретизированных по уровню и времени во временные ряды. Показано, что информационные системы прогнозирования, разработанные на основе этого метода, позволяют эффективно прогнозировать экономические процессы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING OF ECONOMIC PROCESSES ON THE DEFINITION BASIS OF THEIR OPTIMUM BASE PARAMETERS

Features of a new method and the algorithms of forecasting based on definition of optimum base parameters of processes and signals are considered, is optimum digitization on level and time in time numbers. It is shown that information systems of forecasting, developed on the basis of this method, allow predicting effectively economic processes.

Текст научной работы на тему «Особенности прогнозирования экономических процессов на основе определения их оптимальных базовых параметров»

ОСОБЕННОСТИ ПРОГНОЗИРОВАНИЯ ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ НА ОСНОВЕ ОПРЕДЕЛЕНИЯ ИХ ОПТИМАЛЬНЫХ БАЗОВЫХ ПАРАМЕТРОВ

Е.С. Кузнецов,

аспирант кафедры компьютерных технологий в проектировании и производстве Нижегородского государственного технического университета им. Р.Е. Алексеева

E-mail: [email protected]

Адрес: г. Нижний Новгород, ул. Минина, д. 24

'

I Рассмотрены особенности нового метода и алгоритмов прогнозирования, основанных на определении оптимальных базовьх параметров процессов, оптимально дискретизированных по уровню и времени во временные ряды. Показано, что информационные системы прогнозирования, разработанные на основе этого метода, позволяют эффективно прогнозировать экономические процессы.

Ключевые слова: модель исходных данных, оптимальная дискретизация данных, оптимальные базовые параметры данных, прогнозирующие операторы, прогнозирование прогнозируемость.

1. Введение

Развитие прогностики как науки в последние десятилетия привело к созданию множества методов, процедур, приемов прогнозирования. По оценкам зарубежных и отечественных систематиков прогностики [1] насчитывается свыше ста методов прогнозирования. В связи с этим перед экономистами и специалистами других специальностей возникает задача выбора метода, который

давал бы адекватные прогнозы для изучаемых систем и связанных с ними процессов.

Опыт показывает, что собственную оценку сложности реализации конкретного метода можно выполнить, если иметь чёткое математическое описание — математическую модель (ММ) конкретного метода, выраженную, например, в лингвистической форме в виде прогнозирующего оператора (ПО):

/({У,};{Р1}) ^ {у*г } , (!)

где {у },і є[1,М] —исходный ряд данных длины М; {р1}, р1 є [р1, р2,..., рп ] — подбираемые параметры или оптимизируемые по выбранному критерию оптимальности; {уз/}, / є[1,2,...,Х] — прогнозируемые выборки ряда; / — прогнозирующий оператор, характеризующий каждый из известных методов.

В практических исследованиях в качестве модели ПО, в основном, используются следующие функции / линейная (АЯМА, АЫМА) [2], квадратичная, степенная, показательная, экспоненциальная (экспоненциального сглаживания), логистическая. При этом не все процессы удаётся прогнозировать такими моделями, хотя в ряде случаев их удаётся заменять линейной комбинацией гармонических или иных функций.

В последнее время набирают популярность методы прогнозирования, ориентированные на обучение по прецедентам (относящиеся к разделу машинного обучения) или индуктивное обучение, основанные на выявлении общих закономерностей по частным эмпирическим данным. В этом случае, если линейная модель регрессии представляется необоснованной и предложить адекватную нелинейную модель /({у};{р]}) ^ {уз/ } также не удаётся, в качестве компромисса строится модель вида:

П{у,У,{р,\) = (2)

і=і

где Ч>. — некоторые преобразования исходных признаков, в общем случае нелинейные. Задача состоит в том, чтобы подобрать неизвестные одномерные преобразования <р , при которых достигается минимум квадратичного функционала ошибок [3]. Поэтому чаще используются такие модели ПО, сложность идентификации параметров которых не сильно зависит от вида их нелинейностей.

Одной из главных задач в моделях прогнозирования является нахождение порядка п ПО, который определяется преимущественно числом её параметров [2]{р]},є[р1;р2,...,рп] и определяет точность прогноза.

Заметим, что на практике иногда требуется прогнозировать непрерывные (аналоговые) процессы конечной длительности Т. Во многих таких случаях частота дискретизации исходного сигнала при дальнейших расчётах не меняется, что не соответствует строго теореме В.А. Котельникова [4-5]. Чаще она выбирается из соображений практики кратной секунде, минуте, часу и т.д., что свидетельствует о возможной потере необходимой

информации в исходных данных уже на стадии дискретизации сигнала. Выбор по Котельникову осложняется еще и тем, что не всегда просто указать верхнюю частоту . В нашем случае, как увидим далее, модель ПО настраивается на оптимальную / = 1/Д?, учитывающую минимум потерь исходной информации.

2. Метод прогнозирования на основе оптимальных базовых параметров

В известных наиболее популярных методах определение (подбор) порядка модели и значений других параметров ПО, влияющих на точность прогнозирования модели, осуществляется независимыми между собой способами (только для п или только для Л?).

Поэтому нами выбрана такая модель ПО, при которой её параметры были бы согласованы между собой и находились (идентифицировались) по единому критерию специально введенных оптимальных базовых параметров (ОБП) [6-8].

Модель основана на предварительной дискретизации исходных векторных процессов продолжительности Т одновременно по времени, с периодом Д? = Т/М, и по значению в д-уровневые временные ряды исходной длины М

11 1 11 11 У о Уп-1 Уі-п+і--Уі Ук-п+1 >—>Ук Ум-1

Уй>"->Уп-\>ш">Уі-п+\>-">Уі >>---’Ук п+1’-'->Ук>-“’УМ-\

,(3)

имеющие ограничения по диапазону изменения параметров ММ — у. и продолжительности:

< у1т ^ у, (к) ^ у1ж ,к е [0 М -1], V е [1,г ], (4)

где г-количество компонент векторного процесса.

Определение значений ОБП заключается в нахождении такой «тройки» {Д^(, Яор,, пор1} или «пары» БП {дор1, пор1} (если есть доверие к дискретизации исходных данных и Д?ор? = Д?), при которой энтропия (3) по БП временного ряда {ук} будет минимальна:

Еу;тш= тт (/о# 2Ы(А^д,п;у1 ))=

= 1о&1\п,т = Пу;оР, ■ ^2ду;о0 , (5)

где Ч є[Чшіп,Чшох ],п є[пшіп,пшах Фътп^УУр (6)

При этом ПО на основе локализованных ОБП {КР,> Чар, > ПоР, } представим в виде:

/({уі} {Аі0р,, Чр ,пор1})---------------->{у/ }

(7)

Если изначально дан дискретный процесс с фиксированным шагом Д?, то для прогнозирования определяются только д ор1 и пор1. Если же изначально имеется выборка из непрерывного процесса с неоптимальным и требующим уточнения шагом Д?, то по имеющимся М отсчетам сигнал методом сплайнов восстанавливается в «непрерывный». Затем образуются новые наборы выборок процессов с разными шагами дискретизации в интервале

Т/М <Д?< Т/М .,

' тах ' тт’

где Т — длительность исходного процесса.

Тот набор из упомянутых наборов БП будет иметь число компонент Мор1 = Т/ Ыор1 , на котором параметры д, п дают среди всех наборов выборок процессов наименьшее значение энтропии (3). Так определяется вся тройка ОБП {Мор1, др, пр } .

3. Построение прогнозирующего оператора при к < М

Предлагаемый метод прогнозирования, используя только динамические параметры исходных данных, позволяет построить по ряду (2) ПО для любого к = п, п+1, ..., М— 1 в виде д-значной логической функции с ОБП — д, п}.

(Ли,-, УГш)Т=

(8)

Шк-п+и-Ук-п+дТ> (У\-п+2>->У\-п+2)Т>-ХУ[>->УГк Л

или эквивалентной таблице истинности (ТИ) [8].

Строки ТИ ПО строятся по всем идущим подряд п членам ряда отсчетов и следующего за ними отсчета, в качестве прогнозируемого ими значения. Величина п, является порядком математической модели ПО данных (2).

Порядок прогнозирующего оператора может определяться как минимальное п, при котором по одной и той же п-последовательности отсчетов прогнозируются одинаковые значения.

Когда числа п и д определяют ОБП, то ТИ оказывается непротиворечивой и ПО может допускать минимизацию в базисах функций д-значной алгебры логики.

4. Модификация прогнозирующего оператора прогнозирование при к > М

Для прогнозирования неизвестных выборок вне заданного ряда (3) при к > М требуется модификации алгоритма (8).

Прогнозирование при к > М заключается в пошаговом построении продолжения ТИ с М - п + 1-ой по М +,?/ -ю строку, где М +,?/ = 1,2,..., Ь , а Ь — номер максимального шага прогнозирования или т.н. «прогнозного горизонта» для пополнения выборок данных (8), имеющихся в исходной ТИ.

Для определения уМ+х/ используется последовательное сравнение М—п + л/- -ой п-последователь-ности со всеми п-последовательностями, уже имеющимися в исходной таблице, рассматриваемыми как опорные («эталонные») по критерию «минимума расстояния» между ними [8].

Ум*= аг8

Ж

: г шп ,4 }&) (9)

у*е\уп+1>у*+и-ум*г-л

где

Г/1 у к* 1-1 -Ум^-І

ує[1,л] >ё[1,г]

к = п + \,п + 2,..М + 5/" -1

(10)

Таблица 1.

Таблица истинности

В критерии близости (9) используются весовые функции индекса /=1, 2, ..., п с типом веса . = {с, I, е, к}:

ж(с)=1, ж(1)=1+(1—/)/п, ц>(е)=е^/, М^к)=/ -1 (11)

Возможна модификация формулы (7) с учетом классов эквивалентности, каждому из которых соответствует одинаковое прогнозируемое значение исходного ряда [9].

5. Связь оптимальных базовых параметров с предсказуемостью и восстанавливаемостью

Из введенных обозначений и алгоритма прогнозирования (8) для векторного временного ряда (3), удовлетворяющего условиям (4), существует ММ ПО, который по пор1 начальным, следующим подряд с шагом А(ор1 = Т / Мор1 дор1 -значным выборкам исходного ряда (3) позволяет вычислить все оставшиеся М - пор1 выборок.

Исходя из этого, характеризуем «голографическое» свойство векторного М, д, п-процесса — «восстанавливаемость» (с точностью 1 / дор1) с помощью прогнозирующего оператора (7) по пор1 известным, следующим подряд векторам-столбцам, последующих вектор-столбцов с любыми изменениями в них символов текста. И это позволяет естественным образом ввести понятие «предсказуемости (прогнози-руемости)» (Рг) поведения векторного ПО, как отношения энтропии предсказываемой части векторных процессов к энтропии базовой (начальной части)

г,

Рг=

1о&г%

У 1°82с

+1=(М-шР,)=М_йМ (12)

Норі~^~ 1 Норі

* орі

из которого следуют следующие выводы:

Предсказуемость (12) векторного ряда (3) обладает следующими свойствами:

а) зависит явно только от длины М и порядка пдрІ

ПО (8); °д

б) не может превышать длины М векторного ряда;

в) возрастает с ростом М, если текст М, д, п при своем продолжении сохраняет ОБП, то есть при ДМ > 0 остается стационарным «М +ДМ, д°рІ, пдрІ -рядом»;

г) при пор1 = 1 предсказуемость Рг текста максимальна и равна М

Доказательство перечисленных свойств следует из возможности представления функции / ПО (5) в форме ТИ по тексту полной длины М [6].

6. Отличительные особенности предложенного метода

1. Предложен и проверен экспериментально на информационной системе прогнозирования метод, основанный на предварительной оптимальной дискретизизации («оптимальном загрублении») исходных данных во временные ряды.

2. Используемые ОБП {Д?, д, п} находятся одновременно по единому энтропийному критерию, а не по различным известным ранее критериям оптимальности каждого из параметров, например,

Н.Акшке (только для п)[10] и В.А.Котельникова (только для {Д ?)} [4].

3. Применяемый ПО един как для скалярных, так и для векторных процессов.

4. Метод позволяет уточнить частоту дискретизации исходных данных, если она была выбрана не оптимально.

5. Используемый ПО определяется в общем случае в виде нелинейной д-значной логической функции для любого прогнозируемого процесса.

6. Исходя из п.5 данный метод может быть применим в случае неизвестной функциональной зависимости прогнозируемого значения от предыдущих.

7. Прогнозирование экономических процессов

Экономические ряды имеют четкую восходящую или нисходящую тенденцию (тренд). Очевидно, что при этом количество уровней квантования будет не постоянным (не выполняется условие (4)). В данном случае целесообразно прогнозировать не сами значения ряда, а отклонения относительно предыдущего значения, т.е. разности 1-го порядка:

у, = у^-ук’к е[1,М-1],V е[1,г] (13)

Используя предположение, что количество уровней квантования для ряда (13) будет постоянным, после оптимальной дискретизации используя формулы (4)-(6) можно спрогнозировать ряд разностей 1-го порядка. Поскольку в конечном итоге важны не относительные изменения, а абсолютные значения, то используется обратное преобразование:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

у1=у1+ 1^,1 е [1,М-1+Ц,у е [1,г] (14)

,=1

При прогнозировании рыночной стоимости акции также необходимо учесть объем сделок, который был совершен в этот же временной про-

Рис. 1. Прогноз международных перевозок

Рис. 2. Прогноз цены акции ОАО «Газпром»

межуток. Для этого прогнозный ряд можно представить в виде векторного процесса, состоящего из двух компонент: цена при окончании временного промежутка (ДО и количество сделок, совершенных за данный временной промежуток времени.

8. Методика экспериментов.

Оценка точности прогнозирования

Механизм верификации [1] прогноза позволяет выполнить оценку достоверности и точности прогноза по участку эталонного временного ряда. В качестве оценки точности прогноза используется формула

Er (L) =

= уl-Г'^lyM+sr-i-y'SfГ , (15)

где у' — исходный (реальный) процесс; s — шаг прогноза; L — длина прогноза. Сравниваются исходный процесс (у'(s),s e[M-L,M-l]) и спрогнозированный процесс (у(s),s е [M-L,M-l]) на основе исходного процесса с отброшенным концом (у'(s),s е[0,M-L-1]). Поиск оптимальных базовых параметров и построение прогнозирующего оператора (12) осуществлялись на участке к е [0, M-L-1].

В качестве экспериментальных данных были выбраны 2 временных ряда: выборка цен акции ОАО «Газпром» за период 01.12.2011-18.02.2012 и «классический» ряд Ряд G — Series G [2], представляющий месячные международные авиаперевозки (в тысячах) в течение 12 лет с 1949 по 1960. Отличительной особенностью международных перевозок является наличие ярко выраженной сезонной составляющей. Ниже приведена таблица сравнения точности прогноза предложенного метода с двумя наиболее популярными методами — экспоненциального сглаживания и ARIMA.

Таблица 2.

Результаты прогнозирования международных авиаперевозок

= 49, п, = 3:г = 1,М = П9:Е = 16,84: Рг = 40

Исходя из результатов, можно сделать вывод, что предложенный метод при прогнозировании временных рядов с ярко выраженной сезонной компонентой уступает методу прогнозирования, основанному на экспоненциальном сглаживании.

На рис. 1 изображен результат прогнозирования методом на основе оптимальных базовых параметров, выполненный с помощью программы Forecast [11-12]. Синей линей изображен прогнозный ряд, красной — исходный ряд.

Для сравнения цен акции ОАО «Газпром» был спрогнозирован с учетом объемов сделок и без учета объема сделок. Результаты экспериментов (оценка точности прогноза рыночной стоимости акции и результаты предобработки) скалярного процесса, выполненных в программе Forecast [11-12], представлен в виде табл. 3.

Таблица 3.

Результаты прогнозирования скалярного процесса

= 125,«

\5мин; г-1 ,М-1681; Е- 34,83; Рг- 336

L 1 5 10 15 0 2 5 2

ОБП 3 ,7 0, со 0, ,6 3, ,4 4, ,3 4, ,3 4,

Экспоненциальное сглаживание 6 ,9 0, 1,6 2 2 2 2,1

ARIMA 0, 4 со 0, ,6 0, 5 ,7 0, 5 ,9 0, 1,05

На рис. 2 изображен результат прогнозирования цены акции ОАО «Газпром» методом на основе оптимальных базовых параметров, выполненный с помощью программы Forecast [11-12]. Пунктирной линей изображен прогнозный ряд, сплошной — исходный ряд.

Результаты экспериментов (оценка точности прогноза рыночной стоимости акции и результаты предобработки) векторного процесса (с учетом объема сделок), выполненных в программе Forecast, представлен в виде табл. 4.

Таблица 4.

Результаты прогнозирования

L 1 5 10 15 20 25 векторного процесса

ОБП 3,65 19 24 26 34 34 %г 106ЛР,= 3, Д/*= 15лшн; г= 2Д= 1681; £=20,18; А- = 563

Экспоненциальное сглаживание 17,5 14 24 23 30 35 L 1 5 10 15 20 25

ARJMA 7 23 33 37 53 57 ОБП 0,27 0,46 0,55 0,5 0,7 1,1

9. Заключение

Таким образом, в статье предложен и проверен экспериментально новый метод прогнозирования экономических временных рядов, основанный на предварительной оптимальной дискретизизации («оптимальном загрублении») исходных данных во временные ряды. Данный метод зарекомендовал себя в задачах прогнозирования рядов, в которых априорная информация не позволяет сделать вывод о функциональной зависимости прогнозируемого значения от предыдущих. В тех случаях, когда имеется априорная информация, например, информация о наличии сезонной компоненты, следует использовать «классические», наиболее популярные методы прогнозирования, позволяющие учесть эту информацию.

Метод, основанный на применении ОБП, позволяет при прогнозировании рыночных курсов акций

не только учесть объем сделок, но и одновременно спрогнозировать его.

Метод прогнозирования позволяет одновременно осуществлять и его верификацию (оценку достоверности и точности) по участку эталонного временного ряда.

Экспериментально было установлено, что при использовании информации об объеме сделок, возрастает прогнозируемость процесса и увеличивается в несколько раз точность прогноза, что в целом превышает точность прогнозирования ряда, выполненное «классическими» методами.

Предложенный алгоритм может применяться при решении практических задач бизнес-информатики, сводимых к задаче оптимальной дискретизации по уровню и по времени и к задаче прогнозирования временных рядов. ■

Литература

1. Прогностика. Технология. / Под ред. В.И.Сифорова. — М.: Наука, 1990.

2. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. — М.: Мир, 1974.

3. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979.

4. Конева Е.С. Выбор моделей для реальный временных рядов // Автоматика и телемеханика. — №6. — 1988. - С. 3-18.

5. Романюк Ю.А. Основы цифровой обработки сигналов. В 3-х ч. Ч.1. Свойства и преобразования дискретных сигналов: Учебное пособие. — М.: МФТИ, 2005.

6. Кирьянов К.Г. Выбор оптимальных базовых параметров источников экспериментальных данных при их идентификации // Идентификация систем и задачи управления: тр. 3-й междунар. конф.— М.: ИПУ РАН, 2004. — С. 187-208.

7. Кирьянов К.Г. Идентификация динамических и информационных характеристик многоканальных систем на основе оптимальной дискретизации данных // Идентификация систем и задачи управления: тр. 9-й междунар. конф.— М.: ИПУ РАН, 2012. — С. 252-265.

8. Кирьянов К.Г., Кузнецов Е.С. Особенности прогнозирования дискретных и аналоговых векторных процессов на основе идентификации их базовых параметров // Труды 14-й Научной конференции по радиофизике.— Н.Новгород: ННГУ, 2010. — С. 278-279.

9. Кирьянов К.Г., Кузнецов Е.С. Модификация метода прогнозирования аналоговых и дискретных процессов в программе forecast 2 // Труды 12-й Научной конференции по радиофизике. — Н.Новгород: ННГУ, 2008. — С. 271-273.

10.Akaike H. A New Look at the Statistical Model Identification. // IEEE Transactions on Automatic Control. — 1974. — Vol. 19. — P. 716-723.

11.Кирьянов К.Г., Кузнецов Е.С. Информационная система прогнозирования векторных временных рядов // Информационные системы и технологии (ИСТ-2010): тез. докл. междунар. науч.-техн. конф.— Н.Новгород: НГТУ, 2010. — С.158-159.

12.Свидетельство о государственной регистрации программы для ЭВМ №2008611799, 09.04.2008

i Надоели баннеры? Вы всегда можете отключить рекламу.