Совместный учет статистической и экспертной информации при прогнозировании временных рядов экономических показателей*

Колесов Дмитрий Николаевич; Котов Никита Владимирович; Федоренко Андрей Сергеевич

ЭКОНОМЕТРИКА

Д. Н. Колесов, Н. В. Котов, А. С. Федоренко

СОВМЕСТНЫЙ УЧЕТ СТАТИСТИЧЕСКОЙ И ЭКСПЕРТНОЙ ИНФОРМАЦИИ ПРИ ПРОГНОЗИРОВАНИИ ВРЕМЕННЫХ РЯДОВ ЭКОНОМИЧЕСКИХ ПОКАЗАТЕЛЕЙ*

Введение

Практически все наиболее популярные в настоящее время методы статистической экстраполяции временных рядов базируются на явном или неявном предположении об «инерционности» динамики параметров последовательности значений наблюдаемого показателя: постулируется, что закономерности, выявленные по данным за предыдущий период, сохранятся в значительной мере и в будущем.

Эту принципиальную ограниченность методов статистической экстраполяции частично преодолевают экспертные методы прогнозирования временных рядов экономических показателей, предполагающие возможность утилизации информации о будущих изменениях состояний финансово-экономической системы, релевантных относительно предсказываемого процесса. К сожалению, экспертные прогнозы обычно имеют нечисловой характер и нуждаются в дополнительной процедуре получения однозначно определенного числового значения прогнозируемого показателя, чем сильно уступают упомянутым методам статистической экстраполяции.

*Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект 06-06-80271).

Дмитрий Николаевич КОЛЕСОВ — доцент, заведующий кафедрой экономической кибернетики экономического факультета СПбГУ. В 1974 г. окончил экономический факультет ЛГУ. В 1985 г. защитил кандидатскую диссертацию. Имеет 39 печатных работ. Область научных интересов — математические методы в корпоративных финансах и на рынке ценных бумаг (корпоративных ценных бумаг).

Никита Владимирович КОТОВ — аспирант кафедры экономической кибернетики. Имеет 9 научных публикаций. Сфера научных интересов: использование методов теории исследования операций и теории игр для моделирования финансовых рынков.

Андрей Сергеевич ФЕДОРЕНКО — аспирант кафедры экономической кибернетики. Имеет 7 научных публикаций по вопросам применения экономико-математических методов для анализа временных рядов значений показателей финансовых рынков.

Поэтому возникает естественная идея составления некоторого агрегированного прогноза, представляющего собой, например, взвешенную сумму прогнозируемых значений и позволяющего сбалансировать указанные свойства метода статистической экстраполяции и экспертного метода1. В настоящей статье такое агрегирование применяется к статистическому прогнозу, использующему спектральный анализ нормально сглаженных временных рядов (раздел 1), и к экспертному прогнозу, основанному на нечисловой, неточной и неполной экспертной информации о вероятностях альтернатив (раздел 2). Практический пример такого агрегирования статистического и экспертного прогнозов приведен в разделе 3, где подробно разбирается вопрос о возможности предсказания будущих значений облигационного индекса «СВо^э».

1. Спектральный анализ нормально сглаженных временных рядов

Рассмотрим дискретный временной ряд х(/), представляющий собой последовательность значений некоторого показателя, наблюдаемых в моменты времени t е Т = /п}.

Для построения прогноза величины показателя по наблюдаемым значениям х(^), х(/п) необходимо пройти следующие этапы анализа динамики временного ряда х(/): выделение трендовой компоненты динамики показателя; «сглаживание» дискретного временного ряда; выявление периодических колебаний показателя; проверка случайного характера остатка, получающегося после вычитания из исходного ряда тренда и периодических составляющих.

В простейшем случае трендовая составляющая временного ряда может быть выделена, например, при помощи метода наименьших квадратов2. Для сглаживания дискретного временного ряда и перехода к непрерывной функции (необходимость этого перехода будет пояснена далее) предлагается использовать функцию плотности нормального распределения

_ (/ !ч )2

ф (/; ^; ст) = -=- е 2ст2 ,

■\12пст

где / — точка симметрии, а с — параметр, регулирующий степень сглаживания. Функция, получаемая в результате сглаживания, определяется формулой

)2

п 1

/(/; ст) = 2 хг^^е 2ст , 1=1 V 2пст

где х. — значение исследуемой величины в момент времени /., а п — количество элементов множества моментов времени Т.

Отметим несколько особенностей предлагаемого метода сглаживания. Во-первых, выбор параметра с позволяет регулировать степень сглаживания, так как определяет вес, с которым каждое отдельное значение ряда учитывается при определении значения функции /(/; с). Большая величина с позволяет большему количеству значений исходного временного ряда влиять на значение функции /(/; с) в каждой точке. Тем самым на этапе сглаживания осуществляется фильтрация высокочастотных колебаний. Причем степень такой фильтрации зависит от величины параметра с: чем больше значение с, тем более широкий интервал высокочастотных колебаний будет исключен из дальнейшего анализа. Во-вторых, полученный после преобразования ряд оказывается непрерывным и заданным на всей вещественной оси, что необходимо для анализа построения спектральной плотности исследуемого ряда3.

Спектральный анализ4 нормально сглаженного временного ряда/(ґ; с) начнем с вычисления комплексного частотного спектра £(ю; с) (спектрального преобразования Фурье) по формуле

ад

£ (ю; ст) = | е — ]Ш / (ґ; <з)й ґ ,

—ад

где ] = д/— 1 есть комплексная единица. Простые преобразования дают формулу

2 2 ю ст

П — ]ЮҐі-----

£ (ю; ст) = 2 х(ґг- )е 2 ,

!=1

используемую при вычислении энергетического спектра

Ф2 (со, а)= е

2 x(ti)cos oti I +1 2 x(ti )sin oti

i=1 J V i=1

называемого так по причине выполнения соотношения Рэйли5

адад

J x (t)dt = — |Ф (ю) dю ,

-ад п 0

связывающего энергию

ад

2

E = J x (t) d t

сглаженного временного ряда x(t) с функцией Ф2(ю) круговой частоты ю.

Далее необходимо выбрать точки ю i = 1 ^ к, которые будут соответствовать частотам основных периодических компонент исследуемого ряда. Определим точки ю. как середины небольших отрезков на оси абсцисс, площадь графика спектра над которыми является наибольшей. Действительно, интеграл от функции Ф2(ю) по небольшому отрезку представляет собой энергию, приходящуюся на полосу частот, принадлежащих этому отрезку, и определяющую величину вклада колебаний с данными частотами в общую динамику рассматриваемого показателя. Небольшая же величина отрезка позволяет аппроксимировать полосу частот одной частотой со средним значением.

Если построить гистограмму площадей под графиком функции Ф2(ю), то по ней можно определить частоты основных периодических составляющих: это те точки, в которых на гистограмме достигается локальный максимум. Именно на этом способе основан метод определения периодических составляющих, который мы используем далее. Найденные значения ю. — это значения круговых частот тех колебаний, вклад которых в значение рассматриваемой величины в каждый момент времени является наибольшим.

Построение суммы простейших периодических функций (косинусоид)

A(t) = A1 cos(ra1t + ф1) + A2 cos (ю2/ + ф2) +...+Ак cos(o)/ + фк),

где ю. — найденные точки, а А. и ф., i = 1 - к — параметры, определяемые по исходным данным методом наименьших квадратов, завершает этап выделения периодических составляющих сглаженного временного ряда.

Для наглядного представления распределения энергии сглаженного временного ряда по частоте можно использовать нормированный энергетический спектр W(a>; с), определяемый формулой

2

ад

Г Ф2 (ю; ст) ё ю

г,к=1 г<к

Смысл данного преобразования заключается в том, что нормированный спектр Ж(ю; о) выражает долю энергии временного ряда, приходящейся на бесконечно малый частотный диапазон [ю, ю + ёю].

В некоторых случаях вместо нормированного спектра, одним из аргументов которого является круговая частота ю, бывает удобно рассматривать так называемый периодический нормированный спектр У(Т; о), зависящий от периода колебаний и вычисляемый по формуле

При анализе периодического нормированного спектра ¥(Т; о) можно ограничиться рассмотрением интервала (Т Ттах), границы которого определяются формулами

где единицы измерения соответствует интервалам времени между соседними измерениями исходного временного ряда.

Если наблюдаемый дискретный временной ряд х(/.) интерпретировать как реализацию некоторого стохастического процесса ~ ) , то тогда и вычисленный энергетичес-

кий спектр Ф2(ю, о) можно трактовать как реализацию соответствующего стохастического процесса Ф2 (ю, ст). Тогда наличие локального максимума энергетического спектра на некоторой фиксированной частоте ю становится случайным событием и возникает задача определения статистической значимости наблюдаемых спектральных пиков, для решения которой нами предлагается следующая процедура.

В качестве исходной статистической гипотезы Н0, подлежащей проверке по наблюдаемой реализации х(/.) стохастического процесса ~(/.) ( = 1, ..., п), выдвигается предположение, что стохастический процесс ~(/г-) имеет характер белого шума, под которым здесь понимается п-мерная случайная величина с независимыми нормально распределенными компонентами, имеющими одно и то же математическое ожидание и дисперсию.

Оценка критического уровня у(ю; а) для этой гипотезы осуществляется методом Монте-Карло путем многократной реализации белого шума в точках t1, ..., tn. Такой подход позволяет избежать пробле~мы нахождения явного вида конечномерных распределений стохастического процесса Ф2 (ю, ст; Н 0), являющейся нетривиальной задачей даже в случае только одномерных распределений.

После того как будут выделены трендовые, периодические и случайные составляющие нормально сглаженного временного ряда, исследователь получит возможность прогнозировать численное значение исследуемого показателя на определенный момент в будущем. При реализации описанного метода прогнозирования выделенная случайная составляющая временного ряда позволяет оценить точность и достоверность делаемых прогнозов.

2. Экспертное прогнозирование временного ряда по нечисловой информации

В основе предлагаемого метода экспертного прогнозирования значений временного ряда лежит фиксация «альтернатив» A ..., A представляющих собой полную группу попарно несовместных событий: Ar П As = 0 при r ф s; A u... u At = Q.

Предполагается, что исследователь может получать информацию о вероятностях p. = = P(A.), i = 1, • ••, s,p. > 0,p + ...+ps = 1 альтернатив из m различных источников (экспертов). Изj-го источника исследователь получает информацию I,, j =1, ..., m, которая, как правило, может быть сведена к сравнительным суждениям типа «вероятность альтернативы A. больше (меньше, равна и т. п.) вероятности альтернативы Ar», что позволяет формализовать неточную и нечисловую информацию в виде системы I. = {p. >p, pu > pv; i, l, u, v e {1, ..., n}} равенств и неравенств для вероятностей p ..., pn альтернатив A,, ..., A . "

V ’ n

В результате всю неточную, неполную и нечисловую экспертную информацию можно представить в виде кортежа I = (I ..., Im), состоящего из соответствующих систем равенств и неравенств, получаемых из всех m источников информации.

Рассмотрим, как учет информации I,,j = 1, ..., m влияет на сокращение множества P(n) всех возможных векторов вероятностей p = (p1, ., pn) альтернатив A1, ., An, представляющего собой симплекс P(n) = {p = (p ...,pn) :p.> 0,p + ...+pn = 1}. Привлечение неточной, неполной и нечисловой информации в виде систем I, j = 1, ..., m позволяет сформировать множество P(n; I) всех допустимых, с точки зрения j-го источника информации, векторов вероятностей, представляющее собой многогранник P(n; I) с P(n) с Rn.

Неопределенность выбора вектора вероятностейp = (p1, ...,pn) из множества Pj(n; I) можно моделировать при помощи случайного выбора этого вектора. Такая «рандомизация неопределенности»6 дает n-мерный случайный (рандомизированный) вектор ~(Ij) = (pi(Ij) , ■■■, pn (Ij)) Pt (Ij) ^ 0 , ^1 (Ij) +... + pn (Ij) = 1 , который считаем равномерно распределенным на многограннике P(n; Ij).

Компонента p. (Ij) случайного вектора p(Ij) есть рандомизированная (стохастическая) оценка вероятности альтернативы A., соответствующая неточной, неполной и нечисловой информации, полученной изj-го источника. Для случайного вектора p(Ij) можно найти вектор математических ожиданий p(Ij) = (MIj) , ■ ■■, pn (Ij)), p.(Ij) = ZPi (Ij) , i = 1, n, и вектор стандартных отклонений sp(I) = (sp^I), ..., spn(I)),

s p. (Ij) = y]Dpi (Ij) ■ j j j

Математическое ожидание p. (Ij) рандомизированной вероятности p. (Ij) интерпретируется как усредненная оценка вероятности альтернативы A., а стандартное отклонение sp.(I) — как мера точности оценки p. (Ij) .

На практике экспертные оценки вероятности отсчитываются с определенным шагом Д = — , делающим дискретным множество возможных значений оцениваемых ве-

r ” In 12 k n-2 n-1 , 1 T

роятностей p. e <! 0 , — , — , ..., — , ...,------------------------------------,-, 1 f. Такая дискретизация позволяет рас-

[ n n n n n J

сматривать конечное множество P(r, n) всех возможных векторов вероятностей p = (p1, ..., pn), состоящее из N(r, n) элементов: P(r , n)= {p(0) = (p(e), ..., pf^) , 9= 1 , ..., N (r, n) }. Эта дискретизация позволяет рассматривать и соответствующее конечное множество P(r , n ; Ij ) = {p(e) = (p(e),..., p{), 9 = 1,..., N(r, n ; { ) ! всех допустимых (с точки зрения имеющейся у исследователя информации I) векторов вероятностей. Причем, очевидно, выполняется неравенство N(r, n; I) < N(r, n).

Конечность множеств Р(г, п; I),у = 1, т, позволяет, используя различные комби-

наторные алгоритмы, вычислять необходимые исследователю оценки вероятностей альтернатив по формулам

1 м (г , п ; 1У) (е)

Рг (I, ) = ^7----ГГ ^ Р(Є) ,

N (г , п ; I,) е=1

^ Рг (І, ) =

1 N(г , п ; )

N (г , п ; I,) е=1

X [Рг (9) - Рг (I, ) ]

Полученные оценки, учитывающие всю неполную, неточную и нечисловую информацию, доступную исследователю, решают проблему оценки вероятностей альтернатив, которые в нашем случае можно интерпретировать как альтернативы поведения временного ряда изучаемого показателя.

3. Агрегирование статистического и экспертного прогнозов временного ряда

Рассмотрим возможности агрегирования описанных двух методов прогнозирования временных рядов (статистического и экспертного) на примере агрегирования прогнозов значений ценового индекса корпоративных облигаций, публикуемого на интернет-сайте информационного агентства «СВо^э». Для анализа этого облигационного индекса «СВо^э» нами был выбран временной интервал с 1 февраля 2005 по 1 августа 2006 г.

2

Дата

Рис. 1. График ценового индекса корпоративных облигаций за период с 1 февраля 2005 по 1 августа 2006 г.

Сначала реализуем метод статистической экстраполяции на основе спектрального анализа нормально сглаженного временного ряда, описанный в разделе 1.

Выделение тренда методом наименьших квадратов дает следующие параметры линейного тренда: свободный член а = 113.7239, угол наклона Ь = -0.0012.

Исключив найденную линейную составляющую тренда, выделим нелинейный тренд, используя нормальное окно. Затем выделим содержащиеся в полученном ряде

периодические компоненты. Сравнивая с критическими уровнями оценку выявленных периодических компонент, можно определить, являются они значимыми или нет. После этого методом наименьших квадратов мы определяем амплитуду и начальную фазу выделенных колебаний (табл. 1).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 1

Амплитуда и начальная фаза выделенных колебаний

Период(дни) Амплитуда (%) Начальная фаза (дни)

80 18,8 5,85

36 8,80 1,82

13 3,55 1,79

24 5,59 0,82

18 4,05 2,72

16 3,37 0,50

Проверка ряда, остающегося после вычитания из нелинейной части трендовой составляющей ряда выделенных нами компонент на основе оценок уровней значимости, показывает, что других значимых периодических колебаний ряд не содержит, а полученный остаток является реализацией случайной составляющей динамики изучаемого показателя.

Теперь перейдем к анализу периодической компоненты динамики индекса цен облигаций. Применение разработанного метода выявления периодических составляющих дает гистограмму, представленную на рис. 2, где по горизонтальной оси идут значения периодов исследуемых колебаний, а по вертикальной — уровни значимости случайных отклонений значений гистограммы.

Период колебаний (дни)

Рис. 2. Гистограмма спектральной плотности нетрендовой части индекса «СВоп<!з».

Из величин рассчитанных уровней значимости следует, что значимыми являются следующие выявленные периодические компоненты (табл. 2).

Амплитуды остатка, полученного после вычитания значений, объясняемых выделенными колебаниями, очень малы по сравнению со значениями ряда. Это означает, что данные периодические компоненты можно не учитывать, а полученный остаток можно считать незначимым.

Значимые периодические компоненты

Период(дни) Амплитуда (%) Начальная фаза (дни)

7 0,45 3,51

5 0,67 0,65

На основе обнаруженных значимых характеристик трендовой и периодической составляющих анализируемого ряда мы можем построить прогноз ценового индекса на ближайший месяц. При интерпретации построенного прогноза следует учитывать следующее обстоятельство. Вычисленные методом наименьших квадратов амплитуды являются в некотором смысле средним значением амплитуд соответствующих колебаний, которые могут меняться с течением времени. В результате точность прогноза абсолютных значений может ухудшаться. Однако эта проблема легко разрешима, если на основе построенного прогноза (на относительно небольшой промежуток) рассчитать относительные ожидаемые изменения показателя и применить их к реально наблюдаемым значениям исследуемого показателя для расчета его ожидаемых будущих абсолютных значений.

Кроме того, так как спектр остатка, не учтенного при построении прогноза, в указанном выше смысле отвечает характеристикам белого шума, мы можем построить вероятностные интервалы для будущих значений ряда на основе оценки стандартного квадратичного отклонения, рассчитанного на базе этого остатка.

Таким образом, в течение первых десяти дней августа следует ожидать рост индекса, который в результате с вероятностью 68% может оказаться в интервале от 112,54 до 112,71, а с вероятностью 99,7% окажется в интервале от 112,36 до 112,9. После этого значительных резких колебаний индекса не предвидится. К концу августа значение индекса может достичь уровня 112,79 и с вероятностью 68% попадет в интервал от 112,7 до 112,88, а с вероятностью 99,7% — от 112,52 до 113,06.

Помимо этого прогноза, полученного методом статистической экстраполяции, построим аналогичный прогноз значений индекса «CBonds» с использованием нечисловой, неточной и неполной экспертной информации. В качестве коллективного эксперта мы будем использовать аналитиков по рынку облигаций компании «Кит Финанс», которые на своем сайте (www.cf.ru) выразили следующее мнение: «Конъюнктуру долгового рынка на ближайший месяц во многом определят итоги заседания ФРС 8 августа. Мы придерживаемся оптимистического прогноза относительно результатов заседания и надеемся на улучшение конъюнктуры мирового рынка облигаций и российского сегмента в частности. Основным риском для рынка является допущение, что после паузы в череде повышений ставки ее вновь поднимут через одно или несколько заседаний. Сохранение неопределенности негативно скажется на желании инвесторов покупать облигации в преддверии возможного роста уровня доходности. Мы склоняемся к тому, что рыночная конъюнктура в среднесрочной перспективе улучшится».

Как и для большинства экспертных мнений, для данного высказывания характерно отсутствие указания на четкие пределы ожидаемого роста или падения рынка. Однако анализ различных экспертных мнений относительно рынка облигаций показывает, что существенным аналитики, как правило, считают рост «чистых» цен облигаций (очищенных от купонного дохода) свыше 0,2% при средней дюрации, а значительным — свыше 0,6%. Тогда применение описанного во втором параграфе метода оценки вероятностей

альтернатив дает результат: рынок вырастет в пределах от 0,2 до 0,6% с вероятностью 0,62 и точностью 0,14, изменится в пределах от -0,2 до 0,2% с вероятностью 0,28 и точностью 0,1 и упадет в пределах от -0,6 до -0,2% с вероятностью 0,1 и точностью 0,08.

Итак, мы имеем два прогноза динамики индекса рынка облигаций, определяемых на основе: 1) анализа периодических составляющих и 2) экспертного мнения. Для получения агрегированного результата возьмем средневзвешенное значение данных прогнозов с равными весами. Равные веса берутся при отсутствии информации о степени доверия к полученным интервалам. При наличии такой информации веса могут быть выбраны внешним образом. Дополнительным доводом в пользу выбора равных весов является сравнительная оценка степени значимости двух подходов (статистического и экспертного). Очевидно, что объективного сравнения двух принципиально разных подходов не существует. В данном случае мы предполагаем, что они имеют равную значимость.

Получаем, что наиболее вероятным со значением вероятности 0,54 является промежуток от 112,70 до 112,97. По данным сайта информационного агентства «CBonds», на 1 сентября значение индекса составило 112,85.

Заключение

Таким образом, в рассматриваемом примере анализа динамики значений облигационного индекса «CBonds» совместный учет статистической и экспертной информации позволяет получить заметное увеличение точности и достоверности прогноза. Разумеется, для более полного исследования влияния совместного использования экспертной и статистической информации на качество прогнозирования необходимо дальнейшее изучение поведения временных рядов различных финансово-экономических показателей. Однако даже рассмотренный простой пример показывает, что предлагаемый вариант совместного учета экспертной и статистической информации может служить весьма гибким инструментом анализа, мониторинга и прогнозирования временных рядов с использованием всей нечисловой (ординальной), неточной (интервальной) и неполной информации, имеющейся у исследователя.

1 Евстратчик С. В. Прогнозирование временного ряда (на примере фондового индекса) // Вестн. С.-Пе-терб. ун-та. Серия 5: Экономика. 2002. Вып. 4. С. 162-168.

2 Кобозева Е. Г., Федоренко Ф. С., Хованов Н. В. Оценка спектральной плотности сглаженного временного ряда в задачах выявления периодических составляющих экономических процессов // Материалы международной научной конференции «Экономическая наука: проблемы теории и методологии». Санкт-Петербург, 16-18 мая 2002 г. Секции 5-10. СПб., 2002. С. 125-127.

3 Колесов Д. Н., Федоренко А. С., Хованов Н. В. Выявление периодических компонент динамики корпоративных облигаций // Материалы международной научной конференции «Актуальные проблемы экономической науки и хозяйственной практики». Секции 5-12. СПб., 2004. С. 49-50.

4 Гренджер К., Хатанака М. Спектральный анализ временных рядов в экономике. М., 1972.

5 Харкевич А. А. Спектры и анализ. М., 1962.

6 Хованов Н. В. Анализ и синтез показателей при информационном дефиците. СПб., 1996.

Статья поступила в редакцию 19 апреля 2007 г.

Аннотация научной статьи по математике, автор научной работы — Колесов Дмитрий Николаевич, Котов Никита Владимирович, Федоренко Андрей Сергеевич

Похожие темы научных работ по математике , автор научной работы — Колесов Дмитрий Николаевич, Котов Никита Владимирович, Федоренко Андрей Сергеевич

The combination of statistical information and expert appraisal for the forecasting of economic time-series

Текст научной работы на тему «Совместный учет статистической и экспертной информации при прогнозировании временных рядов экономических показателей*»