Научная статья на тему 'Прогнозирование тенденций развития случайных процессов с применением порядковых статистик'

Прогнозирование тенденций развития случайных процессов с применением порядковых статистик Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
142
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ORDINAL STATISTICS / RANDOM VARIABLE / RANDOM PROCESS / MEDIAN / HODGES-LEHMAN STATISTICS / FORECASTING / TREND / MEAN SQUARE ERROR / MEAN ABSOLUTE ERROR / ПОРЯДКОВАЯ СТАТИСТИКА / СЛУЧАЙНАЯ ВЕЛИЧИНА / СЛУЧАЙНЫЙ ПРОЦЕСС / МЕДИАНА / СТАТИСТИКА ХОДЖЕСА-ЛЕМАНА / ПРОГНОЗИРОВАНИЕ / ТРЕНД / СРЕДНЯЯ КВАДРАТИЧНАЯ ОШИБКА / СРЕДНЯЯ АБСОЛЮТНАЯ ОШИБКА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мисюра В. В.

В статье приведены результаты разработки метода прогнозирования тенденций развития случайных процессов, основанного на порядковых статистиках, а именно, медиане и статистике Ходжеса-Лемана. В статье подробно рассматривается предложенный метод: даются основные определения, формулы расчета, подробное описание алгоритма. Алгоритм реализован в виде программного модуля, который имеет практическое применение и может быть использован для решения задач прогнозирования тренда финансовых временных рядов. Приведены сравнительные результаты применения метода прогнозирования для индекса РТС в случае применения медианы и статистики Ходжеса-Лемана.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Forecasting the development trends of random processes using ordinal statistics

The article presents the results of the development of a method for predicting trends in the development of random processes based on ordinal statistics, namely, the median and Hodges-Lehman statistics. The article discusses the proposed method in detail: it provides basic definitions, formulas for the calculation, a detailed description of the algorithm. The algorithm is implemented in the form of a software module that has practical application and can be used to solve problems of forecasting the trend of financial time series. The comparative results of applying the prediction method for the RTS index in the case of the use of the median and the Hodges-Lehmann statistics are given.

Текст научной работы на тему «Прогнозирование тенденций развития случайных процессов с применением порядковых статистик»

Прогнозирование тенденций развития случайных процессов с применением порядковых статистик

В.В. Мисюра

Донской государственный технический университет, Ростов-на-Дону

Аннотация: В статье приведены результаты разработки метода прогнозирования тенденций развития случайных процессов, основанного на порядковых статистиках, а именно, медиане и статистике Ходжеса-Лемана. В статье подробно рассматривается предложенный метод: даются основные определения, формулы расчета, подробное описание алгоритма. Алгоритм реализован в виде программного модуля, который имеет практическое применение и может быть использован для решения задач прогнозирования тренда финансовых временных рядов. Приведены сравнительные результаты применения метода прогнозирования для индекса РТС в случае применения медианы и статистики Ходжеса-Лемана.

Ключевые слова: порядковая статистика, случайная величина, случайный процесс, медиана, статистика Ходжеса-Лемана, прогнозирование, тренд, средняя квадратичная ошибка, средняя абсолютная ошибка.

Рассмотрим случайные процессы описывающие поведение финансовых временных рядов. Предметом настоящего исследования являются методы прогнозирования тенденции их развития во временис использованием оценок на основе порядковых статистик. Цель исследования заключается в оценке возможности использования таких методов для прогнозирования.

Для описания эволюции величин , соответствующих цене некоторого финансового инструмента в момент времени I, обратимся к случайному процессу К = ( К) ш<п с дискретным временем, где

К = 1п

(1).

А-1

Под тенденцией поведения финансового инструмента будем понимать 3 типа его поведения: падение (-1); сохранение(О); рост тренда(1).

Функция, которая позволит прогнозировать тенденцию индекса на один временной период, строится по следующей формуле:

:

Trend■

-1,0+ < 0 0,(0+ > 0)&(0- < 0) 10 > 0

(2)

где 0- и 0+ - пороговые переменные функции.

Пороговые переменные вычисляются соответственно:

00=4) (3)

где ) - порядковая статистика, вычисленная по последовательности кг за к временных периода, предшествующих уровню I; а - коэффициент,

настраиваемый для каждой случайной последовательности; П . _

(ск)

порядковая статистика, вычисленная по случайной последовательности

2 2

стк = (^ - ?](ьк)) за к временных периода, предшествующих уровню /.

Дадим понятие порядковых статистик. Если случайные величины, входящие в выборку Х1 ,Х2Хп расположить в порядке возрастания их значений х^) < Х(2) <... < Х(п-), то соответствующие этим значениям случайные величины Х(1), Х(2),... Х( п) называют порядковыми статистиками.

Распределение вероятностей порядковых статистик зависит от объема выборки п, номера порядковой статистики, а также от функции распределения Т(х) и плотности /(х) наблюдаемой случайной величины X.

Статистические свойства порядковых статистик, как при конечных и малых объемах выборки, так и при больших объемах выборки (то есть в асимптотике), подробно изучены и описаны в литературе (см., например, [1]).

В качестве порядковых статистик для прогнозирования в формуле (3) могут быть использованы следующие оценки: медиана, медиана Ходжеса-

J

Лемана, статистика Диксона, статистика Огавы, статистика Пирсона-Тьюки, статистика Кенуя и другие (см., например, [2, 3]).

В предложенном выше алгоритме прогнозирования будем использовать две порядковые статистики - медиану и медиану Ходжеса-Лемана. Выборочная медиана вычисляется по формуле:

med (Xi, X2,..., Xn) =

n

если — целое 2

X n + X n

H P+1] V 2 2 V

n + 1

X n+ , если--целое

[ ^ 2

(4)

где X[-] - i -я порядковая статистика, равная i -му по величине значению выборочного ряда x1 < x2 <... < xn, ранжированного по возрастанию.

Порядковая статистика Ходжеса-Лемана рассчитывается по формуле (см. [3, 4]):

XH-L = med[(X[i] + X[.]) /2], 1 < i < j < n. (5)

В формуле (5) medобозначает выборочную медиану. Свойства медианы Ходжеса-ЛеманаXH-L хорошо изучены и подробно описаны в литературе [2, 3, 5].

Для решения задачи прогнозирования тенденции развития случайных процессов во времени предлагается следующий алгоритм:

1. Определение случайной последовательности ht = (ht)1st<n по формуле (1). Определение исходных данных - коэффициента а и ширины окна k.

2. Расчет пороговых значений в- и 9+ по формуле (3), где i = k +1,2 ,..., n . Вычисление показателей тренда по формуле (2).

:

3. Вычисление ошибки прогноза-средняя абсолютная ошибка (MAE, MeanAbsoluteError) и средняя квадратичная ошибка (RMSE, RootMeanSquareError) по формулам (6) и (7) соответственно [5].

1 п

MAE = - Я У - f

П i=i

RMSE = J - - fj

\П i=i

(6)

(7)

где у - фактическое значение в момент времени I; - прогнозное значение

в момент времени I; п - размер горизонта прогнозирования.

Алгоритм реализован в программном модуле УБЛв МБЕхее1 и опробован на прогнозировании индекса РТС. В качестве исходных данных для исследования использовались значения индекса РТС по дням с 20.04.2018 по 20.11.2018 (на момент закрытия торгов) [6]. На рис. 1 показана динамика значений индекса РТС.

Рис. 1. - Исходные данные В таблице 1 приведены сравнительные результаты применения метода прогнозирования индекса РТС в случае применения медианы и статистики Ходжеса-Лемана, приведены значения ошибок при различных входных параметрах.

Таблица № 1

Результаты ошибок прогнозирования индекса РТС в случае применения медианы и статистики Ходжеса-Лемана

k а tf'h) - медиана n(hk) - статистика Ходжеса-Лемана

MAE RMSE MAE RMSE

6 1,3 0,18 0,175 0,09 0,085

7 1,3 0,19 0,18 0,1 0,097

6 1,96 0,086 0,077 0,074 0,065

7 1,96 0,094 0,087 0,089 0,078

Проанализировав результаты расчетов, заметим, что применение и медианы, и статистики Ходжеса-Лемана для прогнозирования дает неплохие результаты, хотя при применении порядковой статистики Ходжеса-Лемана ошибки незначительно меньше.

В статье был предложен непараметрический метод, который не использует информацию о функциональном характере распределений. Этот метод гарантирует заданное качество решений в рамках непараметрических моделей при неизвестном распределении наблюдений. Методы, основанные на использовании известного функционального вида распределения наблюдений, зачастую являются очень чувствительными к выборочным данным [7,8]. Что касается качества прогнозов, то эти вопросы рассмотрены в [9,10] и выбранные ошибки MAE и RMSE являются достаточно надежными показателями качества прогнозов.

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 17-01-00888 А

Литература

1. Дейвид Г. Порядковые статистики. М.: Наука. Главная редакция физико-математической литературы, 1979. 336 с.

2. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ, 2006. 816 с.

3. Васильев А.А. Гибридные модели прогнозирования объема продаж нового товара с использованием оценок на основе порядковых статистик // Современные научные исследования и инновации, 2014, № 8. Ч. 2. URL: web.snauka.ru/issues/2014/08/37268

4. Hodjes J.L., Lehmann E.L. Estimation of location based on rank tests // Ann. Math. Statist, 1963, №4, pp. 598-611.

5. Хеттманспергер Т. Статистические выводы, основанные на рангах. М.: Финансы и статистика, 1987. 334 с.

6. Значения индексов по дням // Московская биржа. Индексы. URL: moex.com/ru/index/stat/allindexdata.aspx

7. Мисюра В.В., Мисюра И.В. Обработка и фильтрация сигналов, Современное состояние проблемы // Инженерный вестник Дона, 2013, №4. URL: ivdon.ru/ru/magazine/archive/n4y2013/2130.

8. Мисюра В.В., Мисюра И.В. Программное обеспечение моделирования и фильтрации сигналов сложной нелинейной природы // Инженерный вестник Дона, 2016, №3 URL: ivdon.ru/ru/magazine/archive/n3y2016/3749.

9. Hettmansperger T.P., McKean J.W. Robust nonparametric statistical methods. 2nd ed. USA, Florida: CRC Press, 2010. 553 p.

10. Турунцева М.Ю. Инструменты оценки качества прогнозов показателей экономической деятельности организаций // Экономические отношения, 2011, № 2 (2).URL: bgscience.ru/lib/9844/

References

1. Dejvid G. Porjadkovye statistiki [Ordinal statistics]. M.: Nauka. Glavnaja redakcija fiziko-matematicheskoj literatury, 1979. 336 p.

2. Kobzar' A.I. Prikladnaja matematicheskaja statistika. Dlja inzhenerov i nauchnyh rabotnikov [Applied mathematical statistics. For engineers and scientists]. M.: FIZMATLIT, 2006. 816 p.

3. Vasil'ev A.A. Sovremennye nauchnye issledovanija i innovacii, 2014, № 8. Ch. 2. URL: web.snauka.ru/issues/2014/08/37268

4. Hodjes J.L., Lehmann E.L. Ann. Math. Statist, 1963, №4, pp. 598-611.

5. Hettmansperger T. Statisticheskie vyvody, osnovannye na rangah [Statistical conclusions based on ranks]. M.: Finansy i statistika, 1987. 334 p.

6. Moskovskaja birzha. Indeksy. URL: moex.com/ru/index/stat/allindexdata.aspx

7. Misjura V.V., Misjura I.V. Inzenernyj vestnik Dona (Rus), 2013, №4. URL: ivdon.ru/ru/magazine/archive/n4y2013/2130.

8. Misjura V.V., Misjura I.V. Inzenernyj vestnik Dona (Rus), 2016, №3. URL: ivdon.ru/ru/magazine/archive/n3y2016/3749.

9. Hettmansperger T.P., McKean J.W. Robust nonparametric statistical methods. 2nd ed. USA, Florida: CRC Press, 2010. 553 p.

10. Turunceva M.Ju. Jekonomicheskie otnoshenija, 2011, № 2 (2). URL: bgscience.ru/lib/9844/

i Надоели баннеры? Вы всегда можете отключить рекламу.