ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ
УДК 330.4(075.8)
И. И. Исмагилов, А. П. Кирпичников, А. В. Костромин, С. Ф. Хасанова
ПРИМЕНЕНИЕ БЫСТРОГО ДИСКРЕТНОГО ПРЕОБРАЗОВАНИЯ К ФАЗОВОМУ СПЛАЙН-АНАЛИЗУ МАКРОЭКОНОМИЧЕСКОЙ ДИНАМИКИ
Ключевые слова: фазовый анализ, кубический сплайн, метод наименьших квадратов, ускорение вычислений.
В качестве альтернативы классическому интерполяционному сплайну предлагается комбинированный подход, сочетающий в себе преимущества классического сплайна (гладкость, непрерывность) и устойчивость к погрешностям наблюдений, свойственную моделям, построенным по методу наименьших квадратов. Для реализации метода наименьших квадратов предлагается вычислительный алгоритм, основанный на быстром дискретном преобразовании, представляющем собой модифицированный вариант преобразования Уолша. Такой подход позволяет существенно сократить количество операций умножения в вычислительной системе и соответственно ускорить процесс вычисления.
Keywords: phase analysis, cubic spline, least squares method, the acceleration calculations.
In this study we propose an alternative hybrid approach to the classical interpolation spline that combines the advantages of classical spline (smooth, continuous) and of the method least square (error stability of observations). The method proposes computational algorithm to the method of least square based on Fast Discrete Transforms that is a modified version of the Walsh transform. This approach can significantly reduce the number of multiplication operations in the computer system and expedite the process of calculating.
Описание метода построения сплайновых моделей
В последнее время интенсивно развивается новая отрасль экономической теории - экономическая цикломатика, в основе которой лежат различные гипотезы о цикличности в экономических процессах [1]. При этом в качестве одного из основных методов математического описания экономического поведения различных объектов предлагается аппарат сплайн -функций, или сплайнов [2, 3]. В последнее время аппарат сплайн стал весьма популярен в различных областях, в том числе в экономике [4,5,6,7,8,9] и для анализа финансовых рынков [11]. При этом исследования показывают эффективность прогнозов, полученных при помощи сплайнов [12,13]. Следует отметить перспективность сплайновых моделей при решении прогнозных задач как на региональном уровне, так и на уровне предприятий [14, 15].
В качестве основания для этого приводятся причины, связанные с непредсказуемостью процессов, происходящих в экономике, общественной жизни и истории, с тем, что главное влияние на развитие этих процессов оказывают именно непредсказуемые скачки, которые невозможно было предвидеть заранее, по крайней мере, в рамках тех представлений о процессах, которые существовали до этих событий [16].
Кроме того, декларируются преимущества сплайнового подхода по сравнению, в частности, с полиномиальной интерполяцией. Эти преимущества имеют отношение в основном к двум аспектам: появлению так называемой «ложной цикличности» в полиномах высоких степеней вследствие колебательного характера функций данного класса и связанными с этим большими порядками значений
производных, а также подверженностью интерполяционных полиномов сильному влиянию «выбросов» в исходных данных, что также приводит к колебаниям соответствующих аппроксимаций. Более того, колебательный характер полиномов высокого порядка усиливается на краях области измерений, что ставит возможность корректного прогнозирования за пределами области под большие сомнения [2].
Нелинейность временных рядов приводит к неэффективности таких моделей, как ARMA [17], дробная ARMA модель [18], векторная ARMA и векторная ARMA модель с экзогенными переменными [19], а также модель нестационарного случайного блуждания через коинтеграцию [20,21]. В работах [22,23] показана эффективность применения сплайн - моделей при использовании различных параметров сглаживания. Параметрические и сплайновые сглаженные модели тесно связаны друг с другом, что позволяет их комбинировать в общей модели [24]. Развитием этого подхода стала работа [25], в которой исследуется авторегрессионая зависимость ошибок сплайновых моделей и улучшение многоступенчатого прогноза.
Наиболее популярной областью применения сплайнов являются модели многомерной адаптивной сплайновой регрессии MARS (Multivariate Adaptive Regression Splines), предложенной в 1991 г. в [26], демонстрирующие большую точность при работе с нелинейными временными рядами. При этом в моделях MARS есть возможность моделирования связи между зависимыми переменными и предикторами. В работе [27] многомерная адаптивная сплайновая регрессия используется для выбора переменных и оценки нечетких функций в кластерах временных рядов. Эффективность MARS для выбора переменных модели также подтверждается в работах
[28, 29, 30]. MARS используется не только для идентификации значимых переменных, но и для оценки существенности кластеров временных рядов, как это было осуществлено в работе [31]. В работе [32] MARS с успехом применялась в прогнозировании минимальной и максимальной температуры воздуха на краткосрочный и недельный период. Результаты показывают большую точность прогноза по сравнению с моделями Support Vector Machine Regression (SVMr).
Сплайновые модели применяются также для повышения качества метода частных (дробных) наименьших квадратов и получили название Multivariate Additive Partial Least-Squares Splines models (MAPLSS). Данный метод успешно использовался для моделирования эксперимента по оценке и прогнозированию запасов нефти у [33]. Таким образом, аппарат сплайн - аппроксимаций позволяет эффективно моделировать временные ряды, анализировать зависимость переменных и получать качественные прогнозы.
Очевидно, что из всего класса полиномиальных сплайнов наиболее
привлекательным является сплайн третьего порядка, или кубический сплайн, поскольку он обладает рядом хороших свойств: непрерывность, гладкость, минимальная кривизна и др.
В то же время на фоне рассуждений о преимуществах, очевидно, интерполяционных сплайнов декларируется отказ от метода наименьших квадратов как основы построения эконометрических моделей [3]. При этом говорится, что аппарат наименьших квадратов не дает представления о том, насколько точна та или иная модель, насколько удачно она отражает тенденции процесса. При этом имеется в виду, что применение интерполяционного сплайна уже решает все эти проблемы.
Однако при этом не упоминается о том, что одним из основных постулатов эконометрики, который вряд ли можно подвергать сомнению, является утверждение, что все наблюдения процессов, выражаемые количественно и подвергаемые анализу эконометрическими методами, содержат
погрешности, имеющие различную природу. Следовательно, проводя сплайны через точки наблюдений, в результирующих функциях присутствуют все эти погрешности, несмотря на сглаживающий характер данного процесса. Отсюда очевидна необходимость предварительного сглаживания данных наблюдений, и только затем их следует подвергать анализу с помощью сплайн -функций. Поэтому метод наименьших квадратов, особенно в его взвешенном варианте, учитывающий в некоторой степени наличие погрешностей различной природы, имеет в этом смысле преимущество перед чисто интерполяционными аппроксимациями.
Далее, в эконометрическом анализе учитывается и тот факт, что может иметь место неверный выбор модели процесса и что это может существенным образом отразиться на правильности выводов и точности прогнозов (погрешности спецификации модели). Здесь всегда делается оговорка о необходимости достаточной квалификации
эконометриста и, во всяком случае, признается важнейшая роль именно правильного выбора модели.
Исходя из сказанного, можно предложить несколько иной подход к построению аппроксимаций, отличный от чисто сплайновых интерполяций. Он заключается в комбинировании сплайнового принципа аппроксимации, при котором вся область измерений разбивается на ряд участков, на каждом из которых строится своя полиномиальная аппроксимация, и метода наименьших квадратов, с помощью которого на каждом участке сплайна строится полином, причем этот полином не должен обязательно проходить через точки наблюдений. Преимуществом такого подхода является ослабление влияния наблюдений с большими погрешностями (выбросов) с сохранением преимуществ, связанных с кусочным характером функции, описывающей наблюдаемый процесс.
В данной работе нами был выбран кубический сплайн (третьего порядка). Поскольку на каждом отрезке аппроксимации требовалось определять по четыре параметра, необходимо было задавать на каждом участке четыре условия, чтобы записать с их помощью по каждому участку четыре уравнения для однозначного определения четырех параметров локального полинома.
Этими условиями были, во-первых, равенства значений полиномов соседних участков в точках сопряжения самих участков (два условия на двух краях каждого участка), а во-вторых, равенство значений их производных в тех же точках (еще два условия). Как видим, условия являются симметричными на концах каждого подынтервала, что является преимуществом полиномов нечетных степеней. Чтобы замкнуть получающуюся систему уравнений, надо добавить два недостающих условия на первом и последнем подынтервале, поскольку на левом крае первого подынтервала нет соседнего участка с полиномом, а на правом краю последнего подынтервала также нет соседнего участка. В данной работе недостающие условия заменены «мягкими» граничными условиями, приравнивающими на обоих краях нулю значения вторых производных.
Все это позволяет однозначно определить систему нормальных уравнений и решить ее методами линейной алгебры. Как видим, данная сплайновая аппроксимация не требует непрерывности вторых производных сплайна, что при построении фазовых диаграмм не должно являться большой проблемой. Это отражается только на визуальной гладкости кривой в фазовом пространстве.
Кроме того, здесь есть возможность подбирать размер участка сплайна для максимального исключения, например, явлений ложной цикличности. С этой же целью можно задавать осреднение данных (в частности, брать не ежедневные, а средние значения за неделю или за месяц).
Особенностью предлагаемого подхода является применение облегченных вычислительных процедур для расчета значений моментов различных порядков от наблюдаемых значений результирующего показателя. Эти процедуры приводят к существенному сокращению количества операций
умножения при расчете моментов в правых частях системы нормальных уравнений. Выигрыш достигается за счет некоторого увеличения числа операций сложения при одновременном существенном сокращении числа операций сложения. Перераспределение в операциях приводит к заметному сокращению в целом машинного времени при реализации предлагаемого алгоритма.
Такой эффект связан с тем, что в вычислительных системах время выполнения операций умножения, как правило, в несколько раз превышает время выполнения операций сложения и вычитания. Степень сокращения времени реализации алгоритма зависит от размерности участка сплайна и количества самих участков.
Алгоритмы решения рассматриваемых задач цифровой обработки сигналов (ЦОС) разработаны на основе сверточных косоугольных дискретных преобразований Уолша (СКДПУ). Здесь ядро преобразования подобрано так, что при расчете моментов исходного сигнала операции умножения исключаются полностью. При этом происходит некоторый рост числа операций сложения, что практически не сказывается на общей продолжительности вычислений. В конечном итоге все это дает значительную экономию машинного времени.
Приведем в качестве примера явный вид формул для вычисления косоугольных спектрально -сверточных представителей (КССП) цифрового сигнала при размерности сигнального вектора, равной степени двойки:
{£0О)}, k _ О,
{^0),С(1)}, k _ 1, г
{S0О), S1(1), S1(2), С2и)}, k _ 2,
{S0О),С(1),S1(2),б21Д),S1(3),Б22Д),Б^}, k _ 3,
размерности N1 необходимого для косоугольного дискретного преобразования Уолша:
8 *=
де S0О) = F(0); S1(k) = У-1^кц F(2м), к _ 1,3;
(к) _ ^ и-1 2 кц
М=0'
8а,1) _ у«-2 у«- 2^1+^2-1F(2 м + 2^2); 2 ¿—"Мх _0^М2 _М1 +1
с(2,1) _у"-1 у"-1 22М1+М2-\F(2^1 + 2^2)-
М2 *М1
. у"-20 у"-_ 1 (22М1+М2-1 + 2^+2^2-1 )F(2^1 + 2^2)
б^11 _
_ у "-3 у "-2 у"-1 +М3-3 F^ + 2^2 + 2^3)
Здесь Р - косоугольный спектр Уолша.
Поскольку, как правило, размерность исходного сигнала на участке сплайна не совпадает со степенями двойки, поэтому дополняем сигнальные векторы на участках нулевыми элементами до размерности, соответствующей ближайшей степени двойки. Тогда произойдет переход от размерности N к
N\ _ 2"
Ь ^^ N].
Рассмотрим случай, когда степень аппроксимирующего полинома не превышает трех. В этом случае моменты расширенного сигнального вектора (равные моментам исходного сигнала) представляются в виде:
т0 _ С00), т1 _ С(1), т2 _ С(2) + 4Б21,1),
т3 _ С(3) + 6Б3(2Д)+ 48(1 -8пЛ)31,1,1),
где ) - КССП к -го порядка с отметкой V.
Сравнение предложенного алгоритма с традиционным, основанным на вычислении моментов входного сигнала накоплением сумм произведений даже с использованием достаточно экономичной схемы Горнера в цикле, показало ускорение вычислений от 30% до 80%. Ускорение вычислений возрастает с увеличением числа точек на локальном участке и уменьшается с ростом числа участков сплайна. При этом ускорение тем больше, чем меньше разница между N и Ы1, т.е. чем меньше нужно дополнять исходный сигнальный вектор нулями до ближайшей степени двойки.
Для иллюстрации предлагаемого подхода были выбраны данные наблюдений цены на нефть за период 2005-2013 гг. Предварительный анализ с помощью сплайна ежедневных наблюдений показал наличие большого числа мелких циклов, очевидно, в большинстве своем ложных, для исключения которых было предложено воспользоваться не ежедневными данными наблюдений, а среднемесячными значениями, поскольку рассматриваемый период позволял применение метода наименьших квадратов к выборкам таких размеров. График иллюстрирует на фазовой плоскости наличие одного большого цикла, соответствующего кризису 2008-2010 гг., и нескольких малых циклов, наблюдаемых в период 2011-2013 гг., связанных, очевидно, с неустойчивостью цен на нефть в этот период.
Эти циклы иллюстрируют некоторый повышающий тренд, начавшийся с 2011 г. небольшой петлей в начале 2011 г. с последующим существенным ростом цен на нефть, и далее, с начала 2012 г. до начала 2013 г. продолжающийся с понижением темпа до нулевых и отрицательных значений, образуя петлю, и с весны 2013 г. переходит в колебание с понижающим трендом, что продолжается и до настоящего времени.
На графике показаны временные отметки, соответствующие первому рабочему дню года. Промежуточные месячные отметки не представлены, но их можно легко определить по изломам кривой, связанным с негладкостью сплайна по вторым производным. Кривая закручена по направлению часовой стрелки.
phase plate of oil prices
fp^f \ 02/(1/05 \^ .MíQlí И ^^VM/OIJOSSx \ OlíOKfei ¡Цш/ niü" иЯэ"
M/12Í14;
40 SO 60 70 SO 90 100 110 120 130 140
Рис. 1 - Фазовая кривая цен на нефть в долларах за 2005 - 2014 гг.
Заключение
В статье рассмотрено применение интерполяции кубическими сплайнами к фазовому анализу экономической динамики. Были обсуждены достоинства и недостатки такого подхода. Предложен комбинированный подход, включающий в процесс построения кубических сплайнов методов, основанных на использовании наименьших квадратов. Для ускорения процесса вычисления предложен алгоритм на основе сверточных косоугольных дискретных преобразований Уолша, что позволило существенно сократить время вычислений.
Литература
1. Винтизенко И.Г., Яковенко В.С. Экономическая цикломатика. - М.: Финансы и статистика, 2008. - 428 с.
2. Ильясов Р.Х. Фазовый сплайн - анализ как метод выявления цикличности в экономике//Современные наукоемкие технологии. - 2009. - №1. - с.32-36.
3. Боташева Ф.Б. Эволюция новых технологий анализа в современной макроэкономической динамике//Современные наукоемкие технологии. Региональное приложение. - 2011. - №2(26). - с. 11-16.
4. Jarrow, R., Ruppert, D., & Yu, Y. (2004). Estimating the interest rate term structure of corporate debt with a semiparametric penalized spline model. Journal of the American Statistical Association, 99(465), 57-66. D0I:10.1198/016214504000000070.
5. Kalyanam, K., & Shively, T. S. (1998). Estimating irregular pricing effects: A stochastic spline regression approach. Journal of Marketing Research, 35(1), 16-29. Stable URL: http://www.jstor.org/stable/3151927.
6. Sloot, L. M., Fok, D., & Verhoef, P. C. (2006). The short- and long-term impact of an assortment reduction on category sales. Journal of Marketing Research, 43, 536-548. DOI: 10.1509/jmkr.43.4.536.
7. Stremersch, S., & Lemmens, A. (2009). Sales growth of new pharmaceuticals across the globe: The role of regulatory regimes. Marketing Science, 28(4), 690-708. DOI: 10.1287/mksc.1080.0440.
8. Van Heerde, H. J., Leeflang, P. S. H., & Wittink, D. R. (2001). Semiparametric analysis to estimate the deal effect curve. Journal of Marketing Research, 38(2), 197-215. DOI: 10.1509/jmkr.38.2.197.18842.
9. Wedel, M., & Leeflang, P. S. H. (1998). A model for the effects of psychological pricing in Gabor-Granger price studies. Journal of Economic Psychology, 19(2), 237-260. DOI:10.1016/S0167-4870(98)00006-3.
10.. Lemmens, A., Croux, C. and Stremersch, S., 2012. Dynamics in the international market segmentation of new product growth. International Journal of Research in Marketing, 29(1), pp. 81-92. DOI:
10.1016/j.ijresmar.2011.06.003
11. Rangel, J.G. and Engle, R.F., 2012. The Factor-Spline-GARCH model for high and low frequency correlations. Journal of Business and Economic Statistics, 30(1), pp. 109124. DOI: 10.1080/07350015.2012.643132
12. Mestekemper Thomas, Goran Kauermann, Michael S. Smith, 2013. A comparison of periodic autoregressive and dynamic factor models in intraday energy demand forecasting, International Journal of Forecasting, Volume 29, Issue 1, January-March, Pages 1-12, ISSN 0169-2070, http://dx.doi.org/10.1016/j.ijforecast.2012.03.003.
13. Haniff, M.N. and Pok, W.C., 2010. Intraday volatility and periodicity in the Malaysian stock returns. Research in International Business and Finance, 24(3), pp. 329-343. DOI: 10.1016/j.ribaf.2010.03.001.
14. Аксянова А.В., Хайрутдинова Ю.В. Прогнозирование показателей развития социально-экономической сферы региона // Вестник Казанского технологического университета. 2011. № 20. С. 305-310
15. Гадельшина Г.А., Аксянова А.В. Прогнозирование прибыли предприятия с помощью мультитрендовой модели // Вестник Казанского технологического университета. 2013. Т. 16. № 1. С. 277-281.
16. Талеб Н.Н. Черный лебедь. Под знаком непредсказуемости. - М.: Издательство КоЛибри, 2010. -528 с.
17. Box, G., Jenkins, G.M., Reinsel, G., 1994. Time Series Analysis: Forecasting & Control, third ed. Prentice Hall. ISBN: 0130607746, 9780130607744.
18. Granger, C.W.J., Joyeux, R., 1980. An introduction to longmemory time series models and fractional differencing. J. Time Series Anal. 1 (1), 15-29.
19. Hannan, E.J., Deistler, M., 1988. The statistical theory of linear systems. In: Wiley Series in Probability and Mathematical Statistics. John Wiley & Sons, New York. http://books.google.ru/books?id=n_5JCmPCQ7QC&lpg=PR3 &ots=7_eb83Nav2&dq=Hannan%2C%20E.J.%2C%20Deistle r%2C%20M.%2C%201988.%20The%20statistical%20theory %20of%20linear%20systems.%20In%3A%20Wiley%20Serie s%20in%20Probability%20and%20Mathematical%20Statistic s.%20John%20Wiley%20%26%20Sons%2C%20New%20Yor k.&lr&hl=ru&pg=PR10#v=onepage&q&f=false
20. Engle, R.F., Granger, C.W.J., 1987. Co-integration and error correction: representation, estimation, and testing. Econometrica 55 (2), 251-276. Stable URL: http://www.jstor.org/stable/1913236.
21. Cai, Z., Fan, J. & Yao, Q. 2000, "Functional-Coefficient Regression Models for Nonlinear Time Series", Journal of the American Statistical Association, vol. 95, no. 451, pp. 941955. http://www.scopus.com/inward/record.url?eid=2-s2.0-2242466770&partnerID=40&md5=9a3e6049f0ccb56fb7da1e1 a8fc25ba4
22. Martinez DL., Shih DT, Chen VCP; Kim SB, 2012. A convex version of multivariate adaptive regression splines. Computational statistics & data analysis, 81, pp. 89-106 DOI: 10.1016/j.csda.2014.07.015.
23. Chen, R. & Liu, L.-. 2001, "Functional coefficient autoregressive models: estimation and tests of hypotheses", Journal of Time Series Analysis, vol. 22, no. 2, pp. 151-173. http://www.scopus.com/inward/record.url?eid=2-s2.0-0040481728&partnerID=40&md5=1270862cab25eda184083e 44e1461711.
24. Huang, J.Z., Shen, H., 2004. Functional coefficient regression models for non-linear time series: a polynomial spline approach. Scand. J. Stat. 31 (4), 515-534. http://www.scopus.com/inward/record.url?eid=2-s2.0-10444247376&partnerID=40&md5=c53ce92ecaa910ad8355b 6ebe55e544a
25. Montoril, M.H., Morettin, P.A. and Chiann, C., 2014. Spline estimation of functional coefficient regression models for time series with correlated errors. Statistics and Probability Letters, 92, pp. 226-231. http://dx.doi.org/ 10.1016/ j.spl.2014.05.021.
26. Friedman J.H. (1991). Multivariate adaptive regression Spline. Annals of Statistics, 19, 1-141. Stable URL: http://www.jstor.org/stable/2241837.
27. Zarandi, M.H.F., Zarinbal, M., Ghanbari, N. & Turksen, I.B. 2013, "A new fuzzy functions model tuned by hybridizing imperialist competitive algorithm and simulated annealing. Application: Stock price prediction", Information Sciences, vol. 222, pp. 213-228. http://dx.doi.org/ 10.1016/j.ins.2012.08.002
28. Andalib, A., & Atry, F. (2009). Multi-step ahead forecasts for electricity prices using NARX: A new approach, a critical analysis of one-step ahead forecasts. Energy Conversion and Management, 50(3), 739-747. DOI: 10.1016/j.enconman.2008.09.040
29. Lu, C. -., Lee, T. -., & Lian, C. -. (2012). Sales forecasting for computer wholesalers: A comparison of multivariate adaptive regression splines and artificial neural networks. Decision Support Systems, 54(1), 584-596. DOI: 10.1016/j.dss.2012.08.006
30. Lu, C. -. (2014). Sales forecasting of computer products based on variable selection scheme and support vector regression. Neurocomputing, 128, 491-499. DOI: 10.1016/j.neucom.2013.08.012
31. Kao, L.-., Chiu, C.-., Lu, C.-. and Chang, C.-., 2013. A hybrid approach by integrating wavelet-based feature extraction with MARS and SVR for stock index forecasting. Decision Support Systems, 54(3), pp. 1228-1244. DOI: 10.1016/j.dss.2012.11.012
32. Ramesh, K., & Anitha, R. (2014). MARSpline model for lead seven-day maximum and minimum air temperature prediction in ^ennai, India. Journal of Earth System Science, 123(4), 665-672. DOI: 10.1007/s12040-014-0434-z.
33. Lombardo, R., Durand, J.-. and Faraj, A., 2011. Iterative Design of Experiments by Non-Linear PLS Models. A Case Study: The Reservoir Simulator Data to Forecast Oil Production. Journal of Classification, 28(1), pp. 113-125. DOI: 10.1007/s00357-011-9071-2.
© И. И. Исмагилов - д-р техн. наук, профессор зав/ кафедрой экономико-математического моделирования ИУЭиФ КФУ, iiismag@mail.ru; А. П. Кирпичников - д-р физ.-мат. наук, зав. кафедрой интеллектуальных систем и управления информационными ресурсами КНИТУ, kirpichnikov@kstu.ru; А. В. Костромин - канд. техн. наук, доцент кафедры экономико-математического моделирования ИУЭиФ КФУ, andrei_kostromin@inbox.ru; С. Ф. Хасанова - аспирант кафедры экономико-математического моделирования ИУЭиФ КФУ, svetlana-khasanova-1@yandex.ru.
© I. I. Ismagilov - Doctor of Technical Sciences, Professor, Head of the Department of Economical-mathematical modeling in the Institute of Management, Economics and Finance of Kazan Federal University, iiismag@mail.ru; AP. Kirpichnikov - Doctor of Physical and Mathematical Sciences, Professor, Head of the Department of Intelligent Systems & Information Systems Control in Kazan Scientific Research Technical University, kirpichnikov@kstu.ru; A.V. Kostromin - PhD. of Technical Sciences, docent of the Department of Economical-mathematical modeling in the Institute of Management, Economics and Finance of Kazan Federal University, e-mail: andrei_kostromin@inbox.ru; S.F. Khasanova - Postgraduate of the Department of Economical-mathematical modeling in the Institute of Management, Economics and Finance of Kazan Federal University, svetlana-khasanova-1@yandex.ru.