ПРИКЛАДНАЯ ИНФОРМАТИКА /-
1 № 3 (33) 2011
В. М. Руденко, канд. физ.-мат. наук, доцентНационального исследовательского ядерногоуниверситета «МИФИ», г. Москва
Е. В. Коротков,докт. биол. наук, профессор Национального исследовательского ядерного университета «МИФИ», г. Москва
Поиск скрытой периодичности в финансовых временных рядах методом циклического разложения
Обнаружение периодичности в финансовых рядах является бесспорным успехом методов циклического и информационного разложения. Для проведения расчетных работ по предложенным авторами алгоритмам было разработано программное обеспечение на языке Fortran.
Введение
Выявление циклических процессов, как в числовых временных рядах, так и в символьных последовательностях, может пролить свет на процессы, протекающие в системах различной природы и дать информацию о структуре самих временных рядов. С целью выявления пе-риодичностей во временных рядах и в символьных последовательностях в настоящее время в основном используются методы, основанные на преобразовании Фурье, вейв-лет-разложении и динамическом программировании [1-3]. Ранее авторами данной статьи для указанных целей был предложен метод информационного разложения (ИР), позволяющий обнаруживать такие виды периодичности в символьных последовательностях, обнаружение которых сильно затруднено методами, основанными на преобразовании Фурье, вейвлет-преобразовании или же динамическом программировании [4, 5]. Это связано в первую очередь с тем, что методы, основанные на преобразовании Фурье и вейвлет-преобразовании, раскладывают статистическую значимость длинных (бо'льших, чем размер используемого в последовательности алфавита) периодов
по более мелким, кратным периодам [4, 5], что приводит к невозможности выявить длинную размытую периодичность символьной последовательности на статистически значимом уровне.
Применение информационного разложения к изучению периодичности символьных текстов позволило обнаружить скрытые периоды в поэтических текстах, в последовательностях оснований многих генов [4-7], а также выявить аминокислотную скрытую периодичность, специфичную для белковых семейств [8,9]. Данные результаты показывают, что в символьных последовательностях существует скрытая периодичность, детектируемая исключительно методом информационного разложения. Такие данные также позволяют предположить, что похожая периодичность, которую можно назвать скрытой, может быть выявлена также и в числовых последовательностях. Простейшим способом применения метода информационного разложения является квантование числовой последовательности, что означает ее перекодировку в символьный текст такой же длины, имеющий алфавит определенного конечного размера. Это и было проделано в данной работе для обменного курса €/$ и курса индекса Ыаэбад, что по-
№ 3(33) 2011
зволило выявить в таких рядах необнаруженную ранее периодичность.
Для того чтобы создать метод поиска скрытой периодичности в числовых рядах, не зависящий от способов перекодировки, применили непараметрический критерий серий, что позволило разработать метод поиска скрытой периодичности в числовых последовательностях, который во всех чертах подобен информационному разложению, однако не требует перекодировки числовой последовательности в символьную. Мы назвали этот метод «циклическим разложением». В данном исследовании при помощи циклического разложения подтверждено существование скрытой периодичности в обменном курсе €/$ и в курсе индекса Ыаэбад.
1. Методы и алгоритмы
1.1. Метод информационного разложения
Метод информационного разложения был подробно изложен авторами настоящей статьи ранее в публикациях [4; 5], поэтому здесь изложим его очень кратко. Для построения спектра информационного разложения символьной последовательности используется совокупность взаимных ин-формаций между исследуемой символьной последовательностью и набором искусственных символьных периодических последовательностей. Пусть задана символьная последовательность в = Гене-
рируем набор символьных последовательностей а(/) с периодами / от 2 до N/4 такой же длины, как и символьная последовательность в. В последовательностях а(/) в качестве символов выступают числа. Например, символьная последовательность а(2) с периодичностью длиной в 2 символа имеет вид: 1,2,1,2,1,2,1,2,1,2,1,2,1,2,...; длиной в три символа а(3) = 1,2,3,1,2,3,1,2,3,1, 2,3,1,2,3,...; длиной в л/2 символов а(л/2) = = 1,2,... л/2,1,2,...,л/2,1,2...,л/2.... Далее заполняем матрицу М, элементы которой показывают число совпадений символов между
искусственной периодическои и изучаемой символьной последовательностями. Размерность матрицы М — (л • к), где п показывает длину периода используемой искусственной периодической последовательности, а к представляет собой размер алфавита изучаемой символьной последовательности. После заполнения матрицы М можно определить взаимную информацию между последовательностью а (/) и последовательностью в как:
!{п,к) = Х Xm(i, j) In m(i, j) -
/= 1 ;=i
-¿x(/)lnx(/)-¿y(i) In у(i) + N In N,
i=1 /=1
(1)
где N — длина изучаемой символьной последовательности; х(/), / = 1,2,...,л частоты
символов 1,2.....л в последовательность а(/);
у(у'),У = 1,2,...Л частоты символов в изучаемой символьной последовательности в.
Величина 2/(л, к) распределена как %2 с числом степеней свободы, равным произведению (л-1)-(^-1) [10]. Однако нужно учесть, что величина 2/(л, к) начинает отклоняться от распределения %2, если значения элементов матрицы М становятся меньше, чем 10. Чтобы учесть такое отклонение при работе в условиях малой выборки, использовался метод Монте-Карло при оценке статистической значимости периодичности, в результате применения которого производился переход от статистики 2/(л, к) к статистике 7(л ), имеющей приблизительное стандартное нормальное распределение.
Z (л) =
10(пк)- 1(п, к) jD(l(n,k)) '
(2)
где /0(л,к) — значение, рассчитанное по формуле (1) для последовательности S; /(л,к) и D(l(n,k)) показывают среднее значение и дисперсию величины /(л, к) для множества случайных матриц с такими же суммами х{/') и у(Д как и в исходной матрице М{п,к) [4; 5]. В дальнейшем изложении
10
№ 3(33) 2011
под ИР будем понимать значения Z(n), рассчитанные для различных длин периода п.
1.2. Метод квантования символьной последовательности в числовую
В целях применения метода ИР для анализа числового ряда производилась перекодировка числовой последовательности в символьную с алфавитом из log2/V + 1 букв, где N — длина символьной последовательности. Определялся минимальный и максимальный элемент числового ряда, после чего расстояние от минимального до максимального элементов разбивалось на log2/V + 1 интервалов, таких, чтобы число элементов ряда в каждом интервале равнялось приблизительно N/(\ogzN + 1). В том случае, если числовой ряд содержал множество одинаковых значений, границы интервалов варьировались таким образом, чтобы все одинаковые значения ряда кодировались одним и тем же символом.
1.3. Алгоритм поиска скрытой периодичности с использованием циклического разложения
В случае числовой последовательности Т = t^tz...tN уже нельзя заполнить матрицу М(i,j), как это сделано в п. 1.1, так как последовательность Т не содержит символов. Однако можно разложить последовательность Г на п подпоследовательностей R(j) = r(1,/), r(2,j)..., каждая из которых могла бы формировать столбец / матрицы М(/',/) в случае, если последовательность Т была бы символьной. В таком случае в подпоследовательность R(j) будут входить числа, находящиеся на позициях к = j+nl последовательности Т, I = 0,1,2,...,L, где L = N/n -1. Далее делаем вывод о том, является ли функция распределения подпоследовательностей R(j) идентичной друг другу. В случае присутствия периодичности в последовательности Гдлинойп функции распределения подпоследовательностей R(j) будут различны, а в случае отсутствия периодичности длиной п в последовательности Гони
будут подобны. Задача усложняется тем, § что невозможно сделать предположения от- ^ носительно вида функций распределения ^ в подпоследовательностях R(j), поэтому для и проверки гипотезы о подобии функции рас- | пределения подпоследовательностей R(j) Ц удобно использовать непараметрический ^ критерий. На основе критерия далее будет ^ создана интегральная количественная мера различия функций распределения во всех подпоследовательностях R(j).
С целью оценки расхождения двух функций распределения удобно применить непараметрический критерий Вальда-Вольфо-вица или же критерий серий [11]. Он применяется для проверки гипотезы Н0, утверждающей, что две группы данных представляют случайные независимые выборки с объемами п1 и пг из одной генеральной совокупности, т.е. функции распределения для этих двух выборок не отличаются друг от друга. Результаты наблюдений записываются в виде вариационного ряда объединенной выборки, а принадлежность данных к той или иной группе определяется с помощью кодирующей переменной, принимающей два значения (0 и 1). Полученную таким образом последовательность назовем последовательностью кодов. Серией в последовательности кодов называется всякая подпоследовательность, состоящая из одинаковых кодов и ограниченная противоположными кодами либо находящаяся в начале или конце исходной последовательности. Например, в последовательности кодов 01000111100 имеется пять серий: (0), (1), (ООО), (11111), (00). Статистикой критерия является число серий N1 в последовательности кодов. Если гипотеза Н0 верна, то обе выборки должны быть хорошо перемешаны в общем вариационном ряду и число серий N1 должно быть достаточно большим. Если же выборки получены из генеральных совокупностей с разными распределениями, различающимися средними значениями или разбросом, то число серий N1 сравнительно невелико. Для больших объемов выборок (п1>20 и/или пг>20)
№ 3(33) 2011
для проверки гипотезы Н0 можно использо-ватьстатистику W(nvп2) [11]:
[N1-
W (nv пг) = ■
+1
Vn1 + пг
2 2
2п1пг (2п1п2 - п1 - пг ) | + п2 )2 (п, + п2 -1)
(3)
Если гипотеза Н0верна, то пг) имеет приблизительно стандартное нормальное распределение со средним значением, равным 0, и дисперсией, равной 1. Значение W{nvпг), определяемое по формуле (3), может принимать как положительные, так и отрицательные значения. На практике удобно рассматривать такие серии, объем которых будет близок или равен друг другу (п1 = пг), так как точность формулы (3) возрастает. В этом смысле критерием серий удобно сделать вывод о подобии функций распределения двух подпоследовательностей Я(/) и Я(/')
(/' = 1,2.....л;./' = /'+ 1,...,п), так как они имеют
один и тот же объем. В случае случайной последовательности Г функции распределения в подпоследовательностях Я(/) и Я(/') будут близки между собой, и значение Сбудет около 0. Если же в последовательности Т наблюдается периодичность, то функции распределения в подпоследовательностях Я(/') и Я(У) будут различны, число серий N1 —сравнительно небольшим и 1Ж—отрицательным числом. Например, рассмотрим последовательность (1234567)30, в которой последовательность 1234567 повторяется 30 раз. В таком случае последовательности Я(1) = (1)30, Я(2) = (2)30и т.д., и число серий при сравнении любых двух рядов равно двум. Для случайной последовательности, где будут встречаться только те же числа, это число серий значительно больше. Чтобы ввести меру расхождения распределений между последовательностями Я(/') (/'= 1,2.....л), подсчитаем сумму:
* = ££ w (/, у),
/=1 i=/+1
где W{i,у) рассчитывается по формуле (3) для последовательностей Я(I) и ВЦ). Чтобы оценить статистическую значимость величины X, также как и в случае метода ИР [4-5], используем метод Монте-Карло, применение которого связано с тем, что при относительно небольших значениях п1 и пг функция распределения величины W(nvл2) может существенно отличаться от нормальной. Чтобы свести к минимуму отклонения, генерируем множество й {К) случайных последовательностей путем случайного перемешивания чисел в последовательности Т [4-5]. К есть объем множества в. Для каждой последовательности из множества в определяем подпоследовательности Я(/) (/ = 1,2,...,л) и величину X по формуле (4). Далее определяем для множества значений X среднее значение и дисперсию и рассчитываем величину:
V =
* (G) - X0 4D(X{G)) '
(5)
(4)
гдеХ0 — значение, найденное по формуле (4) для исходной числовой последовательности. Величина I/рассчитывалась для значений длины периода n от 2 до N/A. В результате вычислений получаем спектр значений V{n), который полностью аналогичен введенному ранее спектру информационного разложения Z(n) [4-5]. Предлагаемый метод может быть назван «циклическим разложением», так как при поиске периода длиной п анализируемая последовательность Т циклически раскладывается на п подпоследовательностей fî(/).
На значения спектра V(n) влияют два фактора. Во-первых, отличие в виде функций распределения последовательностей fî(/) (/ = 1,2.....л). Во-вторых, различие
в средних значениях рядов fî(/) (/ = 1,2.....л)
при одном и том же виде функций распределения последовательностей R(i). В этом смысле методом циклического разложения предпочтительно анализировать стационарные ряды, в которых отсутствует постоян-
12
№ 3(33) 2011
ный тренд. При наличии постоянного тренда средние значения у рядов Я(/') могут различаться, тогда как периодичность может отсутствовать, поэтому для применения метода циклического разложения желательно рассматривать ряд х(/) = Г(/) - Г (/ -1), в котором постоянный тренд отсутствует.
1.4. Оценки статистической значимости периодов при проведении преобразования Фурье
Преобразование Фурье рассчитывает для числового ряда интенсивность спектральной плотности для набора ортогональных длин периодов [1]. Однако с целью сравнительного изучения методов циклического разложения и информационного разложения с методом преобразования Фурье желательно рассматривать не спектральную интенсивность, а величину Р = -V, определяемую по формуле (5). Чтобы построить такой спектр, случайным образом перемешивались значения анализируемого числового ряда без изменения самих значений ряда. Получился числовой ряд такой же длины, как и исходный, и к нему применено преобразование Фурье. Всего было проделано 1000 таких перемешиваний, и в результате для интенсивности каждой ортогональной длины периода построили спектр из 1000 значений. Этот спектр позволил установить среднее значение и дисперсию для интенсивностей для различных длин периодов при проведении преобразования Фурье. В итоге для каждой интенсивности определялось значение Р(л) (л — длина периода) и получали для преобразования Фурье спектр, идентичный спектрам, полученным в целях информационного и циклического разложения.
1.5. Разработка программного обеспечения и проведение расчетных работ
С целью проведения расчетных работ по вышеописанным алгоритмам было разработано программное обеспечение на язы-
ке Fortran, выбор которого связан с тем, что разработанные алгоритмы, в частности процедура подсчета статистической значимости методом Монте-Карло, требуют большого числа алгебраических операций. Язык программирования Fortran в целях решения этих задач может создавать оптимальные программы, справляющиеся с задачами за наиболее короткое время. В результате были созданы программные комплексы для расчетов функций Z{n), V(n) и F(n). Вычисления проводились на компьютерном кластере, который состоял из 110 процессоров типа Intel Р4 2.4 GHz. При распараллеливании использовался интерфейс передачи сообщений MPI. Распараллеливание заключалось в том, что расчеты величин Z{n), V(n) и F(л) для различных л выполнялись на разных процессорах. Затем результаты по всем длинам периодов объединялись для получения общего спектра ИР, циклического разложения или же преобразования Фурье. Использование параллелизма при программной реализации описанных алгоритмов позволило вычислять спектры Z(л), V(n) и F(л) для л от 2 до N/4 для числовой последовательности длиной в несколько тысяч элементов не более чем за 1 мин.
2. Анализ результатов
2.1. Искусственные числовые периодические ряды
С целью контроля была проанализирована искусственная периодическая последовательность, в которой числовой период 1234567 представлен 30 раз. Спектр V{л) для этого временного ряда, полученный при помощи метода разложения по сериям, показан на рис. 1а, из которого видно, что значение 1/(7) — наибольшее в спектре, оно равно 38,5. Аналогичный спектр получили и в случае использования метода ИР со значением Z(7) около 39. В данном числовом ряду методы циклического разложения и информационного разложения обнаруживают и кратные 7 другие периоды, но они явля-
№ 3(33) 2011
ются наведенными периодами от периода длиной 7.
В целях получения сопоставимого со спектрами У(л) и ¿(п) спектра преобразования Фурье были проведены 1000 преобразований Фурье для числовых рядов, полученных случайным перемешиванием числового ряда (1234567)30, и затем для полученных случайным образом числовых рядов проводилось преобразование Фурье и определялась интенсивность разложения для различных длин периодов. Полученные спектры для случайных рядов служили основой подсчета среднего значения и дисперсии для интенсивности для всех длин периодов, и затем для каждой длины периода определялось значение Р. Полученный таким образом спектр показан на рис. 1 б. На спектре видно, что преобразование Фурье указывает на существование периодов, равных 2,34; 3,47; 3,53; 6,93 и 7,17, со статистическими значимостями, равными 5,87; 5,61; 3,32; 14,08 и 4,64 соответственно. Однако реально в анализируемом числовом ряду присутствует только период, равный 7, что указывает на разложение статистической значимости длинных периодов по статистическим значимостям более коротких периодов [4-5], часто реально отсутствующих в числовом ряду. Это явление затрудняет выявление скрытой периодичности из-за
40 п
-10-1-,-,-,-,-,-,-,-,-,
0 10 20 30 40 50 60 70 80 п
Рис. 1. Применение метода циклического для поиска периодичности е
уменьшения статистической значимости истинного периода.
Затем была проанализирована искусственная последовательность, содержащая период длиной в 7 чисел, который можно записать так: (1/14) (2/13) (3/12) (4/11) (5/10) (6/9) (7/8)30. Последовательность тоже имеет длину в 210 чисел, но в ней в каждом положении периода возможно присутствие двух чисел с равной вероятностью. Например, в ряду Я( 1) с вероятностью 0,5 могут быть число 1 или же 14, в ряду Я(2) с вероятностью 0,5 могут быть числа 2 или же 13 и т. д. Ясно, что средние значения для
всех рядов Я(/), / = 1,2.....л будут равны 7,5.
Совершенно естественно, что с подобным периодом возможен не один числовой ряд, а некоторое их множество. Датчиком случайных чисел была сгенерирована одна из последовательностей, содержащих этот период, и проанализирована методом циклического разложения, информационного разложения и Фурье-анализом. На рисунке 2 показаны функции У{л), л) и спектр Р (л) для разложения Фурье. Как видно из рис. 2а, б, методы циклического и информационного разложения выявляют данную периодичность, хотя уровень статистической значимости из-за размытия периода стал заметно меньше. Фурье-преобразование (рис. 26) не способно обнаружить пе-
п
разложения (а) и преобразования Фурье (б) временном ряду (1234567)30
№ 3(33) 2011
риодичность. Это означает, что в том случае, если средние значения для каждого
ряда Я(/), ¡= 1,2.....л будут равны, то Фурье-
преобразование не сможет выявить данный период. Пример демонстрирует, что для таких рядов Т, где средние значения у рядов Я(/') будут близки, а их функции распределения различны, методы циклического и информационного разложения являются более мощным средством выявления периодичности, чем преобразование Фурье или подобные ему методы. Далее покажем некоторые примеры, где подобная периодичность обнаруживается методом разложения на серии и методом информационного разложения.
п
2.2. Периодичность некоторых финансовых рядов
2.2.1. Временной ряд для индекса Nasdaq
Авторами была исследована периодичность финансового ряда, представляющего собой дневные значения финансового индекса Nasdaq, полученные с сайта http://www.finam.ru за 2004-2005 гг. С целью исключения влияния тренда на выявление периодичности методом циклического разложения был преобразован исходный числовой ряд для индекса Nasdaq t(/), / = 1,731 в ряд х (/') = t (/) - t (/-7). Здесь символ /' показывает конкретные дни в период с 1 января 2004 г. по 31 декабря 2005 г. В тех
п
п
Рис. 2. Выявление периодичности во временном ряду (1/14) (2/13) (3/12) (4/11) (5/10) (6/9) (7/8)30при помощи метода циклического разложения (а), информационного разложения (б)
и преобразования Фурье(в)
№ 3(33) 2011
случаях, когда значения Г(/') или Г(/-1) отсутствовали (торги не проводились), значение х{/) тоже отсутствовало, что показано в числовом ряду с помощью символа «-». Для дальнейшего анализа пробелы заполнялись случайным образом числами из ряда х'{/') длиной /, полученного из ряда х{/') исключением всех элементов, содержащих «-». Далее генератором случайных чисел генерировалось число rand от 1 до /. Если значение х (rand) отсутствовало, то генерировалось новое случайное число. Затем значение х'(rand) подставлялось в первый элемент х{/), равный «-». После этого генерировалось новое случайное число и заполнение элементов х{/'), равных «-», продолжа-
п
лось до полного их исчерпания. Полученный ряд х(/') переводился в символьную последовательность в соответствии с алгоритмом, приведенным в пункте 1.2, после чего ряд x{i) анализировался методом циклического разложения и методом преобразования Фурье, а его символьный аналог изучался методом информационного разложения. Результаты показаны на рис. 3, из которого видно, что методы циклического разложения и информационного разложения обнаруживают во временном ряде для индекса Nasdaq период длиной 7 дней. Характерно, что на спектральной плотности, построенной с помощью метода разложения Фурье, данный период не обнаруживается.
п
6 -
4 -
2 -
О -
-2 -
10
100
Рис. 3. Применение методов циклического выравнивания (а), информационного разложения (б) и преобразования Фурье (в) для анализа разностного временного рядах(/) = t(i) - t(i-1) для финансового индекса Nasdaq за 2004-2005 гг.
16
№ 3(33) 2011
6 4
V 2
О -2 -4
14
12 -10 -8 -6 -4 -2 -О --2 --4 --6 -
со ё
I
I
50 100 150 200 250 л
50 100 150 200 250 300 л
6 п
4 -
2 -
О -
-2 -
-4
10
100
Рис. 4. Применение методов циклического выравнивания (а), информационного разложения (б и преобразования Фурье (в) с целью анализа временного ряда разностного временного ряда х(/) = t{i)-t{i-^)для обменного курса €/$ за 2004-2005 гг.
2.2.2. Временной ряд для валютного курса обмена €/$
Авторами было проведено исследование, описанное в п. 2.2.1, для курса €/$. Временной ряд был взят с сайта http://www.finam.ru. Циклическое разложение, информационное разложение и спектр преобразования Фурье показаны на рис. 4. Из рисунка 4а и 46 видно, что этот временной ряд имеет период, кратный 7 дням (14 или 7 дней), который не выявляется при использовании преобразования Фурье.
Для того чтобы убедиться, что случайное заполнение пробелов не вносит искажений в полученные результаты и не ведет к созданию периода длиной 7 дней, были проделаны два вида расчетов. Во-первых, выбрали период с 9 февраля по 12 августа 2004 г., когда торги не проводились только в каждое воскресенье, т.е. каждое 71, / = 1,2... ряда отсутствовало. В данном случае в ряду х (I) будет отсутствовать каждое 7/ и 7/ + 1 значение, и эти элементы ряда будут содержать символ «-». Затем исключили из рядах(/')
№ 3(33) 2011
б -
4 -
V 2 -
О -
-2 -
ci
10
100
! s
I 8.
е
Si £
»
I
ë
0 ?
1 is
I
I
I I
CQ й GQ
Q g
IE
oo
s
u
Q
IS «
s?
t
4S
!
n
ë
Рис. 5. Применение циклического разложения
(□) и преобразования Фурье (и) с целью выявления периодичности разностного ряда для курса обмена €$ с пропущенными данными по выходным дням (суббота и воскресенье)
с 9 февраля по 12 августа 2004 г. Отчетливо виден период, равный 5 дням, выявляемый циклическим разложением
каждое 7/ и7/ + 1 значение и получился ряд без незаполненных элементов. В таком случае должен наблюдаться период, равный 5 дням, при применении метода циклического разложения к полученному ряду. Результаты показаны на рис. 5.
Как видно из рис. 5, циклическое разложение (информационное разложение дало
ю -,
8 -
б -
4 -
2 2 -
0 -
-2 -
-4 -
-6 -
аналогичный результат) показало присутствие периода, равного 5 дням, а преобразование Фурье не выявило статистически значимого периода в данном ряду. Выявленный период с учетом исключенных 2 дней в неделю соответствует периоду, показанному на рис. 3. Во-вторых, анализировалась периодичность ряда х(/) за 2004 и 2005 гг. посредством преобразования ряда х(/) путем исключения точек, содержащих символ «-». Для циклического разложения можно построить спектр V(n), если не включать точки, содержащие символ «-» в ряды R{/'). В этом случае игнорируем значения ряда, которые были пропущены. Результаты такого применения метода циклического разложения к курсу индекса Nasdaq и к курсу обмена €/$ показаны на рис. 6, где четко виден период 7 дней. Дополнительный анализ показывает, что выявленный период не связан с отсутствием данных по воскресеньям и в некоторые субботы, а обусловлен разными видами распределений числовых данных в различные дни недели.
Заключение
Метод циклического и информационного разложения наиболее эффективен для по-
10 -, 8 -б -4 -2 -0 --2 --4 -
50 100 150 200 250 п
50 100 150 200 250 п
Рис. 6. Применение циклического разложения в целях выявления периодичности разностного ряда для курса обмена €/$ (а) и индекса Nasdaq (б) посредством пропуска значений по выходным дням (суббота и воскресенье) за 2004 и 2005 гг. Отчетливо виден период, равный 7 дням, выявляемый циклическим разложением
18
№ 3(33) 2011
иска периодичности в таком числовом ряду х(/), / = 1,2где средние значения подпоследовательностей Я(/), / = 1,2.....п отличаются незначительно, тогда как функции распределения числовых рядов R{/') отличаются значительно (N-длина анализируемого числового ряда, n-длина периода). Наиболее выражено такое явление в числовых рядах финансовой природы. Различие распределений в последовательностях Я(/) может быть связано с различным поведением людей на бирже в различные дни недели [12-14]. Было обнаружено, что обменные курсы всех основных валют и мировых индексов имеют период длиной 7 дней. В настоящей работе это продемонстрировано для обменного курса €/$ и индекса Nasdaq. Авторы предполагают, что присутствие такой периодичности связано с различным психологическим поведением человеческих сообществ в различные дни недели.
Считаем, что обнаружение периодичности в финансовых рядах является бесспорным успехом методов циклического и информационного разложения по сравнению с другими применяемыми математически методами [4-5]. Периодичность длиной 7 дней наблюдается во всех временных интервалах, а не только в 2004-2005 гг. Просто в 2004-2005 гг. она оказалась наиболее статистически значимой (наибольшие значения Z(n) и V(n). Следует отметить, что финансовые ряды стали третьим примером последовательностей, где метод информационного разложения обнаруживает скрытую периодичность, которая не выявляется преобразованием Фурье и всеми другими использованными методами. Ранее скрытая периодичность была обнаружена авторами в аминокислотных и нукпеотидных последовательностях, а также в поэтических текстах [4-9]. Полагаем, что и в некоторых числовых рядах другой природы (помимо финансовых рядов) подобный эффект может быть выявлен, особенно в тех рядах, которые связаны с деятельностью человека и его сознательным или же бессознательным выбором.
Список литературы
1. Durbin R., Eddy S. R., Krogh A., Mitchison G. Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids. Cambridge University Press, 1999.
2. Korotkov E. V., Korotkova M. A., Kudryash-ov N. A. Information Decomposition Method for Analysis of Symbolical Sequences // Physical Let-tersA. 2003. Vol. 312. P. 198-210.
3. Korotkov E. V., Korotkova M. A., Tulko J. S. Latent Sequence Periodicity of Some Oncogenes and DNA-binding Protein Genes//CABIOS. 1997. Vol. 13. P. 37-44.
4. Korotkova M. A., Korotkov E. V., Rudenko V. M. Latent Periodicity of Protein Sequences // Journal of Molecular Modelling. 1999. Vol. 5. P. 103-115.
5. KullbackS. Information Theory and Statistics. New York: Wiley, 1959.
6. Laskin A. A., Kudryashov N. A., Skryabin K. G., Korotkov E. V. Latent Periodicity of Serine-Threonine and Tyrosine Protein Kinases and Other Protein Families // Comput Biol Chem. 2005. 29:3. P. 229-243.
7. Mandelbrot В. B. Fractals and Scaling in Finance. Springer. 1997.
8. Mantegna R. N., Stenley H. E. An Introduction To Econophysics: Correlations and Complexity in Finance. Cambridge University Press, 2000.
9. Peters E. E. Chaos and Order in the Capital Markets. John Wiley & Sons, 1996.
10. Sheskin D. J. Handbook of Parametric and Non-parametric Statistical Procedures, Second Edition. Chapman & Hall/CRC, 2000.
11. Stoica P., Moses R. Introduction to Spectral Analysis. NJ: Prentice Hall, 1997.
12. Turutina V. P., Laskin A. A., Skryabin K. G., Kudryashov N. A., Korotkov E. V. Latent Periodicity of Many Protein Families // Biochemistry. 2006. 71. P. 18-31.
13. Астафьева H. M. Вейвлет-анализ: основы теории и примеры применения //Успехи физиче-скихнаук. 1996. Т. 166. С. 1145-1170.
14. Короткое Е. В., Короткова М. А., Френкель Ф. Е., Кудряшов Н. А. Информационный подход к поиску скрытой периодичности в символьных последовательностях II Молекулярная биология. 2003. №37. С. 436-451.