Научная статья на тему 'Быстрый алгоритм робастных оценок показателя Херста при анализе малых выборок биометрических данных и данных рынка'

Быстрый алгоритм робастных оценок показателя Херста при анализе малых выборок биометрических данных и данных рынка Текст научной статьи по специальности «Математика»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
автокорреляционный функционал / показатель Херста / малые выборки / биометрические данные / autocorrelation functional / Hurst exponent / small samples / biometric data

Аннотация научной статьи по математике, автор научной работы — Владимир Иванович Волчихин, Александр Иванович Иванов, Валерий Александрович Тихомиров, Дмитрий Викторович Тарасов

Актуальность и цели. В настоящее время показатель Херста достаточно легко интерпретируется применительно к биометрическим, медицинским и экономическим данным, однако его принято оценивать на больших выборках. Целью работы является снижение выборки реальных данных, на которых достаточно надежно может быть вычислен показатель Херста. Материалы и методы. Используется связь показателя Херста с автокорреляционными функционалами. Предложено свести задачу к оценке автокорреляционных свойств исследуемой последовательности реальных данных. Результаты и выводы. Автокорреляционные функционалы относятся к задачам квадратичной вычислительной сложности, тогда как показатель Херста имеет существенно большую вычислительную сложность и менее устойчив. Это позволяет снизить требования к объему используемой для вычислений выборки реальных данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Владимир Иванович Волчихин, Александр Иванович Иванов, Валерий Александрович Тихомиров, Дмитрий Викторович Тарасов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

A fast algorithm for robust estimates of the Hurst exponent when analyzing small samples of biometric and market data

Background. Currently, the Hurst exponent is quite easily interpreted in relation to biometric, medical and economic data, but it is customary to evaluate it on large samples. The purpose of the work is to reduce the sample of real data on which the Hurst exponent can be calculated quite reliably. Materials and methods. The connection between the Hurst exponent and autocorrelation functionals is used. It is proposed to reduce the problem to assessing the autocorrelation properties of the studied sequence of real data. Results and conclusions. Autocorrelation functionals relate to problems of quadratic computational complexity, while the Hurst exponent has a significantly higher computational complexity and is less stable. This makes it possible to reduce the requirements for the size of the real data sample used for calculations.

Текст научной работы на тему «Быстрый алгоритм робастных оценок показателя Херста при анализе малых выборок биометрических данных и данных рынка»

УДК 519.24; 004.8; 519.6

doi: 10.21685/2072-3059-2024-1-4

Быстрый алгоритм робастных оценок показателя Херста при анализе малых выборок биометрических данных и данных рынка

В. И. Волчихин1, А. И. Иванов2, В. А. Тихомиров3, Д. В. Тарасов4

1,4Пензенский государственный университет, Пенза, Россия пензенский научно-исследовательский электротехнический институт, Пенза, Россия 3Научно-производственное объединение «Развитие инновационных технологий», Тверь, Россия

1cnit@pnzgu.ru, 2ivan@pniei.penza.ru, 3info@npo-rit.ru, 4tarasovdv@mail.ru

Аннотация. Актуальность и цели. В настоящее время показатель Херста достаточно легко интерпретируется применительно к биометрическим, медицинским и экономическим данным, однако его принято оценивать на больших выборках. Целью работы является снижение выборки реальных данных, на которых достаточно надежно может быть вычислен показатель Херста. Материалы и методы. Используется связь показателя Херста с автокорреляционными функционалами. Предложено свести задачу к оценке автокорреляционных свойств исследуемой последовательности реальных данных. Результаты и выводы. Автокорреляционные функционалы относятся к задачам квадратичной вычислительной сложности, тогда как показатель Херста имеет существенно большую вычислительную сложность и менее устойчив. Это позволяет снизить требования к объему используемой для вычислений выборки реальных данных.

Ключевые слова: автокорреляционный функционал, показатель Херста, малые выборки, биометрические данные

Для цитирования: Волчихин В. И., Иванов А. И., Тихомиров В. А., Тарасов Д. В. Быстрый алгоритм робастных оценок показателя Херста при анализе малых выборок биометрических данных и данных рынка // Известия высших учебных заведений. Поволжский регион. Технические науки. 2024. № 1. С. 48-55. doi: 10.21685/2072-30592024-1-4

A fast algorithm for robust estimates of the Hurst exponent when analyzing small samples of biometric and market data

V.I. Volchikhin1, A.I. Ivanov2, V.A. Tikhomirov3, D.V. Tarasov4

1,4Penza State University, Penza, Russia 2Penza Scientific Research Electrotechnical Institute, Penza, Russia 3Scientific-production association "Razvitiye innovatsionnukh tekhnologiy" (Development of innovative technologies), Tver, Russia 1cnit@pnzgu.ru, 2ivan@pniei.penza.ru, 3info@npo-rit.ru, 4tarasovdv@mail.ru

Abstract. Background. Currently, the Hurst exponent is quite easily interpreted in relation to biometric, medical and economic data, but it is customary to evaluate it on large samples. The purpose of the work is to reduce the sample of real data on which the Hurst exponent can be

© Волчихин В. И., Иванов А. И., Тихомиров В. А., Тарасов Д. В., 2024. Контент доступен по лицензии Creative Commons Attribution 4.0 License / This work is licensed under a Creative Commons Attribution 4.0 License.

calculated quite reliably. Materials and methods. The connection between the Hurst exponent and autocorrelation functionals is used. It is proposed to reduce the problem to assessing the autocorrelation properties of the studied sequence of real data. Results and conclusions. Autocorrelation functionals relate to problems of quadratic computational complexity, while the Hurst exponent has a significantly higher computational complexity and is less stable. This makes it possible to reduce the requirements for the size of the real data sample used for calculations.

Keywords: autocorrelation functional, Hurst exponent, small samples, biometric data For citation: Volchikhin V.I., Ivanov A.I., Tikhomirov V.A., Tarasov D.V. A fast algorithm for robust estimates of the Hurst exponent when analyzing small samples of biometric and market data. Izvestiya vysshikh uchebnykh zavedeniy. Povolzhskiy region. Tekhnicheskie nauki = University proceedings. Volga region. Engineering sciences. 2024;(1):48-55. (In Russ.). doi: 10.21685/2072-3059-2024-1-4

Показатель Херста является одним из активно используемых параметров при анализе рынка [1-4] и коллективной биометрии [5]. К сожалению, эмпирический показатель Херста по умолчанию предполагает использование больших выборок из-за того, что он является степенным:

где N - размер выборки; Я - размах выборки; а - стандартное отклонение выборки; Н - степенной показатель Херста, изменяющийся в интервале от 0,5 до 1,0 для предсказуемых персистентных систем и в интервале от 0,0 до 0,5 для антиперсистентных систем с периодическим переключением рынка из состояния «медведи» в состояние «быки».

Переходя в логарифмическую форму уравнения (1), получим еще один вариант записи показателя Херста:

Вторая форма удобна для пояснения причин, по которым при анализе данных рынков и данных коллективной биометрии необходимы большие выборки. Если предположить, что логарифм нормированного размаха данных является константой, то ошибка оценки показателя будет оцениваться следующим соотношением:

То есть ошибки из-за сокращения размеров выборки реальных данных должны расти обратно пропорционально логарифму объема выборки.

Кажется, что оценка значения ошибок (3) крайне пессимистична и обрекает исследователей на накопление больших объемов данных. Возможен обходной путь решения проблемы через создание быстрых алгоритмов оценки показателя Херста [6, 7]. Этот путь состоит в отказе от попыток наблюдения нормированного размаха экспериментальных данных (1) с замещением на наблюдение поведения автокорреляционных функционалов [8].

Теоретическое обоснование такой возможности строится на том, что высоко персистентные временные ряды с высоким значением показателя

Введение

(1)

H = log(R/ o)/log( N/ 2).

(2)

AH - const/log(N/2).

(3)

Херста Н ~ 1,0 должны давать высокие значения классических автокорреляционных функционалов г(х(),х(^ — т))~1,0 при любом сдвиге данных.

В противоположном случае, когда показатель Херста минимален Н ~ 0,0, значение автокорреляционных функционалов должно иметь случайный знак при высоком значении его модуля г (х ), х(^ — т) )~±1,0 (предельно высокая

антиперсистентность). В случае, когда показатель Н ~ 0,5, автокорреляционные функционалы продолжают иметь случайный знак при малых значениях модулей г (х (), х^ — т) )~±0,0.

их

Критерий подсчета смены знаков откликов автокорреляционных функционалов

Для высокого значения показателя Херста Н ~ 1,0 должно наблюдаться малое значение вычисленного числа смены знака откликов автокорреляционных функционалов. Соответственно для нейросетевого распознавания больших значений показателя мы можем воспользоваться критерием подсчета числа наблюдаемых смен знаков у соседних отсчетов автокорреляционных функционалов.

Пример программной реализации критерия на языке программирования MathCAD для данных малых выборок в 32 опыта приведен в левой части рис. 1. В правой части рисунка приведены дискретные спектры нового критерия при воздействии на него слабо коррелированными и сильно коррелированными данными.

Рис. 1. Разделение сильно зависимых данных и данных со слабой корреляционной сцепленностью при анализе дискретных спектров подсчета числа смен знаков анализируемой последовательности

Формально из рассматриваемого критерия может быть создан искусственный нейрон, если воспользоваться выходным квантователем. Выходной квантователь должен давать состояние «1» при обнаружении сильно коррелированных данных Н ~ 0,8. Квантователь сравнивает выходные данные критерия с порогом k = 13,5. Порог расположен между спектральными линиями анализируемых данных.

Если обнаружение сильно коррелированных данных Н ~ 0,8 рассматривать как основную задачу, то искусственный нейрон будет давать значение вероятности ошибок второго рода P2 ~ 0,146. В этом случае вероятность ошибок первого рода (ошибочное принятие решения «0») составит Pi ~ 0,231. Среднее значение вероятностей ошибок первого и второго рода Рее - 0,189.

Критерий оценки суммы амплитуд выходных состояний автокорреляционных функционалов

Кроме критерия подсчета числа смены знаков значений автокорреляционных функционалов, возможно использование критерия суммирования амплитуд значений функционалов. На рис. 2,а приведена программная реализация нового критерия, на рис. 2,б - результаты численного эксперимента.

- топп(32.0.1} у «- тогт(32.0.1}

- moim(3J.0.1) х05<- (i+ z Z)-CO yOS^- (y+ z-; i-Cl.5

A

<0>

- 30S

- yOS

В fr- rsornlAT.l.'

uOS v- В''0' for 0.. 31

тй mean(x) msS 4— mean(ssOS) crx *— stdev(s) cnxS <— btdevf .'zvJS) for J 5 i.. 31 31

rOO. • 1

"I

i= 0

31

■s

- ttUEUs. -

31

nOO < y^

= 0 IrtoJ

31

rrOS V i= 1

(nOO nilB)T

а)

б)

Рис. 2. Разделение данных с высоким и средним значением показателя Херста при анализе непрерывных спектров состояний автокорреляционного функционала

Критерий построен на сдвиге данных, перемножении данных и накоплении нормированных произведений. Критерий дает непрерывные выходные данные, обладающие достаточно высокой разделимостью Р1 = Р2 ~ Рее ~ ~ 0,261. То есть непрерывный критерий слабее предыдущего дискретного критерия примерно на 42 %. Тем не менее эти два критерия хорошо дополняют друг друга из-за того, что их отклики слабо коррелированны между собой согг(2п, Аг) ~ -0,06.

Моделирование персистентных и антиперсистентных хаотических систем

Оказалось, что модель значений показателя Херста хорошо описывается теорией хаоса (теорией двухмерного броуновского движения [2, 3]). Естественно, что малый объем выборки всегда приводит к размыванию результатов оценок. На рис. 3 приведены распределения данных, полученные при моделировании трех вариантов броуновских блужданий:

- с малым показателем Херста Н ~ 0,2 при согг(х, у) ~ -0,8;

- со средним показателем Н ~ 0,5 при согг(х, у) ~ ±0,0;

- с большим показателем Херста Н ~ 0,8 при согг(х, у) ~ +0,8.

Рис. 3. Распределение данных при моделировании персистентного и антиперсистентного хаоса

Следует отметить, что рассмотренный выше искусственный нейрон инвариантен по отношению к положительно коррелированным данными Н ~ 0,8 и отрицательно коррелированным данным Н ~ 0,2. Это является одной из технических проблем синтеза быстрых алгоритмов вычисления показателей Херста на малых выборках. На данный момент очевидным является то, что автокорреляционные функционалы позволяют решить задачу в интервале показателей от Н ~ 0,5 до Н ~ 1,0 для большинства фрактальных объектов реального мира с длинной памятью и монотонной импульсной переходной функцией.

Для расширения диапазона оцениваемых показателей от Н ~ 0,0 до Н ~ 1,0 быстрыми алгоритмами на малых выборках необходимо автокорреляционные функционалы (автокорреляционные нейроны) дополнять функционалами-нейронами иного типа. Предположительно, они могут быть построены на теории броуновского движения, восстанавливающей по косвенным признакам периодичности смены знаков корреляционной сцепленности [9, 10] (периодического переключения системы в два разных состояния «медведи» и «быки»).

Еще одним решением проблемы является принудительное (внешнее) принятие решения о характере наблюдаемых пользователем процессов [11] на основании его интуитивной классификации.

Заключение

Было показано, что два простейших автокорреляционных критерия уже позволяют давать достаточно точные оценки значений показателя Херста на малых выборках в 32 опыта. Так как на сегодня известно порядка 20 автокорреляционных критериев [7], точность оценок значений показателей Херста может быть существенно увеличена. По крайней мере сегодня мы можем создавать нейросетевые предсказатели с 22-кратной выходной кодовой избыточностью. Наличие хорошо разработанной двухмерной теории хаоса (броуновского движения на плоскости), видимо, даст возможность надежно протестировать нейросетевые конструкции. Вполне возможно, что нейросетевые конструкции можно будет аттестовать по уровню их погрешностей (по уровням вероятности появления ошибок предсказаний).

Список литературы

1. Калуш Ю. А., Логинов В. M. Показатель Херста и его скрытые свойства II Сибирский журнал индустриальной математики. 2002. Т. 5, № 4. С. 29-37.

2. Петерс. Э. Хаос и порядок на рынках капитала. Новый аналитический взгляд на циклы, цены и изменчивость рынка I пер. с англ. В. И. Гусевой. M. i MKP, 2000. 333 с.

3. Mандельброт Б., Хадсон З. Л. (НЕ)послушные рынки. Фрактальная революция в финансах I пер. с англ. и ред. А. Ю. Заякина. M. ; СПб. ; Киев i Вильямс, 2006. 408 с.

4. Найман Э. Как покупать дешево и продавать дорого i пособие для разумного инвестора. M. i Альпина Паблишерз, 2011. 552 с.

5. Иванов А. И. Высокоразмерная коллективная биометрия подсознательного поведения людей на рынке и производстве i препринт. Пенза i Из-во ПГУ, 2021. 60 с.

6. Иванов А. И., Егорова Ю. Ю. Корреляционный метод быстрой оценки текущего значения показателя Херста биометрических данных и данных рынка II Нейрокомпьютеры разработка, применение. 2012. № 3. С. 26-27.

7. Иванов А. И., Золотарева Т. А. Искусственный интеллект в защищенном исполнение синтез статистико-нейросетевых автоматов многокритериальной проверки гипотезы независимости малых выборок биометрических данных i препринт. Пенза i Изд-во ПГУ, 2020. 105 с.

8. Иванов А. И. Нейросетевой многокритериальный статистический анализ малых выборок i справочник. Пенза i Изд-во ПГУ, 2022. 218 с.

9. Федер Е. Фракталы. M., 2014. № 69. 267 с. (Книжная серия «Синергетика; от прошлого к будущему»).

10. Орлов Ю. Н., Осминин К. П. Нестационарные временные ряды; Mетоды прогнозирования с примерами анализа финансовых и сырьевых рынков. M. i УРСС, 2011. 384 с.

11. Фейс К. Трейдинг, основанный на интуиции. СПб. i Питер, 2011. 240 с.

References

1. Kalush Yu.A., Loginov V.M. Hurst exponent and its hidden properties. Sibirskiy zhur-nal industrial'noy matematiki = Siberian journal of industrial mathematics. 2002;5(4)i29-37. (In Russ.)

2. Peters. E. Khaos i poryadok na rynkakh kapitala. Novyy analiticheskiy vzglyad na tsikly, tseny i izmenchivost' rynka = Chaos and order in capital markets. A new analytical look at cycles, prices and market volatility. Transí. from Eng. by V.I. Guseva. Moscow; MIR, 2000;333. (In Russ.)

3. Mandelbot B., Khadson Z.L. (NE)poslushnye rynki. Fraktal'naya revolyutsiya v finan-sakh = (NOT)obedient markets. Fractal revolution in finance. Transl. from Eng. and ed. by A.Yu. Zayakin. Moscow; Saint Petersburg; Kiev: Vil'yams, 2006:408. (In Russ.)

4. Nayman E. Kak pokupat' deshevo i prodavat' dorogo: posobie dlya razumnogo in-vestora = How to buy low and sell high: guidance for the smart investor. Moscow: Al'pina Pablisherz, 2011:552. (In Russ.)

5. Ivanov A.I. Vysokorazmernaya kollektivnaya biometriya podsoznatel'nogo povedeniya lyudey na rynke i proizvodstve: preprint = High-dimensional collective biometrics of subconscious behavior of people in the market and production: preprint. Penza: Iz-vo PGU, 2021:60. (In Russ.)

6. Ivanov A.I., Egorova Yu.Yu. Correlation method for quickly assessing the current value of the Hurst exponent of biometric data and market data. Neyro-komp'yutery: razrabot-ka, primenenie = Neuro-computers: development, application. 2012;(3):26-27. (In Russ.)

7. Ivanov A.I., Zolotareva T.A. Iskusstvennyy intellekt v zashchishchennom ispolnenii: sintez statistiko-neyrosetevykh avtomatov mnogokriterial'noy proverki gipotezy nezavi-simosti malykh vyborok biometricheskikh dannykh: preprint = Artificial intelligence in a secure design: synthesis of statistical-neural network automata for multi-criteria testing of the hypothesis of independence of small samples of biometric data: preprint. Penza: Izd-vo PGU, 2020:105. (In Russ.)

8. Ivanov A.I. Neyrosetevoy mnogokriterial'nyy statisticheskiy analiz malykh vyborok: spravochnik = Neural network multicriteria statistical analysis of small samples: reference book. Penza: Izd-vo PGU, 2022:218. (In Russ.)

9. Feder E. Fraktaly (Knizhnaya seriya «Sinergetika: ot proshlogo k budushchemu») = Fractals (Book series "Synergetics: from past to future"). Moscow, 2014;(69):267. (In Russ.)

10. Orlov Yu.N., Osminin K.P. Nestatsionarnye vremennye ryady: Metody progno-zirovaniya s primer ami analiza finansovykh i syr'evykh rynkov = Non-stationary time series: Forecasting methods with examples of analysis offinancial and commodity markets. Moscow: URSS, 2011:384. (In Russ.)

11. Feys K. Treyding, osnovannyy na intuitsii = Trading based on intuition. Saint Petersburg: Piter, 2011:240. (In Russ.)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Информация об авторах / Information about the authors

Владимир Иванович Волчихин Vladimir I. Volchikhin

доктор технических наук, профессор, Doctor of engineering sciences, professor,

президент Пензенского государственного president of Penza State University

университета (Россия, г. Пенза, (40 Krasnaya street, Penza, Russia)

ул. Красная, 40)

E-mail: cnit@pnzgu.ru

Александр Иванович Иванов

доктор технических наук, профессор, научный консультант, Пензенский научно-исследовательский электротехнический институт (Россия, г. Пенза, ул. Советская, 9)

E-mail: ivan@pniei.penza.ru

Aleksandr I. Ivanov

Doctor of engineering sciences, professor, scientific adviser, Penza Scientific Research Electrotechnical Institute (9 Sovetskaya street, Penza, Russia)

Валерий Александрович Тихомиров доктор технических наук, профессор, генеральный директор научно-производственного объединения «Развитие инновационных технологий» (Россия, г. Тверь, ул. Озерная, 14, корп. 1)

E-mail: info@npo-rit.ru

Дмитрий Викторович Тарасов

кандидат технических наук, доцент кафедры высшей и прикладной математики, Пензенский государственный университет (Россия, г. Пенза, ул. Красная, 40)

E-mail: tarasovdv@mail.ru

Valeriy A. Tikhomirov Doctor of engineering sciences, professor, CEO of Scientific-production association "Razvitiye innovatsionnukh tekhnologiy" (Development of innovative technologies) (building 1, 147 Ozernaya street, Tver, Russia)

Dmitriy V. Tarasov Candidate of engineering sciences, associate professor of the sub-department of higher and applied mathematics, Penza State University (40 Krasnaya street, Penza, Russia)

Авторы заявляют об отсутствии конфликта интересов / The authors declare no conflicts of interests.

Поступила в редакцию / Received 10.11.2023

Поступила после рецензирования и доработки / Revised 18.12.2023 Принята к публикации / Accepted 16.01.2024

i Надоели баннеры? Вы всегда можете отключить рекламу.