Научная статья на тему 'Помехоустойчивость методов прогнозирования выбросов динамических рядов с долговременной зависимостью'

Помехоустойчивость методов прогнозирования выбросов динамических рядов с долговременной зависимостью Текст научной статьи по специальности «Медицинские технологии»

CC BY
39
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОМЕХОУСТОЙЧИВОСТЬ / ДОЛГОВРЕМЕННАЯ ЗАВИСИМОСТЬ / ОПТИМАЛЬНЫЙ ФИЛЬТР / ПРОГНОЗИРОВАНИЕ ВЫБРОСОВ / МУЛЬТИФРАКТАЛЬНЫЕ МОДЕЛИ / NOISE ROBUSTNESS / LONG-RANGE DEPENDENCE / OPTIMAL FILTER / BURSTS PREDICTION / MULTIFRACTAL MODELS

Аннотация научной статьи по медицинским технологиям, автор научной работы — Богачёв Михаил Игоревич, Маркелов Олег Александрович

Рассмотрено прогнозирование выбросов динамических рядов с фрактальными свойствами относительно фиксированного порога в присутствии аддитивного "белого" гауссовского шума. Проведено сравнение оптимального линейного прогнозирования и двух квазиоптимальных нелинейных методов прогнозирования динамических рядов. Показано, что метод оптимального линейного прогнозирования не уступает нелинейным методам при доминирующей линейной составляющей и распределении шума, значительно более узком по сравнению с распределением данных, а при отношении "сигнал/шум" 2…5 в указанных условиях даже имеет преимущество. В других случаях целесообразно применять нелинейные методы, например метод интервальных статистик или метод распознавания предиктора.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по медицинским технологиям , автор научной работы — Богачёв Михаил Игоревич, Маркелов Олег Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Noise robustness of extreme events predictors in long-range correlated series

Prediction of bursts in data series with fractal properties in the presence of additive "white" Gaussian noise is considered. Comparing of optimum linear and two quasi optimum non-linear prediction methods of data series is carried out. It is shown that the method of optimum linear prediction doesn't concede to nonlinear methods when linear dependence dominates and noise distribution much more narrow in comparison with distribution of data, and in case of the relation "signal/noise" 2 … 5 in the specified conditions even has advantage. In other cases it is expedient to apply non-linear methods, for example, a method of interval statistics or a method of a predictor recognition.

Текст научной работы на тему «Помехоустойчивость методов прогнозирования выбросов динамических рядов с долговременной зависимостью»

УДК 681.518.25, 519.21

М. И. Богачёв, О. А. Маркелов

Санкт-Петербургский государственный электротехнический

университет "ЛЭТИ"

Помехоустойчивость методов прогнозирования

выбросов динамических рядов с долговременной зависимостью

Рассмотрено прогнозирование выбросов динамических рядов с фрактальными свойствами относительно фиксированного порога в присутствии аддитивного "белого" гауссов-ского шума. Проведено сравнение оптимального линейного прогнозирования и двух квазиоптимальных нелинейных методов прогнозирования динамических рядов. Показано, что метод оптимального линейного прогнозирования не уступает нелинейным методам при доминирующей линейной составляющей и распределении шума, значительно более узком по сравнению с распределением данных, а при отношении "сигнал/шум" 2...5 в указанных условиях даже имеет преимущество. В других случаях целесообразно применять нелинейные методы, например метод интервальных статистик или метод распознавания предиктора.

Помехоустойчивость, долговременная зависимость, оптимальный фильтр, прогнозирование выбросов, мультифрактальные модели

Известно (см., например, [1]), что долговременная зависимость (ДВЗ) свойственна различным динамическим рядам естественного происхождения. Несмотря на высокую популярность математических моделей с ДВЗ при описании многих природных процессов зачастую такие модели не способны в полной мере отражать наблюдаемые колебания. В регистируемых данных помимо ДВЗ-составляющей, как правило, присутствуют регулярные тренды, кратковременные зависимости, а также случайные составляющие. Последние могут являться и неотъемлемым свойством порождающей системы, и обусловливаться инструментальной погрешностью регистрирующей аппаратуры. При прогнозировании выбросов случайная составляющая независимо от своего происхождения неинформативна и проявляется лишь косвенным образом, снижая вероятность правильного прогнозирования при фиксированной вероятности ложной тревоги.

Настоящая статья посвящена анализу помехоустойчивости методов прогнозирования динамических рядов с ДВЗ с использованием ее линейной и нелинейной составляющих, а также кратковременной зависимости. Представленные результаты развивают полученные ранее [2] оценки прогнозируемости данных классов динамических рядов в отсутствие аддитивных шумов.

Формально-математическое описание динамических рядов с долговременной зависимостью чаще всего сводится к использованию монофрактальных моделей, отражающих только линейную составляющую ДВЗ, и мультифрактальных моделей, отражающих также и нелинейную составляющую. Для синтеза монофрактальных данных использован алгоритм, основанный на преобразовании Фурье исходной последовательности, домножении коэффициентов Фурье на убывающую степенную функцию 12 (Н = 1 — у/2 - показатель Хёр-

ста; 0 < у < 1 - параметр автокорреляционной функции процесса К т ~ т ^ и последующем обратном преобразовании Фурье [3]. Для синтеза мультифрактальных данных исполь-© Богачёв М. И., Маркелов О. А., 2012 15

Известия вузов России. Радиоэлектроника. 2012. Вып. 5======================================

зован алгоритм биномиального мультипликативного каскада [4]. Управление свойствами линейной и нелинейной составляющих ДВЗ в формируемой реализации проводилось изменением параметров распределения множителей в указанном каскаде. Более подробно вопросы управления параметрами мультипликативного каскада рассмотрены, например в работе [5].

Для стационарных ДВЗ-процессов с неотрицательной АКФ показатели Хёрста 0.5 < Н < 1, при этом Н — 0.5 соответствует "белому" шуму, а // > 1 - очень медленно метающемуся процессу, напоминающему тренд Н -1 является границей стационарности процесса). В статье представлены результаты для Н = 0.5, 0.8 и 0.98. В модели мультипликативного каскада при Н = 0.5 наблюдается исключительно нелинейная зависимость, а с ростом Н происходит постепенная замена нелинейной зависимости линейной (см. например, [6]).

Прогнозирование выбросов динамических рядов проведено тремя методами: методом оптимального линейного прогнозирования (ОЛП) [7], методом интервальных статистик (ИС) [8] и методом распознавания (характерного) предиктора (РП) [9]. Указанные методы подробно рассмотрены в работе [2], в связи с чем их описание в настоящей статье опущено. Параметры методов выбраны теми же, что и в [2], однако в отличие от последней, в настоящей статье не использован метод полиномиальной экстраполяции, в большинстве случаев существенно уступающий другим методам прогнозирования даже в отсутствие шумов.

Для количественного сравнения построены характеристики помехоустойчивости прогнозирования при добавлении к сформированным ДВЗ-рядам аддитивного "белого" гауссовского шума (АБГШ). Поскольку в качестве прогнозируемого события рассматривалось превышение ДВЗ-процессом фиксированного порога Q (выброс), отношение "сигнал/шум" определялось как отношение минимальной амплитуды интересующего сигнала, равного Q, к среднеквадратическому отклонению шума а. В целях унификации задания порога Q при существенно различных распределениях ДВЗ-процесса фиксировались средние значения интервалов между превышениями Ед.

На рис. 1 приведены характеристики помехоустойчивости, полученные при прогнозировании монофрактальных (а-в) и мультифрактальных (г-е) динамических рядов для показателей Хёрста Н — 0.5 (а, г), Н — 0.8 (б, д) и Н — 0.98 (в, е) и при среднем интервале повторения выбросов Лд=10. Сплошной линией представлены результаты для ОЛП,

штриховой линией - для метода РП, штрихпунктиром - для метода ИС.

Из рис. 1 следует, что в присутствии только нелинейной составляющей ДВЗ Н = 0.5 эффективными ожидаемо оказываются нелинейные методы прогнозирования (см. рис. 1, г). При выраженной линейной зависимости и больших значениях отношения "сигнал/шум" (в режиме насыщения) все рассмотренные методы показывают схожую эффективность, что согласуется с данными [2]. Небольшой выигрыш наблюдается при использовании нелинейных методов для Н = 0.98, что может объясняться паразитной нелинейностью, возникающей в алгоритмах синтеза данных вблизи порога нестационарности. Однако по мере увеличения а шума при (2/ъ « 5 эффективности методов РП и ИС существенно снижаются, в то время как метод ОЛП сохраняет почти неизменную эффективность вплоть до

В В

0.75 - 0.75 -

0.5 - 0.5 -

0.25 __ 1— _ I- 0.25 Г-..... .'1 1 1

0 5 10 а 15 0/ст о 5 10 б 15 <2/

В В

0.75 0.5 0.75 0.5 (Г

0.25 "1 1 1 1 0.25 1 • : 1 1 1

0 5 10 15 0/ст 0 5 10 15 в/

В 0.75 -0.5 -0.25 -

0

В 0.75 0.5 0.25

10

в

15

0

д

Рис. 1

10

е

15

<2/а » 2, что можно объяснить как оптимальным учетом линейной составляющей ДВЗ, так и эффектом линеаризации нелинейной составляющей в прогнозирующем фильтре.

На рис. 2 показаны аналогичные результаты для более высокого порога, соответствующего среднему интервалу повторения выбросов Ид = 500. Из рисунка следует, что, во-

первых, прогнозируемость выбросов улучшается с повышением порога, а это согласуется с данными предыдущих исследований [2], [10]. Во-вторых, сделанные ранее выводы для Ид = 10 в целом могут быть экстраполированы и на более высокие значения порогов. Следует также отметить, что артефакт, связанный с паразитной нелинейностью, в данном случае не оказывает существенного влияния на результаты прогнозирования. Наблюдаемое на рис. 2 нарушение монотонности характеристики помехоустойчивости для метода ИС связано с его дискретной реализацией, основанной на использовании одной и той же убывающей функции вероятности выброса после каждого зарегистрированного превышения порога (более подробно см. [11]), что приводит к неточной фиксации вероятности ложной тревоги а.

В 0.75 0.5 -0.25

В В

0.75 - 0.75 -

0.5 - 0.5 "/йГ

0.25 | 1 0.25 * . 1 I 1

0 5 10 15 е/а о 5 10 15 б/

а б

В В

■ ___ — — — — —

0.75 - / ^ — — 0.75

0.5 Г 0.5 V

0.25 Г' ; 1 1 1 0.25 Т\ ': I I 1

0 5 10 15 б/а 0 5 10 15 6/

0

В 0.75 0.5 0.25

10

в

15

г

0

д

Рис. 2

10

е

15

5

5

г

5

5

г

D 0.75 0.5 0.25

D 0.75 0.5 0.25

/ г / /

10

а

15 Q/a

/

г/

-/

D 0.75 0.5 i 0.25

0

D 0.75 0.5 0.25

10

б

15 0/а

D 0.75 0.5 i 0.25

0

D 0.75 0.5 0.25

10

в

15

0

10

г

15

б/с

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

_L

10

Э

Рис. 3

15 б/а 0

10

е

Рассмотренные примеры нелинейных зависимостей основаны на анализе данных, полученных при помощи мультипликативного каскада, для которого характерно формирование реализаций с широкими распределениями данных, описываемыми логнормальными функциями (более подробно см. [4]). Однако для регистрируемых процессов естественного происхождения данный вид распределения нетипичен. Как правило, распределения наблюдаемых данных оказываются более узкими, что в общем случае снижает эффективность их прогнозирования на фоне шумов. Следовательно, рассмотренная ранее ситуация является более выигрышной с позиции прогнозирования по сравнению с большинством реальных случаев.

С целью анализа влияния ширины распределения данных при неизменном распределении шума далее рассмотрен пример, в котором распределения сигнала и шума совпадают и являются гауссовскими. Поскольку реальные распределения данных преимущественно лежат в диапазоне между указанными случаями, то при качественном согласовании полученных для них результатов выводы могут быть экстраполированы и на промежуточные ситуации.

На рис. 3 представлены кривые помехоустойчивости для модели мультифракталь-ных динамических рядов с гауссовским распределением для значений Rq =10 (а-в) и

Rq =500 (г-е) при Н = 0.5 (а, г), Н = 0.8 (б, д) и Н = 0.98 (в, е). Из анализа кривых на

рис. 3 следует, что нелинейные методы показывают лучшую прогнозируемость в сравнении с линейным методом. Однако при достаточно высоких значениях показателя Хёрста Н = 0.98 метод ОЛП находится на уровне нелинейных методов. При промежуточных значениях H наблюдается качественное отличие результатов, полученных для различных распределений данных. Таким образом, при выраженной линейной зависимости в пределах стационарности существенным фактором является ширина распределения данных, что необходимо исследовать в дальнейшем. Следует учитывать, что метод ОЛП отличается низкой вычислительной сложностью по сравнению с нелинейными методами, поэтому при прочих равных условиях его использование предпочтительно.

5

5

5

5

5

Список литературы

1. Bunde A., Havlin S. Fractals in science. New York: Springer, 1994. 298 p.

2. Богачев М. И., Маркелов О. А. К вопросу об эффективности линеаризации при оптимальном прогнозировании выбросов динамических рядов с долговременной зависимостью // Изв. вузов России. Радиоэлектроника. 2012. Вып. 3. С. 46-53.

3. Schreiber T., Schmitz A. Improved surrogate data for nonlinearity tests // Phys. Rev. Let. 1996. Vol. 77. P. 635-638.

4. Bogachev M. I., Eichner J. F., Bunde A. The effect of multifractality on the statistics of return intervals // Eur. Phys. J. Spec. topics. Vol. 181. 2008. P. 181-193.

5. Богачев М. И. Статистический анализ и прогнозирование динамики случайных процессов в телекоммуникационных сетях с использованием мультифрактальных моделей трафика // Изв. вузов России. Радиоэлектроника. 2008. Вып. 2. С. 34-45.

6. Bogachev M. I., Eichner J. F., Bunde A. On the occurence of extreme events in long-term correlated and multifractal data sets // Pure Appl. Geophys. 2008. Vol. 165. P. 1195-1207.

7. Wiener N. Extrapolation, interpolation and smoothing of time series. New York: Wiley, 1949. 166 p.

8. Statistics of return intervals between long heartbeat intervals and their usability for online prediction of disorders / M. I. Bogachev, I. S. Kireenkov, E. M. Nifontov, A. Bunde // New J. phys. 2009. Vol. 11. P. 063036 (1-18).

9. Богачев М. И. Сравнительная оценка информативности кратковременной и долговременной зависимостей трафика при прогнозировании его динамики в телекоммуникационных системах // Изв. вузов России. Радиоэлектроника. 2009. Вып. 2. С. 52-59.

10. Богачев М. И. Сравнительный анализ помехоустойчивости методов прогнозирования выбросов случайных сигналов с фрактальными свойствами при использовании информации о кратковременной и о долговременной зависимостях // Изв. вузов России. Радиоэлектроника. 2010. Вып. 1. С. 11-21.

11. Bogachev M. I., Bunde A. On the predictability of extreme events in records with linear and nonlinear long-range memory: efficiency and noise robustness // Physica A. 2011. Vol. 390. P. 2240-2250.

M. I. Bogachev, O. A. Markelov

Saint- Petersburg electrotechnical university "LETI"

Noise robustness of extreme events predictors in long-range correlated series

Prediction of bursts in data series with fractal properties in the presence of additive "white" Gaussian noise is considered. Comparing of optimum linear and two quasi optimum non-linear prediction methods of data series is carried out. It is shown that the method of optimum linear prediction doesn't concede to nonlinear methods when linear dependence dominates and noise distribution much more narrow in comparison with distribution of data, and in case of the relation "signal/noise" 2 ... 5 in the specified conditions even has advantage. In other cases it is expedient to apply non-linear methods, for example, a method of interval statistics or a method of a predictor recognition.

Noise robustness, long-range dependence, optimal filter, bursts prediction, multifractal models

Статья поступила в редакцию 15 августа 2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.