Научная статья на тему 'Метод условной декомпозиции эмпирических распределений и его применение к задаче анализа рядов наблюдений'

Метод условной декомпозиции эмпирических распределений и его применение к задаче анализа рядов наблюдений Текст научной статьи по специальности «Математика»

CC BY
336
64
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ РЯДОВ НАБЛЮДЕНИЙ / ЭМПИРИЧЕСКИЕ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ / МЕТОД ДЕКОМПОЗИЦИИ РАСПРЕДЕЛЕНИЙ / ЭВОЛЮЦИЯ СТАТИСТИЧЕСКИХ ПАРАМЕТРОВ / СКОЛЬЗЯЩИЕ РЯДЫ НАБЛЮДЕНИЙ / STATISTICAL CHARACTERISTICS OF A SERIES OF OBSERVATIONS / EMPIRICAL PROBABILITY DISTRIBUTION / METHOD OF DECOMPOSITION OF DISTRIBUTIONS / EVOLUTION OF THE STATISTICAL PARAMETERS / SLIDING SERIES OF OBSERVATIONS

Аннотация научной статьи по математике, автор научной работы — Журавлев Виктор Михайлович, Морозов Виталий Михайлович, Петряков Михаил Сергеевич, Самойлов Вадим Владимирович

Актуальность и цели. Одним из способов анализа рядов наблюдений является анализ эмпирических вероятностных распределений (гистограмм). Задача при таком подходе выяснение фундаментальных свойств физических процессов, ответственных за изменчивость наблюдаемых параметров физических и других систем. Одним из способов обнаружения всех действующих физических факторов в наблюдаемой системе является метод декомпозиции эмпирических распределений. Декомпозиция позволяет представить гистограмму в виде смеси, каждый из компонент которой может интерпретироваться как вероятностное распределение одного из механизмов со специфическими признаками. Стандартным подходом к декомпозиции является метод моментов в сочетании с заранее заданным набором теоретических распределений, которые выбираются до проведения самой декомпозиции. В этом случае сами признаки разделения распределения на компоненты фактически исключаются из анализа, что часто приводит к трудностям в интерпретации полученных результатов. Поэтому актуальная задача обработки рядов разработка метода декомпозиции гистограммы с помощью эмпиричесих признаков, которые непосредственно участвуют в обработке данных. Цель данной работы построение метода декомпозиции рядов наблюдений с помощью формирования эмпирических признаков разделения значений ряда на основе статистических характеристик самого ряда. Материалы и методы. Для реализации метода декомпозиции важным является требование выработки статистически устойчивых признаков, подлежащих проверке во время работы алгоритмов. Устойчивые признаки на базе самого исходного ряда наблюдений можно построить, используя те или иные статистики. Поскольку каждый признак должен относиться к каждому отдельному элементу ряда, то в данной работе используются два метода. Это метод регрессионных моделей и метод вычисления базовых статистик скользящих рядов. Результаты. Основным результатом работы является создание математических алгоритмов проведения условной декомпозиции и его применение к задаче декомпозиции эмпирических распределений ряда чисел Вольфа (ежемесячное число пятен на Солнце) и ежечасного ряда атмосферного давления за 2009 г. Найдены компоненты распределений, и на основе скользящих рядов проанализирована изменчивость параметров эмпирических распределений и эволюция априорных вероятностей. Выводы. Предложенный метод условной декомпозиции дает значительно более эффективный способ разделения гистограмм на компоненты, чем методы декомпозиции, основанные на методе моментов для теоретически заданных распределений смеси. Метод может применяться для большинства систем при условии, что сформулированы основные принципы выявления устойчивых признаков на основе самих рядов наблюдений. Показано, что для этого можно использовать как методы регрессионных моделей, так и методы вычисления базовых статистик, таких как дисперсия, для скользящих рядов наблюдений.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Журавлев Виктор Михайлович, Морозов Виталий Михайлович, Петряков Михаил Сергеевич, Самойлов Вадим Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE METHOD OF CONDITIONAL DECOMPOSITION OF EMPIRICAL DISTRIBUTIONS AND ITS APPLICATION TO THE ANALYSIS OF A SERIES OF OBSERVATIONS

Background. One of the ways to analyze a series of observations is to analyze the empirical probability distributions (histograms). The challenge with this approach is to find the fundamental properties of the physical processes responsible for the variability of the observed parameters of physical and other systems. One of the ways to identify all existing physical factors in the observed system is the decomposition method of empirical distributions. Decomposition enables a histogram to be represented as a mixture, each component of which can be interpreted as the probability distribution of one of the mechanisms; with specific characteristics. The standard approach to the decomposition is the method of moments in conjunction with a predetermined set of theoretical distributions that are chosen to undertake the actual decomposition. In this case the signs of separation are actually excluded from the analysis, which often leads to difficulties in the interpretation of results. Therefore, the topical problem of series processing is the development of a decomposition method using a histogram of empirical features that are directly involved in the data processing. The aim of this work is to construct the decomposition method, a series of observations using the empirical evidence of the formation of a number of separate values ​​based on the statistical characteristics of the series. Materials and methods. In implementation of the decomposition method there is an important requirement to generate statistically stable signs to be checked at the time of the algorithms. Persistent signs on the basis of the initial series of observations can be constructed using these or other statistics. As each characteristic must relate to each individual series element, in this study the authors used two methods. These are the method of regression models and the method of calculating the basic statistics of moving rows. Results. The main result is the creation of mathematical algorithms of conventional decomposition and its application to the decomposition of the empirical distributions of a number of Wolf numbers (monthly number of sunspots) and hourly series of atmospheric pressure in 2009. The authors found components of distributions and analyzed the variability of the parameters of empirical distributions and the evolution of the a priori probabilities using moving series. Conclusions. The proposed method of conditional decomposition gives a much more efficient method of separating components in the histogram than decomposition methods, based on the method of moments for the theoretical given mixture distributions. The method is suitable for the majority of systems, provided the basic principles of sustainable identifying features are formulated on the basis of the series of observations themselves. It is shown that for this purpose one can use both the methods of regression models and the methods of basic statistics calculation, such as variance, for moving series observations.

Текст научной работы на тему «Метод условной декомпозиции эмпирических распределений и его применение к задаче анализа рядов наблюдений»

№ 3 (31), 2014

Физико-математические науки. Физика

УДК 519.25, 53.023,52-17

В. М. Журавлев, В. М. Морозов, М. С. Петряков, В. В. Самойлов

МЕТОД УСЛОВНОЙ ДЕКОМПОЗИЦИИ ЭМПИРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ И ЕГО ПРИМЕНЕНИЕ К ЗАДАЧЕ АНАЛИЗА РЯДОВ НАБЛЮДЕНИЙ1

Аннотация.

Актуальность и цели. Одним из способов анализа рядов наблюдений является анализ эмпирических вероятностных распределений (гистограмм). Задача при таком подходе - выяснение фундаментальных свойств физических процессов, ответственных за изменчивость наблюдаемых параметров физических и других систем. Одним из способов обнаружения всех действующих физических факторов в наблюдаемой системе является метод декомпозиции эмпирических распределений. Декомпозиция позволяет представить гистограмму в виде смеси, каждый из компонент которой может интерпретироваться как вероятностное распределение одного из механизмов со специфическими признаками. Стандартным подходом к декомпозиции является метод моментов в сочетании с заранее заданным набором теоретических распределений, которые выбираются до проведения самой декомпозиции. В этом случае сами признаки разделения распределения на компоненты фактически исключаются из анализа, что часто приводит к трудностям в интерпретации полученных результатов. Поэтому актуальная задача обработки рядов - разработка метода декомпозиции гистограммы с помощью эмпиричесих признаков, которые непосредственно участвуют в обработке данных. Цель данной работы - построение метода декомпозиции рядов наблюдений с помощью формирования эмпирических признаков разделения значений ряда на основе статистических характеристик самого ряда.

Материалы и методы. Для реализации метода декомпозиции важным является требование выработки статистически устойчивых признаков, подлежащих проверке во время работы алгоритмов. Устойчивые признаки на базе самого исходного ряда наблюдений можно построить, используя те или иные статистики. Поскольку каждый признак должен относиться к каждому отдельному элементу ряда, то в данной работе используются два метода. Это метод регрессионных моделей и метод вычисления базовых статистик скользящих рядов.

Результаты. Основным результатом работы является создание математических алгоритмов проведения условной декомпозиции и его применение к задаче декомпозиции эмпирических распределений ряда чисел Вольфа (ежемесячное число пятен на Солнце) и ежечасного ряда атмосферного давления за 2009 г. Найдены компоненты распределений, и на основе скользящих рядов проанализирована изменчивость параметров эмпирических распределений и эволюция априорных вероятностей.

Выводы. Предложенный метод условной декомпозиции дает значительно более эффективный способ разделения гистограмм на компоненты, чем методы декомпозиции, основанные на методе моментов для теоретически заданных распределений смеси. Метод может применяться для большинства систем при условии, что сформулированы основные принципы выявления устойчивых признаков на основе самих рядов наблюдений. Показано, что для этого

1 Работа выполнена при поддержке Министерства образования и науки РФ (в рамках Государственного задания и проекта № 14.Z50.31.0015), а также при частичной финансовой поддержке РФФИ в рамках проекта 13-01-97067 р_поволжье_а.

Physics and mathematics sciences. Mathematics

179

Известия высших учебных заведений. Поволжский регион

можно использовать как методы регрессионных моделей, так и методы вычисления базовых статистик, таких как дисперсия, для скользящих рядов наблюдений.

Ключевые слова: статистические характеристики рядов наблюдений, эмпирические распределения вероятностей, метод декомпозиции распределений, эволюция статистических параметров, скользящие ряды наблюдений.

V. M. Zhuravlev, V. M. Morozov, M. S. Petryakov, V. V. Samoylov

THE METHOD OF CONDITIONAL DECOMPOSITION OF EMPIRICAL DISTRIBUTIONS AND ITS APPLICATION TO THE ANALYSIS OF A SERIES OF OBSERVATIONS

Abstract.

Background. One of the ways to analyze a series of observations is to analyze the empirical probability distributions (histograms). The challenge with this approach is to find the fundamental properties of the physical processes responsible for the variability of the observed parameters of physical and other systems. One of the ways to identify all existing physical factors in the observed system is the decomposition method of empirical distributions. Decomposition enables a histogram to be represented as a mixture, each component of which can be interpreted as the probability distribution of one of the mechanisms; with specific characteristics. The standard approach to the decomposition is the method of moments in conjunction with a predetermined set of theoretical distributions that are chosen to undertake the actual decomposition. In this case the signs of separation are actually excluded from the analysis, which often leads to difficulties in the interpretation of results. Therefore, the topical problem of series processing is the development of a decomposition method using a histogram of empirical features that are directly involved in the data processing. The aim of this work is to construct the decomposition method, a series of observations using the empirical evidence of the formation of a number of separate values based on the statistical characteristics of the series.

Materials and methods. In implementation of the decomposition method there is an important requirement to generate statistically stable signs to be checked at the time of the algorithms. Persistent signs on the basis of the initial series of observations can be constructed using these or other statistics. As each characteristic must relate to each individual series element, in this study the authors used two methods. These are the method of regression models and the method of calculating the basic statistics of moving rows.

Results. The main result is the creation of mathematical algorithms of conventional decomposition and its application to the decomposition of the empirical distributions of a number of Wolf numbers (monthly number of sunspots) and hourly series of atmospheric pressure in 2009. The authors found components of distributions and analyzed the variability of the parameters of empirical distributions and the evolution of the a priori probabilities using moving series.

Conclusions. The proposed method of conditional decomposition gives a much more efficient method of separating components in the histogram than decomposition methods, based on the method of moments for the theoretical given mixture distributions. The method is suitable for the majority of systems, provided the basic principles of sustainable identifying features are formulated on the basis of the series of observations themselves. It is shown that for this purpose one can use both the methods of regression models and the methods of basic statistics calculation, such as variance, for moving series observations.

180

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

Key words: statistical characteristics of a series of observations, empirical probability distribution, method of decomposition of distributions, evolution of the statistical parameters, sliding series of observations

Принцип декомпозиции эмпирических распределений вероятностей (гистограмм) состоит в представлении этого распределения в виде смеси теоретических распределений, каждое из которых отвечает за отдельный физический механизм изменения изучаемого параметра системы. Под смесью понимается формальная сумма отдельных плотностей распределений Ра (х | Ча), а = 1,---,K, физического параметра х с весовыми коэффициентам Ра :

Это соотношение можно рассматривать как формулу полной вероятности, в которой параметры ра представляют собой априорные вероятности появления признака qa с номером а в системе, а ра (х | qa) - условные вероятности появления значения х изучаемого параметра при условии, что реализуется признак ча. Признаки ча являются несовместными и отражают реализацию в системе определенного физического механизма появления значения х, изучаемого параметра. Задача декомпозиции состоит в том, чтобы с помощью каких-либо вычислений отыскать значения априорных вероятностей ра и всех параметров ча теоретических распределений. С математической точки зрения чаще всего задача декомпозиции эмпирических распределений в смесь теоретических распределений осуществляется с помощью метода моментов, хорошо известного в математической статистике [1, 2]. При реализации такого подхода задают явный вид распределений смеси, а параметры этих распределений вычисляют с помощью решения системы нелинейных алгебраических уравнений, число которых и их порядок зависят от выбора теоретических распределений смеси. При этом приходится сталкиваться с серьезной проблемой решения такой системы уравнений и отбора корней, которые реально соответствуют решаемой задаче. Пример реализации такого подхода приведен в работах [3, 4], где проводилась декомпозиция распределения ряда чисел Вольфа солнечной активности с целью выявления механизмов, влияющих на характеристики цикла солнечной активности.

Чаще всего причиной, по которой проводится декомпозиция распределений, является многомодовый характер эмпирических гистограмм, выходящий за уровень случайных флуктуаций. Пример приведен на рис. 1, где показано эмпирическое распределение температуры воздуха на одной из метеостанций за 2009 г. Как видно, гистограмма имеет характерный двухмодовый вид. Каждая мода (или страта) с точки зрения физики обычно отвечает за некоторый особый механизм динамики системы и выявление свойств этих мод позволяет получить некоторые данные об этих механизмах. Однако основной трудностью при реализации декомпозиции является даже не математическая

Введение

K

(1)

а=1

Physics and mathematics sciences. Mathematics

181

Известия высших учебных заведений. Поволжский регион

сложность решения систем уравнений (как правило, нелинейных), а окончательная интерпретация самих механизмов формирования отдельных распределений смеси, что является некорректной задачей в смысле явной неоднозначности возможных интерпретаций.

Рис. 1. Пример гистограммы распределений, построенной по ряду температуры, длиной 12 месяцев с шагом 1 ч

В настоящей работе развивается общая методология метода условной декомпозиции распределений. Основная идея метода состоит в представлении исходного эмпирического распределения не в виде смеси теоретических распределений, а в виде именно эмпирических распределений. Распределения смеси формируются в процессе вычислений с помощью проверки соответствия каждого значения исследуемого ряда некоторому эмпирическому признаку. Признаки должны выбираться таким образом, чтобы проверку на соответствие можно было бы осуществлять в ходе вычислений непосредственно по самим рядам наблюдений или их совокупности. В работе метод применяется к задачам анализа ряда чисел Вольфа и метеорологического ряда наблюдений давления.

1. Принцип условной декомпозиции

Основной принцип условной декомпозиции распределений состоит в выработке эмпирических признаков, соответствующих каждому конкретному измерению исследуемого ряда, на основе всей совокупности измерений. Поскольку признаки должны быть относительно статистически устойчивыми, то в качестве значений признаков предлагается использовать какие-либо статистические модели параметров наблюдаемого ряда. Простейшим способом выработки признаков могут служить простые условия, связанные с попадани-

182

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

ем значения ряда в некоторые заранее заданные интервалы значений. В этом случае процедура построения декомпозиции исходной гистограммы может быть представлена следующим образом. Пусть xt, і = 1,..N, - исходный ряд наблюдений с дискретным временем ti = і А (А - шаг по времени), а X) -усредненная его модель, построенная с помощью, например, метода наименьших квадратов (МНК) [1, 2], синхронизированная с самим рядом:

Xi = A1f1(іА) + А2 f2 (іА) + ''' + ALfL (iА),

где A1,...,Al - коэффициенты регрессии; f1(t),..., fL(t) - заданные функции модели. Исходя из требований статистической устойчивости признаков декомпозиции, в качестве условий можно выбрать условия попадания в заданные интервалы не самих значений ряда, а именно значений усредненной модели. Такие условия в дальнейшем будут называться условиями декомпозиции. Пусть sa, a = 0,.,K, - заранее заданная совокупность границ интервалов [sa-1,sa], а = 1,.,K, Sk =тах(Хі,і = 1,..,N), попадание в которые значений усредненного процесса Xі соответствует наступлению события qa. Это означает, что при выполнении условия

sa-1 ^ Хі < sa (2)

значение Хі исходного ряда относится к эмпирическому распределению Pa (x | qa) и учитывается в соответствующей ему гистограмме. В результате исходная гистограмма распадается на K отдельных гистограмм, соответствующих условиям (2). Каждая из гистограмм описывает случайные флуктуации в системе при попадании ее в некоторую область усредненных значений, наблюдаемых ее параметров.

Другим способом определения условий декомпозиции является использование скользящих рядов наблюдений и их статистических параметров. Под скользящим рядом понимается разбиение исходного ряда длиной N на множество отрезков одинаковой длины L < N, начало и конец которых смещаются друг относительно друга последовательно на одну и ту же величину T , которую будем называть сдвигом. В результате такой процедуры в обработку

попадают отрезки ряда {Yl(a)}, і = 1,.,L; a = 1,.,M (M = [(N-L)/T] +1), сформированные следующим образом:

Y(a)= X+(a-1)T, і = 1,..,L;a = 1,...,M. (3)

Здесь [x] - целая часть вещественного числа x. Отрезки данных перекрываются и содержат основную информацию о процессе на отрезке. При использовании скользящих рядов в качестве текущих признаков можно использовать значения различного рода статистик самих отрезков рядов, например, их средние значения, дисперсии, коэффициенты корреляций и т.д. В дальнейшем в качестве примера будет проведена декомпозиция ряда чисел Вольфа с помощью дисперсии скользящих рядов:

L ----

Sa = Z(Y(a) -Y(a))2 /(L-1), a = 1,...,M. (4)

і=1

Physics and mathematics sciences. Mathematics

183

Известия высших учебных заведений. Поволжский регион

Из самого принципа декомпозиции вытекает, во-первых, что исходная полная гистограмма распределения, представленная в виде (1), имеет смысл полной вероятности для полной совокупности признаков qa. Во-вторых, априорные вероятности могут быть вычислены по формулам:

где Na - число событий, соответствующих появлению признака qa, а N -

K

общее число событий (длина ряда): N = ^Na . Такой способ декомпозиции

a=1

является точным, в отличие от вычисления параметров qa смеси, исходя из заданной формы теоретических распределений pa (x | qa).

В этом случае, если есть необходимость строить теоретическую декомпозицию, то ее можно проводить независимо для каждого отдельного эмпирического распределения pa (x | qa), построенного в результате условной декомпозиции. При этом необходимо применить стандартные методы проверки гипотез о соответствии отдельных эмпирических распределений заданным теоретическим.

Недостатком такого способа декомпозиции является возможность строить разбиение, основываясь лишь на сравнительно простых признаках достижения определенных граничных значений самими рассматриваемыми переменными. В реальности отдельные компоненты в распределениях могут порождаться разными по сути физическими процессами, различие между которыми нельзя установить, изучая только один вид процесса и, тем более, по пересечениям им граничных значений. Однако предлагаемый подход может дать очень полезную информацию в тех случаях, когда диапазоны изменений являются достаточным признаком явления. Примером таких явлений могут служить атмосферные явления, связанные с прохождением областей повышенного давления - антициклоны, и пониженного - циклоны. В этом случае в более общем случае, когда в качестве ряда наблюдений используются несколько отдельных рядов наблюдения различных параметров среды или системы, в качестве признака декомпозиции могут быть использованы более сложные числовые функции, зависящие от значений нескольких параметров, взятых в различные моменты времени.

2. Декомпозиция ряда чисел Вольфа

В качестве первого примера рассмотрим задачу декомпозиции ряда чисел Вольфа солнечной активности. Это позволит сравнить результаты декомпозиции с уже имеющимися результатами теоретической декомпозиции, которые были получены в работах [3, 4]. Исходный ряд ежемесячных значений чисел Вольфа за период c января 1749 по май 2014 г. приведен на рис. 2.

На рис. 3, кроме самой гистограммы, приведено показательное распределение pw (w) = Xe Xw со средним значением W = 1/ X, равным среднему значению ряда чисел Вольфа. Видно, что хотя теоретическое распределение по форме хорошо согласуется с эмпирическим, тем не менее имеются откло-

184

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

нения в области значений w = 40- 50. Это и явилось причиной проведения декомпозиции данного распределения в работах [3, 4]. Основная идея декомпозиции состояла в том, что кроме «равновесного» механизма генерации пятен, который определяет показательное распределение числа пятен на Солнце, существует еще и «взрывной» механизм, который и приводит к появлению отклонений. Гистограмма распределения чисел Вольфа исходного ряда представлена на рис. 3.

Рис. 2. Ряд чисел Вольфа (серая сплошная кривая) и значения выборочных значений стандартных отклонений скользящих рядов L = 24, T = 1 (жирная пунктирная кривая) и среднее значение ряда стандартных отклонений за весь период (сплошная черная горизонтальная линия)

В работах [3, 4] предполагалось выявить характеристики взрывного механизма с помощью декомпозиции распределения путем разделения на показательное и дополнительное распределения типа распределения Максвелла с нулевой вероятностью при w = 0. Задача решалась с помощью метода моментов. В данной работе проведем декомпозицию с помощью разделения значений на основании сравнения стандартных отклонений скользящих рядов длиной 24 месяца со средним по всему ряду стандартным отклонением. Дисперсия скользящего ряда может служить индикатором величины энергии возмущений процесса на данном отрезке времени. Превышение некоторого уровня можно идентифицировать как признак появления «взрывного» процесса образования пятен. На рис. 2 вместе с самим рядом чисел Вольфа жирной пунктирной линией приведен ряд стандартных отклонений для каждого

Physics and mathematics sciences. Mathematics

185

Известия высших учебных заведений. Поволжский регион

скользящего ряда длиной 24 месяца со сдвигом 1 месяц. Именно этот ряд использовался для идентификации признака проявления механизма «взрывного» образования пятен. В качестве граничного значения выбиралось среднее значение стандартного отклонения по всему ряду. При выбранных параметрах среднее значение стандартного отклонения было равно W —17. Этот уровень на рис. 2 представлен сплошной черной горизонтальной линией. В результате все значения исходного ряда со значениями Xj = wj > W относились к действию механизма взрывного типа, а со значениями Xj = Wj < W к равновесному состоянию. Соответствующие гистограммы представлены на рис. 4. В качестве теоретических распределений для сравнения с эмпирическими использовались следующие распределения:

pl(w) = — e w/\ (5)

s1

, ч 4 3/2 -w/

P2(W)=wnFW e

Рис. 3. Гистограмма распределения чисел Вольфа (серая) и теоретическое показательное распределение с X = 1/ W (сплошная черная)

Выбор распределения р2 (w) производился среди большого класса рас-

k - 2 и -

пределений двух видов: 1) p(w ) = Z\wke aw , 2) p(w ) = Z2wke aw , на основе

2

критерия x . Выбор (6) является наилучшим при вычислении параметра S2

186

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

на основе среднего значения эмпирического распределения на рис. 4,б: S2 =2W2 / 5. Выбор распределения (5) производился на основе вычисления среднего по формуле s = W1

Рис. 4. Гистограммы компонент распределения чисел Вольфа (серая) и теоретические распределения (сплошная черная)

Physics and mathematics sciences. Mathematics

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

187

Известия высших учебных заведений. Поволжский регион

По аналогии с работами [3, 4] приведем анализ изменения параметров компонент распределений, полученных описанным способом для скользящих рядов длиной 100 лет со сдвигом 1 год. Для каждого отрезка длиной 100 лет производилась декомпозиция распределения на основе признака превышения стандартным отклонением скользящего ряда среднего значения стандартных отклонений. Результаты представлены на рис. 5 и 6.

Рис. 5. Изменение априорных вероятностей компонент распределения чисел Вольфа скользящих рядов длиной 100 лет с шагом 1 год

Основные выводы анализа результатов в основном совпадают с тем, что было сделано в [3, 4]. В частности, обнаруживаются скачки свойств априорных вероятностей, средних и дисперсий в те же моменты времени, что и при обработке, выполненной в работах [3, 4]. Это говорит об устойчивости найденных закономерностей. Однако основным достижением данного подхода является явное указание признака, в результате которого получена декомпозиция. Для выбора конкретных типов распределений для их теоретического анализа появляются реальные данные в форме самих гистограмм компонент, которые получены в явном виде. Этот результат дает основания для получения более глубоких выводов относительно характера эволюции солнечной активности.

3. Описание модели ряда атмосферного давления

В качестве примера использования моделей регрессии для декомпозиции эмпирических распределений рассмотрим условную декомпозицию рас-

188

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

пределения значений давления на одной из метеостанций Ульяновской области за 2009 г.

Рис. 6. Изменение средних значений (а) и стандартных отклонений (б) компонент распределения чисел Вольфа скользящих рядов длиной 100 лет с шагом 1 год

На рис. 7 приведен график изменения давления за 2009 г. (сплошная серая кривая) вместе с моделью, построенной с помощью МНК (сплошная чер-

Physics and mathematics sciences. Mathematics

189

Известия высших учебных заведений. Поволжский регион

ная кривая). Кроме этого, на графике проведены линии, соответствующие границам областей циклонической деятельности (нижняя черная штриховая), антициклонической (антициклонической) (верхняя черная штриховая) и среднее значение за весь период (сплошная черная). Условные границы были выбраны в соответствии со следующими соотношениями: 5) = P — 0,26ср,

S2 = P + 0,26сp, где P - оценка среднего, с - оценка стандартного отклонения. Такой выбор позволяет заранее оценить вероятность попадания отдельного измерения в интервал [S), S2 ] в предположении о нормальности распределения.

Рис. 7. Изменение давления за 2009 г. (серая сплошная кривая), модель МНК (черная сплошная кривая), границы областей (черные штриховые) и среднего значения за весь период (сплошная черная)

На рис. 8 приведена гистограмма распределения давления за весь 2009 г. и нормальное распределение, имеющее среднее и дисперсию, равные среднему и дисперсии самого ряда (сплошная кривая).

Модель метода наименьших квадратов, приведенная на рис. 7, строилась как совокупность их шести основных гармоник, периоды которых находились с помощью предварительного спектрального анализа ряда наблюдений. Спектральная плотность оценивалась с помощью метода максимальной энтропии в сочетании с методом векторизации исходного ряда [5]. Предварительно проводилось сглаживание ряда косинусным фильтром Тьюки с окном P = 12 и прореживанием с шагом D = 12. Спектральная плотность в диапазоне периодов от 2 суток и до 40 суток приведена на рис. 9. На рис. 9 видна характерная гармоника с периодом T = 33 сут. и кратные ей гармоники. По всей видимости, эти гармоники связаны с лунным приливом и его обертонами. Более низкочастотные гармоники, в частности годовой период и его обертоны, на этом графике не видны, но могут быть обнаружены с помощью сглаживания и прореживания ряда с большим шагом.

190

University proceedings. Volga region

Рис. 8. Гистограмма распределения давления за весь 2009 г. Сплошная кривая - нормальное распределение со средним и дисперсией, равными их оценкам по всему ряду

Рис. 9. График спектральной плотности ряда давления за весь 2009 г. Частота Найквиста 0,5 сут-1. Периоды пиков приведены в сутках

Physics and mathematics sciences. Mathematics

191

Известия высших учебных заведений. Поволжский регион

В соответствии со спектром модель МНК строилась в виде

13

P(t )= 2 AkFk (t), к=0

где F0=1, Fjk-i(t) = cos(Q-t), Рік(t) = sin(Qkt), к = 1,..,6. Частоты выбраны следующим образом: Qi = п/3800, Q = п/2500, Q = п/1488,

Q4 = п/744, Q5= п/288, Q6 = п/144.

4. Условная декомпозиция распределений вероятностей атмосферного давления

Пример декомпозиции рассмотрим для отрезка ряда длиной в 4 месяца, гистограмма которого представлена на рис. 10, из которого видно, что гистограмма имеет сложный характер. Декомпозиционные границы выбраны аналогично рис. 7: <S1= P - 0,26ар, S2 = P + 0,26ар. Результаты декомпозиции представлены на рис. 11.

Рис. 10. Распределение давления за первые 4 месяца 2009 г. Сплошной линией нанесено нормальное распределение, имеющее среднее и дисперсию, равные оценкам этих величин по исходному ряду

Представленные рисунки демонстрируют характер распределений в каждом из диапазонов усредненного давления, которые на рисунках условно обозначены так: «циклон» - p < S1, «норма» - S < p < S2, «антициклон» p > S2. Соответствующие значения априорных вероятностей равны

Р1 =0,18, Р2 = 0,56, Рз = 0,26.

192

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

Рис. 11. Нулевое значение соответствует среднему давлению за период циклонической деятельности

5. Условная декомпозиция скользящих рядов давления

Как и для ряда чисел Вольфа, метод условной декомпозиции может быть использован для выяснения динамики изменчивости параметров компонент распределения, полученных в результате декомпозиции. В данной работе для иллюстрации возможностей такого подхода проводилась декомпозиция последовательности скользящих рядов давления за 2009 г. длительностью 4 месяца, взятых со сдвигом 5 сут. Декомпозиция проводилась при одних и тех же границах для всего периода наблюдения (12 месяцев 2009 г.). После декомпозиции вычислялись дисперсии компонент и средние, которые вычислялись как среднее модели и среднее соответствующей компоненты распределения. На рис. 12-14 представлены результаты такой декомпозиции в виде графиков изменения априорных вероятностей, средних и стандартных отклонений компонент.

Анализируя полученные графики на рис. 12-14 и поведение найденных параметров компонент смеси распределений, можно обнаружить интересную информацию. Из графиков априорных вероятностей можно сделать вывод, что циклоническая и антициклоническая деятельности сменяют друг друга в течение года, находясь в противофазе друг к другу.

Physics and mathematics sciences. Mathematics

193

Рис. 12. Изменение априорных вероятностей за 2009 г. (длина ряда уменьшена на длину скользящего ряда)

Рис. 13. Изменение средних значений компонент за 2009 г. (длина ряда уменьшена на длину скользящего ряда)

194

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

ю

Эволюция стандартных отклонений условных распределений

*

ю

я

х

о

о

©

*

9

н

и

- X /1

X /д /

X

4 5

Бремя, месяц

Циклон 1

Норма 1

1 Антициклон |

Рис. 14. Изменение стандартных отклонений компонент за 2009 год (длина ряда уменьшена на длину скользящего ряда)

Летом превалирует циклоническая деятельность, а зимой - антициклоническая. Из графика стандартных отклонений также можно сделать вывод, что в летний период погода стабилизируется, поскольку величины стандартных отклонений оказываются меньше, чем в остальные периоды времени.

Заключение

В работе предложен и апробирован метод условной декомпозиции на примере рядов ежемесячных чисел Вольфа за период с 1749 по 2014 г., а также ряда ежечасовых значений атмосферного давления за 2009 г. Сам метод реализуется с помощью простых вычислительных процедур, что позволяет его эффективно применять к решению различных задач обработки данных. В работе были продемонстрированы два подхода к формированию признаков условной декомпозиции на основе ряда стандартных отклонений скользящих рядов чисел Вольфа и модели регрессии для ряда давления. Оба подхода демонстрируют возможность получать дополнительную информацию о характере процесса на основе метода декомпозиции. Это позволяет получить новые физические параметры состояния систем в форме параметров компонент смеси эмпирических распределений. Эта дополнительная информация может быть использована для более глубокого выяснения механизмов физических процессов, порождающих те или иные явления в исследуемых системах. Хотя в данной работе использовался лишь простейший вариант условий декомпо-

Physics and mathematics sciences. Mathematics

195

Известия высших учебных заведений. Поволжский регион

зиции, данный метод может применяться и для более общих условий, накладываемых на изучаемые процессы.

Авторы выражают искреннюю благодарность метеорологическому центру аэропорта Восточный г. Ульяновска за предоставленную информацию.

Список литературы

1. Гмурман, В. Е. Теория вероятностей и математическая статистика /

В. Е. Гмурман. - М. : Высшая школа, 2003. - 480 с.

2. Вентцель, Е. С. Теория вероятностей / Е. С. Вентцель. - М. : Наука, Физматгиз, 1969. - 576 с.

3. Журавлев, В. М. Анализ долговременной эволюции активности Солнца на

основе ряда чисел Вольфа (I. Методика) / В. М. Журавлев, С. В. Летуновский // Известия высших учебных заведений. Поволжский регион. Физико-

математические науки. - 2010. - № 4 (16). - C. 120-130.

4. Журавлев, В. М. Анализ долговременной эволюции активности Солнца на

основе ряда чисел Вольфа (II. Результаты) / В. М. Журавлев, С. В. Летуновский // Известия высших учебных заведений. Поволжский регион. Физико-

математические науки. - 2011. - № 3 (19). - C. 164-174.

5. Свидетельство государсвенной регистрации программ для ЭВМ № 2012619378. Многомерный метод максимальной энтропии в одномерном спектральном анализе / Журавлев В. М., Валентюк Р. А. Деп. в ВИНИТИ. 09.09.1987. № 6602-B87. - 17 октября 2012 г.

References

1. Gmurman V. E. Teoriya veroyatnostey i matematicheskaya statistika [Probability theory and mathematical statistics]. Moscow: Vysshaya shkola, 2003, 480 p.

2. Venttsel' E. S. Teoriya veroyatnostey [Probability theory]. Moscow: Nauka, Fizmatgiz, 1969, 576 p.

3. Zhuravlev V. M., Letunovskiy S. V. Izvestiya vysshikh uchebnykh zavedeniy. Povolzh-skiy region. Fiziko-matematicheskie nauki [University proceedings. Volga region. Physical and mathematical sciences]. 2010, no. 4 (16), pp. 120-130.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Zhuravlev V. M., Letunovskiy S. V. Izvestiya vysshikh uchebnykh zavedeniy. Povolzh-skiy region. Fiziko-matematicheskie nauki [University proceedings. Volga region. Physical and mathematical sciences]. 2011, no. 3 (19), pp. 164-174.

5. Svidetel'stvo gosudarsvennoy registratsii programm dlya EVM № 2012619378. Mnogomernyy metod maksimal'noy entropii v odnomernom spektral'nom analize [Certificate of state registration of the PC programs № 2012619378. Multidimensional method of maximal entropy in one-dimensional spectral analysis]. Zhuravlev V. M., Valentyuk R. A. Dep. in VINITI. 9 September 1987. No. 6602-B87. 17 October 2012.

Журавлев Виктор Михайлович

доктор физико-математических наук, профессор, кафедра теоретической физики, Ульяновский государственный университет (Россия, г. Ульяновск, ул. Льва Толстого, 42)

E-mail: zhvictorm@gmail.ru

Zhuravlev Viktor Mikhaylovich Doctor of physical and mathematical sciences, sub-department of theoretical physics, Ulyanovsk State University (42 Lva Tolstogo street, Ulyanovsk, Russia)

196

University proceedings. Volga region

№ 3 (31), 2014

Физико-математические науки. Физика

Морозов Виталий Михайлович студент, Ульяновский государственный университет (Россия, г. Ульяновск, ул. Льва Толстого, 42)

E-mail: aieler@rambler.ru

Петряков Михаил Сергеевич аспирант, Ульяновский государственный университет (Россия, г. Ульяновск, ул. Льва Толстого, 42)

E-mail: petraykovms@gmail.com

Самойлов Вадим Владимирович доцент, кафедра теоретической физики, Ульяновский государственный университет (Россия, г. Ульяновск, ул. Льва Толстого, 42)

E-mail: samoilov_vadim@mail.ru

Morozov Vitaliy Mikhaylovich

Student, Ulyanovsk State University (42 Lva Tolstogo street, Ulyanovsk, Russia)

Petryakov Mikhail Sergeevich Postgraduate student, Ulyanovsk State University (42 Lva Tolstogo street, Ulyanovsk, Russia)

Samoylov Vadim Vladimirovich

Associate professor, sub-department of theoretical physics, Ulyanovsk State University (42 Lva Tolstogo street, Ulyanovsk, Russia)

УДК 519.25, 53.023,52-17 Журавлев, В. М.

Метод условной декомпозиции эмпирических распределений и его применение к задаче анализа рядов наблюдений / В. М. Журавлев,

В. М. Морозов, М. С. Петряков, В. В. Самойлов // Известия высших учебных заведений. Поволжский регион. Физико-математические науки. - 2014. -№ 3 (31). - С. 179-197.

Physics and mathematics sciences. Mathematics

197

i Надоели баннеры? Вы всегда можете отключить рекламу.