Вестник КРАУНЦ. Физ.-мат. науки. 2010. № 1 (1). C. 62-67
УДК 519.688
СЕГМЕНТАЦИЯ СВЯЗАННЫХ ВРЕМЕННЫХ РЯДОВ НА ПРИМЕРЕ ОБЪЕМНОЙ АКТИВНОСТИ РАДОНА И АТМОСФЕРНОГО ДАВЛЕНИЯ А.Б. Тристанов1,2, П.П. Фирстов1,2, Н.А. Жукова3
1 Камчатский филиал Геофизической службы РАН, 683036, г. Петропавловск-Камчатский, бульвар Пийпа, 9
2 Камчатский государственный университет имени Витуса Беринга, 683032, г. Петропавловск-Камчатский, ул. Пограничная, 4
3 Санкт-Петербургский государственный электротехнический университет имени В.И. Ульянова (Ленина), 197376, г. Санкт-Петербург, ул. проф. Попова, 5
E-mail: [email protected]
Изложены результаты применения метода сегментации связных временных рядов на основе теста Грейнджера к сигналам объемной активности радона и атмосферного давления.
Ключевые слова: интеллектуальный анализ временных рядов, сегментация, объемная активность радона
© Тристанов А.Б., Фирстов П.П., Жукова Н.А., 2010
MSC 62N86
SEGMENTATION OF RELATED TIME SERIES BY THE EXAMPLE OF RADON VOLUMETRIC ACTIVITY AND ATMOSHERE PRESSURE A.B. Tristanov1,2, P.P. Firstov1,2, N.A. Zhukova3
1 Kamchatkan experimental & methodical seismological department, Geophysical service, RAS, Petropavlovsk-Kamchatskiy, 683036, Pijpa st., 9, Russia
2 Kamchatka State University by Vitus Bering, 683032, Petropavlovsk-Kamchatskiy, Pogranichnaya st., 4, Russia
3 Saint Petersburg Electrotechnical University «LETI», 197376, St. - Petersburg, Popova st., 5, Russia
E-mail: [email protected]
This paper is devoted to the results of using related time series segmentation method based on Grager test to the radon volumetric activity and atmosphere pressure signals.
Key words: time series data mining, segmentation, radon volumetric activity
© Tristanov A.B., Firstov P.P., Zhukova N.A., 2010
Введение
В настоящее время отмечается большой интерес к анализу временных рядов как источнику, как правило, косвенных данных о процессах в исследуемых системах. Важной задачей обработки временных рядов является нахождение участков временных рядов, обладающих постоянными свойствами, и выявление закономерностей в их изменениях.
Проблема сегментации заключается в построении детектора, обеспечивающего выявление момента изменения свойств временного ряда. Как правило, эта задача решается анализом некоторой функции самого сигнала. В большинстве случаев данный метод дает неплохие результаты. Тем не менее интересен другой подход, заключающийся в сегментации не только по исследуемому временному ряду, но и с учетом других рядов, оказывающих на него влияние. В настоящей работе предпринята попытка решить задачу сегментации ряда объемной активности радона по данным атмосферного давления.
Известно, что большое влияние на наблюдаемые данные объемной активности радона (ОА 1^п) и, как следствие, на ее характеристики, такие как плотность потока (ППР), оказывают метеопараметры. Целью настоящей работы является оценка влияния атмосферного давления на ППР.
Гипотеза исследования заключается в наличии причинно-следственной связи между изменениями атмосферного давления и ОА 1^п. Для оценки этой связи предлагается применить тест Грейнджера с анализом улучшения прогноза процесса при помощи линейной системы под управлением другого процесса по сравнению с моделью авторегрессии.
Данная методика применяется в исследовании связи между сложными процессами в медицине, экономике, а также в науках о Земле [2].
Экспериментальный материал
В работе используются данные, полученные в районе Паратунской гидротермальной системы. В ноябре 1997 г. начала работать станция мониторинга подпочвенного радона, которая расположена в узкой долине ручья Коркино. В 700 м от станции, ниже по течению ручья, находятся естественные выходы термальных вод с содержанием растворенного радона до 1500 Бк/м3. Регистрация на станции Паратунка ведется в двух разноглубинных точках. Точка 1 расположена на подрезанном склоне долины ручья Коркино, на глубине 1 м от дневной поверхности. Точка 2 удалена на 25 м от первой точки по направлению к ручью и находится на 1 м выше дна бункера глубиной в 3 м, вырытого в глинисто-аллювиальных отложениях речной долины.
Методика обработки
Используемые модели
Будем рассматривать «черный ящик», на вход которого поступает «управляющее» воздействие - атмосферное давление, а на выходе имеем реакцию - объемную
активность радона. Соотношение вход-выход данной системы будет иметь вид:
N — 1 М-1
у(п) = £ Ькх(и — к) — £ аку(и — к) + £, (1)
к=0 к=1
где у(п) - значения объемной активности радона; х(п) - значения атмосферного давления; £ - ошибка.
Наличие ошибки £, очевидно, следует из невозможности учесть все параметры, влияющие на процесс генерации радона.
С другой стороны, может быть рассмотрена модель авторегрессии, не учитывающей, в отличие от первой модели, в явной форме влияния атмосферного давления. Тогда данная модель будет иметь вид:
М— 1
у(п) = £ аку(п — к) + п. (2)
к=1
Обе модели могут быть рассмотрены в терминах передаточных функций, т. е.
N—1 и
£ Ьк1к
НХу (г) = М=0------передаточная функция модели процесса У под управлением X;
£ акгк к=0
НУ(г) = -------передаточная функция модели авторегрессии процесса У.
£ акгк к=0
Идентификация обеих моделей (определения коэффициентов) происходит методом наименьших квадратов путем минимизации ошибки прогноза.
Данные модели хорошо изучены, например, в работе [2].
Тест причинности по Грейнджеру
Будем считать, что процессы X и У связаны между собой, если имеет место существенное отличие от нуля коэффициентов Ьк. Для этого строят уравнение авторегрессии процесса У и полное уравнение с учетом влияния процесса X, после чего сравнивают остаточные суммы по ¥-статистике.
Относительным улучшением прогноза называют величину
Px^y =
°Xy - aX Q.'X
где Су, о^у - дисперсии ошибок оптимальных моделей авторегрессии и управляемой модели соответственно; О-Х - дисперсия процесса X.
Отметим, что тест Грейнджера не гарантирует наличие причинно-следственной связи при положительном прохождении теста, но гарантирует ее отсутствие в противоположном случае.
Алгоритм обработки
Вначале выполнялась предобработка сигналов ОА 1^п и атмосферного давления, а именно приведение их к одинаковой частоте дискретизации (8 отсч./сут), заполнение пропусков, центрирование и нормирование.
Все расчеты велись в скользящем окне, длительностью 10 суток, с шагом 1 сутки. Для каждого окна рассчитывались коэффициенты моделей 1, 2 и определялись остаточные ошибки прогноза, по которым вычислялась величина его улучшения. Далее определялась ¥-статистика.
Вычисления проводились для обоих рядов, регистрируемых на станции ПРТ.
Результаты и обсуждения
Вопросу зависимости баровариаций и ОА 1^п посвящены работы П.П. Фирсто-ва и др. [3], в которых построена математическая модель данной зависимости. Тем не менее, несмотря на очевидную связь между атмосферным давлением и эманацией радона, следует отметить, что в зависимости от состояния среды атмосферное давление может оказывать исчезающе малое воздействие, чем другие факторы, например напряженно-деформированное состояние среды.
Предпосылки для определения порядков моделей следующие:
- на ОА 1^п влияют вариации давления длительностью не более суток;
- задержка реакции радона на изменение давления составляет не более нескольких часов;
- авторегрессионая (обратная связь) часть (1) имеет порядок не более 6. Ограничения на порядок моделей оказывает и размер окна, используемый при
обработке.
На рис. 1 показаны рассчитанная оценка уровня значимости критерия Грейнджера, ОА 1^п и значения атмосферного давления; отмечены сегменты, на которых отсутствует значимая связь между ОА 1^п и давлением.
Рис. 1. Оценка уровня значимости критерия Грейнджера для ОА ^ и атмосферного давления с 01.11.2003 г. по 31.10.2004 г.
Далее приведены значения оценки уровня значимости критерия Грейнджера, рассчитанные для 2000-2007 гг. для точки Я1 (рис. 2) и (рис. 3).
Рис. З. Значимость оценки критерия Грейнджера для ОA Rn за З000-З007 гг. в R1
Рис. З. Значимость оценки критерия Грейнджера для ОA Rn за З000-З007 гг. в R2
Отметим, что учет атмосферного давления для точки не оказывает, как правило, значительного влияния на качество прогноза в отличие от точки Л1. Подчеркнем, что наличие значимого влияния показывает: включение в прогнозную модель ряда членов, отвечающих за атмосферное давление, уменьшает дисперсию ошибки, а не свидетельствует о наличии причинно-следственной связи. О наличии такой связи можно судить исходя из физических гипотез.
К сожалению, экспериментальный материал для данного исследования не обладает достаточным качеством в том смысле, что в дальнейшем следует проводить синхронные наблюдения ОА 1^п и давления в одной точке, дабы не вносить дополнительные погрешности в процессе искусственной синхронизации.
В настоящей работе показано, что, несмотря на очевидные факты физической связи атмосферного давления и ОА 1^п, статистическая значимость данной связи в отношении улучшения прогноза поведения ряда различна. Кроме того, обнаружены моменты отсутствия такой связи в некоторые периоды времени.
Литература
1. Бокс Дж., Дженкинс Г. Анализ временных рядов, прогноз и управление / пер. с англ. М.: Мир, 1974.
2. Мохов И.И., Смирнов Д.А. Диагностика причинно-следственной связи солнечной активности и изменений глобальной приповерхностной температуры Земли // Изв. РАН. Физика атмосферы и океана. 2008. Т. 44. №. 3. С. 283-293.
3. Фирстов П.П. [и др.] К вопросу о влиянии баровариаций на поступление радона в атмосферу // Вулканология и сейсмология. 2007. № 6. С. 46-53.
4. Фирстов, П.П., Рудаков В.П. Результаты регистрации подпочвенного радона в 1997-2000 гг. на Петропавловск-Камчатском геодинамическом полигоне // Вулканология и сейсмология. 2002. № 6. С. 1-16
Поступила в редакцию / Original article submitted: 17.11.2010