Научная статья на тему 'Адаптация метода «Гусеница»-88а для работы в автономном режиме при прогнозировании сейсмособытий'

Адаптация метода «Гусеница»-88а для работы в автономном режиме при прогнозировании сейсмособытий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
263
264
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВРЕМЕННОЙ РЯД / МЕТОД "ГУСЕНИЦА"-SSA / СТАТИСТИЧЕСКИЙ АНАЛИЗ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Афанасьев И. А.

Предложена концепция прогнозирования сейсмособытий с использованием данных приборной системы, С помощью метода «Гуcеница»-SSA решается задача о прогнозировании времени будущих землетрясений. Предложена модернизация метода «Гусеница»-SSA для работы в автономном режиме

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Адаптация метода «Гусеница»-88а для работы в автономном режиме при прогнозировании сейсмособытий»

Известия Тульского государственного университета Естественные науки. 2010. Вып. 2. С. 150-155

= ИНФОРМАТИКА

УДК 669.187

Адаптация метода ««Гусеница»-88Л для работы в автономном режиме

*.* />“■' *.»

при прогнозировании сеисмособытии

И.А. Афанасьев

Аннотация. Предложена концепция прогнозирования сейсмособытий с использованием данных приборной системы, С помощью метода «Гусеница»-88Л решается задача о прогнозировании времени будущих землетрясений. Предложена модернизация метода «Гусени-ца»-88Л для работы в автономном режиме.

Ключевые слова: временной ряд, метод «Гусеница»-88Л, статистический анализ.

На сегодняшний день сейсмологи научились давать долгосрочные прогнозы, т.е. предсказывать землетрясения за годы и десятилетия до реальных тектонических событий. Однако, краткосрочных прогнозов по-прежнему никто не может дать и сегодня. Очевидно, что сейсмоактивность зависит от большого количества факторов и эти факторы имеют различную природу. При построении краткосрочных предлагается, использовать только те факторы и материал, по которым имеется и накоплено достаточно информации, а именно: метеоданные, данные о границах сейсмоактивных регионов, данные о разломах земной коры.

Предлагаемый процесс прогнозирования сейсмособытий включает два этапа:

1) определение района (-ов) будущих значимых (с магнитудой более 6 баллов) сейсмособытий;

2) определение временной задержки, т.е. времени, через которое эти события наступят. Понятно, что точно определить эту задержку невозможно. Поэтому, она будет выражаться как Ь ± АЬ.

Данная статья посвящена второму этапу предлагаемой концепции прогнозирования сейсмособытий — определение времени, через которое произойдет землетрясение. Исходными данными для анализа являются показания измерений геодинамических поляризационных потенциалов в лаборатории кафедры ОТ-СиЛП ТулГУ — экспериментальный сигнал. Они представляют собой временной ряд. Но, по сути, мы имеем не один, а два ряда: первый —

экспериментальный сигнал, второй — ряд фактических землетрясений, точек на оси времени. Если рассматривать последний как временной ряд с тем же шагом по оси времени, что и первый, а также учесть тот факт, что экспериментальный сигнал каким-то образом отображает «предвестники землетрясений», виде «необычного поведения» временного ряда, то можно рассматривать не просто два параллельных временных ряда, а один двумерный [2].

Для ее решения будем использовать метод «Гусеница»-8ЯЛ. Суть данного метода была изложена ранее в [9]. Именно он, в отличие от всех остальных, отлично справляется с задачей обработки двумерного временного ряда [1].

С точки зрения практического использования данного метода, особенно при пакетной реализации, было бы очень удобно использовать преимущества метода «Гусеница»-8ЯЛ в автоматическом режиме. Сегодня в работе [6] в рамках метода «Гусеница»-8ЯЛ предложены некоторые методы по идентификации трендовых и периодических составляющих временных рядов с использованием преобразования Фурье, метода нулей, метода низких частот, метода Кендалла. Данные методы хорошо подходят для выделения периодических и трендовых составляющих. Однако, в нашем случае задача несколько иная. Она заключается, помимо определения параметра длины гусеницы, - в поиске и отборе особых аддитивных компонент ряда, которые являются отображением сейсмоактивности.

Пусть имеется ряд XN = + XN и стоит задача прогноза компоненты

ряда Х^. Если XN может рассматриваться как шумовая компонента, то

тИ1) тИ2)

задача состоит в прогнозировании сигнала XN в присутствии шума XN .

Основные предположения:

1. Ряд Xn1 допускает рекуррентное продолжение с помощью линейных рекуррентных формул (ЛРФ) относительно размерности (1.

2. Существует такое число Ь, что ряды xN1 и X® приближенно разделимы, при выборе длинны окна, равной Ь. Это — важное предположение, так как любой временной ряд xN[1 можно рассматривать как аддитивную компоненту ряда XN в том смысле, что XN = xN1) + X(■N)cX(■N) = = XN — xN1). Условие о (приближенно) разделимости означает, что

xN^ является естественной аддитивной компонентой ряда XN с точки зрения метода ЯЯЛ.

Так как мы должны выбрать длину окна, обеспечивающую достаточно хорошее качество разделимости, и выбрать набор собственных троек, соответствующих ряду xN1), то все основные правила для ЯЯЛ как метода анализа временного ряда остаются в силе. Однако, в данном, случае нам необходимо отделить ряд xNN1 от X®, но мы не нуждаемся в полном разложении ряда XN = xff + X®.

Нужно заметить, что задача прогнозирования с помощью метода ЯЯЛ имеет свои особенности, по сравнению с задачей анализа. Так как выбранная длина окна Ь (вместе с набором собственных троек) порождает ЛРФ размерности Ь — 1, которая используется в качестве рекуррентной прогнозирующей формулы, то проблема побочных корней характеристического полинома становится довольно важной. Выбор Ь = ! + 1, где под ! подразумевается размерность минимальной ЛРФ, является оптимальным. К сожалению, на практике малые значения Ь не обеспечивают достаточного качества разделимости. Поэтому, необходимо выбирать наименьшую длину окна, большую, чем ! и приводящую к достаточно хорошей разделимости.

Таким образом, исходный ряд (двумерный) мы представим в общем случае как, XN = xff + ... + xNr). Предполагаем, что некоторые аддитивные компоненты представляют для нас интерес, т.е. являются отображением сейсмоактивности, а некоторые компоненты необходимо отбросить (например, шум), чтобы избежать в дальнейшем искажения качества прогноза землетрясений.

Остановимся более подробно на процессе автоматизации выбора собственных троек иг, Ут), так как именно их определенный набор определяет

аддитивные компоненты ряда. Так как мы рассматриваем не только сам сигнал Е, но и ряд сейсмоактивности на том же интервале времени, т.е. проводим анализ двумерного временного ряда X = [Е\ : ... : ¥к : О1 : ... : О к ] = = [Е, О], то и разложения обоих рядов проводится по общему базису

(иь ...,ил): Е = Е"=1 ик ик Е, С = Ек=1 ик ^ С.

Самым неформализуемым шагом является шаг группировки. Вся информация о каждой из компонент X содержится в собственном числе Хг, а также в собственном иг и факторном V векторах. Собственный и факторный вектора называют сингулярными векторами. Поиск компонент для требуемой группировки, главным образом на основе анализа собственных троек, будем называть процедурой идентификации.

Соответственно, для того, чтобы выделить какую-то составляющую ряда или отделить сигнал от шума, необходимо найти соответствующие искомой составляющей компоненты разложения, сгруппировать их и восстановлением получить искомый ряд.

Отношение ^2ке1 Хк/^2г=1 Хг отражает вклад составляющей, восстановленной по группе компонент I С {1,...,!}, в разложение исходного ряда. Если упорядочить группы в порядке убывания собственных чисел, то компонента с меньшим номером вносит больший вклад в вид ряда, а незначительные компоненты имеют большие номера. Этим можно пользоваться, в частности, для ограничения количества исследуемых компонент [6].

Существует множество критериев отбора собственных троек [1]. Важную роль при проведении группировки собственных троек играют сингулярные числа. В частности, очень полезна форма графика собственных чисел. Как правило, чисто шумовой ряд порождает медленно убывающую последова-

тельность собственных чисел. Если шум добавлен к сигналу, описываемому несколькими собственными тройками с большими сингулярными числами, то скачек в собственных числах может отделять собственные тройки, относящиеся к сигналу, от остальных.

Заметим, что вообще говоря, нет формальной процедуры, позволяющей находить такой скачек. Более того, для сложного сигнала и большого шума собственные тройки могут перемешиваться по отношению к порядку, задаваемому убыванием сингулярных чисел.

В любом случаи, при проведении группировки более детальную информацию дает анализ структуры сингулярных векторов. Но, к сожалению, такой анализ также является процессом творческим, и сопряжен с анализом графиков таких векторов.

Задача стоит в формализации описания процедуры группировки собственных троек, способной работать в режиме реального времени. Процедура группировки включает в себя следующие этапы:

1. Разделение ряда сингулярных чисел на т не пересекающихся подмножеств, т — не велико, проведем группировку;

2. Диагональное усреднение отдельно по каждой из т аддитивной составляющей ряда X, анализ того, какая из сейсмоактивной составляющей ряда Х/т — О лучше приближается к исходной сейсмоактивной составляющей ряда X;

3. Изменение при необходимости границы подмножеств II,..., 1т;

4. Продолжение ряда X, и, следовательно, сейсмоактивной составляющей исходного двумерного ряда О, по отобранным аддитивным составляющим на 3-м этапе, с целью прогнозирования землетрясений.

Но сразу возникает вопрос: правильно ли мы поступили, объединив сигнал (ряд Е) и дискретный временной ряд сейсмособытий (ряд О) в двумерный ряд X = [Е, О], связаны ли два данных ряда друг с другом, насколько удачно будет их разложение по общему базису?

Для ответа на этот вопрос проведем корреляционный анализ. Основной задачей корреляционного анализа является измерение тесноты связи между переменными, путем точечной интервальной оценок соответствующих коэффициентов. В дисперсионном анализе исследуется влияние одного или нескольких качественных показателей на количественный. В однофакторном дисперсионном анализе на одну количественную переменную У оказывает влияние один фактор, наблюдаемый на к уровнях. Общая схема дисперсионного анализа изложена в [7].

Наблюдаемые данные обозначим у^, где г — индекс уровня (г = 1,... ,к), ] — индекс наблюдения на г-м уровне, ] = 1,... ,пг. В нашем случае у^ — это предсказанный сейсмособытия, а факторами являются собственные числа. При расчетах дисперсионного анализа приняты данные сейсмической активности и показаний измерений геодинамических поляризационных потенциа-

лов за 2007 год (табл. 1). Требуется исследовать влияние различных видов группировок собственных троек на качество прогноза сейсмособытий.

Под качеством мы будем рассматривать такие случаи, когда после диагонального усреднения отдельно по каждой из т аддитивной составляющей ряда X, (в частности, сейсмоактивной составляющей ряда Х1т — О), такой ряд будет содержать с определенной доли погрешности, точки сейсмособытий большой магнитуды (М > 6 баллов), т.к. именно такие сейсмособытия являются наиболее опасными для человечества.

Под типом группировки будем понимать отношение ^2ке1 Хк/^2г=1 Хг, которое отражает вклад составляющей, восстановленной по группе компонент I С {1,...,!}, в разложение исходного ряда.

Таблица 1

Исходные данные для дисперсионного анализа

Тип группировки ^2ке1 Хк/ ¿=1 Х Число восстановленных сейсмособытий при заданной группировке Магнитуды восстановленных сейсмособытий

0,8 5 6,5; 7,0; 6,2; 6,0; 7,3

0,15 8 7,5; 7,2; 6,2; 6,7; 7,0; 6,1; 7,1; 6,8

0,05 6 6,3; 7,1; 6,7; 7,5; 8,0; 7,4

Расчеты показали, что при различных группировках собственных троек, средние значения магнитуды сейсмособытий (после диагонального усреднения, получения аддитивной составляющей ряда) — различны.

Процедуру определения времени (и силы) предстоящих сейсмособытий можно представить в виде:

а) выбираем на участке сигнала отрезок для прогнозирования [¿о,Ь] шириной Т = Ь — ¿о;

б) проводим сингулярное разложение двумерного временного ряда X = = [Е, О], определив заранее ширину гусеницы Ь;

в) проводим процедуру группировки (описанную выше п.1-п.4);

г) строим рекуррентный прогноз на М отсчетов вперед ряда X, а, следовательно, и ряда О — прогноз сейсмособытий;

д) сдвигаемся на 1 шаг вперед, [¿о + 1,Ь + 1], и повторяем шаги (а)-(г). Таким образом, была предложена концепция определения времени предстоящих сейсмособытий на основе анализа временных рядов методом «Гусе-ница»-8ЯЛ и его адаптация для работы в автономном режиме.

Список литературы

1. Голяндина Н.Э. Метод «Гусеница»-88Л:прогноз временных рядов. СПб.: СПбГУ, 2004. 78 с.

2. Чистова Г.К. Модели и методы обработки сейсмических сигналов в системах распознавания. Пенза: ПГУ, 2004. 230 с.

3. Eisner J, Tsonis A. Singular Spectrum Analysis. A New Tool in Time Series Analysis. N. Y.: Plenum Press, 1996. 163 p.

4. Данилов Д.Л. Метод «Гусеница» для прогнозирования временных рядов. СПб.: Пресском, 1997. 213 с.

5. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1972. 355 с.

6. Александров Ф.И., Голяндина Н.Э. Автоматизация выделения трендовых и периодических составляющих временного ряда в рамках метода «Гусеница>SSA // Exponenta Pro. Математика в приложениях. 2004. Вып.3-4. С.54-61.

7. Кочетыгов А.А. Теория вероятностей и математическая статистика. Тула: Тул-ГУ, 2006. 320 с.

8. Афанасьев И.А. Концепция прогнозирования сейсмособытий на основе экспериментальных данных различной природы // Изв. ТулГУ. Естественные науки. 2008. Вып.2. C.147-159

Афанасьев Игорь Александрович ([email protected]), аспирант, кафедра прикладной математики и информатики, Тульский государственный

университет.

Adapting «Caterpillars»-SSA method for working offline in order to earthquakes’ prediction

I.A. Afanasiev

Abstract. In this paper we perform the earthquakes prediction concept using the data from the instrument system. Using the method of «Caterpillar»-SSA we solve the problem of predicting the time of future earthquakes. Performed a modernization of the «Caterpillar»-SSA method for using in automatic mode.

Keywords: time series, the method of «Caterpillar»-SSA, a statistical analysis.

Afanasiev Igor ([email protected]), postgraduate student, department of applied mathematics and computer science, Tula State University.

Поступила 14.05.2010

i Надоели баннеры? Вы всегда можете отключить рекламу.