Научная статья на тему 'Модели трендов климатических характеристик и их прогностические возможности'

Модели трендов климатических характеристик и их прогностические возможности Текст научной статьи по специальности «Математика»

CC BY
424
67
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
iPolytech Journal
ВАК
Область наук
Ключевые слова
ВРЕМЕННОЙ РЯД / TIME SERIES / ТРЕНДОВЫЕ МОДЕЛИ / TREND MODELS / ПРОГНОЗИРОВАНИЕ / FORECASTING / СТОХАСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ / STOCHASTIC MODELING

Аннотация научной статьи по математике, автор научной работы — Чекмарёв Аркадий Александрович

В рамках работ по построению региональной климатической модели, входящих в план научных исследований лаборатории гидрологии и климатологии Института географии СО РАН, необходимо было оценить правомерность и возможность использования трендовых моделей для прогнозирования климатических характеристик. В статье приведены результаты исследования по сравнению предсказательных способностей трендовых моделей, построенных с использованием различных математических операторов, аппроксимирующих локальную или глобальную тенденцию изменения переменных во времени. В качестве исходных данных в работе были использованы временные ряды годовых значений повторяемости элементарных механизмов атмосферной циркуляции по Б.Л. Дзердзеевскому.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLIMATIC CHARACTERISTIC TREND MODELS AND THEIR PREDICTIVE CAPABILITIES

In the framework of developments on the construction of a regional climatic model that has been included in the plan of the scientific researches of the Hydrology and Climatology laboratory of the Institute of Geography SB RAS there is the need to estimate the validity and applicability of trend models for climatic characteristic forecasting. The article reports on the research results of comparison of trend model predictive capabilities. Each model is built with the use of different mathematical operators approximating local or global trends in variable changes in time. The time series of annual values of atmospheric circulation elementary mechanism frequency by B.L. Dzerdzeevsky`s method have been used as input data.

Текст научной работы на тему «Модели трендов климатических характеристик и их прогностические возможности»

УДК 911[519]

МОДЕЛИ ТРЕНДОВ КЛИМАТИЧЕСКИХ ХАРАКТЕРИСТИК И ИХ ПРОГНОСТИЧЕСКИЕ ВОЗМОЖНОСТИ

© А.А. Чекмарёв1

Иркутский национальный исследовательский технический университет, 664074, Россия, г. Иркутск, ул. Лермонтова, 83.

В рамках работ по построению региональной климатической модели, входящих в план научных исследований лаборатории гидрологии и климатологии Института географии СО РАН, необходимо было оценить правомерность и возможность использования трендовых моделей для прогнозирования климатических характеристик. В статье приведены результаты исследования по сравнению предсказательных способностей трендовых моделей, построенных с использованием различных математических операторов, аппроксимирующих локальную или глобальную тенденцию изменения переменных во времени. В качестве исходных данных в работе были использованы временные ряды годовых значений повторяемости элементарных механизмов атмосферной циркуляции по Б.Л. Дзердзеевскому.

Ключевые слова: временной ряд; трендовые модели; прогнозирование; стохастическое моделирование.

CLIMATIC CHARACTERISTIC TREND MODELS AND THEIR PREDICTIVE CAPABILITIES A.A. Chekmarev

Irkutsk National Research Technical University, 83 Lermontov St., Irkutsk, 664074, Russia.

In the framework of developments on the construction of a regional climatic model that has been included in the plan of the scientific researches of the Hydrology and Climatology laboratory of the Institute of Geography SB RAS there is the need to estimate the validity and applicability of trend models for climatic characteristic forecasting. The article reports on the research results of comparison of trend model predictive capabilities. Each model is built with the use of different mathematical operators approximating local or global trends in variable changes in time. The time series of annual values of atmospheric circulation elementary mechanism frequency by B.L. Dzerdzeevsky's method have been used as input data.

Keywords: time series; trend models; forecasting; stochastic modeling.

Важной научно-технической задачей для погодозависимых отраслей экономики является получение прогностических оценок климатических и гидрологических параметров с заблаговременностью от месяца до нескольких лет [1]. Например, такие задачи актуальны для отраслей энергетики (прогнозирование стока рек), сельского хозяйства (прогнозирование средней месячной температуры и осадков), аварийно-спасательных служб (прогнозирование опасных климатических явлений) и т.п.

Типичные данные о динамике климатических характеристик представляют собой ряды их значений, заданные с некоторым постоянным шагом по времени. Часто выделяют три компоненты изменчивости временного ряда:

• эволюционная составляющая или

тренд;

• циклическая составляющая;

• стохастическая (или случайная) компонента.

Один из способов статистического прогнозирования временного ряда - это выявление и экстраполяция его основной тенденции, т.е. построение трендовой модели ряда. Этот метод применяется чаще всего тогда, когда отсутствует информация о взаимосвязи прогнозируемой характеристики и ее предикторов, либо когда список возможных предикторов слишком велик и нельзя выделить из них наиболее существенные. В этом случае ход изменения выбранной характеристики пытаются связать не с внешними факторами, а с предысторией исходного ряда (авторегрессионная модель) или строят модель тренда - сглаженную зависимость этой характеристики от времени.

1

Чекмарёв Аркадий Александрович, аспирант, тел.: 89148204818, e-mail: cvv32@yandex.ru Chekmaryov Arkady, Postgraduate, tel.: 89148204818, e-mail: cvv32@yandex.ru

Как правило, классификация трен-довых моделей основана на типе используемого для аппроксимации ряда математического оператора. В зависимости от используемого оператора можно выделить следующие типы моделей: линейные, параболические, экспоненциальные, логарифмические, гиперболические, синусоидальные, логистические или Б-образные тренды и т.д. Успех применения той или иной модели зависит от особенностей исходного временного ряда, т.е. наблюдается ли в его эволюционной составляющей равномерное, равноускоренное или равноза-медленное изменение, развитие с изменяющимся ускорением и т.д.

Трендовые модели применяются во всех задачах, где требуется изучение основной тенденции развития, определенной характеристики. В частности, эти методы широко используются в задачах моделирования и прогнозирования локальных или региональных климатических характеристик [2, 4], а также в экономических задачах [3], медицинских работах [5] и т.д. Тренды гидрометеорологических характеристик чаще всего связывают с глобальным изменением климата [6].

Постановка задачи

Лабораторией гидрологии и климатологии Института географии им. В.Б. Со-чавы СО РАН в кооперации с другими организациями и исследователями ведется

разработка проекта, в рамках которого предполагается построение стохастической региональной климатической модели. Выполнение этой работы требует использования множества разных данных и методов, участия экспертов в области гидрометеорологии, специалистов по методам моделирования и программистов. Проект ориентирован на получение прогностических результатов прикладного характера.

Схема взаимодействия различных частей и участников проекта представлена на рис. 1.

Научный продукт, создаваемый в рамках названного выше проекта, реализуется в виде комплекса компьютерных программ и баз данных. Основной задачей этого комплекса является получение среднесрочных и долгосрочных прогнозов различных компонентов климата (в отдельных географических точках) в вероятностной форме. Для каждой климатической характеристики, по которой имеются данные в виде временного ряда, составляется своя частная стохастическая модель или набор моделей. Частные модели могут быть построены на основе статистических связей либо с учетом физики процесса. Прогноз строится как результат объединения прогнозных оценок по частным моделям и представляется в форме оценки плотности распределения вероятностей.

Рис. 1. Общая схема построения региональной климатической модели и получения с ее использованием прикладных климатических прогнозов

Как видно из схемы, составление частных моделей является прерогативой экспертов-климатологов, которые лучше знакомы с конкретными характеристиками климата и с отдельными физико-географическими регионами. Однако в связи с недостатком сведений о необходимых законах несмотря на большое количество исходных данных, часто затруднительно построить физическую модель прогнозируемого процесса. В таких случаях можно пытаться использовать модели, основанные на статистических закономерностях.

Ряд частных стохастических моделей может быть реализован в форме трендов, т.е. сглаженных аппроксимаций зависимости климатических переменных от времени. Поэтому целесообразно выяснить, какой тип трендовых моделей будет наилучшим образом прогнозировать эволюционную составляющую климатических временных рядов. Для решения такой задачи необходимо построить различные трендовые модели для одной и той же группы временных рядов и сравнить между собой их прогностические возможности.

Описание исходных данных и используемого инструмента моделирования

В качестве проверочного материала для сравнения различных моделей были использованы индексы атмосферной циркуляции по Б.Л. Дзердзеевскому [7], представляющие собой 41 временной ряд частот реализации элементарных циркуляционных механизмов (ЭЦМ). Выбранные временные ряды охватывают период с 1899 по 2012 гг. с шагом один год. Определение типа ЭЦМ осуществлялось по синоптическим картам. В случаях, когда не удавалось определить тип ЭЦМ, он записывался в отдельный ряд (т.е. 41 ряд - ЭЦМ и один ряд «вне типа»). В первой половине XX в. таких случаев было больше, возможно это связано с отсутствием карт барической топографии в те годы. В связи с чем некоторые ряды по этой причине могут быть в значительной мере нестационарными.

Построение моделей трендов и контрольные прогностические расчеты произ-

водились с помощью программного пакета «Стохастическое моделирование» [8]. Данный программный продукт предназначен для построения и исследования моделей многофакторной стохастической зависимости переменных, а также для применения построенных моделей в задачах расчета и прогноза. Под элементарной моделью в рамках этого пакета понимается реализованное средствами программы описание стохастической взаимосвязи между значениями одной переменной, рассматриваемой как функция, и значениями других переменных, рассматриваемых как ее аргументы. В частности, модели трендов являются примерами таких элементарных моделей.

Выбор в пользу этого программного пакета был сделан потому, что большинство моделей для упомянутого выше проекта строятся с использованием его инструментария. Он также удобен для построения и сравнения между собой различных трендовых моделей.

Описание сравниваемых моделей

В ходе работы строились и проверялись по прогностическим возможностям следующие типы трендовых моделей.

Линейные тренды, которые моделируют временной ряд с постоянной скоростью изменения тренда. Формулу оператора, аппроксимирующего эволюционную составляющую временного ряда для такой модели, можно записать в виде:

у (г ) = ахг + а0, (1)

где г - переменная, задающая привязку данных по времени; у(г) - вычисляемая оценка эволюционной составляющей; а, а - настраиваемые по исходным данным

параметры модели.

Квадратичные тренды, моделирующие временной ряд с постоянным ускорением изменения тренда:

у (г) = а2г2 + а/ + а0 , (2)

обозначения в формуле (2) такие же, что и в формуле (1).

Модели простого локального (скользящего) среднего (ПЛС). Такие операторы

могут моделировать тренд с изменяющемся скоростью и ускорением. Формула модели:

1 m

У (t )=- Е у-, (3)

m

где m - количество локальных значений исходной функции, используемых для расчета скользящего среднего; у_г - значение

исходной функции в момент времени, отдаленный от t на i интервалов.

Два типа модифицированных моделей скользящего среднего.

Модель локальной линейной экстраполяции (ЛЛЭ):

1 m

y(t) = -ЕУ-, +y'(t)*|t, (4) m

где y'(t) - локальная сглаженная численная оценка первой производной от исходной функции по времени; T - точка на

временной оси, в окрестности которой вычисляются сглаженные осреднением значения исходного ряда и его производной по времени; |t -T| - расстояние между точками t и T ■

Модель локальной квадратичной экстраполяции (ЛКЭ): У (t ) =

1 m 2, (5)

=-Еу-+y'(t)*\t-Ч+05 *y-(t)*\t -ti2

m -=-

где y"(t) - локальная сглаженная численная оценка второй производной от исходной функции по времени, остальное как в формуле (4).

Пояснение отличия модифицированных моделей скользящего среднего (ЛЛЭ и ЛКЭ) от модели ПЛС приведено на рис. 2. Оно состоит в том, что при экстраполяции ряда кроме среднего значения ближайших m-точек функции в прогнозную оценку входит и приращения, рассчитываемые на основе численной оценки сглаженного значения 1-й и 2-й производной для ЛЛЭ и ЛКЭ соответственно.

Подбор оптимальных значений параметров модели для всех проверяемых математических операторов осуществлялся по критерию точности аппроксимации

временного ряда его модельной оценкой. В качестве такого критерия был выбран классический параметр - средний квадрат отклонения значений ряда от его модельной трендовой составляющей. Пример аппроксимации одного из использованных в работе рядов (ЭЦМ 12а) различными моделями трендов показан на рис. 3.

Среднее многолетнее значение ряда частоты повторяемости ЭЦМ 12а равняется 16 дней в году. Отмечаются два периода с устойчиво повышенной повторяемостью: 1960-1978 и 1993-2004 гг. В последнее десятилетие годовая частота повторяемости этого циркуляционного механизма наиболее высока. Описанный характер поведения ряда, как это видно на рис. 3, лучше аппроксимируется моделями (3)-(5), чем моделями (1)-(2). Однако важно отметить, что лучшее качество аппроксимации еще не гарантирует получение более точного прогноза.

Сравнение прогностических возможностей разных моделей трендов

Прогностические возможности различных моделей трендов оценивались на независимых контрольных данных, т.е. тех, которые не использовались для построения моделей трендов.

В качестве критерия качества прогноза (К) использовалось отношение фактической средней квадратичной ошибки прогноза по модели к фактической средней квадратичной ошибке аналогичного прогноза по «норме»:

к = я/ а,

где

5 =

1

n

Е[у- -У- (t)]

а =

n

1

Е[ у- - У ]

i=1

; n

n

- число шагов прогноза; уе - прогноз по норме (медиана оценки безусловного эмпирического распределения); ум (7) - медиана прогнозной модельной оценки предсказываемой характеристики; у - фактическое значение прогнозируемой характеристики на контрольной выборке.

2

1=1

Рис. 2. Схема, поясняющая различие экстраполяции ряда наблюдений с использованием различных

моделей скользящего среднего

Рис. 3. Сравнение аппроксимации ряда ЭЦМ 12а различными трендовыми моделями: 1 - медиана расчетной оценки; 2 - фактическое значение; 3 - плотность вероятности:

темнее цвет - выше плотность

Для обеспечения большей статистической значимости различий в использовании разных моделей трендов для прогноза производилось осреднение критериев качества по всем прогнозируемым характеристикам. Чтобы еще больше снизить зависимость качества прогноза от выбора контрольного отрезка времени, производилось осреднение критериев для прогнозов,

качество которых проверялось на разных контрольных выборках. Длина контрольных выборок в каждом варианте эксперимента для каждой переменной составляла 3 года. Первая выборка - 2005-2007 гг., последняя выборка - 2010-2012 гг. Для каждого варианта разделения данных на обучающую и контрольную выборки производилось переобучение моделей.

Усредненные значения оценок критерия качества прогнозов (к), построенных с использованием различных моделей трендов

Номер эксперимента Начальная дата, г. Критерий качества прогнозов (к)

Линейная модель Квадратичная модель ПЛС ЛЛЭ ЛКЭ

1 2005 0,9 1,1 0,8 0,68 0,66

2 2006 0,9 1,1 0,8 0,69 0,65

3 2007 0,94 1,1 0,8 0,63 0,69

4 2008 0,88 0,98 0,7 0,63 0,67

5 2009 0,91 0,94 0,69 0,62 0,71

6 2010 0,91 0,91 0,68 0,53 0,57

Среднее значение 0,91 1,02 0,75 0,63 0,66

Стандартное отклонение среднего значения 0,01 0,04 0,02 0,02 0,02

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Результаты эксперимента по сравнению прогностических возможностей различных моделей трендов, выполненного описанным выше способом, представлены в таблице.

Анализ таблицы показывает, что наихудший результат прогнозирования получается при использовании квадратичных моделей тренда. В среднем прогноз по этим моделям даже менее точный, чем прогноз по «норме». Линейные модели тренда улучшают прогноз по сравнению с прогнозом по «норме», но это улучшение незначительно (приблизительно на 10%). Наиболее эффективными для прогнозирования выбранных данных оказались модели скользящего среднего. Лучший результат показал эксперимент с использованием модели локальной линейной экстраполяции. Однако точность прогнозирования по этой модели лишь немного лучше точности прогнозов по модели локальной квадратичной экстраполяции. Результаты применения обоих типов моделей (ЛКЭ и ЛЛЭ) статистически неразличимы. С учетом полученных результатов для прогнозирования рассмотренной группы климатических характери-

Библиогра

1. О климатической доктрине Российской Федерации: распоряж. Президента РФ от 17 декабря 2009 г. № 861-рп [Электронный ресурс]. URL: http://www. meteorf. ru/documents/9/68/ (01.11.2014).

2. Кирста Ю.Б. Прогноз климата агроклиматического потенциала Сибирского федерального округа до 2020 года // Проблемы региональной экологии.

2011. № 3. С. 22-30.

3. Серебрякова Н.А., Грищенко Н.В. Прогнозирование экономических показателей на основе трендовых моделей // Финансы. Экономика. Стратегия.

2012. № 3. С. 55-59.

4. Мяч Л.Т., Болтнева Л.И., Шерстюков Б.Г. Изменения климатических условий и температуры грунтов в районе озера Байкал во второй половине ХХ и в начале XXI века // Криосфера Земли. 2011. Т. XV.

стик можно рекомендовать модель ЛЛЭ, давшую лучший результат в эксперименте, и как более простую по сравнению с моделью ЛКЭ.

Подводя итог выполненной работе, можно сказать следующее:

• трендовые модели рядов индексов циркуляции атмосферы могут использоваться для прогноза этих характеристик на несколько лет вперед;

• наиболее значительное улучшение прогноза относительно прогноза по «норме» (приблизительно 35%) показало применение модифицированных моделей скользящего среднего, использующих для экстраполяции ряда не только оценки его локального среднего значения, но и оценки 1-й и 2-й производных от этого среднего по времени.

Возможно, сделанные по результатам данной работы выводы справедливы и в иных случаях, но для их распространения (или нераспространения) на другие характеристики (и не только климатические) требуются специальные исследования.

Статья поступила 08.04.2015 г.

кии список

№ 1. С. 80-90.

5. Красильников А.В., Жданова Т.Р., Кордумов М.Ю. Особенности заболеваемости раком молочной железы в Архангельской области // Экология человека. 2004. № 4. С. 31-34.

6. Данилов А.Д. Симпозиум по трендам в атмосфере // Гелиогеофизические исследования. 2012. Вып. 2. С. 47-53.

7. Колебания циркуляции атмосферы северного полушария в XX - начале XXI века [Электронный ресурс]. URL: http://atmospheric-circulation.ru/datas/ (10.10.2014).

8. Игнатов А.В., Кравченко В.В., Чекмарёв А.А. Стохастическое моделирование: пакет программ [Электронный ресурс]. URL: http://irigs.irk.ru/work (13.10.2014).

i Надоели баннеры? Вы всегда можете отключить рекламу.