ГЕОГРАФИЯ
НАУЧНЫЙ ОТДЕЛ
Известия Саратовского университета. Новая серия. Серия: Науки о Земле. 2022. Т. 22, вып. 4. С. 230-234
Izvestiya of Saratov University. Earth Sciences, 2022, vol. 22, iss. 4, pp. 230-234 https://geo.sgu.ru https://doi.org/10.18500/1819-7663-2022-22-4-230-234, EDN: LPKOEH
Научная статья УДК 551.5
Применение моделей временных рядов для прогноза аномалии глобальной температуры
М. Б. Богданов, С. В. Морозова0, М. А. Алимпиева
Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского, Россия, 410012, г. Саратов, ул. Астраханская, д. 83
Богданов Михаил Борисович, доктор физико-математических наук, [email protected], https://orcid.org/0000-0001-5305-8925
Морозова Светлана Владимировна, кандидат географических наук, доцент, [email protected], https://orcid.org/0000-0002-5216-976X
Алимпиева Мария Александровна, аспирант, [email protected], https://orcid.org/0000-0003-4422-8835
Аннотация. Спектральный анализ временного ряда среднегодовых значений аномалии глобально осредненной приповерхностной температуры показывает наличие гармониклунного нодального цикла с периодом 18.6 года, что может использоваться при прогнозе значений ряда. Рассматривались три модели ряда: авторегрессия AR(p), комбинированная модель авторегрессии - проинтегрированного скользящего среднего ARIMA(p,d,q) и искусственная нейронная сеть. Показано, что наилучшие результаты прогноза аномалии глобальной температуры на три года дает модель ARIMA(4,1,4).
Ключевые слова: прогнозирование, глобальная температура, модели временных рядов
Для цитирования: Богданов М. Б., Морозова С. В., Алимпиева М. А. Применение моделей временных рядов для прогноза аномалии глобальной температуры // Известия Саратовского университета. Новая серия. Серия: Науки о Земле. 2022. Т. 22, вып. 4. С. 230-234. https://doi.org/10.18500/1819-7663-2022-22-4-230-234, EDN: LPKOEH
Статья опубликована на условиях лицензии Creative Commons Attribution 4.0 International (CC-BY 4.0)
Article
Application of time series models for forecasting the global temperature anomalies M. B. Bogdanov, S. V. Morozova0, M. A. Alimpieva
Saratov State University, 83 Astrakhanskaya St., Saratov 410012, Russia
Mikhail B. Bogdanov, [email protected], https://orcid.org/0000-0001-5305-8925 Svetlana V. Morozova, [email protected], https://orcid.org/0000-0002-5216-976X Mariya A. Alimpieva, [email protected], https://orcid.org/0000-0003-4422-8835
Abstract. Spectral analysis of the time series for average annual values of the globally averaged surface temperature anomaly shows the presence of harmonics of the lunar nodal cycle with a period of 18.6 years, which can be used to predict the values of the series. Three models of the series were considered: autoregression AR(p), combined model of autoregression - integrated moving average ARIMA(p,d,q) and artificial neural network. It is shown that the ARIMA(4,1,4) model gives the best results for predicting the global temperature anomaly for three years. Keywords: forecasting, global temperature, time series models
For citation: Bogdanov M. B., Morozova S. V., Alimpieva M. A. Application of time series models for forecasting the global temperature anomalies. Izvestiya of Saratov University. Earth Sciences, 2022, vol. 22, iss. 4, рр. 230-234 (in Russian). https://doi.org/10.18500/1819-7663-2022-22-4-230-234, EDN: LPKOEH
This is an open access article distributed under the terms of Creative Commons Attribution 4.0 International License (CC0-BY 4.0)
© Богданов М. Б., Морозова С. ВАлимпиева М. А., 2022
М. Б. Богданов и др. Применение моделей временных рядов для прогноза аномалии
Введение
По мнению Межправительственной группы экспертов по изменению климата (МГЭИК, 1РСС) наблюдаемое глобальное потепление вызвано антропогенной эмиссией парниковых газов, в первую очередь диоксида углерода и метана [1]. Этот вывод основан на расчетах сложных моделей общей циркуляции атмосферы и океана (МОЦАО). Несмотря на многие проблемы, возникающие при проведении подобных расчетов [2], данный подход стремится использовать всю доступную на сегодня информацию о климатической системе Земли и является единственно возможным при прогнозе аномалии глобальной температуры на время, измеряемое несколькими десятилетиями.
Альтернативой МОЦАО является подход, основанный на представлении изменений глобальной температуры разными моделями временных рядов, который не использует никакой другой информации, кроме той, что содержится в самом анализируемом ряде. Например, применение цифровой фильтрации к анализу изменений температуры Северного полушария с середины XIX века позволило обнаружить циклы продолжительностью около 30 лет и 70 лет [3]. Анализ ряда зимних температур Центральной Англии также указывает на наличие 70-летнего цикла [4]. Учитывая сравнительно малую длину рядов, точность оценки продолжительности этих циклов невысока, но полученные результаты не зависят от климатических моделей.
Сравнительная редкость применения моделей временных рядов в метеорологии и климатологии имеет достаточно простое объяснение. С давних времен исследователи стремились использовать для прогнозов всю доступную синоптическую информацию или данные о характеристиках циркуляции атмосферы. Объем информации, включаемой в современные гидротермодинамические модели прогноза погоды или МОЦАО, не сравним с тем, что можно извлечь из анализа временных рядов. Тем не менее данный подход может оказаться полезным при оценке характеристик ряда и для прогноза значений ряда на время в два-три интервала отсчета.
Целью нашей статьи является применение разных моделей временных рядов для прогноза аномалии глобально осредненной приповерхностной температуры, включая линейное предсказание, комбинированную модель авторегрессии - проинтегрированного скользящего среднего (часто обозначаемую английской аббревиатурой ARIMA) и модель искусственной нейронной сети. Полученные результаты сравниваются как между собой, так и с наблюдательными данными.
Наблюдательные данные
Для чистоты опыта мы выполнили все прогнозные расчеты в начале 2019 года. Одним из наиболее надежных рядов данных о глобальной температуре в то время был ряд среднегодовой аномалии приповерхностной температуры AT(t), осредненной по Северному и Южному полушариям Земли, HadCRUT.4.6.0.0, полученный в Университете Восточной Англии. Методика расчета аномалии и описание ряда приведены в работе [5]. Начало временного ряда 1850 год, он содержал 169 отсчетов, использованных нами для построения его статистических моделей.
Поиск возможных периодических составляющих
Выше уже упоминалась возможность присутствия в аномалиях глобальной температуры долговременных циклов. Имея цель проведения прогноза на три интервала отсчета (три года), мы должны принимать во внимание возможность наличия в изменениях AT(t) составляющих с периодом порядка времени прогноза. Наиболее распространенным методом поиска периодических составляющих является цифровой спектральный анализ, который, однако, предполагает стационарность и эргодичность временного ряда. Очевидно, что наличие глобального потепления нарушает стационарность ряда. Для устранения тренда мы провели вычитание из отсчетов аномалии AT(t) значений скользящего среднего, вычисленного по 11 отсчетам. Данная процедура приводит к эффективному подавлению частот меньших 0.1 год-1 и обеспечивает стационарность полученного нового ряда.
Спектр мощности временного ряда отклонений аномалии от скользящего среднего S(f), рассчитанный с использованием метода MTM (multitaper method) [6] и компьютерной программы М. Е. Манна, приведен в линейном масштабе на рис. 1. Разрешение по частоте составляет 0.0126 год-1, что показано на рис. 1 горизонтальным отрезком. Штриховой линией отмечена верхняя граница 95%-го доверительного интервала для математического ожидания спектра. Доверительный интервал оценивался в предположении красного шума, представляемого моделью авторегрессии первого порядка AR(1), параметры которой определялись по спектру мощности, сглаженному медианной фильтрацией.
По виду графика S(f) можно судить о том, что в области низких частот f < 0.1 год-1 примененная нами процедура устранения нестационарности существенно подавляет спектр мощности. В этой области наблюдается только один пик с центральной частотой f0 = 0.0538 год-1, который формально не является статистически значимым. Однако в области свободной от подавления можно видеть статистически значимые пики спектра, соответствующие гармоникам этого периодического колебания, с частотами f1 =
= 2/ = 0.1075 год-1, / = 3/ = 0.1614 год-1 и /3 = 4/0 = 0.2152 год 1, которые отмечены данными символами на рис. 1. Частота /0 является фундаментальной для периода обращения линии узлов орбиты Луны, называемого также нодаль-ным циклом, равного 18.6 года.
Рис. 1. Спектр мощности отклонений аномалий глобально осредненной приповерхностной температуры от 11-летнего скользящего среднего
Еще один статистически значимый пик, обозначенный на рис. 1 символом /ш, связан с явлением Эль-Ниньо, оказывающим заметное влияние на глобальную температуру. Следует отметить, что наличие в изменениях АТ (г) гармоник /1 и /ш подтверждается также независимыми исследованиями [7, 8], авторы которых использовали другие ряды данных и разные методы спектрального анализа.
Присутствие гармоник нодального цикла, совпадающего с основным периодом нутации оси вращения Земли, свидетельствует о влиянии на глобальный климат процессов, происходящих в системе Земля - Луна. В первую очередь это приливные явления. Механизм климатического воздействия приливов был предложен в работе [7] и связан с усилением приливами вертикального перемешивания вод океана. При этом холодные воды из глубины поднимаются к поверхности и вызывают уменьшение приповерхностной температуры атмосферы. Оценки энергетики процессов показали, что мощность лунно-солнечного прилива вполне достаточна для обеспечения вертикального перемешивания океана, регистрируемого по данным спутниковой альтиметрии [9]. Проявление нодального цикла,
с которым изменяется максимальная величина склонения Луны, в изменении глобальной температуры рассматривалось также в работе [10].
Информация о присутствии в изменениях аномалии температуры нодального цикла получена из анализа самого временного ряда АТ (г) и в дальнейшем может использоваться при построении его моделей.
Модели временного ряда и данные прогноза
Наиболее простой подход к прогнозу, часто называемый линейным предсказанием [11], предполагает, что прогнозируемое значение центрированного временного ряда АТ (г), заданного равноотстоящими отсчетами, является линейной комбинацией р предшествующих значений. Другое название данного подхода - модель авторегрессии AR(р) порядка р. Нами было выбрано значение р = 20, при котором заведомо перекрывается продолжительность лунного нодального цикла.
Для оценки параметров модели и расчета прогнозируемых значений аномалии температуры на 2019, 2020 и 2021 годы были использованы компьютерные программы из известного руководства [11]. Полученные результаты представлены в таблице. В последней строке таблицы приведены значения АТ (г) ряда HadCRUT.4.6.0.0, опубликованные в начале 2022 года. При оценке качества прогноза в роли невязки выбрана сумма квадратов отклонений наблюдавшихся значений аномалий температуры от прогнозируемых Е(о-с)2. Величина невязки дана в последнем столбце таблицы.
Вторая использованная модель временного ряда АТ (г) представляет собой комбинированную модель авторегрессии - проинтегрированного скользящего среднего ARIMA(р, 1, д) [12], где р - порядок авторегрессии, 1 - номер разности, применяемой к отсчетам ряда, а д - порядок скользящего среднего. Расчет параметров модели и прогноз аномалии температуры на три года выполнялся с помощью разработанной Р. Х. Шам-веем (Shumway) [13] компьютерной программы ASTSA. Оптимальные значения параметров, подобранные с использованием информационного критерия Акайке, оказались равными: р = 4, 1 = 1 и д = 4. Полученные результаты для модели ARIMA(4,1,4) также приведены в таблице.
Прогнозируемые по разным моделям аномалии глобальной температуры, фактические значения и величины невязок
Модель Прогноз по годам, К Невязка Цо-с)2, К2
2019 2020 2021
AR(20) 0.623 0.649 0.637 0.0270
ARIMA(4,1,4) 0.679 0.727 0.745 0.0149
MLP 19-17-1 0.629 0.668 0.678 0.0225
Факт 0.736 0.768 0.645 0.0000
М. Б. Богданов и др. Применение моделей временных рядов для прогноза аномалии
Качество прогноза для этой модели оказывается существенно выше по сравнению с моделью AR(20).
Третья модель прогноза AT (t) использует искусственную нейронную сеть (ИНС) [14]. Этот подход основан на принципах работы мозга человека так, как понимает их современная физиология. В состав ИНС входит большое число связанных друг с другом элементов, называемых нейронами или узлами, каждый из которых может совершать нелинейное преобразование принятого сигнала, описываемое его функцией активации. Выходной сигнал нейрона передается на другие узлы, причем уровень передачи регулируется весовыми коэффициентами. Число нейронов, конкретный вид их функций активации и набор весовых коэффициентов определяются при обучении ИНС, в процессе которого моделируется анализируемый временной ряд. Прошедшая обучение ИНС применяется для прогноза значений ряда. В последнее время ИНС широко используются в разных исследованиях, в том числе в метеорологии и климатологии [15].
В качестве конкретного вида ИНС рассматривался многослойный персептрон (MLP). Это один из наиболее простых подходов. К настоящему времени предложены другие, существенно более мощные варианты ИНС, характеризуемые общим термином «глубокое обучение» ("deep learning"). Однако подобные сети требуют для обучения много тренировочных данных - большой длины временного ряда. При сравнительно малом объеме обучающей выборки, как в нашем случае, они даже могут давать худшие результаты по сравнению с простыми вариантами ИНС [14].
Мы использовали компьютерную программу автоматического поиска параметров оптимальной ИНС из известного приложения STATISTICA (версия 8.0). Она позволяет также привлечь информацию о наличии периодических составляющих в анализируемом временном ряду. При этом продолжительность нодального цикла была округлена до целого числа. В процессе подбора параметров сети варьируется число узлов и рассматриваются разные функции активации.
В результате была получена оптимальная модель MLP 19-17-1. Этот многослойный персептрон содержит 19 входных нейронов, 17 скрытых нейронов и один выходной нейрон. В качестве функции активации скрытых нейронов используется гиперболический тангенс, а выходного нейрона - идентичность. Результаты прогноза по модели ИНС и оценка его качества также приведены в таблице.
Обсуждение результатов
Анализ данных таблицы показывает, что наилучшие результаты прогноза временного ряда AT (t) получаются с применением модели
ARIMA(4,1,4). Две другие модели заметно уступают ей в точности прогноза. Результаты сравнения прогноза по модели ARIMA(4,1,4) с фактическими значениями представлены на рис. 2.
Тонкой линией со светлыми кружками показаны отсчеты ряда HadCRUT.4.6.0.0 с 1850 по 2021 год, а темными кружками с вертикальными отрезками - прогнозировавшиеся значения для трех лет. Длина вертикальных отрезков соответствует 95%-ым доверительным интервалам для математического ожидания аномалии температуры. Видно, что эти интервалы быстро растут со временем прогноза и применение данной модели к предсказаниям на время, превышающее три года, формально не имеет смысла. В то же время на трехлетнем интервале модель обеспечивает достаточно хороший прогноз. Примеры применения моделей ARIMA(р, й, д) в метеорологии и ссылки на другие работы можно найти в статье [16].
1850 1900 1950 2000 t, г
Рис. 2. Среднегодовые значения аномалии глобально осредненной температуры (линия со светлыми кружками) и прогноз на три года (темные кружки с 95%-ным доверительными интервалами)
Как и можно было ожидать, при сравнении результатов простейшая модель AR(20) по точности прогноза оказывается на последнем месте. Но невысокое качество прогноза с использованием ИНС довольно неожиданно, так как она представляет собой нелинейную модель с большим числом степеней свободы. Возможно, что здесь проявляют себя сравнительно небольшая длина и нестационарность временного ряда АГ(I). Прогноз временных рядов не самое успешное приложение ИНС, в отличие от задачи распознавания образов, при решении которой данные сети находятся вне конкуренции.
Выводы
Подход, основанный на представлении изменений глобальной температуры разными моделями временных рядов, который не использует никакой другой информации, кроме той, что содержится в самом анализируемом ряду, позволяет осуществлять прогноз на два-три интервала отсчета. Наилучшие результаты прогноза на три года получены при использовании модели авторегрессии - проинтегрированного скользящего среднего АММЛ(4,1,4).
Ряд аномалии глобально осредненной приповерхностной температуры не является стационарным и содержит периодическую составляющую лунного нодального цикла в 18.6 года. Он представляет собой типичный временной ряд, встречающийся в метеорологии и климатологии. Поэтому можно ожидать, что применение подобных моделей позволит прогнозировать изменение и других характеристик погоды и климата.
Библиографический список
1. Climate Change 2021: The Physical Science Basis. Contribution of Working Group I to the Sixth Assessment Report of the Intergovernmental Panel on Climate Change / eds. V. P. Masson-Delmotte [et al.]. URL: https://www.ipcc. ch/report/sixth-assessment-report-working- group-i/ (дата обращения: 25.07.22).
2. Дымников В. П., Лыкосов В. Н., Володин Е. М. Моделирование климата и его изменений : современные проблемы // Вестник РАН. 2012. Т. 82, № 3. С. 227-336.
3. Переведенцев Ю. П., Вильфанд Р. М., Шанталин-ский К. М., Гурьянов В. В., Николаев А. А., Исмагилов Н. В. Мониторинг и прогнозирование климатической изменчивости на территории Приволжского федерального округа // Гидрометеорологические исследования и прогнозы. 2019. № 1 (371). С. 67-94.
4. Шерстюков Б. Г. Колебательная система климата, резонансы, дальние связи, прогнозы. Обнинск : ФГБУ «ВНИИГМИ-МЦД», 2021. 222 с.
5. Morice C. P., Kennedy J. J., Rayner N. A., Jones P. D. Quantifying uncertainties in global and regional temperature change using an ensemble of observational estimates: The HadCRUT4 dataset // Journal of Geophysical Research. 2012. Vol. 117. D08101. https://doi.org/10.1029/2011JD017187
6. Ghil M., Allen M. R., Dettinger M. D., Ide K., Kondrashov D., Mann M.E., Robertson A. W., Saunders A.,
Tian Y., Varadi F., Yiou P. Advanced spectral methods for climatic time series // Rev. Geophys. 2002. Vol. 40. 3.1-3.41. https://doi.org/10.1029/2000RG000092
7. Keeling C. D., Whorf T. P. Possible forcing of global temperature by the oceanic tides // Proc. National Acad. Sci. USA. 1997. Vol. 94. P. 8321-8328.
8. Scafetta N. Reconstruction of the Interannual to Millennial Scale Patterns of the Global Surface Temperature // Atmosphere. 2021. Vol. 12. P. 147.
9. Munk W. H., Wunsch C. Abyssal recipes II: Energetics of tidal and wind mixing // Deep-Sea Res. 1998. Vol. 45. P. 1977-2010.
10. Ray R. D. Decadal Climate Variability: Is There a Tidal Connection? // Journal of Climate. 2007. Vol. 20. P. 35423560.
11. Press W. H., Teukolsky S. A., Vetterling W. T, Flannery B. P. Numerical Recipes in Fortran 77. The Art of Scientific Computing. Cambridge : Press Syndicate of the University of Cambridge, 1997. 1004 p.
12. Бокс Д., Дженкинс Г. Анализ временных рядов. Прогноз и управление : в 2 выпусках. Вып. 1. Москва : Мир, 1974. 406 с.
13. Shumway R. H., Stoffer D. S. Time Series Analysis and Its Applications. New York : Springer Verlag, 2000. 549 p.
14. Аггарвал Ч. Нейронные сети и глубокое обучение : учебный курс. Санкт-Петербург : ООО «Диалектика», 2020. 752 с.
15. Tran T. T. K., Bateni S. M., Ki S. J., Vosoughifar H. A Review of Neural Networks for Air Temperature Forecasting // Water. 2021. Vol. 13. 1294 p. https://doi.org/ 10.3390/w13091294
16. Lai Y., Dzombak D. A. Use of the Autoregressive Integrated Moving Average (ARIMA) Model to Forecast Near-Term Regional Temperature and Precipitation // Weather and Forecasting. 2020. Vol. 35, iss. 3. P. 959-976.
Поступила в редакцию 15.08.2022; одобрена после рецензирования 30.08.2022; принята к публикации 01.09.2022 The article was submitted 15.08.2022; approved after reviewing 30.08.2022; accepted for publication 01.09.2022