(cc)
http://dx.doi.org/10.35596/1729-7648-2020-18-1-96-103
Оригинальная статья Original paper
УДК 551.509
СТАТИСТИЧЕСКАЯ ОБРАБОТКА МЕТЕОРОЛОГИЧЕСКИХ ДАННЫХ ДЛЯ ВЫВОДОВ О НАЛИЧИИ ВРЕМЕННЫХ ТРЕНДОВ
МУХА ВС.
Белорусский государственный университет информатики и радиоэлектроники (г. Минск, Республика Беларусь)
Поступила в редакцию 5 октября 2017
© Белорусский государственный университет информатики и радиоэлектроники, 2020
Аннотация. На примере исследования изменения средних годовых значений температуры атмосферного воздуха на метеостанции Минск с 1998 года излагается методика обработки метеорологических данных для выводов о наличии линейных временных трендов количественных характеристик погоды. Средние годовые значения температуры, полученные по результатам обработки имеющихся метеорологических данных, аппроксимируются методом наименьших квадратов линейной регрессионной зависимостью от времени. Полученная таким образом линейная функция регрессии для средних годовых значений температуры атмосферного воздуха имеет некоторый рост с течением времени (положительный временной тренд). В работе ставится задача выяснения значимости такого тренда. Для этого предлагается использовать регрессионный анализ с его процедурами проверки гипотез. Прежде всего проверяется выполнимость требований, предъявляемых к регрессионному анализу: нормальности распределения возмущений и однородности дисперсии возмущений. Нормальность распределения возмущений проверена и подтверждена критерием согласия Колмогорова. Однородность дисперсии проверена и подтверждена проверкой гипотезы о равенстве дисперсий двух нормальных распределений и критерием Смирнова для проверки гипотезы о равенстве двух распределений. Для проверки значимости положительного тренда средней годовой температуры проверялись гипотезы о значимости коэффициентов линейной функции регрессии с помощью /-статистики с распределением Стьюдента и гипотеза о существовании линейной связи с помощью /-статистики с распределением Фишера (дисперсионный анализ). В результате проверки указанных гипотез на уровне значимости 0,05 установлена незначимость положительного линейного тренда средней годовой температуры атмосферного воздуха на метеостанции Минск в периоды с 1998 по 2016 год и с 1998 по 2017 год и его значимость в периоды с 1998 по 2018 год и с 1998 по 2019 год.
Ключевые слова: регрессионный анализ, дисперсионный анализ, статистическая проверка гипотез, парниковый эффект, глобальное потепление.
Конфликт интересов. Автор заявляет об отсутствии конфликта интересов.
Для цитирования. Муха В.С. Статистическая обработка метеорологических данных для выводов о наличии временных трендов. Доклады БГУИР. 2020; 18(1): 96-103.
STATISTICAL PROCESSING OF THE METEOROLOGICAL DATA FOR CONCLUSION ON THE PRESENCE OF THE TIME TRENDS
VLADIMIR S. MUKHA
Belarusian State University of Informatics and Radioelectronics (Minsk, Belarus)
Submitted 5 October 2017
© Belarusian State University of Informatics and Radioelectronics, 2020
Abstract. The technic of the processing of the meteorological data for conclusion on the presence of the time trends in the quantitative characteristics of the weather on the example of the analysis of the average yearly atmospheric temperature change at the meteorological station Minsk from 1989 is presented. The average yearly atmospheric temperature received from the measurements is approximated by the least square error method in the linear time dependence regression function. The linear time dependence regression function received in such a way has some positive growing (positive trend). The aim of this paper is to clarify the significance of this growth. For this aim, the usage of the regression analysis with its procedures of hypotheses testing is proposed. First of all, the performing of the demands presented to the regression analysis is checked: normality of the distribution of the disturbance and the homogeneity of the variance (dispersion) of the disturbance. The normality of the distribution of the disturbance was checked and confirmed by the Kolmogorov test. The homogeneity of the dispersion of the disturbance was checked and confirmed both by checking the hypotheses on the equality of the dispersions of two normal distributions and by the Smirnov test for checking the hypotheses on the equality of two distributions. For checking the significance of the positive trend of the yearly mean temperature, the hypotheses on the significance of the coefficients of the linear regression function by the Student t-statistics and the hypothesis on the linear connection presence by the analysis of variance were checked. As the result, the insignificance of the positive linear trend from 1998 to 2016 and from 1998 to 2017 and its significance from 1998 to 2018 and from 1998 to 2019 on the level of significance 0.05 for mean average yearly atmospheric temperature at the meteorological station Minsk was stated.
Keywords: regression analysis, analysis of variance, testing of statistical hypotheses, greenhouse effect, global warming.
Conflict of interests. The author declares no conflict of interests.
For citation. Mukha V.S. Statistical processing of the meteorological data for conclusion on the presence of the time trends. Doklady BGUIR. 2020; 18(1): 96-103.
Введение
Всемирной метеорологической организацией (ВМО) и Программой ООН по окружающей среде (ЮНЕП) в 1988 году была создана межправительственная группа экспертов по изменению климата (МГЭИК, англ. Intergovernmental Panel on Climate Change, IPCC) для оценки риска глобального изменения климата, вызванного техногенными факторами. До настоящего времени МГЭИК выпустила пять оценочных докладов, посвященных состоянию климата Земли и оценке его изменения в будущем. Пятый оценочный доклад выпущен в 2013-2014 гг.
Отправной точкой первого оценочного доклада является констатация факта существования природного парникового эффекта, усиливающегося в результате деятельности человека и способного привести к глобальному потеплению и климатическим изменениям. «Мы уверены в следующем: существует природный парниковый эффект, который поддерживает повышенную температуру Земли, по сравнению с той, которая могла бы быть при других обстоятельствах. Выбросы в атмосферу в результате деятельности человека существенно увеличивают атмосферную концентрацию парниковых газов: двуокиси углерода,
метана, хлорфторуглеродов и закиси азота. Увеличение этих выбросов увеличит парниковый эффект, в результате чего в среднем создастся дополнительное потепление поверхности Земли». Приводится график изменения средней температуры Земли за период с 1860 по 1990 г. относительно средней температуры за 1951-1980 гг., построенный на основе инструментальных измерений, и делается следующий вывод: «... мы верим, что реальное нагревание земного шара на 0,3-0,6 °С произошло в течение последнего столетия ... » (рис. 1)1. Применение выражений «мы уверены», «мы верим» без строгих обоснований снижает убедительность представленных выводов.
В пятом оценочном докладе указывается, что «глобально усредненные совокупные данные о температуре поверхности суши и океана, рассчитанные на основе линейного тренда, свидетельствуют о потеплении на 0,85 °С за период с 1880 по 2012 год» (рис. 2)2. Не указывается, однако, насколько представительна использованная выборка, как рассчитывались средние характеристики, какими методами получен данный вывод, что снижает убедительность представленного заключения.
Рис. 1. График изменения средней температуры
Земли согласно1 Fig. 1. A graph of the variation of the mean earth temperature in accordance with1
Рис. 2. График изменения средней температуры
Земли согласно2 Fig. 2. A graph of the variation of the mean earth temperature in accordance with2
12 декабря 2015 г. на конференции в Париже (СОР21), посвященной климатическим изменениям, подписано международное соглашение по поддержанию увеличения средней температуры планеты на уровне ниже 2 °С - так называемое Парижское соглашение по климату.
Наряду с этим имеется большое число «климатических скептиков», ставящих под сомнение как сам факт глобального потепления, так и роль человека в этом процессе3. Это может быть связано с отмеченной выше неубедительностью докладов МГЭИК. Интерес к проблеме подогревается объявленным 1 июня 2017 г. президентом США Д. Трампом выходом США из Парижского соглашения по климату.
В связи с этим представляется целесообразным отслеживание изменений температуры атмосферного воздуха в локальных масштабах. Представляется, что достоверные выводы об изменениях любой характеристики могут быть сделаны только на основе научной обработки результатов ее инструментальных измерений.
В данной статье делается попытка исследования изменения температуры атмосферного воздуха на метеостанции Минск по имеющимся данным с 1998 по 2019 год. В качестве научного инструмента исследования предлагается использовать регрессионный анализ с его процедурами проверки гипотез.
Содержание исследований
Исходными данными для исследований являются данные метеорологических наблюдений4. Эти данные содержат измерения характеристик погоды (температуры атмосферного воздуха, атмосферного давления, направления и скорости ветра, относительной влажности воздуха и некоторых других) с периодичностью в три часа начиная с нуля часов по UTC (UTC - всемирное координированное время, англ. Coordinated Universal Time), всего 8 измерений в сутки и 240 измерений в месяц из 30 дней. Данные, полученные с сайта4, объединялись в файлы месячных данных. Среднее месячное значение характеристики
за определенный месяц определенного года, например, температуры атмосферного воздуха t, рассчитывалось по формуле
^ т
t =
y,m
где t.
n
-z t,
y = 1998,1999,...,2019, m = 1,2,...,12,
(1)
- , I
y,m J=i
- j -е измерение характеристики t в m -м месяце y -го года, n - количество
измерений характеристики I в т -м месяце у -го года, ? т - среднее значение характеристики t в т -м месяце у -го года.
Средние месячные значения характеристики t, полученные по формуле (1), использовались для расчета средних годовых значений характеристики по формуле
С 12 Л-^12 ^
n„
Z n t
/ i y,m y,m
y = 1998,1999,...,2019.
t =\Z..
y Z—f y,m
V m=1 J V m=1
Полученные по этой формуле значения температуры атмосферного воздуха на метеостанции Минск приведены в табл. 1 (данные за 2002, 2004 и 2005 годы отсутствуют). Как видно, самым холодным в рассматриваемом периоде был 1998 год со средней годовой температурой 6,3°С.
Таблица 1. Средние годовые значения температуры атмосферного воздуха на метеостанции Минск Table 1. Mean yearly values of the temperature of the atmospheric air at the meteorological station Minsk
Год y Year y 1998 1999 2000 2001 2003 2006 2007 2008 2009 2010
Средняя годовая температура t , °С Mean yearly temperature t , °С 6,3 7,8 7,9 7,0 6,6 6,8 7,7 7,9 7,0 7,0
Год y Year y 2011 2012 2013 2014 2015 2016 2017 2018 2019 -
Средняя годовая температура t , °С Mean yearly temperature t , °С 7,6 6,8 7,5 7,8 8,7 7,8 7,7 8,1 8,4 -
Всего в табл. 1 имеется 19 значений (размер выборки п = 19). График средних годовых значений температуры атмосферного воздуха на метеостанции Минск, построенный по данным табл. 1, приведен на рис. 3 (ломаные линии). По виду графика можно сделать вывод, что данные табл. 1 можно представить в виде
t = 0 + 02y = HT(y)0 + t , y = 1998,1999,...,2019,
(2)
где г = НТ (у)0 - линейная функция регрессии средней годовой температуры (линейный временной тренд средней годовой температуры), НТ (у) = (1, у) - вектор базисных функций для представления линейной функции регрессии, 0Т = (0Х,02) - вектор коэффициентов линейной функции регрессии, ^ - отклонения средней годовой температуры от функции регрессии, являющиеся результатом действия случайного возмущения 2 с нулевым средним и дисперсией а2.
Вместо модели данных (2) удобнее пользоваться следующей моделью данных:
К =0+0x = H (x)0 + ^х, x = 1,2,...,19.
(3)
в которой вместо переменной у взята переменная х = у -1997, ^ = ^, НТ (х) = (1, х),
0Т = (0,02). При изменении переменной у от 1998 до 2019 переменная х принимает значения от 1 до 19.
Вектор оценок коэффициентов 0Т = (0,0) линейной функции регрессии (3) может быть получен методом наименьших квадратов по формуле [1]
0 = (FTF)-1(FT Z),
где F = (H(x1),H(x2),...,H(xn)) =
Г1 1
v x1 x2
1 ^
x
, ZT = (t1,t2,...,tn), n = 19 . Оценка a2
n J
дисперсии a2 случайного возмущения S определяется формулой:
i- (z - f0 y(z - f0 ),
a2 =
n - к
где к = 2 - количество коэффициентов функции регрессии.
(4)
Рис. 3. Средняя годовая температура атмосферного воздуха и ее линейная аппроксимация на метеостанции Минск с 1998 по 2019 год Fig. 3. The yearly mean temperature of the atmospheric air and its linear approximation at the meteorological station Minsk from 1998 to 2019 year
По этим формулам и данным табл. 1 были получены следующие оценки коэффициентов линейной функции регрессии и оценка дисперсии случайного возмущения для
средней годовой температуры атмосферного воздуха на метеостанции Минск: 0 = 6,9072 ,
0 = 0,0442, a2 = 0,5625 . Функция регрессии при значениях коэффициентов 0, 02 (эмпирическая функция регрессии) изображена на рис. 1 прямой линией. На рисунке наблюдается некоторый рост средней годовой температуры с течением времени. Возникает, однако, следующий вопрос: является ли этот рост значимым? Линейный регрессионный анализ позволяет дать ответ на этот вопрос путем проверки гипотез двух видов: о значимости коэффициентов линейной регрессии и о наличии линейной связи между входной и выходной переменными [1, 2].
Регрессионный анализ основан на предположениях нормальности N (0, a2) случайного
возмущения S и однородности (независимости от x) дисперсии a2. Вывод о том, что данные предположения выполняются, можно сделать по виду графиков на рис. 1. Однако в работе была выполнена проверка этих предположений с помощью статистических критериев. Нормальность распределения случайного возмущения S была подтверждена применением к данным tj,t2,...,t19 табл. 1 критерия согласия Колмогорова [3]. В частности, была
подтверждена принадлежность распределению N (0, a2) случайных чисел = tx -0-0 x, x = 1,2,...,19. Однородность дисперсии проверялась и подтверждена двумя критериями: критерием однородности дисперсий двух распределений и критерием Смирнова однородности двух распределений. Рассматривались две выборки tx, t2,..., t10 и tn, t12,..., tl9 в предположении,
что они выбраны из распределений с функциями распределения F (x) и F (x) с дисперсиями
Gj2 и a2 соответственно. Однородность дисперсии случайного возмущения S будет
2 2
подтверждена в случае принятия гипотезы о равенстве дисперсий aх и a 2. Данная гипотеза проверяется на основе статистики f = a^ /a2, имеющей f -распределение (Фишера)
с 9,8 степенями свободы [1]. Здесь а2 и а\ - оценки дисперсий а2 и а\, полученные по выборкам ,Ч2,..., Ч10 и ^ 1з Ч12,..., Ч19 :
^ 10 | 19
а2 =1е 6 - т), а2 =1е 6 - т)2, 9 1=1 8 1=11
^ 10 ^ 19
1еI, т2=1е4".
т = — е ч, т =
10 ^ 2 9
10 1=1 9 -=11
Гипотеза об однородности распределений ¥ (х) и ¥2 (х) - это гипотеза о том, что выборки Ч,Ч2,...,Ч10 и ^р^ 1з...,Ч19 извлечены из одного и того же распределения (¥ (х) = ¥2 (х)). Эта гипотеза проверяется на основе статистики Смирнова [3]
г =
v
-^тах^* (х) - ¥г* (х)|: П + Щ
где ¥1 * (х) и ¥2 (х) - эмпирические функции распределения, полученные по выборкам Ч,Ч2,...,Чо и ^ 1з Ч12,...,Ч19 соответственно, Щ = 10, п2 = 9 - размеры этих выборок. Таблица процентных точек распределения статистики г для малых значений щ и Щ имеется в [3], а при Щ ^ да, щ ^ да статистика г имеет распределение Колмогорова.
Гипотеза о значимости коэффициентов линейной функции регрессии проверяется на основе Ч -статистики 5 _
Ч =~Г== , - = 1,2 , (5)
л]а У'
где а2 определяется формулой (4), а1,1 - элемент матрицы А-1 = (а1^) = (¥Т ¥ )—1. Статистика ^ (5) имеет распределение Стьюдента с п — к степенями свободы.
Гипотеза о наличии линейной стохастической связи между входной и выходной переменными проверяется с использованием / -статистики дисперсионного анализа:
Г>2 г>2 / г>2
/=^/а, (б)
к — 1 / п — к
где
п
%=е (^—г)2,
1=1 1п
2 = ■
п
е^
1=1
%02=е (^ — нт (х- )е)2.
1=1
Статистика / (б) имеет ¥ -распределение (Фишера) с к — 1, п — к степенями свободы.
Гипотеза о значимости коэффициентов линейной функции регрессии {Н0 : е = 0; Н : е ^ 0}, 1 = 1,2, проверялась с помощью двустороннего критерия значимости Р(| Ч |> Ча/2) = а. На типичном уровне значимости а = 0,05 предел значимости Ча/2 при п — к = 17 степенях свободы имеет значение Ча/2 = 2,1098 . Рассчитанные по формуле (5) эмпирические значения статистики равны: Ч1эмп = 24,8039, Ч2эмп = 2,6130. Так как I эмп |> Ча/2, то гипотезу Н0 : е= 0 следует отклонить, то есть коэффициент е следует признать значимым. В силу выполнения неравенства | Ч2эмп |> Ча/2 гипотезу Н0 : 52 = 0 также следует отклонить, то есть признать коэффициент 52 значимым.
п
Гипотеза о наличии линейной стохастической связи между входной и выходной переменными в нашем скалярном случае имеет вид {H0 : 0 = 0; H : 0 ^ 0} . Она проверялась правосторонним критерием значимости P( f > fa) = а . На уровне значимости а = 0,05 предел значимости fa при к — 1 = 1, n — к = 17 степенях свободы имеет значение fa = 4,4513. Рассчитанное по формуле (6) эмпирическое значение статистики f равно f мп = 6,8278 . Так как f3Mn > fa, то гипотеза H0 : 0 = 0 отклоняется. Это означает наличие значимой линейной связи между рассматриваемыми переменными.
Аналогичный анализ выполнялся ранее в работе [4] для периода времени с 1998 по 2017 год. Там было установлено отсутствие значимой линейной зависимости от времени средней годовой температуры атмосферного воздуха на метеостанции Минск. Дополнительно был выполнен анализ данных для периодов времени с 1998 по 2016 год и с 1998 по 2018 г. Для данных с 1998 по 2016 год была установлена незначимость линейного тренда, а для данных с 1998 по 2018 год - его значимость.
Заключение
В статье предложена методика использования процедур регрессионного анализа для выводов о наличии линейных временных трендов количественных характеристик погоды. Линейный регрессионный анализ позволяет установить значимость линейного тренда путем проверки гипотез двух видов: гипотезы о значимости коэффициентов линейной функции регрессии и гипотезы о существовании линейной зависимости функции регрессии. Данная методика была использована для анализа линейного тренда средней годовой температуры атмосферного воздуха на метеостанции Минск. Рассматривались четыре периода времени: с 1998 по 2016 год, с 1998 по 2017 год, с 1998 по 2018 год и с 1998 по 2019 год. Полученные линейные регрессионные зависимости для этих периодов имеют небольшой положительный тренд. Проверка указанных выше гипотез на уровне значимости а = 0,05 показала незначимость положительного линейного тренда средней годовой температуры атмосферного воздуха на метеостанции Минск в периоды с 1998 по 2016 год и с 1998 по 2017 год и его значимость в периоды с 1998 по 2018 год и с 1998 по 2019 год. Более теплые в среднем 2018 и 2019 годы привели к росту положительного линейного тренда средней годовой температуры до значимого значения. Отметим также, что в работах [5, 6] предлагаются иные статистические подходы для тех же целей.
Список литературы / References
1. Vuchkov I. N., Boyadjeva L., Solakov E. [Applied linear regression analysis]. Moskva: Finansy I statistika; 1987. (In Russ.)
2. Rao C.S. Linear statistical inference and its applications. Wiley, 2ed, 1973.
3. Bolshev L.N., Smirnov N.V. [Tables of mathematical statistics]. Moskva: Nauka; 1983. (In Russ.)
4. V.S. Mukha. On the Statistical Methods for the Conclusion on the Climate Change. American Journal of Environmental Engineering and Science. 2018;5(2):34-38.
5. Gavrilov M.B., Markovic S.B., Janc N., Nikolic M., Valjarevic A., Komac B., Zorn M., Punisic M., Bacevic N. Assessing average annual air temperature trends using the Mann-Kendall test in Kosovo. Acta geographica Slovenica. 2018;58(1):7-25. DOI: 10.3986/AGS.1309.
6. McKitrick, Ross R., McIntyre S. Herman C. Panel and multivariate methods for tests of trend equivalence in climate data sets. Atmospheric Science Letters. 2010;11(4):270-277. DOI: 10.1002/asl.290.
Сведения об авторе
Муха В.С., д.т.н., профессор, профессор кафедры информационных технологий автоматизированных систем Белорусского государственного университета информатики и радиоэлектроники.
Information about the author
Mukha V.S., D.Sci, Professor, Professor of Automated Data Processing Systems Department of Belarusian State University of Informatics and Radioelectronics.
Адрес для корреспонденции
220013, Республика Беларусь,
г. Минск, ул. П. Бровки, 6,
Белорусский государственный университет
информатики и радиоэлектроники
тел. +375-17-293-88-23
e-mail: [email protected]
Муха Владимир Степанович
Address for correspondence
220013, Republic of Belarus. Minsk,
P. Brovka str., 6,
Belarusian State University
of Informatics and Radioelectronics
tel. +375-17-293-88-23
e-mail: [email protected]
Mukha Vladimir Stepanovich
1 Policymakers Summary. In: Climate Change. The IPCC Scientific Assessment. Published by the Press Syndicate of the University of Cambridge. First published 1990. - Available at:https://www.ipcc.ch/site/assets/uploads/2018/03/ipcc_far_wg_I_iull_report.pdf.
2 Summary for Policymakers. In: IPCC, 2014: Climate Change 2014: Synthesis Report. Contribution of Working Groups I, II and III to the Fifth Assessment Report of the Intergovernmental Panel on Climate Change [Core Writing Team, R.K. Pachauri and L.A. Meyer (eds.)]. IPCC, Geneva, Switzerland. - Available at: https://www.ipcc.ch/site/assets/uploads/2018/02/AR5_SYR_FINAL_SPM.pdf
3 Climate skeptic. - Available at: http://www.climate-skeptic.com
4Meteorological observations. - Available at: http://www.pogoda.by/meteoarchive.