Научная статья на тему 'ПРЕДСКАЗАНИЕ ВРЕМЕННЫХ РЯДОВ СОЛНЕЧНОЙ АКТИВНОСТИ С ПОМОЩЬЮ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ LSTM'

ПРЕДСКАЗАНИЕ ВРЕМЕННЫХ РЯДОВ СОЛНЕЧНОЙ АКТИВНОСТИ С ПОМОЩЬЮ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ LSTM Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
18
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
солнечная активность / искусственные нейронные сети / прогноз / solar activity / artificial neural networks / forecast

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Борис Владимирович Козелов

Построена численная модель предсказания параметров солнечной активности — числа солнечных пятен R и потока радиоизлучения на волне 10,7 см F10,7 вперед на 27 суток. Численная модель использует искусственную нейронную сеть (ИНС) с LSTM (Long short-term memory) слоями. Как для числа солнечных пятен, так и для потока радиоизлучения модель предсказывает уровни и пределы вариации значений на 27 дней. Средняя абсолютная ошибка предсказания модели составляет менее 6 %. Модель в реальном времени реализована на сайте http://aurora.pgia.ru и может быть дополнением к долгосрочным прогнозам других интернет-ресурсов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Борис Владимирович Козелов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PREDICTION OF SOLAR ACTIVITY TIME SERIES USING LSTM ARTIFICIAL NEURAL NETWORK

A numerical model for predicting the parameters of solar activity — the number of sunspots R and the radioflux at a wave of 10.7 cm F10.7 ahead for 27 days — has been built. The numerical model uses an artificial neural network (NN) with LSTM (Long short-term memory) layers. For both the number of sunspots and the radioflux, the model predicts the levels and limits of variation of the values for 27 days. The average absolute prediction error of the model is less than 6 %. The real-time model is implemented on the site http://aurora.pgia.ru and can be an addition to long-term forecasts of other INTERNET resources.

Текст научной работы на тему «ПРЕДСКАЗАНИЕ ВРЕМЕННЫХ РЯДОВ СОЛНЕЧНОЙ АКТИВНОСТИ С ПОМОЩЬЮ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ LSTM»

Научная статья

УДК 523.982, 004.032.26

doi:10.37614/2949-1185.2023.2.2.003

ПРЕДСКАЗАНИЕ ВРЕМЕННЫХ РЯДОВ СОЛНЕЧНОЙ АКТИВНОСТИ С ПОМОЩЬЮ ИСКУССТВЕННОЙ НЕЙРОННОЙ СЕТИ LSTM

Борис Владимирович Козелов

Полярный геофизический институт, Апатиты, Россия, boris.kozelov@gmail.com, https://orcid.org/0000-0003-2738-2443

Аннотация

Построена численная модель предсказания параметров солнечной активности — числа солнечных пятен R и потока радиоизлучения на волне 10,7 см Fwj вперед на 27 суток. Численная модель использует искусственную нейронную сеть (ИНС) с LSTM (Long short-term memory) слоями. Как для числа солнечных пятен, так и для потока радиоизлучения модель предсказывает уровни и пределы вариации значений на 27 дней. Средняя абсолютная ошибка предсказания модели составляет менее 6 %. Модель в реальном времени реализована на сайте http://aurora.pgia.ru и может быть дополнением к долгосрочным прогнозам других интернет-ресурсов. Ключевые слова:

солнечная активность, искусственные нейронные сети, прогноз Благодарности:

работа поддержана РНФ, проект № 22-12-20017. Автор благодарит GSFC/SPDF OMNIWeb за подготовку использованных в статье данных.

Original article

PREDICTION OF SOLAR ACTIVITY TIME SERIES USING LSTM ARTIFICIAL NEURAL NETWORK Boris V. Kozelov

Polar Geophysical Institute, Apatity, Murmansk region, Russia, boris.kozelov@gmail.com, https://orcid.org/0000-0003-2738-2443

Abstract

A numerical model for predicting the parameters of solar activity — the number of sunspots R and the radioflux at a wave of 10.7 cm F10.7 ahead for 27 days — has been built. The numerical model uses an artificial neural network (NN) with LSTM (Long short-term memory) layers. For both the number of sunspots and the radioflux, the model predicts the levels and limits of variation of the values for 27 days. The average absolute prediction error of the model is less than 6 %. The real-time model is implemented on the site http://aurora.pgia.ru and can be an addition to long-term forecasts of other INTERNET resources. Keywords:

solar activity, artificial neural networks, forecast Acknowledgments:

the work was supported by the Russian Science Foundation, project No. 22-12-20017. The author thanks GSFC/SPDF OMNIWeb for preparing the data used in the article.

Введение

Солнце влияет на все, что находится на Земле, поэтому характеристики солнечной активности входят как основные параметры в модели окружающей среды, используемые в геофизике. Для моделей верхних слоев атмосферы, ионосферы и магнитосферы непосредственно солнечную активность характеризуют двумя индексами: число солнечных пятен R и Fwj—среднесуточное значение потока радиоизлучения на волне 10,7 см. Эти индексы необходимо знать как в текущее время, так и уметь их предсказывать для прогностических моделей.

Индекс R характеризует изменения температуры и плотности на всем видимом диске Солнца. Его изменения хорошо коррелируют с изменениями чисел Вольфа и суммарной площади пятен и являются удобной ежедневной характеристикой солнечной активности (SILSO...).

Ежедневные измерения интегрированного излучения от солнечного диска на частоте 2800 МГц (длине волны 10,7 см) выполняются по программе радиомониторинга Солнца, осуществляемой Национальным исследовательским советом Канады с 1947 г. До 31 мая 1991 г. наблюдения проводились в Алгонкинская радиообсерватории (Algonquin) недалеко от Оттавы. С 1 июня 1991 г. наблюдения ведутся в радиоастрофизической обсерватории, расположенной недалеко от Пентиктона (Penticton), Британская Колумбия.

В данной работе представляется численная модель, позволяющая прогнозировать значения этих индексов вперед на 27 дней (1 солнечные сутки). Модель использует искусственную нейронную сеть и в реальном времени реализована на сайте http://aurora.pgia.ru. Прогноз данной модели может быть дополнением к долгосрочным прогнозам других интернет-ресурсов, например, в работе (Solar.).

Данные и предобработка

Основной набор представляет собой суточные значения параметров, характеризующих солнечную активность, число солнечных пятен R и Fio,7 — среднесуточное значение потока радиоизлучения на волне 10,7 см, который измеряется в солнечных единицах потока: 1 с. е. п. = 10-22 Вт/(м2Гц). Временные ряды с 1 января 1961 г. по 1 марта 2023 г. взяты из базы данных OMNI. Оба ряда скоррелированы между собой и содержат известные солнечные периодичности: ~ 11-летний солнечный цикл и ~ 27-дневное собственное солнечное вращение.

Отсутствующие отдельные значения во временном ряду Fwj были интерполированы по соседним. Использованные ряды приведены на рис. 1. Оба ряда нормированы к интервалу от 0 до 1, необходимому для работы с искусственными нейронными сетями. Значения, использованные при нормировке, приведены в табл.

б

Рис. 1. Временные ряды параматров солнечной активности: а радиоизлучения на волне 10,7 см

— число солнечных пятен; б — поток

Индекс R Fl0,7

Минимальное значение 0 64,6

Амплитуда значений 428 367,0

а

Искусственная нейронная сеть

Для построения численной модели использована реализация LSTM (Long short-term memory) слоя на языке Python в пакете keras библиотеки TensorFlow (TensorFlow...). Структура LSTM-слоя — «долгая краткосрочная память» — разработана для решения проблемы исчезновения градиента при тренировке нейронных сетей и детально описана в работе (Hochreiter S. et al., 1997). Каждый нейрон (ячейка) LSTM-слоя имеет два состояния (внутреннее и скрытое) и состоит из нескольких блоков: обновления, запоминания, передачи данных в следующую ячейку. Каждая ячейка LSTM имеет по три входа и по три выхода. Выходы: внутреннее состояние ячейки (A) и скрытое состояние ячейки (C), оно же выход нейрона (B). По умолчанию возвращается только выход B (скрытое состояние) ячейки после обработки всех слов входной последовательности. При необходимости можно вернуть промежуточные выходы (скрытые состояния) и внутренние состояния ячеек на всех итерациях. Значения скрытого и внутреннего состояния нейрона и дополнительные входы используются при создании сети из многих нейронов. Общая структура использованной сети представлена на рис. 2. В данном случае использовались две LSTM-сети по 50 нейронов.

Рис. 2. Общая структура использованной ИНС

Сеть обучалась по данным за 5 солнечных суток (135 земных дней) предсказывать значения вперед на 27 дней (1 солнечные сутки). Для этого из всего ряда данных сформированы массивы векторов из 135 значений для подачи на вход сети и соответствующие им массивы векторов из 27 истинных следующих за ними значений для подачи на выход сети во время тренировки. Подаваемые на вход значения последовательно кодируются во внутреннем состоянии первой LSTM-сети (см. рис. 2), которое подается на вторую LSTM-сеть, которая предсказывает следующие значения. Эти значения сравнивались с истинными, в процессе обучения минимализировалась метрика «средняя абсолютная ошибка» (MAE — mean absolute error).

Результаты обучения и обсуждения

Тренировалась сеть на значениях с 01.01.1963 до начала текущего 25 солнечного цикла, проверочная выборка в размере 20 % выделялась из этого массива. Данные с начала текущего цикла (с 2020 г.) оставлены для независимого тестирования.

Процесс обучения отражает рис. 3. Приведены значения средней абсолютной ошибки на обучающем и проверочном наборах по мере прохождения эпох обучения. В данном случае имеются в виду нормированные данные, то есть в конце обучения средняя абсолютная ошибка на обучающем наборе составляет менее 6 %.

Рис. 3. Обучение модели, средняя абсолютная ошибка на обучающем и проверочном наборах

Работа обученной сети на тестовом наборе показана на рис. 4 и 5. Приведены ряды прогнозируемых значений на 1, 4, 20 дней и реальные наблюдения.

Можно видеть, что:

- модель предсказывает основную тенденцию в исследуемых рядах—общий тренд и периодическую структуру (с периодом около 27 дней);

- периодическая структура сглаживается с увеличением времени прогноза;

- мелкие особенности и пики в рядах прогнозируемых значений модель не описывает;

- в ряду солнечных пятен прогнозированы отсутствующие в наблюдениях пики около 2022-04 и 2022-09, однако они имеются в потоке радиоизлучения, что объясняется обучением модели на совместном наборе данных.

Пример прогноза на весь оборот Солнца вокруг своей оси приведен на рис. 6. Как для числа солнечных пятен, так и для потока радиоизлучения предсказаны уровни и пределы вариации значений за 27 дней, однако более мелкие временные вариации в заданном интервале моделью не описываются.

Рис. 4. Результаты работы модели на тестовом ряду значений числа солнечных пятен

Рис. 5. Результаты работы модели на тестовом ряду значений потока радиоизлучения на 10,4 см

б

Рис. 6. Результаты прогноза модели на солнечные сутки (27 дней) с 25.10.2022 по 20.11.2022: а солнечных пятен; б — поток радиоизлучения на волне 10,7 см

число

а

Выводы

Построена численная модель предсказания параметров солнечной активности — числа солнечных пятен R и потока радиоизлучения на волне 10,7 см Fwj вперед на 27 суток. Для построения численной модели использована ИНС с LSTM-слоями. Как для числа солнечных пятен, так и для потока радиоизлучения модель предсказывает уровни и пределы вариации значений на 27 дней. Средняя абсолютная ошибка предсказания модели составляет менее 6 %. Модель в реальном времени реализована на сайте http://aurora.pgia.ru и может быть дополнением к долгосрочным прогнозам других интернет-ресурсов (Solar...).

Список источников

1. Hochreiter S., Schmidhuber J., Long short-term memory // Neural computation. 1997. V 9(8). P. 1735-1780.

2. SILSO. URL: https://www.sidc.be/silso/ssngraphics

3. Solar Cycle Progression // SWPC. URL: https://www.swpc.noaa.gov/products/solar-cycle-progression

4. TensorFlow. URL: https://www.tensorflow.org/api_docs/python/tf/keras

References

1. Hochreiter S., Schmidhuber J. Long short-term memory. Neural computation, 1997, vol. 9(8), pp. 1735-1780.

2. https://www.sidc.be/silso/ssngraphics

3. Solar Cycle Progression. SWPC. Available at: https://www.swpc.noaa.gov/products/solar-cycle-progression

4. https ://www.tensorflow. org/api_docs/python/tf/keras

Информация об авторе

Б. В. Козелов — доктор физико-математических наук, главный научный сотрудник. Information about the author

B. V. Kozelov — Doctor of Sciences (Phys.-Math.), Chief Researcher.

Статья поступила в редакцию 10.04.2023; одобрена после рецензирования 17.04.2023; принята к публикации 03.05.2023. The article was submitted 10.04.2023; approved after reviewing 17.04.2023; accepted for publication 03.05.2023.

i Надоели баннеры? Вы всегда можете отключить рекламу.