Научная статья на тему 'ПРОГНОЗИРОВАНИЕ ПОЛНОГО ЭЛЕКТРОННОГО СОДЕРЖАНИЯ ИОНОСФЕРЫ НА ОСНОВЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ'

ПРОГНОЗИРОВАНИЕ ПОЛНОГО ЭЛЕКТРОННОГО СОДЕРЖАНИЯ ИОНОСФЕРЫ НА ОСНОВЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
66
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛНОЕ ЭЛЕКТРОННОЕ СОДЕРЖАНИЕ / ГНСС / ИОНОСФЕРА / МАШИННОЕ ОБУЧЕНИЕ / СЛУЧАЙНЫЙ ЛЕС

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Замогильный Д.

Введение. В работе представлена и описана технология применения алгоритма машинного обучения в прогнозировании вертикального полного электронного содержания ионосферы. Ионосферная погрешность является одним из наиболее значимых источников погрешностей измерения псевдодальностей по сигналам ГНСС. Методы. Повышающееся с каждым годом требования к точности позиционирования и навигации по сигналам ГНСС приводит к необходимости разработки новых методов уменьшения влияния различных погрешностей измерений, в том числе ионосферной погрешности. На данный момент для ионосферной коррекции измерений используются модели ионосферы различных типов. Существующие на данный момент широко используемые ионосферные модели не позволяют в значительной степени повысить точность позиционирования по сигналам ГНСС. На данный момент создание новой эффективной методики моделирования и прогнозирования ионосферы отвечающим современ ным требования к точности позиционирования является важной и актуальной задачей. Целью настоящей работы является создание методики моделирования и прогнозирования полного электронного содержания ионосферы с применением алгоритмов машинного обучения. Машинное обучение на данный момент является довольно распространённым и популярным методом решения задач классификации, распознавания и прогнозирования. Метод уже многие года применяется в медицине, робототехнике, промышленности, финансах и множестве других отраслях современной науки и экономики. Цели и задачи исследования. Для достижения поставленной цели необходимо решить ряд задач. В первую очередь необходимо подобрать и собрать данные для обучения модели, далее необходимо выбрать метод машинного обучения и гиперпараметры для выбранного метода. Далее необходимо выполнить прогнозирование ПЭС на основе обученной модели и выполнить оценку точности полученных результатов. сравнение полученных результатов с точностью других существующих моделей. Результаты. Показано, что машинного обучение хорошо справляется с задачей прогнозирования полного электронного содержания. Полученная обученная модель позволяет получать прогноз с точностью сопостави мой с точностью моделей Klobuchar, NeQuick, а в некоторых случаях и знач тельно точнее.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Замогильный Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PREDICTION OF THE TOTAL ELECTRONIC CONTENT OF THE IONOSPHERE BASED ON MACHINE LEARNING ALGORITHMS

Introduction. The paper presents and describes the technology of applying the machine learning algorithm in predicting the vertical total electron content of the ionosphere. The ionospheric error is one of the most significant sources of pseudorange measurement errors from GNSS signals. Increasing every year requirements for the accuracy of positioning and navigation by GNSS signals leads to the need to develop new methods to reduce the impact of various measurement errors, including the ionospheric error. At present, ionospheric models of various types are used for ionospheric correction of measurements. The currently widely used ionospheric models do not allow a significant increase in the accuracy of positioning based on GNSS signals. At the moment, the creation of a new effective method for modeling and forecasting the ionosphere that meets modern requirements for positioning accuracy is an important and urgent task. The purpose of this work is to create a methodology for modeling and predicting the total electron content of the ionosphere using machine learning algorithms. Machine learning is currently a fairly common and pop ular method for solving problems of classification, recognition and prediction. The method has been used for many years in medicine, robotics, industry, finance and many other branches of modern science and economics. To achieve this goal, it is necessary to solve a number of tasks. First of all, you need to select and collect data for training the model, then you need to select a machine learning method and hyperparameters for the selected method. Next, it is necessary to perform TEC prediction based on the trained model and evaluate the accuracy of the results obtained. comparison of the obtained results with the accuracy of other existing models It is shown that machine learning does a good job of predicting full electronic content. The resulting trained model makes it possible to obtain a fore cast with an accuracy comparable to the accuracy of the Klobuchar, NeQuick models, and in some cases much more accurate.

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ ПОЛНОГО ЭЛЕКТРОННОГО СОДЕРЖАНИЯ ИОНОСФЕРЫ НА ОСНОВЕ АЛГОРИТМОВ МАШИННОГО ОБУЧЕНИЯ»

doi: 10.36724/2409-5419-2022-14-4-39-46

ПРОГНОЗИРОВАНИЕ ПОЛНОГО ЭЛЕКТРОННОГО СОДЕРЖАНИЯ ИОНОСФЕРЫ НА ОСНОВЕ АЛГОРИТМОВ

МАШИННОГО ОБУЧЕНИЯ

ЗАМОГИЛЬНЫЙ Дмитрий

Сведения об авторe:

Преподаватель кафедры прикладной геодезии Московского Государственного университета геодезии и картографии, Москва, Россия, dmt.zam@gmail.com

АННОТАЦИЯ

Введение. В работе представлена и описана технология применения алгоритма машинного обучения в прогнозировании вертикального полного электронного содержания ионосферы. Ионосферная погрешность является одним из наиболее значимых источников погрешностей измерения псевдодальностей по сигналам ГНСС. Методы. Повышающееся с каждым годом требования к точности позиционирования и навигации по сигналам ГНСС приводит к необходимости разработки новых методов уменьшения влияния различных погрешностей измерений, в том числе ионосферной погрешности. На данный момент для ионосферной коррекции измерений используются модели ионосферы различных типов. Существующие на данный момент широко используемые ионосферные модели не позволяют в значительной степени повысить точность позиционирования по сигналам ГНСС. На данный момент создание новой эффективной методики моделирования и прогнозирования ионосферы отвечающим современным требования к точности позиционирования является важной и актуальной задачей. Целью настоящей работы является создание методики моделирования и прогнозирования полного электронного содержания ионосферы с применением алгоритмов машинного обучения. Машинное обучение на данный момент является довольно распространённым и популярным методом решения задач классификации, распознавания и прогнозирования. Метод уже многие года применяется в медицине, робототехнике, промышленности, финансах и множестве других отраслях современной науки и экономики. Цели и задачи исследования. Для достижения поставленной цели необходимо решить ряд задач. В первую очередь необходимо подобрать и собрать данные для обучения модели, далее необходимо выбрать метод машинного обучения и гиперпараметры для выбранного метода. Далее необходимо выполнить прогнозирование ПЭС на основе обученной модели и выполнить оценку точности полученных результатов. сравнение полученных результатов с точностью других существующих моделей. Результаты. Показано, что машинного обучение хорошо справляется с задачей прогнозирования полного электронного содержания. Полученная обученная модель позволяет получать прогноз с точностью сопоставимой с точностью моделей К1оЬисИаг, NeQuick, а в некоторых случаях и значительно точнее.

КЛЮЧЕВЫЕ СЛОВА: полное электронное содержание, ГНСС, ионосфера, машинное обучение, случайный лес.

Для цитирования: Замогильный Д. Прогнозирование полного электронного содержания ионосферы на основе алгоритмов машинного обучения // Наукоемкие технологии в космических исследованиях Земли. 2022. Т. 14. № 4. С. 39-46. doi: 10.36724/2409-5419-2022-14-4-39-46

Введение

Ионосфера Земли - это заряженная часть атмосферы, на высоте 60-1000 км. Эта среда оказывает значительное влияние, а распространение сигналов ГНСС и других радиоизмерительных систем.

Прогнозирование и моделирование параметров ионосферы в настоящее время является весьма актуальной задачей ГНСС, систем радионавигации, радиосвязи и радиолокации. Особенно это актуально при позиционировании по сигналам ГНСС, поскольку требования к точности позиционирования увеличиваются каждый год, а качественный учёт ионосферной задержки радиосигналов является одной из основных возможностей повысить точность позиционирования [1,2].

Полное электронное содержание (ПЭС) ионосферы является важным параметром ионосферы, который может быть использован для коррекции ионосферных погрешностей измерений [3]. ПЭС - это количество электронов вдоль столба сечением в один метр. Единица измерения ПЭС - TECU, 1 TECU = 1016 м"2.

Машинное обучение (Machine Learning) - обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. Искусственный интеллект (ИИ), в частности, машинное обучение (ML), быстро развивались, в последние годы особенно в сфере анализа данных и вычислений [4]. ML обычно предоставляет системам возможность автоматически учиться и совершенствоваться на основе опыта, без специального программирования, и обычно упоминается как самая популярная и новейшая технологии четвертой промышленной революции (Индустрия 4.0) [5, 6].

"Индустрия 4.0" [7], как правило, представляет собой непрерывную автоматизацию традиционных производственных и промышленных процессов, включая исследовательскую обработку данных, с использованием новых интеллектуальных технологий, таких как автоматизация машинного обучения. Таким образом, для интеллектуального анализа этих данных и разработки соответствующих реальных приложений алгоритмы машинного обучения являются ключевыми.

Различают два типа обучения. Обучение по прецедентам, или индуктивное обучение, основано на выявлении общих закономерностей по частным эмпирическим данным. Дедуктивное обучение предполагает формализацию знаний экспертов и их перенос в компьютер в виде базы знаний. Дедуктивное обучение принято относить к области экспертных систем, поэтому термины машинное обучение и обучение по прецедентам можно считать синонимами [8].

Целью машинного обучения является частичная или полная автоматизация решения сложных профессиональных задач в самых разных областях человеческой деятельности. Машинное обучение позволяет решать задачи классификации, регрессии, прогнозирования, фильтрации, кластеризации.

Машинное обучение может применяться для решения широкого спектра задач, включая медицинскую диагностику, биоинформатику и химическую информатику, обнаружение мошенничества с кредитными картами, анализ фондового рынка, классификацию последовательностей ДНК,

распознавание речи и рукописного ввода, распознавание объектов в компьютерном зрении, игры, передвижение роботов и в том числе для решения геодезических задач [9,10].

Применение машинного обучения в прогнозировании ионосферы может открыть новое направление в данной сфере и новый метод оценки ионосферных задержек без привязки к ионосферным моделям.

Материалы и методы

Основной алгоритм работы с машинным обучения заключается в решении ряда задач. В первую очередь необходимо подобрать алгоритм машинного обучения. Далее выполняется подбор параметров для обучения. Выбираемые параметры должны каким-либо образом характеризовать прогнозируемую величину, в нашем случае ПЭС. Также в обучающие данные включаются и величины прогнозируемого параметра. Далее собранные данные собираются в отдельный массив, который используется в дальнейшем для обучения модели. После формирования массива данных выполняется обучение модели на основе собранных данных с использованием выбранного алгоритма обучения. Обученная модель сохраняется в отдельный файл в формате .sav. Используя файл обученной модели, можно выполнить прогнозирование ПЭС, для этого необходим массив данных, включающий такие же параметры, как и при обучении, за исключением прогнозируемого параметра, но на даты, на которые выполняется прогноз.

Для описанного выше подхода. Разработка проводилась в интегрированной среде Pycharm [11] на языке программирования Python [12]. В основу разработки легла бесплатная библиотека scikit-learn [13].

В качестве параметров обучения выбраны индекс солнечной активности и поток радиоизлучения с длиной волны 10.7 см (Кр, fl07) высота слоя F2 ионосферы и критическая частота слоя F2 (hmF2, foF2), вычисляемые зенит и азимут на солнце, данные о моменте наблюдений (Год, время, день в году). Эти параметры необходимы как для обучения, так и для прогноза, однако для обучения также необходимы и значения ПЭС, которые полученные путем интерполяции финальной ионосферной сетки IGS в формате IONEX. Все параметры получены на промежуток в 5 лет начиная с 01.01 2016 по 31.12.2020 года. Все параметры, а также источники от куда они получены приведены в таблице 1.

Таблица 1

Данные обучения и их источники

№ Параметр Источник

1 Кр Omni [141

2 Измиран[151

3 ЬтР2 Измиран

4 Р10.7 Omni

5 ПЭС IGS[16]

6 Зенит на солнце Вычислены

7 Азимут на солнце Вычислены

8 Год -

9 Время -

10 День в году -

Правильность выбора параметров подтверждается выполненным тестом важности параметров (рис. 1). По результатам теста видно, что в целом все параметры оказывают значительное влияние на точность прогноза. Исключением являются только Кр индекс, время и год. Такой вывод можно сделать и из анализа кумулятивной выборочной дисперсии (рис. 2), из которого видно, что 6из9 параметров полностью объясняют дисперсию данных. Однако было решено не исключать эти параметры из модели обучения, поскольку даже эти параметры могут, хоть и незначительно, но повысить точность модели, не оказав влияния на производительность.

Влишосгь параметра

Рис. 1. Оценка важности параметров

Здесь первое разделение произошло при х2 > а2. Затем два подпространства были снова разделены: Левая ветвь была разделена на х1 > а4. Правая ветвь была сначала разделена на х1 > а1, а одна из ее ответвлений была разделена на х2 > аЗ. Рисунок 4 представляет собой графическое представление подпространств, разделенных на рисунке 3.

а-! ..

а4

л

С

в

Е D

А

-►

аг

аз

Рис. 3. Рекурсивное двоичное разбиение двумерных подпространств

Рис. 2. Анализ кумулятивной выборочной дисперсии

В качестве метода машинного обучения выбран алгоритм Random Forest. Random forest или случайный лес это классификатор ансамбля, который создает несколько деревьев решений, используя случайно выбранное подмножество обучающих выборок и переменных [17,18].

Деревья решений или древовидные модели включает в себя рекурсивное разбиение набора данных на две группы на основе определенного критерия до тех пор, пока не будет выполнено заранее определенное условие остановки. В нижней части деревьев решений находятся так называемые листовые узлы или листья.

Рисунок 3 иллюстрирует рекурсивное разбиение двумерного входного пространства с выровненными по оси границами, то есть каждый раз, когда входное пространство разбивается в направлении, параллельном одной из осей.

Рис. 4. Графическое представление дерева решений на рисунке 3

В зависимости от того, как заданы критерии разделения и остановки, деревья решений могут быть спроектированы как для задач классификации (категориальный результат, например, логистическая регрессия), так и для задач регрессии (непрерывный результат). Как для задач классификации, так и для задач регрессии подмножество переменных-предикторов, выбранных для разделения внутреннего узла, зависит от заранее определенных критериев разделения, которые сформулированы как задача оптимизации. Общим критерием разделения в задачах классификации является энтропия, которая является практическим применением теоремы Шеннона [19] о исходном кодировании, которая определяет нижнюю границу длины битового представления случайной величины. В каждом внутреннем узле дерева решение энтропии задается формулой:

Е = — Sf=iPí logCPí)

(1)

где с - количество уникальных классов, a p¿ - априорная вероятность каждого данного класса. Это значение максимизируется, чтобы получить максимальную информацию при каждом разделении дерева решений. Для задач регрессии обычно используемым критерием разделения является среднеквадратичная ошибка в каждом внутреннем узле.

Недостатком деревьев решений является то, что они подвержены переобучению, это означает, что модель слишком точно следует особенностям тестового набора данных и плохо работает с новым набором данных. Переобучение деревьев решений приводит к низкой общей точности прогнозирования. Одним из способов повысить точность прогнозирования является рассмотрение только подмножества наблюдений и построение множества отдельных деревьев. Впервые представленная [20], эта идея метода случайного подпространства была позже расширена и официально представлена Брейманом [21] как случайный лес. Модель случайного леса представляет собой алгоритм обучения на основе ансамбля деревьев; то есть алгоритм усредняет прогнозы по множеству отдельных деревьев. Отдельные деревья строятся на основе так называемых bootstrap выборок, а не на исходном образце.

Метод bootstrap заключается в следующем. Пусть имеется выборка X размера N. Равномерно возьмем из выборки N объектов с возвращением. Это означает, что мы будем N раз выбирать произвольный объект выборки (считаем, что каждый объ-

ект «достается» с одинаковой вероятностью —) причем каждый раз мы выбираем из всех исходных N объектов. Можно представить себе мешок, из которого достают шарики: выбранный на каком-то шаге шарик возвращается обратно в мешок, и следующий выбор опять делается равновероятно из того же числа шариков. Отметим, что из-за возвращения среди них окажутся повторы. Обозначим новую выборку через X. Повторяя процедуру М, сгенерируем М подвыборок Xlt ...,ХМ. Теперь мы имеем достаточно большое число выборок и можем оценивать различные статистики исходного распределения.

Отдельные деревья решений легко поддаются интерпретации, но эта интерпретируемость теряется в случайных лесах, поскольку многие деревья решений агрегируются. Однако, в обмен на это, случайные леса часто намного лучше справляются с задачами прогнозирования. Кроме того, лес решений имеет ряд преимуществ, основными из которых является быстрая скорость обучения и прогнозирования, возможность работы с большими объёмами данных, а также возможность работы с любыми видами и форматами данных без необходимости их масштабирования. Все эти преимущества делают данный метод идеальным для решения задачи по прогнозирования полного электронного содержания ионосферы.

После выбора данных и метода обучения необходимо подобрать конфигурацию гиперпараметров или выполнить настройку модели для наилучшего результата моделирования и прогноза. Подбор выполняется методом перебора различных конфигураций с различными гиперпараметрами и выбора наиболее оптимальных. Анализу подвергались следующие гиперпараметры:

1. n estimators - число «деревьев» в «случайном лесу».

2. max features - число признаков для выбора расщепления.

3. max depth - максимальная глубина деревьев.

4. min samples split - минимальное число объектов, необходимое для того, чтобы узел дерева мог бы расщепиться.

5. min samples leaf - минимальное число объектов в листьях.

6. bootstrap - использование для построения деревьев подвыборки с возвращением.

На рисунке 5 представлены результаты перебора различных конфигураций. По полученным данным видно, что значения гиперпараметров не значительно влияют на качество модели, что позволяет сделать акцент на производительность модели.

Далее выполнено обучение модели. Для этого собранные данные за пять лет собираются в единый файл формата .csv. Полученный файл был разделен на данные, предназначенные для обучения и проверочные данные, на основе которых выполнялось исследование результатов прогнозирования в соотношении 0.8 к 0.2 соответственно.

Модель была обучена на данных за четыре года, в результате чего модель сформировала лес деревьев решений. Полученный лес деревьев представляет собой довольно большое количество связанных между собой деревьев решений. Отдельное дерево полученного леса представлено на рисунке 6.

По полученной обученной модели сделан прогноз значений ПЭС на период с 20 января по 31 декабря 2020 года. Для прогнозирования в алгоритм были загружены файл обученной модели в формате .sav и файл с массивом данных тестовой выборки, включающий в себя все вышеперечисленные параметры, за исключение ПЭС, за период с 20.01.2020 по 31.12. 2020. Далее запускается прогнозирование, в результате которого модель на основе выявленных в результате обучения закономерностей и заданных параметров определяет значения ПЭС и выводит их в отдельный массив данных. Вывод результатов прогнозирования проводился в файлы формата .csv.

Результаты

По результатам прогнозирования получены ПЭС на период с 20.01.2020 по 31.12. 2020. На рисунках 7-8 представлено сравнение истинных значений ПЭС с прогнозируемыми. За истинные значения приняты значения ПЭС из тестовой выборки, полученные путём интерполяции финальной ионосферной сетки IGS в формате IONEX. Видно, что прогнозируемые значения ПЭС совпадают с истинными значениями с небольшими отклонениями.

Рассмотрим СКП прогнозируемых значений ПЭС на каждый месяц прогнозирования. СКП рассчитывалась на основе разницы прогнозируемых значений и истинных значений, за которые были приняты значения ПЭС из тестовой выборки. При расчёте СКП, погрешности исходных данных, а именно данных IGS IONEX, не учитывались.

Рассматривая полученные СКП (рис. 9), можно заметить явную зависимость точности прогноза от дальности прогнозирования. В январе СКП прогноза составила 0.47 TECU, когда в ноябре и декабре СКП составляет уже 1.38 и 1.14 TECU. Это объясняется в первую очередь 11-летней цикличностью солнечной активности [22]. Данные, используемые для обучения, попадают в 24 цикл солнечной активности, когда прогноз выполняется на период начала 25 цикла. По данным SWPC видно [23], что в январе 2020 года месячный индекс F10.7 составляет 72.3 • 10"22 W ■ т~2 ■ Hz'1, а в декабре уже

87.3 • 10"22 W ■

т

■Hz~

n estimators

0,051

.1

0,046

I

0.043

0.05

10 B56 1783 2670 3556

max features

£¡0,045

0,04

min_samples_splrt

min_samples_leaf

0,045

-¡to,045

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0.04

0,045

0,04

sqrt

IqgZ

В 15 22 29 35 43 50

Рис. 5. Результаты перебора конфигураций геперпараметров

Рис. 6. Отдельное дерево решений

Рис. 7. Сравнение измеренных и прогнозируемых ПЭС

Рис. 8. Сравнение измеренных и прогнозируемых ПЭС

Соответственно обученная модель не может учесть изменения ПЭС, вызванные 11-летней цикличностью солнечной активности.

Также, поскольку модель обучалась на данных до января 2020 года, чем дальше от этой даты выполняется прогноз, тем более устаревшими становятся данными обучения. По этой причине точность прогноза на более удалённые даты значительно уменьшается.

flnftivb *e«pi<lii |\г?р*лъ Mia MtcHifc №>Ль Aervi I Очипбрь Окмбрь Ноябрь ДМмСр»

Meow

Рис. 9. СКП прогноза ПЭС

Рассмотрим также относительную ошибку полученного прогноза. На рисунке 10 представлены средние относительный ошибки прогноза за каждый месяц в процентах. Из графика видно, что в целом относительная ошибка составляет не более 10% от абсолютного значения ПЭС. Исключением является ноябрь и декабрь, по тем же причинам связанными с устареванием данных обучения и 11-летней цикличностью. Вторым исключением является май и июнь в которые наблюдается наименьшая относительная ошибка. Это связано с большими абсолютными значениями ПЭС в эти месяцы из-за повышенной солнечной активности.

ОГНССИТеЛ&Ная 01НИ&ЛЭ

Иныр* *М»пц М1[Н АЯИЯ1. HÜ1 Нкн* tton* Ащч Сящрйця ОччСр* ••'•Ч- -. MIHI1

Рис. 10. Относительная ошибка прогноза ПЭС Обсуждение результатов

В результате выполненных исследований, получена модель на основе алгоритма машинного обучения Random Forest способная выполнять прогнозирование полного электронного содержания с относительной погрешностью менее 10%.

В результате эксперимента также получена оценка точности прогноза ПЭС на каждый месяц 2020 года (табл. 2).

Полученные результаты следует сравнить с другими средствами моделирования и прогнозирования ионосферы. На данный момент это ионосферные модели, используемые глобальными навигационными системами GPS, Глонасс, Galileo и другие более точные модели ионосферы. В статье [24] авторы получили относительную ошибку для моделей NeQuick (Galileo) и Klobuchar (GPS) порядка 30-36%. Относительная ошибка модели IGS-GIM составила 16%, а для MODIP-GIM порядка 4-5%. В работе [25] авторы приводят относительную ошибку для модели Klobuchar 8-11%, для модели BDGIM (Beidou) 4-8% и для модели NTCM-BC порядка 4%.

Сравнивая полученные данные прогнозирования с приведенными выше точностями ионосферных моделей видно, что прогнозирование ПЭС на основе машинного обучения соответствует по точности моделям Klobuchar и Nequick, а при прогнозировании на небольшой промежуток времени вперёд может достигать точности сравнимую с моделью BDGIM.

Таблица 2

Результаты оценки точности обученной модели

Месяц ско (TECU) % Месяц СКО (TECU) %

Январь 0,47 9,48 Июль 0,75 8,12

Февраль 0,58 9,37 Август 0,82 8,81

Март 0,64 8,59 Сентябрь 0,71 9,75

Апрель 0,66 8,53 Октябрь 0,85 9,91

Май 0,73 7,07 Ноябрь 1,38 13,91

Июнь 0,68 6,56 Декабрь 1,14 14,06

Заключение

На данный момент разработанная модель прогнозирования ПЭС позволяет получить значения ПЭС на довольно продолжительное время вперед с точность сопоставимой с точность моделей Klobuchar и NeQuick. Однако модель требует дальнейшего расширения объёма данных, расширения временных промежутков данных обучения и перехода к пространственному прогнозу ПЭС.

Подобная модель на основе машинного обучения может в дальнейшем использоваться для передачи данных в системах радиолокации и радиосвязи для уменьшения влияния ионосферных эффектов. Текущие результаты могут быть использованы как основа для создания новых усовершенствованных моделей. Кроме того, применение данного подхода к прогнозированию ионосферы может позволить прогнозировать параметры ионосферы для больших областей, и строить ионосферные карты на часы и дни вперёд.

Литература

1. Куприянов А. О., Майоров A.A., Непоклонов В.Б., Давлатов P.A., Печерица Д.С., Морозов ДА. Оценка влияния инструментальных погрешностей навигационного приемника на точность определения параметров ионосферы II Известия вузов «Геодезия и аэрофото-съемка»2015.№6.С.31-35.

2. КуприяновA.O., МорозовД.А. Экспериментальный мониторинг ионосферы с применение мультисистемой ГНСС-аппаратуры II Известия вузов «Геодезия и аэрофотосъемка» 2016. №1. С. 29-33.

3. Куприянов А.О., Тихонов В.В., Морозов ДА., Перминов А.Ю. Оперативный мониторинг параметров ионосферы в локальной области по результатам мультичастотных ГНСС-измерений II Изв. вузов «Геодезия и аэрофотосъемка». 2018. Т. 62. № 6. С. 616-623. DOI: 10.30533/0536-101Х-2018-62-6-616-623

4. Sarker I.H. Ai-driven cybersecurity: an overview, security intelligence modeling and research directions II SN Comput Sci. 2021.

5. SarkerI.H.,HoqueM.M.,MdKUddin,TawfeeqA. Mobiledata science and intelligent apps: concepts, ai-based modeling and research directions II Mob Netw Appl. C. 1-19,2020.

6. Sarker I.H., Kayes ASM, Badsha S., Alqahtani H., Watters P., Ng A. Cybersecurity data science: an overview from machine learning perspective IIJ Big Data. 2020. №7(1). C. 1-29.

7. Sarker I.H., Watters P., Kayes ASM. E Slusarczyk B. Industry 4.0: Are we ready? //PolishJ Manag Stud. №17, 2018.

8. [Электронный ресурс]// URL: http://www.machinelearn-ing.ru/wiki/index.php?title=MamHHHoe_o6y4eHHe (дата обращения: 01.08.2022)

9. Колесников A.A., Кикин П.М, Комиссарова Е.В., Касьянова Е.Л. Использование технологий машинного обучения при решении геоинформационных задач. II ИНТЕРКАРТО. ИНТЕРГИС. №2. 2018. С. 371-384.

10. Omid Memarian Sorkhabi. Deep learning in geodesy II Computer sciences. 2021. URL: https://doi.Org/10.21203/rs.3.rs-446466/v2

11. URL: https://www.jetbrains.com/pycharm/ (дата обращения: 01.08.2022)

12. URL: https://www.anaconda.com/products/individual (дата обращения: 01.08.2022)

13. URL: https://scikit-learn.org/stable/index.html (дата обращения: 01.08.2022)

14. URL: https://omniweb.gsfc.nasa.gov/ (дата обращения: 01.08.2022)

15. URL: https://izmiran.ru/ionosphere/moscow/text/ (дата обращения: 01.08.2022)

16. Stefan Schaer, Werner Gurtner. IONEX: The IONosphere Map EXchange Format Version 1.1. URL: http://ftp.aiub.unibe.ch/ionex/draft/ ionexl 1 .pdf

17. Ho, Tin Kam. Random Decision Forests II 3rd International Conference on Document Analysis and Recognition. Montreal. QC. 2016. C. 278-282.

18. Breiman, L., Friedman, J., Stone, C. J., and Olshen, R. A. Classification and Regression Trees II Boca Raton, FF: CRC press. URL: https://doi.org/10.1201/9781315139470

19. Shannon C. E. A mathematical theory of communication II ACM SIGMOBIFE Mobile Computing and Communications Review 5. 2001. C. 3-55.

20. Ho, T. K. Random decision forests II 3rd International Conference on Document Analysis and Recognition. 1995. C. 278-282. Pisca-taway, NJ: IEEE.

21. Breiman L. Random forests II Machine Teaming. №45. C. 532.2 .

22. Azad A. Mansoori, Parvaiz A. Khan, Purushottam Bhawre, A. K. Gwal, P. K. Purohit. Variability of TEC at mid latitude with solar activity during the solar cycle 23 and 24 2013 II IEEE International Conference on Space Science and Communication (IconSpace). 2013. Melaka. Malaysia.

23. URL: https://www.swpc.noaa.gov/products/solar-cycle-pro-gression.

24. Rovira-Garcia A., Juan J.M., Sanz J., Gonz'alez-Casado G., Ib'a~nez D. Accuracy of Ionospheric Models used in GNSS and SBAS: Methodology and Analysis II Journal of Geodesy. № 90. C. 229-240. 2016

25. Chao Yang, Jing Guo, Tao Geng, Qile Zhao, Kecai Jiang, Xin Xie and Yifei Lv. Assessment and Comparison of Broadcast Ionospheric Models: NTCM-BC, BDGIM, and Klobuchar II Remote Sens. № 12. C. 1215.2020.

PREDICTION OF THE TOTAL ELECTRONIC CONTENT OF THE IONOSPHERE BASED ON MACHINE LEARNING ALGORITHMS

DMITRII ZAMOGILNYI

Moscow, Russia, dmt.zam@gmail.com

ABSTRACT

Introduction. The paper presents and describes the technology of applying the machine learning algorithm in predicting the vertical total electron content of the ionosphere. The ionospheric error is one of the most significant sources of pseudorange measurement errors from GNSS signals. Increasing every year requirements for the accuracy of positioning and navigation by GNSS signals leads to the need to develop new methods to reduce the impact of various measurement errors, including the ionospheric error. At present, ionospheric models of various types are used for ionospheric correction of measurements. The currently widely used ionospheric models do not allow a significant increase in the accuracy of positioning based on GNSS signals. At the moment, the creation of a new effective method for modeling and forecasting the ionosphere that meets modern requirements for positioning accuracy is an important and urgent task. The purpose of this work is to create a methodology for modeling and predicting the total elec-

KEYWORDS: total electron content, GNSS, ionosphere, machine learning, random forest.

tron content of the ionosphere using machine learning algorithms. Machine learning is currently a fairly common and popular method for solving problems of classification, recognition and prediction. The method has been used for many years in medicine, robotics, industry, finance and many other branches of modern science and economics. To achieve this goal, it is necessary to solve a number of tasks. First of all, you need to select and collect data for training the model, then you need to select a machine learning method and hyperparameters for the selected method. Next, it is necessary to perform TEC prediction based on the trained model and evaluate the accuracy of the results obtained. comparison of the obtained results with the accuracy of other existing models It is shown that machine learning does a good job of predicting full electronic content. The resulting trained model makes it possible to obtain a forecast with an accuracy comparable to the accuracy of the Klobuchar, NeQuick models, and in some cases much more accurate.

REFERENCES

1. Kupriyanov A.O., Majorov A.A., Nepoklonov V.B., Davlatov R.A., Pecherica D.S., Morozov D.A. Ocenka vliyaniya instrumental'nyh pogreshnostej navigacionnogo priemnika na tochnost' opredeleniya parametrov ionosfery. Izvestiya vuzov "Geodeziya i aerofotosemka". 2015. No.6, pp. 31-35.

2. Kupriyanov A.O, Morozov D.A. Investigational ionosphere monitoring using multisystnm GNSS equipment. Izvestiya vuzov "Geodeziya iaerofotosemka". 2016. No.1, pp. 29-33.

3. Kupriyanov A.O., Tikhonov V.V., Morozov D.A., Perminov A.Y Operational monitoring of the parameters of the ionosphere in the local area using the results of multifrequency GNSS-measurements. Izv. vuzov "Geodeziya i aerofotos"emka". 2018. Vol. 62. No. 6, pp. 616623. DOI: 10.30533/0536-101X-2018-62-6-616-623

4. Sarker I.H. Ai-driven cybersecurity: an overview, security intelligence modeling and research directions. SN Comput Sci. 2021.

5. Sarker I.H., Hoque M.M., MdK Uddin, Tawfeeq A. Mobile data science and intelligent apps: concepts, ai-based modeling and research directions. Mob NetwAppl, pp. 1-19, 2020.

6. Sarker I.H., Kayes ASM, Badsha S., Alqahtani H., Watters P., Ng A. Cybersecurity data science: an overview from machine learning perspective. J Big Data. 2020. No. 7(1), pp.1-29.

7. Sarker I.H., Watters P, Kayes ASM. Elusarczyk B. Industry 4.0: Are we ready? Polish J Manag Stud. No.17, 2018.

8. URL: http://www.machinelearning.ru/wiki/index.php?title= MawuHHoe_o6yHeHue (accessed:: 01.08.2022).

9. Kolesnikov A.A., Kikin P.M., Komissarova E.V., Kasyanova E.L. The use of machine learning technologies in solving geoinformatic problems. Interkarto. Interdis. No. 2. 2018, pp. 371-384.

10. Omid Memarian Sorkhabi Deep learning in geodesy// Computer sciences. 2021. URL: https://doi.org/10.21203/rs.3.rs-446466/v2

11. URL: https://www.jetbrains.com/pycharm/ (accessed: 01.08.2022).

12. URL: https://www.anaconda.com/products/individual (accessed: 01.08.2022).

13. URL: https://scikit-learn.org/stable/index.html (accessed: 01.08.2022).

14. URL: https://omniweb.gsfc.nasa.gov/ (accessed: 01.08.2022)

15. URL: https://izmiran.ru/ionosphere/moscow/text/ (accessed: 01.08.2022).

16. Stefan Schaer, Werner Gurtner IONEX: The IONosphere Map EXchange Format Version 1.1 URL: http://ftp.aiub.unibe.ch/ionex/ draft/ionex11.pdf (accessed: 01.08.2022).

17. Ho, Tin Kam. Random Decision Forests. 3rd International Conference on Document Analysis and Recognition. Montreal. QC, 1995, pp. 14-1.

18. Breiman L., Friedman J., Stone C. J., Olshen R. A. Classification and Regression Trees. Boca Raton, FL: CRC press. URL: https://doi.org/10.1201/9781315139470.

19. Shannon C. E. A mathematical theory of communication. ACM SIGMOBILE Mobile Computing and Communications Review 5. 2001, pp. 3-55.

20. Ho T. K. Random decision forests. 3rd International Conference on Document Analysis and Recognition. IEEE. 1995, pp. 278-282.

21. Breiman L. Random forests.Machine Learning. No.45, pp. 532. 2001.

22. Mansoori A.A., Khan P.A., Bhawre Purushottam, Gwal A. K., Purohit P. K. Variability of TEC at mid latitude with solar activity during the solar cycle 23 and 24 2013. IEEE International Conference on Space Science and Communication (IconSpace). 2013. Melaka. Malaysia.

23. URL: https://www.swpc.noaa.gov/products/solar-cycle-pro-gression. (accessed: 01.08.2022).

24. Rovira-Garcia A., Juan J.M., Sanz J., Gonzalez-Casado G., Ibanez D. Accuracy of Ionospheric Models used in GNSS and SBAS: Methodology and Analysis. Journal of Geodesy. No. 90, pp. 229-240. 2016.

25. Chao Yang, Jing Guo, Tao Geng, Qile Zhao, Kecai Jiang, Xin Xie and Yifei Lv Assessment and Comparison of Broadcast Ionospheric Models: NTCM-BC, BDGIM, and Klobuchar. Remote Sens. No. 12. P. 1215. 2020.

INFORMATION ABOUT AUTHOR:

Dmitrii Zamogilnyi, Lecturer of the Department of Applied Geodesy of the Moscow State University of Geodesy and Cartography, Moscow, Russia

For citation: Zamogilnyi D. Prediction of the total electronic content of the ionosphere based on machine learning algorithms. H&ES Reserch. 2022. Vol. 14. No 4. P. 39-46. doi: 10.36724/2409-5419-2022-14-4-39-46 (In Rus)

i Надоели баннеры? Вы всегда можете отключить рекламу.