Научная статья на тему 'ПРОГНОЗИРОВАНИЕ ВЕСЕННЕГО ПОЛОВОДЬЯ РЕК С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ'

ПРОГНОЗИРОВАНИЕ ВЕСЕННЕГО ПОЛОВОДЬЯ РЕК С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
324
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / МАШИННОЕ ОБУЧЕНИЕ / ПРОГНОЗИРОВАНИЕ ПАВОДКОВ / МОДЕЛЬ ХОЛЬТА-УИНТЕРСА / DATA MINING / MACHINE LEARNING / FLOOD FORECAST / HOLT-WINTERS MODEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кулин Н.И., Козлов Е.А., Жук Ю.А.

Предмет исследования. Предложен новый подход к решению задачи прогнозирования наводнений и паводков в населенных пунктах Ненецкого автономного округа с помощью методов машинного обучения. Метод. Прогноз выполнен на основе выборки данных исторических показателей гидрологических постов и погодных условий в ближайших населенных пунктах за несколько лет. Особенность предлагаемого метода заключается в том, что для обучения ансамбля моделей (XGBoost, Random Forest, бэггинг) используются дополнительные данные, предварительно полученные в результате прогноза с использованием модели Хольта-Уинтерса. Основные результаты. Полученные в результате тестирования экспериментальные данные показали эффективность нового подхода. В результате работы алгоритма получен прогноз повышенного уровня воды, выполнено сравнение со значениями исторических данных по рекам Ненецкого автономного округа. Практическая значимость. Применение предлагаемого метода прогнозирования критического уровня воды экономически целесообразно, и может быть использовано как дополнительная мера по профилактике и предотвращению последствий наводнений в отдельных регионах России.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кулин Н.И., Козлов Е.А., Жук Ю.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FORECASTING THE SPRING flOOD OF RIVERS WITH MACHINE LEARNING METHODS

The subject of the research. The paper provides an overview of a flood forecasting problem in the Nenetsky region, Russia. The solution involves the use of the open source data on water level during the spring floods. Specifically, its collection, analysis and forecasting via machine learning models. Method. The authors describe a new forecasting approach that involves the use of the Holt-Winters model for a training sample, which is further implemented in order to train the following statistical models: XGBoost, Random Forest and Bagging. The solution is based on a sample of gauging stations’ historical indicators that provide a detailed description of weather conditions in the nearest settlements over several years. A separate sample was created for each location considered in the problem with the aim to build forecasts given a one-month or a one-year time period. Main Results. The forecast was obtained based on the results provided by individually trained models. In the future, the findings could be used when taking preventive measures during flood control. Practical relevance. Low maintenance costs of the information system along with the ability to predict the critical water level make this forecasting approach an economically viable additional measure against floods in poorer regions of Russia.

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ ВЕСЕННЕГО ПОЛОВОДЬЯ РЕК С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ»

УНИВЕРСИТЕТ ИТМО

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ январь-февраль 2021 Том 21 № 1 http://ntv.ifmo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS January-February 2021 Vol. 21 No 1 http://ntv.ifmo.ru/en/

ISSN 2226-1494 (print) ISSN 2500-0373 (online)

ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ

doi: 10.17586/2226-1494-2021-21-1-135-142 УДК 004.852

Прогнозирование весеннего половодья рек с использованием методов машинного обучения

Никита Игоревич Кулин1И, Евгений Александрович Козлов2, Юлия Александровна Жук3

1,2,3 Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация

1 kylin98@list.ruH, https://orcid.org/0000-0002-3952-6080

2 kozloffevgeniy@gmail.com, https://orcid.org/0000-0002-1885-9556

3 zhuk_yua@mail.ru, https://orcid.org/0000-0002-5218-322X Аннотация

Предмет исследования. Предложен новый подход к решению задачи прогнозирования наводнений и паводков в населенных пунктах Ненецкого автономного округа с помощью методов машинного обучения. Метод. Прогноз выполнен на основе выборки данных исторических показателей гидрологических постов и погодных условий в ближайших населенных пунктах за несколько лет. Особенность предлагаемого метода заключается в том, что для обучения ансамбля моделей (XGBoost, Random Forest, бэггинг) используются дополнительные данные, предварительно полученные в результате прогноза с использованием модели Хольта-Уинтерса. Основные результаты. Полученные в результате тестирования экспериментальные данные показали эффективность нового подхода. В результате работы алгоритма получен прогноз повышенного уровня воды, выполнено сравнение со значениями исторических данных по рекам Ненецкого автономного округа. Практическая значимость. Применение предлагаемого метода прогнозирования критического уровня воды экономически целесообразно, и может быть использовано как дополнительная мера по профилактике и предотвращению последствий наводнений в отдельных регионах России. Ключевые слова

интеллектуальный анализ данных, машинное обучение, прогнозирование паводков, модель Хольта-Уинтерса Ссылка для цитирования: Кулин Н.И., Козлов Е.А., Жук Ю.А. Прогнозирование весеннего половодья рек с использованием методов машинного обучения // Научно-технический вестник информационных технологий, механики и оптики. 2021. Т. 21, № 1. С. 135-142. doi: 10.17586/2226-1494-2021-21-1-135-142

Forecasting the spring flood of rivers with machine learning methods

Nikita I. Kulin1^, Evgeniy A. Kozlov2, Yulia A. Zhuk3

1,2,3 ITMO University, Saint Petersburg, 197101, Russian Federation

1 kylin98@list.ruH, https://orcid.org/0000-0002-3952-6080

2 kozloffevgeniy@gmail.com, https://orcid.org/0000-0002-1885-9556

3 zhuk_yua@mail.ru, https://orcid.org/0000-0002-5218-322X Abstract

The subject of the research. The paper provides an overview of a flood forecasting problem in the Nenetsky region, Russia. The solution involves the use of the open source data on water level during the spring floods. Specifically, its collection, analysis and forecasting via machine learning models. Method. The authors describe a new forecasting approach that involves the use of the Holt-Winters model for a training sample, which is further implemented in order to train the following statistical models: XGBoost, Random Forest and Bagging. The solution is based on a sample of gauging stations' historical indicators that provide a detailed description of weather conditions in the nearest settlements over several years. A separate sample was created for each location considered in the problem with the aim to build forecasts given a one-month or a one-year time period. Main Results. The forecast was obtained based on the results provided by individually trained models. In the future, the findings could be used when taking preventive measures during flood control. Practical relevance. Low maintenance costs of the information system along with the ability to predict the critical water level make this forecasting approach an economically viable additional measure against floods in poorer regions of Russia.

© Кулин Н.И., Козлов Е.А., Жук Ю.А., 2021

Keywords

data mining, machine learning, flood forecast, Holt-Winters model

For citation: Kulin N.I., Kozlov E.A., Zhuk Yu.A. Forecasting the spring flood of rivers with machine learning methods. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2021, vol. 21, no. 1, pp. 135-142 (in Russian). doi: 10.17586/2226-1494-2021-21-1-135-142

Введение

Использование современных методов интеллектуального анализа данных привело к росту качественного прогнозирования во многих сферах жизни. Разработка и внедрение новых методов машинного обучения для решения сложных задач как в бизнесе, так и в науке, во избежание временных и вычислительно-мощностных издержек, не теряет своей актуальности. Такие методы как классификация, регрессия, прогнозирование временных рядов, ранжирование и многие другие, не имеют универсальных решений и требуют анализа, модификации, настройки для решения той или иной задачи. Это служит поводом для экспериментов, поиска и разработки новых, простых в применении алгоритмов для получения качественных результатов и эффективных решений.

Исследование новых статистических и математических моделей позволяет широко использовать методы с большими данными, применяемыми в различных промышленных отраслях. На сегодняшний день продолжается работа над оптимизацией процессов хранения, передачи, структурирования и обработки огромных массивов информации, что позволит управлять сложными структурами данных, даст возможность анализировать их, находить всевозможные зависимости и корреляции. Одним из необходимых условий принятия эффективных решений для управления сложными объектами считается своевременное осуществление опережающих управленческих решений, основанных на оценках предварительного прогноза состояния объекта.

Важная задача управления, имеющая экономическое и социальное значение, — предупреждение негативных последствий паводков. В качестве объекта исследования по прогнозированию весеннего половодья рек взят Ненецкий автономный округ.

Решением аналогичных задач занимался ряд ученых, которые разработали и применили различные методы и алгоритмы для построения прогнозов климатических явлений в мировой практике [1-9]. На сегодняшний момент при решении задач прогнозирования уровней воды в период весеннего половодья есть некоторые трудности. Прежде всего, это ограничение возможности сбора и изучения необходимых данных различных федеральных регионов, переданные с федерального уровня на уровень ведомства, ввиду исключительных полномочий МЧС России по обеспечению безопасности населения и окружающей среды от негативных последствий весенних паводков.

Для решения проблемы необходимо: получить информацию о различных особенностях местности, найти альтернативные источники открытых данных, обработать и подготовить данные для анализа, а также выбрать более эффективную модель анализа данных и построения качественного прогноза.

Сбор и обработка данных

Информация о гидрометеорологических явлениях погоды и наблюдениях доступна на сайте Федеральной службы государственной статистики1. По Ненецкому автономному округу были найдены следующие данные: наблюдения формирования и продолжительности ледоставов некоторых рек, местоположения и координаты самых затороопасных участков вблизи рек, журнал по ущербу городских и федеральных объектов во время весенних наводнений, а также список населенных пунктов Ненецкого автономного округа, которые подвергаются паводкам. Стоит отметить, что все населенные пункты находятся в зоне многолетней мерзлоты, таким образом, для прогнозирования уровней воды информацией о виде почвы и содержании в ней влаги, можно пренебречь.

После определения списка населенных пунктов и рек были собраны данные о погоде, уровню воды в реках в населенных пунктах за несколько лет. Данные представлены в виде следующих числовых признаков: дата, скорость ветра (м/c), показания влажного и сухого термометров (°C), давление (гПа), влажность воздуха (%), уровень воды (см), количество снега и количество осадков (мм); и категориальных признаков: присутствие дождя, снега, осадков или метели. На рис. 1 показано изменение температуры воздуха и уровня воды в зависимости от сезона.

На рис. 2 продемонстрирована корреляционная зависимость между числовыми признаками.

Для использования множества данных необходимо масштабировать значения признаков, чтобы избежать завышения значений весов алгоритмов. Распределение масштабированных данных показана на рис. 3. Диапазон масштабирования выбран от 0,01 до 0,9 включительно, данный минимум взят из расчета того, что для работы алгоритма Хольта-Уинтерса значение должно быть отлично от нуля. Полученное множество (обозначим как общая выборка R) представляет собой данные по всем рекам и населенным пунктам с 2015 по 2018 гг. Кроме этого, было сгенерировано еще одно множество данных, представляющее собой набор множеств по каждому населенному пункту отдельно — разделенная выборка Rn. Формат данных выборок один и тот же.

Подход к прогнозированию

При выборе модели рассмотрены следующие алгоритмы: ARIMA (Autoregressive Integrated Moving Average), LSTM (Long Short-Term Memory), RF (Random Forest, случайный лес), AdaBoost (Adaptive

1 [Электронный ресурс]. Режим доступа: https://rosstat.gov.ru/ (дата обращения: 24.01.2021).

Дни

Рис. 1. Изменения температуры воздуха (а) и уровня воды (б) с января 2015 года по декабрь 2018 года Fig. 1. Temperature (а) and water level (б) changes from January 2015 to December 2018

Boosting, адаптивный бустинг), бэггинг, регрессия с градиентным бустингом (или градиентный бустинг, XGBoost), регрессия со стохастическим градиентным спуском, решающее дерево, дополнительное дерево, модель Хольта-Уинтерса [10-15]. Эффективность каждого метода тестировалась с подбором оптимальных параметров с использованием метрик R-квадрат (коэффициента детерминации) и RMSE (среднеквадрати-ческого отклонения). Результаты работы алгоритмов

приведены в табл. 1. Алгоритмы ЛК1МЛ и ЬБТМ не показали положительных результатов, поэтому их оценки не были учтены. Из лучших по полученным результатам метрик, были выбраны следующие алгоритмы: ХвБоо81, случайный лес и бэггинг.

В качестве начального этапа, для построения прогноза наводнения по каждой реке, была взята модель Хольта-Уинтерса [3]. Для работы алгоритма использовалась разделенная выборка (Кп), полученные резуль-

Температура

Влажный термометр

Влажность

Давление

Количество осадков

Количество снега

Уровень воды

1 -0,022 -0,075 0,45 0,47 0,058 0,25 0,1

-0,022 1 0,99 -0,13 -0,21 0,062 -0,67 0,33

-0,075 0,99 1 -0,2 -0,29 0,053 -0,7 0,28

0,45 -0,13 -0,2 1 0,98 0,1 0,44 0,15

0,47 -0,21 -0,29 0,98 1 0,096 0,49 0,17

0,058 0,062 0,053 0,1 0,096 1 0,0026 0,053

0,25 -0,67 -0,7 0,44 0,49 0,0026 1 -0,28

0,1 0,33 0,28 0,15 0,17 0,053 -0,28 1

&

Й m

cd &

И S

&

и S о 5

Он

sr

н

PQ

Й и О

ч Я

я §

U

о о

[5

U

s

й

Я g

я л S u я о

¡S1

-1,0 -0,8 -0,6 ■0,4 •0,2 -0,0 --0,2 --0,4 -0,6

Рис. 2. Тепловая карта корреляционных значений признаков Fig. 2. Correlation heatmap for each pair of features

Ветер Температура Влажный Влажность Давление Количество Количество Уровень термометр осадков снега воды

Признаки

Рис. 3. Распределение масштабированных данных Fig. 3. Normalized data distribution

таты прогноза уровня воды представлены на графике (рис. 4), из которого видно, что алгоритм спрогнозировал наводнение, схожее с историческим наводнением предыдущих лет. Данные всех прогнозов по каждому населенному пункту дублируются в общую выборку данных (К), которая в дальнейшем делится для обучения и валидации. Данные полученного прогноза (на графике правый пик) используется в дальнейшем для построения стека (ансамбля) других моделей. Необходимость составления стека заключается в получении более гибкой функции, которая бы давала результаты лучше, чем каждый алгоритм по-отдель-ности.

Подход к построению стека и его работы следующий:

1) возьмем три модели, которые показали лучший прогноз по итогам тестирования: случайный лес, бэггинг и ХОВоо8^

2) обучим отдельный алгоритм на общем множестве данных;

1000 Дни

1500

Рис. 4. Прогнозирование уровня воды по модели Хольта-Уинтерса Fig. 4. Predicted water level by the Holt-Winters model

3) каждая модель прогнозирует следующий период отдельно, далее результаты усредняются. Стек позволяет спрогнозировать на целый год по каждому отдельному населенному пункту. В итоге на прогноз влияет результат каждой модели из стека, что

Таблица 1. Результативность алгоритмов без подбора оптимальных параметров Table 1. Baseline results (without hyperparameters tuning)

Алгоритм Показатели

R-квадрат RMSE

AdaBoost 0,76 0,112

Бэггинг 0,9 0,069

Регрессия с градиентным бустингом 0,86 0,079

Случайный лес 0,91 0,066

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Регрессия со стохастическим градиентным спуском 0,73 0,114

Линейная регрессия 0,73 0,113

Решающее дерево 0,82 0,089

Дополнительное дерево 0,82 0,106

XGBoost 0,92 0,062

а

0,8

и и о

s «

S 0.4

о

0,0

исторический уровень ---- прогноз

• „ ^Wv......прогноз лольта-уинтерса

ÎF и \ \

j| jJ jf r * 1 \ щ Ч, \ \ ч

»: С к . t/É : Д '■' Jf. 1 .Л«,*»

-Jsj^ irçfe 1 T; 1

Дни

Рис. 5. Сравнение результатов прогноза и исторических данных по городам Ханты-Мансийску (а) и Салехарду (б)

на 2018 год.

Сплошная кривая — исторические данные; штриховая кривая — прогнозируемые данные, полученные предлагаемым методом (ансамбля трех моделей); кривая из точек — прогноз модели Хольта-Уинтерса

Fig. 5. Real data and prediction comparison for Khanty-Mansiysk (a) and Salekhard (б) in 2018. Solid curve — Real data; dashed curve — Prediction by stack of 3 models; dotted curve - Prediction by the Holt-Winters model

позволяет сглаживать выбросы и аномалии для отдельно взятых результатов. Для валидации алгоритмов использован коэффициент детерминации. На рис. 5 показано сравнение исторических данных по городам Ханты-Мансийску и Салехарду и полученных в результате работы ансамбля моделей.

Из рис. 5 видно, что результаты, полученные методом ансамбля трех моделей, показывают лучшие результаты, чем модель Хольта-Уинтерса. Например, на рис. 5, б видно, что модель Хольта-Уинтерса показывает значительную разницу периодов начала и конца пика по дням в сравнении с историческими данными или с прогнозом стека, имеющих небольшие неточно-

сти в прогнозируемых днях. В качестве рекомендации предлагается строить прогноз наводнения только на два месяца вперед. При этом уменьшается количество синтезируемых данных, следовательно, повышается качество и чистота данных множества; повышается точность прогноза, так как множество пополняется новыми, актуальными, реально полученными данными предыдущих месяцев, за счет которых можно проводить дополнительное обучение модели.

Из рис. 6, а, б видно, что значения, полученные в результате моделирования, приблизительно указывают на историческое начало пика наводнения, а на рис. 6, в уровень воды по прогнозу отличается примерно на

Рис. 6. Прогнозы по: г. Ханты-Мансийску (а); г. Уренгой (б) и п. Пангоды (в) на два месяца, начиная с апреля 2018. Сплошная кривая — исторические данные; штриховая кривая — прогнозируемые данные

Fig. 6. Two months prediction for Khanty-Mansiysk (a), Urengoy (б) and Pangody (в) from April 2018. Solid curve — Real data; dashed curve — Prediction

0,14 пункта. Однако линия тренда за два месяца, построенная на данных прогноза, не показывает сезонного изменения уровня воды, что имеет сходство с графиком исторических данных.

Несмотря на небольшой объем открытых данных, предлагаемая модель ансамбля алгоритмов, способна дать аппроксимированный прогноз повышенного уров-

ня воды в течение двух месяцев, а также представить индивидуальный прогноз для каждого населенного пункта, что зачастую является особо востребованным для отдельных областей.

В табл. 2 приведены показатели важности признаков, вычисленные с использованием алгоритмов градиентного бустинга и случайного леса. Самым значимым

Таблица 2. Важность признаков, в долях Table 2. Feature importance in shares

Признаки Соотношение по XGBoost Соотношение по Random Forest Среднее по методам

Прогноз Хольта-Уинтерса 0,87 0,68 0,77

Температура 0,02 0,12 0,07

Снег 0,04 0,06 0,05

Влажный термометр 0,01 0,07 0,04

Количество осадков 0,02 0,03 0,02

Влажность 0,02 0,02 0,02

Давление 0,02 0,02 0,02

Ветер 0,00 0,01 0,00

Наличие снега 0,00 0,01 0,00

Наличие метели 0,00 0,00 0,00

Наличие осадков 0,00 0,00 0,00

Наличие дождя 0,00 0,00 0,00

признаком являются данные результата предварительного прогноза, полученные с помощью модели Хольта-Уинтерса. Далее следуют температура, снег и влажный термометр. Если бы стек состоял из четырех моделей и включал модель Хольта-Уинтерса в ансамбль, то позиции важности признаков сохранились.

Заключение

В работе предложен новый подход к прогнозированию временного ряда на стеке статистических моделей. Особенностью разработанного метода является то, что для обучения модели используются данные прогноза, предварительно полученные с помощью метода

Литература

1. Mosavi A., Ozturk P., Chau K.-W. Flood prediction using machine learning models: Literature review // Water. 2018. V. 10. N 11. P. 1536. doi: 10.3390/w10111536

2. Huang M., Xie J., Cai Y., Wang N., Zhang Y. Application of middleware technique in Web of flood forecasting system with multiple models // Proc. International Conference on Hybrid Information Technology, ICHIT 2006. 2016. P. 505-508. doi: 10.1109/ICHIT.2006.253534

3. Abdurrahman M., Irawan B., Latuconsina R. Flood Forecasting using Holt-Winters Exponential Smoothing Method and Geographic Information System // Proc. 3rd International Conference on Control, Electronics, Renewable Energy and Communications (ICCREC). 2017. P. 159-163. doi: 10.1109/ICCEREC.2017.8226704

4. Adnan R., Ruslan F.A., Samad Abd M., Zain Z.Md. Flood water level modelling and prediction using artificial neural network: Case study of Sungai Batu Pahat in Johor // Proc. IEEE Control and System Graduate Research Colloquium, ICSGRC 2012. 2012. P. 22-25. doi: 10.1109/ICSGRC.2012.6287127

5. Rahman I.I.A., Alias N.M.A. Rainfall forecasting using an artificial neural network model to prevent flash floods // Proc. 8th International Conference on High-capacity Optical Networks and Emerging Technologies, HONET. 2011. P. 323-328. doi: 10.1109/H0NET.2011.6149841

6. Linghu B., Chen F. An intelligent multi-agent approach for flood disaster forecasting utilizing case based reasoning // Proc. 5th International Conference on Intelligent Systems Design and Engineering Applications, ISDEA. 2014. P. 182-185. doi: 10.1109/ISDEA.2014.48

7. Ranit A.B., Durge P. V. Different techniques of flood forecasting and their applications // Proc. 3rd International Conference on Research in Intelligent and Computing in Engineering, RICE. 2018. P. 8509058. doi: 10.1109/RICE.2018.8509058

8. Zhu Y., Feng J., Yan L., Guo T., Li X. Flood prediction using rainfall-flow pattern in data-sparse watersheds // IEEE Access. 2020. V. 8. P. 39713-39724. doi: 10.1109/ACCESS.2020.2971264

9. Sachin D. Holt-Winters Exponential Smoothing // Towards Data Science. 2020 [Электронный ресурс]. URL: https:// towardsdatascience.com/holt-winters-exponential-smoothing-d703072c0572 (дата обращения: 18.10.2020).

10. Koehrsen W. An Implementation and Explanation of the Random Forest in Python // Towards Data Science. 2018 [Электронный ресурс]. URL: https://towardsdatascience.com/an-implementation-and-explanation-of-the-random-forest-in-python-77bf308a9b76 (дата обращения: 18.10.2020).

11. Christopher B. Time Series Analysis (TSA) in Python — Linear Models to GARCH // Blackarbs. 2016 [Электронный ресурс]. URL: http://www.blackarbs.com/blog/time-series-analysis-in-python-linear-models-to-garch/11/1/2016 (дата обращения: 18.10.2020).

12. Brownlee J. A Gentle Introduction to Exponential Smoothing for Time Series Forecasting in Python // Machine Learning Mastery, Australia. 2018 [Электронный ресурс]. URL: https://machinelearningmastery. com/exponential-smoothing-for-time-series-forecasting-in-python/ (дата обращения: 18.10.2020).

13. Rocca J. Ensemble methods: bagging, boosting and stacking // Towards Data Science. 2019 [Электронный ресурс]. URL: https://

Хольта-Уинтерса. Экспериментальные данные в результате тестирования предлагаемого подхода показали его эффективность.

Получен прогноз повышенного уровня воды, сравнимый со значениями исторических данных по рекам Ненецкого автономного округа. Кроме этого, с помощью предлагаемого метода возможно получение индивидуального прогноза для отдельных населенных пунктов. Разработанный метод прогнозирования может быть использован для работ по предотвращению последствий сезонных затоплений населенных пунктов в период весеннего половодья.

References

1. Mosavi A., Ozturk P., Chau K.-W. Flood prediction using machine learning models: Literature review. Water, 2018, vol. 10, no. 11, pp. 1536. doi: 10.3390/w10111536

2. Huang M., Xie J., Cai Y., Wang N., Zhang Y. Application of middleware technique in Web of flood forecasting system with multiple models. Proc. International Conference on Hybrid Information Technology, ICHIT 2006, 2016, pp. 505-508. doi: 10.1109/ICHIT.2006.253534

3. Abdurrahman M., Irawan B., Latuconsina R. Flood Forecasting using Holt-Winters Exponential Smoothing Method and Geographic Information System. Proc. 3rd International Conference on Control, Electronics, Renewable Energy and Communications (ICCREC),

2017, pp. 159-163. doi: 10.1109/ICCEREC.2017.8226704

4. Adnan R., Ruslan F.A., Samad Abd M., Zain Z.Md. Flood water level modelling and prediction using artificial neural network: Case study of Sungai Batu Pahat in Johor. Proc. IEEE Control and System Graduate Research Colloquium, ICSGRC 2012, 2012, pp. 22-25. doi: 10.1109/ICSGRC.2012.6287127

5. Rahman I.I.A., Alias N.M.A. Rainfall forecasting using an artificial neural network model to prevent flash floods. Proc. 8th International Conference on High-capacity Optical Networks and Emerging Technologies, HONET, 2011, pp. 323-328. doi: 10.1109/H0NET.2011.6149841

6. Linghu B., Chen F. An intelligent multi-agent approach for flood disaster forecasting utilizing case based reasoning. Proc. 5th International Conference on Intelligent Systems Design and Engineering Applications, ISDEA, 2014, pp. 182-185. doi: 10.1109/ISDEA.2014.48

7. Ranit A.B., Durge P.V. Different techniques of flood forecasting and their applications. Proc. 3rd International Conference on Research in Intelligent and Computing in Engineering, RICE, 2018, pp. 8509058. doi: 10.1109/RICE.2018.8509058

8. Zhu Y., Feng J., Yan L., Guo T., Li X. Flood prediction using rainfall-flow pattern in data-sparse watersheds. IEEE Access, 2020, vol. 8, pp. 39713-39724. doi: 10.1109/ACCESS.2020.2971264

9. Sachin D. Holt-Winters Exponential Smoothing. Towards Data Science, 2020. Available at: https://towardsdatascience.com/holt-winters-exponential-smoothing-d703072c0572 (accessed: 18.10.2020).

10. Koehrsen W. An Implementation and Explanation of the Random Forest in Python. Towards Data Science, 2018. Available at: https:// towardsdatascience.com/an-implementation-and-explanation-of-the-random-forest-in-python-77bf308a9b76 (accessed: 18.10.2020).

11. Christopher B. Time Series Analysis (TSA) in Python — Linear Models to GARCH. Blackarbs, 2016. Available at: http://www. blackarbs.com/blog/time-series-analysis-in-python-linear-models-to-garch/11/1/2016 (accessed: 18.10.2020).

12. Brownlee J. A Gentle Introduction to Exponential Smoothing for Time Series Forecasting in Python. Machine Learning Mastery, Australia,

2018. Available at: https://machinelearningmastery.com/exponential-smoothing-for-time-series-forecasting-in-python/ (accessed: 18.10.2020).

13. Rocca J. Ensemble methods: bagging, boosting and stacking. Towards Data Science, 2019. Available at: https://towardsdatascience.com/

towardsdatascience.com/ensemble-methods-bagging-boosting-and-stacking-c9214a10a205 (дата обращения: 18.10.2020).

14. Brownlee J. How to Use XGBoost for Time Series Forecasting // Machine Learning Mastery, Australia. 2018 [Электронный ресурс]. URL: https://machinelearningmastery.com/xgboost-for-time-series-forecasting/ (дата обращения: 18.10.2020).

15. Brownlee J. Comparing Classical and Machine Learning Algorithms for Time Series Forecasting // Machine Learning Mastery, Australia. 2019 [Электронный ресурс]. URL: https://machinelearningmastery. com/findings-comparing-classical-and-machine-learning-methods-for-time-series-forecasting/ (дата обращения: 18.10.2020).

ensemble-methods-bagging-boosting-and-stacking-c9214a10a205 (accessed: 18.10.2020).

14. Brownlee J. How to Use XGBoost for Time Series Forecasting. Machine Learning Mastery, Australia, 2018. Available at: https:// machinelearningmastery.com/xgboost-for-time-series-forecasting/ (accessed: 18.10.2020).

15. Brownlee J. Comparing Classical and Machine Learning Algorithms for Time Series Forecasting. Machine Learning Mastery, Australia, 2019. Available at: https://machinelearningmastery.com/ findings-comparing-classical-and-machine-learning-methods-for-time-series-forecasting/ (accessed: 18.10.2020).

Авторы

Кулин Никита Игоревич — студент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, kylin98@list.ru, https:// orcid.org/0000-0002-3952-6080

Козлов Евгений Александрович — студент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, kozloffevgeniy@gmail.com, https://orcid.org/0000-0002-1885-9556 Жук Юлия Александровна — кандидат педагогических наук, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, 55308663800, zhuk_yua@mail.ru, https://orcid.org/0000-0002-5218-322X

Authors

Nikita I. Kulin — Student, ITMO University, Saint Petersburg, 197101, Russian Federation, kylin98@list.ru, https://orcid.org/0000-0002-3952-6080

Evgeniy A. Kozlov — Student, ITMO University, Saint Petersburg, 197101, Russian Federation, kozloffevgeniy@gmail.com, https://orcid.org/0000-0002-1885-9556

Yulia A. Zhuk — PhD, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, S3 55308663800, zhuk_yua@mail.ru, https://orcid.org/0000-0002-5218-322X

Статья поступила в редакцию 07.10.2020 Одобрена после рецензирования 20.01.2021 Принята к печати 03.02.2021

Received 07.10.2020

Approved after reviewing 20.01.2021

Accepted 03.02.2021

Работа доступна по лицензии Creative Commons «Attribution-NonCommercial»

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.