Научная статья на тему 'Моделирование и прогнозирование концентрации PM2.5 на строительной площадке с использованием искусственного интеллекта'

Моделирование и прогнозирование концентрации PM2.5 на строительной площадке с использованием искусственного интеллекта Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
пылевые выбросы / мелкодисперсная пыль / сквозные технологии / загрязнение воздушной среды / искусственный интеллект / пылевое загрязнение / dust emissions / fine dust / end-to-end technologies / air pollution / artificial intelligence / dust pollution

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Светлана Евгеньевна Манжилевская

Введение. Воздействие на людей высоких концентраций РМ2.5 неблагоприятно сказывается на их здоровье. По оценкам исследователей, воздействие твердых частиц, образующихся в результате выбросов строительной пыли, стало причиной 18 % смертей от заболеваний дыхательной системы. В связи с ростом объемов строительного производства и увеличением, соответственно, объемов пылевых выбросов появляется необходимость расширить функционал применения сквозных технологий, а именно технологий искусственного интеллекта, в сфере прогнозирования концентрации пылевых выбросов в атмосферном воздухе частиц мелкодисперсной пыли РМ2.5 на строительной площадке. Материалы и методы. Для достижения поставленной цели были проведены замеры концентрации частиц РМ2.5 на строительной площадке с помощью счетчика частиц Handheld 3016 IAQ в период в период с 1 по 6 июля 2023 г, учитывая метеорологические характеристики территории, которые стали в дальнейшем исходными данными для моделирования прогноза концентрации пылевого загрязнения с помощью таких алгоритмов как ARIMA, EMA, XGBoost и т.д., а также ансамблевых моделей, в состав которых вошли рассматриваемые алгоритмы машинного обучения. Определение эффективности применение данных технологий в сфере прогнозирование определялось путем сравнения результатов прогноза и данными натурных измерений. Результаты исследования. Произведен корреляционный анализ посредством программы «Modeltime», что определяет взаимосвязь между концентрацией РМ2.5 и метеорологическими переменными. Автокорреляция была проведена при помощи корреляции Пирсона. Произведена оценка на первом этапе четырех одномерных моделей на базе искусственного интеллекта с целью определения точности прогноза средней концентрации. Следующим этапом стала оценка прогнозирования средней концентрации РМ2.5 при помощи многомерных моделей, которые учитывают взаимосвязи между независимыми и зависимыми переменными. На заключительном этапе исследования три лучшие модели с точки зрения эффективности прогнозирования были включены для проверки ансамблевой модели. Обсуждение и заключение. Надежные прогнозные модели могут быть полезными инструментами для понимания факторов, которые могут влиять на концентрацию. В настоящем исследовании для прогнозирования концентрации РМ2.5 использовались семь алгоритмов машинного обучения. В совокупности это исследование предоставляет доказательства эффективности использования методов комплексного моделирования для прогнозирования загрязнения воздуха.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Светлана Евгеньевна Манжилевская

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Modeling and Predicting PM2.5 Concentration at a Construction Site Using the Artificial Intelligence

Introduction. High concentration of PM2.5 has the adverse effect on people's health. According to the evaluations made by the researchers, the impact of the particulate matter from the construction dust emissions resulted in 18% of deaths from respiratory diseases. Due to the growth of construction production volume and consequent increase of dust emission volumes, there arises the need to expand the scope of using the end-to-end technologies, namely the artificial intelligence technologies, for predicting the fine-dispersed dust particles PM2.5 concentration in dust emissions at the construction site. Materials and methods. To achieve this goal, the measurements of PM2.5 concentration at the construction site were carried out using the Handheld 3016 IAQ particle counter in the period from July 1 to July 6, 2023 taking into account the meteorological characteristics of the territory, which then became the input data for modelling the forecast of dust pollution concentration using such algorithms as ARIMA, EMA, XGBoost, etc., and the ensemble models that included the above machine learning algorithms. The efficiency of using these technologies for predicting was determined by comparing the results of the forecast and the field measurements data. Results. A correlation analysis was performed using the Modeltime program, which determined the relationship between PM2.5 concentration and meteorological variables. Autocorrelation was performed using Pearson correlation. At the first stage, four one-dimensional models based on the artificial intelligence were evaluated to determine the accuracy of mean concentration forecast. The next step was to evaluate the capacity of predicting the mean PM2.5 concentration using the multidimensional models that took into account the relationships between the independent and dependent variables. At the final stage of the research, three most efficient predictive models were included to test the ensemble model. Discussion and conclusion. The reliable predictive models can be the useful tools for understanding the concentration impact factors. In the present research, seven machine learning algorithms were used to predict the concentration of PM2.5. The research, as a whole, presents the evidences of the integrated modeling method efficiency for predicting the air pollution.

Текст научной работы на тему «Моделирование и прогнозирование концентрации PM2.5 на строительной площадке с использованием искусственного интеллекта»

ТЕХНОЛОГИЯ И ОРГАНИЗАЦИЯ СТРОИТЕЛЬСТВА TECHNOLOGY AND ORGANIZATION OF CONSTRUCTION

H) Check for updates

УДК 628.511.2 Научная статья

https://doi.org/10.23947/2949-1835-2024-3-l-104-113

Моделирование и прогнозирование концентрации PM2.5 на строительной площадке с использованием искусственного интеллекта

С.Е. Манжилевская ED

Донской государственный технический университет, г. Ростов-на-Дону, Российская Федерация „ EDN: BHCSYU

М smanzhilevskaya@yandex.ru

Аннотация

Введение. Воздействие на людей высоких концентраций РМ2.5 неблагоприятно сказывается на их здоровье. По оценкам исследователей, воздействие твердых частиц, образующихся в результате выбросов строительной пыли, стало причиной 18 % смертей от заболеваний дыхательной системы. В связи с ростом объемов строительного производства и увеличением, соответственно, объемов пылевых выбросов появляется необходимость расширить функционал применения сквозных технологий, а именно технологий искусственного интеллекта, в сфере прогнозирования концентрации пылевых выбросов в атмосферном воздухе частиц мелкодисперсной пыли РМ2.5 на строительной площадке.

Материалы и методы. Для достижения поставленной цели были проведены замеры концентрации частиц РМ2. 5 на строительной площадке с помощью счетчика частиц Handheld 3016 IAQ в период в период с 1 по 6 июля 2023 г, учитывая метеорологические характеристики территории, которые стали в дальнейшем исходными данными для моделирования прогноза концентрации пылевого загрязнения с помощью таких алгоритмов как ARIMA, EMA, XGBoost и т.д., а также ансамблевых моделей, в состав которых вошли рассматриваемые алгоритмы машинного обучения. Определение эффективности применение данных технологий в сфере прогнозирование определялось путем сравнения результатов прогноза и данными натурных измерений.

Результаты исследования. Произведен корреляционный анализ посредством программы «Modeltime», что определяет взаимосвязь между концентрацией РМ2.5 и метеорологическими переменными. Автокорреляция была проведена при помощи корреляции Пирсона. Произведена оценка на первом этапе четырех одномерных моделей на базе искусственного интеллекта с целью определения точности прогноза средней концентрации. Следующим этапом стала оценка прогнозирования средней концентрации РМ2.5 при помощи многомерных моделей, которые учитывают взаимосвязи между независимыми и зависимыми переменными. На заключительном этапе исследования три лучшие модели с точки зрения эффективности прогнозирования были включены для проверки ансамблевой модели.

Обсуждение и заключение. Надежные прогнозные модели могут быть полезными инструментами для понимания факторов, которые могут влиять на концентрацию. В настоящем исследовании для прогнозирования g концентрации РМ2.5 использовались семь алгоритмов машинного обучения. В совокупности это исследование u.t предоставляет доказательства эффективности использования методов комплексного моделирования для

и

on прогнозирования загрязнения воздуха. тр

Ключевые слова: пылевые выбросы, мелкодисперсная пыль, сквозные технологии, загрязнение воздушной

.s среды, искусственный интеллект, пылевое загрязнение

£

>

^ Для цитирования. Манжилевская С.Е. Моделирование и прогнозирование концентрации PM2.5 на строительной площадке с использованием искусственного интеллекта. Современные тенденции в строительстве, градостроительстве и планировке территорий. 2024;3(1): 104—113. ^ https://doi.org/10.23947/2949-1835-2024-3-1-104-113

104

© Манжилевская С.Е., 2024

Research article

Modeling and Predicting PM2.5 Concentration at a Construction Site Using the Artificial Intelligence

Svetlana E. Manzhilevskaya ED

Don State Technical University, Rostov-on-Don, Russian Federation И smanzhilevskaya@yandex. ru

Abstract

Introduction. High concentration of PM2.5 has the adverse effect on people's health. According to the evaluations made by the researchers, the impact of the particulate matter from the construction dust emissions resulted in 18% of deaths from respiratory diseases. Due to the growth of construction production volume and consequent increase of dust emission volumes, there arises the need to expand the scope of using the end-to-end technologies, namely the artificial intelligence technologies, for predicting the fine-dispersed dust particles PM2.5 concentration in dust emissions at the construction site. Materials and methods. To achieve this goal, the measurements of PM2.5 concentration at the construction site were carried out using the Handheld 3016 IAQ particle counter in the period from July 1 to July 6, 2023 taking into account the meteorological characteristics of the territory, which then became the input data for modelling the forecast of dust pollution concentration using such algorithms as ARIMA, EMA, XGBoost, etc., and the ensemble models that included the above machine learning algorithms. The efficiency of using these technologies for predicting was determined by comparing the results of the forecast and the field measurements data.

Results. A correlation analysis was performed using the Modeltime program, which determined the relationship between PM2.5 concentration and meteorological variables. Autocorrelation was performed using Pearson correlation. At the first stage, four one-dimensional models based on the artificial intelligence were evaluated to determine the accuracy of mean concentration forecast. The next step was to evaluate the capacity of predicting the mean PM2.5 concentration using the multidimensional models that took into account the relationships between the independent and dependent variables. At the final stage of the research, three most efficient predictive models were included to test the ensemble model. Discussion and conclusion. The reliable predictive models can be the useful tools for understanding the concentration impact factors. In the present research, seven machine learning algorithms were used to predict the concentration of PM2.5. The research, as a whole, presents the evidences of the integrated modeling method efficiency for predicting the air pollution.

Keywords: dust emissions, fine dust, end-to-end technologies, air pollution, artificial intelligence, dust pollution

For citation. Manzhilevskaya SE. Modeling and Predicting PM2.5 Concentration at a Construction Site Using the Artificial Intelligence. Modern Trends in Construction, Urban and Territorial Planning. 2024;3(1):104-113. https://doi.org/10.23947/2949-1835-2024-3-1-104-113

Введение. В России с каждым годом растет городское население, к 2050 году в городских агломерациях будет проживать до 84 % население страны [1]. Рост населения в городах создает множество экологических проблем, в т. ч. загрязнение воздуха за счет быстро растущего объема строительного производства в городах. Замеры, мониторинг, моделирование и прогнозирование пылевых выбросов доказывают, что строительный процесс является крупным источником пылевого загрязнения в городской среде, что требует разработки мероприятий по сокращению его в воздушную среду города [2].

На сегодняшний день в процессе прогнозирования концентрации пылевых выбросов в воздушной среде применяется метод на основе регрессии, но с возрастанием объемов строительства и, соответственно, объемов пылевого загрязнения для систематизации и повышения точности прогнозирования требуется привлечение § новых инструментов, в том числе цифровых технологий. &

В сфере прогнозирования концентрации пылевых выбросов возможно внедрить методы машинного обучения, такие как нейронные сети, методы опорных векторов, модели цифровой библиотеки «Prophet» и т. д., хотя они |

также имеют недостатки и погрешности. В ходе исследований К.Ю. Богачева, применявшего в прогнозировании g

л

линейные и нелинейные модели, было установлено, что нелинейные модели (нейронные сети) дают более точный °

К

прогноз, что делает их приоритетным цифровым инструментом прогнозирования [3]. Нейронные сети, помимо всего, имеют высокие показатели переобучения и достижения в поиске локальных минимумов [4]. |

В связи с развитием тенденции внедрения в строительную отрасль сквозных технологий появляется необходимость проверить возможность применения данного инструмента с целью прогнозирования концентрации загрязнения воздушной среды на примере пылевых выбросов частиц мелкодисперсной пыли РМ2.5, так как на данный момент частицы данного вида наиболее опасный для здоровья человека [5].

н

и

По данным зарубежных исследований в обучении искусственного интеллекта наиболее точные прогнозы дают ансамблевые модели (ensemble models), которые могут комбинировать в своей связке несколько автономных алгоритмов, которые также по отдельности могут осуществить процесс прогнозирования [6].

Цель данного исследования — определить эффективность применения в процессе прогнозирования концентрации пылевого загрязнения РМ2.5 на строительной площадке моделей и алгоритмов обучения искусственного интеллекта, как по отдельности, так и в составе ансамблевых моделей.

Для достижения данной цели были определены следующие задачи:

1. Осуществить процесс моделирования и прогнозирования концентрации пылевого загрязнения частицами РМ2.5 на строительной площадке с использования следующих алгоритмов:

- авторегрессионная интегрированная модель скользящего среднего (autoregressive integrated moving average, ARIMA);

- экспоненциальное сглаживание (exponential moving average, EMA);

- цифровая библиотека Prophet;

- нейронные сети (neural network, NN);

- алгоритм случайного леса (random forest, RF);

- метод опорных векторов (support-vector machine, SVM);

- цифровая библиотека с открытым исходным кодом XGBoost.

2. Применить метод ансамблевых моделей для прогнозирования концентраций PM2.5 на строительной площадке станции метрополитена в г. Москва.

Важно определить надежность полученных результатов от применения модели для прогнозирования концентраций PM2.5 по нескольким причинам:

1. Данные прогноза концентрации загрязняющего вещества, полученные с помощью применения данных моделей, позволят скорректировать расписание работ в зависимости от погодных условий и применить защитные мероприятий, которые позволят снизить концентрацию пылевого загрязнения и уровень воздействия на рабочих и население, проживающее по соседству со строительной площадкой.

2. Модели можно использовать для изучения динамики снижения концентрации загрязняющих веществ, определять, например, зоны или периоды строительного производства с высоким/низким уровнем концентрации загрязняющего вещества в воздушной среде территории города.

3. Применение данных моделей определяют значимые переменные, которые оказывают влияние на концентрацию частиц РМ2.5 при производстве работ на строительной площадке (направление и скорость ветра, влажность, температура и т. д.).

Моделированием и прогнозированием концентрации загрязняющих веществ РМ2.5 и РМ10 занимались многие зарубежные ученые [7, 8]. Загрязненность воздушной среды частицами мелкодисперсной пыли РМ2.5 в строительном производстве является объектом и многих отечественных исследований в связи с высокой степенью их воздействия на здоровье человека [9, 10].

Таким образом, разработка надежных инструментов для прогнозирования содержания РМ2.5 в воздушной среде от строительного производства имеет жизненно важное значение для разработки эффективных стратегий снижения его воздействия.

Материалы и методы. Москва является административной столицей Российской Федерации и центром экономической деятельности страны. Высокая плотность населения, рост строительного производства генерируют большие объемы загрязняющих веществ в воздухе, таких как частицы РМ2.5 [11].

Исходными данными для моделирования процессов прогнозирования концентрации РМ2.5 стали результаты замеров, произведенные на строительной площадке станционного комплекса «Улица Новаторов, вестибюль 1, по 2 ул. Новаторов 6, г. Москва». Измерения концентрации частиц мелкодисперсной пыли были произведены при |з помощи счетчика частиц Handheld 3016 IAQ в период с 1 по 6 июля 2023 г. Для контроля точности прогноза -§ концентрации РМ2.5 путем ее моделирования посредством применения ансамблевых моделей замеры также sg производились 7 и 8 июля. Точность прогнозирования требовала ввести метеорологические переменные —

.s температуру и относительную влажность, что также измерялось в ходе исследования. Все полученные данные

ï?

w были использованы для обучения одномерных и многомерных моделей, рассматриваемых в данной работе, с

целью прогноза концентрации РМ2. 5. а Процесс моделирования прогноза концентрации РМ2.5 включал следующие алгоритмы прогнозирования:

-С 1. Модель ARIMA. Модель не способна фиксировать нелинейные взаимосвязи между переменными,

которые включены в процесс обучения. Это требует поочередно включать переменные в моделирование и посредством сравнения полученных данных с реальными значениями концентрации определять точность

прогноза. Данная модель имеет три элемента: модель авторегрессии, модель скользящего среднего и разностную модель [12]. В целом ARIMA для процесса прогнозирования фиксирует информацию в данных после автокорреляции, а затем посредством ввода переменной выдает прогноз. Математическое выражение данной модели имеет следующий вид:

У = c + y,_i0i + - •+0РУt- p + + £t-q + st, (1)

где yt, — разностные данные временных рядов для концентрации PM2.5; c — константа; е — значение ошибки; d — порядок разностных данных временных рядов.

Предикторы в правой части уравнения (1) включают запаздывающие значения концентрации PM2.5 и запаздывающие ошибки. Элементы p, d и q модели ARIMA определяются автоматически с использованием варианта алгоритма Хайндмана-Хандакара [13].

2. Модель EMA. В отличие от модели ARIMA данный алгоритм применяется для прогнозирования в нескольких областях. Он не только взвешивает одинаково средние значения ряда подмножеств, но и учитывает фактор времени, сглаживая значения и уменьшая их вес с течением времени.

Математическое выражение данной модели имеет следующий вид:

yt+i = F +«( - F), (2)

где yt+1 — прогноз концентрации PM2.5 на следующий период времени; Ft — прогноз концентрации частиц PM2.5 на момент времени (t);yt — фактическое значение концентрации PM2.5 на момент времени (t); а — вес, называемый константой экспоненциального сглаживания (0< а < 1).

Данная модель присваивает меньше веса более ранним по времени наблюдениям (yt-6), чем приближенным к моменту расчета (y-1) [14].

3. Модель Prophet. В данную модель можно включать переменную, которая характеризует показатели «сезонности» концентрации. Например, этот алгоритм можно использовать для прогнозирования пылевыделения от строительных работ в теплое время и холодное время года. Математическое выражение данного алгоритма для расчета концентрации РМ2.5 имеет следующий вид:

yt = g(t) +s(t) + h(t) + st , (3)

где g(t) — кусочно-линейная функция, определяющая динамику; s(t) — различные сезонные закономерности; h(t) — эффект «праздничного дня»; et — ошибки типа белый шум, не учтены моделью [15].

4. Модель нейросети. Нейронные сети моделируют информацию, имитируя человеческое мышление, и отражают нелинейные взаимосвязи.

В моделировании прогноза концентрации РМ2.5 применимы следующие модели:

- модель нелинейной авторегрессии с внешними входами (NARX);

- модель нейронной сети, основанная на нескольких переменных (NNAR).

Для работы с моделями нейросети были использованы следующие данные для переменных, полученные в ходе измерения концентрации РМ2.5 на строительной площадке, представленные в таблице 1.

Таблица 1

Данные измерений со стройплощадки в июле 2023 г.

Концентрация пылевого загрязнения РМ2.5, мкг/м3 Относительная влажность воздуха Температура

Диапазон Средн. значен. Отклон. Диапазон Средн. значен. Отклон. Диапазон Средн. значен. Отклон.

1,73-65,3 22,4 11,9 13,1-19,7 16,7 14,3 23,1-33,2 28,2 4,2

о

5. Алгоритм Random forest. Данный алгоритм генерирует большое количество древ решений. Загрузка всех данных, включая переменные, генерирует уникальные древа решений. Результаты прогнозирования посредством данной модели определяются средними значениями выходных данных каждого дерева.

Математическое выражение данного алгоритма для расчета концентрации РМ2.5 имеет следующий вид:

1 n

Р = - TN, N T

(4)

где р — прогноз алгоритма случайного древа решений; N — количество прогонов по деревьям в случайном лесу (случайным выборкам).

и о н о

й 1) н

6. Модель SVM. Данная модель разработана В.Н. Вапником [16]. Основной целью алгоритма SVM является определение оптимальной гиперплоскости, которая линейно разделяет собранные данные на две группы:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

шгх + Ь = 0 , (5)

где w — весовой вектор; x — входной вектор; Ь — смещение.

7. Алгоритм XGBoost. XGBoost — это относительно новый алгоритм машинного обучения, представляющий собой совокупность деревьев решений, использующий градиентный бустинг. Основная идея модели XGBoost заключается в том, что алгоритм объединяет выходные данные большого количества деревьев решений для получения более точных прогнозов. XGBoost — это алгоритм решений с градиентным усилением, т. е. посредством расчета одной модели алгоритм убирает ошибки при создании следующих моделей, что повышает точность прогнозов. Математическое выражение данного алгоритма для расчета концентрации РМ2.5 имеет следующий вид:

У = !/„

'n ( )

(6)

где xi — тестовая выборка; i — количество выборок; ^ — п-я древовидная модель; п — количество всех деревьев в модели.

Рассмотренные модели были использованы для получения прогнозов среднесуточной концентраций частиц мелкодисперсной пыли РМ2.5.

Процесс прогнозирования был произведен в 4 этапа:

1. Сбор и обработка данных.

2. Подготовка данных к моделированию.

3. Использование расчетной модели для прогнозирования.

4. Оценка прогноза.

Все модели были реализованы с использованием язык программирования для статистической обработки данных и работы с графикой «Я» и программного пакета — «МойеШте». Данное программное обеспечение предоставляет платформу для применения статистических моделей.

Замеры концентрации частиц мелкодисперсной пыли РМ2.5 и метеорологические данные были объединены и преобразованы в почасовые временные ряды данных о концентрации частиц РМ2.5, температуре и относительной влажности с помощью программного пакета «Modeltime». Данные временных рядов о концентрации РМ2.5 представлены на рис. 1.

60

40 -I

20

Й о тр

ад

f

1-07.2023

2.07.2023

3.07.2023

4.07.2023

5 07.2023

6.07.2023

Даты проведения измерений Рис. 1. Показатели концентрации РМ2.5 в период исследования

Модели оценивались с использованием обучающего набора данных. Впоследствии данные, охватывающие обученные модели, были использованы для составления прогнозов на предыдущие 24 часа, т. е. для проверки модели. Для моделей прогнозирования были определены ограничения показателей, которые дают объективность оценки:

1. Средняя абсолютная ошибка (mean absolute error, MAE).

2. Средняя абсолютная масштабированная ошибка (mean absolute scaled error, MASE).

3. Среднеквадратичная ошибка (root mean squared logarithmic error, RMSE).

n

n=1

Результаты исследования. Был проведен корреляционный анализ посредством программы «МойеШте», что определяет взаимосвязь между концентрацией РМ2.5 и метеорологическими переменными. Автокорреляция была проведена при помощи корреляции Пирсона (рис. 2) [17]. Определено, что между концентрацией частиц мелкодисперсной пыли РМ2.5 с относительной влажностью и с температурой слабая отрицательная корреляция, коэффициенты — 0,107 и 0,048 соответственно.

Lag(k)

Рис. 2. Автокорреляция концентрации РМ2.5

Между относительной влажностью и температурой существует сильная отрицательная корреляция (0,929). В целом все переменные были отрицательно коррелированы друг с другом.

Это наблюдение можно отнести к сезонным закономерностям, присутствующим в данных. Пики, как правило, находятся на расстоянии 24 часов друг от друга. По результатам автокорреляции были использованы одномерные модели, чтобы определить подходящие закономерности для включения в многомерные модели.

Были оценены четыре метода одномерного моделирования (ARIMA, EMA, Prophet и NNAR). Обученные модели использовались для создания 24-часовых прогнозов значений концентрации PM2.5 на строительной площадке. Прогнозы, полученные с помощью одномерных моделей, сравниваются с фактическими значениями концентрации PM2.5 на рис. 3. Кроме того, показатели прогнозной эффективности одномерных моделей обобщены и представлены в таблице 2.

« К

si

ср S-

и и я и

3

Д

1 ш \

Г7 X

\

\

Актуальные измерения

ARIMA

EMA

Prophet

NNAR

12:00 15:00 18:00 21:00 00:00 03:00 06:00 09:00

8.07.2023 9.07.2023

Рис. 3. Прогнозирование концентрации РМ2.5 с помощью одномерных моделей

ит о

отр

г о л о нох

е

н

Показатели ограничений при прогнозировании одномерных моделей

Таблица 2

№ п/п Наименование модели MAE MASE RMSE

1 ARIMA 1,82 0,83 2,3518

2 Prophet 1,96 0,89 2,4895

3 EMA 2,08 0,95 2,4839

4 NNAR 2,29 1,04 2,7129

Значения MAE, MASE и RMSE модели ARIMA составили 1,83, 0,83 и 2,3518 соответственно.

По результатам оценки прогнозирования средней концентрации РМ2.5 определено, что модель ARIMA превосходит по точности другие модели.

Следующим этапом стала оценка прогнозирования средней концентрации РМ2.5 при помощи многомерных моделей, которые учитывают взаимосвязи между независимыми и зависимыми переменными. В оценку входили данные в результате применения моделей Prophet, XGBoost, SVM, RF и NN.

Переменными для моделирования прогноза стали:

- данные измерений и результаты корреляционного анализа;

- метеорологические переменные, влияющие на прогнозирование значений концентрации PM2.5 — влажность и температура.

Показатели, полученные посредством моделирования, сравнивались с натурными измерениями на строительной площадке (рис. 4). Оценка точности прогноза представлена в таблице 3.

« К

а &

S-

и и я и

3

22

20

18

16

14

10

\ / I

\\ Л I /v 1/ V4 t^érx ч

\ лЯ

Актуальные измерения

XGBoost

RF

Prophet SVM

NN NARX

12:00 8.07.2023

00:00 9.07.2023

Ö О тр

ад

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 4. Прогнозирование концентрации РМ2.5 с помощью многомерных моделей

Показатели ограничений при прогнозировании многомерных моделей

Таблица 3

№ п/п Наименование модели MAE MASE RMSE

1 XGBoost 1,69 0,77 2,3809

2 RF 1,81 0,82 2,3730

3 Prophet 1,82 0,83 2,3582

4 SVM 1,83 0,83 2,4226

5 NN 2,02 0,92 2,4825

6 NARX 2,02 0,92 2,5920

JP

По результатам оценки видно, что значения MAE, MASE и RMSE для XGBoost модели являются самыми низкими по сравнению с другими многомерными моделями — 1,69, 0,77 и 2,3809 соответственно.

Оценка точности прогноза одномерных и многомерных моделей определила, что многомерные модели XGBoost и ЯР давали более точные прогнозы, чем модель ЛММА, что говорит о необходимости включать в моделирование переменные (температура, временные параметры, влажность).

Ансамблевые методы используют комбинацию алгоритмов машинного обучения для получения более точных прогнозов. На завершающем этапе исследования три лучшие модели с точки зрения эффективности прогнозирования были включены для проверки ансамблевой модели. Тремя лучшими моделями стали XGBoost, ЯР и АЯ1МА. Трем типам ансамблевых моделей были присвоен вес на основе эффективных характеристик прогноза: XGBoost (вес — 3), ЯР (вес — 2) и АЯ1МА (вес — 1).

Данные и оценка прогноза ансамблевых моделей представлены на рис. 5 и в таблице 4.

22

10

12:00 18:00 00:00 06:00 8.07.2023 9.07.2023

Рис. 5. Прогнозирование концентрации РМ2.5 с помощью ансамблевой модели

Таблица 4

Показатели ограничений при прогнозировании ансамблевой модели

№ п/п Наименование модели МАЕ МАБЕ тБЕ

1 ХОБОО81 (3) 1,57 0,71 2,1876

2 КГ (2) 1,60 0,73 2,1985

3 ЛММА (1) 1,61 0,73 2,1830

По результатам оценки видно, что модель XGBoost дает наименее точный прогноз.

Обсуждение и заключение. Применение ансамблевых моделей в целом дает более точный прогноз средней а

в

концентрации пыли РМ2.5 на строительной площадке. о

Надежные прогнозные модели могут быть полезными инструментами для понимания факторов, которые ьел

ит

могут влиять на концентрацию РМ2.5. В настоящем исследовании для прогнозирования концентрации РМ2.5 ^ использовались семь алгоритмов машинного обучения. В совокупности это исследование предоставляет <-> доказательства эффективности использования методов комплексного моделирования для прогнозирования

а

загрязнения воздуха. зи

Наиболее важным ограничением этого исследования является тот факт, что метеорологические факторы аг

р

были единственными переменными, использованными для разработки модели. Несмотря на это ограничение, ^ разработанные модели показали допустимую погрешность. Этот вывод указывает на то, что рассматриваемые §

г

модели надежны. ол

о

Предлагаемые модели могут быть использованы как для разработки проектных решений, беря за основы данные концентрации объектов аналогов, так и подрядными организациями для прогнозирования уровней концентрации РМ2.5 уже в процессе строительного производства.

н

Список литературы

1. Nagaraju K., Goyal S. Impact of construction activities on environment. International Journal of Engineering Technologies and Management Research. 2023;10(1):17-24.

2. Menzelintseva N.V., Karapuzova N.Y., Mikhailovskaya Y.S., Redhwan A.M. Efficiency of standards compliance for PM(10) and PM(2,5). International Review of Civil Engineering. 2016;7(6):1-8. https://doi.org/10.15866/irece.v7i6.9750

3. Bogachev K., Mikhaleva M., Gorelov I. Algebraic multilevel method AMG: Comparison with the method BICGSTAB + ILU and its use in the method CPR. Moscow University Mathematics Bulletin. 2010;65:156-160. https://doi.org/10.3103/S0027132210040042

4. Rossello J.L, Font-Rossello J., Frasser C.F., Moran A., Canals V., Roca M. Stochastic Computing Applications to Artificial Neural Networks. In book: Design and Applications of Emerging Computer Systems 2023. Pp. 303-330. https://doi.org/10.1007/978-3-031-42478-6 12

5. Азаров В.Н., Кузьмичев А.А., Николенко Д.А., Васильев А.Н., Козловцева Е.Ю. Исследование дисперсного состава пыли городской среды. ВестникМГСУ. 2020;15(3):432-442. https://doi.org/10.22227/1997-0935.2020.3.432-442

6. Hasan M., Abedin M., Hajek P., Coussement K., Sultan N., Lucey B. A blending ensemble learning model for crude oil price forecasting. Annals of Operations Research. 2024. https://doi.org/10.1007/s10479-023-05810-8

7. Amartey E.L.N., Onibudo O., Anamor S.K., Nkansah B.O. Dust Sources and Impact: A Review. North American Academic Research. 2022;5:17-37. https://doi.org/10.5281/zenodo.7068922

8. Ali T.E., Syed Ali M.A.S.E., Sadiq M., Khanam T., Ullah I., Pongpiachan S. et al. Dust Effects and Human Health. In book: Dust and Health. 2023. Pp. 1-15. https://doi.org/10.1007/978-3-031-21209-3 1

9. Azarov V.N., Trokhimchyk M.K., Sidelnikova O.E. Research of dust content in the earthworks working area. Procedia Engineering. 2016;150:2008-2012. https://doi.org/10.1016/j.proeng.2016.07.282

10. Стреляева А.Б., Калюжина Е.А. Экологическая безопасность при проведении земляных и строительно-отделочных работ. Вестник Волгоградского государственного архитектурно-строительного университета. Серия: Строительство и архитектура. 2017;50(69):321-329. https://vgasu.ru/upload/files/science/2017 50-69.pdf (дата обращения 11.03.2024)

11. Сумеркин Ю.А., Теличенко В.И., Оценка экологической безопасности придомовых территорий жилых районов. Промышленное и гражданское строительство. 2017;6:75-79.

12. Ridwan M., Sadik K., Afendi F. Comparison of ARIMA and GRU Models for High-Frequency Time Series Forecasting. Scientific Journal of Informatics. 2024;10:389-400. https://doi.org/10.15294/sji.v10i3.45965

13. Peruvazhuthi K., Kumar D., Chithra N. Performance evaluation of univariate time-series techniques for forecasting monthly rainfall data. Journal of Water and Climate Change. 2022;13(12):4151-4176. https://doi.org/10.2166/wcc.2022.107

14. Afarini N., Hindarto D. Forecasting Airline Passenger Growth: Comparative Study LSTM VS Prophet VS Neural Prophet. Sinkron. 2024;9:505-513. https://doi.org/10.33395/sinkron.v9i1.13237

15. Ansari A., Singh P., Ruliana R., Pandey A., Gupta S. Comparison of ARIMA, SutteARIMA, Holt-Winters and NNARModels to Predict Food Grain in India. Forecasting. 2023;5(1):138-152. https://doi.org/10.3390/forecast5010006

16. Mouhajir M., Nechba M., Sedjari Y. Computing the Vapnik Chervonenkis Dimension for Non-Discrete Settings. arXiv. 2023:2308.10041. https://doi.org/10.48550/arXiv.2308.10041

17. Gnambs T. A Brief Note on the Standard Error of the Pearson Correlation. Collabra Psychology. 2023:9(1):1-8. https://doi.org/10.1525/collabra.87615

References

g 1. Kaja N, Goyal S. Impact of Construction Activities on Environment. International Journal of Engineering

3 Technologies and Management Research. 2023;10(1):17-24. https://doi.org/10.29121/ijetmr.v10.i1.2023.1277 й 2. Menzelintseva NV, Karapuzova NY, Mikhailovskaya YS, Redhwan AM. Efficiency of Standards Compliance for

Tp PM(10) and PM(2,5). International Review of Civil Engineering. 2016;7(6):1-8. https://doi.org/10.15866/irece.v7i6.9750 '•¡g 3. Bogachev KYu, Mikhaleva MYu, Gorelov IG. Algebraic Multilevel Method AMG: Comparison with the Method

^ BICGSTAB + ILU and Its Use in the Method CPR. Moscow University Mathematics Bulletin. 2010;65:156-160. | https://doi.org/10.3103/S0027132210040042

£ 4. Rossello JL, Font-Rossello J, Frasser CF, Moran A, Canals V, Roca M. Stochastic Computing Applications to

Artificial Neural Networks. In book: Design and Applications of Emerging Computer Systems. 2023. P. 303-330. Ц https://doi.org/10.1007/978-3-031-42478-6 12

ht 5. Azarov VN, Kuzmichev AA, Nikolenko DA, Vasilev AN, Kozlovtseva EYu. The Research of Dust Dispersed

Composition of Urban Environment. Vestnik MGSU. 2020;15(3):432-442. https://doi.org/10.22227/1997-0935.2020.3.432-442 (In Russ.).

6. Hasan M, Abedin M, Hajek P, Coussement K, Sultan N, Lucey B. A Blending Ensemble Learning Model for Crude Oil Price Forecasting. Annals of Operations Research. 2024. https://doi.org/10.1007/s10479-023-05810-8

7. Amartey Ernest Nii Laryea, Onibudo Oluwasegun Oluwaseun, Anamor Samuel Kofi, Nkansah Benjamin Oduro. Dust Sources and Impact: A Review. North American Academic Research. 2022;5(9):17-37. https://doi.org/10.5281/zenodo.7068922

8. Ali T, Shah Eqani SAMA, Sadiq M, Khanam T, Ullah I, Pongpiachan S, et al. Dust Effects and Human Health. In book: Dust and Health. Emerging Contaminants and Associated Treatment Technologies. Cham: Springer; 2023. P. 1-15. https://doi.org/10.1007/978-3-031-21209-3 1

9. Azarov VN, Trokhimchyk MK, Sidelnikova OE. Research of Dust Content in the Earthworks Working Area. Procedia Engineering. 2016;150:2008-2012. https://doi.org/10.1016/j.proeng.2016.07.282

10. Strelyaeva AB, Kalyuzhina EA. Environmental Safety of Earthworks and Construction and Decoration Works. Bulletin of Volgograd State University of Architecture and Civil Engineering. Series: Civil Engineering and Architecture. 2017;50(69):321-329. URL: https://vgasu.ru/upload/files/science/2017 50-69.pdf (accessed: 11.03.2024). (In Russ.).

11. Sumerkin YuA, Telichenko VI. Assessment of Ecological Safety of Territories Adjoining Residential Areas. Promyshlennoe i grazhdanskoe stroitel'stvo. 2017;(6):75-79. (In Russ.).

12. Ridwan M, Sadik K, Afendi FM. Comparison of ARIMA and GRU Models for High-Frequency Time Series Forecasting. Scientific Journal of Informatics. 2023;10(3):389-400. https://doi.org/10.15294/sji.v10i3.45965

13. Kabbilawsh P, Sathish Kumar D, Chithra NR. Performance Evaluation of Univariate Time-Series Techniques for Forecasting Monthly Rainfall Data. Journal of Water and Climate Change. 2022;13(12):4151-4176. https://doi.org/10.2166/wcc.2022.107

14. Afarini N., Hindarto D. Forecasting Airline Passenger Growth: Comparative Study LSTM VS Prophet VS Neural Prophet. Sinkron. 2024;9(1):505-513. https://doi.org/10.33395/sinkron.v9i1.13237

15. Ahmar AS, Singh PK, Ruliana R, Pandey AK, Gupta S. Comparison of ARIMA, SutteARIMA, and Holt-Winters, and NNAR Models to Predict Food Grain in India. Forecasting. 2023;5(1):138-152. https://doi.org/10.3390/forecast5010006

16. Nechba M, Mouhajir M, Yassine S. Computing the Vapnik Chervonenkis Dimension for Non-Discrete Settings. arXiv. 2023:2308.10041. https://doi.org/10.48550/arXiv.2308.10041

17. Gnambs T. A Brief Note on the Standard Error of the Pearson Correlation. CollabraPsychology. 2023:9(1):87615. https://doi.org/10.1525/collabra.87615

Об авторе:

Светлана Евгеньевна Манжилевская, доцент кафедры организации строительства Донского государственного технического университета (344003, РФ, г. Ростов-на-Дону, пл. Гагарина, 1), кандидат технических наук, доцент, ORCID, ScopusID, smanzhilevskaya@ yandex.ru

Конфликт интересов: автор заявляет об отсутствии конфликта интересов.

Автор прочитал и одобрил окончательный вариант рукописи.

Поступила в редакцию 30.01.2024

Поступила после рецензирования 08.02.2024

Принята к публикации 09.02.2024

About the Author:

Svetlana E. Manzhilevskaya, Cand.Sci. (Engineering), Associate Professor of the Construction Management Department, Don State Technical University (1, Gagarin Sq., Rostov-on-Don, 344003, RF), ScopusID, ORCID, smanzhilevskaya @yande x

О ё

Conflict of interest statement: the author does not have any conflict of interest. ^

S3 о

The author has read and approved the final manuscript. ^

Received 30.01.2024 |

Revised 08.02.2024 |

Accepted 09.02.2024 S

о S

1-е

о

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

н

о g

1) н

i Надоели баннеры? Вы всегда можете отключить рекламу.