Научная статья на тему 'ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧАХ ЭКОЛОГИЧЕСКОГО ПРОГНОЗИРОВАНИЯ'

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧАХ ЭКОЛОГИЧЕСКОГО ПРОГНОЗИРОВАНИЯ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
Экологическое прогнозирование / искусственные нейронные сети / искусственный интеллект / степень загрязненности воды / БПК5 / синтетические данные / реальные данные / МТЭ / перцептрон / метод K-кратной перекрестной проверки. / Environmental forecasting / artificial neural networks / artificial intelligence / degree of water pollution / BOD5 / synthetic data / real data / MFC / perceptron / K-fold crossvalidation method.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Костюченко П. А.

Одним из важнейших параметров при измерении загрязнённости сточных вод является показатель биохимического потребления кислорода (далее БПК). При этом наиболее точно отражающим степень загрязнённости воды принято считать данный показатель, измеряемый на протяжении 5 суток, далее обозначаемый как БПК5. Прогнозирование в любой науке требует работы с большим количеством данных, чтобы учитывать все факторы, которые могут повлиять на исход исследуемого процесса. Для данных целей широко используются инструменты современных электронновычислительных машин (сокращённо ЭВМ). Помимо классических методов, таких как математическое моделирование и статистический анализ, часто используются методы интеллектуального анализа данных, в частности, искусственного интеллекта (далее ИИ), а также искусственных нейронных сетей (далее ИНС), для создания моделей экологических систем и прогнозирования интересующих научное сообщество показателей состояния экосистем. В работе исследуются возможности уменьшения времени проведения эксперимента, за которое можно получить релевантные результаты для дальнейшего прогноза БПК5 с помощью искусственных нейронных сетей. Рассматривается вариант предсказания показателя биохимического потребления кислорода с помощью искусственных нейронных сетей (далее ИНС). ИНС очень часто применяется в случаях, когда статистические данные, требующие обработки, не носят линейный характер.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Костюченко П. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF NEURAL NETWORKS IN ENVIRONMENTAL FORECASTING PROBLEMS

One of the most important parameters when measuring wastewater pollution is the biochemical oxygen demand (hereinafter referred to as BOD). At the same time, this indicator measured over 5 days, hereinafter referred to as BOD5, is considered to most accurately reflect the degree of water pollution. Forecasting in any science requires working with a large amount of data in order to take into account all the factors that can affect the outcome of the process under study. For these purposes, the tools of modern electronic computers (computers for short) are widely used. In addition to classical methods such as mathematical modeling and statistical analysis, data mining methods are often used. In particular, artificial intelligence (hereinafter referred to as AI), as well as artificial neural networks (hereinafter referred to as ANN), to createmodels of ecological systems and forecast indicators of the state of ecosystems that are of interest to the scientific community. This work is devoted to studying the possibility of reducing the time of the experiment, during which it is possible to obtain relevant results for further forecasting BOD5 using artificial neural networks. This paper considers the option of predicting the indicator of biochemical oxygen consumption using artificial neural networks (hereinafter referred to as ANN). ANN is very often used in cases where the statistical data that requires processing is not linear in nature.

Текст научной работы на тему «ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧАХ ЭКОЛОГИЧЕСКОГО ПРОГНОЗИРОВАНИЯ»

УДК: 004.89.

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧАХ ЭКОЛОГИЧЕСКОГО ПРОГНОЗИРОВАНИЯ

©2024 П. А. Костюченко

студент ФГАОУ ВО «Волгоградский государственный университет», специальность: 09.04.01 «Информатика и вычислительная техника»

e-mail: ivtm-221_363272@volsu.ru

Волгоградский государственный университет

Одним из важнейших параметров при измерении загрязнённости сточных вод является показатель биохимического потребления кислорода (далее БПК). При этом наиболее точно отражающим степень загрязнённости воды принято считать данный показатель, измеряемый на протяжении 5 суток, далее обозначаемый как БПК5. Прогнозирование в любой науке требует работы с большим количеством данных, чтобы учитывать все факторы, которые могут повлиять на исход исследуемого процесса. Для данных целей широко используются инструменты современных электронно-вычислительных машин (сокращённо ЭВМ). Помимо классических методов, таких как математическое моделирование и статистический анализ, часто используются методы интеллектуального анализа данных, в частности, искусственного интеллекта (далее ИИ), а также искусственных нейронных сетей (далее ИНС), для создания моделей экологических систем и прогнозирования интересующих научное сообщество показателей состояния экосистем. В работе исследуются возможности уменьшения времени проведения эксперимента, за которое можно получить релевантные результаты для дальнейшего прогноза БПК5 с помощью искусственных нейронных сетей. Рассматривается вариант предсказания показателя биохимического потребления кислорода с помощью искусственных нейронных сетей (далее ИНС). ИНС очень часто применяется в случаях, когда статистические данные, требующие обработки, не носят линейный характер.

Ключевые слова: экологическое прогнозирование, искусственные нейронные сети, искусственный интеллект, степень загрязненности воды, БПК5, синтетические данные, реальные данные, МТЭ, перцептрон, метод K-кратной перекрестной проверки.

APPLICATION OF NEURAL NETWORKS IN ENVIRONMENTAL FORECASTING PROBLEMS

©2024 P. A. Kostyuchenko

Student of Volgograd State University Specialty: 09.04.01 «Informatics and Computer Science» E-mail: ivtm-221_3632 72 @ volsu. ru

Volgograd State University

One of the most important parameters when measuring wastewater pollution is the biochemical oxygen demand (hereinafter referred to as BOD). At the same time, this indicator measured over 5 days, hereinafter referred to as BOD5, is considered to most accurately reflect the degree of water pollution. Forecasting in any science requires working with a large amount of data in order to take into account all the factors that can affect the outcome of the process under study. For these purposes, the tools of modern electronic computers (computers for short) are widely used. In addition to classical methods such as mathematical modeling and statistical analysis, data mining methods are often used. In particular, artificial intelligence (hereinafter referred to as AI), as well as artificial neural networks (hereinafter referred to as ANN), to create

models of ecological systems and forecast indicators of the state of ecosystems that are of interest to the scientific community. This work is devoted to studying the possibility of reducing the time of the experiment, during which it is possible to obtain relevant results for further forecasting BOD5 using artificial neural networks. This paper considers the option of predicting the indicator of biochemical oxygen consumption using artificial neural networks (hereinafter referred to as ANN). ANN is very often used in cases where the statistical data that requires processing is not linear in nature.

Keywords: environmental forecasting, artificial neural networks, artificial intelligence, degree of water pollution, BOD5, synthetic data, real data, MFC, perceptron, K-fold cross-validation method.

Основой для появления возможности упрощения и ускорения процесса оценки загрязнённости воды являются эксперименты с МТЭ. Данное устройство представляет собой однокамерный или двухкамерный резервуар, который состоит из анодной и катодной камеры в случае, если устройство двухкамерное, и анодной камеры и воздушного катода в случае, если устройство однокамерное. В результате работы МТЭ энергия химических элементов, запасённых в загрязнённых сточных водах, с помощью определённого вида бактерий перерабатывается в электрическую.

Толчком к проведению исследования в данном направлении послужило обнаружение зависимости между параметрами выходящего электричества (напряжения или заряда) и показателем БПК5. Данный показатель широко используется учёными и промышленниками для оценки загрязнённости различных типов промышленных водных отходов, а также для исследования загрязнённости природных водных ресурсов. Он отражает количество кислорода, которое вышеописанные бактерии тратят на переработку органических веществ в воде. Однако в лабораторных условиях, как следует из определения показателя, для его выяснения требуется 5 суток. При исследовании возможностей прогнозирования БПК5 с помощью данных, полученных при работе МТЭ, этот срок значительно сокращался.

В данной работе рассматривается вариант предсказания показателя биохимического потребления кислорода с помощью искусственных нейронных сетей (далее ИНС). ИНС очень часто применяются в случаях, когда статистические данные, требующие обработки, не носят линейный характер. Имеющиеся статистические данные, обширные возможности по прогнозированию и предсказанию результатов были использованы в данном исследовании для прогнозирования показателя БПК5 исходя из замеченной корреляции между данным параметром и выходным напряжением при работе МТЭ.

В качестве набора данных, которые в дальнейшем будут использоваться для обучения нейронной сети, была использована выборка, содержащая данные о работе МТЭ с двумя типами вод: бытовые воды и сточные воды пивоваренного завода. Выборка представляет собой значения напряжений на клеммах при работе МТЭ, полученные с интервалом в 5 минут. Количество изменений разнилось в зависимости от эксперимента. Когда наибольшее количество органических элементов заметно уменьшалось и выходное напряжения падало ниже 0,02В, биологический материал становился непригоден для эксперимента и измерение напряжения прекращали. В исследовании был взят набор из 56 измерений зависимости напряжения при работе МТЭ от времени. Как уже было сказано ранее, количество интервалов для измерений в разных экспериментах было неодинаково, поэтому данные уравняли по самому длинному эксперименту. Таким образом, выборка представляет собой набор из 56 векторов, длинной в 1 511 интервалов измерения напряжения. Ниже представлены примеры экспериментальных графиков для двух типов вод.

Время, д. Время, д.

Рис. 1. Зависимость напряжения от времени в МТЭ

Также использовались значения напряжения за 24, 16, 12, 8, 6 и 2 часа до измерения, что в общей сложности требовало разработки 6 моделей ИНС для каждого подхода. Данные представляют собой значения напряжения с интервалом в 5 минут, и для работы нейронной сети количество элементов в векторе входных данных варьировалось в зависимости от периода измерения.

Таким образом, количество нейронов на входных слоях нейронной сети составляло количество часов, умноженное на 12, то есть 288, 192, 144, 96, 72 и 24. В качестве архитектуры нейронной сети в данном исследовании использовался многослойный перцептрон. Ниже представлена общая схема нейронной сети с архитектурой многослойного перцептрона.

Входной слой Скрытые слои Выходной слой

Рис. 2. Архитектура многослойного перцептрона

Нейронные сети прямого распространения состоят из входных и выходных слоев, а также промежуточных (или скрытых) [1-5]. Они, в свою очередь, содержат определённое количество нейронов, являющихся значением взвешенной суммы нейронов предыдущего слоя. В реализации нейронной сети для данных задач используется 3 таких слоя. Для каждого из скрытых слоёв используется функция активации выпрямленной линейной единицы (ЯеЬи). Параметры ИНС подбирались

в процессе перекрестной проверки 5 раз, чтобы минимизировать ошибки (1) и (2) на блоках проверки [6-8].

Первоначально в качестве исходных моделей были созданы трехслойные ИНС со 128 нейронами в каждом из скрытых слоев. После перекрестной проверки количество нейронов в скрытых слоях менялось (в частности, на каждом из скрытых слоев выбирались варианты из 128, 64 и 96 нейронов). Кроме того, были добавлены выпадающие слои (на выпадающих слоях были выбраны такие варианты процентов исключения нейронов, как 10%, 20%, 25%, 30%, 50%).

В этой работе использовался набор данных из 56 экспериментов. Из них 16 экспериментов (8 экспериментов с бытовыми сточными водами и 8 экспериментов со сточными водами пивоваренных заводов) использовались в качестве тестового набора для окончательной оценки моделей после завершения настройки и обучения моделей. Для остальных 40 экспериментов метод K-кратной перекрестной проверки (K=5) применялся для оценки качества ИНС при выборе параметров. Набор данных из 40 экспериментов был разделен на 5 блоков, каждый блок кластеризован по 8 экспериментов. На первом этапе первый блок (20% данных) использовался как блок проверки, а остальные 4 блока (80% данных) использовались как обучающие. На следующем этапе второй блок (20% данных) использовался в качестве проверочных, а остальные блоки (80% данных) - в качестве обучающих данных. И так далее, пока каждый блок по 20 % не будет использован при проверке.

По полученным пяти оценкам рассчитывалось среднее значение функции потерь. Среднеквадратическая ошибка (MSE) определялась как функция потерь, которую необходимо минимизировать во время обучения [9-12]. После окончательного выбора всех параметров, таких как количество нейронов в слоях и проценты прореживания, было выбрано количество эпох для каждой из 12 ИНС, при которых среднее значение MSE по 5 блокам проверки было минимальным. Эти эпохи 12 ИНС использовались для обучения окончательных ИНС на выборке из 40 экспериментов и тестировались на выборке из 16 экспериментов.

Отметим, что ошибки нейронной сети, полученные в данной работе, приведены с учетом погрешности работы микробного топливного элемента. Погрешность определения БПК5 с помощью МФЦ дает погрешность в пределах 10%, конкретно для используемого тестового образца средняя относительная погрешность определения БПК по реальному напряжению MFC составляет примерно 7%.

Шесть моделей ИНС были разработаны для подхода прямого прогнозирования БПК5. После обучения 40 наборов при K-кратной перекрестной проверке был сохранен набор весов, который привел к минимальному значению потерь. Эти веса были применены для вывода.

Для сравнения фактических и прогнозируемых значений БПК5 использовалась средняя абсолютная процентная ошибка (MAPE) [13-15]. Всего в исследуемой выборке было 10 различных видов сточных вод с загрязнением и шесть видов сточных вод без загрязнения, поэтому для оценки нейронной сети также рассчитывались показатели специфичности, чувствительности и точности.

Чувствительность рассчитывалась как отношение количества загрязненных вод, правильно определенных нейронной сетью, к истинному количеству загрязненных вод в тесте. Специфичность рассчитывалась как отношение числа незагрязненных вод, обнаруженных нейронной сетью, к истинному количеству незагрязненных вод в тесте [16-18]. Ниже представлена таблица, отображающая значения чувствительности и специфичности.

Таблица 1

Результаты работы нейронных сетей_

Время, ч.

Параметр 2 6 8 12 16 24

Чувствительность 0,8 0,8 0,8 0,9 0,9 1

Специфичность 0,67 0,67 1 1 0,83 1

Точность 0,71 0,71 0,84 0,96 0,84 0,97

Так, чувствительность составила 1 при входных данных за 24 ч измерений, 0,9 для случаев 16 и 12 ч и 0,8 для остальных случаев (8, 6 и 2 ч). Специфичность составила 1 для 24, 12 и 8 часов измерений, 0,83 для 16 часов и 0,67 для 6 и 2 часов измерений. Помимо специфичности и чувствительности, точность также рассчитывалась как отношение количества правильно угаданных состояний воды (загрязненных или нет) к объему данных в тестовой выборке (16 экспериментов). Точность составляла 0,97 для записи через 24 часа измерения, 0,960 для записи через 12 часов, 0,84 для записи через 16 и 8 часов и 0,71 для записи через 6 и 2 часа.

Модели нейронных сетей, обученные на предложенной выборке, показали хорошие результаты и при косвенном, и при прямом прогнозировании. Ожидаемая точность предсказаний нейронной сети улучшалась при увеличении длины входящих векторов. Срок получения данных о загрязнённости воды при использовании моделей ИНС значительно сократился, вплоть до 24 часов, сохраняя хорошую точность. Оперативное получение показателя БПК5, достаточно близкого к реальному, несомненно, будет полезным для улучшения качества мониторинга чистоты промышленных и природных водных ресурсов.

Библиографический список

1. Палюлин, А. Анализ данных из изображений с применением нейронной сети / А. Палюлин // Россия - Азия - Латинская Америка: Экономика взаимного доверия. -2019. - Том 3. - С. 130-131.

2. Андриянов, Н. Регрессионный анализ и прогнозирование данных футбольной статистики с использованием нейронных сетей / Н. Андриянов, В. Дементьев // Радиоэлектронная техника. - 2020. - Том 1. - С. 138-142.

3. Основные понятия интеллектуального анализа данных. - URL: https://learn.microsoft.com/ru- ru/analysis- services/data- mining/data-mining-concepts?view=asallproducts-allversions (дата обращения: 21.03.2024).

4. Gurney, K. An Introduction to Neural Networks / K. Gurney. - Amsterdam, Netherlands : University of Amsterdam, 1996. - P. 317.

5. Кублик, Е. Исследование возможностей нейронных сетей и смежных методов семантического анализа в задачах анализа текстовых данных / Е. Кублик // Нейрокомпьютеры и их применение. - 2020. - Том 1. - С. 154-155.

6. McCaffrey, J. Neural Networks with JavaScript Succinctly / J. McCaffrey. -Research Triangle Park, USA: Syncfusion Inc., 2019. - P. 163.

7. Багаев, И. Анализ понятий нейронная сеть и сверточная нейронная сеть, обучение сверточной нейросети при помощи модуля Tensorflow / И. Багаев // Математическое и программное обеспечение систем в промышленной и социальной сферах. - 2020. - Том 8. - С. 15-22.

8. Jones, H. Neural Networks: An Essential Beginners Guide to Artificial Neural Networks and their Role in Machine Learning and Artificial Intelligence / H. Jones. - Boston, USA: PWS Publishing, 2018. - P. 95.

9. Hagan, M. Neural Network Design / M. Hagan. - Boston, USA : PWS Publishing, 2014. - P. 800.

10. Roberts, D. A. The Principles of Deep Learning Theory: An Effective Theory Approach to Understanding Neural Networks / D. A. Roberts, S. Yaida, B. Hanin. -Cambridge, England : Cambridge University Press, 2022. - P. 472.

11. Ибрагимов Р. Влияние функций активации нейронных сетей на скорость обучения на примере нейронной сети с обратным распространением ошибки / Р. Ибрагимов // Актуальные проблемы физической и функциональной электроники. -2018. - Том 21. - С. 125-126.

12. Bondarev, A. Use of neural networks in processing economic data / A. Bondarev, K. Lobanov, I. Kauts // Молодые ученые в решении актуальных проблем науки. - 2022. -Том 1. - С. 1001-1003.

13. Певченко, С. Сравнительный анализ алгоритмов нейронной сети и деревьев принятия решений модели интеллектуального анализа данных / С. Певченко,

B. Блужин // Молодой ученый. - 2016. - Том 28. - С. 148-154.

14. Манжула, В. Нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных / В. Манжула, Д. Федяшов // Фундаментальные исследования. - 2011. - Том 4. - С. 108-114.

15. Синягов, А. Изучение работы нейронных сеетй: нейронные сети основы, использование нейронных сетей в экономике / А. Синягов, А. Суконщиков // Шаг в будущее: Искусственный интеллект и цифровая экономика. - 2017. - Том 4. - С. 130-135.

16. Taylor, M. Machine Learning with Neural Networks: An Indepth Visual Introduction with Python: Make Your Own Neural Network in Python: A Simple Guide on Machine Learning with Neural Networks / M.Taylor, M. Koning. - Chicago, USA : Blue Windmill Media, 2017. - P. 373.

17. Голоскоков, К. Применение нейронных сетей в задачах прогнозирования и проблемы идентификации моделей прогнозирования на нейронных сетях / К. Голоскоков // Современные проблемы прикладной информатики. - 2006. - Том 1. -

C. 116-120.

18. Зелинов, М. Реализация искусственной нейронной сети на базе нейронной сети Петри / М. Зелинов // Гуманитарные науки в современном вузе: вчера, сегодня, завтра. - 2019. - Том 1. - С. 880-885.

i Надоели баннеры? Вы всегда можете отключить рекламу.