УДК 556.555.6 : 504.064.36
В.С. Валиев, Д.В. Иванов, А.Т. Горшкова, О.Н. Урбанова, И.В. Мустакимова
Институт проблем экологии и недропользования АН РТ, [email protected]
ИСПОЛЬЗОВАНИЕ ИСКУССТВЕННЫХ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РЕШЕНИЯ ЗАДАЧ ИНТЕРПОЛЯЦИИ РУСЛОВОГО СТОКА (НА ПРИМЕРЕ РЕКИ КАЗАНКИ)
Анализируются возможности использования искусственной нейронной сети на парадигме многослойного персептрона для интерполяции значений русловых расходов воды по длине реки Казанки. Эксперимент продемонстрировал высокую эффективность полученной нейросетевой модели, которая оказалась точнее линейных и полиномиальных аппроксиматоров, традиционно использующихся для решения подобных задач. Полученная модель может быть использована при оценках нормативно-допустимых сбросов на любом участке реки.
Ключевые слова: речной сток; моделирование; расходы воды, нейронные сети; река Казанка.
DOI: https://doi.Org/10.24852/2411-7374.2023.2.45.48
Введение
Развитие 1Т систем, методов машинного обучения, накопление значительных объемов данных многолетних наблюдений, а также общая стратегия цифровизации системы государственного экологического мониторинга в Российской Федерации формируют предпосылки к включению таких наиболее активно развивающихся в последние годы методов анализа данных как искусственные нейронные сети (ИНС) в состав инструментов научного исследования в области контроля за качеством окружающей среды.
Как и другие методы аналитических оценок, искусственные нейронные сети являются математическим алгоритмом преобразующим вектор входных сигналов X в вектор выходных сигналов У Отличием ИНС является то, что их функционирование основано на искусственном нейроне, который является ее ключевым структурным элементом и реализует преобразование сигнала, похожее на возбуждение нейрона в нервной ткани живых существ. Поэтому парадигма ИНС рассматривается в настоящее время как грубая, но реально функционирующая модель нервной системы человека (Круглов, Борисов, 2002). Области применения ИНС практически не ограничены и особенно актуальны при решении задач кластеризации, аппроксимации, классификации и прогнозирования.
Основные достоинства ИНС состоят в следующем: близость к природной реализации математического алгоритма, способность к адаптации, многоканальная система обработки информации,
устойчивость и стабильность функционирования за счет распределенного принципа расчетного алгоритма (Ясницкий, 2008).
В настоящем исследовании рассмотрена ИНС, реализующая наиболее часто востребованную в системах автоматизированных оценок модель интерполяции данных.
Материалы и методы исследования
В качестве нейросетевой парадигмы был использован персептрон на основе классического сигмоидального нейрона, запрограммированный на языке Object Pascal (Буч, 1992) в среде Delphi 7 (рис. 1).
Взвешенная сумма входных сигналов i-го нейрона вычисляется по формуле
При этом взвешенная сумма входных сигналов щ служит аргументом сигмоидальной функции активации f(ui). определяющей значение выходного сигналаy:
Коэффициент b определяет крутизну графика функции и подбирается эмпирически.
Нами использовалась биполярная сигмои-дальная функция, так называемый гиперболический тангенс, определенный в интервале (-1; 1):
2
" 1 + ехр(-2Н) ~ 1
2/2023
45
Рис. 1. Структура нейрона ИНС: x , x,, x3, xN- вектор входных сигналов (синапсы); x0 - смещение, синапс с постоянным значением равным 1; W. - весовые коэффициенты синапсов;
и.- взвешенная сумма входных сигналов; y. - выходной сигнал; f(u) - функция активации Fig. 1. Artificial neural network's structure: x, x2, x3, xN - vector of input signals (synapses); x0 - offset, synapse with constant value equal to 1; W. - weight coefficients of synapses; u. -weighted sum of input signals; y. - output signal; f(u) - activation function
Производная сигмоидальной функции активации, позволяющая представить ее в виде колоко-лообразной кривой, имеет вид:
df (и)
du
= b/(«)(l-/(u))
Производная гиперболического тангенса, соответственно:
df(u) du
= Ь(1 -/2(u))
Реализовано обучение нейронов «с учителем». В этом случае им предъявляют набор пар векторов <Xk, Yk> , где k - число пар в наборе «значение входа - ожидаемое значение выхода», то есть обучение с учителем предполагает априорное знание о соответствии значений выхода тем или иным входным сигналам.
В итоге группы нейронов представленной модели формируют слои, а слои - однонаправленную сеть, многослойный персептрон (Multilayer Perceptron), обученный методом обратного распространения ошибки (error backpropagation), сутью которого является коррекция синаптиче-ских весов, минимизирующая различие между рассчитанным выходом сети и его эталонным значением, осуществляемая в обратном направлении - от выхода сети к ее входу (Хайкин, 2006).
Результаты и их обсуждение
Задача, решаемая разработанной ИНС, состоя-
Рис. 2. Структура ИНС (зеленым цветом показан входной слой, красным - скрытые слои, синим - выходной слой, +1 - нейрон смещения) Fig. 2. The structure of the artificial neural network (green - input layer, red - hidden layers, blue - output layer, +1 - bias neuron)
ла в построении кривои распределения руслового стока р. Казанки. Так как протяженность реки составляет всего 140 км, а ее водосбор вовлечен в активную хозяйственную деятельность, то знание о значениях расхода воды по всей протяженности русла, особенно меженного уровня (50%-ой обеспеченности), является необходимым условием грамотной и эффективной оценки критических пределов кратности разбавления антропогенных стоков.
В качестве обучающих данных использовались результаты среднемноголетних меженных расходов на разных участках реки. Обучающий набор включал 50 пар замеров расхода воды (м3/с) с привязкой по длине русла р. Казанки (расстояние от устья, км). Данные рядов предварительно нормализовались методом Мт-Мах:
X =
X — ХУ1
у — У
Лтах Лшт
где X - нормализуемое значение, Xmin - минимальное значение ряда, X - максимальное зна-
^ ' max
чение ряда.
В результате эмпирического подбора параметров сети наиболее эффективной топологией ИНС для решения данной задачи была признана следующая.
Многослойный персептрон, с одним входом, тремя скрытыми слоями и одним выходом. Структура скрытых слоев: 7 нейронов в первом, 8 - во втором и 5 нейронов в третьем слое. Функция активации - гиперболический тангенс, скорость обучения - 0.01, крутизна - 1, импульс (инерция) сети - 0.7 (рис. 2).
ИНС использовала прямые связи, обеспечивающие передачу сигнала только по направлению от входа к выходу. Обучение сети осуществлялось методом обратного распространения ошибки, ко-
46
российский журнал ИМ! экологии
Рис. 3. График снижения ошибок целевой функции:
красная кривая - тестовая выборка, черная - обучающая, ось X - число прошедших эпох
обучения, Y - значение ошибки Fig. 3. Error reduction graph of the objective function: red curve - test sample, black - training, X-axis - the number of training epochs passed, Y-axis - the error value
60 80 Расстояние от устья, км Distance from mouth, km
Рис. 4. Результат интерполяции значений расходов
воды по длине р. Казанки Fig. 4. The result of interpolation of the values of water discharge along the length of the Kazanka river
-i 5
33
s f 4
i Ê Is
n 3
Расстояние от устья, км Distance from mouth, km
торое контролировалось с помощью расчета ошибки между эталонным (целевым) у и фактическим (рассчитанным) у' выходом модели на обучающей выборке длиной N
Рис. 5. График изменения расходов воды в р. Казанке Fig. 5. Graph of changes in water consumption in the Kazanka river
Успешность обучения сети определялась по снижению рассчитываемой по каждому циклу обучения (эпохе) ошибки, и, когда снижение ошибки прекращалось, а ее значение оказывалась достаточно малым, сеть считалась обученной (рис. 3).
В связи с тем, что решалась задача интерполяции и переобучение сети было некритичным, один и тот же ряд наблюдений использовался и в обучающей, и в тестовой выборках.
В результате удалось получить модель, охватывающую ряд наблюдений за расходом воды в р. Казанке с высокой точностью (R2=0.94). Для сравнения, коэффициент детерминации линейной модели R2=0.68, а наиболее подходящей полиномиальной (полином 5 степени) R2=0.85 (рис. 4).
На рисунке 4 показан результат интерполяции значений расходов воды (м3/с) по всей длине р. Казанки: синяя кривая рассчитана ИНС, черная - полиномиальной функцией 5-го порядка, красными маркерами обозначены измеренные значения расходов, к которым осуществлялась подгонка.
Дополнительно ИНС был задан контрольный ряд значений расстояния по руслу реки, включающий значения, кратные 1.4 км, и модулирующий расстояние от устья: 0; 1.4; 2.8; 4.2; 5.6; 7 км и т.д., всего 100 точек, по которым нейросеть вычислила точные значения меженных расходов (рис. 5). Полученный график является нейросетевой интерполяцией расходов воды по всему руслу и может быть использован для расчета кратностей разбавления загрязняющих веществ при характеристике различных участков бассейна, расчетах нормативно-допустимых сбросов.
Заключение
Проведенный эксперимент продемонстрировал высокую эффективность нейросетевых моделей, в частности, многослойного пер-септрона, при решении задач интерполяции. Полученная модель оказалась точнее линейных и полиномиальных аппроксиматоров, традиционно использующихся для решения подобных задач. Достоинством подхода явля-
8
7
6
4
2
0
0
20
40
100
120
140
8
7
6
2
0
20
40
60
80
100
120
140
2/2123
47
ется также возможность дообучения ИНС при получении обновленных данных, а также простота интегрирования в другие алгоритмы для использования в составе более сложных систем. Эффективность апробированного алгоритма позволяет обоснованно использовать аппроксиматоры на основе ИНС при решении задач интерполяции, нахождения пропущенных значений, прогнозирования тенденций.
Список литературы
1. Буч Г. Объектно-ориентированное проектирование с примерами применения. М.: Конкорд, 1992. 519 с.
2. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия-Телеком, 2002. 382 с.
3. Хайкин С. Нейронные сети: полный курс. М.: ООО «И.Д. Вильямс», 2006. 1104 с.
4. Ясницкий Л.Н. Введение в искусственный интеллект. М.: Издательский центр «Академия», 2008. 176 с.
References
1. Butch G. Ob"ektno-orientirovannoe proektirovanie s primerami primeneniya [Object-oriented design with examples of application]. Moscow: Concord, 1992. 519 p.
2. Kruglov V.V., Borisov V.V. Iskusstvennye nejronnye seti. Teoriya i praktika [Artificial neural networks. Theory and
practice]. Moscow: Hotline-Telecom, 2002. 382 p.
3. Khaikin S. Nejronnye seti: polnyj kurs [Neural networks: a complete course]. Moscow: Williams, 2006. 1104 p.
4. Yasnitsky L.N. Vvedenie v iskusstvennyj intellekt [Introduction to artificial intelligence]. Moscow: Publishing Center «Academy», 2008. 176 p.
Valiev V.S., Ivanov D.V., Gorshkova A.T., Ur-banova O.N., Mustakimova I.V. Using artificial neural networks to solve problems of channel flow interpolation (on the example of the Kazanka river).
The possibilities of using an artificial neural network based on the multilayer perceptron paradigm for interpolating the values of channel water discharges along the length of the Kazanka River are analyzed. The experiment demonstrated the high efficiency of the obtained neural network model, which turned out to be more accurate than linear and polynomial approximators traditionally used to solve such problems. The resulting model can be used in assessing the normatively permissible discharges in any part of the river.
Keywords: river flow; modeling; water costs, neural networks; Kazanka river.
Раскрытие информации о конфликте интересов: Автор заявляет об отсутствии конфликта интересов / Disclosure of conflict of interest information: The author claims no conflict of interest
Информация о статье / Information about the article
Поступила в редакцию / Entered the editorial office: 15.03.2023
Одобрено рецензентами / Approved by reviewers: 30.03.2023
Принята к публикации / Accepted for publication: 05.04.2023
Информация об авторах
Валиев Всеволод Сергеевич, старший научный сотрудник, Институт проблем экологии и недропользования АН РТ, 420087, Россия, г. Казань, ул. Даурская, 28, E-mail: [email protected].
Иванов Дмитрий Владимирович, кандидат биологических наук, зам. директора по научной работе, Институт проблем экологии и недропользования АН РТ, 420087, Россия, г. Казань, ул. Даурская, 28, E-mail: [email protected].
Горшкова Асия Тихоновна, кандидат географических наук, зав. лабораторией, Институт проблем экологии и недропользования АН РТ, Россия, 420087, г. Казань, ул. Даурская, 28, E-mail: [email protected].
Урбанова Ольга Николаевна, старший научный сотрудник, Институт проблем экологии и недропользования АН РТ, Россия, 420087, г. Казань, ул. Даурская, 28, E-mail: [email protected].
Мустакимова Ирина Викторовна, соискатель, Институт проблем экологии и недропользования АН РТ, Россия, 420087, г Казань, ул. Даурская, 28, E-mail: [email protected].
Information about the authors
Vsevolod S. Valiev, Senior Researcher, Research Institute for Problems of Ecology and Mineral Wealth Use of Tatarstan Academy of Sciences, 28, Daurskaya st., Kazan, Russia, 420087, E-mail: [email protected].
Dmitrii V. Ivanov, Ph.D. in Biology, Deputy Director, Research Institute for Problems of Ecology and Mineral Wealth Use of Tatarstan Academy of Sciences, 28, Daurskaya st., Kazan, Russia, 420087, E-mail: [email protected].
Asiya T. Gorschkova, Ph.D. in Geography, Head of laboratory, Researcher Institute for Problem of Ecology and Mineral Wealth Use of Tatarstan Academy of Sciences, 28, Daurskaya st., Kazan, 420087, Russia, E-mail: [email protected].
Olga N. Urbanova, Senior Researcher, Research Institute for Problem of Ecology and Mineral Wealth Use of Tatarstan Academy of Sciences, 28, Daurskaya st., Kazan, 420087, Russia, E-mail: [email protected].
Irina V. Mustakimova, Applicant, Researcher Institute for Problem of Ecology and Mineral Wealth Use of Tatarstan Academy of
Sciences, 28, Daurskaya st., Kazan, 420087, Russia, E-mail: [email protected]. ® ©
48
российский журнпл ПРИМИ) экологии