Научная статья на тему 'Применение нейронных сетей для прогноза уровня концентрации фенольных соединений в сточных водах горных предприятий'

Применение нейронных сетей для прогноза уровня концентрации фенольных соединений в сточных водах горных предприятий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
67
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ШАХТНЫЕ ВОДЫ / ЗАГРЯЗНЕНИЕ / УПРАВЛЕНИЕ / ОЧИСТКА / ФЕНОЛЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Соколов Эдуард Михайлович, Шейнкман Леонид Элярдович, Дергунов Дмитрий Викторович

На основе экспериментальных исследований предложена нейросетевая регрессионная модель, направленная на решение задач управления процессом снижения антропогенного воздействия горных предприятий на окружающую среду

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Соколов Эдуард Михайлович, Шейнкман Леонид Элярдович, Дергунов Дмитрий Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение нейронных сетей для прогноза уровня концентрации фенольных соединений в сточных водах горных предприятий»

© Э.М. Соколов, Л.Э. Шейнкман, Д.В. Дергунов, 2012

УДК: 004.8.032.26:622.793

Э.М. Соколов, Л.Э. Шейнкман, Д.В. Дергунов

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗА УРОВНЯ КОНЦЕНТРАЦИИ ФЕНОЛЬНЫХ СОЕДИНЕНИЙ В СТОЧНЫХ ВОДАХ ГОРНЫХ ПРЕДПРИЯТИЙ

На основе экспериментальных исследований предложена нейросетевая регрессионная модель, направленная на решение задач управления процессом снижения антропогенного воздействия горных предприятий на окружающую среду. Ключевыю слова: шахтные воды, загрязнение, управление, очистка, фенолы.

В горнодобывающей промышленности могут встретиться три типа сточных вод, загрязняющих окружающую среду: откачиваемые шахтные (грунтовые и инфильтраци-онные) воды; сточные воды обогатительных цехов и предприятий, расположенных на территории рудника; инфильтрационные воды, затопляющие заброшенную шахту [1]. Как правило, шахтные воды, сбрасываемые в водные объекты, содержат органические соединения, фенолы и другие углеводороды ароматического ряда. Попадая в водотоки, они нарушают биологическое и гидрохимическое равновесие и создают угрозу не только для здоровья населения, но и для рыбных запасов рек [2]. Органические соединения, частично просачиваясь через зону аэрации, попадают в подземный водоносный горизонт грунтовых вод и загрязняют его, а также с потоком подземных вод распространяются на значительные расстояния, нанося при этом серьезный экологический и экономический ущерб.

Современным и высокоэффективным методом удаления органических загрязнителей, содержащихся в промстоках являются усовершенствован-

ные окислительные процессы (Advanced Oxidation Processes - АОР), основанные на использовании свободных радикалов в качестве окислителей [3].

Для принятия эффективных управленческих решений, направленных на снижение антропогенного влияния органических соединений, сбрасываемых в составе шахтных вод необходим инструмент прогнозирования уровня загрязнителя в воде после осушествления очистки на этапе сброса. Таким инструментом могут послужить нейросетевые регрессионные модели зависимости концентрации загрязнителя от параметров процесса очистки. Применение нейронных сетей для построения прогнозных моделей продиктовано их свойством, воспроизводить чрезвычайно сложные зависимости нелинейным моделированием [4].

Группой исследователей Калужского филиала МГТУ им. Н.Э. Баумана в лаборатории Исследования воды и водных ресурсов Национального Университета Сингапура проводились эксперименты, по выявлению механизма воздействия окислителей - перекиси водорода и хлорида железа (III) в присутствии ультрафио-

Таблица 1

Матрица планирования эксперимента

_ Планирование Переменная состояния

н 2 в Z0 колированный масштаб натуральный масштаб

О Zl Z2 Z3 Z4 Xl X2 X3 X4 У

1 +1 -1 -1 -1 -1 0,05 100 1 1 0,036

2 +1 + 1 -1 -1 -1 0,1 100 1 1 0,071

3 +1 -1 + 1 -1 -1 0,05 200 1 1 0,035

4 +1 + 1 + 1 -1 -1 0,1 200 1 1 0,068

5 +1 -1 -1 +1 -1 0,05 100 2 1 0,033

6 +1 + 1 -1 +1 -1 0,1 100 2 1 0,064

7 +1 -1 + 1 +1 -1 0,05 200 2 1 0,031

8 +1 + 1 + 1 +1 -1 0,1 200 2 1 0,061

9 +1 -1 -1 -1 + 1 0,05 100 1 2 0,032

10 +1 + 1 -1 -1 + 1 0,1 100 1 2 0,062

11 +1 -1 + 1 -1 + 1 0,05 200 1 2 0,03

12 +1 +1 + 1 -1 + 1 0,1 200 1 2 0,059

13 +1 -1 -1 +1 + 1 0,05 100 2 2 0,028

14 +1 +1 -1 +1 + 1 0,1 100 2 2 0,056

15 +1 -1 + 1 +1 + 1 0,05 200 2 2 0,027

16 +1 +1 + 1 +1 + 1 0,1 200 2 2 0,053

летовой активации на уровень снижения концентрации фенольного загрязнителя (бисфенол-А (ВРА)) в модельных растворах с применением жидкостной и газовой хроматографии, атомной абсорбции и других методов [5]. По результатам исследований были отобраны значения параметров процесса для построения матрицы оптимального планирования эксперимента (табл. 1) [6], в результате которого сравнивалось воздействие ультрафиолетового излучения (время излучения t - x4) и окислителей на интенсивность разложения органического загрязнителя в модельном растворе (остаточная концентрация ВРА - у) при различных концентрациях ВРА - xj перекиси водорода H2O2 - x2 и хлорида железа (III) - x3.

При решении задач прогнозирования роль нейронной сети состоит в предсказании будущей реакции системы по её предшествующему поведе-

нию. В данном случае нейронная сеть играет роль универсального аппрок-симатора функции от нескольких переменных [4], реализуя нелинейную функцию

У = I (х),

где х - входной вектор; у - реализация векторной функции нескольких переменных.

Используя нелинейный аппарат нейросетевого моделирования, в программной среде Б!а1Мюа 6.1 решалась регрессионная задача по определению прогнозного уровня остаточной концентрации фенольного соединения в водной среде от параметров процесса очистки. Исходя из результатов планирования эксперимента параметрами входного вектора являются: начальная концентрация фенольного соединения (С(ВРА)), концентрация перекиси водорода (С(Н202)), концентрация хлорида же-

Рис. 1. Архитектура четырехспойного персептрона, построенного Statistica Neural Networks

леза (III), выступающего в качестве активатора (Сд) и время воздействия на систему ультрафиолетового излучения (t), выходного - остаточная концентрация загрязнителя (Cost).

Из построенных в Statistica Neural Networks пяти тысяч нейронных сетей выбран многослойный персептрон (MLP) (№4663), с четырьмя слоями: входной слой, имеющий четыре нейрона, выходной - один нейрон и два скрытых слоя по 10 и 4 нейрона в каждом соответственно. Архитектура сети МП 4:4-10-4-1:1 представлена на рис. 1.

Нейронная сеть при следующих значениях исходных параметров С(ВРА) = 0,006 мг/л, C(H2Ü2) = =945,96 мг/л, С(А) = 0,857 г/л, t = = 120 ч дала прогноз значения остаточной концентрации фенольного загрязнителя Cost = 0,001527 мг/л, что соответствует уровню рассогласования 0,6% по сравнению со значением, полученным решением задачи оптимизации при тех же значениях входных параметрах, основанной на

линейной множественной регрессии вида:

У = Ъ0 + Ъ1 Х1 + Ъ2 Х2 + Ъ3 Х3 + Ъ4 Х4, где У = 1п у, Х1 = 1п х1, Х2 = 1п х2, Х3 = 1п х3, Х4 = 1п х4 .

Уровень концентрации загрязнителя, прогнозируемый нейронной сетью в сравнении со значением, полученным по линейной регрессионной модели, характеризует высокую степень точности работы нейронной сети.

Четырехслойный персептрон (рис. 1) обучен на основе алгоритма обратного распространения ошибки и сопряженных градиентов. Сто эпох (итераций) обратного распространения, а также двадцать и пять эпох сопряженными градиентами (ОР100, СГ20, СГ5 Ь) с ошибкой обучения 0,006764, контрольной ошибкой 0,033119 и тестовой ошибкой 0,049106 сформировали наилучшую нейронную сеть. Ошибки получены соответственно для обучающего, контрольного и тестового подмножеств (табл. 2-4), на которые был «разбит» исходный массив данных (табл. 1) [7].

При обучении сети алгоритмом обратного распространения все наблюдения из обучающего множества на каждой эпохе по очереди подаются на вход сети.

Таблица 2

Обучающее подмножество

Обучающее подмножество

наблюдаемое предсказанное

C(ost) C(ost)_MLP

2 0,071000 0,070947

3 0,035000 0,035467

4 0,068000 0,067722

6 0,064000 0,064099

7 0,031000 0,030682

8 0,061000 0,061244

9 0,032000 0,031585

13 0,028000 0,028190

Таблица 3

Контрольное подмножество

Контрольное подмножество

наблюдаемое предсказанное

С^) С(ов1)_МЬР

5 0,033000 0,034610

11 0,030000 0,030431

12 0,059000 0,060919

14 0,056000 0,057286

Таблица 4

Тестовое подмножество

Тестовое подмножество

наблюдаемое предсказанное

С^) С^)_МЬР

1 0,036000 0,039251

10 0,062000 0,062533

15 0,027000 0,026916

16 0,053000 0,055641

Сеть обрабатывает их и выдает выходные значения, которые сравниваются с целевыми выходными значениями, содержащимися в наборе исходных данных. В процессе обучения происходит корректировка весов сети, направленная на уменьшение ошибки, т.е. разности между желаемым и реальным выходом. При обучении вычисляется локальный градиент каждого веса для каждого наблюдения. Веса корректируются после обработки каждого наблюдения по формуле [7, 8]

AwlJ () = П8]ог + аЫц (( —1)

где Ц- скорость обучения; 8- локальный градиент ошибки; а- коэффициент инерции; ог - выходное значение 1-го элемента (пороги считаются весами с о г = — 1); I - номер итерации (эпохи).

В методе спуска по сопряженным градиентам происходит последовательный поиск минимума по различным направлениям на поверхности ошибок. Сначала берется направление наискорейшего спуска, вдоль ко-

торого ищется минимум. Направления поиска (сопряженные направления) выбираются из тех соображений, чтобы не терять минимума по тем направлениям, по которым уже произведена минимизация. Градиент ошибки вычисляется как сумма градиентов ошибок по всем обучающим наблюдениям. Начальное направление поиска задается формулой [4, 7, 8]:

¿0 = —gо ,

где ё0 - начальное направление спуска; — g0 - антиградиент минимизируемой функции в точке хо, т.е. —У/(Хо) .

На последующих шагах направление поиска корректируется с помощью формулы Полака-Рибьера [4, 8]:

^ +1 +1 + в1й1,

в

gj+1((+1 gj)

т

gjgj

где - направление спуска на ]-ом шаге; в. - величина шага; gj - вектор градиента минимизируемой функции на ]-ом шаге; gT - транспонированный вектор градиента.

В случае если по данному направлению ошибка не убывает, то алгоритм снова берёт направление наискорейшего спуска.

Вид синаптических функций и функций активации, используемых в работе четырехслойного персептрона приведены в табл. 5.

Пост-синаптическая потенциальная функция (ПСП) имеет линейную природу, т.е. линейные ПСП-элементы берут взвешенную сумму своих входов и сдвигают её на пороговое значение [7, 8].

Уровень активации на вход сети передается в неизменном виде по-

Таблица 5

Функции активации в слоях нейронной сети

Слой Элементы Функции

Синаптиче-ская Активации

1 4 линейная линейная

2 10 линейная гиперболическая

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3 4 линейная гиперболическая

4 1 линейная линейная

Таблица 6

Описательные статистики

Статистические параметры Регрессия, C(ost)_MLP 4663

Среднее данных 0,046625

Ст. откл. данных 0,015767

Среднее ошибки 0,000720

Ст. откл. ошибки 0,001070

Среднее абсолютной ошибки 0,000864

Отношение ст. откл. (S.D. ratio) 0,067876

Корреляция 0,997703

средством линейной функции активации. Входы на второй и третий слои активируются гиперболической функцией, представляющей собой функцию гиперболического тангенса (!апЬ) [7, 8]:

у

eas - e~

где а - коэффициент, характеризующий крутизну функции.

В четвертом слое нейронной сети активация осуществляется линейной функцией, т.е. на выход сети значения с выхода третьего слоя передаются в неизменном виде.

Результаты работы сети в задаче регрессии приведены в табл. 6.

Наиболее важной статистикой характеризующей качество нейросе-тевой модели является отношение стандартных отклонений (Отношение ст. откл. или S.D. ratio), пред-

ставляющее собой отношение стандартного отклонения ошибки прогноза к стандартному отклонению исходных данных. Величина этой статистики 0,067876 значительно меньшая единицы (Отношение ст. откл. < 0,1 [7]) отражает хорошее качество регрессии, что также подтверждается коэффициентом коре-ляции Пирсона, между предсказанными и наблюдаемыми выходными значениями, равным 0,997703. Долю объясненной дисперсии зависимой переменной в общей выборочной дисперсии по результату работы сети в задаче регрессии характеризует регрессионное отношение, которое определяется R = 1 - -S.D. ratio = 1 - 0,067876 = 0,932124, что составляет 93%. Высокий процент объясненной дисперсии является универсальной мерой качества нейросетевой регрессионной модели [7].

Применение нейронных сетей для анализа поведения зависимой переменой, в данном случае концентрации фенольного соединения в водной среде от параметров процесса очистки - концентрации перекиси водорода, хлорида железа (III), выступающих в качестве окислителя и активатора фотохимической реакции и времени ультрафиолетового воздействия, позволяет выработать механизм предсказания уровня концентрации загрязнителя в зависимости от интервалов варьирования параметров процесса. Данный механизм нелинейного нейросетевого

as

ea + e~a

моделирования позволит не только управлять процессом очистки шахтных вод, содержащих трудноокис-ляемую органику, но и оптимизировать уровень затрат на функционирование очистных сооружений путем оптимального расхода ингредиентов окислителей под необходимый

1. Технический справочник по обработке воды: В 2 т., Т. 2: пер. с фр. СПб.: Новый журнал, 2007.

2. Тарасенко И.А., Чепкая H.A., Ели-сафенко Т.Н., Зиньков A.B., Катаева И.В., Садардинов И.В. Экологические последствия закрытия угольных шахт и меры по предотвращению их отрицательного воздействия на регион // Вестник ДВО РАН, 2004, №1. С. 87-93.

3. Моисеев И. И. Окислительные методы в технологии очистки воды и воздуха // Изв. АН. Сер. хим. 1995. № 3. С. 578 - 588.

4. Осовский С. Нейронные сети для обработки информации /Пер. с польского И. Д. Рудинского. М.: Финансы и статистика, 2004. 344 с.: ил.

уровень концентрации загрязнителя на выходе процесса очистки. Это позволит с минимально возможным уровнем затрат максимально снизить антропогенную нагрузку фенолсо-держаших сточных вод на окружающую среду, сбрасываемых при эксплуатации горных предприятий.

- СПИСОК ЛИТЕРАТУРЫ

5. Чернова М.В. Исследование процесса очистки водных систем от феноль-ных соединений под действием физико-химических факторов. Лис. ... канд. техн. наук. Калуга-Тула, 2009. 118 с.

6. ГОСТ Р 50.1.040-2002. Статистические методы. Планирование экспериментов. Термины и определения. М., Госстандарт России, 2002. 36 с.

7. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных /Под. ред. В.П. Боровикова. 2-е изд., перераб. и доп. М.: Горячая линия - Телеком, 2008. 392 с., ил.

8. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Лля профессионалов. 2-е изд. (+CD). СПб.: Питер, 2003. 688 е.: ил. S2H

КОРОТКО ОБ АВТОРАХ -

Соколов Эдуард Михайлович - доктор технических наук, профессор, зав. кафедрой, e-mail: eliard@yandex.ru

Шейнкман Леонид Элярдович - профессор, доктор технических наук, e-mail: eliard@yandex.ru.

Дергунов Дмитрий Викторович - аспирант, e-mail: dmitrov83@mail.ru; dmitrov@tula.ru. Тульский государственный университет.

д

i Надоели баннеры? Вы всегда можете отключить рекламу.