© Э.М. Соколов, Л.Э. Шейнкман, Д.В. Дергунов, 2012
УДК: 004.8.032.26:622.793
Э.М. Соколов, Л.Э. Шейнкман, Д.В. Дергунов
ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗА УРОВНЯ КОНЦЕНТРАЦИИ ФЕНОЛЬНЫХ СОЕДИНЕНИЙ В СТОЧНЫХ ВОДАХ ГОРНЫХ ПРЕДПРИЯТИЙ
На основе экспериментальных исследований предложена нейросетевая регрессионная модель, направленная на решение задач управления процессом снижения антропогенного воздействия горных предприятий на окружающую среду. Ключевыю слова: шахтные воды, загрязнение, управление, очистка, фенолы.
В горнодобывающей промышленности могут встретиться три типа сточных вод, загрязняющих окружающую среду: откачиваемые шахтные (грунтовые и инфильтраци-онные) воды; сточные воды обогатительных цехов и предприятий, расположенных на территории рудника; инфильтрационные воды, затопляющие заброшенную шахту [1]. Как правило, шахтные воды, сбрасываемые в водные объекты, содержат органические соединения, фенолы и другие углеводороды ароматического ряда. Попадая в водотоки, они нарушают биологическое и гидрохимическое равновесие и создают угрозу не только для здоровья населения, но и для рыбных запасов рек [2]. Органические соединения, частично просачиваясь через зону аэрации, попадают в подземный водоносный горизонт грунтовых вод и загрязняют его, а также с потоком подземных вод распространяются на значительные расстояния, нанося при этом серьезный экологический и экономический ущерб.
Современным и высокоэффективным методом удаления органических загрязнителей, содержащихся в промстоках являются усовершенствован-
ные окислительные процессы (Advanced Oxidation Processes - АОР), основанные на использовании свободных радикалов в качестве окислителей [3].
Для принятия эффективных управленческих решений, направленных на снижение антропогенного влияния органических соединений, сбрасываемых в составе шахтных вод необходим инструмент прогнозирования уровня загрязнителя в воде после осушествления очистки на этапе сброса. Таким инструментом могут послужить нейросетевые регрессионные модели зависимости концентрации загрязнителя от параметров процесса очистки. Применение нейронных сетей для построения прогнозных моделей продиктовано их свойством, воспроизводить чрезвычайно сложные зависимости нелинейным моделированием [4].
Группой исследователей Калужского филиала МГТУ им. Н.Э. Баумана в лаборатории Исследования воды и водных ресурсов Национального Университета Сингапура проводились эксперименты, по выявлению механизма воздействия окислителей - перекиси водорода и хлорида железа (III) в присутствии ультрафио-
Таблица 1
Матрица планирования эксперимента
_ Планирование Переменная состояния
н 2 в Z0 колированный масштаб натуральный масштаб
О Zl Z2 Z3 Z4 Xl X2 X3 X4 У
1 +1 -1 -1 -1 -1 0,05 100 1 1 0,036
2 +1 + 1 -1 -1 -1 0,1 100 1 1 0,071
3 +1 -1 + 1 -1 -1 0,05 200 1 1 0,035
4 +1 + 1 + 1 -1 -1 0,1 200 1 1 0,068
5 +1 -1 -1 +1 -1 0,05 100 2 1 0,033
6 +1 + 1 -1 +1 -1 0,1 100 2 1 0,064
7 +1 -1 + 1 +1 -1 0,05 200 2 1 0,031
8 +1 + 1 + 1 +1 -1 0,1 200 2 1 0,061
9 +1 -1 -1 -1 + 1 0,05 100 1 2 0,032
10 +1 + 1 -1 -1 + 1 0,1 100 1 2 0,062
11 +1 -1 + 1 -1 + 1 0,05 200 1 2 0,03
12 +1 +1 + 1 -1 + 1 0,1 200 1 2 0,059
13 +1 -1 -1 +1 + 1 0,05 100 2 2 0,028
14 +1 +1 -1 +1 + 1 0,1 100 2 2 0,056
15 +1 -1 + 1 +1 + 1 0,05 200 2 2 0,027
16 +1 +1 + 1 +1 + 1 0,1 200 2 2 0,053
летовой активации на уровень снижения концентрации фенольного загрязнителя (бисфенол-А (ВРА)) в модельных растворах с применением жидкостной и газовой хроматографии, атомной абсорбции и других методов [5]. По результатам исследований были отобраны значения параметров процесса для построения матрицы оптимального планирования эксперимента (табл. 1) [6], в результате которого сравнивалось воздействие ультрафиолетового излучения (время излучения t - x4) и окислителей на интенсивность разложения органического загрязнителя в модельном растворе (остаточная концентрация ВРА - у) при различных концентрациях ВРА - xj перекиси водорода H2O2 - x2 и хлорида железа (III) - x3.
При решении задач прогнозирования роль нейронной сети состоит в предсказании будущей реакции системы по её предшествующему поведе-
нию. В данном случае нейронная сеть играет роль универсального аппрок-симатора функции от нескольких переменных [4], реализуя нелинейную функцию
У = I (х),
где х - входной вектор; у - реализация векторной функции нескольких переменных.
Используя нелинейный аппарат нейросетевого моделирования, в программной среде Б!а1Мюа 6.1 решалась регрессионная задача по определению прогнозного уровня остаточной концентрации фенольного соединения в водной среде от параметров процесса очистки. Исходя из результатов планирования эксперимента параметрами входного вектора являются: начальная концентрация фенольного соединения (С(ВРА)), концентрация перекиси водорода (С(Н202)), концентрация хлорида же-
Рис. 1. Архитектура четырехспойного персептрона, построенного Statistica Neural Networks
леза (III), выступающего в качестве активатора (Сд) и время воздействия на систему ультрафиолетового излучения (t), выходного - остаточная концентрация загрязнителя (Cost).
Из построенных в Statistica Neural Networks пяти тысяч нейронных сетей выбран многослойный персептрон (MLP) (№4663), с четырьмя слоями: входной слой, имеющий четыре нейрона, выходной - один нейрон и два скрытых слоя по 10 и 4 нейрона в каждом соответственно. Архитектура сети МП 4:4-10-4-1:1 представлена на рис. 1.
Нейронная сеть при следующих значениях исходных параметров С(ВРА) = 0,006 мг/л, C(H2Ü2) = =945,96 мг/л, С(А) = 0,857 г/л, t = = 120 ч дала прогноз значения остаточной концентрации фенольного загрязнителя Cost = 0,001527 мг/л, что соответствует уровню рассогласования 0,6% по сравнению со значением, полученным решением задачи оптимизации при тех же значениях входных параметрах, основанной на
линейной множественной регрессии вида:
У = Ъ0 + Ъ1 Х1 + Ъ2 Х2 + Ъ3 Х3 + Ъ4 Х4, где У = 1п у, Х1 = 1п х1, Х2 = 1п х2, Х3 = 1п х3, Х4 = 1п х4 .
Уровень концентрации загрязнителя, прогнозируемый нейронной сетью в сравнении со значением, полученным по линейной регрессионной модели, характеризует высокую степень точности работы нейронной сети.
Четырехслойный персептрон (рис. 1) обучен на основе алгоритма обратного распространения ошибки и сопряженных градиентов. Сто эпох (итераций) обратного распространения, а также двадцать и пять эпох сопряженными градиентами (ОР100, СГ20, СГ5 Ь) с ошибкой обучения 0,006764, контрольной ошибкой 0,033119 и тестовой ошибкой 0,049106 сформировали наилучшую нейронную сеть. Ошибки получены соответственно для обучающего, контрольного и тестового подмножеств (табл. 2-4), на которые был «разбит» исходный массив данных (табл. 1) [7].
При обучении сети алгоритмом обратного распространения все наблюдения из обучающего множества на каждой эпохе по очереди подаются на вход сети.
Таблица 2
Обучающее подмножество
Обучающее подмножество
наблюдаемое предсказанное
C(ost) C(ost)_MLP
2 0,071000 0,070947
3 0,035000 0,035467
4 0,068000 0,067722
6 0,064000 0,064099
7 0,031000 0,030682
8 0,061000 0,061244
9 0,032000 0,031585
13 0,028000 0,028190
Таблица 3
Контрольное подмножество
Контрольное подмножество
наблюдаемое предсказанное
С^) С(ов1)_МЬР
5 0,033000 0,034610
11 0,030000 0,030431
12 0,059000 0,060919
14 0,056000 0,057286
Таблица 4
Тестовое подмножество
Тестовое подмножество
наблюдаемое предсказанное
С^) С^)_МЬР
1 0,036000 0,039251
10 0,062000 0,062533
15 0,027000 0,026916
16 0,053000 0,055641
Сеть обрабатывает их и выдает выходные значения, которые сравниваются с целевыми выходными значениями, содержащимися в наборе исходных данных. В процессе обучения происходит корректировка весов сети, направленная на уменьшение ошибки, т.е. разности между желаемым и реальным выходом. При обучении вычисляется локальный градиент каждого веса для каждого наблюдения. Веса корректируются после обработки каждого наблюдения по формуле [7, 8]
AwlJ () = П8]ог + аЫц (( —1)
где Ц- скорость обучения; 8- локальный градиент ошибки; а- коэффициент инерции; ог - выходное значение 1-го элемента (пороги считаются весами с о г = — 1); I - номер итерации (эпохи).
В методе спуска по сопряженным градиентам происходит последовательный поиск минимума по различным направлениям на поверхности ошибок. Сначала берется направление наискорейшего спуска, вдоль ко-
торого ищется минимум. Направления поиска (сопряженные направления) выбираются из тех соображений, чтобы не терять минимума по тем направлениям, по которым уже произведена минимизация. Градиент ошибки вычисляется как сумма градиентов ошибок по всем обучающим наблюдениям. Начальное направление поиска задается формулой [4, 7, 8]:
¿0 = —gо ,
где ё0 - начальное направление спуска; — g0 - антиградиент минимизируемой функции в точке хо, т.е. —У/(Хо) .
На последующих шагах направление поиска корректируется с помощью формулы Полака-Рибьера [4, 8]:
^ +1 +1 + в1й1,
в
gj+1((+1 gj)
т
gjgj
где - направление спуска на ]-ом шаге; в. - величина шага; gj - вектор градиента минимизируемой функции на ]-ом шаге; gT - транспонированный вектор градиента.
В случае если по данному направлению ошибка не убывает, то алгоритм снова берёт направление наискорейшего спуска.
Вид синаптических функций и функций активации, используемых в работе четырехслойного персептрона приведены в табл. 5.
Пост-синаптическая потенциальная функция (ПСП) имеет линейную природу, т.е. линейные ПСП-элементы берут взвешенную сумму своих входов и сдвигают её на пороговое значение [7, 8].
Уровень активации на вход сети передается в неизменном виде по-
Таблица 5
Функции активации в слоях нейронной сети
Слой Элементы Функции
Синаптиче-ская Активации
1 4 линейная линейная
2 10 линейная гиперболическая
3 4 линейная гиперболическая
4 1 линейная линейная
Таблица 6
Описательные статистики
Статистические параметры Регрессия, C(ost)_MLP 4663
Среднее данных 0,046625
Ст. откл. данных 0,015767
Среднее ошибки 0,000720
Ст. откл. ошибки 0,001070
Среднее абсолютной ошибки 0,000864
Отношение ст. откл. (S.D. ratio) 0,067876
Корреляция 0,997703
средством линейной функции активации. Входы на второй и третий слои активируются гиперболической функцией, представляющей собой функцию гиперболического тангенса (!апЬ) [7, 8]:
у
eas - e~
где а - коэффициент, характеризующий крутизну функции.
В четвертом слое нейронной сети активация осуществляется линейной функцией, т.е. на выход сети значения с выхода третьего слоя передаются в неизменном виде.
Результаты работы сети в задаче регрессии приведены в табл. 6.
Наиболее важной статистикой характеризующей качество нейросе-тевой модели является отношение стандартных отклонений (Отношение ст. откл. или S.D. ratio), пред-
ставляющее собой отношение стандартного отклонения ошибки прогноза к стандартному отклонению исходных данных. Величина этой статистики 0,067876 значительно меньшая единицы (Отношение ст. откл. < 0,1 [7]) отражает хорошее качество регрессии, что также подтверждается коэффициентом коре-ляции Пирсона, между предсказанными и наблюдаемыми выходными значениями, равным 0,997703. Долю объясненной дисперсии зависимой переменной в общей выборочной дисперсии по результату работы сети в задаче регрессии характеризует регрессионное отношение, которое определяется R = 1 - -S.D. ratio = 1 - 0,067876 = 0,932124, что составляет 93%. Высокий процент объясненной дисперсии является универсальной мерой качества нейросетевой регрессионной модели [7].
Применение нейронных сетей для анализа поведения зависимой переменой, в данном случае концентрации фенольного соединения в водной среде от параметров процесса очистки - концентрации перекиси водорода, хлорида железа (III), выступающих в качестве окислителя и активатора фотохимической реакции и времени ультрафиолетового воздействия, позволяет выработать механизм предсказания уровня концентрации загрязнителя в зависимости от интервалов варьирования параметров процесса. Данный механизм нелинейного нейросетевого
as
ea + e~a
моделирования позволит не только управлять процессом очистки шахтных вод, содержащих трудноокис-ляемую органику, но и оптимизировать уровень затрат на функционирование очистных сооружений путем оптимального расхода ингредиентов окислителей под необходимый
1. Технический справочник по обработке воды: В 2 т., Т. 2: пер. с фр. СПб.: Новый журнал, 2007.
2. Тарасенко И.А., Чепкая H.A., Ели-сафенко Т.Н., Зиньков A.B., Катаева И.В., Садардинов И.В. Экологические последствия закрытия угольных шахт и меры по предотвращению их отрицательного воздействия на регион // Вестник ДВО РАН, 2004, №1. С. 87-93.
3. Моисеев И. И. Окислительные методы в технологии очистки воды и воздуха // Изв. АН. Сер. хим. 1995. № 3. С. 578 - 588.
4. Осовский С. Нейронные сети для обработки информации /Пер. с польского И. Д. Рудинского. М.: Финансы и статистика, 2004. 344 с.: ил.
уровень концентрации загрязнителя на выходе процесса очистки. Это позволит с минимально возможным уровнем затрат максимально снизить антропогенную нагрузку фенолсо-держаших сточных вод на окружающую среду, сбрасываемых при эксплуатации горных предприятий.
- СПИСОК ЛИТЕРАТУРЫ
5. Чернова М.В. Исследование процесса очистки водных систем от феноль-ных соединений под действием физико-химических факторов. Лис. ... канд. техн. наук. Калуга-Тула, 2009. 118 с.
6. ГОСТ Р 50.1.040-2002. Статистические методы. Планирование экспериментов. Термины и определения. М., Госстандарт России, 2002. 36 с.
7. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных /Под. ред. В.П. Боровикова. 2-е изд., перераб. и доп. М.: Горячая линия - Телеком, 2008. 392 с., ил.
8. Боровиков В. STATISTICA. Искусство анализа данных на компьютере: Лля профессионалов. 2-е изд. (+CD). СПб.: Питер, 2003. 688 е.: ил. S2H
КОРОТКО ОБ АВТОРАХ -
Соколов Эдуард Михайлович - доктор технических наук, профессор, зав. кафедрой, e-mail: [email protected]
Шейнкман Леонид Элярдович - профессор, доктор технических наук, e-mail: [email protected].
Дергунов Дмитрий Викторович - аспирант, e-mail: [email protected]; [email protected]. Тульский государственный университет.
д