Научная статья на тему 'Применение регуляризации к идентификации математической модели деструкции фенольных соединений в промышленных сточных водах по технологии advanced oxidation processes'

Применение регуляризации к идентификации математической модели деструкции фенольных соединений в промышленных сточных водах по технологии advanced oxidation processes Текст научной статьи по специальности «Математика»

CC BY
235
62
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕГУЛЯРИЗАЦИЯ / НЕКОРРЕКТНЫЕ ЗАДАЧИ / МОДЕЛИРОВАНИЕ / ФЕНОЛ / СТОЧНЫЕ ВОДЫ / ОЧИСТКА / УСОВЕРШЕНСТВОВАННЫЕ ОКИСЛИТЕЛЬНЫЕ ПРОЦЕССЫ / REGULARIZATION / INCORRECT PROBLEMS / MODELING / PHENOL / WASTE WATER / TREATMENT / ADVANCED OXIDATION PROCESSES

Аннотация научной статьи по математике, автор научной работы — Шейнкман Леонид Элярдович, Дергунов Дмитрий Викторович, Котлеревская Людмила Викторовна, Антоненко Наталья Александровна

Для эффективного управления процессом очистки сточных вод промышленных предприятий от фенольных соединений на основе усовершенствованных окислительных процессов предложена экспоненциальная модель снижения концентрации фенольных соединений (на примере Бисфенола-А) при воздействии физико-химических факторов (УФ излучения, λ = 365 нм, Н2О2, Fe3+). Модель идентифицирована в программных средах Statistica и MathCad на основе метода наименьших квадратов и является статистически значимой результатам эксперимента, проведенного на основе оптимального планирования. Для стабилизации неустойчивых параметров модели применен метод регуляризации А.Н. Тихонова. Полученная регуляризованная модель, устанавливающая зависимость степени фотохимического разложения фенольных соединений в водной среде от параметров процесса, является статистически значимой и обладает лучшими прогнозными свойствами, чем исходная зависимость, идентифицированная по методу наименьших квадратов. Статистическая значимость регуляризованной модели определялась с использованием F-критерия Фишера, t-критерия Стьюдента и 95%-ных доверительных интервалов для регуляризованных параметров модели. Значение коэффициента детерминации, R2 =0,9995, показывает, что вариация физико-химических факторов при применении регуляризации на 99,95% объясняет вариацию концентрации фенольного соединения (ВРА). Значимость коэффициента детерминации подтверждается с 99%-ной вероятностью по критерию Фишера. Модель фотохимического разложения фенольных соединений в водной среде, полученная на основе применения метода регуляризации может давать более устойчивые прогнозные значения уровней содержания фенольных соединений в промышленных сточных водах.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Шейнкман Леонид Элярдович, Дергунов Дмитрий Викторович, Котлеревская Людмила Викторовна, Антоненко Наталья Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF REGULARIZATION TO THE IDENTIFICATION OF THE MATHEMATICAL MODEL OF THE DEGRADATION OF PHENOLIC COMPOUNDS IN INDUSTRIAL WASTEWATER TECHNOLOGY ADVANCED OXIDATION PROCESSES

For effective management of wastewater treatment process industrial enterprises of phenolic compounds on the basis of advanced oxidation processes proposed exponential model to reduce the concentration of phenolic compounds (for example, Bisphenol-A) under the action of physical and chemical factors (UV radiation, λ = 365 nm, H2O2, Fe3+). Model identified in the Statistica software environments and MathCad based on the method of least squares and is statistically significant results of the experiment carried out on the basis of optimal planning. For stabilization of unstable parameters of the model, the method of regularization A.N. Tikhonov. The resulting regularized model establishing the degree of photochemical degradation of phenolic compounds in the aquatic environment of the process parameters is statistically significant and has the best forward-looking features than the original relationship, identified by the method of least squares. The statistical significance of a regularized model was determined using Fisher’s F-test, t-Student’s t test and 95% confidence intervals for the regularized model parameters. The coefficient of determination, R2 = 0,9995, shows that the variation of physical and chemical factors in the application of regularization to explain 99,95% of the variation of concentration of phenolic compounds (BPA). The significance of the coefficient of determination is confirmed with 99% probability by the Fisher test. Model photochemical decomposition of phenolic compounds in an aqueous medium, obtained by applying the regularization method may provide more stable levels of predicted values of phenolic compounds in industrial waste water.

Текст научной работы на тему «Применение регуляризации к идентификации математической модели деструкции фенольных соединений в промышленных сточных водах по технологии advanced oxidation processes»

УДК 519.673:547.562.4:628.3

ПРИМЕНЕНИЕ РЕГУЛЯРИЗАЦИИ К ИДЕНТИФИКАЦИИ МАТЕМАТИЧЕСКОЙ МОДЕЛИ ДЕСТРУКЦИИ ФЕНОЛЬНЫХ СОЕДИНЕНИЙ В ПРОМЫШЛЕННЫХ СТОЧНЫХ ВОДАХ ПО ТЕХНОЛОГИИ ADVANCED OXIDATION PROCESSES

© 2015 Л.Э. Шейнкман, Д.В. Дергунов, Л.В. Котлеревская, Н.А. Антоненко

Тульский государственный университет

Статья поступила в редакцию 30.09.2015

Для эффективного управления процессом очистки сточных вод промышленных предприятий от фенольных соединений на основе усовершенствованных окислительных процессов предложена экспоненциальная модель снижения концентрации фенольных соединений (на примере Бисфенола-А) при воздействии физико-химических факторов (УФ излучения, X = 365 нм, Н2О2, Fe3+). Модель идентифицирована в программных средах Statistica и MathCad на основе метода наименьших квадратов и является статистически значимой результатам эксперимента, проведенного на основе оптимального планирования. Для стабилизации неустойчивых параметров модели применен метод регуляризации А.Н. Тихонова. Полученная регуляризованная модель, устанавливающая зависимость степени фотохимического разложения фенольных соединений в водной среде от параметров процесса, является статистически значимой и обладает лучшими прогнозными свойствами, чем исходная зависимость, идентифицированная по методу наименьших квадратов. Статистическая значимость регуляризованной модели определялась с использованием F-критерия Фишера, t-критерия Стьюдента и 95%-ных доверительных интервалов для регуляри-зованных параметров модели. Значение коэффициента детерминации, R2 =0,9995, показывает, что вариация физико-химических факторов при применении регуляризации на 99,95% объясняет вариацию концентрации фенольного соединения (ВРА). Значимость коэффициента детерминации подтверждается с 99%-ной вероятностью по критерию Фишера. Модель фотохимического разложения фенольных соединений в водной среде, полученная на основе применения метода регуляризации может давать более устойчивые прогнозные значения уровней содержания фенольных соединений в промышленных сточных водах.

Ключевые слова: Регуляризация, некорректные задачи, моделирование, фенол, сточные воды, очистка, усовершенствованные окислительные процессы.

ВВЕДЕНИЕ

Сточные воды ряда отраслей промышленности (химической, фармацевтической, металлургической, целлюлозно-бумажной, горно-перера-батывающей и др.) вносят значительный вклад в загрязнение поверхностных и подземных водных объектов фенольными и трудноокисляемыми органическими соединениями. В технологических схемах очистки промышленных вод от фенольных соединений на многих предприятиях используется обработка стоков коагулянтами и флокулянтами. Однако эти методы имеют ряд недостатков, приводящих к повышенному образованию осадка и солесодержанию.

Современным и высокоэффективным методом удаления органических загрязнителей, содержащихся в промышленных сточных водах, яв-

Шейнкман Леонид Элярдович, доктор технических наук, профессор, профессор кафедры «Аэрология, охрана труда и окружающей среды». E-mail: eliard@yandex.ru Дергунов Дмитрий Викторович, кандидат технических наук, инженер. E-mail: dmitrov83@mail.ru Котлеревская Людмила Викторовна, кандидат технических наук, доцент. E-mail: eliard@yandex.ru Антоненко Наталья Александровна, аспирант. E-mail: eliard@yandex.ru

ляются процессы, основанные на использовании свободных радикалов в качестве окислителей, использующие технологию усовершенствованных окислительных процессов (Advanced Oxidation Processes - АОР) [1]. Достоинством АОР-процессов является легкость регулирования их скорости в широких пределах с изменением интенсивности светового потока, быстрое и полное их приостановление с прекращением облучения.

Для управления процессом очистки сточных вод от фенольных соединений и идентификации математической модели на основе применения фотохимических методов при совместном действии окислителей перекиси водорода, хлорида железа (III) и ультрафиолетовго излучения длиной волны 365 нм проводились экспериментальные исследования с применением жидкостной и газовой хроматографии [2].

Управление процессами очистки сточных вод осуществляется на основе математических моделей, адекватно описывающих законы фотохимического разложения фенольных соединений в водной среде, представленные в зашифрованном виде экспериментальными данными. Для выявления этих законов и идентификации математических моделей применяется аппарат математической статистики, а именно регрессионный

анализ, основанный на методе наименьших квадратов (МНК) [3]. Однако, алгебраическая задача МНК, применительно к оценке параметров математических моделей, описывающих процесс фотохимического разложения фенольных соединений в водной среде, является некорректно поставленной. Решение такой задачи может не существовать или не иметь единственного решения или может отсутствовать непрерывная зависимость решения от исходных данных, т.е. небольшим погрешностям исходных данных могут соответствовать существенные погрешности получаемых решений, что в конечном итоге приводит к неустойчивости оценок параметров идентифицируемой модели [4, 5]. Однако, при управлении процессом очистки сточных вод на стадии моделирования, варьированием уровнями факторов, необходимо получать адекватные прогнозные значения уровней остаточной концентрации фенольного соединения, содержащегося в воде по окончании очистки. Таким образом, целью работы является построение устойчивых решений при идентификации параметров математической модели, устанавливающей зависимость уровня снижения концентрации фенольных соединений в водной среде при воздействии фотохимических факторов.

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА

При проведении экспериментальных исследований, связанных с оценкой воздействия физико-химических факторов на уровень раз-

ложения фенольных соединений в водной среде, в качестве зависимой переменной выбран показатель «содержание остаточной концентрации ВРА на выходе процесса». На уровень остаточной концентрации фенольного загрязнителя в процессе фотодеградации влияют следующие факторы: исходная концентрация ВРА в модельном растворе Xj - CBPA, мг/л; концентрация перекиси водорода x - CH2O2, мг/л; концентрация активатора, содержащего ионы железа (III) x3 - CA, г/л; время облучения x4 - t, ч.

При проведении опытных исследований каждый из факторов варьировался на двух уровнях - минимальном (кодированное значение - 1) и максимальном (кодированное значение +1). Границы пространства планирования заданы m-мерным кубом со сторонами - 1 < х < +1, j = 1, 2, ..., m [6]. Матрица планирования эксперимента приведена в табл. 1 [2].

МОДЕЛИРОВАНИЕ И ОБРАБОТКА РЕЗУЛЬТАТОВ

Будем считать, что влияние, оказываемое воздействием физико-химических факторов, на уровень снижения концентрации фенольного соединения в водной среде можно описать моделью вида [7]:

n

У = 1+S=^ßifi (X15 Х2 5 • • • 5 Xm ) + S , (1) i=1

где: f(x1, x2,..., xj - произвольные функции факторов (регрессоров); ß1, ß2,..., ßk - коэффициенты

Таблица 1. Матрица полного факторного эксперимента

Опыты Планирование Переменная состояния

zo кодированный масштаб натуральный масштаб

zi z2 zs z4 xi x2 Xs x4 у

1 + 1 -1 -1 -1 -1 0,05 100 1 1 0,036

2 + 1 +1 -1 -1 -1 0,1 100 1 1 0,071

3 + 1 -1 + 1 -1 -1 0,05 200 1 1 0,035

4 + 1 +1 + 1 -1 -1 0,1 200 1 1 0,068

5 + 1 -1 -1 + 1 -1 0,05 100 2 1 0,033

6 + 1 +1 -1 + 1 -1 0,1 100 2 1 0,064

7 + 1 -1 + 1 + 1 -1 0,05 200 2 1 0,031

8 + 1 +1 + 1 + 1 -1 0,1 200 2 1 0,061

9 + 1 -1 -1 -1 + 1 0,05 100 1 2 0,032

10 + 1 +1 -1 -1 + 1 0,1 100 1 2 0,062

11 + 1 -1 + 1 -1 + 1 0,05 200 1 2 0,03

12 + 1 +1 + 1 -1 + 1 0,1 200 1 2 0,059

13 + 1 -1 -1 + 1 + 1 0,05 100 2 2 0,028

14 + 1 +1 -1 + 1 + 1 0,1 100 2 2 0,056

15 + 1 -1 + 1 + 1 + 1 0,05 200 2 2 0,027

16 + 1 +1 + 1 + 1 + 1 0,1 200 2 2 0,053

модели; е - ошибка эксперимента.

Матрица регрессоров F (при планировании эксперимента F - расширенная матрица эксперимента) представляет собой следующую (Nxk) - матрицу:

fll fl2 ••• fkl ^ F _ fl2 f22 • ' ' fk2

V flN f2N • " fkN J

В каждой строке F записаны значения функций fu из модели (1) при данном наблюдении (и = 1,2,...,N), т.к. в регрессионном анализе предварительно предполагается некоторая структура модели, функции fiu известны.

Исходя из закона действующих масс [8], которому подчиняется гомогенный фото-каталитический процесс разложения органических соединений, зависимость концентрации фенольного соединения от факторов процесса математически можно описать следующим выражением:

ц _ ß\ 2 Xß 3 Х3 4 X4 5 , (2)

где: ц - уровень остаточной концентрации BPA в момент времени t, мг/л; x1 - исходная концентрация ВРА, мг/л; x2 - концентрация перекиси водорода, мг/л; x3 - концентрация хлорида железа (III), г/л; x4 - время процесса очистки, ч; ß1, ß 2, ß 3, ß 4, ß 5 - параметры модели.

Коэффициенты ß в модель (2) входят нелинейно, но при линеаризации путем логарифмировании по натуральному основанию, правой и левой частей уравнения (2), получим:

1пц _ln ß + ß2ln~ + ß3ln~2 + ß4ln~3 + ß5ln~4 где в соответствии с (1): ц _ ln ц, ß _ ln ßl, fi _l,

f2 _ ln , f3 _ ln X2 , f4 _ ln x3 , fn _ f5 _ ln x4 .

Однако при таком преобразовании случайное возмущение (ошибка эксперимента) входит в модель мультипликативно и имеет логнормальное

распределение, т.е. y _це, и после логарифмирование это дает: ln y _ 1пц + lne [7].

После линеаризации и введении новых переменных, выражение (2) примет вид:

Y _ b0 + bXl + b2X2 + b3X3 + b4X4, (3)

где: предикторные переменные X1, X2, X3, X4 и отклик Y являются логарифмическими функциями : Y = lny, X1 = lnx1, X2 = lnx2, X3 = lnx3, X4 = lnx4; b0, b1, b2, b3, b4 - параметры модели.

Обычно в задачах обработки данных матрица эксперимента и вектор отклика известны неточно, т.е. с погрешностями. Но даже при точно заданной входной матрице конечная разрядность ЭВМ, наличие ошибок округления и их накопление в процессе вычисления коэффициентов регрессии приводят к неопределенности представления матрицы эксперимента на этапах вы-

числительной процедуры. Поэтому погрешности в матрице данных принципиально неустранимы, т.е. задача определения регрессионных коэффициентов по методу наименьших квадратов неустойчива к ошибкам в исходных данных [4].

Одно из основных предположений классической процедуры регрессионного анализа заключается в том, что матрица регрессоров Б имеет полный ранг, а информационная матрица О = РТР - невырождена [7].

При вырожденности информационной матрицы нельзя вычислить коэффициенты регрессионной модели по формуле:

Ь = (ТГ ГТУ, (4)

поскольку не существует матрица С = (ТГ)1. Действительно, элементы матрицы С находят следующим образом:

с, = (-1)+1\о,]\ / \о\.

Как известно, линейным преобразованием можно любую матрицу привести к диагональному виду. Пусть V будет ортогональной матрицей, столбцы которой - ортонормированные собственные векторы матрицы РТР, т.е.

(ГУ)) ГУ = УТГТ ГУ = diag(АД,..., А,),

где А2,..., \ - собственные числа матрицы РТР.

Ортогональность матрицы V означает, что VTV = I и скалярное произведение любых двух столбцов матрицы V равно

vlVj _ZVuVfl _

1

0

при i = ,,

1=1 ^о при i Ф

Из линейной алгебры известно, что если Яг собственное число РТР, то

ГТГУг =хуг,

а также

g _ \ftf\

, к

Следовательно, информационная матрица О вырождена, если хотя бы одно из её собственных чисел А равно нулю. Тогда выполняется условие

1 ¥т¥Уг = 0,

что возможно только при = 0, когда строки матрицы ¥ ортогональны к V. и существует зависимость:

Уц/1 + У*/2 + •••+Уш1к = 0. (5)

Уравнение (5) означает, что существует линейная зависимость между столбцами матрицы Р, т.е. хотя бы один из них можно выразить как линейную комбинацию остальных. Если матрица РТР имеет р нулевых собственных чисел, существует р независимых между собой уравнений типа (5). Если столбцы матрицы Р рассматривать как векторы, то р из них будут коллинеарны, т.е. будут иметь совпадающие направления. Такое

явление называют строгой мультиколлинеарно-стью. Оно означает, что ранг матрицы FTF равен k - p (числу линейно независимых столбцов F). Иногда уравнение (5) выполняется лишь приблизительно. Это явление называется мультиколли-неарностью и имеет отрицательные последствия для оценивания регрессионных коэффициентов.

В случае мультиколлинеарности одно или несколько собственных чисел G=FTF очень близки к нулю, поэтому близок к нулю и определитель информационной матрицы |G|. А так как обращение информационной матрицы связано с делением на |G|, который при сильной муль-тиколлинеарности будет очень малым числом, малые ошибки в вычислениях могут вызвать существенные различия в рассчитываемых элементах G = FTF, а значит и в оцениваемых коэффициентах регрессии.

Отрицательные последствия мультиколлине-арности заключаются в неустойчивости оценок коэффициентов модели, численной неустойчивости процедуры оценивания, вызванной ошибками машинного округления и накоплением ошибок.

В линейной алгебре для исследования мультиколлинеарности прибегают к числам обусловленности. Для информационной матрицы плана G = FTF число обусловленности может быть определено как отношение максимального и минимального значений собственных чисел X, т.е. Р = Cond (FTF) = X / X . . Чем больше число

4 ' max mm

обусловленности, тем сильнее ошибка в исходных данных сказывается на решении линейной системы, т.е. число обусловленности характеризует точность решения [7].

Определяя в системе MathCad вектор собственных чисел информационной матрицы Фишера (FTF), получим: X{FTF} = (0,058; 526,312; 1,922; 1,922; 1,922); максимальное и минимальное собственные числа матрицы FTF равны соответственно - X = 526,312; X . = 0,0584. Число

max 1 1 mm 1

обусловленности информационной матрицы, в смысле евклидовой нормы, определенное через отношение собственных чисел составляет P(FTF) = 9-103. Сильная мультиколлинеарность проявляется при Cond(FTF) > 105 - 106 [7].

РЕГУЛЯРИЗАЦИЯ

Учитывая, что алгебраически задача определения оценок неизвестных параметров множественной линейной регрессии сводится к вычислению псевдорешений ф системы линейных алгебраических уравнений (СЛАУ):

Аф = f, (6)

где: А еRmxn, m > n, rankA = n, феRn, f eRm, то наиболее эффективным способом «борьбы» с мультиколлинеарностью является идея регуляризации псевдорешений, изложенная в работах А.Н. Тихонова [4, 5, 9, 10].

Согласно методу регуляризации А.Н. Тихонова, решение ф определяется из минимизации функционала

М [ф ] = |\Лф - /\|2 +а\ф\

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

то есть регуляризованное псевдорешение СЛАУ (6) определяется как решение задачи

(Ра= arg min

\\ - f\

xeRn

2 II-II2)

2 +аЫ 2 j,

(7)

где: ||*|| - евклидова норма вектора; а - параметр регуляризации.

Решение регуляризованной задачи (7) эквивалентно решению системы уравнений:

(ЛТЛ + а1 )фа= Лт/,

где: А - матрица СЛАУ; f - вектор-столбец правой части СЛАУ; Т - символ транспонированная; I -единичная матрица.

Регуляризация А.Н. Тихонова, в решении регрессионных задач, представляющая попытку преодолеть последствия плохой обусловленности матрицы (РГ), интерпретирована рядом исследователей как подход, названный гребневой регрессией (ридж-регрессией) [7, 11, 12].

Процедура построения гребневой регрессии, впервые предложенная в 1962 году А.Э. Хоэрлом, предназначена для работы в случаях, когда существование приближенных зависимостей между столбцами матрицы Г приводит к тому, что матрица РГ близка к вырожденной, из-за чего оценки параметров становятся неустойчивыми и, как правило, обладают большими стандартными ошибками. При использовании метода гребневой регрессии для стабилизации МНК-оценок, определяемых по формуле (4) при плохой обусловленности информационной матрицы, регуляризация связана с добавлением некого положительного числа х (параметра регуляризации) к диагональным элементам матрицы ГГ [11].

При условии выбора подходящего значения параметра регуляризации х, можно существенно уменьшить квадратичную ошибку МНК-оценок за счет их небольшого смещения. Выбор параметра регуляризации Хоэрл, Кеннард и Белдвин [11, 12] предложили осуществлять следующим образом: _ т • 88е 1

х _---*т—*, (8)

п - т -1 Ь Ь

где: т - количество параметров (без учета свободного члена) в исходной модели регрессии; ББе - остаточная сумма квадратов, полученная по исходной модели регрессии без корректировки на мультиколлинеарность; Ь* - вектор-столбец коэффициентов регрессии, преобразованный по формуле:

b* = h

to - X)2

(9)

где: b. - параметр при переменной X. в исходной

модели регрессии, определенный по МНК; X ^ -среднее значение /'-ой независимой переменной.

После выбора величины т формула для оценки регуляризованных параметров регрессии будет иметь вид:

b =

(FTF + tI)- FTY ,

(10)

где: I- единичная матрица; Р - матрица регрессо-ров; У-вектор значений зависимой переменной.

Оценки параметров регрессии, полученные по формуле (10), будут смещенными. Однако, т.к. определитель матрицы (РР+т1), больше определителя матрицы (РР), дисперсия оценок параметров регрессии уменьшится, что положительно повлияет на прогнозные свойства модели [12].

В работах [7, 13] показано, что регуляризован-ные оценки можно записать еще и следующими двумя способами:

bT =

I + т

(FTF) -■

b = Zb , (11)

или

h =

где Z =

I -т {FTF + т1) 1 b = (I -tW) b, (12) I + t(FtF )-11 1, а W = (FTF + tI ) -1.

персий оценок коэффициентов у1(т) монотонно убывает, в то время как квадрат смещения оценок монотонно возрастает. Очевидно, квадратичная ошибка оценки имеет минимум при у1(т) = у2(т), что видно из (14).

Доказано [13], что всегда существует такое значение т, при котором М(т) < М(0), М(0) - квадратичная ошибка, полученная МНК-оцениванием при т = 0.

Таким образом, при выборе подходящего значения параметра регуляризации, уменьшается квадратичная ошибка оценок [7].

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

Для идентификации оценок коэффициентов регрессионной модели (3) по МНК в соответствии с формулой (4) использовались пакеты прикладных программ у.6.1 и MathCad 14.0. Анализ экспериментальных данных, проводимый в Statistica и MathCad позволил определить вектор коэффициентов модели Ь МНК = (-0,080788; 0,971642; -0,069869; -0,156662; -0,203063) и идентифицировать модель вида:

Cost = eXP

-0,080788 + 0,971642lnCBPA -0,069869lnCHO — —0,156662lnCA -0,203063lnt

,(17)

Если рассматривать математическое ожидание обоих выражений (12), выясняется, что регу-ляризованные оценки оказываются смещенными и смещение их равно:

Е (Ьт) -) = -т(тЕ + т1) 1 ). (13)

Очевидно, что смещение зависит как от параметра регуляризации т, так и от неизвестных значений регрессионных коэффициентов р.

За счет смещения можно достичь уменьшения квадратичной ошибки оценок М(т), которая разложима на две составляющие:

мТ) = Е(Ь,.-РУ = Е((-)) ((-)) = у(т) + у(т).(14)

Первая составляющая:

У (т) = *2X( / (Л +т)2), (15)

/=1

где Л. - собственные числа матрицы РР. Она равна сумме дисперсий оценок коэффициентов. Второй член

у (т) = т2р (( + т1)-2 р = ХГа,2 / (( /т) +1) 21, (16)

где: а = V), а V - ортогональная матрица, столбцы которой - собственные векторы РТБ. Тогда VГFTFV = Л, где Л - диагональная матрица с собственными числами на диагонали Л1, Л2, ...,Лк.

При сравнении (13) и (16), видно, что у2(т) равна квадрату смещения оценок регрессионных коэффициентов. Из (15) и (16) следует, что с ростом параметра регуляризации т сумма дис-

где: CocT(t) и С0 - остаточная и начальная концентрации фенольного загрязнителя соответственно, мг/л; CH2O2 - концентрация перекиси водорода, мг/л; СА - концентрация хлорида железа (III), г/л; t - время, ч.

Значение коэффициента детерминации, близкого к единице (R2 =0,999), показывает, что вариация факторов на 99,9% объясняет вариацию остаточной концентрации фенольного соединения при фотохимическом воздействии. Значимость коэффициента детерминации подтверждается с 99%-ной вероятностью (уровень значимости а=0,01), в связи с тем, что критическое значение критерия Фишера F^ со степенями свободы v1 = 4, v2 = 11 не превышает расчетного значения для регрессионной модели (F (0,01;4,11)=5,67 < F=7292,13). На основе t-критерия Стьюдента установлена значимость оценок параметров модели (17) на уровне а =0,01, свободного члена на уровне а=0,05 (модули t-критерия tj=164,7; t2=11,8; t3=26,6; t4=34,4 превышают критическое значение t(0,99;11)=2,72, а модуль t-критерия для свободного члена t0=2,4>t(0,95;11)=1,79). О 99%-ной достоверности модели (17) экспериментальным данным свидетельствует принадлежность оценки дисперсии ошибок наблюдений 99%-ному доверительному интервалу (S2=6,7-10-5 е (2,75-10-5; 28,25-10-5)). Статистика Дарбина-Уотсона DW=2,02 и сериальная корреляция остатков pcor= -0,092, подтверждают высокую степень адекватности модели (17) результатам эксперимента [2].

Учитывая, что остаточная сумма квадратов в исходной модели регрессии (17) составляет

ББе = 735,4402-10 6 и квадратный корень из суммы квадратов Х/) = 1,3863, то вектор преобразованных коэффициентов регрессии, определяемый по формуле (9), будет иметь вид Ь* ={1,346987; -0,096859; -0,217181; -0,281506} ,) = 1,™,4. Величина параметра регуляризации, определяемая по формуле (8) будет иметь значение, равное х = 1,371-10-4.

Точность оценивания определяется по величине квадратичной ошибки оценки коэффициентов ( СКОК):

CKOK =

I (( - )2.

ошибки, хотя это понятие субъективное [7], т.е. приемлемый выбор параметра регуляризации основывается на гребневом следе и варьируется в данном случае вокруг оптимального значения 1,371-10-4. При использовании пакетов прикладных программ 81а^8Йса и MathCad идентифицирован вектор регуляризированных оценок коэффициентов регрессии Ьг = {0,081205; 0,971509; 0,069860; 0,156641; 0,203035}, и регуляризованная модель снижения концентрации фенольного соединения в виде:

-0,081205 + 0,9715091пС„, -0,069861пСпп Л

Cost = eXP

-0,156641lnC„ - 0,203035 ln t

1,(18)

где: Ь - оценки значений коэффициентов модели, полученные методом регуляризации; Ь. -значения коэффициентов модели, полученные по МНК.

Дополнительно к определенному по формуле (8) параметру регуляризации, зададимся рядом иных значений величины х. Результаты оценивания параметров модели (3) методом регуляризации при различных значениях х приведены в табл. 2.

Из табл. 2 видно, что наименьшая квадратичная ошибка оценок получается при х = 10-5. Однако, при очень малых значениях параметра регуляризации её эффект незначителен, а при больших х влияние данных падает по сравнению с влиянием члена х1. Авторы работы [14] для того, чтобы не сильно «испортить» задачу, рекомендуют выбирать параметр регуляризации весьма малым, порядка 10-3 - 10-9.

Оценка параметра регуляризации х = 1,371-10-4, принятая в соответствии с рекомендациями Хоэрла, Кеннарда и Белдвина [11, 12] дает приемлемый минимальный уровень квадратической

где: CocT(t) и С0 - остаточная и начальная концентрации фенольного загрязнителя соответственно, мг/л; CH2O2 - концентрация перекиси водорода, мг/л; СА - концентрация хлорида железа (III), г/л; t - время, ч.

Значение коэффициента детерминации, R2 =0,9995, показывает, что вариация факторов при применении параметра регуляризации х на 99,95% объясняет вариацию остаточной концентрации фенольного соединения (ВРА) по модели (18). Значимость коэффициента детерминации подтверждается с 99%-ной вероятностью (уровень значимости а=0,01), в связи с тем, что критическое значение критерия Фишера F^ со степенями свободы v1 = 4, v2 = 11 не превышает расчетного значения для регуляризованной регрессионной модели ^кр(0,01;4,11)=5,67 < F=5348,417). На основе t-критерия Стьюдента установлена значимость оценок регуляризо-ванных параметров модели bjr на уровне а =0,01, свободного члена b0r на уровне а =0,05. Уровни значений статистики t-критерия Стьюдента для регуляризованных параметров модели (18) со-

Таблица 2. Результаты оценивания параметров модели

Коэффи-центы модели МНК ь2 ьз ь4 CKOK

0,971642 -0,069869 -0,156662 -0,203063 —

х = 1,37-10-4 0,971509 -0,069860 -0,156641 -0,203035 1,9-10-8

10-4 0,971545 -0,069862 -0,156647 -0,203043 1,008-10-8

2-10-4 0,971448 -0,069855 -0,156631 -0,203022 4,047-10-8

5-10-4 0,971157 -0,069834 -0,156584 -0,202961 2,529-10-7

10-5 0,971632 -0,069868 -0,156661 -0,203061 1,06-10-10

10-3 0,970672 -0,069799 -0,156506 -0,202860 1,011-10-6

1,836-10-3 0,969862 -0,069741 -0,156375 -0,202691 3,406-10-6

1,2-10-2 0,960121 -0,069041 -0,154805 -0,200655 1,427-10-4

1,7-10-2 0,955400 -0,068701 -0,154044 -0,199668 2,835-10-4

10-2 0,962022 -0,069177 -0,155111 -0,201052 9,947-10-5

1,55-Ю1 0,841249 -0,060493 -0,135639 -0,175812 0,018

10-1 0,883311 -0,063517 -0,142420 -0,184603 8,386-10-3

ставляют: ЦЬ0г} = 2,0880; ЦЬ1г} = 141,0815; ЦЬ2г} = 10,1449; t{Ь3г} Г= 22,7472; ЦЬ4г} = 29,4845. Модули значений ^критерия Стьюдента регуляризо-ванных параметров Ъ.г превышают критическое значение ^критерия со степенью свободы V = 11 на уровне значимости a = 0,01 - ^0,99;11) = 2,72. Для свободного члена регуляризованной модели модуль расчетного значения ^критерия Стьюдента превышает критическое значение при уровне значимости а = 0,05 (!ЧЬ0г}| = 2,0880 > ^0,95;11) = 1,7959). Таким образом, регуляри-зованное значение оценки свободного члена, равное Ьг0 = 0,081205 значимо на уровне а = 0,05. Стандартная ошибка оценки модели (18) составляет 0,00955; стандартная ошибка оценки свободного члена - 0,038892. Статистика Дарби-на-Уотсона DW=2,019 и сериальная корреляция остатков рсог= -0,091273, подтверждают высокую степень адекватности регуляризованной модели (18) результатам эксперимента.

Доверительные интервалы для истинных значений параметров Ъ. множественной регрессионной модели в матричной форме имеют вид [15]:

Ъ] - г а( - т -1)-^ 52 ((О)-1) < < Ъ] + * а ( ( - т -1 )■ ^((Р)-')", ] = 1,..., т

1

где: г а (( -т -1) - квантиль распределения

Стьюден та порядка (1 - а/2) с (Ы - т - 1) степенями свободы; 2 ) ) - оценка дисперсии ошибок наблюдений (ост аточная дисперсия);

(( ^) ) - диагональный элемент корреляционной матрицы; N - число наблюдений (строк матрицы планирования); т - число факторов модели; - уровень значимости.

Учитывая, что корень квадратный из дисперсии есть стандартные отклонения оценок

параметров регрессии Ъ. от истинных значений Ъ, т.е. стандартные ошибки определения параметров регрессии Ъ/, то доверительный интервал упрощается к виду:

Ъ ± 5 {Ъ }■ - т -1), (19)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

где: 5 {б.} - стандартные ошибки отклонения МНК-оценок регрессии Ъ. от истинных значений Ъ. ; г а (( - т -1) - квантиль распределения

1 2

Стьюдента порядка (1 - а/2) с (Ы - т - 1) степенями свободы; N - число строк матрицы планирования; т - число параметров модели.

Вероятностным калькулятором системы Statistica при доверительной вероятности р = 1 - а = 0,95 (а = 0,05) определен квантиль распределения Стьюдента: ^975(11) = 2,200985.

Доверительные интервалы (95%-ные) для истинных значений параметров регрессии Ь], построенные на основании МНК-оценок Ъ.МНК в соответствии с (19) имеют вид:

• для Ь0:

-0,080788 ± 2,200985■ 0,0333 = (-0,154081;-0,007495) ;

• для Ь1:

0,971642 ± 2,200985 ■ 0,005898 = (0,958661; 0,984623);

• для Ь2:

-0,069869 ±2,200985■ 0,005898 = (-0,082851;-0,056888);

• для Ь3:

-0,156662 ±2,200985 ^0,005898 = (-0,169643; -0,143681);

• для Ь4:

-0,203063 ± 2,200985 ■ 0,005898 = (-0,216044; -0,190082).

95%-ные доверительные интервалы для регуляризованных коэффициентов регрессии определялись в соответствии с формулой (19) с учетом того, что уровни стандартных ошибок отклонения регуляризированных оценок регрессии от истинных значений, оцененные в Statistica составляют: S{b0г} = 0,038896; S{Ь1г} = S{b2г} = S{b3г} = S{b4г} = 0,0068807. г г г

Доверительные интервалы для истинных значений параметров регрессии, построенные на основании регуляризованных оценок Ъ,г, принимают вид:

• для Ь0(г):

-0,081206 ± 2,200985 ■ 0,038896 = (-0,166815; 0,004403);

• для Ь1(г):

0,971509± 2,200985 ■ 006887 = (0,956351;0,986667);

• для Ь2 (г):

-0,069860 ±2,200985 ■ 0,006887 = (-0,085018;-0,054702);

• для Ь3 (г):

-0,156641 ±2,200985 ^0,006887 = (-0,171799; -0,141483);

• для Ь4(г):

-0,203035 ± 2,200985 ■ 0,006887 = (-0,218193; -0,187877).

Область 95%-х доверительных интервалов для истинных оценок параметров модели, построенных на основе регуляризованных оценок коэффициентов регрессии Ъ^ пересекается с областью 95%-х доверительных интервалов, построенных для МНК-оценок коэффициентов, т.е. области доверительных интервалов являются смещенными, как и регуляризованные оценки параметров модели. Регуляризованные оценки являются значимыми, т.к. принадлежат 95%-м доверительным интервалам, построенным для значений этих коэффициентов.

ВЫВОДЫ

Обобщая приведенные выше результаты исследований, можно сделать вывод о том, что для идентифицированной по методу наименьших квадратов экспоненциальной модели снижения концентрации фенольных соединений в водной среде под действием физико-химических факторов проведена регуляризация, направленная на стабилизацию неустойчивых к ошибкам, ко-

эффициентов модели. Регуляризованные оценки параметров модели получены методом гребневой регрессии с использованием приемлемого значения параметра регуляризации, выбранного способом, предложенным иностранными специалистами в области решения некорректных задач.

Полученная регуляризованная модель, устанавливающая зависимость степени разложения фенольных соединений в водной среде от параметров процесса (начальной концентрации фенольного соединения, концентрации перекиси водорода, концентрации хлорида железа (III), времени ультрафиолетового воздействия на систему) является статистически значимой и обладает лучшими прогнозными свойствами, чем исходная модель, идентифицированная по методу наименьших квадратов. Таким образом, регуляризованная модель фотохимического разложения фенольных соединений может давать более устойчивые прогнозные значения уровней содержания фенольных соединений в промышленных сточных водах на этапах планирования и проведения водоочистных мероприятий.

СПИСОК ЛИТЕРАТУРЫ

Кармазинов, Ф.В., Костюченко, С.В., Кудрявцев, Н.Н., Храменков, С.В. Ультрафиолетовые технологии в современном мире . - Долгопрудный, Издательский Дом «Интеллект», 2012. - 392 с.

Соколов, Э.М., Шейнкман, Л.Э., Дергунов, Д.В. Исследование снижения концентрации фенольных

соединении в водных средах с использованием математического моделирования // Вестник Южного научного центра РАН. - 2013. - Т. 9, №2. - С. 23 - 31.

3. Марков, Ю.Г., Маркова, И.В. Математические модели химических реакций. - СПб.: Издательство «Лань», 2013. - 192 с.

4. Тихонов, А.Н., Уфимцев, М.В. Статистическая обработка результатов экспериментов . - М.: Издательство МГУ, 1988. - 174 с.

5. Тихонов, А.Н., Арсенин, В.Я. Методы решения некорректных задач. - М.: Наука, 1979. - 285 с.

6. Ермаков, С.М., Жиглявский, А.А. Математическая теория оптимального эксперимента. - М.: Наука, 1987. - 320 с.

7. Вучков, И., Бояджиева, Л., Солаков, Е. Прикладной линейный регрессионный анализ. - М.: Финансы и статистика, 1987. - 240 с.

8. Эммануэль, Н.М., Кнорре, Д.Г. Курс химической кинетики. - М.: Высшая школа, 1984. - 463 с.

9. Тихонов, А.Н. Решение некорректно поставленных задач и метод регуляризации //Доклады АН СССР. - 1963. - Т. 151, №3. - С. 501 - 504. Тихонов, А.Н. О регуляризации некорректно поставленных задач // Доклады АН СССР. - 1963. - Т. 153, №1. - С. 45 - 52.

Дрейпер, Н., Смит, Г. Прикладной регрессионный анализ. - М.: Издательский дом «Вильямс», 2007. - 912 с.

12. Елисеева, И.И. Эконометрика. - М.: Издательство Юрайт, 2014. - 449 с.

13. Hoerl, A., Kennard, R. Ridge regression: biased estimation for nonorthogonal problems// Technometrics. 1970. №12. - Р. 55 - 67.

14. Ватульян, А.О., Беляк, О.А., Сухов, Д.Ю., Явруян, О.В. Обратные и некорректные задачи. - Ростов-на-Дону, Издательство Южного федерального университета, 2011. - 232 с.

15. Афифи, А., Эйзен, С. Статистический анализ. Подход с использованием ЭВМ. - М.: Мир, 1982. - 488 с.

10.

11.

APPLICATION OF REGULARIZATION TO THE IDENTIFICATION OF THE MATHEMATICAL MODEL OF THE DEGRADATION OF PHENOLIC COMPOUNDS IN INDUSTRIAL WASTEWATER TECHNOLOGY ADVANCED OXIDATION PROCESSES

© 2015 L.E. Sheinkman, D.V. Dergunov, L.V. Kotlerevskaya, N.A. Antonenko

Tula State University

For effective management of wastewater treatment process industrial enterprises of phenolic compounds on the basis of advanced oxidation processes proposed exponential model to reduce the concentration ofphenolic compounds (for example, Bisphenol-A) under the action ofphysical and chemical factors (UV radiation, X = 365 nm, H2O2, Fe3+). Model identified in the Statistica software environments and MathCad based on the method of least squares and is statistically significant results of the experiment carried out on the basis of optimal planning. For stabilization of unstable parameters of the model, the method of regularization A.N. Tikhonov. The resulting regularized model establishing the degree of photochemical degradation of phenolic compounds in the aquatic environment of the process parameters is statistically significant and has the best forward-looking features than the original relationship, identified by the method of least squares. The statistical significance of a regularized model was determined using Fisher's F-test, t-Student's t test and 95% confidence intervals for the regularized model parameters. The coefficient of determination, R2 = 0,9995, shows that the variation of physical and chemical factors in the application of regularization to explain 99,95% of the variation of concentration ofphenolic compounds (BPA). The significance of the coefficient of determination is confirmed with 99% probability by the Fisher test. Model photochemical decomposition of phenolic compounds in an aqueous medium, obtained by applying the regularization method may provide more stable levels of predicted values of phenolic compounds in industrial waste water.

Keywords: Regularization, incorrect problems, modeling, phenol, waste water, treatment, advanced oxidation processes.

Leonid Sheinkman, Doctor of Technical Sciences, Professor at the Aerology, Labor Protection and the Environment Department. E-mail: eliard@yandex.ru DmitriyDergunov, Candidate ofTechnical Sciences, Engineer. E-mail: dmitrov83@mail.ru

Lyudmila Kotlerevskaya, Candidate of Technical Sciences, Associate Professor. E-mail: eliard@yandex.ru Natalya Antonenko, Graduate Student. E-mail: eliard@yandex.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.