Научная статья на тему 'ИССЛЕДОВАНИЕ ВЛИЯНИЯ СЛУЧАЙНОГО ФАКТОРА ПОГРЕШНОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ ИЗМЕРЕНИЙ НА РЕЗУЛЬТАТ МОДЕЛИРОВАНИЯ ПРОЦЕССА БИОДЕГРАДАЦИИ НИКОТИНА'

ИССЛЕДОВАНИЕ ВЛИЯНИЯ СЛУЧАЙНОГО ФАКТОРА ПОГРЕШНОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ ИЗМЕРЕНИЙ НА РЕЗУЛЬТАТ МОДЕЛИРОВАНИЯ ПРОЦЕССА БИОДЕГРАДАЦИИ НИКОТИНА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
45
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / ОПТИМИЗАЦИЯ / БИОРАЗЛОЖЕНИЕ НИКОТИНА / ИНГИБИРОВАНИЕ / ПОВЕРХНОСТЬ ОТКЛИКА / ПОГРЕШНОСТЬ ЭКСПЕРИМЕНТА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кожухарь Олеся Юрьевна, Скичко Алексей Сергеевич

В статье рассмотрено влияние случайного фактора погрешности эксперимента на вид поверхностей отклика при решении задачи оптимизации на примере процесса биодеградации никотина штаммом бактерий Ochrobactrum sp. SJY1. Изучена взаимосвязь случайного искажения экспериментальных данных и поиска оптимального набора констант. Проводится анализ работы оптимизационных алгоритмов на полученных поверхностях отклика при внесении погрешностей эксперимента из области доверительного интервала.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кожухарь Олеся Юрьевна, Скичко Алексей Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

RESEARCH OF THE INFLUENCE OF THE RANDOM FACTOR OF EXPERIMENTAL MEASUREMENT ERROR ON THE MODELING RESULT OF NICOTINE BIODEGRADATION PROCESS

The article discusses the influence of the random factor of experimental error on the appearance of response surfaces when solving the optimization problem using the process of nicotine biodegradation by the bacterial strain Ochrobactrum sp. SJY1 as an example. The relationship between random distortion of experimental data and the search for the optimal set of constants is studied. We analyze the performance of optimization algorithms on the obtained response surfaces when experimental errors are introduced from the confidence interval region.

Текст научной работы на тему «ИССЛЕДОВАНИЕ ВЛИЯНИЯ СЛУЧАЙНОГО ФАКТОРА ПОГРЕШНОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ ИЗМЕРЕНИЙ НА РЕЗУЛЬТАТ МОДЕЛИРОВАНИЯ ПРОЦЕССА БИОДЕГРАДАЦИИ НИКОТИНА»

УДК 004.942:579.695 Кожухарь О.Ю., Скичко А.С.

ИССЛЕДОВАНИЕ ВЛИЯНИЯ СЛУЧАЙНОГО ФАКТОРА ПОГРЕШНОСТИ ЭКСПЕРИМЕНТАЛЬНЫХ ИЗМЕРЕНИЙ НА РЕЗУЛЬТАТ МОДЕЛИРОВАНИЯ ПРОЦЕССА БИОДЕГРАДАЦИИ НИКОТИНА

Кожухарь Олеся Юрьевна - магистрант 2-го года обучения кафедры кибернетики химико-технологических процессов; olesyakozhukhar@yandex.ru.

Скичко Алексей Сергеевич - кандидат химических наук, доцент кафедры кибернетики химико-технологических процессов;

ФГБОУ ВО «Российский химико-технологический университет им. Д.И. Менделеева», Россия, Москва, 125047, Миусская площадь, дом 9.

В статье рассмотрено влияние случайного фактора погрешности эксперимента на вид поверхностей отклика при решении задачи оптимизации на примере процесса биодеградации никотина штаммом бактерий Ochrobactrum sp. SJY1. Изучена взаимосвязь случайного искажения экспериментальных данных и поиска оптимального набора констант. Проводится анализ работы оптимизационных алгоритмов на полученных поверхностях отклика при внесении погрешностей эксперимента из области доверительного интервала.

Ключевые слова: математическая модель, оптимизация, биоразложение никотина, ингибирование, поверхность отклика, погрешность эксперимента.

RESEARCH OF THE INFLUENCE OF THE RANDOM FACTOR OF EXPERIMENTAL MEASUREMENT ERROR ON THE MODELING RESULT OF NICOTINE BIODEGRADATION PROCESS

Kozhukhar O.Yu.1, Skichko A.S.1

1 D. Mendeleev University of Chemical Technology of Russia, Moscow, Russian Federation

The article discusses the influence of the random factor of experimental error on the appearance of response surfaces when solving the optimization problem using the process of nicotine biodegradation by the bacterial strain Ochrobactrum sp. SJY1 as an example. The relationship between random distortion of experimental data and the search for the optimal set of constants is studied. We analyze the performance of optimization algorithms on the obtained response surfaces when experimental errors are introduced from the confidence interval region. Keywords: mathematical model, optimization, nicotine biodegradation, inhibition, response surface, experimental error.

Введение

Современная биотехнологии основывается на последних достижениях науки разных отраслей, в том числе микробиологии и биоочистки, объектом исследования которых является живая система. Воспроизводимость таких процессов зачастую ниже, чем в химической технологии, вследствие невозможности задания тех же условий. Так, в научной периодике встречаются экспериментальные работы, представляющие единичный эксперимент без проведения повторяющихся опытов. В этом случае оценить степень достоверности экспериментальных данных без учета влияния случайного фактора затруднительно. Поэтому становится актуальной задача исследования возможных различий оптимальных констант математической модели процесса, получаемых при внесении случайного фактора в экспериментальные данные.

С целью выявления общих закономерностей и взаимосвязей в цепочке «Случайный экспериментальный фактор ^ поверхность отклика ^ значение оптимальных констант ^ прогноз по модели», а также наглядной их демонстрации, предлагается проведение вычислительных экспериментов на примере достаточно простой

модели процесса биоразложения никотина штаммом ОЛгоЬасйит sp. SJY1 из [1].

Одной из важных составляющих поставленной задачи является исследование влияния случайного фактора при проведении экспериментальных исследований на вид поверхности отклика при поиске неизвестных констант модели, поскольку непосредственно от вида поверхности отклика может зависеть работа оптимизационных алгоритмов и конечный результат, то есть значения констант, которые, в свою очередь, могут влиять на качественные и количественные характеристики при использовании модели для прогнозирования протекания процесса.

Научная новизна данного исследования заключается в том, что ранее подобных вычислительных экспериментов не проводилось. Поскольку возможны различные прогнозы моделирования в случае воздействия случайного фактора, цепочка «Случайный экспериментальный фактор ^ поверхность отклика ^ значение констант ^ прогноз по модели» исследовалась множество раз с целью выявления возможных сложностей на разных ее этапах.

Математическая модель процесса биодеградации никотиновой пыли в водной среде

В качестве объекта исследования рассматривается процесс разложения никотиновой пыли в водной среде за счёт бактерий рода Ochrobactrum [1]. Анализ экспериментальных данных из [1] показывает, что наличие никотина практически ингибирует рост клеток, хотя, в конечном счёте, продукты разложения никотина используются самими клетками в качестве субстрата. Так процесс биодеградации никотиновой пыли проходит через образование большого количества промежуточных веществ (условно обозначенные за 2), которые накапливаются в среде до момента, когда ингибирующее действие никотина на клетки достаточно ослабнет в связи с уменьшением его концентрации. Процессы можно разделить во времени и представить в виде отдельных подсистем [2]. Интерес для дальнейшего исследования представляет первая подсистема, математическая модель которой состоит из следующих уравнений:

- уравнение изменения концентрации никотина в среде:

*** /14

- = --V, (1)

- уравнение изменения концентрации Z-

метаболитов:

- = -V, (2)

- уравнение для расчёта удельной скорости разложения никотина:

¡1 = (3)

где s - концентрация субстрата (никотина), мг/мл;

¡л - удельная скорость разложения никотина,

1/ч;

х - концентрация биомассы, мг/мл;

2 - концентрация 2-метаболитов, мг/мл;

Ло - максимальная удельная скорость данной стадии, 1/ч;

К - константа насыщения, мг/мл;

К] - константа субстратного ингибирования, мл/мг.

Таким образом математическая модель содержит три изменяемые величины и три неизвестные константы ¡л0, Кя, К/, значение которых требуется оценить по имеющимся экспериментальным данным.

Постановка оптимизационной задачи поиска констант модели

Данная оптимизационная задача является трёхпараметрической. С целью подробного анализа среза поверхностей отклика для двух различных констант, задача была сведена к двумерной на основании предварительных оценок константы ¡¡о. Сравниваются два критерия оптимизации -линейный Я1 и квадратичный Я2 критерии рассогласования экспериментальных и расчетных данных:

= (5)

где индекс «э» соответствует

экспериментальным данным из [1],

индекс «р» - результатам вычислительного эксперимента.

Постановка оптимизационной задачи поиска констант модели записывается традиционно для обоих критериев: R -> min.

Исследование поверхности отклика

Исследование влияния случайного фактора погрешности экспериментальных измерений на вид поверхности отклика заключается в проведении множества вычислительных экспериментов, в ходе которых в экспериментальные данные субстрата случайным образом вносились различные отклонения из области доверительного интервала. Экспериментальные данные из [1] после статистической обработки принимались за некий усредненный базовый эксперимент. И доверительный интервал определялся как среднеквадратичное отклонение от него. Сравнивались три вида отклонений: систематические отклонения в разные стороны и случайный разброс грубых ошибок из области доверительного интервала. Проводимые вычислительные

эксперименты соответствуют оптимизации процесса биодеградации никотина в условиях случайного искажения экспериментальных данных от имеющихся усреднённых значений.

Искажение экспериментальных данных влияет на вид поверхности отклика, от которого зависит работа оптимизационных алгоритмов и конечный результат поиска констант. Пример работы метода поочередного изменения переменных [3] представлен на рис. 1. Под пунктом (а) представлен срез поверхности отклика, полученный при использовании линейного критерия рассогласования (4), под пунктом (б) - результат использования квадратичного критерия (5). На графиках маркеры оранжевого цвета описывают сетку решений однопараметрической оптимизации по Ks при постоянных значениях Ki, маркеры синего цвета -обратную ситуацию. Светлым оттенком отмечены точки локальных экстремумов, в которых алгоритм может «застревать». Единичному красному маркеру «•» соответствует глобальных экстремум для данного эксперимента. На графиках представлены четыре маршрута движения алгоритма, отмеченные штрихом и мелкими круглыми точками, из разных начальных значений. Штрих - линия движения изменения одной переменной (KS) при стабилизации другой (Ki) во время работы алгоритма метода поочередного изменения переменных; мелкие круглые точки - изменение переменной Ki при стабилизации константы KS на первой итерации алгоритма.

(а)

\

1,7 1,5

1,3 ' 1,1 0,9 0,7

0,3

'I.1

(б)

1 I 1 '.

'■»¿Ч

Оптимум 1,21: 1,47

V

%

■ \ ■......А, V

4 I. 3 V

Ч. I, 1

1,07 1' 1,27 1,37 1,47 1,57 : о/ 1,77 1,87 1,97 2,07 2,17

К,

0,8 0,3 1 1,1 1,2 1,3 1.5 1,6 1,7 1.В

К,

Рис.1 Демонстрация алгоритма работы метода поочередного изменения переменных на разных поверхностях отклика: а - результат использования линейного критерия рассогласования, б - результат использования квадратичного критерия

На рис. 2 и 3 представлены срезы поверхностей отклика для вычислительных экспериментов с экспериментальными данными, соответствующими граничным значениям доверительного интервала. На рис. 2 - по нижней границе доверительного интервала; на рис. 3 - по верхней границе. Данные графики демонстрируют поверхности отклика для максимального расхождения экспериментальных данных от усредненного базового значения.

Случайный разброс отклонений

экспериментальных измерений разных знаков из области доверительного интервала оказало наименьшее влияние на вид поверхности отклика. В таком случае разброс оптимальных значений гораздо меньше, чем для систематических отклонений. Однако для процессов биотехнологии более характерно наличие именно систематических отклонений, которые в случае наличия грубых ошибок могут давать непредсказуемые результаты моделирования.

На представленных поверхностях отклика (рис. 1 -3) видно, что использование линейного критерия рассогласования приводит к более сложной поверхности отклика с «зоной нечувствительности» в виде оврага, резкими скачками изменения параметров и локальными экстремумами. А квадратичный критерий дает простую поверхность отклика с ярко выраженным глобальным экстремумом.

На основании более 100 проведенных вычислительных экспериментов, процент сложных поверхностей отклика для варианта использования линейного критерия рассогласования составляет 91.43%, а для квадратичного критерия - 2.86%. Следовательно, для данной модели эффективнее будет использование квадратичного критерия

рассогласования, так как он оказался более устойчив к случайным разбросам экспериментальных данных относительно средних значений.

О 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6 1,Е Константа субстратного ингибирования

],6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 Константа субстратного ингибирования

Рис. 2 Срезы поверхностей отклика для вычислительного эксперимента с погрешностью измерений по нижней границе доверительного интервала: а - результат использования линейного критерия рассогласования, б - результат использования квадратичного критерия

2,7 2,5 2,3 2,1 1,9 1 1,7 1,5 1,3 1,1 0,9 0,7 0,5 0,3 ОД

(а)

Оптимум 4 1,84; 1,75

2,7 2,5 2,3 2Д 1,9 1 1,7 1,5 1,3 1Д 0,9 0,7 0,5 0,3 ОД

(б)

Оптимум"

1,73:1,97

1,55 1,65 1,75 1,85 1,95 Константа субстратного ингибирования

1,6 1,7 1,8 1,9 2

Константа субстратного ингибирования

Рис. 3 Срезы поверхностей отклика для вычислительного эксперимента с погрешностью измерений по верхней границе доверительного интервала: а - результат использования линейного критерия рассогласования, б - результат использования квадратичного критерия

Таким образом, можно сделать вывод, что использование линейного критерия рассогласования в любом случае приводит к усложнению поверхности отклика и работе оптимизационного алгоритма; использование квадратичного критерия устраняет эту проблему практически во всех случаях. Следовательно, при внимательной предварительной обработке экспериментальных данных и правильном подборе критерия оптимизации можно минимизировать влияние случайного фактора погрешности

экспериментальных измерений.

Анализ кинетических кривых процесса

Для оценки возможных результатов моделирования процесса в зависимости от точности

экспериментальных измерений проводилось сравнение кинетических кривых, полученных в ходе вычислительных экспериментов.

На рис. 4 представлены графики изменения концентрации никотина (субстрата) во времени, соответственно. Кривые штрихом соответствуют граничным значениям экспериментальных данных из доверительного интервала, следовательно, данные кривые будут создавать «коридор» значений, в который могут попадать другие кривые, соответствующие вычислительным экспериментам со случайным разбросом погрешности измерений из доверительного интервала. Также данные кривые наглядно демонстрируют, насколько может различаться результат моделирования для процессов с неточными экспериментальные данными.

4 < (а)

3,5 \

3

ч 2 \\Ч

* ч\\

Г с г- з 4 \ \ V 4 \ N

I га Ё 1,5 - \ ч\\

1 \ \ \

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 1 < 1 \ \ \ \ Ч л> \ \ \ \ 4 V 4 Л \

0,5 \ V \ V ч \ * \ ч \\ \> , \

0 2 4 6 8 10 12 14

10 и

Рис.4 Кинетические кривые разложения субстрата для различных вычислительных экспериментов: единичные точки соответствуют экспериментальным данным из [1], сплошная линия - базовому эксперименту, штрих - нижняя граница доверительного интервала, длинный штрих - верхняя граница доверительного интервала; а - результат оптимизации линейного критерия, б - квадратичного критерия

Расхождение кинетических кривых разложения никотина во времени для вычислительного эксперимента с погрешностью экспериментальных измерений на границах доверительного интервала из [1] составляет: для субстрата, начальная концентрация в среде которого равна 1 мг/мл - от 68 до 90%; для субстрата, начальная концентрация которого 2 мг/мл - 77-94%; и для субстрата с начальной концентрацией в среде 4 мг/мл - 90-98%. Данный результат выше среднего, следовательно, случайный фактор погрешности экспериментальных измерений оказывает значительное влияние на вид

кинетических кривых, которые сохраняют свою тенденцию, но отходят от среднего результата, и на важный технический параметр - время доведения концентрации никотина до ПДК, расхождение которого может варьироваться от 1 до 3 часов.

Кинетические кривые деградации никотина для других вычислительных экспериментов

соответствуют сделанным ранее выводам. И при минимальном начальном значении субстрата случайный фактор в меньшей степени влияет на моделирование.

(а) 1,5 * (б)

2,г 2,1 А А 13 1Д - А А i 4 i. * * * *

1,9 и ± А 1,9 V

з: =

1 v ■ ♦ ♦ * ♦ i V ♦ *

га 2 * *•

х 1,5 га = 1,5 га * *

8 v * Е ♦

X £

ас 1,1 ■ 1 « . . ¡В 1,1 "

0,9 - 0,9 ■

0,7 ■ 0.1

0,5 - ■ оз

0,9 1 и и 1,3 1,4 1,5 1,5 1,7 1,8 1,9 1 1Д и 1,0 1,6 1,7 1,8 1,9 }

Кднстзнтз субстратного инси^.флгыния Киш.|лг[л су&страшшиингибиривании

Рис.5 График разброса оптимального набора значений констант для различных вычислительных экспериментов: а - результат оптимизации линейного критерия, б - квадратичного критерия

График разброса оптимального набора констант для разных вычислительных экспериментов представлен на рис. 5. На графиках маркерами «■» обозначены оптимумы для вычислительных экспериментов с отклонениями экспериментальных измерений в меньшую сторону, маркеры «▲» соответствуют отклонениям в большую сторону, маркеры «♦» характеризуют случайные отклонения из доверительного интервала. Маркеры «■» и «▲» большего размера соответствуют значениям границы доверительного интервала. Символ «•» - оптимум для базового эксперимента, принятого за эталон.

На полученных графиках видно, что наличие грубых ошибок приводит к разбросу значений в области оптимума, а вычислительные эксперименты с отклонениями только в одну сторону расположены дальше от оптимумов и только в верхней (отклонения в большую сторону) либо в нижней (отклонения в меньшую сторону) области.

Список литературы

1. Yu H., Tang H., Zhu X., Li Y., Xu P. Molecular mechanism of nicotine degradation by a newly isolated strain, Ochrobactrum sp. strain SJY1 // Applied and environmental microbiology. - 2015. - V. 81, №1. - P. 272-281.

2. Скичко А.С., Кожухарь О.Ю. Анализ погрешности результатов поиска констант модели процесса биоразложения никотина // Вестник Международной академии системных исследований. Информатика, экология, экономика. - 2020. - Т. 22. -С. 26-33.

3. Дударов С. П. Использование численных методов в табличном процессоре Microsoft Excel. Лабораторный практикум: учеб. пособие. — М.: РХТУ им. Д.И. Менделеева, 2013. — 116 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.