Научная статья на тему 'Нейросетевые модели химических углеводородных систем'

Нейросетевые модели химических углеводородных систем Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
157
44
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Замятин Николай Владимирович, Пустовалов Дмитрий Станиславович, Шадрин Ярослав Петрович

Рассмотрены углеводородные системы типа бензинов. Для построения моделей таких химических систем используются регрессионные уравнения. Для повышения адекватности при синтезе моделей применены нейронные сети, связывающие параметры бензинов с их составом.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Замятин Николай Владимирович, Пустовалов Дмитрий Станиславович, Шадрин Ярослав Петрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нейросетевые модели химических углеводородных систем»

УДК 543.544.85:665.35

Н.В. Замятин, Д.С. Пустовалов, Я.П. Шадрин

Нейросетевые модели химических углеводородных систем

Рассмотрены углеводородные системы типа бензинов. Для построения моделей таких химических систем используются регрессионные уравнения. Для повышения адекватности при синтезе моделей применены нейронные сети, связывающие параметры бензинов с их составом.

Большинство изучаемых химических объектов относится к классу сложных систем. Исследование таких систем заключается в установлении зависимостей между входными параметрами (факторами) и выходными параметрами — показателями качества функционирования системы, и определении уровней факторов, оптимизирующих выходные параметры системы.

Существует два подхода к решению задачи идентификации математической модели химической системы: детерминистский и стохастический.

Детерминистский подход получил распространение в последнее время в связи с появлением мощной вычислительной техники и решением квантово-механических уравнений для структур молекул. Однако детерминистские модели получены пока только для ограниченного числа простых углеводородов, где связываются структуры молекул и их свойства. Сложные структуры углеводородов, ввиду трудности всестороннего исследования механизмов явления, пока невозможно полностью описать математически.

В условиях неполного знания механизма физико-механических явлений задачи идентификации и оптимизации, то есть отыскания оптимального состава для получения определенных свойств смесей, решаются посредством экспериментально-статистических методов. Получили развитие новые методы, позволяющие модернизировать многомерные нелинейные системы: метод наименьших дробных квадратов, дающий возможность выделить скрытые переменные, которые несут большую факторную нагрузку, и, следовательно, их количество значительно меньше; нейронные сети, позволяющие не иметь априорной информации о виде поверхности отклика и хорошо работающие с нелинейными связями.

Для представления химической системы в условиях стохастического подхода наиболее подходящей моделью является «черный ящик» (рис. 1).

Компоненты х.

Г

Химическая система

Параметры у

У

Рис. 1. Химическая система

Одним из важных и неформализованных этапов при построении моделей является выбор математического аппарата для преобразования и интерпретации априорной информации об изучаемой химической системе и обработка полученных данных. Математическое описание (идентификация) химических систем должно основываться на достаточно глубоких знаниях системы и свойств, входящих в нее элементов, которых может насчитываться несколько тысяч, а также процессов взаимодействия между ними. Соответственно должны быть эффективно и хорошо спланированы эксперименты для проверки гипотез относительно математической модели и определения ее коэффициентов.

Вся совокупность параметров, определяющих модели состава и свойств веществ, может быть разбита на следующие основные группы:

- входные величины

X = (^, ,..., ),

при контроле веществ (топлив) — это концентрации компонентов или углеводородов;

- выходные величины или отклики исследуемой системы

г = {у1,у2,-,уа)>

это могут быть параметры свойств системы углеводородов (октановое число, плотность, давление насыщенных паров и т.д.);

- контролируемые, но не управляемые параметры 2 - (г1,г2,...,гп);

- неконтролируемые параметры или возмущающие воздействия

Если все параметры являются контролируемыми, то это пассивный эксперимент, обычно предполагающий только регистрацию опытных данных.

В этом случае взаимодействие между составляющими химической системы отсутствует, а свойства системы удовлетворяют условиям аддитивности или близки к нему. Для идентификации такой модели можно применять линейный регрессионный анализ.

Если при проведении эксперимента имеет место сочетание управляемых и контролируемых параметров - это активно-пассивный эксперимент. В исследовании процессов в химических системах широкое распространение получил активный эксперимент, основанный на управлении протекающим процессом путем воздействия различными веществами либо подавлении определенных процессов или веществ. При выполнении активного эксперимента управляемые параметры химических систем изменяются в заданных пределах, а все неуправляемые и неконтролируемые параметры представляются в виде эквивалентного шума .Р, отнесенного к выходу системы.

Зависимость между входными и выходными переменными может быть следующая:

У = ф(х,0) + е,

где 9 = (91,02,...,0л) — неизвестные параметры, которые необходимо определить по результатам эксперимента. Координатное пространство х1,х2,...,хп представляет факторное пространство модели химической системы. Поверхность отклика в виде нелинейной поверхности позволяет найти оптимальное соотношение компонентов в смеси.

При синтезе моделей химических углеводородных систем серьезное внимание нужно уделять нелинейности моделей, что особенно актуально для совокупности углеводородов, между которыми возможны межмолекулярные взаимодействия, причем в различных источниках информации предполагается различный подход. Например, указывается, что условие аддитивности соблюдается для легких углеводородов, и, следовательно, с минимальной погрешностью можно использовать линейную регрессию. В то же время существует понятие «октановое число смешения» и приводятся значения октановых чисел для индивидуальных углеводородов и значение октанового числа смешения, что указывает на значительное отличие этих чисел соответственно нелинейностей при формировании модели.

В многомерном случае, так же как и в одномерном, имеется принципиальная возможность выбирать вид модели, наиболее подходящий для описания химической системы, в соответствии с поставленными целями. Эта принципиальная возможность основывается на том, что любая химическая система имеет сложную структуру. В качестве многомерной (многооткликовой) модели можно выбирать смесь углеводородов с различными одновременно определяемыми свойствами (октановое число, давление насыщенных паров, плотность, фракционный состав). Традиционную многомерную модель получают из одномерной простым увеличением числа откликов. В этом случае все выходные переменные описываются одинаковым числом регрессоров. Подобная модель в регрессионном анализе будет иметь вид

У = АХ + Е ,

где У — п-р матрица измерений р откликов системы; X — ит-матрица значения г регрессоров; А — г -р матрица неизвестных параметров; Е — п-р матрица случайных возмущений.

Оценки неизвестных параметров можно получить по методу наименьших квадратов

А = (XX)'1 ХУ .

Видно, что матрица оценок для А состоит из столбцов, каждый из которых представляет собой оценки параметров для своего отклика, полученные при применении МНК в соответствующей однооткликовой задаче. Это позволяет разложить задачу оценивания параметров на ряд однооткликовых задач.

Применение методов линеаризации данных, методов производных, использование весовых факторов, регрессий первого, второго, третьего порядков, соответствующих многомерных или даже одномерных методов для синтеза моделей веществ — все это позволяет предсказывать состав и свойства веществ.

Моделирование классическими методами требует обзорных обучающих процедур, в которых входы и выходы (ответы и цели) должны быть известны предварительно. Для обучающих систем используется различие между предсказываемыми выходами и действительным ответом, чтобы корректировать его параметры для достижения лучшего представления. Обучение продолжается до тех пор, пока ответы от всех переменных окажутся внутри адекватных границ допусков, или до тех пор, пока итерационная квота или число обучающих попыток не будут достигнуты.

При определении таких параметров углеводородных систем (бензинов), как октановых чисел, в качестве обучающих процедур необходимо использовать методы измерения октановых чисел.

Существует ряд методов определения октанового числа, из которых моторный и исследовательский методы поддерживаются ГОСТом (АвТМ), так как являются прямыми методами измерения октанового числа. В исследовательском методе октановое число определяется при оборотах двигателя (600 об/мин), моделирующих легкий режим работы при низкой эксплуатационной нагрузке. Моторный метод — это определение октанового числа при более высоких оборотах двигателя (900 об/мин), моделирующих тяжелые дорожные условия при большой нагрузке. Для реализации этих методов необходимы громоздкое оборудование и большой расход пробы (до 1 л на анализ). Поэтому целесообразно применять хроматогра-фические методы, позволяющие заменить моторные методы. Для этого необходимо установить связь между параметрами, полученными на гостированных методах, и хроматограм-мами набора исследуемых бензинов й углеводородных смесей (процедура калибровки).

В первых версиях автоматизированной системы контроля параметров бензина использовалась регрессионная модель углеводородной смеси. В качестве первичного преобразователя для получения электрического сигнала использовался хроматограф марки 3700. Условия хроматографического анализа приведены в табл. 1.

Таблица 1

Условия проведения хроматографического анализа

Условия анализа Параметры

1. Тип колонки Капиллярная

2. Длина колонки 50 -100 м

3. Диаметр колонки 0,25 мм

4. Температура термостата, начальная 80 °С

5. Температура испарителя 130 °С

6. Газ-носитель Гелий

7. Расход газа-носителя 1,2 мл/мин

8. Объем пробы 0,1 мкл

Фрагмент хроматограммы товарного бензина марки А- 76 (80) приведен на рис. 2.

Количественная обработка хроматограммы проводилась по известным алгоритмам [1], а идентификация осуществлялась алгоритмами, имеющими в основе индексы удерживания [2].

Для определения октановых чисел по моторному методу используется полученное линейное уравнение регрессии следующего вида:

ОЧ = 54,75 - 0,026 хг - 0,070 х2 -0,093 х3 - 0,4 х4 - 0,11 х5 - 0,053 хв - 0,462 х7 -- 0,01 х& + 0,6 х9 - 0,017 х10~ 0,12 хп - 0,263 х12 - 0,089 х13 - 0,075 х14 -

- 0,458 х15 - 0,1 х16 - 0,044*!7 - 0,031 х1Т - 0,0002 х19 - 0,383 х20 + 0,007 х21 -

- 0,09 х22 + 0,081 х23 - 0,134 х24 + 0,04 х25 + 0,168 х2в + 0,055 х27 + 0,037 х28,

где ОЧ — октановое число по моторному методу; х1...х28 — содержание соответствующих групп углеводородов, масс.%.

Индивидуальные углеводороды, входящие в состав бензина, разбиты на 28 групп методом автоматической классификации по близости температур кипения и значений октановых чисел.

Получение октановых чисел бензинов выполнялось для 30 обучающих образцов, из которых 6 контрольных образцов анализировались на рассматриваемой модели. Результаты определения октановых чисел на регрессионной модели приведены в табл. 2.

1 400 1 300 1 200 1 100 1 ООО

S? 800

g 700

% 600

500 400 300 200 100 0

Рис. 2. Хроматограмма бензина А-76 (80) (капиллярная колонка — сквалан)

Таблица 2

Результаты анализа контрольных образцов бензина А-76 (80)

Номер образца Октановые числа, ГОСТ Октановые числа модели Отклонение,%

1 77,6 78,5 1Д4

2 77,3 79,4 2,67

3 75,4 77,5 2,67

4 76,0 78,2 2,65

5 77,0 77 0

6 76,5 79 3,16

Нелинейные методы могут решать проблему построения моделей (калибровки) с меньшей приемлемой ошибкой. Появление нейронных сетей вызвало большой интерес и желание применять их для синтеза калибрационных моделей и в конечном итоге получать информацию о составе многокомпонентной смеси без ее разделения и знания параметров отдельных углеводородов. Нейронные сети способны моделировать параметры веществ, для того чтобы оценить концентрации компонентов неизвестных веществ [3].

Методы PCR (метод главных компонент) и PLC (метод дробных наименьших квадратов), основанные на многомерной линейной регрессии, широко используются для целей калибровки. Эти методы интересны для решения задач калибровки из-за их способностей выявлять скрытые переменные и тем самым уменьшать число факторов модели. При обработке многомерных данных, где приходится оперировать сотнями входных переменных и пространство размерностей очень велико, нейронная сеть становится громоздкой и неэффективной. Поэтому целесообразно совместное применение PCR или PLC и нейронной сети с целью выявления скрытых переменных в процессе предобработки данных для последующего моделирования химической системы.

Из основных видов нейронных сетей наиболее целесообразно для целей синтеза калибрационных моделей использовать сети прямого распространения со стратегией обучения обратного распространения ошибки. Выбор этого варианта представления сетей обусловлен в первую очередь их простотой и наглядностью. Применение метода градиентного спуска для снятия различия между текущим значением отклика и желательным позволяет достаточно просто проводить обучение. В качестве активационной функции предполагается использовать сигмоидальную функцию с пределами 0,1.

Передающая (активационная) функция формирует выход нейрона согласно выражению

\ / — 1 \ 1 + ехр(-а*)'

где а — коэффициент скорости обучения.

В случае многих входов (вектор х), выходов (вектор у) нейронов и слоев нейронной сети входные векторы взвешиваются, суммируются и затем преобразуются в соответствии с активационной функцией, чтобы сформировать выходной общий выходной вектор нейронной сети У.

;

■ «

1 ^ .....

1

I "f

■ ; 1

: 1 j|

1 -"--"Г 1 ti"

Wa. VT I\ ■ • ■ I"" " -

Время (сех)

При корректировке значений весовых функций последнего нейрона для данного набора входных переменных веса и смещения предыдущих нейронов также изменяются, чтобы уменьшить разницу между текущим значением отклика и желаемым и в соответствии с заданным значением ошибки. Сеть считается полностью обученной, если полученный отклик близок к желаемому значению. Таким образом, происходит обучение сети с учителем и построение калибрационной модели.

Для обучения нейронной сети необходимо выбрать входные нейроны, скрытые слои и выходные нейроны, число которых зависит от решаемых задач. При моделировании состава и свойств бензинов выбор метода преобразования информации и структуры нейронной сети определялся в первую очередь количеством входных переменных, количеством выходных откликов и необходимой точностью преобразования при моделировании.

Для построения нейросетевых калибровочных моделей бензинов также использовался хроматографический метод. Условия проведения хроматографического анализа приведены в табл. 3.

Таблица 3

Условия проведения хроматографического анализа

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Условия анализа Параметры

1. Тип колонки Капиллярная кварцевая

2. Длина колонки 50 м

3. Диаметр колонки 0,2 мм

4. Температура термостата, начальная 25 "С

5. Температура испарителя 150 "С

6. Газ-носитель Гелий

7. Расход газа-носителя 1,6 мл/мин

8. Объем пробы 0,1 мкл

Информативным носителем служила хроматограмма, в качестве входных переменных использовались площади пиков, соответствующих концентрациям компонентов. В качестве обучающего набора применялась выборка 40 различных видов бензинов, произведенных на нефтеперерабатывающих заводах (Омск, Ангарск, Ачинск), а также нефтеполимерные бензины и модифицированные бензины (Томск). Для каждого образца на хроматографе 3700 снималась хроматограмма и измерялись следующие параметры: октановое число, фракци-бнный состав, давление насыщенных паров, плотность, групповой состав. Пример результатов анализа для одной пробы бензина представлен в табл. 4.

Таблица 4

Результаты анализа пробы бензина А-76 (80).

Групповой состав, % Октановое число Фракционный состав, град Плотность, г/см3 Д.н.п., кПа

Аром, углев. 1,06 Норм. алк. 38,25 Изоалканы 0,07 Нафтены 27,5 Прочие 3,08 79,8 Тн. к. 42 Т 10 60 Т so 90 Т 90 137 Тк.к. 173 0,732 Н.к. 39,9 Н.к. 25,3 Н.к. 19,6 Н.к. 15,3

Основные принципы построения нейронной сети заключаются в том, чтобы установить связь между входными переменными в виде площадей пиков хроматограмм, определяющих концентрации углеводородов в бензинах, со свойствами бензинов в виде откликов модели, определяющих параметры бензинов. Из хроматограммы видно, что состав бензина определяется большим количеством пиков (компонентов в виде углеводородов). Обычно их количество лежит в пределах от 50 до 150 пиков. Нейронная сеть при таком количестве входных переменных окажется чрезвычайно громоздкой и практически неработоспособной из-за больших временных задержек (рис. 3).

Необходимо сократить число входных переменных, используя различные статистические приемы: наиболее целесообразно применить методы кластерного анализа для группировки углеводородов в кластеры по близости свойств. Процедура кластерного анализа позволила выявить 31 группу углеводородов. Следует отметить, что результаты практически совпали с работой [3], где разбиение проводилось субъективным методом.

Время

Рис. 3. Хроматограмма для контролируемого образца бензина А - 76 (80)

Для решения задачи моделирования многокомпонентной смеси бензина число выходных нейронов соответствует числу параметров, подлежащих измерениям (всего 5). Определение индивидуального состава углеводородов выполняется при решении задачи идентификации на соответствующей нейронной сети (рис. 4). Для обучения нейронной сети необходимо на ее входы подать скрытые переменные, полученные из результатов кластерного анализа или метода главных компонент. Количество переменных может добавляться или уменьшаться в зависимости от точности предсказания моделируемых параметров.

Входные параметры

Выходные параметры

Промежуточные слои

Выходной слой

Рис. 4. Структура нейронной сети для калибровочной модели бензина

Для принятия решения о количестве входов значения величин весов, соединяющие входы с высшими слоями, анализируются. Если веса, взаимодействующие с данным входом, очень маленькие, в дополнение к соответствующим переменным добавляются еще группы углеводородов, но при этом выполняется очередная процедура кластерного анализа с разбиением на число предыдущих кластеров плюс 1. Результаты исследований стандартной ошибки предсказания октанового числа в зависимости от числа слоев приведены в табл. 6.

Для проведения экспериментов по определению оптимального числа входов методом кластерного анализа определялись группы углеводородов, число которых составило от 10 до 30. Суммарные значения их \подавались на входы нейронной сети. Сначала выполнялось ее обучение, а затем вычислялась ошибка предсказания на контрольных смесях. Резльтаты показали, что существует насыщение, после которого увеличивать число групп не имеет смысла.

Аналогично выполнялись эксперименты по определению числа нейронов в скрытом

слое.

При выполнении процедур обучения возможно возникновение осцилляций и попадание в локальные минимумы. Во избежание этого к номеру текущего нейрона добавляется единица. Также возможно устранение осцилляции корректировкой скорости обучения нейронной сети.

Результаты исследования моделей, связывающих входные переменные в виде хроматог-рамм с выходными переменными в виде параметров бензинов, позволили получить адекватные модели в виде полносвязной нейронной сети с прямым распространением, параметры которой представлены в табл. 5. Результаты прогнозирования октановых чисел приведены в табл. 6.

При сравнении результатов моделирования бензинов, приведенных в табл. 2 и б, видно, что отклонение параметров на нейросетевых моделях бензинов меньше, чем на регрессионных.

Таблица 5

Параметры нейронной сети

Нейронная сеть Число входных переменных Число слоев Число нейронов в слоях Значение скорости

Модель бензина 28 3 10 0,2

Таблица 6

Прогнозирование на обученной трёхслойной нейронной сети для октановых чисел

Экспериментальные данные Полученные результаты Отклонение, %

79,6 79,8 0,3

79,9 79,7 0,2

94,9 95,1 0,3

79,9 80,1 0,3

95,4 95,1 0,3

92 91,7 0,3

91,4 91,1 0,2

91,4 91,1 0,2

94,8 94,7 0,02

94,8 94,7 0,1

Таким образом, проведенные эксперименты показали, что применение нейронных сетей для моделирования смесей углеводородов в виде бензинов позволяет с достаточной точностью получить адекватные модели.

Эти методики нашли применение в автоматизированных информационных системах контроля параметров бензина (АИС КПБ) на основе хроматографических преобразователей, достоинствами которых являются минимальный размер пробы, низкая стоимость анализа, высокая точность определения параметров бензина.

Литература

1. Гуревич A.JI. Автоматический хроматографический анализ / A.JI. Гуревич, JI.A. Русинов, H.A. Сягаев. - JI. : Химия, 1980. - 192 с.

2. Замятин Н.В. Методы идентификации в хроматографическом анализе / Н.В. Замятин, З.А. Смыслова, Н.В. Пермякова. - Томск : Томск, гос. ун-т систем упр. и радиоэлектроники, 1999. - 35 с.

3. Замятин Н.В. Применение нейронных сетей для идентификации хроматограмм / Н.В. Замятин, Я.П. Шадрин // Нейроинформатика 98 : сб. научн. тр.. - Красноярск, 1998. -С. 19-20.

4. Замятин Н.В. Автоматизированная система контроля параметров бензина / Н.В. Замятин, Я.П. Шадрин // Приборы и системы управления. -1998. - № 5. - С. 31-36.

Замятин Николай Владимирович

Д-р техн. наук, профессор каф. автоматизации обработки информации ТУСУРа Тел.: (3822) 41 34 29

Пустовалов Дмитрий Станиславович

Зав. лаб. хроматографии ООО «Томскнефтехим»

Шадрин Ярослав Петрович

Электроник каф. автоматизации обработки информации ТУСУРа

N.V. Zamyatin, D.S. Pustovalov, J.P. Shadrin

Neural network models of chemical hidrocarbonic systems

Hydrocarbonic systems of type of gasolines are considered. For construction of models of such chemical systems are used регрессионные the equations. The neural networks connecting parameters of gasolines with their structure are applied to increase of adequacy at synthesis of models.

i Надоели баннеры? Вы всегда можете отключить рекламу.