множества лингвистическом переменной | V | Рі, рі ^ ^, В^ \ | , где - терм-множество лингви-
Тененев В.А. , Мыльцев В.А. ПРИМЕНЕНИЕ НЕЧЕТКОГО ЛОГИЧЕСКОГО ВЫВОДА ДЛЯ ИССЛЕДОВАНИЯ РЕАКЦИИ ВЫХОДНЫХ СИГНАЛОВ НА ИЗМЕНЕНИЕ ВХОДНЫХ СИГНАЛОВ ДИНАМИЧЕСКИХ СИСТЕМ
Для управления сложными технологическими процессами необходимо иметь некоторую его модель. Описание отдельных фаз однородного технологического процесса возможно системами дифференциальных и алгебраических уравнений. В этом случае можно поставить задачу оптимального управления процессом. Решение данной задачи позволяет выбирать оптимальные режимы технологического процесса. Для многостадийных процессов, в которых осуществляются разнообразные физические, химические, электродинамические явления, построение детерминированных математических моделей становится очень сложной и, часто, невыполнимой задачей. В таких случаях возможны подходы, основанные на методах системного моделирования. В условиях имеющейся неопределенности воздействия множества факторов на производственные процессы целесообразно применять методы нечеткого моделирования [1].
Рассмотрим способ построения и подход к проблемно-целевому анализу сложных организационно-технических систем на основе нечеткого моделирования. Представим некоторый производственный процесс в виде нечеткой причинно-следственной сети: 5 = ^Р,У) , где Р = |ру,і = 1,р}, V = IV(ру,pJ),і,] = 1,р,і Ф у'} - множество элементов и
множество связей между элементами системы.
При описании элементов используется множество нечетких ситуаций, характеризующих пространство возможных состояний элементов, а также множество отношений между ними. Каждому элементу системы
р соответствует лингвистическая переменная (гу,В) , определенная на терм-множестве |г/М. } , и базовое множество В элемента. Терм-множество представляет собой набор лингвистических значений элемента, характеризующих его типовые состояния), где Мі - число типовых состояний данного элемента. Для описания термов Тік,к = 1,МІ , соответствующих значениям элемента р( , используются нечеткие функции принадлежности из множества Мі = |м {Ь),Ь є В,} .
Связи v(pi, р.) между типовыми состояниями каждой пары элементов задаются одним из значений терм-
^(рі,р),\РІр)) , где Г|
стической переменной V(рі,р^.) . Связи между типовыми состояниями каждой пары элементов задаются нечеткими переменными.
В зависимости от характера и способа представления информации, используемой при описании термов, определяющих типовые состояния элементов, могут применяться прямые и косвенные методы построения функций принадлежности. Прямые методы основаны на непосредственном задании экспертом нечетких множеств М = |м (Ь), Ь є В і} и используются для измеримых характеристик. Прямые методы построения функций
принадлежности применяются при опросе и согласовании мнений группы экспертов. В этом случае устанавливаются некоторые нечеткие числа и приближенные интервальные оценки.
Косвенные методы определения значений функций принадлежности используются в случаях, когда нет измеримых свойств. Рассмотрим наиболее распространенные методы.
Метод парных сравнений.
Задано некоторое множество X = |х} из п элементов. Степень принадлежности элемента х нечеткому подмножеству О обозначим ц0(х~), х є X . Для всех элементов множества должно выполняться условие:
п
Емо (х)=1.
і = 1
Степень принадлежности элементов множеству определяется посредством парных сравнений. Оценка
элемента х по сравнению с элементом X- определяется матрицей парных сравнений А = ^^;і,] = 1,п . Для
оценки относительной важности элементов используется девятибалльная шкала отношений [2]. По этой шкале 1 соответствует одинаковой значимости элементов, а 9 - соответствует абсолютной значимости. Правило заполнения матриц отношения: если элемент хі доминирует над элементомх. , то элемент матрицы ау равен целому числу а по шкале отношений. Симметричный элемент матрицы а^ = 1/ а .
Для ранжирования элементов х вычисляются главный собственный вектор и главное собственное значение матрицы парного сравнения а^. . Главный собственный вектор матрицы А определяется равенством А^ = , где ^,^тх - главный собственный вектор и максимальное собственное значение. Для
А ке
нахождения вектора ^ используется следующая формула [2]: ^ =~т—Т~, к = 1,2,... при достижении усло-
ет Аке
і— ^ < є . Здесь е =
вектор, состоящим из единиц.
1
При найденном векторе w степень принадлежности элементов определяется как Ма(хі) = ^,і = 1,п . Так
п
как собственные вектора являются ортонормированными, то условие Емо(хі) =1 выполняется.
і=1
Соответствующее главному собственному вектору максимальное собственное значение находится из уравнения Aw = умножением на вектор е : еТAw = ^^хЄ^w . Так как eTw = 1 , то = еТAw . Зна-
чение ^ применяется при вычислении индекса однородности суждений эксперта 10 = (^^х — п)!(п — 1) .
Ai =
Например,
15 3 2
1/5 1 1/2 1/3
1/3 2 1 1/2
1/2 3 2 1
два эксперта составили следующие две матрицы для рассматриваемых четырех элементов:
15 4 1
А2 =
1/5
1/4
1
1 1/5 1/3 5 1 2
3 1/2 1
Для первой матрицы ^ = (0.483; 0.088; 0.157; 0.272) ,
для второй = (0. 455; 0.063; 0.256; 0.225) . При этом индексы однородности суждений равны соответ-
ственно 0.007 и 0.22. Средние значения могут быть получены либо осреднением матриц парного сравнения, либо осреднением собственных векторов.
Метод на основе статистических данных. В качестве степени принадлежности элемента х множеству О принимается оценка частоты использования значения терма для характеристики элемента. Степень принадлежности некоторого значения вычисляется как отношение числа экспериментов, в которых оно встречалось в определенном интервале шкалы, к максимальному для этого значения числу экспериментов по всем интервалам при условии, что в каждый интервал шкалы попадает одинаковое число экспериментов. Полученные данные нормируются и сглаживаются для обеспечения унимодальности.
Использование типовых функций. В качестве функций принадлежности используются типовые функции (треугольные, трапециевидные, гауссовы, колоколообразные, Б,Z -образные), конкретный вид которых определяется значениями параметров, входящих в их аналитические представления и уточняется в соответствии с данными экспериментов [3].
k
Треугольная функция принадлежности: Y(C)=7 К( и- d), где
k i=1
a, b, c - некоторые числовые параметры, удо-
влетворяющие условию a< b < c .
Трапециевидная функция: /л( x; a,b, c, d ) =
0, x < a
(x - a)/(b - a), a < x < b
1, b < x < c , a < b < c < d .
(d - x)j(d - c), c < x < d
0, x > d
jiz (x;a,b) =
/u2 (x; a, b) =
S,Z -образные функции принадлежности:
1, x < a
0.5 + 0.5cos(^[(x - a)/(b - a)]), a < x < b , a < b ;
0, x > b 1, x < a
1 - 2[(x - a)/(b - a)] , a < x < (a + b)/2
2[(b - x)/(b - a)] , (a + b)/2 < x < b 0, x > b
, fis (x;a,b) =
0, x < a
0.5 + 0.5cos[^(x - b)/(b - a)], a < x < b ,
1, x > b
/us (x; a, b) =
0, x < a -]2
2[(x - a)/(b - a)] , a < x < (a + bУ2 1 - 2 [(b - x)/(b - a)] , (a + b)/2 < x < b
1, x > b
Л (x; a, b) = У [ 1 + exp (-a (x - b))] - сигмоидальная функция,
0, x < c
Л (x; a,b, c, d ) = < [<^( x )-<^(c)/<^(d )-^(c)], c < x < d - нормированная сигмоидальная функция, где
1, x > d
v{. x) =1 [1 + exp(-a(x - b))J ; c < b < d ; S -функция соответствует a > 0 , Z -функция a < 0 .
Колоколообразная функция л( x; a,b, c) = 1^ (1 + |( x - bV cl“) • Гауссова функция принадлежности
л(x;b,c) = exp(-(x - b)2/c) .
Отношения причинности между каждой парой элементов (pt, Pj)
из множества связей
V = {V (Pi, Pj )} фор-
мируются в виде ориентированного графа. Связь между типовыми состояниями каждой пары элементов задаются одним из значений терм-множества лингвистической переменной.
Связи, характеризующие нечеткую степень влияния между типовыми состояниями каждой пары элементов, описываются нечеткими переменными, которые могут задаваться либо значениями из отрезка [-1,1], либо функциями принадлежности. Задание взаимосвязей между элементами с помощь функций принадлежности позволяет формировать продукционные модели в виде множества нечетких правил.
Некоторые элементы могут образовывать подсистему с типом взаимосвязей, отличных от остальных. Такая подсистема может описываться детерминированной математической моделью в виде алгебраических и дифференциальных уравнений. При необходимости связи между элементами подсистем в ряде случаев представляются нейронной сетью, однонаправленной либо рекуррентной. Для таких подсистем определяется следующая структура (рис.1).
Пусть имеется узловой элемент р. . Вместе с элементами р, у = у, ут , рк, у = к, к элемент р образует некоторую подсистему. Входы в подсистему определяются связями V(у,I),У = У,ут , а выходы связями V (*, к ), к = к ,к^ . Узловой элемент рг осуществляет преобразование вида
У = ф* (X), X = [Ху],у = Л; ^ = [Л],к = к1 , (1)
где \ - выходные воздействия; X - входные сигналы.
Рис.1. Структура подсистемы
В виде подсистемы может быть представлено некоторое техническое устройство, осуществляющее технологический процесс. Например, аппарат центробежной осушки газа. Тогда входными параметрами являются термодинамические (давление, температура, влажность) и теплофизические характеристики газа. К входным параметрам также относятся технологические характеристики процесса (расход газа, закрутка газа, дисперсный состав конденсированной влаги, конструктивные особенности аппарата и т.д.). Выходными параметрами могут являться требуемые термодинамические параметры, включая и температуру точки росы, а также характеристики в виде затрат энергетических, сырьевых и трудовых ресурсов. Преобразование (1) может быть представлено в нескольких видах.
1. Математическая модель технологического процесса. Она может включать уравнения движения многофазной среды в многомерной постановке с учетом фазовых превращений. Преобразование может также выглядеть, как инженерная методика расчета технико-экономических показателей данного технологического процесса.
2. Математическая модель, описываемая нейронной сетью. Для извлечения знаний из системы данных и для решения задач управления широкое применение нашли однонаправленные многослойные нейронные сети. Важным свойством нейронных сетей является способность к обучению и обобщению полученных знаний. Обученная на ограниченном множестве обучающих выборок, сеть обобщает накопленную информацию и выдает реакцию на данные, не применявшиеся при обучении.
Нейронная сеть осуществляет нелинейное преобразование (1) вектора X в вектор У : У = Е (W, X), где W - матрица коэффициентов преобразования, определяемая в процессе обучения сети.
Многослойная нейронная сеть состоит из входного и выходного слоев, а также из нескольких внутренних
(скрытых) слоев [4]. Входной слой имеет размерность входного вектора X = [х^,...,хп] . Обычно размерность векто-
ра увеличивают еще на единицу, добавляя х0 = 1 . Это делается для включения величины смещения функции активации в множество весовых коэффициентов. Каждый нейрон первого скрытого слоя (к=1) осуществляет суммирование
п ____
входящих сигналов иу = 2 МуХу, * = 1, N .
у=0
Выходной сигнал нейрона преобразуется с помощью функции активации = О(ик), * = 1,N;к = 1,Кс , где N -
число нейронов в к -м слое; Кс - число слоев.
В качестве функции активации используется сигмоида
О(У) = 1/[1 + ехр(-Д?)] . Производная от этой функции выражается через значения самой функции
Д.О/& = рО(з)(1 - О(^)) .
Выходные преобразованные сигналы суммируются на последующем слое и, так далее, до последнего выходного слоя.
N*-1 ____
ик = 2 ^к-1, гк = О(ик), * = 1,N, к = 1,Кс , так что г0 = X, У = гКс . у=0
Построенная таким образом нейронная сеть содержит весовые коэффициенты мМ*, * = 1,Ык,у = 0,1,к = 1,Кс ,
требующие определения в процессе обучения.
Для обучения используется система данных, представляющая собой набор наблюдаемых точек
(Xу ^у), у = 1,р , где X,f - входной вектор и вектор функции, соответственно. Система данных из р
точек делится на две выборки: обучающую (Xу, у ), у = 1, к и проверочную у = к + \ р . Весовые коэффициенты нужно подобрать таким образом, чтобы они обеспечили минимальное отклонение рассчитываемых в сети
1 т
значений У от имеющихся f , т.е. давали бы минимум целевой функции = - 2 (У - Я )2 ^ Ш1П .
2 1=1
Здесь W - матрица коэффициентов , * = 1,Ык,у = 0,1,к = 1,Кс , q - номер предъявляемой для обучения пары из выборки (Xq, Р ), д = 1, к .
Для обучения нейронной сети (настройки коэффициентов ДО) наиболее часто применяются алгоритм обратного распространения ошибки и генетические алгоритмы [5].
В качестве примера рассмотрим экспериментальные данные, описывающие зависимость дебита жидкости от расхода газа и диаметра подъемника в процессе работы газлифтной скважины [6]. При низком пластовом давлении, большой глубине и высоких газовых факторах наиболее приемлемым способом эксплуатации скважин является газлифт [7]. Принципиальная технологическая схема газлифтной эксплуатации заключается в подаче газа высокого давления в затрубное пространство скважины.
Экспериментальные зависимости дебита жидкости Qот расхода газа V и диаметра подъемника d приведены на рис.2 (данные с обозначением exp).
Всего рассмотрено 58 экспериментальных точек. Половина из них случайным образом отобрана в обучающую выборку. Нейронная сеть обучалась с помощью генетического алгоритма [5]. Результаты восстановления характеристик газлифтных скважин приведены на рис.2 с обозначением net. Обученная сеть становится способной по заданным значениям расхода газа V и диаметра подъемника d давать значения дебита жидкости Q . Зависимости 5 и 6 приведены для значений d = 0.085, d = 0.07 , не имеющихся в экспериментальных данных.
о-1----1-----1----1----1----1----1-----1----1----1----ІУ-10'3 м/с
0 10 20 30 40 50 60 70 80 90 100
Рис.2. Зависимости дебита жидкости от расхода газа и диаметра подъемника
Структурная схема данного технологического процесса показана на рис.З.
Рис.З. Структурная схема газ-лифтного процесса
3. Узловой элемент p может осуществлять преобразование вида (1) с помощью набора правил, получаемого методом деревьев решений. Деревья решений - это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение. Под правилом понимается
логическая конструкция, представленная в виде if A then B (A ^ B) .
Пусть целевая переменная соответствует некоторым классам, на которые разбито множество данных. Требуется отыскать некоторое классифицирующее правило, позволяющее разбить множество данных на эти классы. В процессе поиска классифицирующего правила проводится перебор всех независимых переменных и отыскивается наиболее представительное правило на данном этапе. В обычных деревьях решений применяются предикаты вида x<w, x > w . Данные разбиваются на две группы в соответствии со значением этого предиката. После этого процесс повторяется для каждой из этих групп до тех пор, пока получающиеся подгруппы содержат в себе представителей классов и включают в себя достаточно большое количество точек для того, чтобы статистически значимо быть разбитыми на меньшие подгруппы. В результате, окончательное классифицирующее правило, построенное этим процессом, может быть представлено в виде бинарного дерева. Каждый узел этого дерева соответствует некоторому подмножеству данных и содержит найденное классифицирующее правило для этого подмножества. Удобным для анализа свойством деревьев решений является представление данных в виде иерархической структуры. Компактное дерево проявляет картину влияния различных факторов, независимых переменных.
Метод классификации, основанный на деревьях решений, имеет в качестве преимуществ следующие свойства: быстрый процесс обучения; генерация правил в областях, где эксперту трудно формализовать свои знания; извлечение правил на естественном языке; интуитивно понятная классификационная модель; достаточно высокая точность прогноза, сопоставимая с другими методами; построение непараметрических моделей.
Эти положительные свойства приближают методологию деревьев решений к системам, основанным на нечеткой логике, выигрывая у них в быстроте процесса обучения.
Для подсистемы, показанной на рис.б, с применением алгоритма, приведенного в [B], получен следующий набор правил, соответствующий построенному дереву:
1: if V >= B0.20 then Q=[32,41];
2: if V < B0.20 AND d >= 0.0B AND V >= 32.0 then
3: if d >= 0.0B AND V < 32.00 then Q=[4B,63];
4: if V < B0.20 AND d >= 0.01 AND d < 0.0B then Q=[32,41];
5: if V < B0.20 AND d >= 0.05 AND d < 0.01 AND V >= 15.б0 then £?=[1б,31];
б: if d >= 0.05 AND d < 0.01 AND V < 15.б0 then Q=[0,15];
1: if V < B0.20 AND d < 0.05 then Q=[0,15].
Выходная величина Q определяется на некоторых интервалах. Для точечной оценки выходной величины, как это предложено в работе [B], можно применить алгоритм нечеткого вывода. К имеющимся правилам эксперт или аналитик может добавить дополнительные правила, увеличивающие качество моделирования рассматриваемой системы.
Рассмотренные три варианта описания некоторых подсистем делают нечеткую модель сложной производственно-технической системы более универсальной и гибкой.
Основой для проведения операции нечеткого логического вывода является вид связей между элементами нечеткой системы, содержащих правила, названия термов и функции принадлежности термов. Пусть имеется подсистема нечеткого вывода, имеющая т правил вида:
f>,
, . (-1 / . /V \J
7=1
then у е(гу,BtУ j,i = 1,m , (2)
где х, у = 1,п - имена входных переменных; у - имя выходной переменной.
Результатом нечеткого вывода является четкое значение переменной уеГ на основе заданных четких значений х4 еХ, / =1,и .
В общем случае механизм логического вывода включает четыре этапа: введение нечеткости (фазификация), нечеткий вывод, композиция и приведение к четкости, или дефазификация. Алгоритмы нечеткого вывода различаются главным образом видом используемого нечеткого вывода, следующим после фазификации, и разновидностью метода дефазификации.
Нечеткий вывод по способу Мамдани. Данный алгоритм математически описывается следующим образом.
1. Процедура фазификации: определяются степени истинности, т.е. значения ФП для левых частей
каждого правила (предпосылок). Для правил вида (2) обозначим степени истинности как
4;(ху), / = \,т, у = 1 ,п .
2. Нечеткий вывод. Сначала определяются уровни «отсечения» для левой части каждого из правил. В
качестве С-нормы выступает логический минимум (пип) : 0С1 = 1ШП(Д--(5с • )), /=1,тю, у =1,77 . Далее находятся
j
«усеченные» функции принадлежности Д-(у) = шт(^-, В{(у)), I = 1,т .
I
3. Композиция, или объединение полученных усеченных функций, для чего используется максимальная композиция (I -конорма): /и(у) = шах(В'(у)),У = 1,т , где ^(у) - функция принадлежности итогового нечеткого множества.
I
4. На этапе дефазификации приведение к четкости можно осуществить разными методами.
Метод среднего центра, или центроидный метод: y = JyZ?(y) 1^В(у) или для дискретного варианта:
У /у
т / то
У = I>л- •
/=1 / /=1
Геометрический смысл рассчитанного значения - это центр тяжести для кривой ^(у) .
Нечеткий вывод по Сугено. В модели вывода Сугено на выходе дефазификатора на выходе системы не требуется. Для этого используется набор правил следующего вида:
f> '
j=i
then y = f (X) Vi = 1,m , где f ( X) - некоторая четкая функция. Чаще всего в роли
f (X) выступает полином первого порядка вида: у = fi(X)=Pi0+2 Pvxj.
j=1
Этапы алгоритма Сугено.
1. Процедура фазификации аналогична способу Мамдани.
2. Нечеткий вывод. Определяются уровни «отсечения» предпосылок правил ^ и рассчитываются инди-
___ n
видуальные выходы правил R, i = 1,m : yt = p/0 +2PijXj , где p/0 [p^] - коэффициенты полинома, или циф-
j=i ,
ровые веса. Эти коэффициенты либо уточняются в процессе анализа данных, либо подбираются в процессе обучения.
3. Итоговая четкая величина у вычисляется как средневзвешенное:
m / то
у = г гДе ш ~ количество правил вывода.
/=1 / /=1
Процесс построения системы нечеткого вывода в общем случае состоит из двух этапов: структурной
адаптации и параметрической адаптации. Эти процедуры могут выполняться как раздельно, так и одновременно, и проводятся с использованием экспериментальных данных обучающей выборки. Структурная адаптация подразумевает генерацию базы нечетких правил вида "if - then”. Критерием качества сформированной базы правил выступает величина покрытия правилами всех примеров из обучающей выборки.
На этапе параметрической адаптации производится настройка параметров функций принадлежности нечеткой системы. Для этого, как правило, минимизируется квадратичная сумма разностей между фактическим у. и. спрогно-
1 k
зированным d значением переменной вывода нечеткой системы: ^(C) = — 2(у _d) , где C - вектор параметров
k i=1
функций принадлежности, k - объем обучающей выборки.
Таким образом, моделируемая система представляется в виде совокупности элементов и подсистем, связанных между собой нечеткими связями. Последовательное осуществление нечеткого логического вывода приводит к реакции выходных сигналов на изменение входных сигналов и внешних условий.
ЛИТЕРАТУРА
1. Борисов В.В., Бычков И.А., Дементьев А.В. и др. Компьютерная поддержка сложных организационно-технических систем.- М.: Горячая линия - Телеком, 2002.154с.
2. Андрейчиков А.В., Андрейчикова О. Н. Анализ, синтез, планирование решений в экономике. - М.: Финансы и статистика, 2000.-363с.
3. Леоненков А.В. Нечеткое моделирование в среде MATLAB и fuzzyTECH.- СПб.: БХВ-Петербург,
2003.-736с.
n
4. Осовский С. Нейронные сети для обработки информации / Пер. с польского И.Д. Рудинского. - М.: Финансы и статистика, 2002. - 344 с.
5. Сенилов М.А., Тененев В.А. Интеллектуальные алгоритмы интерпретации геофизических исследований скважин. СПб: Изд-во СПбГЭТУ «ЛЭТИ»,2 0 0 4.12 8с.
6. Мирзаджанзаде А.Х., Хасанов М.М., Бахтизин Р.Н. Моделирование процессов нефтегазодобычи. Нелинейность, неравновесность, неопределенность. - Москва-Ижевск: Институт компьютерных исследований,
2004.-368с.
7. Тер-Саркисов Р.М. Разработка и добыча трудноизвлекаемых запасов углеводородов.- М.: ООО
«Недра-Бизнесцентр», 2005.-407с.
8. Тененев В.А., Ворончак В.И.Решение задач классификации и аппроксимации с применением нечетких деревьев решений./ Интеллектуальные системы в производстве, №2, 2005.с.- 46-69.