В.Х. ФЕДОТОВ
О ЦЕЛЕСООБРАЗНОМ ПОВЕДЕНИИ В ИСКУССТВЕННЫХ СИСТЕМАХ*
Ключевые слова: искусственный интеллект, самоорганизация, принцип минимума производства энтропии, критерий эволюции, упорядоченность, целесообразность.
Естественные системы (ЕС) в природе и обществе функционируют по законам «разумности», которые можно использовать при конструировании интеллектуальных искусственных систем (ИС). На основе идей самоорганизации и эволюции ЕС исследованы нестационарные режимы и устойчивость моделей триггерных систем. Показано, что флуктуации, снижающие избыточное производство энтропии, могут приводить к неустойчивости и рождению упорядоченных структур. Способность ИС к самоорганизации интерпретируется как целесообразное поведение.
ABOUTTHE PRACTICABILITY BEHAVIOR IN ARTIFICIAL SYSTEM Key words: artifical intelligence, self-organization, the minimum entropy produce principal, the evolution criteria, ordering, practicability.
The natural systems (NS) in nature and society works in low «brain» and may use for constructing of intellectual artifical systems (AS). With ideas of self-organization and evolution investigated unsteady regimes of NS and stability the models of trigger systems. The fluctuation with negative entropy produdion may iniciate unstability and burning ordered structures. The self-organization interpreteted as practicability behavior.
Естественные системы (ЕС), окружающие нас (флора, фауна, экосистема, социум и др.), характеризуются весьма «разумным» поведением, т.е. способностью вырабатывать «правильный» отклик на внешнее возмущение, обучаться и выживать. Основным критерием разумности для ЕС, по-видимому, является стабильность (безопасность, самосохранение, устойчивость). Примем это утверждение как основную аксиому.
Искусственные системы (ИС) более предсказуемы и не обладают способностью к целеполаганию. Может ли ИС обладать проявлениями интеллекта и что можно считать его проявлениями? Какое качество ЕС наиболее значимо с этой точки зрения? Эти вопросы остаются важнейшими нерешенными проблемам теории искусственного интеллекта (ИИ).
Целью работы является исследование возможности использования эволюционных идей в качестве модели разумного поведения ИС. Идеи эволюции универсальны для физики (Л. Больцман и др.), биологии (Ч. Дарвин) и социологии (К. Маркс). Принципы эволюции ЕС выражают фундаментальные законы неравновесной термодинамики (И. Пригожин, П. Гленсдорф) - принцип минимума производства энтропии и универсальный критерий эволюции [4, 6].
И. Пригожин (1945) обобщил второй закон термодинамики на открытые неравновесные системы (Нобелевская премия, 1977). Изменение энтропии dS=deS+djS, где deS - поток внешней энтропии (обмен энергией); djS - производство энтропии внутри системы (диффузия, реакции). Внутреннее производство энтропии всегда неотрицательно d,S>0 (второе начало термодинамики). В закрытых системах deS=0, dS=d,S>0 - энтропия монотонно растет до максимума в равновесии. В открытых системах deS^0 и dS может иметь любой знак. В стационарном состоянии (с.с.) dS=0 и deS=-d,S<0. Принцип минимума производства энтропии утверждает, что в линейных системах производство энтропии P=djS/dt монотонно убывает dP/df<0 и достигает минимума в с. с.. Из него следует, что в открытых линейных системах, так же как и в закрытых, флуктуации затухают (устойчивость). Критерий эволюции обобщает принцип минимума на нелинейные системы. В ходе эволюции любая система стремится уменьшить производство энтропии dpdt<0, обусловленное
* Исследование выполнено при финансовой поддержке РФФИ проект № 08-07-97009 р_поволжье_а «Исследование и оптимизация подходов к разработке масштабируемых, настраиваемых и адаптивных прикладных производственных информационных систем».
внутренними силами Х, здесь dP/dt=dxP/dt+d|P/dt. При этом не оговаривается знак dIP/dt. В линейной области dxP=dIP и критерий переходит в принцип минимума. Вне линейной области dP/dt может менять знак.
Важную роль в эволюции играет случайный фактор (флуктуации). Флуктуации отклоняют энтропию и ее производство от с.с. AS=S-SM=5S+5 S/2+..., AP=P-PM.=SP+S2P/2+..., где 52S/2 и 52P/2=d(52S/2)/dt=5XP - избыточные S и P. Если избыточное производство энтропии положительно S2S<0, 5i(52S)>0, то система устойчива. При 5t(52S)<0 возможны неустойчивость и новая структура.
Эти принципы позволяет предположить, что, действуя в соответствии с критерием эволюции, ИС сможет вести себя подобно ЕС - в процессе флуктуаций терять устойчивость, демонстрировать бифуркации, приобретать новый уровень сложности и самоорганизовываться.
1) если избыток производства энтропии отрицателен AP=dt(52S)<0, то возможна неустойчивость;
2) в области неустойчивости возможны бифуркации и переход к новым состояниям;
3) уменьшение энтропии системы AS=S-S0<0 соответствует более упорядоченному состоянию.
Стремление к цели AS^min будем рассматривать как основное проявление интеллекта в ИС. В случае необходимости принятия решений, при наличии нескольких альтернатив, предпочтение отдается варианту, соответствующему лучшему значению этого критерия.
Нелинейная неравновесная термодинамика приближенно описывается эволюционными уравнениями физико-химических процессов в открытых системах, представляющих собой систему дифференциальных уравнений с параметрами (аналогичные уравнения встречаются в биологии и социологии):
dx/dt « f(x, w), (1)
где x=x(w,t) - вектор переменных (макроскопических), характеризующих состояние системы; f - известная вектор-функция, определяемая базовой физической гипотезой (кинетический закон); w=w(E,t) - вектор вероятностных параметров (частот); Е - пространство процесса; t - время.
Вблизи с.с. xM зависимость от времени практически должна исчезать ¿x/9t«f(xM,w)«0. Однако под влиянием неизбежных случайных флуктуаций система отклоняется от текущего состояния и начинает двигаться к новому или тому же с.с. Флуктуации будем задавать изменением значений некоторых компонент матрицы параметров w(E,t) во времени
dw/dt « g(x,w), (2)
где g - неизвестная вектор-функция, характеризующая пространство Е.
Расширенная система (1)-(2) включает две взаимосвязанные части (детерминированную f и случайную g) и представляет собой модель эволюции ЕС, происходящей под влиянием флуктуаций. Ее размерность равна сумме размерностей векторов x и w.
Пусть открытая система состоит из двух неоднородных подсистем - внешней (глобальной) и внутренней (локальной). Процессы взаимодействия объектов системы представим стадийной структурой (схемой)
A + T.aijXj = Za-j Xj + A- , (d), /=1,...,s; j=1,...,n; (3)
где Ai и Xj - объекты глобальной и локальной подсистем соответственно; Zaj=Za_/,>0 и di - целочисленные параметры (балансы и кратности стадий соответственно); s - число стадий.
Выберем в качестве базовой гипотезы закон действующих масс [5]. Тогда уравнения (1) для процесса (3) в избытке объектов глобальной подсистемы и без учета диффузии запишутся
Х ] = /(х, У) = Е(э-- Эц)(г / - гч) = Е(э- - эк])гк, к=1 ,...,25; У=1,---,п; (4)
где х; - концентрации X ; ЕЦх;| 0<х;<1, Ех;- =1} - пространство процесса; г±/ = =У±/П(х;)а±,у>0 - скорости стадий; у±/=к±/С±/ - вероятности стадий; к±/ и Е±/ - константы скоростей стадий; С±, - концентрации А±
Избыточное производство энтропии 5хР или (что эквивалентно) плотности производства энтропии 5хст связано с кинетикой процесса соотношением ст=ЕЛХк, где Л- обобщенные потоки; Хк- обобщенные силы [6]. Потоки и силы связаны со скоростью процесса, мерой удаленности от равновесия (сродством) и устойчивостью с.с. Устойчивость определяется коэффициентами характеристического уравнения [3] Хп+а1Хп-1+...+ап=0, где Стр=^е1(-д//р/дх/д); р,д =1,...,п (сумма по /1<...</р); det - определитель.
Выразим стр через балансовые коэффициенты и скорости стадий [2]
ар = Е(х/1 '"Х/р) Егк1 "•гкр det(akp,p> - а-кр,/р') det(akp,/p), (5) где р =1,...,п; /'1../р =1,...,п; к1,...,кр =1,...,25 (первая сумма по /1<...</р, а вто-
рая по к1<...<кр).
Для одномаршрутных процессов г,-г_/=с(/ г, в=п и выражение упрощается ар =2г°-/2г_к1 •••г_к/Е(х/1 •••х^Р1ирик/ , (5 ' )
здесь первая сумма берется по /=0,...,р, вторая по к1<...<к/, а третья по /1<...</р; множители P/1•••ipkЬ•^k/=det(akp,/p-a_kp,/p) det([app-a_(p,/p][akp,,pdkp]), причем второй определитель построен из двух частей - сверху первая, снизу - вторая. Если все Р(1^,рк1"к/>0, то соответствующее ар>0. Если один из Р/1„,рк1"к/<0 при некоторых значениях индексов, то в некоторой области параметров возможно наличие с.с., в котором ар <0 (для этого достаточно, например, чтобы х,1-1,-,х,р-1; г_к1,.,г_к/>>г^>1).
Соотношения (5) упрощают анализ упорядоченности. Если все а1,а2,.,ап>0, то с.с. единственно и устойчиво, а избыток энтропии положителен. Если один из коэффициентов отрицателен ар<0, то возможны любые эволюционные явления - отрицательный избыток энтропии, неустойчивость, бифуркации и новые упорядоченные структуры.
Действительно из (5) следует, что <а = гХх/1 1Р,1+2г_к12х,1 1Р,1к1 = гЕхц 1 Z(ak1,/1-a_k1,/1)ak1,/1dk1+ Ег-^Ех^ (э^л-э-пл)2. Следовательно, если процесс включает только линейные, квадратичные или неавтокаталитические стадии любой нелинейности, то всегда а1>0 и с.с. единственно и устойчиво. Неустойчивость возможна только при Е(ak1>/1-a_(1>/1)ak1>/1dk1<0, что возможно при наличии автокаталитической стадии третьего или более высокого порядка нелинейности.
Примеры. На устойчивость двухстадийных процессов влияет только одна величина а1. А) Для нелинейного кубического процесса 1) Х2=Х1, 2) Х1+2Х2=3Х2, получим Р1=1, Р2=-1. Значит, а1 и избыток энтропии могут быть отрицательными, возможны неустойчивость и критические явления. Этот процесс (простейший «триггер») допускает множественность стационарных состояний (м.с.с.) и исследован нами в [1,8]. В) Для трехстадийных процессов имеют значение знаки а1 и а2. Для нелинейного процесса 1) Х3=Х1, 2) Х1=Х2,
3) Х2+2Х3=3Х3, получим Р1 =Р2 =1, Р3 =-1, Р12 = Р23 =1, Р13 = -1, поэтому возможны смена знаков а1 (за счет Р3) и а2 (за счет Р13). Возможны и неустойчивость и м.с.с. При одновременном выполнении условий а1>0, а2 >0 возможны автоколебания, что показано нами в работе [7].
Флуктуации (2) повышают размерность системы на число независимых частот (т), соответственно увеличивают число коэффициентов ар, привносят в них дополнительные слагаемые Дар и увеличивают вероятность возникновения неустойчивости
Пр =Ор + Даp=Еdet(-дh/p/дy/q), р,д=1,2,.,п+т, (5 ' ' )
где h=/ug■; у^хиу; ар=0(р=п+1,.,п+т);Да1=-Едд/ду/, ...,Дстп+m=det(-дh/p/дyq).
Исследуем влияние флуктуаций на простейший «триггер» (схема А), в котором возможны неустойчивость и м.с.с. Запишем эту схему в символике открытых неоднородных систем (3)
1) А1+г=Х, 2) Х+22=3г+А-1. (6)
Уравнения (1)-(2) при избытке компонент глобальной подсистемы А1, А-1=Соп81>>Х запишутся
бг /с = -(W2+W_2)ZЪ+W2Z2-(W1 + W_1)Z+W_1 = /(г, у± ,), (6э)
б'м1№= д(г, w2,w_1,w_2,...), (6Ь)
где г=1-хе[О,1] - независимая переменная (безразмерная концентрация 2); хе[0,1] - зависимая переменная (безразмерная концентрация X); у±,>0.
I) При отсутствии флуктуаций (у^Соп^ эволюция системы описывается одним уравнением (6э). В одномерных системах устойчивые упорядоченные структуры не возникают.
Стационарные режимы определяются решениями кубического уравнения /=О. Анализ показал, что существует до трех различных с.с. При у-1=0 и О^г^у-^Уг+У-г^О имеется одно граничное и два внутренних с.с. г(1)м=О, г^^Уг-^О^Уг+У-г), z(3)м=(w2+VD)/2(w2+w_2), причем второе (среднее) неустойчиво. При у-1>0 все с.с. являются внутренними (критерий м.с.с. дан в [1,8]). Например, м.с.с. реализуется при у1=19, у_1=1, у2=125100/1089»115, w_2=41ОО/121«341. Границы области м.с.с. у1=[у1т|п,у1тах]«[18.93,23.85],
У2=[У2т|П,У2та>[8О,1ОООО], w_1=[w_1" единственно и устойчиво (рис. 1).
,у-1 ]» [0,2.85]. Вне этой области с.с.
1 1 1 1 1 1 . ! , 1 1
1(Оо «<Оо г(йо
о.? - *(01 ф5 - *>1 05 - ^ -
г<1>2 *(¡>2 . МОг Л,
** V
о п 1 1 0 0 0 о 1 1
«К»)
"•К»)
30
30
ь
"1(1)
30
30
Рис. 1. Триггер без флуктуаций. Стационарный портрет при »2=115, 1^2=341:
а) ии=0; Ь) ии=1; c) ии=2.9
(рис. 1а) и у1<~У1тах имеются одно граничное и два внут-»0.6, причем второе (среднее) неустойчиво.
«О.2, г(3)м~
При у-1»у_1 ренних с.с. г(1)м=О, г(2)м:
При у-1>»у1тах реализуется только граничное с.с. При (рис. 1, в) существуют три с.с. г(1)м=О.1, г(2)м»О.122, г(3)м=О.55, причем второе с.с. (среднее) неустойчиво. Если у1<»у1т|п реализуется только с.с. с большим значением (третье), например при у1=18, г( ’„»О.57. Если у1>у1т|п реализуется только с.с. с меньшим значением (первое), например при у1=25, г( ’„»О.О5. При (рис. 1, с) м.с.с. исчезает и при любых у1 существует только одно устойчивое внутреннее с.с.
Нестационарное поведение зависит от начальных условий г(О)=гО, у1(0)=у10. В области неустойчивости система движется к ближайшему устойчивому с.с. монотонно или в режиме затухающих колебаний.
II) При наличии флуктуаций у ^СопэТ) эволюция описывается двумя уравнениями (6э)-(6Ь). В двумерных системах уже могут возникать новые упорядоченные структуры (автоколебания). Рассмотрим несколько случаев.
Случай 1. Флуктуации не зависят от макроскопических переменных:
бу1/а= д(у1). (6Ь ')
В этом уравнении переменные разделяются, и решение запишется t=\g ^(w1)dw1. В частности, при д(у1)=ау1 решение имеет вид экспоненты у1=у10 exp(аt), где а - константа. Отклик на затухающие периодические флуктуации д(\л/-|) показан на рис. 2.
06
гО)
0-1
08
г)
00
О I 100
а Ь
Рис. 2. Отклик z(í) на периодические флуктуации и/1=и/10(1+Ь$т(1+а/)/(1+у/) при и/ю=19:
а) затухающие (а=1.5, е=0.9, у=1); Ь) растущие (а=1, е=0.1, у=0.005) -переход к «нижнему» с.с. г(1)„=0.1
Отклик на незатухающие периодические флуктуации показан на рис. 3
0.8 0.5
*<•>
00
2(1)
0.2
1К1
т
О 02
20
50
100
100
а Ь
Рис. 3. Отклик z(í) на периодические незатухающие флуктуации при и/ю=19: а) регулярные и/1=и/10(2+Ьзт(1+аЭД, (а=1.5, е=0.5);
Ь) нерегулярные и/1=и/10(1+Ь8т(1+а^/(1+то^10,1), (а=1, е=0.1)
Из рис. 1-3 видно, что отклик системы «повторяет» характер флуктуаций. С усложнением флуктуаций осцилляции становятся более хаотичными, но такое поведение вполне ожидаемо. Периодические незатухающие флуктуации, зависящие только от времени, транслируют свои параметры на другие компоненты системы. Порождаемые автоколебания не являются самопроизвольными. Они не обусловлены внутренними механизмами и неустойчивостью.
Случай 2. В более общем случае флуктуации зависят и от макроскопических переменных (сильная обратная связь). Пусть д(г,у1) - линейная функция, тогда (6Ь) можно записать в виде
сУ/с№= z+аw1-b = д(гу), (6Ь '' )
где э, Ь>О - константы.
Запишем уравнения стационарности /=д=О параметрически (у-1,у-2, э,Ь и г - параметры)
у1=(Ь-г)/а, w2=((ь-z)/a-w_1+ у-2 г3)/ (г2 (1-г)). (7)
Условие положительности у1, запишется
Ь>тах{г, г+а(у-1(1-г) - г )/г). (8)
Вычислим коэффициенты характеристического уравнения Х2+О1Х+О2=0 расширенной системы (6а)-(6Ь') с помощью соотношений (5' '): ^1= а1+Да1=
= -(df/dz+dg/dw1), cti= -df/dz = 3(w2+w-2)z -2w2z+(wl+w-1), Acti = -dg/dw1= -a, Q.2=df/dzdg/dw1-dg/dzdf/öw1, dg/dw1 = -z, dg/dz=1.
Если Q1<0, Q2>0, то с.с. неустойчиво и единственно. Для этого необходимо
22 0<w-1<min{-3(w2+w-2)z +2w2z-w1+a, -3(w2+w-2)z +2w2z-w1+ z/a}. (9)
В двумерных системах внутри замкнутой траектории находится, как минимум, одна грубая особая точка типа фокус (D^Q12-4Q2<0) или узел (D>0) [8]. Для наличия фокуса необходимо
p/(3z2)-2Vz <w-2<p/(3z2)+2Vz, где p=-3w2z2+2w2z-(w1+ w-1 ). (10)
Соотношения (7)-(10) выражают необходимые условия возникновения незатухающих колебаний из осциллирующей неустойчивости в системе (6a)-(6b'') под влиянием флуктуаций. Если они не выполняются, то новые структуры не возникают. Если они выполняются, то при определенных значениях свободных параметров существуют автоколебания.
Пример. Условия (7)-(10) и требование единственности выполняются, например, при a=0.07, b=0.43, z10=0.1, w10=3 и ю1=0.857; ет_1=0.01; ю2=4.191; ю_2=1 (с-1). При этом имеется единственное с.с. типа неустойчивый «фокус» с координатами z„=0.37; w1m=0.857 и возникают автоколебания. Стационарная скорость /"„=0.311 (с-1), период Т»2л/л/а»10 (с). Эволюция нестационарных режимов при изменении параметра w_2 показана на рис. 4.
О 50 100
0 00111 100 _
abc Рис. 4. Триггер с флуктуациями z(t): а) узел (01=1.349, 02=0.271, 0=0.736) при и/_2е[7,25]; в) устойчивый фокус (01=0.045, 02=0.362, D =-1.446) при w_2e[1.8,6j;
с) неустойчивый фокус (0i=-0.172, 02=0.377, D=-1.479) и автоколебания при w_2e[0,1.7]
Как видно, упорядоченная структура возникает при уменьшении w-2 до минимума и существует в интервале w-2e[0,1.7j. При обратном движении, т.е. с ростом w-2 автоколебания сохраняются в более широком диапазоне w-2e[0,3.5], затем затухают и переходят в монотонный режим. Аналогичная эволюция упорядоченности наблюдается и при изменении w-1. Если условия (7)-(10) не выполняются, то при w-1e [0.3,2] существует устойчивый узел, при w-1e [0.08,0.2] - устойчивый фокус. При w-1e [0.01,0.07] выполняются условия (7)-(10) совместно с условием единственности и вновь возникают автоколебания. При обратном движении автоколебания переходят в затухающие, а затем в монотонный режим. В данном случае осцилляции возникают спонтанно и являются самоорганизующейся структурой.
Исследуем зависимость 01 от свободных параметров, вычислив частные производные 501/5w-1 =1, 5ct1/5w-2 =3z2>0, 501/5z =6(w2 +w-2 )z-2w2 , 5ст1/5а =-1, 5ст1/5Ь =0. Значит, при уменьшении параметров w-1, w-2 значение 01 уменьшается. В области автоколебаний w-1e [0.01,0.07] и w-2e[0,1.7] минимальны. При этом значение 01е[-0.175,0] отрицательно и минимально, что соответствует отрицательному избыточному производству энтропии.
Таким образом, на примере модели естественного процесса в открытой неоднородной системе показано, что принудительное «смещение» системы в сторону минимизации избытка производства энтропии AS^min может привести к
рождению самоорганизующейся структуры и появлению качественно нового, более высокоорганизованного состояния. Применительно к ИС это можно интерпретировать как проявление целесообразности, разумности, интеллекта.
Дополнительно можно использовать любые цели, специфичные для конкретной предметной области и субъективные интуитивные соображения, основанные на «здравом смысле» и опыте. Основная трудность остается в том, чтобы найти адекватную меру целесообразности в искусственных системах. Здесь возможен следующий эвристический подход. Между формальной записью многих законов природы существует аналогия, которую можно выразить простым эвристическим правилом - «интенсивность» процесса пропорциональна некоторой функции от «весов» его участников. Вид функции «интенсивности» может быть различным (произведение, сумма и др.) и зависит от системы координат, меры, метрики и т.д. Эту закономерность можно назвать принципом взвешенной пропорциональности.
Примеры. 1) В законе действующих масс скорость взаимодействия пА+тВ^ пропорциональна произведению концентраций r=w[A]n[B]m, где: w -вероятность; [A], [B] - концентрации А и В; п, т - число объектов А и В. 2) Мерой силы тяготения также является произведение F=m1m2r 2. 3) В теории информации энтропия используется в качестве меры упорядоченности системы и определяется как сумма H=-Zp, log p,, (/=1,...,п), где p, - вероятность состояния; число возможных состояний (Zp,=1); п - число состояний [9]. В логарифмической метрике 1п(Пх,а') = Za, lnx,, т.е. сумма и произведение одинаково информативны с точностью до метрики.
Критерий эволюции универсален и справедлив для широкого класса моделей природы и общества. Построенные на его основе решения могут быть использованы при разработке интеллектуальных компонентов информационных систем, способных самостоятельно принимать целесообразные решения на различных уровнях управления.
Литература
1. Алексеев Б.В. Множественность стационарных состояний каталитической реакции / Б.В. Алексеев, Н.И. Кольцов // Известия ВУЗов. Хим. и хим. технол. 1983. № 12. С. 26, 1437-1440.
2. Алексеев Б.В. Стехиометрические условия неустойчивости каталитических реакций / Б.В. Алексеев, В.Х. Федотов, Н.И. Кольцов // ДАН СССР, 1989. Т. 306. № 4. С. 884-888.
3. Андронов А. А. Теория колебаний / А. А. Андронов, А. А. Витт, С.Э. Хайкин. М.: Наука, 1981.
4. Гленсдорф П. Термодинамическая теория структуры, устойчивости и флуктуаций / П. Гленсдорф, И. Приго-жин. М.: Мир, 1973.
5. Киперман С.Л. Введение в кинетику гетерогенных каталитических процессов / С.Л. Киперман. М.: Наука, 1964.
6. НиколисГ. Самоорганизация в неравновесных системах / Г. Николис, И. Пригожин. М.: Мир, 1979.
7. Федотов В.Х. Трехстадийные осцилляторы в гетерогенном катализе / В.Х. Федотов, Б.В. Алексеев, Н.И. Кольцов // Известия ВУЗов. № 5. 1985. С. 28, 66-68.
8. Федотов В.Х. Критерий множественности стационарных состояний одномаршрутных каталитических реакций / В.Х. Федотов, Н.И. Кольцов, Б.В. Алексеев // ДАН СССР, 1988. Т. 302. № 1. С. 126-131.
9. Шеннон К. Работы по теории информации и кибернетике / К. Шеннон. М.: ИЛ, 1963.
ФЕДОТОВ ВЛАДИСЛАВ ХАРИТОНОВИЧ - кандидат химических наук, доцент кафедры информационных систем экономического факультета, Чувашский государственный университет, Россия, Чебоксары fvh@inbox.ru).
FEDOTOV VLADISLAV KHARITONOVICH - candidate of chemical sciences, assistant professor, Chuvash State University, Russia, Cheboksary.