Научная статья на тему 'Метод автономного адаптивного управления'

Метод автономного адаптивного управления Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
898
326
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Метод автономного адаптивного управления»

Применение градиентного метода определения нечеткого экстремума позволяет установить нечеткие подмножества X', соответствующие экстремуму нечеткой функции Ь'(х;,х2,...,х;), описывающей изменение '-го компонента вектора В состояний ВХР.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Егупов Н.Д., Гаврилов А.К, Коньков ВТ., Милов Л.Т., Мочалов И А., Мышляев Ю.К, Трофимов А.И. Методы робастного, нейронечеткого и адаптивного управления: Учебник / Под ред. Н.Д. Егупова; изд 2-ое, стереотипное. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. - 744с.

2. Мелихов А.Н., Берштейн Л.С., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой - М.: Наука, 1990. - 272с.

3. Дюбуа Д., Прад А. Теория возможностей: Пер. с французского В.Б.Тарасова / Под редакцией С.А.Орловского - М.: Радио и Связь, 1990. - 288с.

4. . ., . ., . .

исходной информации. - М.: Энергоатомиздат, 1991. - 240с.

5. Асатурян В.И. Теория планирования эксперимента. - М.: Радио и связь, 1983.

УДК 519.7

А.А. Жданов

МЕТОД АВТОНОМНОГО АДАПТИВНОГО УПРАВЛЕНИЯ Введение. Подавляющее большинство автоматически управляемых техни-

, , -нием теории управления, построенной на аналитическом понимании законов механики и физики. Этот «классический» подход к управлению строится на том, что положение точки (объекта управления) в пространстве признаков известно абсо-

.

( ).

Однако при всей изощренности наработанного математического инструментария, областью применения «классических» методов управления остаются сравнительно простые объекты управления с очевидными свойствами. Попытки аналитически описать более тонкие свойства объектов управления (технических и, тем более, ), , , быстро приводят к катастрофическому усложнению математических моделей. Ситуацию в целом не спасают ни эвристические приемы, ни повышение эффективности вычислительной техники. На практике объекты управления, которые плохо ,

, . развивается «неклассический» подход в теории управления. Такие «неклассиче-» -странстве признаков, а лишь как некоторую информацию об этой «точке» (со. . ).

. -

, ,

.

,

систем управления - нервных систем живых организмов. Нервные системы реализуют некоторые универсальные принципы обращения с эмпирической информацией и универсальные поисковые алгоритмы. Мы видим, что один и тот же мозг живого организма успешно решает самые разнообразные задачи (так мозг птицы позволяет ей и балансировать на одной ноге, и обходить препятствия, и управлять полетом, и решать еще мно-).

. ,

управления является разработка единых принципов построения универсальных адаптивных систем управления на естественных основаниях.

Однако, к сегодняшнему дню это «неклассическое» направление распалось на многие ветви, далеко ушедшие друг от друга: экспертные системы, нейронные сети, системы нечеткой логики, системы с подкрепляющим обучением, искусственная жизнь и другие. По-видимому, эти ветви просто отражают разные стороны рассматриваемых естественных систем управления, либо разные фазы их эволю-. , , описывающую принципы функционирования естественных систем управления и механизмы их эволюции. В своей работе мы идем именно этим путем, разрабатывая концептуальную модель нервной системы, которую мы называем системой «Автономного адаптивного управления» (ААУ) [1-26].

1. Концепция подхода «автономного адаптивного управления» (ААУ). Создавая управляющую систему (УС) как модель нервной системы мы отталкиваемся от ее наблюдаемых свойств. Эти свойства служат условиями для разработки как макро-, так и микроструктуры УС.

1.1. «Условие автономности» - требует рассматривать УС как подсистему ( ), -вающую знания, необходимые для управления. В свою очередь, ОУ является подсистемой среды. Рис.1 показывает УС, ОУ и среду как соответствующие подмно-,

выходных полюсов подсистем к их входным полюсам (белыми кружками показаны также истоки воздействий, а черными кружками - стоки). Из такого понимания системы видно, что УС управляет не только ОУ, но всей системой «Среда - ОУ -», , -щают часть воздействий, что в целом порождает случайные составляющие в процессе функционирования системы.

Рис.1

1.2. «Условие дискретности». Мы знаем, что строение нервных систем во многих отношениях дискретно: нейроны, нервные волокна, нервные импульсы, датчики, исполнители и т.д. Однако, в нервной системе имеются и непрерывные процессы, которые могут помочь при решении КР-полных задач.

1.3. «Условие максимальной начальной приспособленности» отражает невозможность создания УС, обладающей способностью адаптироваться к любым предъявленным ей ОУ и среде. Это условие требует максимального использования априорной информации для возможно более полного начального приспособления как ОУ, так и УС к условиям существования. В биологии эта начальная приспособленность осуществляется эволюционным приспособлением видов.

1.4. «Условие минимума начальных знаний» отражает тот факт, что нервная система новорожденного организма обладает относительным минимумом знаний и должна в течение жизни накапливать знания, необходимые для управления, т.е. быть адаптивной УС.

,

функции:

a) выживание организма;

b) стремление к накоплению новых знаний.

Все остальные целевые функции (потребности) являются подчиненными указанным двум и их производными.

Из названных условий и целевых функций вынужденно следует, что искомая УС должна решать следующие определенные взаимосогласованные задачи:

• находить во входных данных, поступающих от датчиков, неслучайную,

,

и среде (эту задачу мы называем задачей формирования образов. В математике ей близка задача автоматической классификации, кластеризации. Сформированные образы запоминаются в «Памяти образов»);

• -ванные образы - задача распознавания образов;

• обнаруживать специальные образы - знания, отражающие неслучайные причинно-следственные связи событий в системе, которые можно использовать для управления, и запоминать их в «Базе знаний» - задача получения и представле-

;

• , « »;

• вырабатывать эмоциональные оценки для сформированных образов, за-

, -;

• под влиянием указанных выше целевых функций (выживания и накопления знаний) на основе данных нескольких разделов памяти таких, как «Память

», « » ., в терминах образов и их эмоциональных оценок, принимать решения в каждый текущий момент времени - задача многоуровневого и иерархического управления.

,

систем не могут претендовать на звание моделей нервных систем, если они строятся не на решении всего комплекса перечисленных здесь задач. Безусловно, для прагматических целей можно строить адаптивные (тем более не адаптивные) системы управления только на основе решения одной-двух из названных задач. При-

меры таких систем: искусственные нейронные сети, системы нечеткой логики, экспертные системы, системы обучения с подкреплением.

Если строить УС, содержащую в себе подсистемы, решающие названные выше задачи, то УС должна будет иметь следующие состав и структуру (рис.2).

Рис.2

Опираясь на описанные представления о структуре и функциях искомой УС, мы разрабатываем модели, соответствующие схеме (см. рис.2). Каждая подсистема УС здесь является адаптивной самообучаемой системой. В целом такая система является самообучаемым распознающе-управляющим комплексом.

Придерживаясь указанной схемы, можно конструировать системы ААУ на базе различных технологий. Однако, использование традиционных математических методов для решения названных подзадач, является, по-видимому, наиболее ,

, , или их свойства меняются в процессе управления. Применение традиционных искусственных нейронных сетей (ИНС) для построения систем ААУ возможно, в частности, для блока датчиков и распознающей подсистемы, поскольку при использовании ИНС можно обойтись без математической формализации ОУ. Однако, ИНС имеют проблему «катастрофического забывания» и их использование в , , -

.

, .

,

для решения совсем иных задач.

Для синтеза систем ААУ мы используем специально разработанные нами модели нейронов [6,11,15]. Основная идея этих нейронов состоит в следующем. Биологический нейрон является самообучаемой системой автоматической классификации. Известно такое свойство пластичности синапсов, которое заставляет ускоренно расти только те синапсы, по которым приходят коррелирующие сигналы. Это свойство является ключевым моментом, позволяющим нейрону отыскивать коррелирующие события в системе, в том числе неслучайные причинно. , -, . Даже наиболее простой вид корреляции, когда с нулевой временной задержкой

коррелирует определенное большинство входных сигналов нейрона, позволяет строить множество практически полезных прикладных систем ААУ.

Такая наиболее простая модель нейрона показана на рис.3.

пи

Рис.3

С помощью блока Rw нейрон выделяет некоторый класс воспринимаемых сигналов (в простейшем случае - это вектор, состоящий из одних единиц). В блоке lw подсчитывается статистика наблюдений такого вектора и определяется, достаточно ли накопленной статистики для того, чтобы сказать, что этот вектор не случаен. Если нейрон понимает, что данный вектор неслучаен, нейрон переходит в новое состояние, при котором он теперь способен «узнавать» данный вектор -распознавать образ. В режиме распознавания блок Rw узнает образ, блок lw подтверждает, что это неслучайный образ, и триггерный блок Tw переключается, выдавая на выход нейрона сигнал Ow t+1=1, говорящий о том, что образ Ow был распознан. Этот выходной сигнал будет существовать до тех пор, пока он не будет воспринят другими нейронами или подсистемами УС. Тогда, такие нейроны пошлют сигнал Sw =1, и триггер сбросится. Вот логическое выражение, описывающее работу данного нейрона:

о w+1 = - S w & (( b w & l w) V о w) and S wi = b w & l w & g w.

Сеть из таких нейронов может собираться произвольно, например, так, как , .4.

к другим подсистемам УС

Рис.4

В процессе работы системы некоторые нейроны обучаются. В каждый момент времени некоторые из обученных нейронов могут распознавать свои образы. Процесс обучения нейронов, как и процесс распознавания образов, идет по слоям шаг за шагом.

, , для формирования специальных образов, отражающих неслучайные причинно. « », выходные действия Yi влияют на прообразы известных ей («сформированных») .

В силу бинарности информации, такое влияние (в сходных условиях) может состоять в одном из трех вариантов: действие вызывает распознавание образа О,, либо действие вытесняет ранее распознанный образ О,, либо данное действие на данный образ не влияет.

« »

({Ои }‘-2 ; Ytl ; {От } ), где {Ои }г~2 - множество распознанных или нераспознанных образов, описывающих состояние системы в момент /-2; Yti'1 - есть идентификатор (образ) действия, совершенного УС в момент /-1; {От } - есть множество распознанных или нераспознанных образов, описывающих состояние системы в момент /.

,

«Условие в момент ^ » —► Действие в момент 12 »^> «Результат в момент 13 ». (1)

Эта импликация представлена тремя пространственно-временными событиями. Образ такой неслучайной тройки, если он сформирован, является элементарным знанием управляющей системы. Такое знание запоминается в подсистеме «База знаний» управляющей системы в специальной структуре. «База знаний» (БЗ)

« ».

Заполнение БЗ (обучение УС) происходит в процессе наблюдения за предысторией эволюции УС. Для обучения УС не так уж и важно - совершает ли УС действия специально с целью обучения (напомним о целевой функции “накопление знаний ”) или с целью выживания - знания накапливаются во всех этих случа-.

Прежде чем принимать решения, для УС следует задать или УС сама должна определить качественные оценки элементам знаний - образам и действиям. Такие оценки определят разное качество альтернативных вариантов эволюции сис-, -.

« ». . -

зы и состояния мы окрашиваем в цвета эмоций, и хотим при любых обстоятельствах только одного - добиться, чтобы качество нашего состояния в будущем было максимальным из возможного для нас. В любой ситуации мы делаем то, что счи-« ». , .

« ». -системой закреплено много функций. В частности, эта подсистема:

1) , -низму наследственным путем;

2)

от оценок распознанных образов;

3) вырабатывает качественные оценки для вновь сформированных образов путем поиска корреляций с текущей оценкой состояния ОУ;

4) содержит в себе аппаратно «зашитое» стремление УС к повышению качественной оценки текущего состояния;

и некоторые другие функции.

Тем самым, «подсистема эмоций» является одновременно источником по-стояной внутренней активности УС и «учителем» в процессе самообучения.

« » :

a) множества распознанных образов (это составляет «условие» в тройке

(1));

b) анализа набора возможных действий и их последствий, записанных в БЗ;

c) критерием принятия решений служит «подсистема эмоций», заставляющая УС выбирать то действие из всех возможных, которое обещает максимально повысить оценку текущего состояния, т.е. способно вызвать образы с наилучшими оценкам, либо вытеснить образы с наихудшими оценками;

В целом управляющая система ААУ представляет собой единый распо-знающе-управляющий комплекс. УС в одном процессе осуществляет самообучение и управление. В рамках этого комплекса взаимосогласованно решаются сле-:

• автоматическая классификация (задача таксономии);

• ;

• ;

• ;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• ;

• ;

• .

Основное свойство систем ААУ состоит в следующем. При помещении такой УС в объект управления и в среду, свойства которых заранее плохо известны ( . . ,

),

данной системой и постепенно улучшает этот способ.

2. Проблемы метода ААУ и в озможности их преодоления. Основная теоретическая проблема нашего подхода состоит в отсутствии в настоящее время четкой процедуры построения УС ААУ для всякого заданного конкретного приложения. Мы имеем своего рода конструктор из нейронов и общую схему УС. Действующие приложения пока собираются эвристически. Причина отсутствия четкой процедуры построения УС достаточно глубокая. Объясним ее на следующем примере. В составе УС имеется система автоматической классификации. Как извест-,

( ) . .

.

, , алгоритм, который будет искать эти порождающие правила методом проб. В нервной системе таким правилам, порождающим классы образов, соответствует топология нервной сети и параметры нейронов. А поисковым алгоритмом построения топологии сети в природе является естественный эволюционный отбор. Отсюда вывод: регулярная эффективная процедура синтеза УС ААУ для задаваемых приложений должна содержать в себе поисковый алгоритм определения топологии , .

В нейроноподобных сетях системы ААУ одному нейрону соответствует один образ в отличие от стандартных ИНС, где образу соответствует выходной

вектор. Поэтому сети ААУ являются семантическими, а адаптивность УС ААУ связана не только с адаптивными свойствами самих нейронов, но и с избытком нейронов в ее нейросетях, поскольку в исходный момент множество нейронов соответствует множеству пробных образов. Аналогичное свойство наблюдается и у биологических нервных систем. Отмечается, что множество нейронов мозга «из» , -ется только небольшая часть нейронов. В природе топология нервной системы формируется в основном не самим организмом, а длительным процессом эволюционного отбора при формировании вида. Такую «априорную» настройку топологии конкретной УС ААУ мы можем выполнить двумя способами:

• -

;

• посредством эволюцион ных поисковых алгоритмов, которые симулируют природный процесс эволюционного отбора.

Второй путь может быть автоматизирован, что делает его весьма перспек-.

,

оптимизированы с помощью поисковых эволюционных алгоритмов, которые могут симулировать этап эволюционного развития «вида» данного ОУ и его УС.

,

сетей УС ААУ в процессе ее работы. Такие возможности нами исследуются. В биологии это соответствует перестройке нервной сети в пренатальный (до рождения) и постнатальный (после рождения) периоды жизни организма.

В настоящее время нами разрабатываются версии системы ААУ, использующие в своем составе возможности, предоставляемые такими технологиями, как: генетические алгоритмы [21], нечеткая логика [2], детерминированный хаос [19], искусственные нейронные сети.

3. Практические приложения на основе систем ААУ. На основе метода ААУ нами были разработаны прототипы адаптивных систем управления для раз. -

,

постепенно развивала его, повышая качество управления. Во всех случаях схема УС была одинакова (см. рис.2). Отличия касались только топологии нейронопо-, , -ределялась содержательным смыслом приложения, а также заданными критериями . .

«РПо1» - адаптивная система управления угловым движением космического аппарата [4,10,13,16,17].

«АаСА8» - -

портного средства [24,26].

«Многоуровневая нейроноподобная система управления моделью сердечно-сосудистой системы» - моделирует адаптивные механизмы управления в сердечно-сосудистой системе [25].

«Мобш1ьный робот Гном №8» - адаптивная система управления для модели мобильного робота, демонстрирующая возможность автоматической выработки стереотипов поведения при обходе препятствий [23].

«Тактик» - система поддержки принятия решений при управлении социальными объектами [10].

Заключение. На основании опыта разработки прикладных систем ААУ мы убеждены в перспективности и полезности подхода, поскольку он позволяет строить практически полезные адаптивные системы управления без разработки точных математических моделей объектов управления, что обычно составляет большую часть стоимости разработки систем управления.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Zhdanov A.A.. Application of Pattern Recognition Procedure to the Acquisition and Use of Data in Control.// Pattern Recognition and Image Analisis vol.2, N2,1992, pp. 180-194. (ISSN: 1054-6618).

2. Zhdanov A.A. A principle of Pattern Formation and Recognition.// Pattern Recognition and Image Analisis vol.2, N3,1992. - C.249-264. (ISSN: 1054-6618).

3. Жданов АЛ. Накопление и использование информации при управлении в условиях неопределенности. Сборник научных трудов ИФТП РАН ^^^фо^^^^^тонная технология и численные методы анализа pacnpeflenenHbix систем". - М.:1992. - С.112-133.

4. . ., . ., . . -

ного управления в системе угловой стабилизации космического аппарата "Спектр РГ". Сборник "Информационная бионика и моделирование" (п.ред. акад. Лупичева Л.Н.), Изд-во ГосИФТП, 1995. - С.87-114.

5. . . .

" ". " " .

- М.: 1996. - С.171-206.

6. . . -

. " ". проблеме "Кибернетика" РАН. Выпуск 3. - М.: 1997. - С.258-274.

7. . . // . . . -

ственный интеллект в технических системах. - М.: Гос.ИФТП, 1997. - С.142-157.

8. Zhdanov A.A. About an Autonomous Adaptive Control Methodology. ISIC/CIRA/(ISAS'98), NIST, Gaithersburg, Maryland. September 14-17, 1998, pp.227-232.

9. Zhdanov A.A. The Mathematical Models of Neuron and Neural Network in Autonomous Adaptive Control Methodology. WCCI’98(IJCNN’98), IEEE World Congress on Computational Intelligence, Anchorage, Alaska, May 4-9, 1998, pp.1042-1046.

10. Жданов АЛ., Норкин НЛ., Гуриев МЛ. Некоторые практические приложения метода

// . . . -нических системах. Вып. № 19. - М.: Гос.ИФТП, 1998. - С.72-99.

11. . . // . Теория и системы управления, 1999, № 5, - С.127-134.

12. Zhdanov A.A., A.N. Vinokurov, Emotions Simulation in Methodology of Autonomous Adaptive Control. 1999 -14th IEEE International Symposium on Intelligent Control /Intelligent Systems and Semiotics ISIC/ISAS'99. Special session Emotions and Intelligent Systems. September 15-17, 1999, Cambridge, Massachusetts, USA. Paper 99-002I-6.

13. . ., . ., . . -

. . 1999. 1.

- М.: Биоинформсервис, 2000. - С. 66-83. (англ. том. Zhdanov A.A., S.V. Arsenjev, V.A. Polovnikov, On autonomous adaptive control methodology.// Proceedings of the Russian Academy of Sciences Institute for System Programming. N 1, 1999, pp.55-70).

14. . ., . .

. // . . . « -

ских системах». Вып. № 20. - М.: Гос. ИФТП, 1999. - С.111-146.

15. A.A. Zhdanov, A. V. Ryadovikov. Neural Models in the Autonomous Adaptive Control Method. Optical Memory and Neural Networks. Vol. 9, No. 2, 2000. pp.115-132.

16. Жданов АЛ., Беляев Б.Б. Принципы построения системы управления угловым движением космического аппарата на основе имитации нервной системы. Сб. тезисов докладов XXV академических чтений по космонавтике, Москва, 24-26 января 2001 г. - М.: Война и мир, 2001. - С.126-127.

17. . ., . ., . . -

мизации нейросетевой базы знаний адаптивной системы стабилизации углового движе-

. . XXV -

монавтике, Москва, 24-26 января 2001 г. - М.: Война и мир, 2001. - С.128-129.

18. Жданов АЛ., Крыжановский М.В., Преображенский Н.Б. О возможности создания систем автономного искусственного интеллекта.// Интеллектуальные и многопроцессорные системы-2001// Тезисы докладов Международной научной конференции. - Таганрог: Изд-во ТРТУ, 2001. - С.245-248. ISBN 5-8327-0089-9. '

19. Жданов АЛ., Устюжанин А.Е. Возможности использования технологии детерминиро-

. // -темного программирования: Том. 2. - М.: ИСП РАН, 2001. - С.141-179.

20. . ., . . . Нейрокомпьютеры: Разработка, Применение. № 2, 2001.

21. ZhdanovA.A., L.V. Zemskikh. The Evolutionary Growth of Neural Networks for the Autonomous Adaptive Control System. // The 5th World Multiconference on Systemics, Cybernetics and Informatics (SCI 2001) and the 7th International Conference on Information Systems Analysis and Synthesis (ISAS 2001), Orlando, USA, July 22-25, 2001. pp.404-409, 2001.

22. Жданов АЛ., Караваев M.B. Применение нечеткой логик и в имитационной системе ав-

. // : Том. 3. - М.: ИСП РАН, 2002. - С.119-135*.

23. . ., . ., . . -

. " -цессорные системы" IMS’2002. - С.115-118. Кацивели.

24. www: http://www.ispras.ru/~zhdanov

25. www: http://www.inria.msu.ru/ru/

26. www: http://www.atssoft.com/

УДК 658.512.2.011.56

..

МЕТОД РАСЧЕТА НАПРЯЖЕНИЙ В НЕСИММЕТРИЧНЫХ СПАЯХ СТЕКЛА С УПРУГИМ МАТЕРИАЛОМ

Значение разработки методов расчета напряжений в спаях стекол с металлами, керамикой и другими материалами для практических целей известно [1,2]. В настоящей статье приведен алгоритм расчета напряжений и деформаций в плоском несимметричном спае, температура которого изменяется во времени, и результаты расчетов по предложенному алгоритму сопоставлены с эксперименталь-.

Здесь рассмотрены спаи, для которых отношение ширины к длине не превышает 0.2, а отношение суммарной толщины к длине - 0.05. В этом случае, как показывает анализ [3], можно пренебречь краевыми напряжениями и выбрать в качестве модели рассматриваемой системы многослойную полосу. Рассмотрим напряжения и деформации в полосе (рис.1), состоящей из т жестко соединенных (без проскальзывания) слоев, физические характеристики которых в общем случае

i Надоели баннеры? Вы всегда можете отключить рекламу.