Управление динамическими активными системами при нечеткой информации о положении цели и состоянии природы
Базуткин В. В.
(Институт проблем управления РАН; Москва)
1. Введение
В настоящее время, когда рыночные отношения стали частью нашей жизни внимание исследователей направлено на поиск новых путей решения сложных экономических задач. Неотъемлемой частью данной проблематики является изучение и разработка механизмов управления в акгивных системах (АС) Ниже исследуются возможности использования качественных суждений для обеспечения оценки начальных возможных состояний и выбора управления в динамических АС Решение детерминированных задач при условии полной информированности [3] позволило перейти к развитию исследований недетерменированных процессов в АС, описываемых интервальной [2], вероятностной [1] и нечеткой [6] неопределенностями
Предложенный в данной статье метод расширяет возможности использования техники анализа нечеткой неопределенности и дает реальный способ использования математически формализованного принятия решений в динамических АС
2. Описание модели
#
Рассмотрим задачу нахождения области начальных данных, максимально принадлежащих решению задачи синтеза оптимального управления динамической АС в условиях нечеткой информации на выполняемые действия и на конечное состояние системы.
Введем следующие предположения и обозначения
1.1. - - моменты времени
1.2. Управляющий орган (центр) руководит выполнением действий активного Ъ цемента (АЭ).
%
1.3. Центр выбирает в момент времени і управление и/ , І є{1,2,.„,Н}.
1.4. АЭ выбирает в момент времени і действие уь', кс={1,2,...,М}.
1.5. Центр получает к моменту времени і доход Хі
А
1.6. Доход центра х* выражается через доход хм , действия уь' и управление и,"1, следующим образом:
Хг=1(Хм, Ук 1 » Щ1'1).
Как частный случай возможного представления функции дохода через действие и управления можно рассматривать функцию:
і-1
«Г I |Г.(у‘)-Х .(и*)1,
где К,(ув) - функция дохода центра в момент времени 8, х*(и*) - функция затрат на управление АЭ для побуждению его к выбору у* при управлении и*
1.7. Информация о предпочтениях АЭ на множестве возможных действий отражается функцией принадлежности ц (ук', иі1) [3,4]
Качественно это означает, что выбор и исполнение АЭ действия ук! происходит в соответствии с возможностями стимулирования центром выбора АЭ действия с помощью управления и/.
1.8. — известная заранее функция принадлежности дохода центра в момент времени N.
1.9. Функция принадлежности дохода центра в начальный момент неизвестна
и
Она обозначается ц(х«).
3. Постановка задачи
ъ
Задача заключается в:
1) оценке области начальных состояний, задаваемой функцией Ц(хо);
2) выборе возможного управления центра, задаваемого набором величин
4. Основной алгоритм
Для определения начальной области, используя подход, предложенный • . ® * • Беллманом « Заде [7], можно использовать следующий алгоритм
Степень достижения цели при заданныхпарах; «действие - управление» <у°,и°),,..
к || *
,(уч ,»иК ), определяется функцией
|Д * тт|ц(уа, и0), \х(у\ и1),..., ЦСУ14 \ У*’), )|
принадлежности цели
* * •• * * ; « 4 , 4 •> :• ,
Так как желательно, чтобы степень этой принадлежности была как можно больше, нужно найти максимум по всех парам (у*\ и0),,.. ,(ук')
\х- тах тЩ^(уФ»и0Шу1«н1Ь«*мИ(у1ЧЛим'|),ц(жн)]
•* * . , ■
• *• * ' • * * у
Обозначение та* Х(у‘, и1)
(у1. У)
подразумевает. что в ¡-Й момент времени, действие у* выбирается из у/,уД ум‘ а
• • ■ •
управление и* из и і',..., йь,..»« ин
Вычисление максимального значения по паре (у1'11,и41) из числа «(у14'1,«14'1) и не
.* • *' *
• • 1. . • ф
•' • - * • . | к; • • т • .в
зависящег о от нее Ь можно произвести следующим образом
I * * * . •
тах тт^у^1,^1), Ь пин | шах а(уГЧ1,и141), Ь | (1)
. Г ’ » * .* * « 4
о4' .а-*')
• • ‘ * 4 4 ' • | ,
Сделаем некоторые преобразования в соответствии с (I) и с учетом того, что ЖгН(**и ,у141, и141)
Получим:
У 85 шах шіп[ц(у°, и0), |і(у\ и1),.«., Ц(у* \ и14!), ц(х N )) =
і • ' .*• V •• і • • • ■ ** уд
(/, и*)... ¿у"-' ,и*‘)
таї тах тіп |ц(у", и"), ц(у1, и').-. М<УМ ')> И( ^»N1 ,У''и" ') )|
(>". »V.,(/ (у" V)
таж тіп (ц(ув. »*). ^(У1.«1).".., и14 2), тах [^(у”1, и'"),
(у», «V. ,(У* V2) <>">"")
И Ч*м і, у^.У1') )Ц*
■пах Ш1п|ц(у“. и*),ц(у‘, и'),..., ц(у"2, и”2), ц(хм , )|
(у“, и»)...' .и"1)
В последнем равенстве сделано обозначение
Ц(х* I )“ шах |ц((уми”'), ц( Г(хк I, у14и"') )|
(/•V)
Функцию ц(1м-1 ) можно интерпретировать как функцию максимальной принадлеж-носги получаемого (М-1)-го результата или как ограничения на область допустимых значений на (М-1)-ом шаге, выраженных через функцию 1)
Действуя по аналогии, можно рекуррентно посгроить из (!Ч-1)-ой функции О функцию ц(жма) и далее, продолжая последовательно находить значения функций ц(14> В итоге приходим к функции ц(хо) .
Кроме того, если мы выбираем начальное состояние хо. то последовательно находим пары — действие плюс управление (у0, и0),... ,(у'41 ,11*4 которые максимизируют функцию принадлежности
Чтобы найти (у0, и®), путем перебора найдем то значение (уД и”), которое дает максимальную величину
аИп(ц(ук*, ц (4*0, у*> И|°))1
Таким образом, мы получаем значения параметров к и I и, следовательно, (у°, и°) Далее определяем
И(1#
и находим (у1 *и!). Продолжая рекуррентно эту процедуру, получаем (у2,и2), (у\и3),..., <У*1
5. Заключение
В рамках принятого в теории активных сисгем описания функционирования АС (3,6], данная работа предлагает алгоритм построения системы управления динамическими активными системами при нечеткой информации о положении цели и состоянии природы . Этот подход интересен тем, что отталкиваясь от уже известного алгоритма, разработанного Заде-Беллманом [7], он дает его новое понимание и предлагает построение динамическою управления и оценки поведения АС Используемая мотель дискретное время, нечеткое огп» лние нречпочтеиий
экономических агентов в зависимости от дискретного набора выбираемых д^й» им-n и стимулирования, рекуррентное представление дохода управляющего органа нечем и** определение терминального положения цели - дает способ математической формализации задач Использование этого способа исследования позволим предложить алгоритм динамического программирования для нахождения в нечеткой форме зависимости функции при над нежности начального состояния oi конечною и при выборе начальных условий определить последовательность оптимальных управлений
Литература:
[1] Бурков В.И., Еналеев А К,, Новиков ДА. Механизмы стимулирования к
%
вероятностных моделях социально-экономических систем /Автоматика и телемеханика 1993, N11. ( .3-30,
[2] Бурков В.Н., Еналеев АЖ, Новиков Д А. Механизмы функционирования социально экономических систем с сообщением информации //Автоматика и телемеханика 1996
N3. С. 3-25.
[3] Бурков В. Н., Новиков Д. А . Введение в теорию активных систем. М.: ИПУ РАН ¡996.
* ' *
[4] Кофман А.В. Введение в теорию нечетких множеств. М.: Радио и связь, I9S/
[5] Орловский С А. Проблемы щтнятия решений njm нечеткой исходной информации М.: Наука, 1981.
» *
[6] Новиков Д.А. Механизмы стимулирования в моделях активных систем с нечеткой неопределенностью. М.: ИПУ РАН, 1997.
[7] Bellman RE., Zadeh LA Decision making in fuzzy environment //Mcmagment Science 1970. Vol. 17В. P. 141-164.