Научная статья на тему 'Управление динамическими активными системами при нечеткой информации о положении цели и состоянии природы'

Управление динамическими активными системами при нечеткой информации о положении цели и состоянии природы Текст научной статьи по специальности «Математика»

CC BY
102
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Управление динамическими активными системами при нечеткой информации о положении цели и состоянии природы»

Управление динамическими активными системами при нечеткой информации о положении цели и состоянии природы

Базуткин В. В.

(Институт проблем управления РАН; Москва)

1. Введение

В настоящее время, когда рыночные отношения стали частью нашей жизни внимание исследователей направлено на поиск новых путей решения сложных экономических задач. Неотъемлемой частью данной проблематики является изучение и разработка механизмов управления в акгивных системах (АС) Ниже исследуются возможности использования качественных суждений для обеспечения оценки начальных возможных состояний и выбора управления в динамических АС Решение детерминированных задач при условии полной информированности [3] позволило перейти к развитию исследований недетерменированных процессов в АС, описываемых интервальной [2], вероятностной [1] и нечеткой [6] неопределенностями

Предложенный в данной статье метод расширяет возможности использования техники анализа нечеткой неопределенности и дает реальный способ использования математически формализованного принятия решений в динамических АС

2. Описание модели

#

Рассмотрим задачу нахождения области начальных данных, максимально принадлежащих решению задачи синтеза оптимального управления динамической АС в условиях нечеткой информации на выполняемые действия и на конечное состояние системы.

Введем следующие предположения и обозначения

1.1. - - моменты времени

1.2. Управляющий орган (центр) руководит выполнением действий активного Ъ цемента (АЭ).

%

1.3. Центр выбирает в момент времени і управление и/ , І є{1,2,.„,Н}.

1.4. АЭ выбирает в момент времени і действие уь', кс={1,2,...,М}.

1.5. Центр получает к моменту времени і доход Хі

А

1.6. Доход центра х* выражается через доход хм , действия уь' и управление и,"1, следующим образом:

Хг=1(Хм, Ук 1 » Щ1'1).

Как частный случай возможного представления функции дохода через действие и управления можно рассматривать функцию:

і-1

«Г I |Г.(у‘)-Х .(и*)1,

где К,(ув) - функция дохода центра в момент времени 8, х*(и*) - функция затрат на управление АЭ для побуждению его к выбору у* при управлении и*

1.7. Информация о предпочтениях АЭ на множестве возможных действий отражается функцией принадлежности ц (ук', иі1) [3,4]

Качественно это означает, что выбор и исполнение АЭ действия ук! происходит в соответствии с возможностями стимулирования центром выбора АЭ действия с помощью управления и/.

1.8. — известная заранее функция принадлежности дохода центра в момент времени N.

1.9. Функция принадлежности дохода центра в начальный момент неизвестна

и

Она обозначается ц(х«).

3. Постановка задачи

ъ

Задача заключается в:

1) оценке области начальных состояний, задаваемой функцией Ц(хо);

2) выборе возможного управления центра, задаваемого набором величин

4. Основной алгоритм

Для определения начальной области, используя подход, предложенный • . ® * • Беллманом « Заде [7], можно использовать следующий алгоритм

Степень достижения цели при заданныхпарах; «действие - управление» <у°,и°),,..

к || *

,(уч ,»иК ), определяется функцией

|Д * тт|ц(уа, и0), \х(у\ и1),..., ЦСУ14 \ У*’), )|

принадлежности цели

* * •• * * ; « 4 , 4 •> :• ,

Так как желательно, чтобы степень этой принадлежности была как можно больше, нужно найти максимум по всех парам (у*\ и0),,.. ,(ук')

\х- тах тЩ^(уФ»и0Шу1«н1Ь«*мИ(у1ЧЛим'|),ц(жн)]

•* * . , ■

• *• * ' • * * у

Обозначение та* Х(у‘, и1)

(у1. У)

подразумевает. что в ¡-Й момент времени, действие у* выбирается из у/,уД ум‘ а

• • ■ •

управление и* из и і',..., йь,..»« ин

Вычисление максимального значения по паре (у1'11,и41) из числа «(у14'1,«14'1) и не

.* • *' *

• • 1. . • ф

•' • - * • . | к; • • т • .в

зависящег о от нее Ь можно произвести следующим образом

I * * * . •

тах тт^у^1,^1), Ь пин | шах а(уГЧ1,и141), Ь | (1)

. Г ’ » * .* * « 4

о4' .а-*')

• • ‘ * 4 4 ' • | ,

Сделаем некоторые преобразования в соответствии с (I) и с учетом того, что ЖгН(**и ,у141, и141)

Получим:

У 85 шах шіп[ц(у°, и0), |і(у\ и1),.«., Ц(у* \ и14!), ц(х N )) =

і • ' .*• V •• і • • • ■ ** уд

(/, и*)... ¿у"-' ,и*‘)

таї тах тіп |ц(у", и"), ц(у1, и').-. М<УМ ')> И( ^»N1 ,У''и" ') )|

(>". »V.,(/ (у" V)

таж тіп (ц(ув. »*). ^(У1.«1).".., и14 2), тах [^(у”1, и'"),

(у», «V. ,(У* V2) <>">"")

И Ч*м і, у^.У1') )Ц*

■пах Ш1п|ц(у“. и*),ц(у‘, и'),..., ц(у"2, и”2), ц(хм , )|

(у“, и»)...' .и"1)

В последнем равенстве сделано обозначение

Ц(х* I )“ шах |ц((уми”'), ц( Г(хк I, у14и"') )|

(/•V)

Функцию ц(1м-1 ) можно интерпретировать как функцию максимальной принадлеж-носги получаемого (М-1)-го результата или как ограничения на область допустимых значений на (М-1)-ом шаге, выраженных через функцию 1)

Действуя по аналогии, можно рекуррентно посгроить из (!Ч-1)-ой функции О функцию ц(жма) и далее, продолжая последовательно находить значения функций ц(14> В итоге приходим к функции ц(хо) .

Кроме того, если мы выбираем начальное состояние хо. то последовательно находим пары — действие плюс управление (у0, и0),... ,(у'41 ,11*4 которые максимизируют функцию принадлежности

Чтобы найти (у0, и®), путем перебора найдем то значение (уД и”), которое дает максимальную величину

аИп(ц(ук*, ц (4*0, у*> И|°))1

Таким образом, мы получаем значения параметров к и I и, следовательно, (у°, и°) Далее определяем

И(1#

и находим (у1 *и!). Продолжая рекуррентно эту процедуру, получаем (у2,и2), (у\и3),..., <У*1

5. Заключение

В рамках принятого в теории активных сисгем описания функционирования АС (3,6], данная работа предлагает алгоритм построения системы управления динамическими активными системами при нечеткой информации о положении цели и состоянии природы . Этот подход интересен тем, что отталкиваясь от уже известного алгоритма, разработанного Заде-Беллманом [7], он дает его новое понимание и предлагает построение динамическою управления и оценки поведения АС Используемая мотель дискретное время, нечеткое огп» лние нречпочтеиий

экономических агентов в зависимости от дискретного набора выбираемых д^й» им-n и стимулирования, рекуррентное представление дохода управляющего органа нечем и** определение терминального положения цели - дает способ математической формализации задач Использование этого способа исследования позволим предложить алгоритм динамического программирования для нахождения в нечеткой форме зависимости функции при над нежности начального состояния oi конечною и при выборе начальных условий определить последовательность оптимальных управлений

Литература:

[1] Бурков В.И., Еналеев А К,, Новиков ДА. Механизмы стимулирования к

%

вероятностных моделях социально-экономических систем /Автоматика и телемеханика 1993, N11. ( .3-30,

[2] Бурков В.Н., Еналеев АЖ, Новиков Д А. Механизмы функционирования социально экономических систем с сообщением информации //Автоматика и телемеханика 1996

N3. С. 3-25.

[3] Бурков В. Н., Новиков Д. А . Введение в теорию активных систем. М.: ИПУ РАН ¡996.

* ' *

[4] Кофман А.В. Введение в теорию нечетких множеств. М.: Радио и связь, I9S/

[5] Орловский С А. Проблемы щтнятия решений njm нечеткой исходной информации М.: Наука, 1981.

» *

[6] Новиков Д.А. Механизмы стимулирования в моделях активных систем с нечеткой неопределенностью. М.: ИПУ РАН, 1997.

[7] Bellman RE., Zadeh LA Decision making in fuzzy environment //Mcmagment Science 1970. Vol. 17В. P. 141-164.

i Надоели баннеры? Вы всегда можете отключить рекламу.