УДК 681.3
МЕТОД КОМПЕНСАЦИЙ ДЛЯ ПОДДЕРЖКИ ПРОЦЕССОВ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ДИНАМИЧЕСКОМ РАСПРЕДЕЛЕНИИ РЕСУРСОВ
© 2002 П.О. Скобелев Институт проблем управления сложными системами РАН, г. Самара
Рассматривается метод компенсаций для поддержки принятия решений о динамическом распределении ресурсов в системах, функционирующих в реальном времени. Предлагается создание муль-тиагентных систем с миром агентов заказов и ресурсов, способных оперативно воспринимать ситуацию, принимать решения, коммуницировать и устанавливать связи между собой. Для принятия и пересмотра решений агенты получают возможность предлагать компенсации, что приводит к установлению нового баланса интересов за счет перераспределения прибыли между вновь приходящими и имеющимися агентами системы. Рассматриваются достоинства и ограничения метода и показывается возможность его применения для широкого круга приложений.
Введение
Традиционно проблема распределения ресурсов рассматривается и решается в случае, когда все ресурсы и потребности в этих ресурсах известны заранее. Однако существующие рыночные условия настолько нестабильны, что, как правило, спрос на ресурсы и предложение ресурсов подчиняются весьма изменчивым и непредсказуемым процессам, а сами ресурсы и заказы могут появляться и исчезать в заранее непредвиденные моменты времени. При таких условиях алгоритмы размещения и реализации заказов должны включать в себя возможности для частого и быстрого перераспределения ресурсов, с чем плохо справляются обычные подходы [1-3].
Динамическое распределение ресурсов является проблемой, при которой ресурсы, которые необходимо разместить и/или спрос на эти ресурсы непредвиденным образом изменяются в процессе принятия решений. Мультиагентные системы [4-5] могут рассматриваться как основа для создания более эффективных методов и средств для динамического распределения и перераспределения ресурсов при постоянно изменяющемся спросе и предложении. Агент является программным объектом, обладающим способностью автономно существовать и "разумно" общаться с другими объектами, что предполагает наличие возможностей создавать со-
общения; посылать их другим агентам или людям; интерпретировать входящие сообщения; действовать над ними некоторым образом. Мулътиагентная система (МАС) рассматривается как система, состоящая из агентов соревнующихся или кооперирующихся между собой, в зависимости от ситуации, с целью дать возможность системе выполнить поставленную задачу.
При этом главной особенностью предлагаемого в статье подхода становиться самоорганизация заказов и ресурсов, при которой вместо централизованного решения задачи и построения полностью оптимального плана действий, каждый заказ и каждый ресурс должен самостоятельно принять решение, какой из возможных вариантов взаимодействия ему подходит, и изменить свое принятое ранее решение, если находится вариант для его улучшения.
Под самоорганизацией при этом понимается возможность системы автономно видоизменять уже существующие и/или устанавливать новые связи между ее компонентами с целью повышения значения критерия эффективности ее существования или восстановления после повреждения. В контексте распределения ресурсов любое автономное изменение связи заказ-ресурс рассматривается как шаг в самоорганизации.
Примеры различных областей, где требуется постоянное динамическое распределе-
ние ресурсов, включают:
1. Производственная логистика - установление места и времени нахождения материалов или компонентов на производственных мощностях (сборочные устройства, конвейеры, металлообрабатывающие станки и т.д.) в условиях неопределенности, создаваемой постоянными изменениями спецификаций производимых продуктов и поведением поставщиков и потребителей.
2. Планирование Работы Персонала -распределение задач для персонала в условиях быстро развивающегося рынка.
3. Е-коммерция - распределение доступных товаров и услуг (предложение) в соответствии с требованиями клиентов (спрос), когда клиенты и/или поставщики неожиданно появляются или покидают торговую площадку.
4. Управление Знаниями - распределение записей по кластерам в ситуациях частого обновления баз данных.
5. Понимание текста - размещение (приписывание) смыслов (значений) к словам в процессе непрерывного диалога между человеком и машиной
Мир заказов и ресурсов МАС для поддержки процессов принятия решений
Для поддержки процессов принятия решений в мультиагентных системах строится специальный виртуальный мир "ресурсов-заказов", в котором агенты заказов и ресурсов могут динамически устанавливать и разрывать связи между собой [6-7]. При этом агенты заказов ищут наилучшие варианты реализации своих заданий с наилучшим качеством, минимальной ценой и в заданный срок, а агенты ресурсов стремятся повысить коэффициент своего использования и, наоборот, получить максимально возможную прибыль. В результате агенты заказов и ресурсов составляют диалектическую пару противоположностей, которая находится в постоянной "борьбе и единстве": агенты заказов могут конкурировать за агента некоторого ресурса или наоборот агенты ресурсов могут конкурировать между собой за агента некоторого заказа. С другой стороны, несколько агентов ресурсов могут скооперироваться для выпол-
нения некоторого сложного заказа, равно как и несколько агентов заказов могут скооперироваться для уменьшения цены некоторого ресурса. Наконец, нашедшие друг друга заказы и ресурсы, вступившие по обоюдному согласию в связь между собой, представляют собой временно образование, существующее до момента исполнения некоторого проекта (работы), которое может иметь довольно сложную иерархическую структуру, поскольку ресурсы для обеспечения своей жизнедеятельности могут в свою очередь генерировать новые заказы на субподрядные работы и т.д.
Виртуальный мир предприятия состоит из агентов заказов и ресурсов, способных взаимодействовать между собой. Состояние агентов, зафиксированное в мире в некоторый момент времени, будем называть сценой мира. Агенты в сцене виртуального мира могут быть свободными (располагать ресурсом и не иметь связи), и в этом состоянии они активно ищут связи с другими агентами, постоянно осуществляя поиск взаимного соответствия (матчинг) с потенциальными партнерами (как мужские и женские особи, разноименные заряды и т.д.). Для этого они находят потенциальных кандидатов, сопоставляют варианты по методу четкого (полного) или нечеткого матчинга (частичное совпадение свойств), принимают решения о выгодности того или иного варианта и делают предложения выбранному партнеру. Однако связь устанавливается только в том случае, если партнер также согласен и для него данный вариант является лучшим из всех имеющихся в его положении в данный момент времени. При этом для агента устанавливается состояние "доволен" (что будет отображаться на рисунках далее выражением его символического "лица"), если ценность его варианта выше, чем например средний показатель удовлетворенности агентов на рынке, и "не доволен", если наоборот, ниже этого показателя (для нечеткого матчинга это также может быть степень соответствия агентов друг другу - полностью или частично совпало три свойства из пяти, или же все пять). Степень неудовлетворенности агента является одним из стимулов к пересмотру вариантов.
Если свободный активный агент исследовал весь рынок и обнаружил, что для него нет никаких возможностей для установления связи, он переходит в состоянии покоя или бездействия ("сна") и будет ожидать прихода сообщения с предложением от другого агента или появления любого другого важного события, связанного с каким-либо изменением в сцене (когда такое происходит, агент "пробуждается" и становится активным, а вновь "успокаивается" и "засыпает", когда вся цепочка переговоров других агентов, вызванная некоторым событием, например, приходом нового пользователя, затихает). Кроме того, в состояние покоя переходят и агенты, установившие отношения с другими агентами, которые заводят "будильник" и ждут инициализации по таймеру до момента возобновления своей активности - для агента детали в логистике, например, когда придет срок ее поставки на конвейер. В случае "пробуждения" по сообщениям к классу агентов в первую очередь будятся свободные агенты, во вторую - недовольные агенты, и в третью -довольные (для возможного пересмотра и их вариантов по методу компенсаций).
Рассмотрим взаимодействие агентов на простом примере (рис.1). Здесь имеются 7 агентов, которые пытаются осуществить мат-чинг и установить отношения между собой. Здесь белым цветом выделены агенты заказов, а серым - ресурсов. Видно, что два агента слева нашли друг друга, удовлетворены условиями сотрудничества (улыбаются) и установили отношение (непрерывная стрелка), три агента в группе в центре рисунка также удовлетворены условиями (улыбаются) и находятся в стадии принятия решения и установления отношений (пунктирная стрелка), а группа справа - в стадии принятия решения (пунктирная стрелка), но не удовлетворены условиями (грустят), возможно, что и вовсе не подходят друг другу и вынуждены будут расстаться. Обратим внимание, что здесь также показана возможная активность с каждой из сторон, как от заказов к ресурсам, так от ресурсов к заказам (направление стрелки).
В мире "заказов-ресурсов" основные действия агентов связаны с процедурами мат-
Рис.1. Сцена простейшего виртуального мира: матчинг агентов заказов (белые) и ресурсов (серые)
чинга (поиска соответствия между собой) и принятия или пересмотра решений, установления и разрыва связей. Для этого также агенты должны иметь возможность запрашивать друг У друга значения необходимых параметров, находить в онтологии правила принятия решений и методы вычислений значений сложных параметров, проводить требуемые расчеты значений этих параметров, а также создавать вспомогательных агентов заказов или ресурсов, если это необходимо.
Метод компенсаций для динамичного распределения ресурсов
Предположим, что мультиагентная система решает задачу постоянного размещения производственных ресурсов по заказам. При этом заказы прибывают в систему одна за другим и время прибытия заказов и их характеристики непредсказуемы, более того, некоторые заказы могут отзываться из системы. Также и ресурсы могут оставаться постоянными или изменяться и даже исчезать из системы в силу потери или поломки.
Каждый ресурс R характеризуется:
- рядом характерных чертf (тип изделия, материал и т.д.);
- его цена с, которая выражается в условных денежных единицах (условных единиц
- у.е.) и назначается самим ресурсом в зависимости от ситуации на рынке;
- себестоимость ресурса s (не изменяется, причем с > s).
Прибыль ресурса Profit (R) рассматривается как сумма прибылей от выполнения каждого заказа Profit (R) = S(c (Oi) - s (Oi)), где c (Oi) - стоимость ресурса для заказа Oi, а s (Oi)
- себестоимость выполнения этого заказа.
Накапливая прибыль, ресурс может принимать заказы и по цене, меньше чем себестоимость.
Каждый заказ O характеризуется:
- набором характерных черт g (желаемый тип изделия, материал и т.д);
- его покупательная способность p выражается денежными единицами (у.е.);
- объемом средств г, которые он может потратить на получение ресурса в данный момент времени, r < p.
Прибыль заказа Profit (O) определяется как сумма прибыли от каждого подзака-за, т.е. разница между объемом средств, имеющихся на покупку данного ресурса и его текущей ценой Profit (O) = S (r (Ri) - c (Ri)), где r (Ri) - резерв на покупку ресурса Ri для данного заказа, а c (Ri) - принятая заказом цена данного ресурса.
Пусть каждый заказ и ресурс имеют определенные критерии для принятия решений, например, максимизируют свою прибыль. Тогда правило принятия решения, т.е. выбора ресурса со стороны заказа, есть правило выбора предложения с минимальной ценой Min (c), а правило для ресурса, в случае, когда для него есть много предложений - как выбор заказа с максимальным предложением Max (r). Принятие решения при этом будет простейшим, состоящим в том, чтобы выбрать минимум или максимум по одному из параметров. Заметим, что в дальнейшем агенты могут применять и сколь угодно более сложные критерии и методы оптимизации, если для этого есть время. Главная проблема, решаемая в настоящем подходе, состоит не в том, как именно принять оптимальное решение (проблема выбора - лишь третий этап), а в том, чтобы реализовать за заданное время все основные этапы процесса принятия решений, о которых писал Саймон [8].
Введем теперь общий критерий Value (i), отражающий "общественную ценность" варианта для системы на i-ом шаге. Этот критерий призван частично погасить "эгоистические" устремления агентов, локально оптимизирующих свою прибыль без учетов своего окружения. В простейшем случае, это может быть, например, общая прибыль системы, или скажем срок, на который станок должен
быть выведен из оборота для его ремонта или регламента. Агенты смогут устанавливать новые связи и принимать или пересматривать свои решения только в том случае, если Value не уменьшается, а увеличивается, т.е. Value (i) > Value (i+1).
Общий алгоритм метода компенсаций для динамического распределения ресурсов тогда выглядит следующим образом:
1. Как только заказ входит в систему, ему назначается агент. Агент заказа посылает сообщение всем агентам, отвечающим за имеющиеся в наличии ресурсы, заявляя, что ему необходим такой-то ресурс с определенными характеристиками g, и что он может заплатить за этот ресурс определенное количество денежных единиц r.
2. Все агенты, обладающие ресурсами с указанными свойствами g, или лишь несколькими из указанных свойств (в случае частичного матчинга), и со стоимостью, которая меньше или равна названному количеству денежных единиц, начинают предлагать эти ресурсы Агенту потребности, т.е. r > с и при этом каждый ресурсов выбирает предложение с Max (r).
3. Из получаемого множества предложений, Агент заказа выбирает наиболее подходящий ему ресурс в соответствие с заданными ему критериями и методом принятия решений, например, определяя Min (c).
4. Если подходящего ресурса нет в наличии, Агент заказа старается заполучить в свое распоряжение ресурс, который был уже отдан другому заказу, предлагая тому заказу компенсацию, максимальный размер которой к не превосходитp - c.
5. Агент заказа, которому предлагается компенсация к, рассматривает это предложение. Компенсация принимается только в том случае, если она позволяет заказу приобрести другой устраивающий его ресурс, для чего необходимо новое резервирование ресурсов на сумму, и в то же время повысить общую ценность системы (например, итоговую прибыль системы). Если предложение принято, Агент заказа реорганизует связи - ранее установленные отношения между заказом и ресурсом разрушаются, а новые отношения между другим заказом и свободным ресурсом
устанавливаются, тем самым, повышая общую ценность системы.
6. Процесс, описанный выше, повторяется до тех пор, пока все ресурсы не становятся связанными с заказами, и никакое дополнительное изменение во владении ресурсом не сможет более увеличить ценность системы Value или до тех пор, пока не закончится время, отведенное для распределения.
7. Если заказ или ресурс удаляются из системы, они посылают сообщение и разрывают связи, освобождая партнера от обязательств, вследствие чего освободившийся партнер начинает заново осуществлять поиск вариантов своей реализации.
Этот метод реализует важные принципы самоорганизации, позволяющие децентрализованным образом осуществлять динамическое распределение ресурсов в любой открытой системе, в которой имеется постоянный приток новых заказов, от транспортной и производственной логистики - до понимания смысла фраз предложений на естественном языке.
Пример применения метода в транспортной логистике
Рассмотрим пример организации перевозок грузов транспортными средствами с использованием. механизма самоорганизации и варианта переговоров с взаимными компенсациями. Пусть имеется некоторая сеть городов и дорог, а также два транспортных средства, осуществляющие перевозки в данной сети (рис.2). Один из этих перевозчиков является более мощным (имеет грузоподъемность 100 тонн) и более тихоходным (скорость 10 км/час), а второй - менее мощным, но более скоростным (с грузоподъемностью 10 тонн при скорости 15 км/час). Соответственно стоимость перевозки первым перевозчиком равна 7 условных единиц за 1 км, а вторым - 3 условные единицы.
Ситуация 1.
Пусть 15 сентября в систему приходит первый заказ на перевозку груза в 5 тонн из пункта A в пункт D на расстояние 500 км с ценой 15 000 условных единиц и дедлайном 20 сентября. Предположим, что перевозчик 1 в текущий момент уже свободен и уже на-
A 500 B
Рис.2. Сеть городов и дорог (числа - условные расстояния)
ходится в пункте Е, а перевозчик 2 завершает исполнение принятого ранее заказа в пункт С.
Для планирования исполнения этого заказа создается Агент заказа 1. Этот Агент посылает запрос на перевозку указанного груза обоим перевозчикам. В ответ каждый из перевозчиков рассматривает запрос и посылает Агенту заказа свои предложения.
Первый перевозчик готов приступить к исполнению запроса немедленно, он свободен и ждет заказов. Для этого перевозчика предварительно потребуется перемещение из пункта Е в пункт А (300 км). Стоимость исполнения заказа при этом составит (300 + 500)-7=5600 у.е., а срок исполнения -(300+500)/10=80 часов, т.е. примерно 4 суток.
Второй перевозчик также вполне успевает прилететь в пункт А и исполнить данный заказ, но для этого ему потребуется сначала доисполнить текущий заказ. Если в данный момент перевозчик 2 находится в пункте О, то ему потребуется пройти маршрут О -С - О - А и его срок исполнения заказа составит (250 + 250 + 250 + 500)/15=83,3 часов,
A B
Рис.3. Начальное состояние сети и маршруты перемещения дирижаблей в пункт исходного расположения груза
т.е. также примерно 4 суток, при цене (250 + 250 + 500)-3=3000 у.е. Прибыль в случае второго перевозчика составит 12000 у.е., а в случае первого - 10 400 у.е.
Очевидно, что по критерию прибыльности Агент заказа 1 выберет второго перевозчика, хотя ему и дольше лететь к пункту А. Заметим, что в случае другого критерия, например, по критерию равномерности распределения перевозчиков по сети или их средней загрузке или необходимости своевременного профилактического осмотра у второго перевозчика, мог бы быть выбран и первый перевозчик.
Таким образом, каждый из перевозчиков рассмотрел ситуацию для себя и рассчитал свою определенную цену и сроки в зависимости от своих параметров, и второй перевозчик, который более легкий и компактный, предложил и лучшую цену. Агент заказа, в свою очередь, принял это предложение с учетом своих требований и предложенной наилучшей цены. В результате между заказом и перевозчиком (ресурсом) в системе возникла первая связь (рис.4), обусловленная бронированием перевозчика для исполнения первого заказа.
Ситуация 2.
Предположим теперь, что через час в систему пришел новый срочный заказ на транспортировку груза, в соответствие с которым требуется перевести груз весом 8 тонн из пункта С в пункт В на расстояние 150 км с ценой 20 000 условных единиц и дедлайном 17 сентября.
В этой ситуации из переговоров агентов быстро выясняется, что только второй перевозчик может выполнить заказ. Действительно, первому потребуется (500 + 300)/10 = 80 часов, т.е. примерно 3,5 суток, что больше срока дедлайна. Второму же перевозчику нужно будет (250 + 300) / 15 = 36,6 часов, т.е. около 1,5 суток. Однако перевозчик 2 уже забронирован заказом 1. В данной ситуации обращение заказа 2 к перевозчику 2 вызывает "волну" (цепочку) переговоров: перевозчик 2 должен обратится к заказу 1 с предложением разрешить ему реализовать заказ 2 и определить размер компенсации, который он должен получить за такое разрешение, который покро-
Заказ 1 1,2 |_____| Перевозчик 1 (21)
Перевозчик 2 (22)
Рис.4. Обнаружение заказом двух перевозчиков (ресурсов) и бронирование второго перевозчика для транспортировки груза: 1 - запрос к первому перевозчику, 2 - ответ и предложение от первого перевозчика, 3 - запрос второму, 4 - ответ и предложение от второго, 5 - выбор варианта второго перевозчика и его бронирование
ет все его расходы на бронирование первого и бронирование второго вариантов перевозок, если таковой найдется.
Для этого заказ 1 вновь обращается на рынок перевозчиков со своим предложением - и в ответ получает уже рассчитанное ранее предложение от перевозчика 1, которое вполне устраивает заказ 1 по срокам исполнения. Вместе с тем, прибыль по данному варианту оказывается существенно меньше той, что была ранее (10400 против 12000). Резонно, что заказ 1 попросит у заказа 2 по возможности компенсировать разницу (1600), что заказ 2 вполне может сделать, поскольку его прибыль от перевозки груза составит 20 000 - (250 + 300)3 = 18 350. Заметим, что здесь запрошенный размер компенсации первому заказу существенно меньше, чем прибыль второго заказа - если бы эти суммы были бы сопоставимы, то могла бы быть задействована любая другая стратегия (например, деления общей прибыли пополам или пропорционально стоимости заказов и т.д.). В результате достижения "договоренности" устанавливается новый баланс интересов и происходит разбронирование перевозчика 2 и бронирование перевозчика 1 для первого заказа. Теперь перевозчик 2 получает возможность исполнить заказ 2.
Ситуация 3.
Рассмотрим теперь несколько иную ситуацию. Пусть первый перевозчик исполняет полученный заказ А - Б (и пройдено уже 100 км), а второй перевозчик только что освободился в точке В (сразу заметим, что в условиях быстрых изменений планировать на
Заказ 1 8,9
Заказ 2 6, 11
Перевозчик 1 (21)
Перевозчик 2 (22)
перевозчик лишних 250 км. Вариант принимается и общая ситуация компании улучшается еще на 250 долларов - хотя первый дирижабль при этом "лично" страдает в угоду повышения общей прибыли компании (в определенных случаях полученная дополнительная прибыль может быть и поделена между перевозчиками, отчасти компенсируя первому перевозчику лишение части заказа).
Рис.5. Приход второго заказа и перебронирование второго перевозчика для второго заказа с выплатой компенсации: 6 - запрос ко второму перевозчику, 7 - переадресация предложения первому заказу, 8 - запрос к первому перевозчику, 9 - положительный ответ и предложение, 10 - разрешение на перебронирование второго перевозчика, 11 - согласие и предложение с суммой компенсации первому заказу
большой период времени вперед не эффективно - поэтому агенты в данном примере планируют свою загрузку на один контракт-шаг вперед). Никаких новых заказов пока нет.
Освободившийся ресурс (перевозчик 2) немедленно начинает искать новые возможности для приложения своих сил. Теперь уже он проявляет инициативу и активность и посылает запрос всем заказам (в данном случае заказу 1): есть ли возможность еще повысить его прибыль? В ответ заказ 1 обнаруживает точку О возможной пересадки и посылает запрос на перевозку из О в Б для второго перевозчика.
Второй перевозчик делает свои расчеты по перевозке груза первого перевозчика из О в Б. Такая перевозка будет стоить (250 + 250)-3= 1500 у.е. Та же перевозка на первом перевозчике потребует 250-7=1750 у.е. Если перегрузка ничего не стоит, то можно сэкономить 250 у.е., хотя придется гнать второй
500
В
500
Рис.6. Новое начальное положение дирижаблей
Выводы и заключение
Рассмотренный метод предназначен для построения мультиагентных систем массового обслуживания различных заказов в режиме реального времени, причем в условиях высокой неопределенности и большой динамики изменений, когда на получение полностью оптимальных решений не достаточно времени. Предполагается, что в любой такой системе непрерывно происходят следующие важные изменения, осуществляемые в заранее не предсказуемые моменты времени:
• приходит новый заказ, для которого требуется найти подходящие ресурсы, удовлетворяющие как заказчика, так и всех имеющихся исполнителей,
• появляется новый свободный ресурс (причем вводится новый или забронированный ранее вдруг становится свободным),
• "на ходу" изменяются цели, предпочтения или ограничения заказчика, например, пользователь может переменить свой приоритет с поиска вариантов минимальной цены на скорейший срок получения товара,
Заказ 1
о
Перевозчик 1 (21)
12,13,14
Перевозчик 2 (22)
Рис.7. Освобождение ресурса также вызывает пересмотр ситуации и перепланирование ресурсов в ходе исполнения заказа: 12 - освободившийся перевозчик инициирует выполняющийся заказ,
13 - выясняется, что перегрузка на второго перевозчика в точке О выгодна для первого заказа,
14 - дается подтверждение и бронирование второго перевозчика для перевозки с точки О груза в й,
15 - первому перевозчику дается извещение об изменении маршрута в точке О и необходимости перегрузки груза на второго перевозчика
• исчезает ранее забронированный или свободный ресурс (ресурс неожиданно выводится из системы или ломается и выходит из строя и т.д.),
• отменяется существующий, возможно уже даже запущенный в исполнение, заказ,
• изменяются критерии функционирования системы в целом (например, для сети производства автомобилей критерий получения максимальной прибыли на несколько месяцев может уступить место критерию высвобождения одной из линий конвейера для проведения ее ремонта и модернизации).
Суть предлагаемого метода состоит в том, чтобы ускорить процесс нахождения варианта за счет выбора первого подходящего варианта, повышающего общую ценность системы - но при сохранении возможности пересмотра ранее принятых решений при возникновении новых ситуаций, в которых возникает конфликт интересов между новыми и старыми заказами (решениями). Это означает установление некоторой структуры отношений между агентами и пересмотр этой структуры в ходе работы системы, причем этот конфликт и пересмотр отношений может осуществляться как внутри самой системы, так и требовать обращения к одному из потребителей, например, для удлинения сроков поставки за счет сокращения цены и т.д. Метод предусматривает выплату компенсаций за разрыв отношений, что означает динамического перераспределение прибыли между вновь приходящими и имеющимися заказами.
Из вышеприведенного описания ясно, что в процессе распространения "волны" переговоров и ре-переговоров (при пересмотре уже ранее заключенных договоренностей) мультиагентная система осуществляет постоянное динамическое перераспределение ресурсов между заказами и находит решения, которые:
1) постоянно учитывают возможное изменения ситуации, как-то появление новых заказов или отзыв уже имеющихся, возможный выход из строя существующих ресурсов, появление новых ресурсов на рынке и т.д.;
2) удобны для работы в условиях наращиваемых распределенных сетевых сред, в
которых участники могут взаимодействовать по принципам "каждый с каждый" и "равный с равным";
3) по возможности не ухудшают положение участников, в то же время обеспечивая улучшение ситуации (решения) компании в целом (ранее был только один заказ - теперь удалось разрешить конфликт и перераспределить ресурс и в результате прибыль по одному заказу дополняется прибылью по другому заказу). Система переходит от одного аттрактора, состояния устойчивого равновесия, к другому (в данной ситуации новые приходящие заказы могут долго не затрагивать существовавшие договоренности, и будет расти общая прибыльность);
4) первый вариант решения находится очень быстро (в простейшем случае берется первый подходящий), поскольку не требуется глобальная оптимизация, что особенно важно с ростом числа заказов и ресурсов; если же время на принятие решений имеется -возможно дальнейшее исследование более подходящих вариантов;
5) находится некоторый временный баланс интересов и компромисс между "личными" и "общественными" интересами каждого участника, заменяющий, как правило, недостижимый глобальный оптимум.
Таким образом, в рамках предлагаемого метода проблема неопределенности и динамического окружения решается за счет введения механизмов самоорганизации, связанной с обеспечением полной децентрализо-ванности и распределённости в процессах принятия решений путем введения автономных программных агентов и поддержкой двусторонней активности агентов, реализуемой как со стороны агентов заказов, так и агентов ресурсов, возможностью динамического установления связей и их пересмотра с согласия всех заинтересованных сторон.
При этом достоинства системы связаны не только с возможностью работы в условиях динамического окружения, но и высокой скоростью работы системы при неполной загрузке системы. Скорость системы замедляется лишь при полном пересмотре и переорганизации всех связей заказов и ресурсов, т.е. при переходе от одного аттрактора (со-
стояния устойчивого равновесия) к другому. Такие процессы связаны с лавинообразно развивающимися процессами по типу катастроф различного рода, с той лишь разницей, что система в результате восстанавливается и переходит в новое более устойчивое равновесие. Другим потенциальным недостатком системы является квазиоптимальность принимаемых решений, что во многих случаях является приемлемой платой за возможность работы в высоко неопределенных и динамических условиях, характерных для современной глобальной экономики.
Данные модели, методы и средства взаимодействия агентов реализованы в инструментальных программных средствах [5] и успешно применяются в целом ряде различных приложений [9].
СПИСОК ЛИТЕРАТУРЫ
1. Джонсон Р., Каст Ф., Розенцвейг Д. Системы и руководство: Теория систем и руководство системами. М.: Советское радио, 1971.
2. Емельянов С.В., Наппелъбаум Э.Л. Методы управления сложными системами. Принципы рациональности коллективного выбора // Техническая кибернетика. М.: ВИНИТИ, 1978. Т.10.
3. Саати Т., Кернс К. Аналитическое планирование. Организация систем. М.: Радио и связь, 1991.
4. Vittikh V.A., Skobelev P.O. Multi-agent systems for modelling of self - organization and cooperation processes // Proceedings of the XIII
International Conference on the Application of Artificial Intelligence in Engineering, Ireland, Calway,1998.
5. Batishev S. V., Ivkushkin C. V., Minakov I.A., Rzevski G.A., Skobelev P.O. MagentA MultiAgent Systems: Engines, Ontologies and Applications // Proc. of the 3rd Intern. Workshop on Computer Science and Information Technologies CSIT’2001, Ufa, Russia, 21-26 September, 2001. Ufa State Aviation Technical University - Institute JurInfoR-MSU. Regular Papers. 2001. Vol. 1.
6. Bummux B.A., Ржевский Г.А., Скобелев П. О. Мультиагентные модели взаимодействия в процессах принятия решений // Труды 4-ой Международной конференции по проблемам управления и моделирования сложных систем, Самара, 17-24 июня 2002. Самара: СНЦ РАН, 2002.
7. Андреев B., Батищев С., Ивкушкин К., Минаков И., Ржевский Г., Сафронов А., Скобелев П., Шамашов М. Принципы построения открытых мультиагентных систем для поддержки процессов принятия решений // Труды 4-ой Международной конференции по проблемам управления и моделирования сложных систем, Самара, 17-24 июня 2002. Самара: СНЦ РАН, 2002.
8. Simon H. The New Science of Management Decision. Harper and Row Publishers Inc., New York, 1960.
9. Скобелев П. О. Открытые мультиагентные системы для поддержки процессов принятия решений при управлении предприятиями // Известия Самарского научного центра РАН. Т3. 2001. №1.
METHOD OF COMPENSATIONS FOR DECISION MAKING SUPPORT IN DYNAMIC RESOURCE ALLOCATION PROBLEMS
© 2002 P.O. Skobelev
Institute for the Control of Complex Systems of Russian Academy of Sciences, Samara
Method of compensations for dynamic resource allocation in real time systems is described. The development of multiagent system with the world of demand and supply agents (which are able to percept current situation, make decisions, communicate and establish the relations between each other) is proposed as a solution. To negotiate and re-negotiate decisions the agents are able to propose compensations to each other, which establish the balance of interests as a result of income redistribution between existing and newly generated agents. Advantages and limitations of method are analyzed. The prospective applications for different problem domains are proposed.