Научная статья на тему 'Управление распределением ресурсов в мультиагентной среде c P2P взаимодействием на основе модели аукциона'

Управление распределением ресурсов в мультиагентной среде c P2P взаимодействием на основе модели аукциона Текст научной статьи по специальности «Экономика и бизнес»

CC BY
196
80
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Управление распределением ресурсов в мультиагентной среде c P2P взаимодействием на основе модели аукциона»

Иващенко А.В., Леднев А.М.

УПРАВЛЕНИЕ РАСПРЕДЕЛЕНИЕМ РЕСУРСОВ В МУЛЬТИАГЕНТНОЙ СРЕДЕ C P2P ВЗАИМОДЕЙСТВИЕМ НА ОСНОВЕ МОДЕЛИ АУКЦИОНА

Современные тенденции в области автоматизации управления распределением ресурсов состоят в применении интеллектуальных средств поддержки принятия решений, которые строятся по аналогии с биологическими системами, позволяющими реализовать природные механизмы самоорганизации [1] . Например, в настоящее время широко распространены мультиагентные архитектуры и технологии, использующие, в частности, пиринговые (P2P) принципы организации взаимодействия между активными программными компонентами [2, 3].

При решении практических задач с применением данного подхода часто бывает необходимо обеспечить такое взаимодействие участников (акторов или агентов), при котором будут реализовываться либо оптимизационные стратегии, либо обеспечивающие равновесие по Нэшу. При этом реализация прямого управления не может быть выполнена, так как субъект управления не имеет возможности явно определять поведение объекта управления, который представляет собой в общем случае сеть попарно взаимодействующих активных программ.

Таким образом, актуальной является задача разработки организационных моделей взаимодействия, определяющих такие правила обмена информацией, при выполнении которых система в целом обеспечивает решение оптимизационных задач в рамках решаемой проблемы. Таких моделей может быть разработано достаточно много, однако, среди общего множества необходимо выделить отдельный подкласс аукционов, в которых основное взаимодействие построено вокруг конкурентной борьбы за ресурсы.

В этой области можно предложить новую идею управления взаимодействием центра с участниками аукциона путем определения динамических характеристик процесса торгов, основанную на применении методов и средств управления взаимодействием в многоакторной интегрированной информационной среде

[4], описанию которой посвящена данная статья.

Рассмотрим сеть акторов, объединяющих лица, принимающие решения, или их представителей в виде программных агентов. В такой сети выделим центр, который в разные интервалы времени выставляет некоторые ресурсы (лоты), интересные акторам в разной степени. Целью центра является обеспечение максимального суммарного выигрыша от реализации всех лотов за некоторый интервал времени. Аукционом будем называть публичную продажу одного лота по заранее установленным правилам, определяемым центром перед началом аукциона. Победителем аукциона становится актор, выигравший аукцион в соответствии с его правилами. Целью актора является приобретение максимального количества лотов наибольшего интереса при минимальных затратах.

При проведении торгов центр может выбирать различные формы аукциона (в зависимости от решаемой задачи). Например, аукцион может быть открытым, когда участники видят ставки всех своих оппонентов, или закрытым, во время проведения которого участники не видят ставки своих оппонентов и не могут изменять свои ставки. При проведении закрытого аукциона заявки подаются «в конвертах» -каждый участник напрямую, не разглашая публично, сообщает центру размер своей ставки. Также выделяют английский, голландский и скандинавский аукционы. Английский аукцион является самым распространенным и предусматривает пошаговое увеличение цены покупателями до того момента, пока не останется единственный победитель. В голландском аукционе торг начинается с максимально высокой цены и ведется с ее понижением, пока не найдется покупатель, согласный купить по объявленной цене. В скандинавском аукционе торги ведутся с фиксированным заранее определенным шагом повышения цены, возможность сделать ставку является платной, а победителем признается участник, сделавший последнюю ставку до момента окончания торгов.

В задачах распределения ресурсов (например, планирования в транспортной логистике) необходимо выбрать такую модель аукциона, которая бы позволяла наиболее эффективно «продавать» поступающие заказы исполнителям. Основным критерием эффективности в данном случае может выступить комбинация показателя уровня сервиса (суммарного отклонения от выполнения заказов в срок) и загрузки транспорта (суммарного пустого пробега). В данном случае каждый заказ может выступать в качестве лота, а водители - в качестве участников аукциона.

Отметим, что, естественно, в данном случае не идет речь о проведении реального аукциона между водителями. Модель аукциона используется для имитационного моделирования взаимодействия в много-акторной среде и позволяет обеспечить оптимизационные стратегии при реализации распределенных алгоритмов планирования, например с использованием мультиагентных платформ. Стратегической целью проведения такого аукциона является дополнительная «загрузка» ресурсов, при этом могут увеличиваться риски невыполнения заказов, а итоговое расписание в общем случае не будет консистентным.

В связи с этим, наиболее результативным для центра будет проведения закрытого английского аукциона первой цены. В такой схеме центр будет выстраивать взаимодействие с участниками аукциона по схеме P2P, сообщая им текущую цену и предложившего ее ожидаемого победителя и интервала времени, в течение которого будут собираться контрпредложения. Каждый участник такого аукциона в ответ может повысить цену и инициировать новую итерацию. Аукцион завершается в случае, если контрпредложения перестают поступать.

В таком аукционе центр может управлять лишь временными характеристиками процесса сбора заявок, аналогично тому, как при проведении реального аукциона ведущий увеличивает паузы между первым, вторым и третьим ударами молотка. Такое поведение в реальности провоцирует участников аукциона повышать ставки наперегонки, а в многоакторной среде стимулирует информационное взаимодействие.

Таким образом, предлагается 1) при решении задач организации эффективного распределения ресурсов в распределенной многоакторной среде предлагается использовать модель закрытого английского аукциона первой цены; 2) в качестве основного механизма управления распределением ресурсов в условиях применения выбранной модели аукциона предлагается варьирование интервалов времени торгов по каждому лоту.

При практической реализации описанной выше схемы в задачах автоматизации управления распределением ресурсов может быть полезной также модель распродажи. В настоящее время во многих магазинах существует практика проведения распродаж в несколько этапов. На каждом последующем этапе стоимость товара уменьшается на определенное количество процентов. Таким образом, с одной стороны магазин пытается как можно быстрее избавиться от застаревшего товара, обновив прилавки и получив максимальную прибыль, с другой стороны покупатели хотят купить товар по меньшей стоимости. Покупатель не может быть уверен, что нужный ему товар (его размера, цвета и т. д.) не будет куплен кем-то другим в ближайшее время, и что данный этап распродажи не является заключительным. Также магазин может вовсе не понижать дальше цену на определенные товары, тем самым, сделав выжидательную тактику покупателя бессмысленной.

Таким образом, получаем задачу единовременных множественных аукционов в несколько итераций с единым центром и неопределенным количеством акторов. Существенным упрощением по отношению к рассмотренной выше модели аукциона является отсутствие возможности акторов влиять на стоимость товара, указывая свои предложения. В этом случае время решения становится еще более определяющим фактором. Заметим, что постоянное значение параметра стоимости в ставке актора не влияет на возможность влиять на итоговую стоимость. В случае, когда акторы не проявляют интереса (не делают ставки), центр вынужден сильнее снижать цену на товар, чтобы его стали покупать.

В ходе имитационных экспериментов, проведенных с использованием мультиагентной системы, моделирующей взаимодействие в многоакторной интегрированной информационной среде, которая была построена на платформе J2EE, была подтверждена возможность увеличения итоговой стоимости лота в случае, когда центр успевает провести больше итераций путем изменения времени каждой итерации.

Во время розыгрыша каждого лота центр давал время, через которое акторы должны были сделать новые ставки. Среди предложенных ставок по итогам итерации выбиралась максимальная, относительно которой акторы снова делали ставки. В условиях, когда ставка будет сделана в любом случае, ставки делали все акторы. В игре принимали участие два актора (с увеличением количества акторов, цена лота будет возрастать). Величина ставки каждого актора определялись относительно начальной стоимости лота, путем прибавления случайной величины, имеющей усеченный нормальный закон распределения .

В первом случае (без управления) длительность итераций была одинакова и, с учетом реального времени, в 41% лотов было проведено 3 итерации, а в 59% лотов - 4 итерации. Во втором случае центр получил возможность управления длительностью итерации, при этом в обоих случаях ни центр, ни игроки не знали времени, отведенного на розыгрыш лота.Центр уменьшал время последующей итерации пропорционально приросту уровня ставки. Чем больше была сделана ставка, тем быстрее центр проводил итерации. В результате в среднем за время розыгрыша лота успевало проходить от 5 до 15 итераций.

Рассмотренная модель аукциона представляется полезной, прежде всего, при построении автоматизированных интеллектуальных систем управления распределением ресурсов в транспортной логистике [5], при планировании производства, управлении сервисными службами. Также весьма перспективным выглядит применение данной модели в системах документооборота при организации виртуальных площадок согласования спорных решений в составе распределенной системы поддержки принятия решений между экспертами разной специализации.

ЛИТЕРАТУРА

1. Leitao P. Holonic rationale and self-organization on design of complex evolvable systems.HoloMAS 2009, LNAI 5696, 2009. - Springer-VerlagBerlinHeidelberg - pp 1 - 12

2. Gorodetsky V.,KarsaevO.,Samoylov V., Serebryakov S.P2P agent networks / Springer"LectureNotesinArtificialIntelligence", 2009. - vol.5319. - pp.41- 54

3. Gorodetsky V.,KarsaevO.,Samoylov V., Serebryakov S.Agent-based distributed decision makingin dynamicP2P environment / Intelligent decision technologies(IDT):An InternationalJournal, 2009. - Volume3

4. Иващенко А.В. Управление согласованным взаимодействием пользователей интегрированной информационной среды предприятия / Самара: Самарский научный центр РАН, 2011. - 100 с.

5. Lednev A. Mobile P2P taxi service / MSc Dissertation, University of Surrey. - 2010. -75 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.