Научная статья на тему 'Модели поддержки принятия решений в условиях неопределенности, сводящиеся к кооперативным играм'

Модели поддержки принятия решений в условиях неопределенности, сводящиеся к кооперативным играм Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
384
150
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ / НЕОПРЕДЕЛЕННОСТЬ / ТЕОРИЯ ИГР / КООПЕРАТИВНЫЕ ИГРЫ / ВЫСОКОПРОИЗВОДИТЕЛЬНЫЕ СИСТЕМЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Влацкая Ирина Валерьевна, Нестеренко Максим Юрьевич, Полежаев Петр Николаевич

В рамках настоящей работы описана информационная система поддержки принятия реше

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Влацкая Ирина Валерьевна, Нестеренко Максим Юрьевич, Полежаев Петр Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DECISION SUPPORT MODELS UNDER UNCERTAINTY WHICH REDUCED TO COOPERATIVE GAMES

This paper describes the decision support system under uncertainty on the basis of gaming simulation. It includes the model of management decision

Текст научной работы на тему «Модели поддержки принятия решений в условиях неопределенности, сводящиеся к кооперативным играм»

Влацкая И.В., Нестеренко М.Ю., Полежаев П.Н.

Оренбургский государственный университет E-mail: mois@mail.osu.ru

МОДЕЛИ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ, СВОДЯЩИЕСЯ К КООПЕРАТИВНЫМ ИГРАМ

В рамках настоящей работы описана информационная система поддержки принятия решений в условиях неопределенности на основе игрового моделирования. Она включает модель принятия управленческих решений в условиях конкурентных рынков, модель кооперации производителей одного товара в рамках технологического процесса, модель планирования вычислений в грид-системе, а также модель распределения расходов между членами кооператива. Каждая модель сводит задачу принятия решений к одному из вариантов кооперативных игр.

Ключевые слова: система поддержки принятия решений, неопределенность, теория игр, кооперативные игры, высокопроизводительные системы.

Введение

В наши дни в различных социально-экономических сферах деятельности человека часто возникают задачи принятия решений в условиях конфликтов и конкурентной борьбы, когда несколько, в общем случае, рационально действующих субъектов осуществляют коллективное принятие решений, причем выигрыш каждого зависит не только от выбранной им стратегии, но и от решений других участников и результатов экспериментов.

Среди направлений теории игр особое место занимают кооперативные игры [1, 2]. Существует множество задач принятия решений, сводимых к решению одного из варианта кооперативной игры: принятие управленческих решений в условиях конкурентных рынков, кооперация производителей одного товара в рамках технологического процесса, планирование вычислений в грид-системе и др. Каждая подобная задача описывается с помощью соответствующей игровой модели.

В рамках настоящей работы разработана информационная система поддержки принятия решений в условиях неопределенности на основе игрового моделирования, поддерживающая возможность решения различных классов игровых задач.

Описание информационной системы поддержки принятия решений в условиях неопределенности на основе игрового моделирования

В ходе проводимых исследований была разработана информационная система поддержки принятия решений (ИСППР) в условиях неопределенности на основе игрового моделирова-

ния. Ее физическая и логическая архитектура изображена соответственно на рисунках 1 и 2.

К числу аппаратных компонент настоящей системы поддержки принятия решений относятся: вычислительные кластеры и БМР-системы с предустановленными соответствующими версиями решающих модулей для различных классов игровых задач; центральный сервер, включающий все основные программные компоненты настоящей системы; компьютеры пользова-телей-ЛПР (ЛПР - лиц, принимающих решения) с установленными стандартными браузерами. Информационный обмен между данными аппаратными компонентами осуществляется через локальную сеть с использованием защищенных протоколов.

Логическая архитектура построена на сервисно-ориентированном подходе и включает следующие программные компоненты:

1. Решающие модули для конкретных архитектур параллельных вычислительных систем - кластеров и БМР-систем (симметричных многопроцессорных систем с общей памятью). Каждый подобный модуль, представляющий собой параллельную программу, реализует алгоритм решения определенного класса игр и учитывает особенности соответствующей вычислительной системы.

2. Сервис управления вычислениями, взаимодействуя с управляющими системами параллельной вычислительной техники, занимается помещением задач в очередь управляющей системы и отслеживанием их состояния. При отправке на решение новых задач с помощью сервиса передачи данных инициируется доставка входного файла на целевую вычислительную систему, а при завершении задач - доставка выходных данных

в базу данных системы. Циклически опрашивает состояние задач на всех подключенных вычислительных системах и сохраняет данные сведения в базу данных через сервис доступа к данным.

3. Web-приложение взаимодействия с пользователем содержит удобный дружественный интерфейс работы с ЛПР, обеспечиваемый соответствующими подсистемами постановки задачи игрового моделирования принятия решений, визуализации полученных результатов и отслеживания состояния задач. Реализация интерфейса взаимодействия с пользователем в виде Web-приложения дает ИСППР возможность доступа к нему через браузер пользователями с различными архитектурами их персональных компьютеров.

4. Сервис передачи данных при взаимодействии с сервисами сетевой передачи файлов вычислительной техники обеспечивает загрузку из хранилища данных входных файлов, необходимых решающим модулям, а также сохранение выходных файлов с результатами.

5. Сервис доступа к данным реализует доступ к данным, хранящимся в БД для других компонент системы с помощью ИЕБТ-подхода.

6. База данных используется для хранения поставленных задач, текущей управляющей информации, полученных результатов, профилей пользователей системы.

7. Управляющие системы параллельной вычислительной техники обеспечивают все стадии локальной обработки вычислительных

Центральный сервер ИСППР

ПЭ 1 ••• I Решающие модули

для ЗМР-системы

Общая память

SMP-cиcтeмы

Управляющая

система

Сервис сетевой передачи файлов

Сервис доступа к данным

База данных

Web-приложение взаимодействия с пользователем

Сервис передачи данных

Сервис

управления

вычислениями

LAN

Вычислительные узлы

ПЭ

Решающие модули для вычислительного кластера

Контролирующий

узел

Высокопроизводительная сеть

Вычислительные кластеры

Компьютеры пользователей-ЛПР

Рисунок 1. Физическая архитектура ИСППР

Обозначение:

ПЭ - процессорный элемент

ЛПР

Вычислительные кластеры

8МР-системы

Центральный сервер

Рисунок 2. Логическая архитектура ИСППР

ВЕСТНИК ОГУ №9 (145)/сентябрь'2012 145

задач - их прием, постановку в очередь, планирование, запуск, контроль исполнения и сохранение результатов. Управляющие системы в общем случае представляют собой стандартные автономные компоненты, способные параллельно выполнять задачи собственных пользователей вычислительной техники, которые не имеют отношение к данной системе поддержки принятия решений.

8. Сервисы сетевой передачи файлов являются стандартными компонентами параллельной вычислительной техники и обеспечивают безопасную передачу файлов, необходимых для запускаемых задач, а также получение результатов вычислений. Пример подобного сервиса - демон с поддержкой протокола БРТР.

В рамках ИСППР реализована поддержка возможности решения следующих теоретикоигровых задач принятия решений: кооперативные игры, заданные в виде биматричных игр между всеми возможными парами игроков или в форме характеристической функции; стохастические игры и статистические игры.

Опишем основные игровые модели принятия решений, сводящиеся к кооперативным играм.

Модель принятия управленческих решений в условиях конкурентных рынков

Имеется N фирм участниц олигополии, у I -й фирмы имеются издержки СI и объем выпуска товара Qi. Тогда формула прибыли будет иметь вид:

= ь&(& -(0[ + ••• + ^))-Рассмотрим возможность кооперации между фирмами и представим задачу принятия решений о максимизации прибыли фирм в виде кооперативной игры, заданной совокупностью биматричных игр между всеми парами игроков.

Всего таких игр будет CN = ~ и потребу-

ется ровно столько же пар матриц вида (для пары игроков х,У е1^,Х < У ):

к

Ст

АХ / Y =

К

Ст

(Ы +1)2 Ы(Ы +1)

--d

■-d

ьа2

(Ы + 2)2 4(Ы + 2)2

--d

--d

К

к

а2

Ст

(Ы +1)2 (Ы + 2)2

■-Л

ьа2

+1)

--Л

— Л

зьа2

4(Ы + 2)2

--Л

где Q0 - величина общего выпуска, при котором прибыль каждой фирмы отрицательна и равна -d. В этом случае в каждой парной би-матричной игре у каждого из игроков есть две стратегии: К - стратегия Курно («быть последователем») и Ст - стратегия Стекельберга («быть лидером»).

После задания кооперативной игры в виде совокупности биматричных игр вычисляется характеристическая функция V [2], для которой затем находится вектор Шепли.

Модель кооперации производителей одного товара в рамках технологического процесса

Пусть имеется некий товар. Для производства одной его единицы в рамках технологического процесса требуется а1 единиц первой его компоненты, а2 единиц второй, ..., ак единиц к-й, причем V/ = 1,к а/ е Z + и {0}.

Имеется п предприятий, выпускающих компоненты одного товара. Обозначим в качестве т,у- число единиц компоненты /, выпускаемых в единицу времени (день, месяц, год) на предприятии I.

Так как нередко случается, что у предприятий не хватает мощностей для одновременного выпуска всех компонент для сборки товара, то возможно сотрудничество между ними в целях совместного производства изделий.

Пусть К - некоторая коалиция предприятий, тогда очевидно функция выигрыша (количество совместно производимых товаров в единицу времени) может быть определена по формуле:

у(К) = тіп j=1,к

уєК

а у

Распределение выигрыша производится на основе вектора Шепли.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Модель планирования вычислений в грид-системе

Грид-система описывается множеством С = ^,...,йт} поставщиков (владельцев) грид-ресурсов (кластеров), которые связаны между собой через некоторую непроизводительную сеть.

Каждый кластер представляет собой однородную вычислительную систему и характеризуется следующим набором параметров:

й = (Щ.^М^,^),

где N е X+ - количество вычислительных узлов; Si > 1, Mi е X+, Di е X+ - соответственно относительная производительность, объемы оперативной и дисковой памяти всех его узлов; Qi сП -набор программных пакетов, установленных в При этом П = {щ,пк} представляет множество всевозможных пакетов, которые могут быть доступны в рамках всей грид-системы.

Положим, в системе выполняется единственная задача (параллельная программа). Пусть J = {Тртп} - набор ее независимых подзадач. Обозначим следующим образом заявку пользователя на ее исполнение:

оJ = (J,pJ> dJ) ,

где pJ е R+ - платеж пользователя за использование вычислительных ресурсов; dJ - верхняя граница окончания времени выполнения всей задачи.

Каждая подзадача т ], в свою очередь, характеризуется следующим набором параметров:

т,• = (nj>'tj>mj>dj>H j)

где nj е Z

количество запрашиваемых для

исполнения вычислительных узлов; I] > 0 -оценка времени выполнения на узлах единичной относительной производительности; т^ е X+, dj е X+ - требования к размерам соответственно оперативной и дисковой памяти вычислительных узлов; Н^ с П - набор необходимого для исполнения программного обеспечения.

Получив заявку о J, диспетчер для каждой подзадачи ту- е J и кластера е С определяет величину * (Т . , gi) - оценку времени исполнения т. на gi, а также с(т., gi) - финансовые расходы владельца на выполнение т ..

В настоящей работе предлагаются следующие формулы для задания данных функций:

г (Т;, gi) =

если N1 < п. V < ш. V < й. V —I Н с а),

—, иначе,

Si

С(т!, gi) =

если г(т : , gi ) =га,

Ш

Ачп]1(т], gi) + М + ср.-!- + £ ц(п),

иначе.

В формуле для ?(т ],Й1) условие Ni < П] V М1 < mj V Di < dj V —(Н] с Qi) учитывает случай, когда подзадача т^ не может быть выполнена на кластере , т. к. нет нужного количества вычислительных узлов, недостаточно дисковой, оперативной памяти узлов или не все необходимые программные пакеты установлены.

Коэффициенты Л1, Б1 и С1, значения Li( п) определяются владельцем кластера самостоятельно, исходя из стоимости обслуживания системы, расходов электроэнергии, затрат на амортизацию, рисков и т. п. Их значения передаются диспетчеру грид-системы.

Владельцы кластеров могут объединяться в коалиции (динамически формируемые вирту-

альные организации) с целью предоставления пользователю необходимых вычислительных мощностей для выполнения его программы в установленный срок dJ. Они это вынуждены делать, т. к. получат суммарный доход pJ, если программа завершится ранее установленного срока, и ничего не получат в противном случае.

Пусть 5К : J ^ К определяет некоторое фиксированное назначение подзадач программы на вычислительные ресурсы сформированной коалиции поставщиков К с С. Тогда суммарные затраты поставщиков К на выполнение программы J могут быть вычислены по формуле:

C(J,K,Ък) = £ с( т,Ък( т)).

те J

оо

Время выполнения всей программы J на вычислительных ресурсах поставщиков К может быть определено как максимальное время окончания работы грид-ресурса по исполнению задач данной программы:

гехес(/>К>8К) = тах X {(т,8)

%еО те/: 8 к( т)=g

Каждый поставщик стремится выбрать коалицию, в которой, будучи ее участником, он получит наибольшую прибыль. Данная задача может быть формализована в виде кооперативной игры (О,г), где характеристическая функция определяется следующим образом:

v(K) =

0,

если K = 0v texec (J, K,5K ) > dJ ,

pJ - c( J, K ,5K), если K Ф0 a texec і J, K ,5K) < dJ.

Для дележа прибыли внутри коалиции может быть использован принцип равного распределения, т. е. если коалиция К получает прибыль у(К), то на каждого ее участника у(К)

приходится К| . Каждый владелец кластера g е О, действуя рационально, стремится определить оптимальную для него коалицию К, обеспечивающую ему максимальную прибыль:

K = arg max

v(K)

КяО.^еК |К| .

Данная задача может быть решена с помощью кооперационных графов Майерсона [3,4], предназначенных для формализации описания структуры коалиций. Вычисление оптимального отображения 8К также представляет собой ^-полную задачу, поэтому чаще всего на практике для его получения можно использовать некий эффективный эвристический алгоритм (метод назначения).

Модель распределения расходов

между членами кооператива

Имеется п потребителей, которым необходимо построить хранилища для жидкого топлива [1] . Известно, что затраты на строительство являются некоторой возрастающей функцией от объема хранилищ. В моменты времени гх,г2,...,гт заданы потребности каждого потребителя в топливе функцией qi (г), где I = 1, п . Также положим, что топливо принимается в хранилища в промежутках между потреблением. Тогда объем хранилища, который полностью удовлетворяет потребности всех потребителей, равен

max

I q(t).

t i=1

Потребители могут объединяться в коалицию для постройки хранилища топлива. Если образуется коалиция S, то объем хранилища, который нужно построить этой коалиции, должен быть равен

max X qi(t),

t ieS

причем расходы на его строительство могут быть выражены некоторой функцией от объема

F(max X qi(t)).

t ieS

Необходимо определить число хранилищ и коалиции, которые их будут строить, а также распределить расходы на постройку хранилищ между членами коалиций.

Настоящая задача может рассматриваться в качестве кооперативной игры n лиц. Ее характеристическая функция задается как функция стоимости хранилища коалиции:

v( S) = F( max X qi( t)).

t ie S

Для решения кооперативной игры может быть использован вектор Шепли q>[v] , который характеризует распределение расходов на строительство.

После нахождения вектора Шепли для каждой коалиции необходимо проверить выполнение неравенства

(q>[vJ)s(i) < (<V[v])i> где (q>[v])S(i) - компонента вектора Шепли игры |S лиц, характеристическая функция которой является сужением функции v на множество S.

Коалиция S, для которой выполняется данное неравенство, должна строить свое хранили-

ще, а игроки, не входящие в 5, - свое хранилище. Если такой коалиции нет, то все игроки строят общее хранилище, а расходы распределяются согласно вектору Шепли.

Заключение

Разработана информационная система поддержки принятия решений в условиях неопределенности на основе игрового моделирования, позволяющая решать различные теоретико-иг-

ровые задачи с помощью параллельных алгоритмов. Поддерживаются два основных класса параллельных вычислительных систем - БМР-системы и вычислительные кластеры.

Настоящая информационная система поддерживает наиболее актуальные игровые модели принятия решений, сводящиеся к одному из вариантов кооперативной игры.

29.06.2012

Исследования выполнены при поддержке Министерства образования и науки Российской Федерации в рамках реализации ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 гг. (ГК №14.740.11.0287 и №14.740.11.1256)

Список литературы:

1. Дюбин, Г.Н. Введение в прикладную теорию игр / Г.Н. Дюбин, В.Г. Суздаль. - М.: Наука, 336 с.

2. Протасов, И.Д. Теория игр и исследование операций. - M.: Гелиос АРВ, 2006. - 368 с.

3. Полежаев, П.Н. Экспериментальное исследование алгоритмов планирования задач для вычислительной грид-системы // Системы управления и информационные технологии. - 2011. - №3.2 (45). - С. 266-270.

4. Carroll, T.E. Formation of Virtual Organizations in Grids: A Game-Theoretic Approach / T.E. Carroll, D. Grosu // Economic Models and Algorithms for Distributed Systems, Autonomic Systems. - 2010. - Part I. - P 63-81.

Сведение об авторах:

Влацкая Ирина Валерьевна, заведующий кафедрой математического обеспечения информационных систем Оренбургского государственного университета, кандидат технических наук, доцент,

e-mail: mois@mail.osu.ru Нестеренко Максим Юрьевич, преподаватель кафедры математического обеспечения информационных систем Оренбургского государственного университета, кандидат технических наук,

доцент, e-mail: nesteren@mail.osu.ru Полежаев Петр Николаевич, аспирант кафедры математического обеспечения информационных систем математического факультета Оренбургского государственного университета,

e-mail: peter.polezhaev@mail.ru 460018, г. Оренбург, пр-т Победы, 13, ауд. 2131, тел. (3532) 372534

UDC 519.83; 519.816

Vlatskaya I.V., Nesterenko M.Yu., Polezhaev P.N.

Orenburg state university E-mail: mois@mail.osu.ru

DECISION SUPPORT MODELS UNDER UNCERTAINTY WHICH REDUCED TO COOPERATIVE GAMES

This paper describes the decision support system under uncertainty on the basis of gaming simulation. It includes the model of management decision-making in competitive markets, the cooperation model of one product manufacturers in workflow, the model of scheduling jobs in grid and the model of costs distribution between the members of cooperative. Each model reduces the problem of decision-making to one of the variants of cooperative games.

Key words: decision support system, uncertainty, game theory, cooperative games, high performance systems. Bibliography:

1. Dubin, G.N. Introduction to applied game theory / G.N. Dubin, V.G. Suzdal. - M.: Nauka. - 336 p.

2. Protasov, I.D. Game theory and operations research. - M.: Helios ARV, 2006. - 368 p.

3. Polezhaev, P.N. Experimental research of job scheduling algorithms for computational grid-system // Control Systems and Information Technologies. - 2011. - №3.2 (45). - P. 266-270.

4. Carroll, T.E. Formation of Virtual Organizations in Grids: A Game-Theoretic Approach / T.E. Carroll, D. Grosu // Economic Models and Algorithms for Distributed Systems, Autonomic Systems. - 2010. - Part I. - P 63-81.

i Надоели баннеры? Вы всегда можете отключить рекламу.