Научная статья на тему 'Гарантированное по рискам и сожалениям решение для иерархической модели'

Гарантированное по рискам и сожалениям решение для иерархической модели Текст научной статьи по специальности «Математика»

CC BY
42
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
HIERARCHICAL GAME UNDER UNCERTAINTY / PARETO MINIMUM / RISK FUNCTION / REGRET FUNCTION / INFORMED UNCERTAINTY / ИЕРАРХИЧЕСКАЯ ИГРА ПРИ НЕОПРЕДЕЛЕННОСТИ / МИНИМУМ ПО ПАРЕТО / РИСК ПО ВАЛЬДУ / СОЖАЛЕНИЕ ПО СЭВИДЖУ / ИНФОРМИРОВАННАЯ НЕОПРЕДЕЛЕННОСТЬ

Аннотация научной статьи по математике, автор научной работы — Бардин А.Е., Житенева Ю.Н.

Формализуется новая модель принятия решений в условиях действия неконтролируемых (неопределенных) факторов в форме иерархической игры. В этой игре «природа» реагирует на выбор лица, принимающего решения, своих стратегий, изменяя область возможных значений. Предложен подход к принятию решения в указанной модели, основанный на использовании концепции оптимальности по Парето и принципах Вальда и Сэвиджа. Получены коэффициентные условия существования формализованного оптимального решения для линейно-квадратичного случая.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The Guaranteed on Risks and Regrets Solution for a Hierarchical Model with Informed Uncertainty

The paper formalizes a new model of solution-making under the conditions of uncontrolled (uncertain) factors in the form of a hierarchical game. The problem of solution-making under uncertainty in the form of a hierarchical game with nature is considered Γ = 〈 U, { Y [ u ] | u ∈ U },f 0( u,y ( u ))〉. In this game U is a set of top-level player strategies (center). Not an empty set Y [ u ] is a set of uncertainties (lower level player strategies, that is, nature). It that can be realized as a result of the chosen center strategy u ∈ U. The basic difference between the game and the known models [3]-[5] is that nature 󰯺reacts󰯻 to the choice of the solution maker, changing the area of possible uncertainties. Solution-making in the game Γ is as follows. The first move is made by the top-level player using a certain strategy u ∈ U. The second move is made by nature, which realizes an any informed uncertainty y ( u ) ∈ Y [ u ]. As a result of this procedure in the game Γ there is a situation ( u,y ( u )). In this situation the payoff function value of the center for equal to f 0( u,y ( u )). In the game Γ center, choosing a strategy u ∈ U that seeks to maximize its payoff function f 0( u,y ( u )). A top-level player should consider the possibility of realization of any uncertainty y ( u ) ∈ Y [ u ]. In this case, it can use different concepts of solution-making in problems under uncertainty. The article discusses the approach to solution-making in this model, based on the concept of optimality Pareto and the principles of Wald and Savage. A two-criterion problem is considered P = 〈 U, { RV ( u ),RS ( u )}〉. In this problem the function RV ( u ) = m u axm y( u in) f 0( u,y ( u )) m y( u in) f 0( u,y ( u )) is a risk on Wald for the center, the function RS ( u ) = m y(a u x) Φ0( u,y ( u )) m u inm y(a u x) Φ0( u,y ( u )) is a strategic regret of the center. The regret function is defined by the following equality Φ0( u,y ( u )) = m u a U x f 0( u,y ( u )) f 0( u,y ( u )). ∈ The strategy of the center u ∗ ∈ U will be called a guaranteed risk and regret solution for the game Γ, if it is the minimum Pareto solution to the problem P. The article describes an algorithm for constructing a formalized optimal solution. The 󰯺performance󰯻 of the specified algorithm for finding the regret function and constructing a guaranteed risk and regret solution for the game on the example of a linear-quadratic optimization problem in terms of possible supply of imported products to the market is investigated.

Текст научной работы на тему «Гарантированное по рискам и сожалениям решение для иерархической модели»

удк: 519.83 msc2010: 91a65

ГАРАНТИРОВАННОЕ ПО РИСКАМ И СОЖАЛЕНИЯМ РЕШЕНИЕ ДЛЯ ИЕРАРХИЧЕСКОЙ МОДЕЛИ

© А. Е. Бардин, Ю. Н. Житенева

Государственный гуманитарно-технологический университет

ФИЗИКО-МАТЕМАТИЧЕСКИЙ ФАКУЛЬтЕт

ул. Зеленая, 22, г. Орехово-Зуево, Московская обл., 142611, Российская Федерация e-mail: inth2006@rambler.ru, ulya_ zhiteneva@mail.ru

The Guaranteed on Risks and Regrets Solution for a Hierarchical Model with Informed Uncertainty.

Bardin A. E., Zhiteneva Ju. N.

Abstract.

The paper formalizes a new model of solution-making under the conditions of uncontrolled (uncertain) factors in the form of a hierarchical game.

The problem of solution-making under uncertainty in the form of a hierarchical game with nature is considered

Г = (U, {Y[u] | u e U},fo(u,y(u))).

In this game U is a set of top-level player strategies (center). Not an empty set Y[u] is a set of uncertainties (lower level player strategies, that is, nature). It that can be realized as a result of the chosen center strategy u e U. The basic difference between the game and the known models [3] [5] is that nature «reacts» to the choice of the solution maker, changing the area of possible uncertainties.

Solution-making in the game Г is as follows. The first move is made by the top-level player using a certain strategy u e U. The second move is made by nature, which realizes an any informed uncertainty y(u) e Y[u]. As a result of this procedure in the game Г there is a situation (u,y(u)). In this situation the payoff function value of the center for equal to fo(u,y(u)).

In the game Г center, choosing a strategy u e U that seeks to maximize its payoff function fo(u,y(u)). A top-level player should consider the possibility of realization of any uncertainty y(u) e Y [u]. In this case, it can use different concepts of solution-making in problems under uncertainty.

The article discusses the approach to solution-making in this model, based on the concept of optimality Pareto and the principles of Wald and Savage.

A two-criterion problem is considered

P = (U, {RV(u), RS(u)}).

In this problem the function

RV (u) = maxmin fo(u,y(u)) — min fo(u,y(u))

is a risk on Wald for the center, the function

RS(u) = max y(u)) — minmax Фo(u,y(u))

y(u) u y(u)

is a strategic regret of the center. The regret function is defined by the following equality

Фо^^^)) = max fo(u,y(u)) — fo(u,y(u)). u£U

The strategy of the center u* £ U will be called a guaranteed risk and regret solution for the game Г, if it is the minimum Pareto solution to the problem P.

The article describes an algorithm for constructing a formalized optimal solution. The «performance» of the specified algorithm for finding the regret function and constructing a guaranteed risk and regret solution for the game on the example of a linear-quadratic optimization problem in terms of possible supply of imported products to the market is investigated.

Keywords: hierarchical game under uncertainty, Pareto minimum, risk function, regret function, informed uncertainty

Введение

В работах [1]-[5] исследуются конфликты в условиях действия неконтролируемых факторов. Там же формализованы различные понятия решения, которые базируются на принципах оптимального поведения из теории задач при неопределенности. В данной работе формализуется новая игровая модель принятия решений в подобных задачах. Принципиальное отличие от известных моделей [3]-[5] состоит в том, что природа «реагирует» на выбор лица, принимающего решение (ЛПР), изменяя область возможных неопределенностей.

Для принятия решения в условиях неопределенности используется ряд критериев. Согласно максиминному критерию Вальда игра с природой рассматривается как конфликт с разумным и агрессивным противником, делающим все для того, чтобы помешать лицу, принимающему решение, достигнуть успеха. Таким образом, осторожная (максиминная) стратегия ЛПР является оптимальной согласно этому критерию. Этот критерий олицетворяет «позицию пессимизма». Он ориентируется на самую неблагоприятную для ЛПР реализацию неопределенности.

Критерий минимаксного сожаления Сэвиджа при выборе оптимальной стратегии ориентируется не на выигрыш, а на сожаления. В качестве оптимальной стратегии выбирается та стратегия, при которой величина сожаления в наихудших условиях

минимальна. Такая стратегия поведения часто соответствует принципам азартного игрока.

Очевидно, разумный игрок должен учитывать как возникающие риски при принятии решения, так и возможность получения большего выигрыша. Возникает идея формализации нового подхода к принятию решений в игре с природой, который мог бы соединить позитивные особенности обоих принципов и ослабить их негативные свойства.

В данной работе формализуется понятие гарантированного по рискам и сожалениям решения иерархической игры с природой и указан алгоритм построения оптимального решения. Исследована «работа» указанного алгоритма для нахождения функции сожаления и построения гарантированного по рискам и сожалениям решения для игры на примере линейно-квадратичной задачи оптимизации производства в условиях возможной поставки импортной продукции на рынок.

1. Постановка задачи

Рассматривается задача принятия решений при неопределенности в форме иерархической игры

Г = (U, {Y[u] | u е U},/o(u,y(u))>,

где множество U - совокупность стратегий игрока верхнего уровня (центра). Непустое множество Y [и] есть совокупность неопределенностей y (стратегий игрока нижнего уровня, то есть природы), которые могут реализоваться в результате выбранной центром стратегии u е U.

В игре Г центр, выбирая стратегию u е U, стремится максимизировать свою функцию выигрыша /0(u, y(u)). Игрок верхнего уровня при выборе своей стратегии должен учитывать возможность реализации любой неопределенности y е Y [u], при этом он может использовать различные концепции принятия решений в задачах при неопределенности, например, принципы Вальда и Сэвиджа.

Перейдем к иерархической «процедуре» принятия решений в игре Г.

Первый ход делает игрок верхнего уровня, используя конкретную стратегию u е U. Второй ход делает природа, которая реализует произвольную информированную неопределенность y(u) е Y [u]. В результате указанной процедуры в игре Г возникает ситуация (u,y(u)), при этом выигрыш центра равен /0(u,y(u)).

Аналогично подходу в работах [1]-[2], определим стратегический риск по Вальду для центра

Rv (u) = maxmin /0(u,y(u)) — min /0(u,y(u)), (1)

u y(u) y(u)

а также его стратегическое сожаление

RS(u) = max Ф0(м,у(м)) — min max Ф0(м,у(м)), (2)

y(u) u y(u)

где функция сожалений

Фо(и,у(и)) = max fo(u,y(u)) — fo (u,y(u)).

ugU

Здесь предполагается существование экстремальных значений соответствующих функций. Будем также полагать, что центр, выбирая стратегию u 6 U, стремится получить возможно меньшие значения как функции риска RV (u), так и функции сожаления RS (u).

Определение 1. Стратегию центра u* 6 U будем называть гарантированным по рискам и сожалениям решением для игры Г, если u* является минимальным по Парето решением для двухкритериальной задачи

P = (U, {RV(u),RS(u)}), (3)

т.е. для всех значений u 6 U несовместна система неравенств

RV(u) < RV(u*), RS(u) < RS(u*),

причем по крайней мере одно из неравенств строгое.

Рассмотрим пошаговый алгоритм вычисления функции сожалений Фо(^ y(u)). Первый шаг состоит в выборе центром определенного решения u 6 U. Второй шаг совершает природа, применяя стратегию y(u) 6 Y [u]. Третий шаг снова выполняет центр, решая оптимизационную задачу

P(u,y(u))J ^ (4)

где зафиксирована неопределенность y 6 Y [u]. Множество U* состоит из всех допустимых стратегий центра z 6 U, для которых фиксированное значение неопределенности y(u) принадлежит множеству Y [u], именно,

U* = {z 6 U | y(u) 6 Y[u]}. (5)

Предположим, что оптимальное решение z*(y(u)) задачи P(u,y(u)) существует для всех стратегий u 6 U и фиксированных неопределенностей y 6 Y [u]. Окончательно имеем:

ФоКуН) = fo (z*(y(u)),y(u)) — fo(u,y(u)). (6)

Отметим, что в задаче Р (и, у (и)) фиксирована стратегия и € и и неопределенность у (и) € У [и].

Далее рассмотрим «работу» указанного алгоритма нахождения функции сожаления и построения гарантированного по рискам и сожалениям решения игры Г на примере линейно-квадратичной задачи оптимизации производства в условиях возможной поставки импортной продукции на рынок.

2. линейно-квадратичная задача оптимизации производства с

учетом импорта

Пусть фирма производит и поставляет на рынок определенный вид продукции. Объем этого продукта обозначим и € и = [0,со]. После принятия решения о количестве произведенной продукции появляется новый игрок (компания-импортер). Причем о действиях импортера имеется неполная информация. Далее будем считать, что объем поставляемой импортной продукции зависит от величины и € [0, с0] и равен у (и) € У [и], где множество

У [и] = {у(и) € [0, 6] | 0 < у(и) < 6 — 1и}. (7)

Суммарный объем указанного вида продукции на рынке равен и + у (и). Будем считать, что издержки производства для данной фирмы являются линейными функциями от выпуска и, именно, затраты равны величине кои, где константа ко > 0.

Предположим, что на рынке в зависимости от спроса устанавливается цена, определяемая следующей формулой:

р(и,у(и))= а — Ь(и + у(и)), (8)

где число а > 0 - начальная цена товара, а константа Ь > 0 - коэффициент, который показывает, как уменьшается цена продукта при поступлении на рынок единицы продукции. Тогда выручка фирмы равна

/о (и, у(и)) = р(и, у(и))и — кои

или, с учетом (8),

где параметр

/о(и,у(и))= Ь^ — и2 + 2^ ^о — и^,

— 2 )и), (9)

а — ко

Ло =

Далее предполагаем выполнение условия а > ко, тогда параметр Ло > 0. Предполагаем также, что выполнено неравенство 6 — 1со > 0 и справедливы условия Ло < со,

«0 — 2 > 0, где параметры ^ > 0, 0 < I < 1. Тогда для любого у € [0,^] получаем неравенство

У

0 < «0 — ^ < со.

Формализуем задачу оптимизации производства в форме иерархической игры с природой

Г = (и, [У[и] | и € и},/о(и,у(и))>. (10)

В игре (10) фирма-производитель является игроком верхнего уровня (центром). Совокупность ее стратегий описывается множеством и = [0,с0]. Фирма-импортер рассматривается в качестве игрока нижнего уровня (природы, неопределенности). Множество У [и], заданное в (7), есть совокупность возможных действий компании-импортера (неопределенности) у (и), которые могут реализоваться в результате выбранной центром стратегии и € и.

В игре (10) центр стремится максимизировать свою функцию выигрыша /0(и, у(и)), определенную в (9). При этом он должен учитывать возможность реализации любой неопределенности у (и) € У [и] при выборе собственной стратегии

и € и.

Будем считать, что центр при выборе оптимального решения в игре Г, руководствуется принципом Сэвиджа.

Перейдем к пошаговому построению функции сожалений центра Ф0(и,у(и)), заданной равенством (6).

первый шаг. Игрок верхнего уровня рассматривает возможность использования производственной стратегии и € и.

второй шаг. Предполагаем, что в этом случае природа реализует информированную неопределенность у (и) € У [и], то есть количество импортной продукции поставленной на рынок равно у (и).

третий шаг. Если данная фирма имела бы точную информацию о количестве импортной продукции у (и), то она изменила бы свою исходную стратегию и € [0, с0] на новую стратегию £*(у(и)), на которой достигался бы максимум функции

(-z2 + <"» - ^)*)•

/o(z,y(u)) = Ъ( - z2 + 2( h0 - ^ )z), z G U*. (11)

В равенстве (11) задана стратегия и € и и зафиксирована неопределенность у (и) € У [и], множество и * определено в (5).

Для решения оптимизационной задачи Р (и, у (и)), описанной в (4), необходимо описать множество и*. Рассмотрим несколько возможных случаев.

Первый случай. Пусть объем импорта y(u) 6 [0, d — /cg], тогда множество U* = U (рис. 1). Поэтому получаем задачу максимизации функции /0(z,y(u)) по переменной z 6 [0,c0], где фиксирована неопределенность y(u).

Рис. 1. Первый случай

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Используя свойства квадратичной функции, получаем следующее утверждение. Лемма 1. Пусть в игре с природой (10) выполнено условие

(Vy 6

0 < hg — 2 < cg

,

(12)

при этом центр выбрал произвольную стратегию и € [0, со]. Тогда при фиксированном значении у(и) € [0,6 — 1со] наибольшее значение функции /о(г,у(и)), заданной равенством (11), на отрезке [0, со] достигается в точке

z*(y(u)) = hg

y(u) 2 '

Если при заданной стратегии и € [0, со] реализовалась неопределенность у(и) € [6 — 1со,6 — 1и], то максимальное значение функции /о(г,у(и)) ищется на отрезке 0, а-Уупри фиксированном значении у (и).

Второй случай. Максимальное значение функции /о (г, у (и)) достигается во внутренней точке отрезка Введем обозначение:

2

-(6 — 1Ло). (13)

0 d-y(u) 0, l

(рис. 2). 2

У =

2- /

Лемма 2. Пусть в игре с природой (10) выполнено условие (12), а также центр выбрал произвольную стратегию и € [0,с0]. Тогда при фиксированном значении у(и) € [б—1с0, б—1и], которое удовлетворяет условию у(и) — у, наибольшее значение функции /0(^,у(и)) на отрезке [0,с0] достигается в точке

z*(y(u)) = ho -

y(u) 2 '

При этом справедливы неравенства б — 1с0 < у < б.

Рис. 2. Второй случай

Доказательство. Пусть при заданной стратегии и € [0, с0] реализовалась неопределенность у(и) € [б — 1с0,б — 1и]. Тогда наибольшее значение функции /0(^,у(и)) на отрезке

0 d-y{u) 0> 1

достигается в точке £*(у(и)) = «0 — только тогда, когда выполнено условие

« _ уМ < б — у(и)

0 2 - I . Решая полученное неравенство, имеем у(и) — у, где у определено в (13).

Покажем, что у > б — 1с0.

Действительно, справедлива следующая цепочка импликаций

{

с > h

0 " ^ 2(с0 - h0) + d - 1с0 > 0 ^ 2d - 21h0 > 2d - 21с0 - Id + 12c0 ^

d — 1c0 > 0

2

^ 2(6 - /Л,0) > (2 - 1)(6 - 1с0) ^ -—- (6 - /Л,0) >6 - 1с0 ^ у >6 - 1с0. Аналогично можно показать, что у <6.

Введем обозначение:

6 — у 2 / 6 \ . .

Рассмотрим свойства стратегии и. Покажем, что центру невыгодно использовать стратегии и € [0, и), если он желает максимизировать свою функцию выигрыша.

Лемма 3. Пусть при заданной стратегии и € [0, с0] реализовалась неопределенность у(и) € [0,6 - 1и], при этом у(и) < у. Тогда согласно предыдущим утверждениям центр выбирает новую стратегию

*( ( \\ и У(и)

* (У(и)) = ^0 - —, причем выполнено неравенство **(у(и)) > и.

Доказательство. Если в данных условиях реализовалась неопределенность у = у,

то

**(у(и)) = ^0 - | = и.

В этом случае точка локального экстремума квадратичной функции /0(и,у(и)) совпадает с граничной точкой = —. Если у < у, то

V ^ и у(и) ^ 6 - у 2 Л 6А ~ * (у(и)) = ^ = 2-7 - и.

Отметим, что при выборе центром стратегии и € [0, и) соответствующая стратегия природы (неопределенность) у(и) принимает значения от нуля до числа 6-1и > у.

Лемма 4. Пусть при заданной стратегии и € [0,и) реализовалась неопределенность у(и) < у, где стратегия природы у определена в (13). Тогда, используя стратегию и, центр гарантирует себе больший выигрыш, чем при выборе произвольной стратегии и € [0,и), для любой допустимой неопределенности у(и) € [0,у].

Доказательство. Согласно предыдущей лемме, при фиксированной неопределенности у(и) € [0,у] квадратичная функция /0(и,у(и)), заданная равенством (9), строго

возрастает на промежутке и Е [0, и]. Поэтому выполнено неравенство

/о(и, У (и)) = ^ - и2 + 2 (ко - и ^ > ^ - и2 + 2 (ко - 0 и ^ = /с (и, у(и)), где у (и) Е [0,у].

Третий случай. Осталось рассмотреть случай, когда при заданной стратегии и Е [0,и) реализуется неопределенность у (и) Е (у, б - 1и] (рис. 3). Здесь при фиксированной неопределенности у(и) максимальное значение функции /0(г,у(и)), заданной в (11), на промежутке [0, и) достигается в граничной точке гь = а-Уу.

Рис. 3. Третий случай

Лемма 5. Пусть при заданной стратегии и Е [0,и) реализовалась неопределенность у (и) Е (у, б - 1и], где стратегия природы у определена в (13). Тогда, используя стратегию и, центр гарантирует себе больший выигрыш, чем при выборе произвольной стратегии и Е [0,и), для любой допустимой неопределенности у (и) Е (у, б - 1и].

Доказательство. Из предыдущих рассуждений следует, что для любой стратегии и Е [0,и) и любой неопределенности у(и) Е (у, б - 1и] оптимальное решение задачи

Р(«,у(«)):( '( + 2(ко - ^^ ШаХ,

[ г Е [г Е и | у (и) Е (у, б - 1и]} достигается в граничной точке

гь(у(и)) = ^ - у(и), гь(у(и)) Е [0,и).

Следовательно, для всех стратегий и Е [0, и) и произвольной неопределенности у (и) Е (у, б - 1и] выполнено неравенство

/о(и,у(и)) < /о(гь,у(и)).

Так как

, у(и) ^ , у(и) ко - — > ко - —

для всех стратегий и Е [0,и), неопределенностей у(и) Е У [и] и у(и) Е (у/, б - 1и], то с учетом предыдущей леммы имеем

/о (и, у (и)) < ^ - г2 + 2 (ко - ^ < ^ - гь2 + 2 ( ко - ^ гь ^

Н

<

<61 -и2 + 2 ко- ^

Таким образом, выполнено неравенство

/о(и,у(и)) < /о (и, у(и)), и Е [0,и), у(и) Е У [и], у(и) Е (у, б - 1и].

Обобщая результаты, полученные в приведенных выше утверждениях, вместе со случаем, когда параметр 1 = 0, получаем основной вывод.

Теорема. Рассматривается задача принятия решений при неопределенности в форме иерархической игры (10):

Г = (и, [У[и] | и Е и},/о(и,у(и))>,

где множество и = [0,со] - совокупность стратегий игрока верхнего уровня (центра). Непустое множество У [и] = [0,б - 1и] есть совокупность неопределенностей у(и) (стратегий игрока нижнего уровня, то есть природы), которые могут реализоваться в результате выбранной центром стратегии и Е и. Предполагаем,

что выполнено условие 6 - 1с0 > 0 и для любого у € [0, 6] справедливо неравенство 0 < /0 - 2 < с0, где параметры 6 > 0, 0 < 1 < 1. Тогда

1) при любом фиксированном значении у(и) € [0,6 - 1с0] наибольшее значение функции

у(и)'

/o(z,y(u)) = 6 - z2 + 2 h

(-z2 + < ho -

на отрезке [0, с0] достигается в точке **(у(и)) = /0 - ;

2) при любом фиксированном значении у(и) € [6- 1с0,6- 1и], которое удовлетворяет условию у(и) < у = 237(6-1/0), наибольшее значение функции /0(*,у(и)) на отрезке [0, с0] достигается в точке г*(у(и)) = /0 - и при этом справедливы неравенства 6 - 1с0 < у < 6;

3) если при заданной стратегии и € [0,и) реализовалась неопределенность у(и) € (у, 6 - 1и], то используя стратегию и = /0 - 2, центр гарантирует себе больший выигрыш, чем при выборе произвольной стратегии и € [0,и), для любой допустимой неопределенности у(и) € (у, 6 - 1и].

Замечание. На содержательном уровне данное утверждение означает, что в формализованной выше иерархической игре (10) существует «пограничная» стратегия и = 2-7 (¡0 - , которая зависит только от параметров исходной задачи и при этом центру невыгодно использовать стратегии и € [0,и), если он желает максимизировать свою функцию выигрыша.

Отметим, что для классической задачи принятия решений при неопределенности, которая соответствует параметру 1 = 0, «пограничная» стратегия и = /0

соответствует осторожному (оптимальному по Вальду) поведению в игре.

Окончательно получаем, что функция сожаления, заданная в (6), принимает вид

Ф0(и,у(и)) = 6^0 - ^ - и) 2.

Имеем:

( 6(/*0 - и)2, 0 < и < ¡10 - |, тах Ф0(и,у(и)) = < / Л2 ,

у(и)еУ [и] | М ¡0 - и - 2] , ¡0 - | < и < С0.

Тогда гарантированное сожаление центра равно

^ , , 662 тттах Ф0(и, у) =-,

иеи у&у ^ 16

соответственно, решение

uS = ho

является гарантированным по Сэвиджу, именно,

(Vy G Y)(Фo(uS,y) < Фo(uS,yS)),

где неопределенность

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

i 0, \ d,

s ( ) |0, 0 < u < ho - |, yS (u) = < , 4

d, h0 - d < u < c0.

Тогда стратегическое сожаление по Сэвиджу (2) имеет вид

RS (u) =

(ho - u)

ho

16

, 0 < u < ho

u

— / # —

d2 16

, ho

< u < co.

Для нахождения стратегического риска по Вальду (1) предположим, что центр ориентируется на возможность реализации самой неблагоприятной для него неопределенности уу (и) = б — Тогда

minfo(u,y(u)) = fo(u,y (u)) = bi

(-u2 + <hi - D),

где параметры

/ ,n , a — ko d b1 = (1 - l)b, h1 = o7 o, d1 = ---, 0 < l < 1.

2&1 1 1 — I

Далее предполагаем выполнение условия а > тогда параметр ^ > 0. Пусть также справедливы условия 0 < ^ — у < с0. Тогда гарантированное по Вальду

решение центра:

uV = h1

d1 т

Стратегический риск по Вальду (1) для центра есть

V\2

RV (u) = b1(u - uV)

Выполняя построение гарантированного по рискам и сожалениям решения игры (10), необходимо получить минимальное по Парето решение двухкритериальной задачи P, определенной в (3).

Для выделения единственного гарантированного по рискам и сожалениям решения центра получаем классическую оптимизационную задачу

(RV(u)) 2 + (RS(u)) 2 ^ min, u g U = [0, d].

2 d2

2

d

4

Решение последней задачи для допустимого набора параметров находим, используя численные методы.

Заключение

В данной статье исследуется иерархическая структура принятия решений в конфликтной ситуации, когда действуют неконтролируемые лицом, принимающим решение, факторы. При этом в рассматриваемой математической модели конфликта учитываются как ожидаемые потери при принятии рискованных решений, так и возможность благоприятных для ЛПР (игрока) действий внешних факторов. Именно, наличие риска в процессе принятия решений не всегда является негативной особенностью реальной проблемы. Конкретные задачи, связанные с экономическими, социальными, политическими и военными конфликтами, свидетельствуют о возникающей часто необходимости принятия рискованного выбора.

Для конкретного класса линейно-квадратичных моделей иерархических систем конфликтов с двумя уровнями иерархии сформулирована и решена задача формализации оптимального решения. Также исследована проблема построения эффективного алгоритма нахождения оптимальных решений для поставленных задач.

список литературы

1. Бардин, А. Е., Житенева, Ю. Н., Макаркина, Т. В. U-оптимальное по рискам и сожалениям решение игры с природой // Анализ, моделирование, управление, развитие экономических систем: сборник научных трудов X Международной школы-симпозиума АМУР-2016. — Симферополь: ТНУ, 2016. — C. 29-35.

BARDIN, A. & ZHITENEVA, J. & MAKARKINA, T. (2016) The U-optimal on risks and regrets solution game with nature. Analysis, Modeling, Management, Development of Economic Systems: Proceedings of the Eighth International School-Symposium AMUR-2016. p. 29-35.

2. Бардин, А. Е., Солдатова, Н. Г. Сильно гарантированное равновесие в одной иерархической двухуровневой игре при неопределенности / / Вестник ЮжноУральского государственного университета. Серия: Математика. Механика. Физика. — 2014. — Т. 1. — C. 17-23.

BARDIN, A. & SOLDATOVA, N. (2014) The strongly guaranteed equilibrium in one hierarchical two-level game under uncertainty. Bulletin of the South Ural state University. Series: Mathematics. Mechanics. Physics. 1. p. 17-23.

3. Жуковский, В. И., Кудрявцев, К. Н. Уравновешивание конфликтов и их приложения. - M.: ЛЕНАНД, 2012. - 304 с.

ZHUKOVSKIY, V. and CUDRYAVCEV, K. (2012) Balancing conflicts and their applications. Moscow: LENAND.

4. Жуковский, В. И., Кудрявцев, К. Н., Смирнова, Л. В. Гарантированные решения конфликтов и их приложения. — M.: КРАСАНД, 2013. — 324 с.

ZHUKOVSKIY, V. and CUDRYAVCEV, K. and SMIRNOVA, L. (2013) Guaranteed conflict solutions and their applications. Moscow: KRASAND.

5. Жуковский, В. И., Салуквадзе, М. Е. Математические основы золотого правила. — Москва - Тбилиси: Национальная Академия Наук Грузии, 2016. — 263 с. ZHUKOVSKIY, V. and SALUKVADZE, M. (2016) The mathematical foundations of the Golden rule. Moscow-Tbilisi: The National Academy Of Sciences Of Georgia.

6. SAVAGE, L. Y. (1951) The theory of statistical decision. J. American Statistic Association. 46. p. 55-67.

i Надоели баннеры? Вы всегда можете отключить рекламу.