Научная статья на тему 'ПРИНЦИП СЭВИДЖА И УЧЕТ ИСХОДА В ОДНОКРИТЕРИАЛЬНОЙ НЕЛИНЕЙНОЙ ЗАДАЧЕ ПРИ НЕОПРЕДЕЛЕННОСТИ'

ПРИНЦИП СЭВИДЖА И УЧЕТ ИСХОДА В ОДНОКРИТЕРИАЛЬНОЙ НЕЛИНЕЙНОЙ ЗАДАЧЕ ПРИ НЕОПРЕДЕЛЕННОСТИ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
87
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСХОД / РИСК / НЕОПРЕДЕЛЕННОСТЬ / ОПТИМАЛЬНОСТЬ ПО ПАРЕТО / ПРИНЦИП ВАЛЬДА / ПРИНЦИП СЭВИДЖА

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Жуковский Владислав Иосифович, Жуковская Лидия Владиславовна, Самсонов Сергей Петрович, Смирнова Лидия Викторовна

В середине прошлого века американский математик и статистик, профессор Мичиганского университета Леонард Сэвидж (1917-1971) и знаменитый швейцарский экономист, профессор университета в Цюрихе Юрг Ниханс (1919-2007) независимо друг от друга предложили подход к выбору решения в однокритериальной задаче при неопределенности (ОЗН), названный принципом минимаксного сожаления. Этот принцип, наряду с Вальдовским принципом гарантированного результата (максимина), играет важнейшую роль в принятии гарантированного по неопределенности решения в ОЗН. Главную роль в принципе минимаксного сожаления выполняет функция сожаления, которая как раз и определяет риск по Нихансу-Сэвиджу в ОЗН. Такой риск получил широкое распространение в практических задачах управления в последние годы. В настоящей статье предлагается один из возможных подходов к нахождению решения в ОЗН с позиции лица, принимающего решение (ЛПР), который одновременно пытается увеличить выигрыш (исход) и уменьшить риск (т.е. «убить двух птиц одним камнем при одном броске»). В качестве приложения найден явный вид такого решения для линейно-квадратичного варианта ОЗН достаточно общего вида.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Жуковский Владислав Иосифович, Жуковская Лидия Владиславовна, Самсонов Сергей Петрович, Смирнова Лидия Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE SAVAGE PRINCIPLE AND ACCOUNTING FOR OUTCOME IN SINGLE-CRITERION NONLINEAR PROBLEM UNDER UNCERTAINTY

In the middle of the last century the American mathematician and statistician professor of Michigan University Leonard Savage (1917-1971) and the well-known economist, professor of Zurich University (Switzerland) Jurg Niehans (1919-2007) independently from each other suggested the approach to decision-making in one-criterion problem under uncertainty (OPU), called the principle of minimax regret. This principle along with Wald principle of guaranteed result (maximin) is playing the most important role in guaranteed under uncertainty decision-making in OPU. The main role in the principle of minimax regret is carrying out the regret function, which determines the Niehans-Savage risk in OPU. Such risk has received the broad extension in practical problems during last years. In the present article we suggest one of possible approaches to finding decision in OPU from the position of a decision-maker, which simultaneously tries to increase the payoff (outcome) and to reduce the risk (i.e., “to kill two birds with one stone in one throw”). As an application, an explicit form of such a solution was immediately found for a linear-quadratic variant of the OPU of a fairly general form.

Текст научной работы на тему «ПРИНЦИП СЭВИДЖА И УЧЕТ ИСХОДА В ОДНОКРИТЕРИАЛЬНОЙ НЕЛИНЕЙНОЙ ЗАДАЧЕ ПРИ НЕОПРЕДЕЛЕННОСТИ»

Известия Института математики и информатики Удмуртского государственного университета

2022. Том 59. С. 25-40

УДК 517.577.1

© В. И. Жуковский, Л. В. Жуковская, С. П. Самсонов, Л. В. Смирнова

ПРИНЦИП СЭВИДЖА И УЧЕТ ИСХОДА В ОДНОКРИТЕРИАЛЬНОЙ НЕЛИНЕЙНОЙ ЗАДАЧЕ ПРИ НЕОПРЕДЕЛЕННОСТИ

В середине прошлого века американский математик и статистик, профессор Мичиганского университета Леонард Сэвидж (1917-1971) и знаменитый швейцарский экономист, профессор университета в Цюрихе Юрг Ниханс (1919-2007) независимо друг от друга предложили подход к выбору решения в однокритериальной задаче при неопределенности (ОЗН), названный принципом минимаксного сожаления. Этот принцип, наряду с Вальдовским принципом гарантированного результата (максимина), играет важнейшую роль в принятии гарантированного по неопределенности решения в ОЗН. Главную роль в принципе минимаксного сожаления выполняет функция сожаления, которая как раз и определяет риск по Нихансу-Сэвиджу в ОЗН. Такой риск получил широкое распространение в практических задачах управления в последние годы. В настоящей статье предлагается один из возможных подходов к нахождению решения в ОЗН с позиции лица, принимающего решение (ЛПР), который одновременно пытается увеличить выигрыш (исход) и уменьшить риск (т. е. «убить двух птиц одним камнем при одном броске»). В качестве приложения найден явный вид такого решения для линейно-квадратичного варианта ОЗН достаточно общего вида.

Ключевые слова: исход, риск, неопределенность, оптимальность по Парето, принцип Вальда, принцип Сэвиджа.

DOI: 10.35634/2226-3594-2022-59-03

§ 1. Dubia plus torquent mala1

В статье рассматривается математическая модель принятия решения в условиях конфликта, представленная в виде однокритериальной задачи при неопределенности (ОЗН). В общем виде неопределенность принято классифицировать на фундаментальную, то есть неопределенность будущего и неопределенность, связанную с незнанием конкретных значений текущих характеристик процессов и явлений. Обычно различают несколько видов неопределенности: стратегическую; неопределенность целей; неопределенность, порождаемую действиями участников взаимодействия в системе. При этом выделяют внешние и внутренние факторы неопределенности: к внешним, как правило, относят неопределенность, влияющую извне и приводящую к дестабилизации системы; внутреннюю — связывают с непредвиденными факторами, порождаемыми самой системой; отмечают также взаимосвязь рассматриваемых процессов. Например, среди прочих источников неопределенности, возникающей в процессе принятия решений в экономической системе, наиболее часто указывается так называемый поведенческий фактор, который, как правило, детерминируется в обществе социодемографическими и социоэкономическими процессами в целом. Неопределенность, порождаемая как внешними, так и внутренними факторами, чаще всего проявляется в неполноте или неточности информации об условиях функционирования системы, о связях между ее составляющими, о параметрах ее подсистем и об их конфликтности. Причинами появления неопределенности могут являться различные факторы, например, от труднопрогнозируемого характера научно-технического прогресса и ошибок

1 Мучительней всего неизвестность (лат), цитата из трагедии римского государственного деятеля, философа Сенека (ок. IV в. до н. э.), «Агамемнон».

при прогнозировании до динамических изменений внутренних и внешних условий устойчивости развития систем; от качественного изменения интеллектуального, образовательного, трудового и культурного потенциала, состояния здоровья населения до погрешностей вероятностного характера прогнозируемых параметров развития системы и прочего.

Подробной классификации неопределенностей в современных экономических системах посвящена работа В. С. Диева [1]. Необходимо отметить, что каждый из видов неопределенности требует разного подхода для ее учета. В данной статье мы ограничились интервальными неопределенностями. О таких неопределенностях известны лишь границы изменения, а какие-либо вероятностные характеристики отсутствуют. Обзор интервальных неопределенностей можно найти также в [2,3]. Для учета неопределенностей мы воспользуемся одним из трех способов, предложенных В. И. Жуковским в [2-4]. Данный способ позволяет перейти от исходной задачи принятия решения в однокритерильной задаче при неопределенности (ОЗН) к однокритериальной задаче, но без неопределенностей.

Актуальным является феномен риска, который изучается и теоретиками, и практиками в рамках различных научных школ и направлений. Как правило, под «риском» подразумевают возможность выбора: принимать или нет на себя ответственность за результаты выбранного решения, как на уровне отдельного индивида, хозяйствующего субъекта, так и общества в целом. Предлагаемая в статье методология моделирования процессов принятия гарантированных решений основывается на предположении о возможном увеличении исходов при одновременном уменьшении связанного с ними риска (по Нихансу-Сэвиджу) и при этом учитывается возможность реализации любой неопределенности.

§ 2. Принцип минимаксного риска

Главные задачи математической теории ОЗН следующие: выработка принципа оптимальности, исследование существования решений, оптимальных в соответствии с выработанными принципами, и разработка методов построения гарантированных решений. Ответам на данные вопросы и посвящена эта статья.

В теории игр понятие оптимальности базируется на концепции устойчивости: отклонения ЛПР от оптимальной стратегии не должно увеличивать его исхода. Эта концепция как раз и используется в настоящем исследовании.

Перейдем к постановке задачи. Рассмотрим однокритериальную задачу при неопределенности Г(1) = (X, У, f(х,у)). В задаче Г(1) ЛПР выбирает свою стратегию х Е X С Ега так, чтобы значение скалярного критерия f (х,у) было возможно большим. Выбирая свою стратегию, ЛПР вынужден ориентироваться на реализацию любой заранее не предсказуемой неопределенности у € У С Мт. О неопределенности известны только границы изменения.

Наличие неопределенности приводит к появлению множества результатов f (х, У) = = {f (х,у) | Уу Е У}, порожденных х € X. Множество f (х,У) можно «сузить», используя риски.

Учет рисков является актуальной задачей экономики. Данный факт подтверждается, например, присуждением Нобелевской премии 1990 года Гарри Максу Марковицу [5] за новый подход к исследованию инвестиционных рисков. Что такое риск? Известный российский специалист по теории оптимизации Т. К. Сиразетдинов считает, что в настоящее время нет четкого математического определения риска [6, с. 31]. Шестнадцать возможных определений риска представлены в [7, с. 15]. Большинство из них требуют статистических данных о неопределенности. Однако часто ЛПР не имеет такой информации. Именно такое ограничение рассматривается здесь.

Под риском мы будем понимать возможность отклонения полученных значений критерия от желаемого значения. Данное определение соответствует обычным микроэкономическим рискам, описанным, например, в [7, с. 40-50].

В 1939 году румынский математик Абрахам Вальд (1902-1950), который эмигрировал в Америку в 1938 и работал у Неймана, представил принцип максмина (принцип гарантированного результата) [8,9]. Этот принцип используется для нахождения гарантированного решения, в частности, в однокритериальной задаче при неопределенности (ОЗН). Почти 10 лет спустя, знаменитый швейцарский экономист Юрг Ниханс в 1948 году и американский математик Леонард Сэвидж в 1951 независимо друг от друга предложили в [10,11] принцип минимаксного сожаления, позволяющий для ОЗН построить гарантированный риск. Этот принцип получил в математической литературе название риска по Сэвиджу (позднее названный риском по Нихансу-Сэвиджу). Отметим, что с 1997 в США учреждена премия Сэвиджа. Эта премия ежегодно присуждается авторам двух самых выдающихся диссертаций в области экономики и статистики.

Для однокритериальной задачи Г(1) = (X, Y, f (x,y)) принцип минимаксного сожаления состоит в построении пары (xr, Rf £ X х R), удовлетворяющей цепочке равенств

Rf = max Rf (xr , y) = min max Rf (x,y), (1)

J y£Y x€X y£Y

где функция риска (по Нихансу-Сэвиджу)

Rf (x,y) = maxf (z,y) - f (x,y). (2)

Значение R^ из (1) называется риском по Нихансу-Сэвиджу в задаче Г(1). Функция риска Rf (x, y) оценивает насколько реализованное значение критерия f (x, y) «не достает до самого лучшего значения» (для ЛПР в задаче

Г(1)), именно, значения maxf (z,y). Очевидно, что

z€Z

цель ЛПР — выбрать свою стратегию x £ X так, чтобы значение Rf (x,y) было возможно меньшим. Затем, следуя принципу гарантированного результата, ЛПР рассчитывает на наибольшее противодействие со стороны неопределенности (см. [8]). Поэтому, следуя (1) и (2), ЛПР является оптимистом (ЛПР стремится к наибольшему значению max f (z, y)). С другой

z£X

стороны, если ЛПР ориентируется на появление наихудшего для себя результата (именно, вальдовского максиминного решения (x0,f0 = maxminf(x,y) = minf(x0,y))), то ЛПР

x€X y£Y y&Y

является пессимистом.

Далее считаем, что в задаче Г(1) ЛПР является оптимистом, то есть, ЛПР строит для f (x,y) функцию риска (по Нихансу-Сэвиджу) по (1), (2). Значение этой функции риска называется риском по Нихансу-Сэвиджу. Отметим два обстоятельства: во-первых, в Г(1) критерию f (x,y) соответствует свой риск Rf (x,y) (см. (2)); во-вторых, ЛПР формирует свою стратегию x £ X так, чтобы риск Rf (x,y) был возможно меньшим; при этом, выбирая свою стратегию, ЛПР вынужден ориентироваться на появление любой стратегической неопределенности y(■) £ YX,y(x): X ^ Y.

§ 3. Как объединить желание увеличить выигрыш и одновременно уменьшить риск?

Здесь используем подход из [12], который был предложен для многокритериальных задач. Для этого мы должны перейти от ОЗН к задаче гарантий (без неопределенности).

До сих пор целью ЛПР было выбрать свою стратегию так, чтобы получить возможно большее значение выгрыша. Но в настоящей статье считаем, что ЛПР стремится одновременно увеличить свой выигрыш и уменьшить риск. Напомним, что ЛПР строит функцию риска по Нихансу-Сэвиджу Rf (x,y) (2), значение которой называется риском. Риск по Нихансу-Сэвиджу Rf определяется цепочкой равенств (1). Это и есть риск, который ЛПР стремится уменьшить. Здесь, естественно, возникают два вопроса.

1. Как построить один критерий, который объединяет желание увеличить выигрыш и в то же время уменьшить риск?

2. Как найти стратегию, удовлетворяющую обоим желаниям, и как учесть неопределенность?

Построение функции риска по Нихансу-Сэвиджу Напомним, что, согласно принципу минимаксного сожаления (по Нихансу-Сэвиджа) риском ЛПР является значение функции риска Rf (x,y) = max f (z,y) — f (x,y), где f (x,y) — функция выигрыша ЛПР в задаче Г(1).

z€X

Чтобы построить функцию риска Rf (x,y), нам нужно прежде всего определить максимум f [y] = max f (x, y) при Vy G Y. Чтобы сделать это, будем считать, что ЛПР формирует свою

x€X

стратегию в виде контрстратегии x(y): Y ^ X такой, что

maxf (x,y) = f (x(y),y) = f [y] Vy G Y-

x€X

Множество всех контрстратегий обозначим XY (обозначение множества n-вектор-функций x(y): Y ^ X определенных на Y со значениями на X). Итак, чтобы построить первое слагаемое из правой части равенства (2), ЛПР нужно решить однокритериальную задачу (XY, Y, f (x,y)) для каждой неопределенности y(x) G YX. В результате должна быть построена скалярная функция f [y], которая определяется равенством

f [y] = max f (x,y) Vy G Y>

x(-)ex

после этого получим функцию риска по Нихансу-Сэвиджу по формуле (2).

§ 4. Непрерывность функции риска. Сильно гарантированные выигрыши и сильно гарантированные риски

Напомним следующие обозначения. Множество компактов евклидова пространства Rk обозначается comp Rk. Факт непрерывности скалярной функции ^(x) на X обозначаем

G C(X).

Основным утверждением в данном разделе является (см. [13, с. 54, 187]) Утверждение 1. Если X G comp Rn, Y G comp Rm и f (■) G C (X x Y), то

(a) функция max f (x,y) непрерывна на Y,

x€X

(b) функция min f (x, y) непрерывна на X.

y&

Следствие 1. Если X G comp Rn, Y G comp Rm и f (■) G C (X x Y) в задаче Г(1), то функция риска по Нихану-Сэвиджу Rf (x, y) непрерывна на X x Y.

Перейдем к сильно гарантированному выигрышу и риску для задачи Г(1). Используем один из трех методов учета неопределенности, предложенных для ЛПР в [3,4]. Этот метод заключается, в частности, в том, что функции выигрыша f (x,y) из Г(1) ставится в соответствие ее сильная гарантия f [x] = min f (x,y). Отсюда, выбирая стратегию x G X, ЛПР

y&

обеспечит себе выигрыш f [x] ^ f (x,y) Vy G Y (при реализации любой неопределенности y G Y). Такой сильно гарантированный выигрыш f [x] достаточно естественен при рассмотрении интервальных неопределенностей. Единственное, что известно об этих неопределенностях y G Y — это множество их значений Y С Rm, а какие-либо вероятностные характеристики отсутствуют по тем или иным причинам.

Утверждение 2. Если в Г(1) множества X и Y суть компакты, функция выигрыша f (x,y) непрерывна на X х Y, тогда сильно гарантированный выигрыш

f [x]=min f (x,y) (3)

уёУ

и сильно гарантированный риск

Rf [x] = max Rf (x,y) (4)

y&

будут непрерывными на X скалярными функциями.

Данное утверждение сразу же следует из утверждения 1, следствия 1 и непрерывности f (x, y) и Rf (x, y) на X х Y.

Замечание 1. Во-первых, смысл гарантированного выигрыша f [x] из (3) следующий. Какая бы неопределенность y € Y ни реализовалась в задаче Г(1), ЛПР, используя свою стратегию x € X, обеспечивает себе выигрыш f (x,y), не меньший чем f [x]. Таким образом, множество выигрышей f (x,Y) = {f(x,y)|Vy € Y}, порожденных стратегией x € X, ограничено снизу сильно гарантированным выигрышем f [x]. Во-вторых, множество всех рисков Rf (x,y) по Нихансу-Сэвиджу, которые могут реализоваться при любых неопределенностях y € Y, ограничено сверху сильно гарантированным риском Rf [x]. Действительно, из (4) получаем

Rf [x] ^ Rf - f (x,y) Vy € Y.

Итак, используя свою стратегию x € X, ЛПР обеспечивает себе одновременно сильную гарантию по выигрышу f [x] и сильную гарантию по риску Rf [x].

§ 5. Переход от ОЗН Г(1) к двухкритериальнои задаче

Цели ЛПР увеличить свой выигрыш и одновременно уменьшить риск соответствует новая математическая модель двухкритериальной задачи при неопределенности

Г2 = (X, Y, {f (x,y),-Rf (x,y)}>.

Здесь X и Y те же, что и в Г(1). В Г2 мы перешли от одного критерия f (x,y) к двух-компонентному векторному критерию {f (x,y), —Rf(x,y)}, где Rf(x,y) — функция риска по Нихансу-Сэвиджу. В задаче Г2 цель ЛПР — выбрать стратегию x € X, при которой оба критерия f (x,y) и —Rf (x,y) принимают одновременно возможно большие значения, именно по такой причине используем Rf (x,y) со знаком «минус». В силу Rf (x,y) ^ 0 при V(x,y) € X х Y увеличение —Rf (x,y) эквивалентно уменьшению Rf (x,y). Выбирая свою стратегию, ЛПР вынужден считаться с появлением любой заранее непредсказуемой неопределенности y € Y.

Присутствие только интервальных неопределенностей y € Y в задаче Г2 обосновывает возможность для ЛПР ориентироваться на сильно гарантированный выигрыш f [x] из (3) и сильно гарантированный риск Rf [x] из (4). Этот подход приводит к переходу от задачи Г(1) к двухкритериальной задаче без неопределенности

Г2 = (X, {f [x], —Rf [x]}>

(в которой ЛПР должен выбрать свою стратегию x € X так, чтобы оба критерия f [x] и —Rf [x] одновременно принимали возможно большие значения).

Затем, для построения сильно гарантированных выигрыша и риска, нужно привлечь результаты математической теории векторной оптимизации.

В данной работе используем решение многокритериальной задачи, предложенное итальянским экономистом и социологом Вильфредо Парето в 1909 году. Напомним, что в задаче Г2 стратегия xP называется максимальной по Парето, если Vx G X несовместна система из двух неравенств f [x] ^ f [xP], —Rf [x] ^ —Rf [xP], из которых хотя бы одно строгое. В результате, мы приходим к следующему понятию.

Определение 1. Тройка (xP,f[xP],Rf[xP]) называется сильно гарантированным по Парето решением задачи если

(a) xP максимальна по Парето в задаче

(b) f [xP] — значение сильно гарантированного выигрыша f [x] = min f (x,y) при x = xP

yeY

в задаче Г(1);

(c) Rf [xP] — значение сильно гарантированного риска Rf [x] = max Rf (x,y) при x = xP.

yeY

Замечание 2. В определении 1 можно использовать и другие концепции оптимальности из теории многокритериальных задач: максимум по Слейтеру, Борвейну, Джоффриону, А-максимум, конусную оптимальность. Все эти концепции можно найти в [12].

Из определения максимальной по Парето стратегии xP следует:

(a) если использование стратегии x = xP (x G X) приводит к увеличению одного из критериев, тогда по крайней мере один из остальных критериев неизбежно уменьшится;

(b) не существует стратегии x G X такой, что значения всех критериев увеличатся по сравнению с их значениями при x = xP.

Очевидно следующее утверждение (лемма Карлина).

Утверждение 3. Пусть в задаче существует xP G X и числа a,ß G (0,1), такие что xP максимизирует скалярную функцию Ф^] = af [x] — ßRf [x], то есть

Ф^ ] = max(af [x] — ßRf [x]).

x€X

Тогда xP максимальна по Парето в задаче Г

Замечание 3. Рассмотрим свертку критериев (3) и (4) в виде Ф[ж] = а/[ж] — вЛ/[ж]. Во-первых, даже если для ж = жр мы получим увеличение гарантированного выигрыша / [ж] > / [жр], то в силу максимальности по Парето жр и Л/ [ж] ^ 0, такое увеличение гарантированного выигрыша неизбежно приведет к увеличению гарантированного риска Л/ [ж] > Л/ — / [жр]. С другой стороны, уменьшение гарантированного риска Л/ [ж] < Л/ [жр] приведет к уменьшению гарантированного выигрыша / [ж] < / [жр]. Оба эти случая нежелательны для ЛПР. Во-вторых, в силу Л/ — / [ж] ^ 0 увеличение а/[ж] — вЛ/ [ж] соответствует желанию ЛПР одновременно увеличить /[ж] и уменьшить Л/[ж]. Вот почему используем переход от двухкритериальной задачи Г2 к однокритериальной задаче (X, Ф[ж] = а/[ж] — вЛ/[ж]).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теперь можем ответить на второй вопрос из параграфа 3: как найти стратегию, которая удовлетворит оба желания ЛПР, и как учесть интервальную неопределенность? Для этого мы перейдем последовательно от задачи Г(1) к задачам Гь Г2, Г3, где

Г1 = (Х,У, {/(ж,у), — Д/(ж,у)}),

Г2 = (X, {/[х], —Д/[ж]}), (5)

Гз = (X, Ф[ж] = а/[ж] — вД/ [х]).

Здесь стратегии x £ X С Rn, неопределенности y £ Rm, функция выигрыша f (x, y) и функция риска по Нихансу-Сэвиджу Rf (x, y) определены на (x, y) £ X х Y, числа а, ß £ (0,1).

З а м е ч а н и е 4. Перечислим достоинства решения, приведенного в определении 1.

Во-первых, определены нижние границы f [xP] ^ f (xP , y) Vy £ Y для выигрышей и верхние границы Rf [xP] ^ Rf (xP, y) Vy £ Y для рисков. Отметим, что существование и непрерывность f [x] и Rf [ж] «обеспечивается» условиями X £ comp Rn,Y £ comp Rm и f (■) £ C(X х Y) (см. утверждение 1).

Во-вторых, увеличение гарантированного по Парето выигрыша (по сравнению с f [xP]) неизбежно приведет к увеличению гарантированного риска (по сравнению с Rf [xP]). С другой стороны, уменьшение гарантированного риска приведет к уменьшению гарантированного выигрыша.

З а м е ч а н и е 5. Определение 1 дает следующую схему построения сильно гарантированного решения. Она состоит из четырех этапов.

Этап I. Для /(ж, у) находим fly] = max/(ж, у) и строим функцию риска по Нихансу-Сэвиджу,

хех

именно, Rf (ж, y) = f [y] - f (x,y).

Этап II. Находим сильную гарантию для выигрыша /[ж] = min/(ж, у) и для риска Rf[ ж] =

у&

= max Rf (x,y). yeY

Этап III. Для двухкритериальной задачи Г2 строим максимальную по Парето стратегию .г''. Здесь можно использовать утверждение 3, положив а = ß = 1. Тогда нахождение максимальной по Парето стратегии в задаче Гз сводится к построению xP такой что

max(f [ж] - Rf [ж]) = f [xP ] - Rf [xP ]. (6)

Этап IV. Для xp определяем значения сильных гарантий /[хр] и ltj\:rr'\. Построенная в результате тройка (xP, f [xP], Rf [xP]) является решением, удовлетворяющим определению 1. Таким образом, стратегия xP порождает гарантированный выигрыш f [xP] для f (x,y) и гарантированный риск по Нихансу-Сэвиджу Rf [xP].

В следующем параграфе применим данную схему для построения сильно гарантированного решения в одной линейно-квадратичной ОЗН.

§ 6. Явный вид функции риска по Нихансу-Сэвиджу в линейно-квадратичной однокритериальной задаче при неопределенности Постановка задачи. Рассмотрим линейно-квадратичную ОЗН

Г1д = (Rn, Rm,f (x,y)).

Здесь множество стратегий x представляет собой евклидово n-мерное пространство Rn, множество неопределенностей есть Rm, функция выигрыша имеет линейно-квадратичную форму.

Рассмотрим линейно-квадратичную однокритериальную задачу при неопределенности (ОЗН)

f (x, y) = x' Ax + 2x'By + y 'Cy + 2a'x + 2c'y + d,

где, не ограничивая общности, считаем, n х n-матрицу A и m х m-матрицу C постоянными и симметричными; n х m-матрица B постоянная; n-вектор a, m-вектор c и число d постоянными, штрих сверху означает транспонирование. В задаче r1q ЛПР стремится выбрать свою стратегию x £ Rn таким образом, чтобы получить возможно большее значение функции выигрыша и одновременно возможно меньшее значение функции риска. Выбирая свою стратегию, ЛПР допускает реализацию любой заранее непредсказуемой неопределенности y £ Rm.

Задача состоит в построении явного вида функции риска по Нихансу-Сэвиджу для r1q. Напомним следующие обозначения: для квадратной матрицы A с постоянными элементами A > 0 (A < 0) означает, что квадратичная форма x'Ax с матрицей A определенно положительна (определенно отрицательна); 0n — нулевой n-вектор;

д£ =

dx

dx2

гЭ/1

джх df

- джп -

— градиент скалярной функции f (x, y) по x;

• Э2/

dxidxi

d2f dxndxi

d2f dxidxn

d2f дхпдхп

— гессиан f (x, y) по x;

А — определитель матрицы А; — единичная п х п-матрица. Легко видеть, что

д д д д2 — (х'Ах) = 2Ах, — {2х'Ъу) = 2Ъу, —(2а'х) = 2а, —{х'Ах) = 2А. (7) дх дх дх дх2

Явный вид функции риска по Нихансу-Сэвиджу. Согласно этапу I (из замечания 5) приступим к построению явного вида функции риска Я/(х,у).

Этап I. Строим явный вид функции риска по Нихансу-Сэвиджу Rf(x, у) для I '/,г

Утверждение 4. Если в задаче Г1д матрица А < 0, тогда функция риска по Нихансу-Сэвиджу имеет вид Я/(х, у) = — (х'А + у'В' + а')А-1(Ах + Ву + а).

Доказательство. Пусть вектор-функции х(у) определена на и х(у) € Кга Уу € Ет:

д/(х,у)

Sx

= 2Ax(y) + 2By + 2а = 0n Vy G Rm

x=x(y)

д2f(x,y)

Sx2

2A < 0,

(8)

x=x(y)

х(у) удовлетворяет условию тах /(г, у) = /(х(у),у) Уу €

Условие (8) обеспечивается требованием А < 0. Из (7) и (8) получаем что х(у) = — А-1(Ву + а). Подставим х = х(у) в /(х, у). Будем иметь

тах / (г, у) = / (х(у), у) = (у'В' + а' )А-1(Ву + а) — 2(у'В' + а' )А-1Ву + у'Су —

— 2а'А-1(Ву + а) + 2с'у + д = — (у'В' + а' )А-1(Ву + а) + у'Су + 2с'у + d = = у' [С — В'А-1В]у + 2(с' — а'А-1В )у + (д — а'А-1а).

Тогда функция риска по Нихансу-Сэвиджу имеет вид

Я/ (х,у) = / (х(у ),у) — / (х,у) =

= —х'Ах — 2х'Ву — 2а'х — у'В'А-1Ву — 2а'А-1Ву — а'А-1а = = —(х'А + у'В' + а' )А-1 (Ах + Ву + а).

Этим и завершается доказательство утверждения 4.

Построение сильной гарантии для функции риска. Этап II. Построим функцию Rf[x], Утверждение 5. Пусть в задаче r1q

A < 0, C> 0, det B = 0, n = m.

Тогда

Rf [x] = max Rf (x,y) = 0 Vx G Rn. fL J yeRm /v

Доказательство. Для того чтобы найти Rf[x], нам нужно построить вектор-функцию y(x): Rn ^ Rm такую, что

max Rf (х>У) = Rf (x, y(x)) = Rf [x] Vx G Rn. Используем достаточные условия:

dRf (x,y)

dy

= -2B'x - 2B'A-1By(x) - 2B'A-1a = 0m Vx £ Rn, (9)

y=y(x)

Ö2 Rf (x, y)

= -2B'A-1B > 0. (10)

y=y(x)

dy2

Так как A < 0 и det B = 0, выполняется цепочка импликаций

A-1 < 0 ^ B'A-1B < 0 ^ —B'A-1B > 0 ^ —2B'A-1B > 0, то есть имеет место (10). Учитывая, что (B'A-1B)-1 = B-1A(B')-1, из (9) получаем

y(x) = —(B'A-1B )-1(B'x + B'A-1a) = —B-1 A(x + A-1a) = —B-1(Ax + a). Подставляя y = y(x) в Rf [x], находим

Rf [x] = Rf (x,y(x)) = —(x'A — x'A — a' + a')A-1(Ax — Ax — a + a) = 0 Vx G Rn,

то есть Rf [x] = 0 Vx G Rn. □

Следуя замечанию 5 нам нужно найти сильно гарантированный выигрыш min f (x,y).

y&

Учитывая f (x,y) = x'Ax + 2x'By + y'Cy + 2a'x + 2c'y + d, A< 0 и C > 0, перейдем к построению сильно гарантированного выигрыша f [x] = min f (x,y).

Л е м м а 1 (см. [14, с. 89]). Для всякой n х n-матрицы C > 0 существует единственная n х n-матрица S > 0, такая что S2 = C. Матрица S называется квадратным корнем из матрицы С и обозначается С?. К тому же собственные числа матрицы С равны собственным числам матрицы С?.

Л е м м а 2. Если симметричная n х n-матрица C > 0, тогда C-1 = [S2]-1 = [S-1]2.

Действительно, для S = имеем С = S ■ S ^ C~l = [S ■ S]"1 = S"^"1 = [S"1]2.

Л е м м а 3. Имеет место импликация

A < 0 Л C> 0 ^ (A — BCB') < 0 VB G Rnxn,

где Rnxn — множество постоянных n х n-матриц.

В самом деле, выполняется цепочка импликаций

С > 0 ^ С-1 > 0 ^ ВС-1В' ^ 0 УВ € Егахга ^ —ВС-1В' ^ 0 УВ € Егахга Утверждение 6. Если А < 0 и С > 0, тогда

/[х] = 1ШП /(х, у) = х' [А — ВС-1В ']х + 2х'[а — ВС-1с] + д — с'С-1с. (11)

Доказательство. Согласно лемме 1 существует матрица Б, такая что С = Б2. К тому же С > 0 ^ Б > 0, Б' = Б .С учетом Б-1Б-1 = С-1 (лемма 2), ББ = С, Б-1Б = Еп и евклидова норма || • || ^ 0, получаем

/ (х, у) = х'Ах + 2х'Ву + у'Су + 2а'х + 2с'у + д = ||Б-1В'х + Бу + Б-1с||2 — — х'ВС-1В'х — 2х'ВС-1с — с'С-1с — у'Су — 2х'Ву — 2с'у + х'Ах + 2х'Ву + 2а'х + д ^ ^ х' [А — ВС-1В']х + 2х' [а — ВС-1с] + [д — с'С-1 с] = /[х] Ух € Ега, у € Ет.

Тогда, согласно определению сильно гарантированного выигрыша

/(х, у) ^ /[х] Ух € Ега, у €

отсюда устанавливаем справедливость (11). □

Этапы Ш-ГУ. Согласно (6) построим максимальную по Парето стратегию хр для задачи Г2 из (5) и найдем / [хр].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Согласно утверждению 5, если в задаче Г1д

А < 0, С> 0, В = 0,

тогда сильно гарантированный риск Я/[х] = 0 при всех х € Кга. Поэтому Я/[хр] = 0, где хр — максимальная по Парето стратегия в задаче Г3 из (5). Итак, мы будем искать

максимальную по Парето стратегию для задачи Г3 из условия

тах / [х] = / [хР ]

при ограничениях (8) и С < 0.

Явный вид сильно гарантированного по Парето решения Г1д.

Утверждение 7. Пусть в задаче Г1д выполнены условия: А< 0, т = п, С > 0, det В = 0, тогда

хр = —[А — ВС -1В' ]-1(а — ВС-1с), / [хр ] = —(а' — с'С -1В' )[А — ВС -1В' ]-1(а — ВС-1с) + д — с'С-1с.

Доказательство. Достаточными условиями существования хр являются:

д/ [х]

дх

= 2[А — ВС-1В' ]хр + 2(а — ВС-1с) = 0, (12)

-ХР

д2/[х]

дх2

2[А — ВС В']-1 < 0. (13)

= 2[А — В С 1 °'] 1

Х = ХР

Лемма 3 и А< 0,С> 0 обеспечивают выполнение (13). С учетом А — ВС-1В' < 0 и (12) имеем

хр = —[А — ВС-1В' ]-1(а — ВС -1с). (14)

Подставляя xP в (11) получаем:

f [xP] = -(а' - c'C-1B ')[A - BC-1B']-1[A - BC-1B'][A - BC-1B']-1(a - BC-1c) + + d - cC-1c = -(а' - c'C-1B')[A - BC-1B']-1(а - BC-1c) + d - c'C-1c.

(15)

Замечание 6. Для линейно-квадратичной задачи при неопределенности получили следующий результат. Рассматриваем линейно-квадратичную задачу Г^ = (Rn, Rm, f (ж, y)). Если f (ж, y) = ж'Аж + 2x'By + y'Cy + 2а'ж + 2c'y + d, A < 0, C > 0, m = n, det B = 0, тогда тройка (xP, f [xP], Rf [xP]), где

жр = -[A - BC-1B']-1(a - BC-1c), f [жр] = -(a' - c'C-1B')[A - BC-1B']-1(a - BC-1c) + d - c'C-1c,

Rf [жр ] = 0,

является сильно гарантированным по Парето решением задачи Г^.

С точки зрения математической теории игр, этот результат означает следующее. Если в задаче r1q ЛПР использует стратегию xP из (14), то он обеспечивает себе сильно гарантированный выигрыш f [xP] (см. (15)) и самый лучший риск R [xP] = 0. К тому же, согласно лемме 3 «существенная» часть этого выигрыша равна -(а' - c'C-1B')[A - BC-1B']-1 x x (а - BC-1c) > 0.

A bon intedeur — salut (франц. употр. значение: из сказанного необходимо сделать вывод): в однокритериальной задаче при неопределенности (ОЗН) ЛПР может поразить одним выстрелом три цели:

во-первых, учесть наличие интервальных неопределенностей;

во-вторых, возможно увеличить исход;

в-третьих, одновременно уменьшить риск (по Нихансу-Сэвиджу).

Причем при непрерывной целевой функции и компактности множеств стратегий и неопределенности такие паретовские гарантии исхода и риска существуют. Для линейно-квадратичной целевой функции найден явный вид предполагаемого гарантированного по исходу и риску решения.

Здесь желательно иметь в виду, что экономисты делят всех пользователей на три категории, в зависимости от отношения к рискам (рискофобы, рискофили и рисконейтрал). Предлагаемая читателю статья отражает подход рисконейтрала. Работа подразумевает применение в дальнейшем предлагаемого подхода в многокритерильных и игровых задачах. Более того в каждом из в настоящее время сложившихся направлений математической теории игр можно дополнять стремление игроков к большим выигрышам их желанием возможно уменьшить связанные с этим риски, то есть получать возможно более полную информацию о формируемых решениях. Так в исследованиях бескоалиционных игр (равновесие по Нэ-шу, по Бержу, угроз и контругроз) учитывать стремление игроков не только к увеличению своего выигрыша, но и к уменьшению связанного с этим риска [15-17], аналогично по кооперативным играм (вектор Шепли, С-ядро и т.д.) [18-21], по иерархическим играм (равновесие по Штакельбергу, по Гермейеру) [22-24] и по коалиционным играм (коалиционное равновесие) [18,19] и связанные с этим устойчивость коалиционных структур.

СПИСОК ЛИТЕРАТУРЫ

1. Диев В. С. Рациональность и риск // Вестник НГУ. Сер. Философия. 2012. Т. 10. Вып. 4. С. 14-20.

https://elibrary.ru/item.asp?id=18411209

2. Жуковский В. И., Кудрявцев К. Н. Уравновешивание конфликтов при неопределенности. I. Аналог седловой точки // Математическая теория игр и ее приложения. 2013. Т. 5. Вып. 1. С. 27-44. http://mi.mathnet.ru/mgta102

3. Жуковский В. И., Кудрявцев К. Н. Уравновешивание конфликтов при неопределенности. II. Аналог максимина// Математическая теория игр и ее приложения. 2013. Т. 5. Вып. 2. С. 3-45. http://mi.mathnet.ru/mgta107

4. Жуковский В. И., Болдырев М. В., Кириченко М.М. Гарантированное для рисконейтрала решение однокритериальной задачи: аналог векторной седловой точки // Известия Института математики и информатики Удмуртского государственного университета. 2018. Т. 52. С. 13-32. https://doi.org/10.20537/2226-3594-2018-52-02

5. Markowitz H. Portfolio selection // The Journal of Finance. 1952. Vol. 7. Issue 1. P. 77-91. https://doi.org/10.1111/j.1540-6261.1952.tb01525.x

6. Мухаметзянова Д. Д., Сиразетдинов Р. М., Устинова Л. Н., Сиразетдинова Э. Р. Стандартизация системы управления рисками инновационных предприятий // Экономика, предпринимательство и право. 2021. Т. 11. № 12. С. 2871-2886. https://doi.org/10.18334/epp.11.12.113906

7. Жуковский В. И., Жуковская Л. В. Риск в многокритериальных и конфликтных системах при неопределенности. Москва: URSS, 2017.

8. Wald A. Contribution to the theory of statistical estimation and testing hypothesis // The Annals of Mathematical Statistics. 1939. Vol. 10. No. 4. P. 299-326. https://www.jstor.org/stable/2235609

9. Wald A. Statistical decision functions. New York: Wiley, 1950.

10. Savage L. J. The theory of statistical decision // Journal of the American Statistical Association. 1951. Vol. 46. Issue 253. P. 55-67. https://doi.org/10.1080/01621459.1951.10500768

11. Niehans J. Zur Preisbilding bei ungewissen Erwartungen // Swiss Journal of Economics and Statistics. 1948. Vol. 84. Issue 5. P. 433-456. https://www.econbiz.de/Record/zur-preisbildung-bei-ungewissen-erwartungen-niehans-j%C3%BCrg/10002568205

12. Zhukovskii V. I., Salukvadze M. E. The vector-valued maximin. New York: Academic Press, 1994.

13. Дмитрук А. В. Выпуклый анализ. Элементарный вводный курс. М.: МАКС Пресс, 2012.

14. Воеводин В. В., Кузнецов Ю. А. Матрицы и вычисления. М.: Наука, 1984.

15. Salukvadze M. E., Zhukovskiy V. I. The Berge equilibrium: a game theoretic framework for the Golden Rule of ethics. Cham: Birkhauser, 2020. https://doi.org/10.1007/978-3-030-25546-6

16. Zhukovskiy V.I., Salukvadze M.E. The Golden Rule of ethics. London: CRC Press, 2021. https://doi.org/10.1201/9781003134541

17. Жуковский В. И., Чикрий А. А., Солдатова Н. Г. Существование равновесия по Бержу в конфликтах при неопределенности // Автоматика и телемеханика. 2016. Вып. 4. C. 114-133. http://mi.mathnet.ru/at14435

18. Petrosjan L.A., Zenkevich N.A. Conditions for sustainable cooperation // Automation and Remote Control. 2015. Vol. 76. Issue 10. P. 1894-1904. https://doi.org/10.1134/S0005117915100148

19. Жуковский В. И., Жуковская Л. В., Кудрявцев К. Н., Ларбани М. Строгие коалиционные равновесия в играх при неопределенности // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки. 2020. Т. 30. Вып. 2. С. 189-207. https://doi.org/10.35634/vm200204

20. Petrosian O., Barabanov A. Looking forward approach in cooperative differential games with uncertain stochastic dynamics // Journal of Optimization Theory and Applications. 2017. Vol. 172. Issue 1. P. 328-347. https://doi.org/10.1007/s10957-016-1009-8

21. Petrosian O., Tur A., Wang Z., Gao H. Cooperative differential games with continuous updating using Hamilton-Jacobi-Bellman equation // Optimization Methods and Software. 2020. P. 1-29. https://doi.org/10.1080/10556788.2020.1802456

22. Ougolnitsky G. A., Usov A. B. Dynamic hierarchical two-player games in open-loop strategies and their applications // Automation and Remote Control. 2015. Vol. 76. Issue 11. P. 2056-2069. https://doi.org/10.1134/S0005117915110144

23. Gorelov M. A. Logic in the study of hierarchical games under uncertainty // Automation and Remote Control. 2017. Vol. 78. Issue 11. P. 2051-2061. https://doi.org/10.1134/S0005117917110108

24. Gorelov M. A. Risk management in hierarchical games with random factors // Automation and Remote Control. 2019. Vol. 80. Issue 7. P. 1265-1278. https://doi.org/10.1134/S000511791907004X

Поступила в редакцию 10.02.2022 Принята в печать 01.05.2022

Жуковский Владислав Иосифович, д. ф.-м. н., профессор, кафедра оптимального управления, Московский государственный университет им. М. В. Ломоносова, 119991, Россия, г. Москва, Ленинские горы, 1.

ORCID: https://orcid.org/0000-0003-2345-9474 E-mail: zhkvlad@yandex.ru

Жуковская Лидия Владиславовна, д. э. н., ведущий научный сотрудник, Центральный экономико-математический институт РАН, 117418, Россия, г. Москва, Нахимовский проспект, 47. ORCID: https://orcid.org/0000-0002-4152-3161 E-mail: zhukovskaylv@mail.ru

Самсонов Сергей Петрович, к. ф.-м. н., доцент, кафедра оптимального управления, Московский государственный университет им. М.В. Ломоносова, 119991, Россия, г. Москва, Ленинские горы, 1. ORCID: https://orcid.org/0000-0003-3237-7091 E-mail: samsonov@cs.msu.su

Смирнова Лидия Викторовна, к. ф.-м. н., доцент, кафедра информатики и физики, Государственный гуманитарно-технологический университет, 142611, Россия, г. Орехово-Зуево, ул. Зеленая, 22. ORCID: https://orcid.org/0000-0002-8366-4675 E-mail: smirnovalidiya@rambler.ru

Цитирование: В. И. Жуковский, Л. В. Жуковская, С. П. Самсонов, Л. В. Смирнова. Принцип Сэ-виджа и учет исхода в однокритериальной нелинейной задаче при неопределенности // Известия Института математики и информатики Удмуртского государственного университета. 2022. Т. 59. С. 25-40.

V.I. Zhukovskiy, L. V. Zhukovskaya, S.P. Samsonov, L. V. Smirnova

The Savage principle and accounting for outcome in single-criterion nonlinear problem under uncertainty

Keywords: outcome, risk, uncertainty, Pareto optimality, Wald principle, Savage principle. MSC2020: 90C47

DOI: 10.35634/2226-3594-2022-59-03

In the middle of the last century the American mathematician and statistician professor of Michigan University Leonard Savage (1917-1971) and the well-known economist, professor of Zurich University (Switzerland) Jurg Niehans (1919-2007) independently from each other suggested the approach to decision-making in one-criterion problem under uncertainty (OPU), called the principle of minimax regret. This principle along with Wald principle of guaranteed result (maximin) is playing the most important role in guaranteed under uncertainty decision-making in OPU. The main role in the principle of minimax regret is carrying out the regret function, which determines the Niehans-Savage risk in OPU. Such risk has received the broad extension in practical problems during last years. In the present article we suggest one of possible approaches to finding decision in OPU from the position of a decision-maker, which simultaneously tries to increase the payoff (outcome) and to reduce the risk (i. e., "to kill two birds with one stone in one throw"). As an application, an explicit form of such a solution was immediately found for a linear-quadratic variant of the OPU of a fairly general form.

REFERENCES

1. Diev V. S. Rationality and risk, Vestnik Novosibirskogo Gosudarstvennogo Universiteta. Seriya: Filosofiya, 2012, vol. 10, issue 4, pp. 14-20 (in Russian). https://elibrary.ru/item.asp?id=18411209

2. Zhukovskiy V. I., Kudryavtsev K.N. Equilibrating conflicts under uncertainty. I. Analog of a saddle-point, Matematicheskaya Teoriya Igr i Ee Prilozheniya, 2013, vol. 5, issue 1, pp. 27-44 (in Russian). http://mi.mathnet.ru/eng/mgta 102

3. Zhukovskiy V. I., Kudryavtsev K.N. Equilibrating conflicts under uncertainty. II. Analog of a maximin, Matematicheskaya Teoriya Igr i Ee Prilozheniya, 2013, vol. 5, issue 2, pp. 3-45 (in Russian). http://mi.mathnet.ru/eng/mgta 107

4. Zhukovskii V. I., Boldyrev M. V., Kirichenko M. M. A solution guaranteed for a risk-neutral person to a one-criterion problem: an analog of the vector saddle point, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2018, vol. 52, pp. 13-32 (in Russian). https://doi.org/10.20537/2226-3594-2018-52-02

5. Markowitz H. Portfolio selection, The Journal of Finance, 1952, vol. 7, issue 1, pp. 77-91. https://doi.org/10.1111/j.1540-6261.1952.tb01525.x

6. Mukhamedzyanova D. D., Sirazetdinov R. M., Ustinova L. N., Sirazetdinova E. R. The risk management system standardization at innovative enterprises, Ekonomika, Predprinimatel'stvo i Pravo, 2021, vol. 11, no. 12, pp. 2871-2886 (in Russian). https://doi.org/10.18334/epp.11.12.113906

7. Zhukovskiy V. I., Zhukovskaya L.V. Risk v mnogokriterial'nykh i konfliktnykh sistemakh pri neo-predelennosti (Risk in multi-criteria and conflict systems with uncertainty), Moscow: URSS, 2017.

8. Wald A. Contribution to the theory of statistical estimation and testing hypothesis, The Annals of Mathematical Statistics, 1939, vol. 10, no. 4, pp. 299-326. https://www.jstor.org/stable/2235609

9. Wald A. Statistical decision functions, New York: Wiley, 1950.

10. Sawage L. J. The theory of statistical decision, Journal of the American Statistical Association, 1951, vol. 46, issue 253, pp. 55-67. https://doi.org/10.1080/01621459.1951.10500768

11. Niehans J. Zur Preisbildung bei ungewissen Erwartungen, Swiss Journal of Economics and Statistics, 1948, vol. 84, issue 5, pp. 433-456. https://www.econbiz.de/Record/zur-preisbildung-bei-ungewissen-erwartungen-niehans-j%C3%BCrg/10002568205

12. Zhukovskii V. I., Salukvadze M.E. The vector-valued maximin, New York: Academic Press, 1994.

13. Dmitruk A. V. Vypuklyi analiz. Elementarnyi vvodnyi kurs (Convex analysis. An elementary introductory course), Moscow: MAKS Press, 2012.

14. Voevodin V. V., Kuznetsov Yu. A. Matritsy i vychisleniya (Matrices and calculations), Moscow: Nauka, 1984.

15. Salukvadze M. E., Zhukovskiy V.I. The Berge equilibrium: a game theoretic framework for the Golden Rule of ethics, Cham: Birkhauser, 2020. https://doi.org/10.1007/978-3-030-25546-6

16. Zhukovskiy V. I., Salukvadze M.E. The Golden Rule of ethics, London: CRC Press, 2021. https://doi.org/10.1201/9781003134541

17. Zhukovskiy V. I., Chikrii A. A., Soldatova N. G. Existence of Berge equilibrium in conflicts under uncertainty, Automation and Remote Control, 2016, vol. 77, issue 4, pp. 640-655.

https://doi. org/10.1134/S0005117916040093

18. Petrosjan L.A., Zenkevich N.A. Conditions for sustainable cooperation, Automation and Remote Control, 2015, vol. 76, issue 10, pp. 1894-1904. https://doi.org/10.1134/S0005117915100148

19. Zhukovskiy V. I., Zhukovskaya L. V., Kudryavtsev K. N., Larbani M. Strong coalitional equilibria in games under uncertainty, Vestnik Udmurtskogo Universiteta. Matematika. Mekhanika. Komp'yuternye Nauki, 2020, vol. 30, issue 2, pp. 189-207. https://doi.org/10.35634/vm200204

20. Petrosian O., Barabanov A. Looking forward approach in cooperative differential games with uncertain stochastic dynamics, Journal of Optimization Theory and Applications, 2017, vol. 172, issue 1, pp. 328-347. https://doi.org/10.1007/s10957-016-1009-8

21. Petrosian O., Tur A., Wang Z., Gao H. Cooperative differential games with continuous updating using Hamilton-Jacobi-Bellman equation, Optimization Methods and Software, 2020, pp. 1-29. https://doi.org/10.1080/10556788.2020.1802456

22. Ougolnitsky G. A., Usov A. B. Dynamic hierarchical two-player games in open-loop strategies and their applications, Automation and Remote Control, 2015, vol. 76, issue 11, pp. 2056-2069. https://doi. org/10.1134/S0005117915110144

23. Gorelov M. A. Logic in the study of hierarchical games under uncertainty, Automation and Remote Control, 2017, vol. 78, issue 11, pp. 2051-2061. https://doi.org/10.1134/S0005117917110108

24. Gorelov M. A. Risk management in hierarchical games with random factors, Automation and Remote Control, 2019, vol. 80, issue 7, pp. 1265-1278. https://doi.org/10.1134/S000511791907004X

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Received 10.02.2022 Accepted 01.05.2022

Vladislav Iosifovich Zhukovskii, Doctor of Physics and Mathematics, Professor, Department of Optimal Control, Faculty of Computational Mathematics and Cybernetics, Lomonosov Moscow State University, Leninskie Gory, 1, Moscow, 119991, Russia. ORCID: https://orcid.org/0000-0003-2345-9474 E-mail: zhkvlad@yandex.ru

Lidiya Vladislavovna Zhukovskaya, Doctor of Economics, Senior Researcher, Central Economic and Mathematical Institute of the Russian Academy of Sciences, Nakhimovskii pr., 47, Moscow, 117418, Russia.

ORCID: https://orcid.org/0000-0002-4152-3161 E-mail: zhkvlad@yandex.ru

Sergei Petrovich Samsonov, Candidate of Physics and Mathematics, Department of Optimal Control,

Faculty of Computational Mathematics and Cybernetics, Lomonosov Moscow State University, Leninskie

Gory, 1, Moscow, 119991, Russia.

ORCID: https://orcid.org/0000-0003-3237-7091

E-mail: samsonov@cs.msu.su

Lidiya Viktorovna Smirnova, Candidate of Physics and Mathematics, Department of Computer Science and Physics, State University of Humanities and Technology, ul. Zelenaya, 22, Orekhovo-Zuevo, 142611, Russia.

ORCID: https://orcid.org/0000-0002-8366-4675 E-mail: smirnovalidiya@rambler.ru

Citation: V.I. Zhukovskiy, L.V. Zhukovskaya, S.P. Samsonov, L.V. Smirnova. The Savage principle and accounting for outcome in single-criterion nonlinear problem under uncertainty, Izvestiya Instituta Matematiki i Informatiki Udmurtskogo Gosudarstvennogo Universiteta, 2022, vol. 59, pp. 25-40.

i Надоели баннеры? Вы всегда можете отключить рекламу.