Научная статья на тему 'Линейная задача принятия решений с учетом рисков и сожалений'

Линейная задача принятия решений с учетом рисков и сожалений Текст научной статьи по специальности «Математика»

CC BY
47
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ / LINEAR PROGRAMMING PROBLEM / НЕОПРЕДЕЛЕННОСТЬ / UNCERTAINTY / ДВУХКРИТЕРИАЛЬНАЯ ЗАДАЧА / TWO-CRITERIA PROBLEM / РИСК ПО ВАЛЬДУ / RISK FUNCTION / СОЖАЛЕНИЕ ПО СЭВИДЖУ / REGRET FUNCTION / МИНИМУМ ПО ПАРЕТО / PARETO MINIMUM

Аннотация научной статьи по математике, автор научной работы — Бардин А.Е., Житенева Ю.Н.

В работе рассматривается задача линейного программирования при неопределенности, формализуется понятие U-оптимального по рискам и сожалениям решения данной задачи. Указан алгоритм построения оптимального решения. Реализация алгоритма показана на примере задачи составления оптимального плана производства

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Линейная задача принятия решений с учетом рисков и сожалений»

УДК: 519.87 MSC2010: 90C47

ЛИНЕЙНАЯ ЗАДАЧА ПРИНЯТИЯ РЕШЕНИЙ С УЧЕТОМ РИСКОВ

И СОЖАЛЕНИЙ

© А. Е. Бардин, Ю. Н. Житенева

Государственный гуманитарно-технологический университет факультет информатики ул. Зеленая, 22, г. Орехово-Зуево, Московская обл., 142611, Российская Федерация e-mail: inth2006@rambler.ru, ulya_zhiteneva@mail.ru

The linear problem of making solution with consider the risks and regrets.

Bardin A. E., Zhiteneva J. N.

Abstract. This paper deals with a linear programming problem with interval function coefficients. A new approach for a problem under uncertainty is proposed. It is based on two concepts: the guaranteed result and the minimax regret criterion. We consider the following linear programming problem under uncertainty

max f (x,y),

x£X

n

where f (x, y) = ^ Vixi is utility function, the feasible set X is given by

i=l

X = {x = (X1,X2,... ,Xn) e Rn| Ax < b}.

Here A is an m x n matrix, x and b are n- and m-column vectors, respectively. The set of uncertainties is defined by

Y = {y = (yi,V2,... ,Vn)| a < Vi < bi, i e {1,2,... ,n}}. Further, we decide the standard linear programming problem

n

f (x, y) = E aixi ^ max,

i=l

\ x = (xi,x2, . . . ,xn) e X, { xi > 0, i e {1, 2,..., n},

where X = {x = (xl, x2,..., xn) e Rn| Ax < b} and xV e X is solution. The two-criteria problem

Г = (X, {fi(x) = Rv(x), f2(x) = Rs(x)}),

is formalized. Here

Rv (x) = fv [xV] aixi

i=l

is risk function,

RS (x) = max ф(х,у) — minmax ф(х,у)

y£Y x€X y£Y

is regret function, where ф(х,у) = max f (x,y) — f (x, y).

z€X

Then we look for vector xp £ X, which minimizes the function

F(x) = RV(x) + RS(x), x £ X.

Solution xP £ X is Pareto optimal for problem Г. In this paper we construct the algorithm finding optimal solution xP £ X. In order to illustrate the proposed solution method, a numerical example is given.

Keywords: linear programming problem, uncertainty, two-criteria problem, risk function, regret function, Pareto minimum.

Введение

В работах [1]—[3] Жуковского В. И. и его учеников исследуются конфликтные системы при неопределенности. Там же формализованы различные понятия решения, которые базируются на принципах оптимального поведения из теории задач при неопределенности. В данной работе анализируется линейная модель принятия решений в условиях действия неконтролируемых факторов.

Для принятия решения в условиях неопределенности используется ряд критериев. Согласно максиминному критерию Вальда игра с природой рассматривается как конфликт с разумным и агрессивным противником, делающим все для того, чтобы помешать лицу, принимающему решение (ЛПР) достигнуть успеха. Таким образом, осторожная (максиминная) стратегия ЛПР является оптимальной согласно этому критерию. Этот критерий олицетворяет «позицию пессимизма». Он ориентируется на самую неблагоприятную для ЛПР реализацию неопределенности. Такой подход естественен для того, кто боится проиграть.

Критерий минимаксного сожаления Сэвиджа при выборе оптимальной стратегии ориентируется не на выигрыш, а на сожаления. В качестве оптимальной стратегии выбирается та стратегия, при которой величина сожаления в наихудших условиях минимальна. Такая стратегия поведения часто соответствует принципам азартного игрока.

Очевидно, разумный игрок должен учитывать как возникающие риски при принятии решения, так и возможность получения большего выигрыша. Возникает идея формализации нового подхода к принятию решений в игре с природой, который мог бы соединить позитивные особенности обоих принципов и ослабить их негативные

свойства. В данной работе формализуется понятие и-оптимального по рискам и сожалениям решения линейной задачи и указан алгоритм построения оптимального решения.

1. Постановка задачи. Формализация оптимального решения

Рассмотрим задачу линейного программирования при неопределенности

n

f (x, y) = Е ViXi ^ max,

i=1

x = (x1, ..., xn) E X, X e comp Rn, (1) 0 < a < Vi < bi,

xi > 0, i E {1, 2,...,n}.

Неотрицательный набор переменных x = (x1, x2,... , xn) можно интерпретировать как план производства n видов продукции, причем количество продукции каждого вида ограничено ресурсами данного производства. Будем предполагать, что множество X допустимых планов определено системой линейных уравнений и нестрогих линейных неравенств. Неопределенность yi, i E {1, 2,... , n}, можно рассматривать как доход от реализации единицы i-го вида продукции. При этом для указанных доходов известны лишь граничные значения, которые зависят от рыноч-

n

ных цен, спроса и т.д. Тогда целевая функция f (x, y) = Vixi есть суммарный доход

i=1

от реализации всей продукции. Формализуем U-оптимальное по рискам и сожалениям решение данной задачи.

Согласно подходу в работах [1]—[3] стратегический риск по Вальду для лица принимающего решение (ЛПР) положим равным

Rv(x) = maxminf (x,y) - mmf (x, V), (2)

x€X y£Y y£Y

стратегическое сожаление по Сэвиджу определим как

RS(x) = max 0(x, y) — min max 0(x, y), (3)

yEY x€X yEY

где функция сожаления 0(x,y) вычисляется согласно равенству

0(x,y) = max f (x,y) — f (x,y).

zGX

Отметим, что риски и сожаления определены как стратегические, то есть являются функциями только от выбранного решения (стратегии) x E X. Заметим также, что вследствие непрерывности функции f (x, y) и компактности множеств решений X

и неопределенностей

Y = {у = (У1,У2, . . . ,Уп)| «i < Уг < bi, i G {1, 2,...,^}} ,

все указанные максимумы и минимумы существуют, причем функции Яу (х) и Rs(х) будут непрерывными.

Для исходной задачи (1) введем обозначение:

п

/у[х] = min / (x,y) = V од.

y€Y ^—'

i=1

Тогда гарантированный суммарный доход от реализации плана ху равен

n

max min / (х, у) = ma^> агхг = /у [ху].

x€X y€Y x€X ^—'

г=1

Здесь осторожный по Вальду план ху G X есть решение оптимизационной задачи

n

/(х, у) = Е «гХг ^ max,

г=1

х = (х1,х2,... ,хп) G X, хг > 0, i G {1, 2,. . . ,n}.

Получаем стратегический риск по Вальду

n

Яу (х) = /у [ху ] - йгхг.

г=1

Далее построим алгоритм нахождения функции Rs(х), определенной в (3). Введем обозначение:

Ф^ [х] = max ф(х,у). (4)

yeY

Пусть

nn

ф(х,У) = max /(х,У) - /(х,У) = maxV yi(zi - хг) = V yi(z*(y) - хг). (5)

г=1 г=1

Здесь вектор z*(y) = (z^(y), z2(y),..., (y)) является решением задачи параметрического программирования

n

/(z,y) = Е yizi ^ maX

г=1

z = (z1, z2,..., zn) G X, X G compRn (6)

0 < «i < yi < Ьг, Zi > 0, i G {1, 2,...,n}.

Так как параметры yi} i Е {1,2, ...,n}, положительны, а также zi > 0, i Е {1, 2, ...,n}, то оптимальные решения z*(y) принадлежат множеству XP максимальных по Парето точек множества X. Именно, точка xP = (xp,xp,... ,xp) будет максимальной по Парето точкой множества, если для всех x = (xi,x2,... ,xn) несовместна система неравенств

P

x1 > xp, x2 > xp,

\ p /V» ry1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

n > n

причем хотя бы одно из неравенств является строгим.

Таким образом, с одной стороны, для каждого фиксированного набора y = (y1, y2,... , yn) Е Y задача (6) является задачей линейного программирования. Следовательно, оптимальное решение z*(y) достигается в некоторой угловой точке множества Xp . С другой стороны, функция 0(x,y), заданная в (5), является кусочно-линейной по переменной y. Поэтому при фиксированном наборе x = (x1, x2,..., xn) Е X наибольшее сожаление ЛПР достигается в одной из угловых точек многогранника Y, где совокупность всех угловых точек представляет собой множество

Yc = {c = (ci,c2,... ,Cn)| c Е {ai,bi}, i Е {1, 2,..., n}}.

Исходя из вышесказанного, получаем, что для построения явного вида функции Ф^[x], определенной в (4), можно «сузить» множество допустимых решений X до множества Xp, а множество неопределенностей Y до множества Yc . Таким образом, имеем следующий алгоритм:

1 шаг. Находим совокупность Xp всех угловых точек множества Xp.

2 шаг. Для каждого набора c = (c1 ,c2,... ,cn) Е Yc решаем оптимизационную задачу

n

f (x) = cixi ^ max,

i=1

c = (c1,c2,...,cn) Е Yc, (7)

x = (x1, x2, . . . , xn)

Е Xp.

3 шаг. Пусть x*(c) = (x1(c), x£(c),..., xn(c)) оптимальное решение задачи (7) с заданным набором c = (c1, c2,..., cn) Е Yc, тогда составляем функцию

n

0(x, c) = ci(x*(c) - xi).

i=1

4 шаг. Для каждого набора с = (с^ с2,..., сп) Е УС определяем множество X(с), которое задается системой неравенств

Ф(х, с) > ф(х, У^ е Ус.

5 шаг. Получаем явный вид функции Фя[х] = ф(х, с), х Е X(с) П X, с Е Ус•

В результате указанной выше последовательности шагов получаем представление множества X как объединение конечного числа подмножеств, именно,

X = и (X(с) П X).

сеУс

На каждом подмножестве вида X (с) ПX функция Фя [х], заданная равенством (4), имеет «особый» аналитический вид, то есть

п

ФЯ[х] = ф(х, с) = ^ сДх*(с) — хг), ф(х, с) > ф(х, , У^ Е УС.

г=1

Отметим, что некоторые множества вида X(с) П X, с Е УС, могут быть пустыми.

6 шаг. Далее решаем классические задачи линейного программирования, число которых не более 2п. Именно,

п

ФЯ[х] = Е сг(х*(с) — хг) ^ min,

г=1 (8)

х Е (X(с) П X).

7 шаг. Окончательно, сравнивая решения задач вида (8), находим «глобальный» минимум функции Фя [х] на множестве X. Пусть план х^ является оптимальным решением исходной задачи (1) согласно принципу Сэвиджа, то есть

ФЯ [хЗ ] = тттах ф(х,у) = ттФя [х].

х€Х у€У х€Х

8 шаг. Если с е Ус, то функция Я8(х) на множестве X (с) П X имеет вид:

п

Яя(х) = Фя[х] — Фя[х£] = ^ сг(х*(с) — хг) — Фз[х£].

г=1

Перейдем к формализации и-оптимального решения для задачи (1). Исходной задаче поставим в соответствие двухкритериальную задачу

Г = (X, {/1(х) = Яу(х), /2(х) = Яя(х)}>,

где ЛПР стремится получить значения каждого из критериев как можно меньше. Формализуем понятие оптимального решения в исходной задаче, используя известные понятия оптимальности для многокритериальных задач.

Определение 1. Решение в задаче (1) назовем U-оптимальным по рискам и сожалениям, если оно является минимальным для функции

F(x) = R2 (x) + Rs(x), x Е X.

Теорема 1. Если система ограничений в задаче (1) является непустым компактом пространства Rn, то существует U-оптимальное по рискам и сожалениям решение xjj Е X, которое является минимальным по Парето для задачи Г. При этом решение xj принадлежит множеству Xp максимальных по Парето точек множества X.

2. Задача составления оптимального плана производства

Проиллюстрируем алгоритм нахождения U-оптимального по рискам и сожалениям решения на конкретной модели составления оптимального плана производства.

Пример. Рассмотрим задачу линейного программирования при неопределенности

f (x, y) = y1 x1 + y2x2 ^ max,

x1 + x2 < 10, (9)

0 < x1 < 8, ()

0 < x2 < 6,

где значения неопределенностей удовлетворяют неравенствам

1 < y1 < 8, 3 < y2 < 6.

Неотрицательный набор переменных x = (x1,x2) можно интерпретировать как план производства двух видов продукции, причем количество продукции первого вида требуется выпустить не больше 8 единиц, второго - не более 6, а общее количество выпускаемой продукции не должно превосходить 10 единиц. Неопределенности y1 , y2 представляют собой возможные доходы от реализации единиц соответствующих видов продукции. При этом для указанных доходов известны лишь граничные значения, которые зависят от рыночных цен, спроса и т.д. Тогда целевая функция f (x, y) = y1 x1 + y2x2 есть суммарный доход от реализации всей продукции,

где y = (y1,y2).

Найдем U-оптимальное по рискам и сожалениям решение данной задачи. Вычислим стратегический риск по Вальду Rv(x), определенный в (2). Так как переменные x1, x2 и неопределенности y1, y2 в задаче (9) неотрицательны, то минимальное значение целевой функции f (x,y) достигается при наихудших для ЛПР

значениях неопределенностей, то есть

min / (x y) = / (x ymin) = xi + 3x2,

где ymln = (1, 3).

Для нахождения max min /(x,y) решаем задачу линейного программирования

x€X

/(x) = x1 + 3x2 ^ max,

xi + X2 < 10, (10)

0 < xi < 8, ()

0 < x2 < 6.

Оптимальное решение задачи (10) равно xmax = (xmax,xmax) = (4,6). Найденное осторожное решение является максиминным для задачи (9), при этом

max min f (x,y) = 22. xex

Если набор x = (x1,x2) произвольное допустимое решение задачи, то стратегический риск по Вальду для ЛПР равен

RV (x) = 22 - x1 - 3x2. (11)

Перейдем к нахождению стратегического сожаления по Сэвиджу Rs(x), определенного в (3). Используем приведенный в работе алгоритм.

1 шаг. Совокупность всех угловых точек множества XP есть множество

XP = {A =(4, 6), B = (8, 2)}.

2 шаг. Множество вершин прямоугольника

Y = {y =(yi,y2)| 1 < yi < 8, 3 < y2 < 6}

есть

Yc = {c(i) = (1, 3),c(2) = (1, 6),c(3) = (8, 3),c(4) = (8, 6)}. Для каждого набора c(i) = , с2г^ G Yc решаем оптимизационную задачу

/(x) = cii)xi + c2^x2 ^ max, c(i) = (c(ii),c2i^ G Yc, i G {1, 2, 3, 4}, (12)

x = (x(,x2) G Xp.

Получаем множество оптимальных решений x*(c(i)) = ^xi(c(i)), x2(c(i), i G {1, 2, 3, 4}, задач вида (12), именно

{x*(c(i)) = (4, 6), x*(c(2)) = (4, 6), x*(c(3)) = (8, 2), x*(c(4)) = (8, 2)}.

3 шаг. Пусть x* (c(i)) оптимальные решения задачи (12) с заданным набором c(i) = ^c!i),c2i^ E YC. Составляем функции

0(x, c(i)) = c(1i) (x*(c(i)) — x1) + c2i) (x*(c(i)) — x2), i E {1, 2, 3, 4}. В результате имеем систему функций:

0(x,c(1)) = 22 — x1 — 3x2,

0(x, c(2)) = 40 — x1 — 6x2, (13)

0(x,c(3)) = 70 — 8x1 — 3x2, ( )

0(x, c(4)) = 76 — 8x1 — 6x2.

4 шаг. Для каждого набора c(i) = (cSi) ,c?) E Ус, i E {1, 2, 3, 4}, графически находим множество X c(i) , которое определяется системой неравенств

0(x,c(i)) > 0(x,c(j)), Vi, j E {1, 2, 3, 4}, j = i.

Отметим, что система

0(x,c(1)) > 0(x,c(j)), Vj E {2, 3, 4},

не имеет решений, то есть множество X(c(1)) пустое.

5 шаг. Получаем явный вид функции Ф*[x] = 0(x, c(i)), c(i) E Ус, i e{2, 3, 4} .В результате получаем представление множества X как объединение конечного числа

подмножеств, именно, X = у ^x (c(i)) n X j

ie{2,3,4}

6 шаг. Решаем классические задачи линейного программирования вида (8), именно,

Ф*[x] = Е cii^xk(c(i)) — xfc) ^ min,

k=1 v ' (14)

x E (x (c(i)) n x), i E {2, 3, 4}.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7 шаг. Окончательно, сравнивая решения задач вида (14), находим «глобальный» минимум функции Ф*[x] на множестве X. Получаем, что план x* = (6,4) является оптимальным решением задачи (9) согласно принципу Сэвиджа, то есть

Ф* [xS] = minmax 0(x,y) = minФS [x] = 10.

x€X y€Y x€X

8 шаг. Учитывая (3), опишем функцию Rs (x) на множестве XP максимальных по Парето точек множества X:

„ , , I 60 — 8x1 — 3x2, 4 < x1 < 6, x1 + x2 = 10, Rs (x) = <

I 30 — x1 — 6x2, 6 < x1 < 8, x1 + x2 = 10.

Таким образом, на множестве Xр максимальных по Парето точек множества X задачи (9) функцию стратегического риска по Сэвиджу можно записать в виде

„ , , I 30 — 5х1, 4 < х1 < 6, х1 + х2 = 10, Яs (х) = <

I 5х1 — 30, 6 < х1 < 8, х1 + х2 = 10.

С учетом (11), функция стратегического риска по Вальду на множестве Xр примет вид

Яу (х) = 2х1 — 8, 4 < х1 < 8, х1 + х2 = 10.

Для отыскания U-оптимального по рискам и сожалениям решения задачи (9) найдем решение задачи минимизации функции Г(х) = Яу> (х) + Я| (х) на множестве Xр, т. е.

Г(х) = 29х? — 332х1 + 964 ^ т1п,

х1 + х2 = 10, 4 < х1 < 8.

Используя необходимые и достаточные условия существования экстремума, можно показать, что

(166 124 \ хи = агд шш Г, ^^^ .

Найденное решение является и-оптимальным по рискам и сожалениям в задаче (9) составления оптимального плана производства.

ЗАКЛЮЧЕНИЕ

В данной работе определяются понятия функции риска и функции сожаления для задачи линейного программирования при неопределенности. Каждое возможное решение ЛПР оценивает двумя критериями: стратегическим риском по Вальду и стратегическим сожалением по Сэвиджу. Первый критерий вычисляет возможные потери при отклонении от гарантированного по Вальду решения. Второй критерий учитывает возможность реализации «благоприятных» для ЛПР неопределенностей.

Формализовано и-оптимальное по рискам и сожалениям решение исходной линейной модели, которое соответствует поведению разумного игрока. Построен пошаговый алгоритм нахождения оптимального решения и проиллюстрирован на конкретном примере.

Описок литературы

1. Бардин, А. Е., Житенева, Ю. Н. Риски и сожаления в игре с природой // Международный научный журнал "Спектральные и эволюционные задачи": Труды XXII Международной конференции "Крымская осенняя математическая школа—симпозиум". — Симферополь: ТНУ, 2012. — Т. 22. — C. 2-5.

BARDIN, A. & ZHITENEVA, J. (2012) The risks and regrets in game with nature. International Scientific Journal "Spectral and Evolution Problems: Proceedings of the Twenty Second Crimean Autumn Mathematical School-Symposium (KROMSH-2012)". 22. p. 2-5.

2. Бардин, А. Е., Житенева, Ю. Н. Равновесия гарантий в одной бескоалиционной игре при неопределенности // Анализ, моделирование, управление, развитие экономических систем: сборник научных трудов VIII Международной школы—симпозиума АМУР-2014. — Симферополь: ТНУ, 2014. — C. 23-24.

BARDIN, A. & ZHITENEVA, J. (2014) The equilibrium of guarantees in one non-cooperative game under uncertainty. Analysis, Modeling, Management, Development of Economic Systems: Proceedings of the Eighth International School-Symposium AMUR-2014. . p. 23-24.

3. Жуковский, В. И., Кудрявцев, К. Н., Смирнова, Л. В. Гарантированные решения конфликтов и их приложения. — M.: КРАСАНД, 2013. — 324 с.

ZHUKOVSKIY, V. and CUDRYAVCEV, K. and SMIRNOVA, L. (2013) Guaranteed conflict solutions and their applications. Moscow: KRASAND.

i Надоели баннеры? Вы всегда можете отключить рекламу.