Вычислительные технологии
Том 11, № 4, 2006
ПОКАЗАТЕЛЬ ИНТЕРВАЛЬНОГО НЕРАВЕНСТВА: СВОЙСТВА И ПРИМЕНЕНИЕ*
Л. Т. АЩЕПКОВ, Д. В. ДАВЫДОВ Институт прикладной математики ДВО РАН, Владивосток, Россия e-mail: ltas@iam.dvo.ru, ddavydov_77@yahoo.com
A numerical characterization for interval inequalities is offered. Some properties of this characterization are derived, one of which is a comparison with probability measure for interval inequality. Usefulness of the characterization is demonstrated on some interval applications, such as interval-valued function minimization, interval linear programming, and interval matrix games.
Введение
Одним из важных вопросов интервального анализа является сравнение интервалов. Отношение частичного порядка "меньше" или "больше" между интервалами дает возможность формулировать интервальные предпочтения и открывает дорогу для постановки и решения широкого круга задач принятия решений в условиях интервальной неопределенности.
Строгое отношение частичного порядка предложено [1] для пар непересекающихся интервалов, все остальные интервалы считаются несравнимыми. Напротив, слабое отношение частичного порядка [2, 3] допускает пересечение интервалов, но не учитывает меры их общей части. В результате "меньший" интервал на числовой прямой может располагаться почти целиком правее "большего" интервала.
Отсутствие численного критерия при сравнении двух интервалов вряд ли можно признать естественным. В смежных с интервальным анализом дисциплинах (теории вероятностей, теории нечетких множеств) давно и успешно используют вещественные показатели бинарных операций над множествами, которые трактуются как вероятности или функции принадлежности.
В данной статье по аналогии введен вещественный показатель интервального неравенства x < y, позволяющий судить о том, как "много" точек x, y интервалов x, y связано отношением x < y. Устанавливаются основные свойства показателя и его связь с вероятностью. Показано применение показателя к задаче минимизации интервальной функции, интервальному линейному программированию и интервальной матричной игре в чистых стратегиях. Детали практического использования демонстрируются на примере решения задачи оптимального потребительского выбора с интервальным бюджетным ограничением.
* Работа выполнена при финансовой поддержке Дальневосточного отделения РАН (грант № 06-111-А-01-012).
© Институт вычислительных технологий Сибирского отделения Российской академии наук, 2006.
1. Вспомогательные сведения
Рассмотрим замкнутые вещественные интервалы
X = [хо - Ах, хо + Ах], у = [уо - Ау, уо + Ау] (1)
с центрами х0 , уо радиуса Ах > 0, Ау > 0. Следуя [4], приведем известные определения интервального неравенства
х < у (2)
в "сильном", "слабом" и "центральном" смыслах соответственно:
х < у ^ ((х < у)(Ух е х)(Уу е у)), X < у ^ ((х < у)(3х е х)(3у е у)), X < у ^ (хо < уо).
Сильное определение означает, что на числовой оси интервал х расположен левее интервала у и может иметь с ним не более одной общей точки хо + Ах = уо — Ау. Слабое определение включает в себя сильное как частный случай и допускает пересечение интервалов. При этом, если интервалы имеют общую точку хо — Ах = уо + Ау, то х находится правее у. Центральное определение сводит сравнение интервалов к сравнению их центров независимо от радиусов.
Данным определениям можно придать вероятностный смысл, если рассматривать интервалы х, у как континуумы возможных реализаций двух независимых случайных величин х, у. Тогда событие х < у достоверно в смысле сильного определения, возможно с некоторой вероятностью в смысле слабого определения и однозначно устанавливается по математическим ожиданиям случайных величин в смысле центрального определения, если функции их плотности симметричны относительно центров интервалов.
2. Показатель интервального неравенства
Продолжим вероятностную трактовку неравенства (2) для интервалов (1) с положительными радиусами. Будем рассматривать (х, у) как точку на плоскости с независимыми случайными координатами х, у, равномерно распределенными в интервалах х, у соответственно. Вероятность Р(х < у) события
х < у = {(х,у) е х х у : х < у} (3)
равна отношению площади части прямоугольника хху, лежащей выше биссектрисы х = у, к площади всего прямоугольника (рис. 1). Это отношение представляет собой довольно сложную нелинейную функцию центров и радиусов интервалов, поэтому использование вероятности Р(х < у) для характеристики интервального неравенства может вызывать затруднения. Заменим вероятность Р(х < у) более простым числовым показателем Л(х < у). В качестве него выберем (с точностью до знака) отношение отрезков ОС и ОД (рис. 1). Отрезки ОС и ОД пропорциональны расстояниям от центра О и вершины Д прямоугольника до биссектрисы х = у. Используя это обстоятельство и выражая длины отрезков через концы интервалов, получим
ОС | у о — хо|
ОД Ах + Ау'
У x <y X =y
Уо /'K/ у/ X > у
/ / D
/ Xo X
Рис. 1. Отношение ОС/ОО отрезков ОС и ОО характеризует множество точек прямоугольника х х у, удовлетворяющих неравенству х < у.
х0-Ах Уо-^У х0+Ах Уо + Ау х
Рис. 2. Неравенство х < у выполняется для всех точек х,у соответствующих интервалов х, у, за исключением пересечения х П у.
К выражению (4) приводят и другие соображения. Обратимся к случаю пересечения интервалов, изображенному на рис. 2. Неравенство x < y имеет место для тех точек интервалов x, у, которые отвечают условиям x £ [xo — Ax,y0 — Ay], y £ [xo + Ax,yo + Ayj. Отношение суммы длин этих отрезков к сумме длин интервалов x, у характеризует выполнение неравенства (2) и с точностью до знака совпадает с выражением (4).
Учитывая приведенные соображения, примем за показатель интервального неравенства (2) вещественное число
R(x < У) = -y0-^. (5)
v " J; Ax + Ay v у
Введенный показатель обобщает определения интервального неравенства в сильном, слабом и центральном смыслах. Они соответствуют случаям
R(x < у) > 1, R(x < у) > — 1, R(x < у) > 0.
Случай R(x < у) < —1 означает, что интервал x находится целиком правее интервала у и не пересекает его.
Если перейти в формуле (5) к пределу при Ax ^ 0, Ay ^ 0, то для вырожденных (точечных) интервалов x0 = [x0,x0], y0 = [y0,y0] получим
R(x0 < y0) = если x0 < y0,
R(x0 < y0) = — то, если x0 > y0, R(x0 < y0) = 0, если x0 = y0-
Таким образом, показатель (5) можно формально использовать и для вырожденных интервалов (обычных числовых неравенств), если дополнить числовую прямую символами —то и уточнить соответствующие арифметические операции над ними.
3. Свойства показателя
Определим в обозначениях (1) умножение ах вещественного числа а на интервал х и сумму х + у интервалов х, у по правилам
ах = а[хо — Ах, хо + Ах] = [ахо — |а| Дх, ахо + |а|Дх],
х + у = [хо — Ах, хо + Ах] + [уо — Ау, Уо + Ау] =
= [хо + Уо — Ах — Ау, хо + уо + Ах + Ау].
Сходимость хк ^ х последовательности интервалов х^ = [хок — Ахк, хок + Ахк], к = 1, 2,..., к интервалу х будем понимать как сходимость последовательностей центров и радиусов: хок ^ хо, Ахк ^ Ах.
С помощью формулы (5) легко проверить следующие свойства показателя интервального неравенства.
Свойство 1. Если а = 0, то
Л(ах < ау) = (а/|а|)Я(х < у).
Свойство 2. Если пары интервалов а, Ь и х, у имеют положительные суммы радиусов,
то
Я(а + х < Ь + у) = (1 — А)Я(а < Ь) + АЯ(х < у),
где
А =|1+Аа +
Ах + Ау,
Свойство 3. Если каждая пара из трех интервалов х, у, ъ имеет положительную сумму радиусов, то
(Ах + Аг)Я(х < ъ) = (Ах + Ау)Я(х < у) + (Ау + Аг)Я(у < ъ).
Свойство 4. Если хк ^ х и ук ^ у, то Я(хк < ук) ^ Я(х < у).
Приведем ряд очевидных следствий из перечисленных свойств.
IA. Умножение интервального неравенства на положительное число не меняет его показателя; умножение неравенства на отрицательное число меняет знак показателя на противоположный.
1Б. Показатель неравенства антисимметричен
Я(х < у) = — Д(у < х).
IB. Интервалы х, у с совпадающими центрами одновременно удовлетворяют противоположным неравенствам х < у, у < х с нулевым показателем.
2А. Сложение интервальных неравенств а < Ь и х < у с одинаковыми показателями дает неравенство а + х < Ь + у с тем же показателем.
2Б. Если пары интервалов а, Ь и х, у имеют равные суммы радиусов, то показатель неравенства а + х < Ь + у равен среднему арифметическому показателей неравенств а < Ь и х < у.
3А. Для интервалов х, у, ъ с попарно равными положительными суммами радиусов справедливо равенство
Я(х < ъ) = Я(х < у) + Я(у < ъ).
4. Связь показателя с вероятностью
Будем рассматривать точки х,у интервалов (1) с положительными радиусами как реализации независимых случайных величин с постоянными плотностями распределения. Установим связь между показателем р = R(x < y) неравенства x < y и вероятностью P(x < y) события (3). Аналитическое выражение связи зависит от взаимного расположения прямоугольника x х y и полуплоскости х < у (см. рис. 1). Выделим три основных случая. Полуплоскость содержит: а) единственную вершину прямоугольника (-1 < р < —pi); б) от двух до трех вершин включительно (|р| < р1); в) все четыре вершины прямоугольника (Pi < р < 1), где
= |Дх — Ay| р1 = Дх + Ду '
Вероятность р(р) = P(x < y) есть отношение площади пересечения прямоугольника с полуплоскостью к площади всего прямоугольника. Выражая это отношение через координаты вершин прямоугольника и учитывая формулу (5), получим
2 1 Дх + Ду
р(р) = а(1 + р) , —1 < р< —р1, р(р) = ^ + 2Ду р» |р| < р1>
,2 ____ п Л. (Дх + Ду)2
р(р) = 1 - а(1 - р) , р1 < р < 1 = 8АхАу ) ' (6)
Функция р(р), заданная на отрезке [-1,1] формулами (6), непрерывна вместе со своей первой производной. При расчетах, не требующих высокой точности, вместо формул (6) можно использовать более простую формулу
р(р) « п(р), п(р) = 0.5(1 + р), -1 < р < 1. (7)
Для абсолютной погрешности приближения (7) справедлива оценка
|р(р) - п(р)|< 2А/1} , -1 < р < 1,
где число а определено в формуле (6). В частности, если интервалы х, у имеют равные радиусы, то погрешность приближения (7) не превосходит 1/8.
5. Применение показателя
Остановимся на вопросах использования показателя интервального неравенства в некоторых интервальных задачах принятия решений.
Локальный минимум интервально-значной функции. Рассмотрим заданную в области О С Кп интервально-значную [1] функцию
у = {(х) = [/с(ж) - А/(х),/с(х) + А/(х)]. (8)
Пусть х* — некоторая точка множества О, р — вещественное число и С — окрестность точки х* (любое открытое множество в Яга, содержащее х*). Назовем х* точкой локального р-минимума функции ^ на О, если найдется такая ее окрестность С, что для всех х £ С ПО справедливо неравенство
(х*> *г (х»=А/х/)г р. (9)
По смыслу число р есть нижняя оценка показателей интервальных неравенств f (ж*) < f (ж) в окрестности точки ж*. Поскольку неравенство (9) должно выполняться и при ж = ж*, то р < 0. Если р = 0, то каждая точка локального 0-минимума функции f (ж) является точкой обычного локального минимума функции /о (ж) — ее центра. Переписывая неравенство (9) в виде
/о(ж) - рД/(ж) > /о(ж*) + рД/(ж*),
легко показать, что в области р < 0 множество Mp точек локального р-минимума монотонно по включению: MP1 D MP2 при р1 < р2 < 0. В частности, Mp D M0 при р < 0. Применяя к неравенству (9) следствие 1Б, приходим к условию
R(f(ж) < f(ж*)) = ) <
Д/(ж) + Д/(ж* )
Число в = —р > 0 ограничивает сверху вероятность того, что ж* не является точкой минимума интервально-значной функции.
Интервальная система линейных неравенств [5]. Другим примером применения показателя служит система линейных неравенств
n
a j ж^ < b j, i = 1, 2,...,m, (10)
j=i
с заданными интервальными коэффициентами
aij = [ßijo — Дajj ,ajjo + Да^ ], bj = [bio — ДЬ, bjo + Д^]
и вещественными неизвестными ж^.
Пусть р = (р1, р2,... , рт) — некоторый вещественный вектор. Назовем вектор ж
р-решением системы неравенств (10), если
n
R I ^^ ajjж, < ЬИ > рj, i =1, 2,..., m. (11)
Выполняя указанные здесь арифметические операции (см. разд. 2) и пользуясь формулой (5), перепишем (11) в эквивалентной координатной форме
nn
У^ ai^- + р^ ^ Дajj ж| < bjo — PjДbj, i = 1, 2,..., m. (12)
j=i j=i
Таким образом, р-решениями системы неравенств (10) служат те и только те векторы x, которые удовлетворяют всем неравенствам (12). Множетсво Np всех решений (12) обладает свойством монотонности по включению: Npi D Np2, если покоординатно выполняется векторное неравенство р1 < р2. Следовательно, показатель р имеет прямое отношение к "совместности" интервальных неравенств (10).
Заметим, что при неотрицательности координат вектора р нелинейность в неравенствах (12) устраняется введением дополнительных неизвестных. Сформируем отвечающую (12) вспомогательную систему линейных неравенств
n n
у^ aijQXj + рг^ Aaj Sj < Ью - р^Д^, i = 1, 2,...,m, (13)
j=i j=i
-Sj < Xj < Sj, j = 1, 2,..., n.
Множество ее решений в координатном пространстве переменных x1, x2,... , xn, s1, s2, ... , sn обозначим Lp. Нетрудно показать, что при р > 0 множество Np есть ортогональная проекция множества Lp на подпространство переменных x1,x2,... ,xn. В ряде случаев это обстоятельство позволяет сохранять линейность при редукции линейных интервальных задач принятия решений (например, задачи линейного программирования) к другим детерминированным задачам. Соответствующий пример приведен ниже.
Интервальное линейное программирование [6]. Рассмотрим стандартную задачу линейного программирования
c'x ^ max, Ax < b, x > 0, (14)
где A, b — заданные интервальные матрица и вектор размерности m х n,m; x — вектор неизвестных размерности n; c'x — скалярное произведение заданного (неинтервального) n-мерного вектора c на x. Интервальное неравенство в условии задачи (14) будем понимать в прежнем смысле (10).
Пусть р = (р1,р2,... , рт) — некоторый заданный вектор. Неотрицательный вектор x, удовлетворяющий условиям (11), назовем р-планом задачи (14). С учетом (12) нахождение оптимального р-плана задачи (14) сводится к решению детерминированной задачи линейного программирования
c'x ^ max, (А0 + < Ь0 - Др)ДЬ, x > 0, (15)
где А0, ДА, Ь0, ДЬ — матрицы и векторы, составленные обычным образом из соответствующих чисел aij0, Да^, Ьг0, ДЬг, i =1, 2,... , m, j = 1, 2,... , n; Д(р) — диагональная матрица, главная диагональ которой сформирована из координат вектора р. Если в задаче (14) условие неотрицательности неизвестных отсутствует, то ограничения задачи (15) следует формировать в виде (12) (или (13) при р > 0).
Интервальная матричная игра [7, 8]. Рассмотрим в обозначениях предыдущего примера матричную игру с интервальной (m х ^-матрицей выигрышей A = (aij). Будем предполагать, что стратегиями первого и второго игрока служат номера строк и столбцов матрицы выигрышей соответственно. При независимом выборе игроками стратегий i, j выигрышем первого игрока (проигрышем второго игрока) в ситуации (i, j) считается любое число aij из интервала aij.
Назовем стратегии i*, j * р-оптимальными, если неравенства
R(aij* < ai*j*) > р, R(ai*j* < ai*j) > р, i =1, 2,..., m, j = 1, 2,..., n, (16)
выполняются при наибольшем значении р.
Нахождение числа р и р-оптимальных стратегий сводится к двум операциям: вычислению минимальных показателей неравенств
Paß = min{R(aiß < a«ß), R(a«ß < aaj)} (17)
i,j
для каждой пары индексов а, в и выделению из них максимального показателя
р = max paß = Pi*j*.
a,ß
Поясним сказанное на примере матрицы выигрышей
[2, 4] [6, 8] ■
А
А 1 [—4, —2] [0,2]
По формуле (17) находим
ри = тт{Я([—4, —2] < [2, 4]); Я([2, 4] < [6, 8])} = тт{3; 2} = 2.
Точно так же вычисляем р12 = —2, р21 = —3, р22 = —3. Ситуации (1,1) отвечает наибольший показатель р =2 из всех минимальных. Следовательно, стратегии г* = ]* = 1 будут 2-оптимальными.
Приведенный алгоритм находит число р и р-оптимальные стратегии за конечное число шагов для любой матрицы выигрышей с невырожденными интервальными элементами (имеющими положительные радиусы). В этом смысле проблемы р-разрешимости интервальных матричных игр в чистых стратегиях формально не существует. Однако имеется неформальная проблема приемлемости р-решения для игроков при р < —1, которая аналогична отсутствию седловой точки матрицы выигрышей в обычных (неинтервальных) матричных играх. В качестве примера приведем интервальный аналог известной игры в "орлянку" с матрицей выигрышей
А = / [—1 — е, —1 + е] [1 — е, 1 + е] V [1 — е, 1+ е] [—1 — е, —1 + е]
Здесь любые стратегии игроков являются (—е-1)-оптимальными.
Данный пример свидетельствует о необходимости перехода к смешанным стратегиям [9]. Его можно выполнить с помощью описанной выше техники, которая сводит решение интервальной матричной игры в смешанных стратегиях к решению двух детерминированных задач линейного программирования типа (15). Однако подробное изложение этого подхода требует отдельного освещения.
6. Пример
Рассмотрим известную [10] задачу оптимального потребительского выбора
и(х1,х2) = х?х2"а ^ тах, р1х1 + р2х2 < М, х1 > 0, х2 > 0, (18)
в которой требуется найти количества двух потребляемых товаров, максимизирующих функцию полезности Кобба — Дугласа при бюджетном ограничении. Здесь x1 , x2 — количества товаров; p1,p2 — соответствующие цены; M — ожидаемый доход; а, — заданный параметр (0 < а < 1). Решение задачи имеет вид
= ам, x2 = (1 -а)м, „• = м(а)(1-а)1-". (19)
Pi Р2 \PlJ \ Р2 J
Результаты социологических опросов свидетельствуют о приближенном восприятии потребителями цен приобретаемых товаров и ожидаемых доходов [11, 12]. Поэтому естественно считать коэффициенты p1,p2, M в бюджетном ограничении (18) не определенными со значениями в некоторых известных интервалах p1, p2, M. В этом случае точное решение (19) становится неопределенным и, вообще говоря, малоинформативным. Его нельзя осреднить вероятностными методами, поскольку распределение цен внутри интервалов неизвестно. Гарантированное решение, соответствующее наибольшим ценам и минимальному доходу, как видно из (19), имеет минимальную оптимальную полезность и вряд ли отвечает интересам потребителя. Выясним, что дает интервальная интерпретация
u(x1, x2) = x^1"" ^ max, p1x1 + p2x2 < M, x1 > 0, x2 > 0, (20)
задачи (18). Для упрощения анализа примем цены p10 > 0, p20 > 0 и ожидаемый доход Mo > 0 известными с некоторыми относительными ошибками п1 = п2 = п и ц, т. е. положим
p1 = P10 [1 - п, 1+ п], p2 = P20 [1 - п, 1+ п], 0 <п< 1,
M = M0 [1 - ц, 1 + ц], 0 <ц< 1.
Потребуем, чтобы бюджетное ограничение (20) выполнялось с показателем р, -1 < р < 1. Применив формулу (5), преобразуем задачу (20) к детерминированной задаче с параметрами
u(x1 ,x2) = x?x2"a ^ max, (1 + пр)^^ + p20x2) < (1 - ^p)M0, x1 > 0, x2 > 0. (21)
По аналогии с (19) найдем решение задачи (21):
x!(p) = k(p)x1, x2 = k(p)x2, U = fc(p)M^-V f—Y = . (22)
\P1j V P2 J 1+ пР
Формулы (22) описывают семейство решений. Поскольку функция к(р) на отрезке -1 < р < 1 положительна и строго убывает, с возрастанием показателя р "полезность" решений (22) уменьшается. Вместе с тем "надежность" этих решений (в смысле вероятности выполнения бюджетного ограничения) увеличивается. Таким образом, потребитель имеет возможность выбирать из данного семейства по своему усмотрению любые промежуточные по градации решения между высокополезными и ненадежными и менее полезными, но надежными. Например, "среднее" решение (22), отвечающее р = 0, ориентировано на средний доход M0 и вероятность 0.5 выполнения бюджетного ограничения; его полезность при малой относительной ошибке п близка среднему арифметическому 0.5[и*(-1) + и*(1)]. В пределе при п ^ 0, ц ^ 0, M0 ^ M решение (22) переходит в решение (19).
Как видно из данного и приведенных выше примеров, в оптимизационных задачах с интервальной неопределенностью предлагаемый подход вместе с понятием показателя
интервального неравенства приводит к интерпретируемым семействам решений и дает возможность выбора среди них подходящего в том или ином смысле. Здесь прослеживается некоторая аналогия с многокритериальной оптимизацией или теорией игр, в которых неоднозначность условий задачи или понимания решений объективно ведет к неоднозначности ответов.
Список литературы
[1] Вощинин А.П., Сотиров Г.Р. Оптимизация в условиях неопределенности. М.: Изд-во МЭИ, 1989.
[2] Фишверн П. Теория полезности для принятия решений. М.: Наука, 1978.
[3] Tsoukias A., Vincke Ph. A Characterization of PQI interval orders // Discrete Appl. Math. 2003. Vol. 127, N 2. P. 387-397.
[4] ШАРЫй С.П. Интервальные алгебраические задачи и их численное решение: Дис. ... докт. физ.-мат. наук. Новосибирск, 2000.
[5] Rohn J., Kreslova J. Linear interval inequalities // Linear and Multilinear Algebra. 1994. Vol. 38. P. 41-43.
[6] ВАТОлин А.А. О задачах линейного программирования с интервальными коэффициентами // Журн. вычисл. математики и мат. физики. 1984. Т. 24. С. 1629-1637.
[7] ШАшихин В.Н. Решение интервальной матричной игры в смешанных стратегиях // Изв. РАН. Теория и системы управления. 2001. № 5. С. 97-104.
[8] Ащепков Л.Т., Гуторова С.В., Карпачев А.А., Ли С. Интервальные матричные игры // Дальневост. мат. журн. 2003. № 2. С. 276-288.
[9] Фон Нейман Дж., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970.
[10] Varian H.R. Microeconomic analysis. N.-Y.: W.W. Norton & Co., 1992.
[11] Давыдов Д.В., Тарасов А.А. Модели теории выбора. Владивосток, 2005 (Препр. / РАН. Дальневосточное отд-ние; ДВГУ).
[12] Давыдов Д.В., Тарасов А.А. Модели поведения потребителей: экспериментальная проверка в региональных условиях // Информатика и системы управления. 2003. Т. 2, № 6. С. 57-66.
Поступила в редакцию 20 декабря 2005 г., в переработанном виде —15 марта 2006 г.