Исследование конусной оптимальности в дифференциальной кооперативной игре без побочных платежей

Матвеев Владимир Александрович

Для применения предлагаемого подхода главным условием является различие ТФС основного материала и скрытых в нём дефектов - СПО. В системе грунт (основной материал) - СПО (металл, пластмасса), эффективность решения задачи обнаружения и распознавания типа объекта заключается в том, что тепловые свойства грунта по шкале теплопроводности находятся посредине между тепловыми свойствами металлов и пластмасс.

Таким образом, применение методики обнаружения скрытых подповерхностных объектов в

инфракрасном диапазоне волн на основе идентификации их теплофизических свойств позволяет повысить контраст изображения за счёт преобразования термограмм в тепловые томограммы и глубинограммы и, соответственно, увеличить вероятность правильного обнаружения объектов поиска с распознаванием их класса как по тепло-физическим свойствам, так и по контуру.

Работа выполнена при поддержке по региональному гранту РФФИ, проект № 09-01-97501-р_центр_а.

СПИСОК ЛИТЕРАТУРЫ

1. Громов Ю.Ю., Лобанов Б.С., Ищук И.Н. и др.

Интеллектуальная информационная система синтеза решения задач теплового обнаружения скрытых подповерхностных объектов // Инженерная физика. 2009. № 11. С. 36-42.

2. Ищук И.Н., Фесенко А.И., Громов Ю.Ю. Идентификация свойств скрытых подповерхностных объектов в инфракрасном диапазоне волн. М.: Машиностроение. 2008. 184 с.

3. Ищук И.Н., Громов Ю.Ю., Самхарадзе Т.Г., Фесенко А.И. Обработка изображений в инфракрасном диапазоне волн на основе идентификации тепловых свойств скрытых подповерхностных объектов // Инженерная физика. 2009. № 2. С. 3-11.

4. Ищук И.Н., Карпов И.Г., Фесенко А.И. Обнаружение скрытых подповерхностных объектов в инфракрасном диапазоне волн на основе идентификации

их тепло-вых свойств // Измерительная техника. 2009. № 4. С. 36-39.

5. Фурман Я.А., Кревецкий А.В., Передреев А.К.

и др. Введение в контурный анализ и его приложения к обработке изображений и сигналов. М.: ФИЗМАТЛИТ. 2002. 592 с.

6. Тихонов В.И. Оптимальный прием сигналов. М.: Радио и связь. 1983. 320 с.

7. Ищук И.Н. Принципы обнаружения дефектов в материалах при помощи термографии // Измерительная техника. 2008. № 4. С. 49-53; Ishchuk I.N. The detection of defects in materials using thermography // Measurement Techniques. 2008. Vol. 51. № 4. P. 184-187.

8. Ищук И.Н., Фесенко А.И., Скрипкин А.С. Профилирование глубины с помощью оптико-электронной системы тепловой подповерхностной локации // Радиотехника. 2008. № 5. С. 61-65.

УДК 519.8

В.А Матвеев

ИССЛЕДОВАНИЕ КОНУСНОЙ ОПТИМАЛЬНОСТИ В ДИФФЕРЕНЦИАЛЬНОЙ КООПЕРАТИВНОЙ ИГРЕ БЕЗ ПОБОЧНЫХ ПЛАТЕЖЕЙ

При выработке и принятии решения в сложной системе управления большое значение имеет согласование интересов сторон, имеющих несовпадающие взгляды на результат функционирования системы. Изучение этой проблемы проводилось в рамках теории группового выбора [1]. Под групповым решением обычно понима-

ют общее соглашение по рассматриваемой проблеме для всех участников группы на основе их субъективных интересов, предпочтений и целей. Иными словами, осуществляется переход от индивидуальных точек зрения отдельных экспертов к единому коллективному мнению, на основе которого вырабатывается согласованное групповое

решение. Такой взгляд на проблему очень близок к концепции кооперативного решения в теории игР [2].

Очень часто в моделях управления рассматривается "статическое" или "мгновенное" принятие решения. В этом случае не учитывается изменение объекта управления и предпочтений лица принимающего решение (ЛПР) с течением времени. Такая идеализация характерна и для конфликтных или теоретико-игровых задач. Однако в большинстве реальных проблем с течением времени изменяется и сама управляемая система и предпочтения ЛПР, ибо "всё течёт, всё движется и ничего не остаётся неизменным" [3, С. 214-219]. Учёт динамики осуществляется в рамках дифференциальной теории игр.

Рассматривается дифференциальная игровая задача N лиц, которая представлена в [4, С. 21-25]

(1)

Здесь N = {1,..., N1 множество игроков. Управляемая динамическая система X, в которой изменение во времени t е [?0, ?1] описывается системой линейных дифференциальных уравнений и начальными условиями

х = Л(()х + 2=1 В (1)п1, (2)

х(д = Хо . (3)

Элементы матриц предполагаются непрерывными. В (2)-(3) представлено изменение фазового вектора х = (х1,..., хи) еЯп под воздействием управления и = (ир..., пм). Управляющие воздействия (стратегии) -го игрока отождествляются с функциями и. = и. (?,х) = Q(t)x, где п.хп элементы матрицы Q(t) предполагаются непрерывными для t е Множество его стратегий

и = {и. = Q¡(t)x | Q.(t)еС^ tl]}, /еN. Далее используются ситуации

и = (и,,..., ия) е и = (4)

Игра развивается следующим образом. Каждый из игроков выбирает и использует свою стратегию и. = Q(1)хе и, / еN. В результате складывается ситуация (и.,..., и^)е и = (иу...,^). Фазовый вектор x(t), t е [t0,t1] находится как решение задачи (2)-(3). На наборах (х^), (и.,..., им) задана функция выигрыша .-го игрока, определённая квадратичным функционалом

Ji (и, ti,,x.J = х{гх )С1х(г1) +

+ Г\и(0Д-и(0 + *(0С,-*(0)Л, 1'еЛГ. (5) "о

На содержательном уровне цель игроков состоит в совместном выборе своих стратегий, при котором окончательный исход (выигрыш) каждого игрока будет возможно большим. Учитывая (2)-(5), игра (1) называется дифференциальной позиционной линейно-квадратичной игрой N лиц

[4, с. 24].

Будем рассматривать кооперативный вариант игры (1), при котором игроки могут договариваться между собой о совместном выборе ситуации и е и. Часто такие модели возникают в задачах, когда побочные платежи запрещены самими правилами игры. Например, в задачах преследования убегающего группой догоняющих, где функция выигрыша преследователя есть его расстояние (в момент окончания игры) до убегающего, передача части выигрыша (части расстояния) от одного преследователя к другому просто невозможна. Далее рассматривается кооперативная игра без побочных платежей [5].

Перейдём к нетривиальной задаче определения оптимального решения в кооперативной игровой задаче (1). Формально дифференциальную позиционную линейно-квадратичную игру N лиц (1) можно рассматривать с точки зрения многокритериальной задачи [6, 7]. Определяется дифференциальная позиционная линейно-квадратичная многокритериальная задача

2 = (6)

Здесь управляемая динамическая система представлена в (2)-(3). Управляющим воздействием в задаче (6) является ситуация из игры (1) и множество ситуаций и представлено в (4). Векторная функция выигрышей

1 = (/^(u,Xo,tQ),...,J¿у(и,Хд,^о)), (7)

компоненты которой приведены в (5). Формальное сходство позволяет использовать принципы оптимальности от многокритериальной дифференциальной задачи (6) для дифференциальной кооперативной игровой задачи (1).

Многокритериальные задачи и различные подходы к определению решения активно изучаются.

Один из достаточно общих подходов к определению решения в многокритериальной задаче основан на концепции конусной оптимальности

[8, 9]. Будем рассматривать выпуклый, острый конус К в №. Часто рассматривается многогранный (полиэдральный) конус в конечномерном евклидовом пространстве, который можно задать квадратной матрицей

к = У 6 я-| лу> о^Н}. (8)

Полагаем, что элементы матрицы А являются неотрицательными, а сама матрица невырожденной. Это гарантирует то, что соответствующий конус К в (8) будет выпуклым, острым, и его размерность совпадает с размерностью критериального пространства №. Конус порождает в векторном пространстве бинарное отношение > по правилу

/> Я о /- я 6 К. (9)

Известно, что если конус К в (8) является выпуклым, острым и не содержит начало координат, то он определяет отношение строго порядка инвариантное относительно линейного положительного преобразования в Яы. Верно и обратное утверждение. Такой конус К называют конусом доминирования в ЯN > 1. Стандартным образом строгий порядок (9) в Я11 при заданном конусе К определяет оптимальное (максимальное, минимальное) по конусу решение в многокритериальной задаче. Используем приведённый выше подход к определению решения в дифференциальной кооперативной игре N лиц без побочных платежей (1).

Пусть конус К определён невырожденной квадратной матрицей А порядка 1, элементы которой неотрицательны (8). Ситуация и* 6 и называется оптимальной по конусу К в задаче (1), если У и 6 и выполнено условие ^и*) - ^и) 6 К. Если при этом Я1 е К (- ЯN е К), то оптимальное решение называется максимальным по конусу К (минимальным по конусу К).

Оптимальное по конусу К решение является достаточно общим в задаче (1). Действительно, такое решение, как частный случай, включает оптимальное по Парето (по Слейтеру) решение в задаче (1), которое будет конусным решением с конусом доминирования:

Я1 = {х6Я1\х. > 0,/ = 1,..., 1}/{01} (ЯЦ = {х6Я1\х1 > 0,/ = 1,..., 1}).

Оптимальных по конусу решений может быть много. Тогда уточнение по конусу можно

применить несколько раз, последовательно уточняя (улучшая) решение. Соответствующий подход можно представить в матричной форме [9]. Рассмотрим следующую бесконечную последовательность квадратных, невырожденных, неразложимых, стохастических матриц

A1,A2,...,A.,.., ieN.

(10)

Все элементы стохастической матрицы неотрицательны и сумма элементов каждой строки равна единице. По последовательности матриц построим новую последовательность:

В = в2 = Л2 А1 = А2Вр В3 = А3 А2 •А! = А3 •B2..., В = А •А ■,..., -А, = А В „..., п6N. (11)

п п п— 1 7 7 1 п п— 17 7 чу

Каждая матрица из последовательности (11) будет определять многогранный конус аналогично (8). Обозначим конусы этой последовательности, как К, /6 N. Полученная последовательность конусов позволит построить уточнённое по конусу решение многокритериальной задачи (1).

Утверждение 1. Пусть матрицы А /6 N из последовательности (10) являются неотрицательными, невырожденными, неразложимыми, стохастическими. Тогда для любого натурального п

матрица Вп = Ап Ап1-,..., А1 из последовательности (11) является неотрицательной, невырожденной, неразложимой, стохастической;

для соответствующих конусов имеет место включение К с К ^.;

п п+1 '

для соответствующих множеств оптимальных по конусу решений задачи (1) имеет место включение X* з X* ,.

п п+1

Каждая матрица В /6 N из последовательности (11) является стохастической, и для них верны условия теоремы Фробениуса [10, С. 354-355]. У каждой такой матрицы максимальное собственное значение Х0 = 1. Каждому собственному значению однозначно можно выбрать левый собственный вектор:

а

.....а£>), Е^а,00^ <>0-(12)

Учитывая вышеизложенное, для последовательности матриц (11) верно

Утверждение 2. Пусть матрицы A ie N, из последовательности (10) являются неотрицательными, невырожденными, неразложимыми, стохастическими. Тогда существует предел последовательности матриц (11), т. е.

lim В{ = lim Д, ■ A„_lV..Mi =

Матрица A0 является положительной, вырожденной с рангом равным 1, все строки матрицы равны

lim а(п) = а(0) = (<\с40),..,<>),У>,(0) =1, а,№) >0,

где левый собственный вектор а(я) из (12).

Последнее утверждение является основанием для уточнения оптимального решения в задаче (1).

Определение. Рассматривается многокритериальная задача (1) и последовательность неотрицательных, невырожденных, неразложимых, стохастических матриц (10). Пусть набор чисел

<х<°> = {a?\af,...,a™), =1, а<°> >0

представляет строку предельной матрицы A0 из утверждения 2. Тогда ситуацию

M*earcmax(a{0)/1(M) + af/2(M) +.....+a^/jv(«))(13)

U£U

будем называть уточнённым по последовательности конусов (10) оптимальным (максимальным) решением дифференциальной игровой задачи (1).

Если в определении уточнения оптимального по Парето решения в дифференциальной игровой задаче (1) проводится по последовательности многогранных конусов, определённых степенями неотрицательной, невырожденной, неразложимой, стохастической матрицы А, то полученное решение будем называть уточнённым по конусу K решением многокритериальной задачи (1).

Рассмотрим кооперативный подход к формированию решения в дифференциальной игровой задаче (1). Уточнённое по конусу решение может быть определено из многогранного конуса, выбор которого устраивает всех игроков. Игроки должны сделать свой выбор из учёта своих интересов, которые представлены соответствующим функционалом (5) из векторной функции выигрыша (7) J(u, О = Ju х^ J^u ^ t0)). В то же время интересы игроков требуется согласовать, предложив им пойти на снижение своего индивидуального выигрыша в обмен на выработку общего коллективного решения.

Каждый игрок i е N выбирает ситуацию, что доставляет наибольшее значение его функции выигрыша J(u, х0, t0), то есть J.(ui*, х0, t0) > f (u, x0, t0), Vu е U. В этой ситуации свои (не лучшие) выигрыши получают и все остальные игроки. Получается набор из N выигрышей всех игроков J(uf*, Хо, to) = Jm* Хо, to),..., Jn(U*, -о, to)). Считаем, что все выигрыши положительны. Если это не так, то общим преобразованием делаем все значения выигрышей положительными.

Обозначим М. = х0, (0) +... + JN(ui*, х0, t0)) и

получим набор из N положительных чисел, в сумме равных единице Ци*, х0, (0)/М,..., JN(ui*, х0, (0)/М). Аналогичным образом каждый игрок i е N определяет свой набор из N положительных чисел, в сумме равных единице. Поставим набор чисел игрока iе N в ^ю строку матрицы А. По построению эта квадратная матрица А порядка N является стохастической и она определяет конус доминирования К.

По рецептам утверждения 2 многогранный конус доминирования К (стохастическая матрица А) позволяет определить уточнённое по конусу оптимальное решение. Уточнённым решением в кооперативной дифференциальной игре является оптимальное по конусу решение в соответствующей многокритериальной задаче и конус доминирования есть предельный многогранный конус К0, из утверждения 2. Отметим, что этот конус определяется предельной матрицей А

Полученное уточнённое по конусу решение можно считать решением исходной кооперативной игрой без побочных платежей. Действительно, такое решение выгодно каждому игроку, т. к. исходным пунктом кооперативного решения являются ситуации, наилучшие для этого игрока. На втором этапе совместно выбирается компромиссное решение, которое обосновано существом рассматриваемой задачи (матрицей А), а не личным предпочтением игрока.

Рассмотрим модельный пример кооперативной игры двух лиц без побочных платежей. Динамическая управляемая система представлена дифференциальным уравнением и начальным условием из [11, С. 338-339]:

X = и((), (14)

х(0 = Х0. (15)

Здесь хеЯ, и е Я, (е [0,1]. Заданы функционалы - выигрыши первого и второго игроков:

=- ]и2Л+-л:2(1), 2 п 2

J2=2ju2dt + x2(l).

(16)

(17)

На содержательном уровне цель игры состоит в выборе управления, доставляющего возможно меньшее значение одновременно двум функционалам (16) и (17).

В соответствии с представленной выше схемой рассмотрим динамическую задачу минимизации (14)—(16) для первого игрока. Используя методы динамического программирования [11], находим оптимальное управление первого игрока, которое является постоянным и1 = —0,5х0. Функционал (16) принимает значение J11*= 0,25x0. При таком управлении и1* = -0,5х0 другой функционал (17) достигает J2*= 0,75x0.

Аналогично решается динамическая задача минимизации (14), (15), (17) для второго игрока. В этом случае оптимальное управление является

постоянным и2* = -1/з х0. Функционал (17) принимает значение J2* = 2/з х0. Значение функционала

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(16) будет J2 = 5/18 х0. Полученная информация позволяет определить стохастическую матрицу А

А -

у1 / ^ 2/ (V /4

/мх

]г* / 5/

2 / /М2) 1/17

12/

17 у

Здесь м1 = J12* + J2 = х0 и м2 = J2 + J2;= 17/18 х2.

Матрица А определяет двухгранный конус К, аналогично (8). Уточнение проводится по последовательности конусов, определяемых степенями матрица А. Предельная матрица

А) =

( 20/ /71 20/ ч /71

5Х

51/

71

Ки

где с = (20/71, 51/71) собственный вектор матрицы А, относящийся к максимальному собственному значению X = 1. Матрице А0 соответствует конус К0, аналогично (8).

Решением кооперативной дифференциальной игры двух лиц без побочных платежей (14)—(17) является оптимальное по предельному конусу К0 решение двухкритериальной динамической задачи, определяемой условиями (14)-(17).

Оптимальное управление по конусу К0 в последней двухкритериальной задаче находится как решение динамической задачи, аналогичной динамической задачи для первого (второго) игрока в данном примере. Отличие в целевом функционале, который в последнем случае равен

, 112 V 2 , 61 г,..

/=-\и ¿и +-х41).

173

173,

Оптимальное управление находится по методам динамического программирования. Оно будет

постоянным и** = -61/173х0. В этом случае выигрыши игроков, представленные функционалами (16) и (17) будут J** = J2) = (0271726; 0,667780). Значения функционалов представлено с точностью до е = 0,000001.

Исследована проблема группового выбора. Согласование интересов проводится с позиции кооперативной теории игр. При выработке решения учитывается также развитие процесса управления во времени. Рассмотрение этих факторов приводит к дифференциальной кооперативной игре без побочных платежей. Решение в такой задаче определяется из соответствующей многокритериальной динамической задачи, учитывая близость формулировок этих двух задач. Обычно решением многокритериальной задачи считают оптимумы по Слейтеру и по Парето, но таких решений, как правило, много. Используется процедура уточнения решения, которая для "статических" многокритериальных задач основана на последовательной конусной оптимизации и представлена в [9]. Особенностью метода является выбор, с которого начинается процедура уточнения векторного решения. Этот первоначальный конус определяется личными предпочтениями игроков.

Конусное решение указывает приемлемый, по мнению экспертов, компромисс между критериями при принятии решения. Если исход оптимален по конусу и от него возможен переход к другому исходу, так что выигрыш по одному критерию будет большим, то найдётся другой критерий, по которому проигрыш будет недопустимо большим.

Конусные решения в многокритериальной задаче имеют важное свойство: если первый конус включает второй конус как подмножество, то множество оптимальных по первому конусу решений является подмножеством решений, оптимальных по второму конусу. На этом свойстве построена процедура уточнения решения.

Конусные отношения можно задавать в матричной форме, именно в форме стохастических матриц. В этом случае последовательное уточнение конусной упорядоченности соответствует умножению стохастических матриц. Предлагается следующий алгоритм: на основании мнения

экспертов строится последовательность расширяющихся конусов, которой соответствует последовательность вложенных множеств конусных решений. Решение по предельному конусу называется уточнённым по последовательности конусов оптимальным решением многокритериальной задачи и, значит, решением первоначальной кооперативной игры.

Для дифференциальной кооперативной игровой задачи N лиц сформулировано уточнённое по последовательности конусов решение и проведено обоснование алгоритма его нахождения. Указаны свойства последовательности стохастических матриц, которые гарантируют существование предельного конуса. Рассмотрен модельный пример.

СПИСОК ЛИТЕРАТУРЫ

1. МиркиI Б.Г. Проблема группового выбора. М.: Наука. 1974.

2. Мулен Э. Теория игр с примерами из экономики. М.: Мир.1985.

3. Жуковский В.И., Салуквадзе М.Е. Риски и исходы в многокритериальных задачах управления. Тбилиси: Интелекти. 2004.

4. Жуковский В.И. Кооперативные игры при неопределённости и их приложения. М.: Эдиториал УРСС. 1999.

5. Тынянский Н.Т., Жуковский В.И. Дифференциальные игры с ненулевой суммой (кооперативный вариант) // Итоги науки и техники. Математический анализ. М.: ВИНИТИ. Т. 17. С. 3-112.

6. Подиновский В.В., Ногин В.Д. Оптимизация гарантий в многокритериальных задачах управления. Тбилиси: Мецниереба. 1996.

7. Ногин В.Д. Принятие решений в многокритериальной среде: количественный подход. М.: Физматлит. 2002.

8. Yu P.L. Cone convexity, cone extreme points and nondominated solutions in decision problems with multiobjectives // Journal ofoptimization theory and application. 1974. Vol. 14. № 3. P. 319-377.

9. Матвеев В.А. Исследование оптимальности по конусу в многокритериальной задаче // Научно-технические ведомости СПбГТУ 2009. № 4. С. 169-176.

10. Гантмахер Ф.Р. Теория матриц. Москва.: Наука. 1967.

11. Пантелеев В.И., Бортаковский А.С. Теория управления в примерах и задачах. М.: Высшая школа. 2003.

УДК 681.3.06

Б.Г. Ильясов, И.В. Дегтярева, Е.А.Макарова, А.Н. Павлова

РЕГУЛИРОВАНИЕ НЕРАВНОВЕСНЫХ ПРОЦЕССОВ МАКРОЭКОНОМИЧЕСКОГО КРУГООБОРОТА ФИНАНСОВЫХ ПОТОКОВ

Неустойчивость функционирования российской экономики в настоящее время обусловлена не только влиянием мирового финансового кризиса, но и внутренними причинами, одной их которых является несовершенство рыночных механизмов макроэкономического регулирования. В этих условиях всё большую актуальность приобретают системные исследования динамики функционирования макроэкономических систем в рыночных условиях.

Моделирование рыночных макроэкономических механизмов ведётся с использованием как

неоклассических моделей частичного равновесия на рынках благ и ресурсов, так и кейнсианских неравновесных моделей макроэкономических рынков, а также современных моделей информационных несовершенств на этих рынках [1-3]. Особый интерес представляет компьютерное моделирование динамических особенностей рыночных механизмов на основе методологии системной динамики, результатом которого является разработка систем имитационного моделирования (СИМ) для целей макроэкономического анализа [4-6]. Несмотря на широкие возможности

Исследование конусной оптимальности в дифференциальной кооперативной игре без побочных платежей Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Матвеев Владимир Александрович

Похожие темы научных работ по математике , автор научной работы — Матвеев Владимир Александрович

Текст научной работы на тему «Исследование конусной оптимальности в дифференциальной кооперативной игре без побочных платежей»