Локальный поиск в квадратичной игре двух лиц

Минарченко Илья Михайлович

Серия «Математика» 2016. Т. 18. С. 60—73

Онлайн-доступ к журналу: http://isu.ru/izvestia

ИЗВЕСТИЯ

Иркутского государственного университета

УДК 519.833 ЫБС 90С33

Локальный поиск в квадратичной игре двух лиц *

И. М. Минарченко

Институт систем энергетики им. Л. А. Мелентьева СО РАН

Аннотация. Рассматривается бескоалиционная игра двух лиц в нормальной форме с квадратичными функциями потерь игроков. Предполагается, что функция потерь каждого игрока является строго выпуклой квадратичной функцией собственной переменной. Зависимость потерь от переменной другого участника линейна и определяется соответствующим билинейным слагаемым. Задача поиска равновесия по Нэшу в рассматриваемой игре сводится к эквивалентной минимаксной задаче с помощью подхода Никайдо - Исода. Поскольку для данной игры не удаётся аналитически решить «внутреннюю» задачу максимизации, то полученная минимаксная задача представляется как задача минимизации невыпуклой неявно заданной функции на множестве ситуаций игры. «Внутренняя» задача максимизации, являющаяся выпуклой, заменяется двойственной по Лагранжу задачей, благодаря чему целевая функция исходной задачи оптимизации представляется в виде разности двух выпуклых функций (осуществляется d.c.-разложение), при этом функция, определяющая вогнутую часть разложения, по-прежнему задана неявно. В работе предлагается естественный способ линеаризации вогнутого слагаемого и, на основе этого, применение итеративного метода локального поиска для d.c.-функций. В данном методе очередная точка выбирается как решение выпуклой задачи оптимизации, в которой целевая функция получается из исходной целевой функции путём линеаризации вогнутого слагаемого в d.c.-разложении. В силу невыпуклости рассматриваемой нами задачи, предлагается использовать локальный поиск в сочетании с мульти-стартом. Известно, что минимальное значение целевой функции равно нулю и множество точек, где оно достигается, совпадает с множеством равновесий в исходной игре, благодаря чему можно легко проверить, является ли полученная локальным спуском стационарная точка равновесием по Нэшу. Приводятся результаты численного тестирования локального поиска для d.c.-функций и его сравнение с рядом существующих методов поиска равновесия на случайно сгенерированных задачах.

Ключевые слова: равновесие по Нэшу, функция Никайдо - Исода, d.c.-разложе-ние, алгоритмы вычисления равновесий.

* Работа выполнена при финансовой поддержке РФФИ, грант 15-07-08986.

1. Введение

В рамках данной статьи под квадратичной игрой мы будем подразумевать игру, в которой целевая функция каждого игрока квадратична по собственной переменной, т. е. по переменной, определяющей стратегию данного игрока. При этом будем полагать, что зависимость целевой функции каждого участника от вектора переменных других игроков является линейной и определяется соответствующими билинейными слагаемыми. Иными словами, рассматриваемая в статье квадратичная игра обобщает билинейную игру путём добавления в целевую функцию каждого игрока квадратичного по собственной переменной слагаемого. Игры с функциями выигрыша такого вида ранее рассматривались в [1; 5; 16].

Стоит отметить, что билинейные игры сами по себе являются достаточно широким классом, включающим в себя, в частности, полиматричные (а следовательно, и биматричные) игры в смешанных стратегиях [7]. Отличие между билинейной и полиматричной игрой заключается в виде множеств стратегий игроков. В смешанном расширении полиматричных игр игроки выбирают свои стратегии из симплексов, в то время как множество стратегий в билинейной игре у каждого игрока, вообще говоря, является произвольным. Данное различие, как будет отмечено далее, оказывает существенное влияние на сложность поиска равновесия по Нэшу в игре.

Обширное исследование, посвящённое вычислению равновесия по Нэшу в биматричных играх, представлено в [4]. В [7] изучается проблема существования и построения полиномиальных алгоритмов для билинейных игр с фиксированным рангом матрицы, являющейся суммой матриц обоих игроков. Целый ряд работ посвящён построению алгоритмов для вычисления равновесия в играх общего вида, в том числе со связанными стратегиями (см., например [2; 3; 6; 8; 10; 9]).

В настоящей работе рассматривается бескоалиционная квадратичная игра двух лиц с линейными по чужой переменной функциями потерь участников и с независимыми множествами стратегий. Дополнительно положим, что функция потерь каждого игрока строго выпукла по собственной переменной. Как известно, данное условие при некоторых стандартных ограничениях на множества стратегий игроков гарантирует существование равновесия по Нэшу в игре. Как бы то ни было, даже в этом случае поиск равновесия представляется весьма сложной задачей. Достаточно упомянуть тот факт, что биматричная игра, являющаяся частным случаем билинейной игры, может иметь экспоненциальное число равновесных точек [14]. Отличием данной статьи от вышеупомянутых работ является постановка игры, не гарантирующая сходимость соответствующих методов поиска равновесия, предлагаемых другими авторами.

В статье описывается способ сведения задачи поиска равновесия к задаче минимизации невыпуклой и неявно заданной функции и предлагается её представление в виде разности двух выпуклых функций (ё.е.-разложение). Такое разложение позволяет использовать известный метод локального поиска для ё.е.-функций, основанный на линеаризации вогнутого слагаемого [18].

В конце статьи приводятся результаты численного сравнения предлагаемого метода локального поиска с экстраградиентным методом поиска равновесия [1]. Хотя сходимость экстраградиентного алгоритма не гарантируется в условиях принятой нами постановки, сравнение видится оправданным по той причине, что экстраградиентный метод не требует решения вспомогательных выпуклых задач оптимизации на каждой итерации, в отличие от метода, основанного на ё.е.-разложении, и других методов из вышеупомянутых источников. В силу этого экстраградиентный метод является гораздо менее требовательным в вычислительном плане.

(2.1)

2. Постановка задачи

Рассмотрим квадратичную игру следующего вида: Fi (xi,x2) = х~[ (С1Х2 + di) + -xjBiXi —> min, х\ G X1,

2 xi

F2 (xi,x2) = xl (C2X1 + d2) + ^x2B2x2 ->• min, x2 G X2,

2 X2

где X1 и X2 непустые компактные выпуклые множества вида

X1 = {xi G R™1 | A1X1 < bi} , X2 = {Ж2 G R™2 | A2X2 < b2}.

Здесь d1 G R™1, d2 G R™2, b1 G R91, b2 G R92 и матрицы C1, C2, B1, B2, A1, A2 имеют размеры m1 x m2, m2 x m1, m1 x m1, m2 x m2, q1 x m1, q2 x m2 соответственно. Не умаляя общности, будем считать матрицы B1 и B2 симметричными. R обозначает множество действительных чисел. Положим, что матрицы B1 и B2 положительно определены, следовательно, функции F1(-,X2), F2X1, ■) строго выпуклы при любых X2 G X2, X1 G X1. Отсюда с учётом непрерывности функций потерь участников, а также выпуклости и компактности множества ситуаций игры в силу теоремы Какутани непосредственно следует существование равновесия по Нэшу в игре (2.1).

3. Сведение к задаче оптимизации

Введём обозначения х = (х^х2), y = (yi,, X = X1 x X2 и определим функцию Ф: X x X ^ R следующим образом:

Ф(х,у) = Fi(y) + F2(y) - Fi(xi,y2) - F2(yi,X2).

Функция Ф(-) называется функцией Никайдо - Исода [13]. Следующая теорема устанавливает необходимое и достаточное условие равновесия по Нэшу.

Теорема ([13]). Ситуация y £ X является равновесием по Нэшу в игре (2.1) тогда и только тогда, когда выполнено соотношение

y £ Arg min max Ф (x, y).

y£X x£X

Из теоремы немедленно следует эквивалентная задача оптимизации P(y) = max Ф(х, y) ^ min . (3.1)

x£X y&X

Иными словами, множество равновесий по Нэшу в игре (2.1) совпадает с множеством решений задачи (3.1). При этом известно наименьшее значение целевой функции (3.1) — ноль, — что обеспечивает нас критерием, позволяющим проверить, является ли данная допустимая точка глобальным решением задачи и, следовательно, равновесием по Нэшу в исходной игре. Отметим, что наличие такого критерия делает оправданным использование локального спуска в задаче (3.1) из случайных начальных приближений, поскольку полученные таким образом стационарные точки могут быть легко проверены на равновесность.

Функция P(•) является, вообще говоря, невыпуклой, поэтому поиск равновесия сводится к задаче глобальной минимизации. Другая трудность заключается в том, что P(•) задана неявно. При этом в некоторых частных случаях «внутренняя» задача оптимизации (максимизация Ф(-,у)) может быть решена аналитически. К таким случаям относятся биматричные и полиматричные игры в смешанных стратегиях. Явный вид функции P(•) для таких игр становится возможным благодаря билинейной структуре целевых функций игроков и множествам стратегий, заданным симплексами. Впервые задача (3.1) для бимат-ричной игры была сформулирована в [12; 11] и позже использована для вычисления равновесия в [4]. Сведение полиматричных игр к задаче оптимизации вида (3.1) подробно рассмотрено в [17]. Для билинейных игр с множествами стратегий общего вида не удаётся получить явный вид функции P(•), даже при отсутствии квадратичного слагаемого в целевых функциях игроков.

Заметим, эквивалентность перехода к задаче оптимизации справедлива только для игр с независимыми множествами стратегий. При наличии общего для нескольких игроков ограничения могут существовать равновесные точки, не являющиеся решением задачи (3.1) [6].

Введём обозначения:

C =

0 Ci C2 0

,B =

Bi 0 0 B2

, d =

=

Ai 0 0 A 2

,b =

Тогда задача (3.1) для игры (2.1) примет вид: Р(у) =ут (Су + d) + 1-утВу+

+ max

xex

—х (Су + d)--х Вх

2

^ min, (3.2)

vex

где X = {х е Мт | Ах ^ Ь}, т = Ш1+т2. Поскольку матрицы В1, В2 положительно определены, то В также положительно определена. Отсюда следует строгая вогнутость целевой функции задачи «внутренней» максимизации в (3.2):

1

tp(x,y) =—х (Су + d) — -х Вх —> max,

2 xex

y е X.

Следует отметить, что до данного момента мы не использовали наше предположение о положительной определённости В1, В2.

Поскольку ф(-,у) строго вогнута для любого у е X и множество X определено линейными соотношениями, то выполнено равенство

max ш(х, y) = min max L(x, X, y)

Vy е X,

где X е Rq — вектор множителей Лагранжа, q = q1 + q2, и

L(x, А, у) = -xT (Су + d) - iхтВх - Хт(Ах - Ъ)

есть функция Лагранжа при произвольном фиксированном y е X. Очевидно, L(-,X,y) достигает максимума на Rm в точке, где первая производная по переменной х обращается в ноль. Тогда с учётом невырожденности матрицы B, которая следует из её положительной определённости, имеем точку х* = -B-1 (Cy + d + ATX) такую, что

max^>(x,y)=minL(x*,X,y) Vy е X. (3.3)

xex A^o

Тогда, выполнив соответствующую подстановку, получим

1

L(x*, X, у) = I (Cy + d)T B~l (Cy + d) +

Ti

+ (Cy + d)1 B~LA A + -A 1 AB~LA 1 A + A 1 b. (3.4)

Объединяя равенства (3.3) и (3.4), будем иметь:

тах <р(х, у) = \ (Су + d)T В'1 (Су + d) +

xGX 2

+ min \>0

(Су + d)T В~1АТХ + i\TAB~lAT\ + \Tb

Vy G X. (3.5)

С учётом (3.5) задача (3.2) может быть переписана в следующем виде:

р (у) = g(y)- h(y) ^ min> (3.6)

yex

где

9(У)=УТ {С + \в+1-СтВ-1С)у+

+ ут (cTB~ld + d) + ^dTB~1d,

(3.7)

h(y) = - min Ф (y,X),

■ф (у, А) = XTAB~1Cy + l\TAB-1AT\ + Ат (b + AB~1d) .

2

Следующее утверждение позволяет нам перейти к описанию метода решения задачи (3.6).

Утверждение 1. Функции g(-) и h(-) выпуклы.

Доказательство. Учитывая симметричность матрицы B и обозначая z = (B + C)y, квадратичная часть функции g(-) может быть представлена в следующем виде:

уТ (с+1-в+1-ств-1с^у =

= iут (В + С)т В-1 (В + С) у = izTB~1z.

Поскольку B положительно определена, то zTB-1z > 0 для любого z = 0 и z(y)TB-1z(y) ^ 0 для любого y G R™. Следовательно, g(-) выпукла. Функция ф(-, Л) линейна для любого Л G R9, а значит h(-) также выпукла. □

Таким образом, получено представление целевой функции P(■) в виде разности двух выпуклых функций. Мы предлагаем использовать для решения задачи (3.6) метод локального поиска для d.c.-функций [18]. Его основная идея заключается в линеаризации вогнутого слагаемого в текущей точке и выборе следующего приближения как решения получившейся задачи выпуклого программирования. Так, локальный поиск в исходной невыпуклой задаче сводится к серии выпуклых задач.

Одним из критериев останова служит близость значения функции Р(•) к нулю. Поскольку вычисления производятся неточно, необходимо охарактеризовать точку, получаемую алгоритмом при срабатывании такого критерия. Напомним, е-равновесием по Нэшу в игре (2.1) (е > 0) называется такая ситуация у* е X, для которой справедливы следующие неравенства:

Р1 (У1,У*) >^(у*,у2*) - е Уу1 е X1, 1 (38)

(у*,у2) > *2(у*,у*) - е Уу2 е X2. / (.)

Имеет место следующее утверждение.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Утверждение 2. Пусть Р(у*) < е для некоторых у* е X и е > 0. Тогда у* является е-равновесием по Нэшу.

Доказательство. Учитывая определение функции Р(•) (см. (3.1)), из неравенства Р(у*) < е для произвольных х1 е X1, х2 е X2 будем иметь:

^1(х1,у2*) + ^2(у*,х2) ^ шт[^1 (Х1,у* ) + ^2(у*,Х2)] > ^ (у *) + ^ (у *) - е. Фиксируя поочерёдно Х\ = у\ и х2 = у2, получим (3.8). □

Далее опишем шаги метода локального поиска для ё.е.-функций применительно к задаче (3.6). Основная трудность заключается в неявном виде вогнутого слагаемого целевой функции. Однако линеаризация вогнутой части возникает естественным образом благодаря тому, что функция ф(^, Л) является линейной. А именно, для построения линейной аппроксимации выпуклой функции Н(^) в некоторой точке у е X достаточно минимизировать функцию ф(у, Л) по второй переменной, т. е. решить задачу выпуклого квадратичного программирования. Выпуклость функции ф(у, •) обосновывается аналогично выпуклости функции $(•) (см. доказательство утверждения 1).

Алгоритм 1. Шаг 0. Положить к = 0. Выбрать малые числа е1 > 0, е2 > 0 и начальное приближение ук е X.

Шаг 1. Вычислить

Лк+1 как решение выпуклой задачи минимизации:

Ak+1 = arg min ф (yk, А) \>0 \ /

Шаг 2. Вычислить yk+1 как решение выпуклой линеаризованной задачи:

yk+1 = arg min g (y) + ф (y, Ak+1 yex L v

Шаг 3. Если Р(ук+1) < е1, то СТОП: ук+1 является глобальным решением задачи (3.6) и ^-равновесием по Нэшу в игре (2.1). Иначе, если \\ук+1 — ук|| < е2 то СТОП: ук+1 является локальным решением и не является равновесием в (2.1). В противном случае, положить к = к + 1 и перейти на шаг 1.

4. Численный эксперимент

Предлагаемый в настоящей статье алгоритм локального поиска сравнивался с тремя существующими алгоритмами поиска равновесия: с релаксационным алгоритмом [8], экстраградиентным методом [1] и алгоритмом Розена [15].

Релаксационный алгоритм задаётся следующим процессом:

ук+1 = (1 — 1к )ук + 1к Х(ук), 0 <1к < 1, к = 0,1, 2,..., х(у) = &Ygm&xФ(x,y),

хЕХ

где длина шага Ьк определяется дроблением из условия

Р ((1 — Ьк)ук + Ьк х(ук)) < Р(ук) — аЬ2кЦХ(ук) — ук||, а е (0,1).

Критерий останова релаксационного алгоритма: Р(ук) < е\ или

Цук+1 — ук|| < ^2. (4.1)

Каждая итерация экстраградиентного алгоритма состоит из двух полушагов и имеет вид:

хк = ттх (хк - и р(хк)) , хк+1 = Их (Хк - и р(хк)) .

Здесь пх(•) обозначает оператор проектирования на множество X, р(х) = (УЖ1 ¡1(х), VХ2/2(х)) определяет псевдоградиент суммы функций потерь и длина шага Ьк выбирается дроблением из условия

2г1\\{В + С){хк-хк)\\2 ^{1-5)\\хк-хк\\2, ¿€(0,1). (4.2)

Критерий останова для экстраградиентного метода — условие (4.1). Метод Розена определяется процессом

хк+1 = хк — Ьк р(хк), к = 0,1, 2,...

с проекцией при выходе за пределы допустимого множества X. В рамках настоящего тестирования алгоритм был реализован без вычисления множителей Лагранжа и длина шага выбиралась из условия (4.2), хотя это и не гарантирует сходимость метода Розена даже при В + С У 0 . Критерий останова — условие (4.1) или Цр(хк)|| < е3.

Сходимость сравниваемых методов зависит от свойств матрицы B + C. Релаксационный алгоритм сходится к равновесной точке при B+C У 0, экстраградиентный алгоритм сходится к равновесию при B + C У 0, в то время как метод локального поиска для d.c.-функций сходится к стационарной точке функции P(•) вне зависимости от знакоопределённости B + C .В связи с этим мы рассмотрим три случая: матрица B + C (а) положительно определена, (б) неотрицательно определена и имеет ровно одно нулевое собственное значение, (в) имеет хотя бы одно отрицательное собственное значение. Напомним, что B У 0 выполнено всегда по условию задачи.

Численный эксперимент проводился на случайно сгенерированных задачах разных размерностей. Для всех задач было установлено одинаковое количество скалярных переменных у каждого из двух игроков, то есть ш\ = m2 = ш/2, множество X определено в виде

X = {x е Мт | —10 ^ Xi ^ 10, i = 1,...,ш} ,

а также установлено е\ = е2 = е3 = 10_6, а = 10_4, 5 = 0.1 (для экстраградиентного алгоритма), 5 = 0.5 (для алгоритма Розена). Все методы запускались из одного и того же набора случайных точек (муль-тистарт). Программа реализована в MATLAB. Задачи выпуклого программирования на шагах 1 и 2 метода локального поиска решались встроенной подпрограммой quadprog. Вспомогательные выпуклые задачи релаксационного алгоритма, необходимые для вычисления X(y) и дробления шага, решались аналогично. Вычисления производились на компьютере с процессором AMD FX-8350 4.00 GHz. Максимальное заданное число итераций алгоритма Розена и экстраградиентного — 40 000, двух других методов — 10 000.

Результаты вычислений представлены в табл. 1-3 в зависимости от знакоопределённости матрицы B + C. Каждая строка соответствует задачам одной размерности. В наименованиях столбцов приняты следующие обозначения: ш — размерность задачи (суммарное количество скалярных переменных обоих игроков); Problems — количество сгенерированных задач данной размерности; Method — метод решения: локальный поиск для d.c.-функций (dcls), релаксационный алгоритм (relax), экстраградиентный метод (exgr), алгоритм Розена (rosen); MS — количество запусков из случайных начальных точек для одной задачи; NE starts — суммарное количество запусков, в результате которых было получено равновесие; Solved — количество задач, в которых найдено хотя бы одно равновесие; It. — среднее количество итераций одного запуска; Time — среднее время работы одного запуска. Отметим, что в расчёте средних величин в таблице участвовали только те запуски, при которых до достижения установленного максимального числа итераций сработал критерий останова. Поскольку релаксационный алгоритм показал неудовлетворительные результаты по сравнению с остальными метода-

Таблица 1

Результаты численного тестирования алгоритмов поиска равновесия: В + С положительно определена

т Problems Method MS NE starts Solved It. Time, s

2 100 dels 3 300 100 2 0.01

relax 3 300 100 40 0.43

exgr 3 300 100 74 0.01

rosen 3 300 100 69 0.01

4 50 dels 3 150 50 3 0.02

relax 3 147 49 192 3.12

exgr 3 150 50 99 0.02

rosen 3 146 50 307 0.02

6 50 dels 5 242 49 4 0.02

relax 5 250 50 213 3.10

exgr 5 250 50 99 0.02

rosen 5 245 49 138 0.01

8 50 dels 5 241 50 4 0.03

relax 5 250 50 195 3.09

exgr 5 250 50 149 0.03

rosen 5 250 50 125 0.01

10 10 dels 10 100 10 4 0.03

relax 10 100 10 189 2.83

exgr 10 100 10 137 0.03

rosen 10 100 10 162 0.01

ми, то он был исключён из сравнения на задачах большей размерности, а также на задачах, где В + С имеет отрицательное собственное значение.

5. Заключение

В настоящей работе описана методика сведения задачи поиска равновесия по Нэшу в квадратичной игре двух лиц с целевыми функциями игроков, квадратичными по собственной переменной и линейными по переменной другого участника, к задаче оптимизации с помощью функции Никайдо - Исода. Приведено ё.е.-разложение целевой функции, основанное на двойственной по Лагранжу задаче, и предложено использование локального поиска для ё.е.-функций в сочетании с мультистартом. Проведено численное сравнение указанного метода с некоторыми существующими методами поиска равновесия: с релаксационным алгоритмом, экстраградиентным методом и алгоритмом Розена. Результаты вычислений показали, что предлагаемый метод локального поиска отыскал равновесие в большинстве сгенерированных задач, при

Таблица 2

Результаты численного тестирования алгоритмов поиска равновесия: В + С имеет ровно одно нулевое собственное значение

т Problems Method MS NE starts Solved It. Time, s

2 100 dels 3 170 67 8 0.05

relax 3 189 70 182 2.32

exgr 3 300 100 149 0.03

rosen 3 300 100 79 0.01

4 50 dels 3 86 37 16 0.11

relax 3 81 28 285 3.27

exgr 3 150 50 200 0.04

rosen 3 150 50 114 0.01

6 50 dels 5 130 42 21 0.14

relax 5 93 20 255 2.79

exgr 5 250 50 404 0.09

rosen 5 250 50 167 0.01

8 30 dels 5 102 28 35 0.25

relax 5 88 19 219 2.52

exgr 5 150 30 317 0.07

rosen 5 150 30 151 0.01

10 10 dels 10 57 9 38 0.28

exgr 10 100 10 708 0.16

rosen 10 100 10 245 0.01

Таблица 3

Результаты численного тестирования алгоритмов поиска равновесия: В + С имеет отрицательное собственное значение

rn Problems Method MS NE starts Solved It. Time, s

2 100 dels 3 295 100 14 0.09

exgr 3 300 100 124 0.03

rosen 3 297 99 221 0.01

4 50 dels 3 137 47 36 0.25

exgr 3 147 49 105 0.02

rosen 3 129 44 332 0.02

6 50 dels 5 212 46 171 1.20

exgr 5 198 40 130 0.03

rosen 5 144 31 465 0.03

8 50 dels 5 211 50 337 2.42

exgr 5 185 38 152 0.04

rosen 5 139 32 500 0.04

10 10 dels 10 54 10 665 4.94

exgr 10 67 8 190 0.05

rosen 10 50 6 495 0.04

этом только в случае знаконеопределённой матрицы B + C количество проделанных итераций превосходит аналогичный показатель других методов. Наименьшее число итераций приходится на случай B + C У 0. Примечательно, что наименьшее число решённых локальным поиском задач приходится на случай, когда B + C имеет нулевое собственное значение, при этом в случае знаконеопределённости при увеличении размерности количество решённых задач больше, чем у обоих методов градиентного типа (экстраградиентного и Розена).

Несомненным достоинством предлагаемого в данной статье алгоритма являются более широкие условия применимости, в которых гарантируется сходимость. Однако необходимо учитывать, что метод локального поиска для d.c.-функций является методом оптимизации и сходится в стационарные точки целевой функции (в наших обозначениях P(•)), среди которых только глобальные минимумы являются равновесиями по Нэшу.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Список литературы

1. Антипин А. С. Градиентный и экстраградиентный подходы в билинейном равновесном программировании / А. С. Антипин. - М. : ВЦ им. А. А. Дородницына РАН, 2002. - 130 с.

2. Антипин А. С. Равновесное программирование: методы градиентного типа / А. С. Антипин // Автоматика и телемеханика. - 1997. - № 8. - С. 125-137.

3. Зуховицкий С. И. Вогнутые игры многих лиц / С. И. Зуховицкий, Р. А. Поляк, М. Е. Примак // Экономика и мат. методы. - 1971. - Т. 7, № 6. - С. 888-900.

4. Стрекаловский А. С. Биматричные игры и билинейное программирование / А. С. Стрекаловский, А. В. Орлов. - М. : Физматлит, 2007. - 224 с.

5. Dreves A. Finding All Solutions of Affine Generalized Nash Equilibrium Problems with One-dimensional Strategy Sets / A. Dreves // Math Meth Oper Res. - 2014. -Vol. 80. - P. 139-159.

6. Flam S. D. Finding Normalized Equilibrium in Convex-Concave Games / S. D. Flam, A. Ruszczynski // International Game Theory Review. - 2008. - Vol. 10, N 1. - P. 37-51.

7. Garg J. Bilinear Games: Polynomial Time Algorithms for Rank Based Subclasses / J. Garg, A. X. Jiang, R. Mehta // Lecture Notes in Computer Science. Internet and Network Economics. - 2011. - N 7090. - P. 399-407.

8. von Heusinger A. Relaxation Methods for Generalized Nash Equilibrium Problems with Inexact Line Search / A. von Heusinger, C. Kanzow //J. Optim. Theory Appl. - 2009. - N 143. - P. 159-183.

9. Krawczyk J. Numerical Solutions to Coupled-Constraint (or Generalized Nash) Equilibrium Problems / J. Krawczyk // CMS. - 2007. - Vol. 4. - P. 183-204.

10. Krawczyk J. Relaxation Algorithms to Find Nash Equilibria with Economic Applications / J. Krawczyk, S. Uryasev // Environmental Modeling and Assessment. - 2000. - Vol. 5. - P. 63-73.

11. Mangasarian O. L. Equilibrium Points of Bimatrix Games / O. L. Mangasarian // Journal of the Society for Industrial and Applied Mathematics. - 1964. - Vol. 12. - P. 778-780.

12. Mills H. Equilibrium Points in Finite Games / H. Mills // Journal of the Society for Industrial and Applied Mathematics. - 1960. - Vol. 8, N 2. - P. 397-402.

13. Nikaido H. Note on Noncooperative Convex Games / H. Nikaido, K. Isoda // Pacific Journal of Mathematics. - 1955. - Vol. 5, N 5. - P. 807-815.

14. Quint T. A Theorem on the Number of Nash Equilibriua in a Bimatrix Game / T. Quint, M. Shubik // International Journal of Game Theory. - 1997. - N 26. -P. 353-359.

15. Rosen J. B. Existence and Uniqueness of Equilibrium Points for Concave N-Person Games / J. B. Rosen // Econometrica. - 1965. - Vol. 33, N 3. — P. 520-534.

16. Schiro D. A. On the Solution of Affine Generalized Nash Equilibrium Problems with Shared Constraints by Lemke's Method / D. A. Schiro, J.-S. Pang, U. V. Shanbhag // Math. Program., Ser. A. - 2013. - Vol. 142. - P. 1-46.

17. Strekalovskiy A. S. Polymatrix Games and Optimization Problems / A. S. Strekalovskiy, R. Enkhbat // Automation and Remote Control. - 2014. - Vol. 75, N 4. - P. 632-645.

18. Strekalovskiy A. S. On Local Search in D.C. Optimization Problems / A. S. Strekalovsky // Applied Mathematics and Computation. - 2015. - N 255. -P. 73-83.

Минарченко Илья Михайлович, Институт систем энергетики им. Л. А. Мелентьева СО РАН, 664033, Иркутск, ул. Лермонтова, 130, тел.: (3952)500646 доб. 258 (e-mail: eq.progr@gmail.com)

I. M. Minarchenko

Local Search in Quadratic Two-Person Game

Abstract. We consider a noncooperative two-person game in strategic form with quadratic players' loss functions. Loss function of every player is assumed to be strictly convex quadratic function with respect to own variable and linear with respect to another player's variable defining by corresponding bilinear term. Nash equilibrium problem for such a game is reduced to an equivalent minmax problem by Nikaido - Isoda approach. As the "inner" maximization problem does not admit analytical solution, the minmax problem is represented by the minimization problem of nonconvex implicitly defined function over the set of strategy profiles of the game. The "inner" maximization problem, which is turn out to be convex, is replaced by Lagrange dual problem. For the problem under consideration, it leads to d.c.-decomposition of the objective function. In other words, the objective is represented as a difference of two convex functions with implicit function that defines concave part of the decomposition. In this paper we propose a natural way to linearize concave term, and then iterative local search method for d.c.-functions is suggested to use. The main idea of this method is that the next point is chosen as a solution of auxiliary convex optimization problem where objective function is taken as initial objective with linearized concave term. Since the problem is nonconvex, we propose to use multistart of local search from randomly generated initial points. It is known, that minimum of the objective function is zero, and the set of the points bringing minimal value to the objective is coincide with the set of Nash equilibria of the game. Therefore one can easily verify whether stationary point obtained by local search is Nash equilibrium. In the paper we provide results of numerical testing of local search for d.c.-functions on the randomly generated problems and a comparison with some existing algorithms for computing Nash equilibria.

Keywords: Nash equilibrium, Nikaido - Isoda function, d.c.-decomposition, algorithms for computing Nash equilibria.

References

1. Antipin A.S. Gradient and Extragradient Approaches in Bilinear Equilibrium Programming (in Russian). Moscow, Vychislitel'nyy Tsentr im. A. A. Dorodnitsyna RAN, 2002. 130 p.

2. Antipin A.S. Equilibrium Programming: Gradient-Type Methods (in Russian). Avtomat. i Telemekh., 1997, no 8, pp. 125-137.

3. Zukhovitskiy S.I., Polyak R.A., Primak M.E. Many-Person Convex Games (in Russian). Economica i Mat. Metody, 1971, vol. 7, no 6, pp. 888-900.

4. Strekalovskiy A.S., Orlov A.V. Bimatrix Games and Bilinear Programming (in Russian). Moscow, FIZMATLIT, 2007. 224 p.

5. Dreves A. Finding All Solutions of Affine Generalized Nash Equilibrium Problems with One-dimensional Strategy Sets. Math Meth Oper Res, 2014, vol. 80, pp. 139159.

6. Flam S.D., Ruszczynski A. Finding Normalized Equilibrium in Convex-Concave Games. International Game Theory Review, 2008, vol. 10, no 1, pp. 37-51.

7. Garg J., Jiang A. X., Mehta R. Bilinear Games: Polynomial Time Algorithms for Rank Based Subclasses. Lecture Notes in Computer Science. Internet and Network Economics, 2011, no 7090, pp. 399-407.

8. von Heusinger A., Kanzow C. Relaxation Methods for Generalized Nash Equilibrium Problems with Inexact Line Search. J. Optim. Theory Appl., 2009, no 143, pp. 159-183.

9. Krawczyk J. Numerical Solutions to Coupled-Constraint (or Generalized Nash) Equilibrium Problems. CMS, 2007, vol. 4, pp. 183-204.

10. Krawczyk J., Uryasev S. Relaxation Algorithms to Find Nash Equilibria with Economic Applications. Environmental Modeling and Assessment, 2000, vol. 5, pp. 63-73.

11. Mangasarian O.L. Equilibrium Points of Bimatrix Games. Journal of the Society for Industrial and Applied Mathematics, 1964, vol. 12, pp. 778-780.

12. Mills H. Equilibrium Points in Finite Games. Journal of the Society for Industrial and Applied Mathematics, 1960, vol. 8, no 2, pp. 397-402.

13. Nikaido H., Isoda K. Note on Noncooperative Convex Games. Pacific Journal of Mathematics, 1955, vol. 5, no 5, pp. 807-815.

14. Quint T., Shubik M. A Theorem on the Number of Nash Equilibriua in a Bimatrix Game. International Journal of Game Theory, 1997, no 26, pp. 353-359.

15. Rosen J.B. Existence and Uniqueness of Equilibrium Points for Concave N-Person Games. Econometrica, 1965, vol. 33, no 3, pp. 520-534.

16. Schiro D.A., Pang J.-S., Shanbhag U.V. On the Solution of Affine Generalized Nash Equilibrium Problems with Shared Constraints by Lemke's Method. Math. Program., Ser. A, 2013, vol. 142, pp. 1-46.

17. Strekalovskiy A.S., Enkhbat R. Polymatrix Games and Optimization Problems. Automation and Remote Control, 2014, vol. 75, no 4, pp. 632-645.

18. Strekalovskiy A.S. On Local Search in D.C. Optimization Problems. Applied Mathematics and Computation, 2015, no 255, pp. 73-83.

Minarchenko Ilya Mikhailovich, Melentiev Energy Systems Institute SB RAS, 130, Lermontov st., Irkutsk, 664033, tel.: (3952)500646, ex. 258 (e-mail: eq.progr@gmail.com)

Локальный поиск в квадратичной игре двух лиц Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Минарченко Илья Михайлович

Похожие темы научных работ по математике , автор научной работы — Минарченко Илья Михайлович

Local Search in Quadratic Two-Person Game

Текст научной работы на тему «Локальный поиск в квадратичной игре двух лиц»