удк 681 з Е.В. УШАКОВА
Омский государственный университет им. Ф.М. Достоевского
ЗАДАЧА О ЛИНЕЙНОМ РАЗМЕЩЕНИИ
В данной работе рассматривается решение задачи о линейном размещении 2п магазинов на одной улице в двухмерном и трёхмерном случаях, с использованием теории выпуклых игр.
1. Введение
Задача имеет следующую формулировку: на одной улице должно быть размещено 2п магазинов спорттоваров. Владельца магазина дешевых товаров назовём вторым игроком, а дорогих — первым игроком. Если магазины расположены близко друг от друга, то покупатели зачастую предпочитают приобрести дешевый товар. Второй игрок стремится разместить свои магазины как можно ближе к магазинам первого игрока, а тот старается по возможности увеличить расстояние между магазинами.
Решение в одномерном случае приведено в книге [1]. Однако в многомерных случаях данный способ весьма затруднителен. Мы же предлагаем более простой метод решения. Подробно остановимся на двухмерном и трёхмерном случаях.
Введём некоторые понятия и факты из теории выпуклых игр.
Если рассматривать нашу задачу как игру двух лиц, то данная игра будет являться антагонистической, то есть выигрыш первого игрока равен проигрышу второго и определяется значением платежной ф ункции И(а,Р), заданной на некотором ограниченном множестве. Здесь а-стратегия первого игрока, Р - стратегия второго. Мы считаем, что функция Н(а,р) непрерывна. Как действовать игрокам в антагонистической игре? Очевидно, каждый игрок должен выбирать свою стратегию таким образом, чтобы максимально увеличить свой выигрыш, уменьшая тем самым выигрыш противника. Но так как цели игроков прямо противоположны, то им придется удовлетвориться компромиссным вариантом, то есть ситуацией, которая хотя и не идеальна для обоих, но устраивает каждого.
Следующая теорема является непрерывным вариантом теоремы Неймана-Неша о матричных играх.
Теорема 1. (Основная теорема теории непрерывных игр на ограниченном множестве)
Непрерывная игра на замкнутом ограниченном множестве определена в смешанных стратегиях, то есть выполнимо равенство:
М))= (/о)Н
Величина —называется ценой игры.
Если первый игрок использует максиминную стратегию р(с(), при которой гарантируется средний выигрыш с, то второй игрок вынужден использовать свою минимаксную стратегию <?(/?), если он хочет гарантировать, что в среднем не проиграет больше, чем с. То же самое можно сказать об игроках в обратном порядке. По этой причине максиминная и минимаксная смешанные стратегии считаются оптимальными.
Заметим, что общих методов нахождения макси-минной и минимаксной смешанных стратегий не существует. Однако есть очень важный класс таких игр, в которых оптимальные стратегии эффективно определимы — это класс так называемых выпуклых игр.
Теорема 2. (Основная теорема о выпуклых играх)
Пусть функция H(a,(J) выпукла по Р для любого фиксированного а (такие игры называются выпуклыми). Тогда второй игрок имеет чистую оптимальную стратегию. Это значит, что существует число Рпр, такое, что выполнено равенство:
max //, {p(a),pv) = mjn(max Н2{aMP))] =
= mjn|max Нг (ос,Р)j = с.
Опишем алгоритм нахождения оптимальных стратегий выпуклых игр. Стратегия Р„р, второго игрока находится непосредственно. Для нахождения оптимальной стратегии первого игрока используются следующие соображения. Стратегия «называется существенной, если min^max#(a,/?)j достигается при заданном значений' а и значении Р„р1 . Оптимальной стратегией первого игрока является смесь существенных стратегий с некоторыми вероятностями.
Схема алгоритма:
1. Проверка того, что функция Н(а,Р) выпукла по р.
2.Нахождение Р„р, изравенсгвас = min(max//(a,/?)j.
3. Нахождение существенных стратегий ог;1 а, из равенства с = Н(а, Рор1).
4. Определение оптимальной стратегии первого игрока (оптимальной стратегией первого игрока является смесь стратегий а,, а, с вероятностями р и 1-р).
Введём ещё одно понятие, которое нам необходимо для решения. Симплекс — это выпуклый многогранник с числом вершин на единицу больше, чем размерность рассматриваемого пространства [1], |3]. О-симплекс — точка, 1-симплекс — это отрезок, 2-симплекс — треугольник, 3- симплекс — тетраэдр, ит. д, Симплекс является правильным, если все его рёбра имеют одинаковую длину (правильный треугольник, правильный тетраэдр). Выпуклая оболочка любых m из п вершин симплекса сама является симплексом и называется m-гранью. 0-гра-ни - это вершины, 1-грани — рёбра, п-1 — грани — просто грани.
Пусть в /?"' дана система декартовых координат х],х2,...,хт, в которой вершина е,, i = 0,...,n имеет координаты е,. = , тогда n-симплекс с
вершинами е,,е,,...,е„ состоит из всех точек пространства, координаты которых имеют вид:
i>") = 1, У">о.
Для удобства мы будем ставить в соответствие нашей задаче симплексы. В случае п = 2, когда необходимо разместить 4 магазина, мы будем размещать две точки в треугольнике в пространстве R2 (2-симплекс). Когда каждый игрок имеет по 3 магазина, мы рассмотрим размещение двух точек в тетраэдре (правильный 3-симплекс). Если у каждого игрока будет произвольное количество магазинов (n); можно рас-
сматривать n-симплекс. При этом выбор игрока — это точка внутри многогранника.
2. Решение
2.1 .Случай п = 2.
Необходимо разместить 4 магазина на одной улице (2 дешевых и 2 дорогих). Рассмотрим правильный 2-симплекс - равносторонний треугольник Т, высота которого равна единице. Установим взаимно однозначное соответствие между точками треугольника Т и парами точек на отрезке I = [0,1 ] длины 1. Каждой точке С в Тсопоставим вектор (А,,/?,,/г,) расстояний до соответствующих сторон треугольника. Выберем на I пару точек a, b таким образом, что расстояние от а до 0 равно Л,, расстояние от b до 0 равно ht + h2, следовательно, расстояние от а до b равно , автоматически расстояние от b до 1 равно h..
Выбор пары точек a, b на I позволяет определить единственную точку С на Т, которой соответствует вектор (/г,,/^,^). Это следует из того, что сумма расстояний от произвольной точки Т до его сторон равна 1. Выходит, одна точка в треугольнике соответствует двум точкам на прямой.
Таким образом, задачу о размещении 4 магазинов (точек) можно рассматривать, как задачу о размещении 2 точек на треугольнике. Одна точка соответствует владельцу дешевых магазинов, а другая владельцу дорогих. Будем считать, что это игра с нулевой суммой, то есть выигрыш первого игрока равен проигрышу второго. В качестве платёжной функции выбираем квадрат расстояния между этими точками.
Вычислим расстояние между точками. Рассмотрим равносторонний треугольник Т = ABC. Первый игрок выбирает точку Р, а второй Q. Точка Р соответствует вектору (х^х2,л,) расстояний до сторон треугольника АВ, АС и ВС, соответственно. Точка О соответствует вектору (угу2>у^) расстояний до сторон треугольника АВ, АС и ВС, соответственно. Путем несложных вычислений мы получили, что расстояние между Р и Q равно:
\Рд\Л{2(х,-у,) + {х2-у2))2-{х2-Уг)\
Таким образом, платёжная функция имеет вид:
Н (. > У, > У г) = \{2{x¡ - У,) + (*г - У i ))2 - (х2 ~УгУ.
Покажем разумность такого выбора. Если пары л:,,лг2) и (.Ур-Ут) близки, то есть |лг, — | < и < с, то Н (x],x2,y¡,y\)<4e2. Если же наоборот,
точек U, - у
^(х1,х2,у1,у1)<е1, А также 1
< е.
Проверим теперь на выпуклость относительно (у,Л'2) нашу платёжную функцию у,, у2).
Функция Я(.Т|,л-2._у,._у2) выпукла, если
Н". И"
' ; >0, Н" >0.
"Г,.
В нашем случае
8 4
3 3
4 8
3 3
Таким образом, наша функция Н[хх,хг,у\,уг) строго выпукла по второй паре переменных.
Сформулируем и докажем обобщенную теорему о выпуклых играх.
Теорема 3. (Обобщенная теорема о выпуклых играх)
Пусть имеется выпуклое, ограниченное замкнутое множество М на Я2, в нашем случае — это равносторонний треугольник. Пусть имеется игра двух лиц, первый из которых выбирает точку /'(х,, л\) е М, а второй игрок выбирает точку (2(упу2)е М .Платёжная функция — это выигрыш первого игрока, равный проигрышу второго. В нашем случае, в качестве платёжной функции мы взяли квадрат расстояния между точками Р и О. Н (х,,,,_у2) непрерывная, выпуклая по переменным (.У,,.У,) функция.Тогда по основной теореме о выпуклых играх (теорема 2), существует оптимальная чистая стратегия второго игрока, то есть выполнимо равенство:
тиЯ(р(Р)1б^) = тт(тахЯ(Л?(е))) =
= т т ^ тах Я (Р, £3) | = с
Здесь р(Р) - непрерывная функция плотности распределения на М; я {0) - непрерывная функция плотности _распределения на М. Таким образом, Ящн ~ Я(У»У1) " чистая оптимальная стратегия второго игрока. Для первого игрока определяются существенные стратегии Р (х1, х2), такие что Н (х,, х2, у,, у2) = с.
■Зафиксируем переменную у2 = уг. Тогда функция Н(х[,х2,у[,у2) - выпукла по у] прилюбых значениях х[, х2. По основной теореме выпуклых игр это означает, что второй игрок имеет чистую оптимальную стратегию _у,.
Зафиксируем переменную у, = у,, считаем у2 переменной. Тогда функция Н[х1,х2,у],у2) - выпукла по у 2 прилюбых значениях х,, х2. По основной теореме выпуклых игр это означает, что второй игрок имеет чистую оптимальную стратегию у2. Отсюда следует, что () = (у],уг) - чистая оптимальная стратегия второго игрока, такая что
тах Н (х1,х2,у1,у1) = с
Вернёмся к нашей зад аче. У нас имеется равносторонний треугольник. Так как игра выпуклая, то второй игрок имеет оптимальную чистую стратегию 0 = {у,,у2)-
Теорема 4. (Оптимальная чистая стратегия второго игрока)
Точка <2 = (у^у2) - центр треугольника.
■ Если О - эт0 центр, то второй игрок обеспе-
(2)\
чивает себе проигрыш не больше I ~ I . Если <2 - не центр, то второй игрок не гарантирует себе проигрыш, равный I 2 I ■ Оптимальная чистая стратегия
— это гарантированный проигрыш (выигрыш), значит второй игрок выбирает центр.
Первый игрок имеет три существенные стратегии, которые находятся в вершинах треугольника. Пусть он выбирает их с одинаковой вероятностью, 1
равной — . Если первый игрок выбрал каждую из вер-
1
шин треугольника с вероятностью ~ и второй игрок выбрал центр треугольника, то квадрат расстояния
Г2У
между точками будет равен 7 , то есть средний выигрыш равен проигрышу второго и равен
V
это и есть оптимальные стратегии игроков.
Покажем, что любой другой выбор второго игрока, то есть выбор точки 0 не в центре треугольника Т, увеличивает средний выигрыш первого игрока.
Лемма.
Сумма квадратов расстояний от всех вершин треугольника до произвольной нецентральной точки больше, чем сумма квадратов расстояний от всех вершин треугольника до центра. ▼ Рассмотрим равносторонний треугольник с высо-
2
той 1, значит сторона равна ^ . Введем декартову
систему координат с началом в середине отрезка стороны треугольника. Таким образом, вершины этой
стороны будут иметь координаты: ("^Д'0)1
Значит, третья вершина будет лежать на оси ОУ, и имеет координату (0,1), так как высота равна 1. Координата центра:
Пусть произвольная точка имеет координату Тогда сумма квадратов расстояний от этой точки до всех вершин треугольника равна:
1 1 « 7 I 1
Найдем минимум этой функции: = 6,-^ = 0 ,,
е1'у{х,у) = 6у-2 = 0 ^ 3
Проверим полученную стационарную точку на
,,60
экстремум. Вычисляем якобиан: J{d)= >0,
Г
бирает точку Р, а второй О. Точка Р соответствует вектору , х2, х3, х4) - расстояния до граней тетраэдра ADC, ABC, DAB и BCD соответственно. Точка Q соответствует вектору (У,,У2^У^У^) - расстояния до граней тетраэдра ADC, ABC, DAB и BCD соответственно. Квадрат расстояния между Ри Q равен:
+ -Уз))' + (*! -У.)'
Таким образом, платёжная функция имеет вид if"'
H(x„x2,x},yl,y1,yi) =
+ +(*1 -У,)2
Покажем разумность такого выбора. Если пары точек (х{,х2,хЛ и (у,,у2,у}) близки, то есть \х2 - Уг1 ^ £. 1*3 - Уз [ ^ £ • то н (л-,, х,, х3, у^, уг, у ) < 20г2. Если же наоборот, Н(х1,х2,х1,хА,у1,у1,у},уА)<е2, то (дт, - _у3) < £2 => |дг3 - у}\< £. Аналогично получается,
■з Гэ i - ■> ■
-уг\йе.
J\ =—i=>0. Та-2 V6
0 6
и6> 0. Следовательно, точка является мини-
мумом функции с( (х,у) . ▲
Если второй игрок выбирает центр, то он минимизирует свой проигрыш. Следовательно, его оптимальная чистая стратегия - это центр. Если первый игрок будет выбирать свои существенные стратегии — вершины с разными вероятностями, то он не гарантирует
себе выигрыш | . Поскольку второй игрок в этом
случае сдвинет свою чистую стратегию из центра к вершине, вероятность выбора которой наибольшая.■ 2.2. Случай п = 3.
Пусть на одной улице должно быть размещено шесть магазинов (три дешевых и три дорогих). Мы будем ставить в соответствие правильный 3-симплекс - тетраэдр Т3, высота которого равна единице.
Установим взаимно однозначное соответствие между точками тетраэдра Т., и тройками точек на отрезке I = [0,1) длины 1. Каждой точке С в Т., сопоставим вектор (, Л2, Лз, Л^) расстояний до соответствующих сторон тетраэдра. Выберем на I тройку точек А, В, С таким образом, что расстояние от А до 0 равно /?,, расстояние от В до 0 равно /», + И2, следовательно, расстояние от А до В равно /г,, расстояние от 0 до С равно /г, + И2 + /г, автоматически расстояние от В до 1 равно НА. Выбор тройки точек на отрезке позволяет определить единственную точку в тетраэдре, которой соответствует вектор (Л,,Л2,/г,, ). Это следует из того, что сумма расстояний от произвольной точки в тетраэдре до его граней равна единице.
Таким образом, задачу о размещении 6 магазинов (точек) можно рассматривать как задачу о размещении 2 точек в тетраэдре. Одна точка соответствует владельцу дешевых магазинов, а другая — владельцу дорогих. Будем считать, что это игра с нулевой суммой, то есть выигрыш первого игрока равен проигрышу второго. В качестве платёжной функции выбираем квадрат расстояния между этими точками.
Вычислим расстояние между точками. Рассмотрим правильный тетраэдр АВСО. Первый игрок вы-
= min |
Q
вает себе проигрыш не больше с = J . Если 0 - не центр, то второй игрок не гарантирует себе проиг-
что -у^Е , \х.
Проверим теперь на выпуклость относительно (у,,уг,у-,) нашу платёжную функцию. В нашем случае Якобианы равны Jy = 0, Jг = 0,
ким образом, наша функция Н выпукла по второй паре переменных.
Сформулируем и докажем обобщенную теорему о выпуклых игрзх.
Теорема 5. (Обобщенная теорема о выпуклых играх)
Пусть имеется выпуклое, ограниченное замкнутое множество М на Я1, в нашем случае — это правильный тетраэдр. Пусть имеется игра двух лиц, первый из которых выбирает точку Р(х],х2,х-))еМ, а второй игрок выбирает точку Q(yl,y2,y]) е М . Платёжная функция — это выигрыш первого игрока, равный проигрышу второго. В нашем случае, в качестве платёжной функции мы взяли квадрат расстояния между точками РиО- Н ^,х2,хг,у^у2,у2) непрерывная, выпуклая по переменным {у[,у1,уъ) функция. Тогда по основной теореме о выпуклых играх /теорема 2), существует оптимальная чистая стратегия второго игрока, то есть выполнимо равенство:
тах !1{р(РЫ,р1) = тт(тах Н{Р,д (С))) =
I (тах//(/>,£?)) = с
Здесь р(Р) - непрерывная функция плотности распределения на М; - непрерывная функция плотности распределения на М. Таким образом, (}„!» =Я{У\>У2>У>) - чистая оптимальная стратегия второго игрока. Для первого игрока определяются существенные стратегии />(д:,,^2,д:3), такие что И(х[,х2,х2,у[,у2,у}) = с.
■Доказательство аналогично доказательству теоремы з.и
Вернёмся к нашей задаче. У нас имеется правильный тетраэдр. Так как игра выпуклая, то второй игрок имеет оптимальную чистую стратегию £ = {у^уг>У-\)-Теорема 6. (Оптимальная чистая стратегия второго игрока)
Точка 0 = (у,,у1,у}) • центр тетраэдра. ■ Если ^ - это центр, то второй игрок обеспечи-
рыш, равный с. Так как, оптимальная стратегия — это гарантированный проигрыш (выигрыш), значит второй игрок выбирает центр.
Первый игрок имеет четыре существенные стратегии, которые находятся в вершинах тетраэдра. Пусть он выбирает их с одинаковой вероятностью, 1
равной -. Если первый игрок выбрал каждую из вер-1
шин с вероятностью — и второй игрок выбрал центр,
то квадрат расстояния между точками будет равен с, то есть средний выигрыш равен проигрышу второго и равен с, это и есть оптимальные стратегии игроков.
Покажем, что любой другой выбор второго игрока, то есть выбор точки д не в центре тетраэдра, увеличивает средний выигрыш первого игрока. Лемма.
Сумма квадратов расстояний от всех вершин тетраэдра до произвольной нецентральной точки больше, чем сумма квадратов расстояний от всех вершин тетраэдра до центра. ▼ Рассмотрим правильный тетраэдр с высотой 1, зна-[3
чит сторона равна «I— . Введем декартову систему координат с началом в одной из вершин тетраэдра, ось ОУ направим вдоль одного из рёбер основания. Таким образом, вершины тетраэдра будут иметь координаты:
(0,0,0),
ojj.o
,0
1 V5
2л/2 ' 2s[2
,1
Координата центра:
2 л/2 ' 2%/2 '
1 Уз Г 2^2 '272'^
Пусть произвольная точка имеет координату (х,у,г). Тогда сумма квадратов расстояний от этой точки до всех вершин треугольника равна:
</ (х, у, г) = 4х2 + 4у2 + 4г2 - 2л/б* - 2^2у -21 + 5. Найдем минимум этой функции:
'с1[(х,у,г) = Ях-2-Л = 0
л л > / Г \
1 Уз
d;(x,y) = Sy-2y/6: </;(*,j/) = 8r-2
о
2V2'2ч/2'4
Проверим полученную стационарную точку на экстремум. Вычисляем якобианы: У, =512>0, = 64 > 0, и J| = 8 > 0 . Следовательно, точка — является минимумом функции с!(х,у,г). ▲ Если второй игрок выбирает центр, то он минимизирует свой проигрыш. Следовательно, его оптимальная чистая стратегия - это центр. Если первый игрок будет выбирать свои существенные стратегии
— вершины с разными вероятностями, то он не гарантирует себе выигрыш с. Поскольку второй игрок в этом случае сдвинет свою чистую стратегию из центра к вершине, вероятность выбора которой наибольшая. ■
2.3. Случай произвольного п. Если у каждого игрока будет произвольное количество магазинов (п), мы будем рассматривать п-сим-плекс. При этом выбор игрока — это точка внутри многогранника.
Можно показать, что в произвольном случае будет действовать обобщенная теорема о выпуклых играх подобная Теоремам 3 и 5. Каждый раз второй игрок будет иметь оптимальную чистую стратегию
— точка, являющаяся центром симплекса. А первый
I
игрок будет с одинаковой вероятностью - выбирать
вершины. Цена игры при этом будет
и + 1
Библиографический список
1. Александров П.С. Комбинаторная топология /П С. Александров. - М.:Л, 1947.
2. Мулен Э. Теория игр с примерами из математической экономики /Э. Мулен. - М.: Мир, 1985.
3. Понтригин Л.С. Основы комбинаторной топологии / Л.С. Понтрягин. — М.:Л, 1947.
УШАКОВА Евгения Валерьевна, аспирантка кафедры информационных систем.
Дата поступления статьи в редакцию: 28.09.2006 г. © Ушакова Е.В.
Книжная полка
Латышев А.В., Асеев А.Л. Моноатомные ступени на поверхности кремния. - Новосибирск : Изд-во СО РАН, 2006.-242 с.
В книге представлены результаты исследований структурных процессов, протекающих на поверхности кремния при сублимации, адсорбции, гомо- и гетероэпитаксиальном росте, термическом отжиге и газовых реакциях, полученные с помощью разработанного в ИФП СО РАН уникального диагностического метода — in situ сверхвысоковакуумной отражательной электронной микроскопии. Для физиков, специалистов и студентов, занимающихся вопросами материаловедения, физики кристаллизации, молекулярно-лучевой эпи-таксии, атомными процессами на поверхности твердого тела, методами наноструктурирования, нанодиагно-стики и развитием кремниевых нанотехнологий. Рос. акад. наук, Сиб. отд-ние, Ин-тфизики полупроводников.
Фролов Г.И., Жигалов B.C. Физические свойства и применение магнитопленочных нанокомпозитов. -
Новосибирск: Изд-во СО РАН, 2006. - 188 с.
Создание неравновесной структуры в твердом теле — путь к получению материалов с новыми свойствами. Монография рассматривает возможности реализации этого подхода на примере магнитопленочных материалов с кластерной и нанокристаллической структурами. Рассмотрены особенности структуры и свойств аморфных ферримагнитных пленок сплавов редкая земля—переходный металл, а также возможности их использования в устройствах оптической обработки информации; вопросы корреляции структуры и магнитных свойств в нанокристаллических пленках Зс1-металлов; описаны методы получения этих материалов с размером зерна менее 10 нм. Показаны пути создания на базе этих пленок высокорезистивных магнитомягких материалов и сред-носителей для сверхплотной магнитной записи. Для специалистов в области физики твердого тела, физической химии и материаловедения, для студентов и аспирантов соответствующих специальностей. Отв. редактор В. Ф. Шабанов ; Рос. акад. наук, Сиб. отд-ние, Ин-тфизики им. Л, В. Киренского, М-вообразования и науки РФ, Федеральное агентство по образованию, Сиб. гос. аэрокосмический ун-т им. М. Ф. Решетнева.