Научная статья на тему 'Имитация матричных игр как метод анализа практических стратегий принятия решений'

Имитация матричных игр как метод анализа практических стратегий принятия решений Текст научной статьи по специальности «Математика»

CC BY
396
83
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
СТРАТЕГИЯ ПРИНЯТИЯ РЕШЕНИЙ / ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ / МАТРИЧНЫЕ ИГРЫ / STRATEGY OF DECISION-MAKING / SIMULATION / MATRIX GAMES

Аннотация научной статьи по математике, автор научной работы — Пуртов Андрей Михайлович, Чанышев Олег Георгиевич

Приводятся результаты использования имитационных моделей для сравнительного анализа практических стратегий принятия решений. Качество стратегий оценивается с помощью матричных игр.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Simulation of matrix games as a method of analysis of practical strategy of decision-making

Results of the use of simulation for comparative analysis of practical strategy of decision-making are described. The quality of strategy is estimated by means of matrix games.

Текст научной работы на тему «Имитация матричных игр как метод анализа практических стратегий принятия решений»

Библиографический список

1. Пуртов, А. М. Интеграция технологии ГИС и метода редукции графов для анализа транспортных сетей/ А. М. Пуртов // Омский научный вестник. — 2011. — № 1(97). — С. 164— 168.

2. Юршевич, Е. А. Опыт использования пакета ANYLOGIC для моделирования городского трафика / Е. А. Юршевич, Е. И. Петрова // Имитационное моделирование. Теория и практика (ИММОД-2005) : сб. докл. 2-й Всерос. конф. Т. 1. — СПб. : ЦТ СС, 2005. - С. 298-305.

3. Долгушин, Д. Ю. Двухуровневое моделирование автотранспортных потоков на основе клеточных автоматов и систем с очередями / Д. Ю. Долгушин, В. Н. Задорожный, С. В. Кокорин // Имитационное моделирование. Теория и практика (ИММ0Д-2011) : материалы 5-й Всерос. конф. Т. 1. — СПб. : ЦТ СС, 2011. — С. 139— 144.

4. Живоглядов, В. Г. Теория движения транспортных и пешеходных потоков / В. Г. Живоглядов. — Ростов н/Д. : Изд-во журн. «Изв. вузов. Сев.- Кавк. регион», 2005. — 1082 с.

5. Яцкив, И. В. Использование возможностей имитационного моделирования для анализа транспортных узлов / М. В. Яцкив, Е. А. Юршевич, Н. В. Колмакова // Имитационное моделирование. Теория и практика (ИММОД-2005) : сб. докл. 2-й Всерос. конф. Т. 2. - СПб. : ЦТ СС, 2005. - С. 237-245.

6. PTV VISION [Электронный ресурс] / Программные продукты PTV Vision. — Режим доступа: http://www.ptv-vision.ru (дата обращения: 02.08.2012).

ПУРТОВ Андрей Михайлович, кандидат технических наук, доцент (Россия), старший научный сотрудник лаборатории методов проблем преобразования информации.

Адрес для переписки: [email protected]

Статья поступила в редакцию 15.08.2012 г.

© А. М. Пуртов

УДК 6813 А. М. ПУРТОВ

О. Г. ЧАНЫШЕВ

Омский филиал Института математики СО РАН

ИМИТАЦИЯ МАТРИЧНЫХ ИГР КАК МЕТОД АНАЛИЗА ПРАКТИЧЕСКИХ СТРАТЕГИЙ ПРИНЯТИЯ РЕШЕНИЙ

Приводятся результаты использования имитационных моделей для сравнительного анализа практических стратегий принятия решений. Качество стратегий оценивается с помощью матричных игр.

Ключевые слова: стратегия принятия решений, имитационное моделирование, матричные игры.

Введение. Проблемы целенаправленного движения и принятия решений являются предметом исследований в различных областях научно-практической деятельности: философия, психология, экономика, военное дело, техника, спорт, математика и др. В каждой из областей решаются свои задачи, используются специфические методы, алгоритмы, критерии. Стратегии поведения в хорошо формализованных ситуациях разрабатываются математической теорией принятия решений. Большинство реальных ситуаций трудно формализовать. В таких случаях для принятия решений используются проверенные практикой относительно простые методы, алгоритмы. Известные специалисты в области математической теории принятия решений Р.Л. Кини и Г. Райффа в одной из своих последних работ [1] отмечают, что методам принятия решений в реальных ситуациях уделяется незаслуженно мало внимания.

На качество принимаемых решений большое влияние оказывает уровень информированности лица, принимающего решение (ЛПР). Поэтому од-

ной из главных целей информационного процесса является получение объективных оценок различных ситуаций. Такие оценки можно считать текущим уровнем знаний. Изучение целенаправленного движения и принятия решений в игровых ситуациях дает знания в следующих направлениях:

— свойства эвристических (практических) процедур принятия решений;

— влияние свойств ЛПР (игроков), на возможность достижения собственных целей;

— влияние организации игрового процесса на формирование объективных оценок ситуаций.

Многие игры можно рассматривать как модели реальных ситуаций. Поэтому представляется целесообразным их использование для изучения свойств процедур принятия решений, используемых в повседневной жизни.

Величина выигрыша является важным критерием качества игрока, алгоритма принятия решений. С другой стороны, с точки зрения общества (множества игроков), большое значение имеет возмож-

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013

ность получения объективных оценок множества ситуаций в результате многочисленных реализаций процессов принятия решений.

Хорошими моделями для анализа процедур принятия решений и процессов формирования оценок ситуаций являются матричные В матричных играх можно аналитически найти цену игры (абсолютную оценку ситуации) и оптимальные стратегии для игроков. Этим они удобны для сравнительного анализа различных стратегий, алгоритмов принятия решений. Эффективным методом анализа игровых ситуаций является имитационное моделирование, позволяющее практически на любом уровне детализации представить исследуемый процесс.

Целью работы был сравнительный анализ эвристических (практических, простых) стратегий (алгоритмов) принятия решений. Основными критериями качества стратегий считались два параметра:

— величина выигрыша игроков, использующих стратегию;

— близость получаемых в результате игры статистических оценок к известным абсолютным оценкам ситуаций.

Для сравнения алгоритмов использовались имитационные модели матричных игр.

1. Имитационные модели стратегий принятия решений. Для проведения экспериментов использовалась матрица (рис. 1), приведенная в [2]. Игроки независимо друг от друга выбирают строки и столбцы матрицы. Цель игрока 1, выбирающего строки, получить максимальный выигрыш. Цель игрока 2, выбирающего столбцы, минимизировать выигрыш игрока 1. При имитации удобно представлять этот процесс в виде графа, изображенного в правой части рисунка. Это позволяет использовать понятия траекторий движения, стоимости вершин. Вершины (1,1), (2,1), (3,1) выбираются игроком 1, а вершины (1,2), (2,2), (3,2) выбираются игроком 2. Выбирая вершину, игрок 2 не знает, в какой вершине он находится. Этим обеспечивается независимость выбора игроков. Абсолютная стоимость начальной вершины С(0) равна вычисленной цене игры.

Эксперименты заключались в проведении турниров среди стратегий, используемых игроком 1 и игроком 2. Словом «ход» будем обозначать один выбор игроком строки или столбца. Словом «партия» будем обозначать процесс выбора игроками заданного на входе модели какого-то количества ходов. При моделировании в каждой партии вычисляются текущие статистические оценки стоимости вершин. Обозначим S(i) — текущая статистическая оценка стоимости вершины г S(i) равна отношению текущего суммарного выигрыша при выборе вершины 1 к числу выборов этой вершины на момент времени вычислений.

Результат партии определялся следующим образом:

— S(0)>1,86 — победа игрока, выбирающего строки;

— S(0)<1,84 — победа игрока, выбирающего столбцы;

— 1,84<Б(0)<1,86 — ничья.

За победу игроку (стратегии) присуждалось 2 очка, за ничью 1 очко, за поражение 0 очков.

В турнирах участвовали 2 игрока, использующих семь стратегий. В [3] приведены результаты состязаний для пяти стратегий. Тогда использовались модели на GPSS РС. В дальнейшем студент ОмГТУ О. В. Гердт разработал программу моделирования

Рис. 1. Переход от игровой матрицы к графу

турниров на С# и добавил для анализа еще две стратегии. Перечислим стратегии, используемые игроками.

SP1 — используется вычисленная оптимальная стратегия. Вероятности выбора строк (вершин графа 1,1 2,1 3,1) равны соответственно 0.55, 0.2, 0,25. Вероятности выбора столбцов (вершин графа 1,2 2,2 3,2) равны 0.4, 0,35, 0,25. Оптимальная стратегия, по принятым в теории матричных игр определениям, должна обеспечивать величину выигрыша, равную вычисленной цене игры независимо от применяемой противником стратегии. В нашей постановке задачи она со всеми должна делать ничью (1,84^(0)<1,86).

В реальных условиях игровая матрица редко бывает известна. Поэтому для других стратегий и игроков, их использующих, были выдвинуты следующие требования:

— игроки знают цену игры;

— игроки не знают значения ячеек игровой матрицы, но знают оценку сделанного хода;

— игроки ничего не знают о стратегиях, используемых другими игроками;

— игрокам известны текущие статистические оценки стоимости вершин;

— стратегии должны быть легко реализуемы на практике.

В результате для экспериментов были разработаны следующие стратегии.

SP2 — выбор вершины с вероятностью, пропорциональной S(i), (с учетом цели игрока). Для игрока 1 чем больше S(i), тем больше вероятность выбора вершины с номером 1. Для игрока 2 чем меньше S(i), тем больше вероятность выбора вершины с номером 1.

SP3 — если после выбора 1-ой вершины ход оказался неудачным, на следующем ходу игрок выбирает другую вершину. Для игрока, выбирающего строки, ход считается неудачным, если приз меньше S(0). Для игрока, выбирающего столбцы, ход считается неудачным, если приз больше S(0). Новая вершина выбирается с вероятностью, пропорциональной S(i)1 (с учетом цели игрока).

Для стратегий SP2 и SP3 важно набрать объективную первоначальную статистику. Если одна вершина случайно окажется «плохой», то из-за малой вероятности ее выбора будет долго такой и оставаться.

SP4 — при выборе каждого следующего хода происходит простой последовательный перебор вершин независимо от ситуации. Самая простая и часто используемая в реальности стратегия.

БР1 БР2 БРЭ БР4 БР5 БР6 БР7 Очки

БР1 1 Я 1,85 1 С 1,85 1 Я 1,85 1 С 1,84 1 Я 1,85 1 С 1,86 1 Я 1,86 1 С 1,84 1 Я 1,85 1 С 1,85 1 Я 1,86 1 С 1,85 12

БР2 1 С 1,85 1 Я 1,85 0 Я 1,38 0 С 1,94 0 Я 1,75 2 С 1,75 0 Я 1,42 0 С 2,19 0 Я 1,43 0 С 2,03 0 Я 1,25 0 С 2,24 4

БР3 1 С 1,85 1 Я 1,84 2 С 1,38 2 Я 1,94 0 Я 1,59 2 С 1,75 0 Я 1,29 0 С 2,33 0 Я 1,60 0 С 2,03 0 Я 1,64 0 С 2,23 8

БР4 1 С 1,85 1 Я 1,86 2 С 1,75 0 Я 1,75 2 С 1,59 0 Я 1,75 2 Я 3,33 2 С 0,33 2 Я 2,04 2 С 1,53 0 Я 1,34 0 С 1,94 14

БР5 1 С 1,86 1 Я 1,84 2 С 1,42 2 Я 2,19 2 С 1,29 2 Я 2,33 0 С 3,33 0 Я 0,33 2 Я 2,17 2 С 1,47 2 Я 3,00 0 С 2,49 16

БР6 1 С 1,85 1 Я 1,85 2 С 1,43 2 Я 2,03 2 С 1,60 2 Я 2,03 0 С 2,04 0 Я 1,53 0 С 2,17 0 Я 1,47 0 Я 1,51 0 С 2,01 10

БР7 1 С 1,86 1 Я 1,85 2 С 1,25 2 Я 2,24 2 С 1,64 2 Я 2,23 2 С 1,34 2 Я 1,94 0 С 3,00 2 Я 2,49 2 С 1,51 2 Я 2,01 20

SP5 — игрок выбирает вершину i до первого неудачного хода. В отличие от SP3, в случае неудачи выбор следующей вершины детерминированный, простым перебором. В отличие от SP4, в случае удачного хода вершина выбирается повторно.

SP6 — задается число допустимых неудачных выборов (п) вершины i после того, как она была выбрана удачно (так поступает азартный игрок). При исчерпании числа неудачных попыток, на следующем ходу вершины выбираются равновероятно. Предварительные эксперименты показали, что увеличение п ухудшает результаты стратегии SP6. Поэтому в описываемых экспериментах п=1 (разрешается только одна неудачная попытка).

Стратегии SP5, SP6 учитывают текущий опыт, но не учитывают накопленную статистику.

SP7 — перед игрой тестируется игровая матрица. Это нарушение требования о незнании игровой матрицы и серьезная фора по сравнению со стратегиями SP2, SP3, SP4, SP5, SP6. Перед игрой вычисляются первоначальные стоимости вершин. Во время игры S(i) модифицируются и вершины выбираются с вероятностями, пропорциональными их стоимости.

При моделировании в каждой партии игроки делали по 50000 ходов.

Основные цели моделирования заключались в сравнительной оценке стратегий по двум критериям:

— относительная сила стратегий (количество набранных очков);

— близость получаемой статистической оценки S(0) к абсолютной оценке С(0).

2. Проведение экспериментов на матрице 3Х3. Результаты турнира 1, в котором использовались матрица и граф, описанные выше, приведены в табл. 1.

Строка таблицы содержит результаты стратегии в партиях против той стратегии, обозначением которой назван столбец. Каждая пара стратегий использовалась игроками в двух партиях. В первой партии одну стратегию использовал игрок 1, другую стратегию использовал игрок 2. Во второй партии игроки менялись стратегиями.

Если стратегию использовал игрок 1 (выбирал строки игровой матрицы), результат помечен буквой R. Если стратегию использовал игрок 2 (выбирал столбцы игровой матрицы), результат помечен буквой С. Ячейки с результатами содержат по две строки, в которых записана информация о партиях:

Таблица 2

Оценки стоимости игры в турнире 1

БР2 БР3 БР4 БР5 БР6

Б(0) 1,73625 1,73875 1,75875 1,81625 1,7875

(0) СО 1 (0) С( 0,11375 0,11125 0,09125 0,03375 0,0625

— результат партии (2 — победа, 1 — ничья, 0 — проигрыш);

— обозначение игрока, использовавшего стратегию (Я, С);

— статистическая стоимость игры S(0).

Последний столбец показывает количество набранных стратегий очков в турнире.

По результатам турнира 1 можно сделать следующие выводы.

Стратегия SP1, оптимальная с математической точки зрения, обеспечивает во всех партиях приз, примерно равный вычисленной абсолютной цене игры. Поэтому игроки, использующие стратегию SP1, делают ничьи (с позиции силы) с игроками, использующими все другие стратегии. Это походит на сильного шахматиста, который делает со всеми игроками ничьи (независимо от их силы) на основании того, что начальная позиция объективно равная.

Стратегии SP2 и SP3, при которых выбираются вершины с вероятностями, зависящими от текущих статистических оценок S(i), набрали наименьшее число очков. Это связано с тем, что статистические оценки стоимости вершин изменяются относительно медленно. Поэтому игроки, использующие такие оценки для принятия решений, консервативны, не реагируют оперативно на изменение обстановки.

Стратегии SP4, SP5, SP6 часто меняют выбираемые вершины и не учитывают их консервативные статистические оценки. Стратегии SP4 и SP5 опередили стратегию SP1 благодаря их более успешным выступлениям против «слабых» стратегий. Успех стратегии SP5 можно объяснить тем, что в рассматриваемых условиях после неудачного хода однозначно менять выбор более эффективно, чем менять его с какой-то вероятностью.

Убедительная победа стратегии SP7 связана с большой форой, предоставленной ей другими стратегиями (кроме SP1) в виде возможности перед началом игры оценить стоимости вершин графа.

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013

232

БР1 БР2 БР3 БР4 БР5 БР6 БР7 Очки

БР1 1 R 1,86 1 С 1,86 0 R 1,51 0 С 1,98 1 R 1,85 1 С 1,85 0 R 1,42 0 С 1,99 0 R 1,45 0 С 1,97 2 R 1,88 0 С 1,86 6

БР2 1 С 1,86 1 R 1,86 0 R 1,21 0 С 1,90 0 R 1,75 2 С 1,74 0 R 1,20 0 С 2,16 0 R 1,25 0 С 2,10 0 R 1,24 0 С 2,31 4

БР3 2 С 1,51 2 R 1,98 2 С 1,21 2 R 1,90 0 R 1,68 2 С 1,52 0 R 1,19 0 С 1,90 0 R 1,35 2 С 1,57 0 R 1,71 2 С 1,39 14

БР4 1 С 1,85 1 R 1,85 2 С 1,75 0 R 1,74 2 С 1,68 0 R 1,52 2 R 2,30 2 С 0,45 0 R 1,61 2 С 1,57 0 R 1,44 0 С 2,04 12

БР5 2 С 1,42 2 R 1,99 2 С 1,20 2 R 2,16 2 С 1,19 2 R 1,90 0 С 2,30 0 R 0,45 0 R 1,76 2 С 1,28 2 R 3,18 2 С 1,46 18

БР6 2 С 1,45 2 R 1,97 2 С 1,25 2 R 2,10 2 С 1,35 0 R 1,57 2 С 1,61 0 R 1,57 2 С 1,76 0 R 1,28 0 R 1,74 2 С 1,54 16

БР7 0 С 1,88 2 R 1,86 2 С 1,24 2 R 2,31 2 С 1,71 0 R 1,39 2 С 1,44 2 R 2,04 0 С 3,18 0 R 1,46 2 С 1,74 0 R 1,54 14

Таблица 4

Оценки стоимости игры в турнире 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

БР1 БР2 БР3 БР4 БР5 БР6 БР7

Б(0) 1,79 1,715 1,575 1,65 1,690 1,599 1,815

С(0) - 8(0) 0,06 0,135 0,274 0,2 0,159 0,250 0,034

В табл. 2 показана способность стратегий, не зная игровую матрицу, получать оценки S(0), близкие к С(0). В таблицу не включены стратегии SP1 и SP7, знающие игровую матрицу.

В таблице для пяти стратегий приведены средние значения S(0), рассчитанные по результатам партий, проведенных между ними. Таблица показывает, что простые эвристические стратегии позволяют получить неплохие оценки стоимости игры. Среднее значение S(i) для всех стратегий равно 1,77. Отклонение от С(0) равно 0,08, что составляет 4 %.

Цель следующей серии экспериментов заключалась в анализе способности стратегий адаптироваться к изменению ситуаций. Текущие значения игровой матрицы были случайными величинами. Через каждые 100 ходов начальные значения игровой матрицы умножались на равномерно распределенную случайную величину от 0 до 2. Остальные условия турнира 2 такие же, как в турнире 1. Результаты турнира 2 приведены в табл. 3. Структура, обозначения в табл. 3 такие же, как и в табл. 1.

В турнире 2 резко снизилась эффективность стратегий SP1 и SP7, знающих игровую матрицу. Это объяснимо тем, что роль знания средних значений ячейки матрицы снижается при случайном изменении их величины в процессе игры. Стратегия SP1 не использует средств адаптации к изменению ситуации. Стратегия SP2, ориентированная на использование статистических оценок стоимости вершин графа, опять заняла последнее место. Значительно улучшились результаты стратегий SP3 и SP6, повторяющих выбор в случае удачного хода и изменяющих выбор в случае неудачного хода. Стратегии SP4 и SP5, тоже часто меняющие выбор вершин графа, остались на высоком уровне.

По структуре табл. 4 аналогична табл. 2. Она построена по результатам турнира 2. В табл. 4 включены стратегии SP1 и SP2, т.к. в этом турнире знание средних значений игровой матрицы не дает им

большого преимущества перед другими. Сравнивая значения таблиц 2 и 4, можно сделать вывод об ухудшении оценки стратегиями значения С(0). Среднее значение S(i) для всех стратегий равно 1,69. Отклонение от С(0) равно 0,16, что составляет 9 %. Стратегия SP7 хуже выступила в турнире 2, чем в турнире 1, но показала хороший результат по оценке стоимости игры С(0).

3. Проведение экспериментов на матрице 4Х4. Основная цель анализа стратегий на матрице 4х4 состояла в ответе на вопросы: какие результаты покажут стратегии на матрице большей размерности, привязаны ли выводы, сделанные в предыдущих экспериментах, к конкретной игровой матрице или имеют более общий характер. Эксперименты этой серии провел студент ОмГТУ О. В. Гердт. Для проведения экспериментов (турнир 3) использовалась игровая матрица на рис. 2. Вычисленные параметры игры:

— вероятности для оптимальной стратегии: (0,3; 0,4; 0,17; 0,13) для строк и (0,3; 0,3; 0,3; 0,1) для столбцов;

— цена игры С(0) = 1,8.

Результат партии определялся следующим образом:

Рис. 2. Игровая матрица для турнира 3

Игровая матрица Граф процесса игры

Игрок 2

2 3 4 0 1

2 | 3 | О

Цена игры С(0)=1,85

Оптимальные стратегии Р(1,1)=0,55 Р(2,1)=0,2 Р(3,1)=0,25 Р(1,2)=0,4 Р(2,2)=0,35 Р(3,2)=0,25

SP1 SP2 SP3 SP4 SP5 SP6 SP7 Очки

SP1 1 R 1,81 1 С 1,80 1 R 1,80 1 С 1,80 1 R 1,80 1 С 1,80 1 R 1,80 1 С 1,80 1 R 1,80 1 С 1,80 1 R 1,80 1 С 1,80 12

SP2 1 С 1,81 1 R 1,80 0 R 1,68 0 С 2,00 2 R 1,91 0 С 1,92 0 R 1,58 0 С 2,07 0 R 1,64 0 С 2,03 0 R 1,33 0 С 2,09 4

SP3 1 С 1,80 1 R 1,80 2 С 1,68 2 R 2,00 0 R 1,69 0 С 1,98 0 R 1,28 0 С 2,15 0 R 1,64 0 С 1,99 0 R 1,52 0 С 2,11 6

SP4 1 С 1,80 1 R 1,80 0 С 1,91 2 R 1,92 2 С 1,69 2 R 1,98 0 R 1,38 2 С 1,38 2 R 2,02 2 С 1,47 0 R 1,51 0 С 1,89 14

SP5 1 С 1,80 1 R 1,80 2 С 1,58 2 R 2,07 2 С 1,28 2 R 2,15 2 С 1,38 0 R 1,38 2 R 2,01 2 С 1,41 2 R 3,00 0 С 2,69 18

SP6 1 С 1,80 1 R 1,80 2 С 1,64 2 R 2,03 2 С 1,64 2 R 1,99 0 С 2,02 0 R 1,47 0 С 2,01 0 R 1,41 2 R 2,00 0 С 2,05 12

SP7 1 С 1,80 1 R 1,80 2 С 1,33 2 R 2,09 2 С 1,71 2 R 1,39 2 С 1,51 2 R 1,89 0 С 3,00 2 R 2,69 0 С 2,00 2 R 2,05 18

S(0)>1,81 — победа игрока, выбирающего строки;

S(0)<1,79 — победа игрока, выбирающего столбцы;

1,79<Б(0)<1,81 — ничья.

Другие условия такие же, как в турнире 1. Результаты турнира 3 приведены в табл. 5. Структура, обозначения в табл. 5 такие же, как и в табл. 1. Сравнение количества очков, набранных стратегиями в турнирах 1 и 3, показывает малое изменение результатов, несмотря на увеличение размерности игровой матрицы. Это говорит о том, что выводы по турнирам 1 и 2 относятся не только к конкретной матрице на рис.1. Таким образом, появляется возможность при анализе стратегий на матричных играх делать относительно общие выводы.

По структуре табл. 6 аналогична табл. 2. Но она построена по результатам турнира 3. Среднее значение S(i) для всех стратегий равно 1,76. Отклонение от С(0) равно 0,04, что составляет 2%. Несмотря на усложнение игровой ситуации (размерности игровой матрицы), точность оценки стратегиями цены игры повысилась.

Анализ результатов экспериментов позволяет сделать следующие выводы:

— оптимальная (по определению) стратегия делает ничью со всеми другими стратегиями (сильными и слабыми) в матричных играх с фиксированными значениями игровой матрицы. В турнире многие стратегии более эффективны за счет выигрыша у более слабых;

— в рассматриваемых условиях стратегии, использующие для принятия решений статистические оценки ситуаций (вершин графа), показывают плохие результаты ^Р2, SP3). Это происходит из-за консервативности статистических оценок. Стратегии, оперативно реагирующие на изменение ситуации, показывают хорошие результаты;

— простые эвристические (практические) стратегии, даже не зная игровую матрицу, позволяют получать хорошую оценку стоимости игры;

— результаты, полученные на одной игровой матрице, достаточно хорошо совпадают с результатами, полученными на других игровых матрицах.

Заключение. Простые эвристические стратегии принятия решений имеют большое значение как в повседневных бытовых, так и в объектно-ориентированных профессиональных ситуациях. В работе сделана попытка показать пользу от использования

Таблица 6

Оценки стоимости игры в турнире 3

SP2 SP3 SP4 SP5 SP6

S(0) 1,85375 1,80125 1,71875 1,6575 1,77625

(0) СО 1 (0) и -0,05375 -0,00125 0,08125 0,1425 0,02375

имитационного моделирования матричных игр для генерации и сравнительного анализа различных стратегий. Проведенные эксперименты показали, что матричные игры можно использовать для анализа качества стратегий по критериям:

— способность побеждать;

— возможность получения объективных оценок ситуаций.

Выводы, сделанные в статье, предназначены не столько для обобщений, сколько для получения информации для размышлений.

Библиографический список

1. Джон С. Хэммонд. Умный выбор: как научиться принимать правильные решения / Джон С. Хэммонд, Ральф Л. Кини, Говард Райффа ; пер. с англ. — Новосибирск : Сиб. унив. изд-во, 2007. - 187 с.

2. Дж. Мак Кинси. Введение в теорию игр / Дж. Мак Кинси ; пер. с англ. ; под ред. Д. Б. Юдина. — М. : Гос. изд. физ.-мат. лит., 1960. — 420 с.

3. Пуртов, А. М. Имитация процессов принятия решений / А. М. Пуртов // Имитационное моделирование. Теория и практика : материалы конф. В 2 т. Т. 2. — СПб., 2007. — С. 169 — 173.

ПУРТОВ Андрей Михайлович, кандидат технических наук, доцент (Россия), старший научный сотрудник лаборатории методов проблем преобразования информации.

ЧАНЫШЕВ Олег Георгиевич, кандидат технических наук, старший научный сотрудник лаборатории методов проблем преобразования информации. Адрес для переписки: [email protected]

Статья поступила в редакцию 04.12.2012 г.

© А. М. Пуртов, О. Г. Чанышев

ОМСКИЙ НАУЧНЫЙ ВЕСТНИК № 1 (117) 2013 ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

i Надоели баннеры? Вы всегда можете отключить рекламу.