Научная статья на тему 'Условно контролирующие стратегии и последовательный выбор решений в многошаговой игре с булевыми стратегиями'

Условно контролирующие стратегии и последовательный выбор решений в многошаговой игре с булевыми стратегиями Текст научной статьи по специальности «Математика»

CC BY
31
8
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Блыщик В.Ф.

В статье рассматриваются многошаговые игры с булевыми стратегиями и последовательным выбором действий игроками. Вводится понятие условно-контролирующей стратегии и на основе этого понятия предлагается алгоритм выбора решения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The multimonic games with Boolean strategies and sequential selection of actions by players are considered. The notion of conditionally controlling strategy and suggest the decision algorithm based on this notion is introduced.

Текст научной работы на тему «Условно контролирующие стратегии и последовательный выбор решений в многошаговой игре с булевыми стратегиями»

УДК 519.83

УСЛОВНО КОНТРОЛИРУЮЩИЕ СТРАТЕГИИ И ПОСЛЕДОВАТЕЛЬНЫЙ ВЫБОР РЕШЕНИЙ В МНОГОШАГОВОЙ ИГРЕ С БУЛЕВЫМИ СТРАТЕГИЯМИ

© Блыщик В.Ф.

Таврический национальный университет им. В.И. Вернадского

факультет математики и информатики

пр-т Вернадского, 4, г. Симферополь, 95007, Украина e-mail: veb@land.ru

Abstract. The multimonic games with Boolean strategies and sequential selection of actions by players are considered. The notion of conditionally controlling strategy and suggest the decision algorithm based on this notion is introduced.

Введение

Принятие решений в реальных сложных системах связано с конфликтными ситуациями и неопределенностью, которая вызвана не только отсутствием информации о выборе стратегий противоборствующей стороной, но и невозможностью априорного вычисления выигрыша для некоторых ситуаций. Будем рассматривать класс антагонистических игр, в котором стратегии двух игроков состоят в указании совокупности некоторых действий из заданного множества, выполнение которых зависит от игрока. Такие стратегии являются булевыми векторами (наборами), состоящими из единиц и нулей. Вещественная функция выигрыша предполагается априорно заданной только для некоторого подмножества ситуаций. Такие модели будем называть играми с булевыми стратегиями [1, 2, 3, 5].

Изучение такого класса игр позволяет моделировать и оптимизировать поведение противоборствующих сторон логическими средствами, использовать методы, согласованные со структурой и математическим описанием вычислительных систем, баз знаний, моделей и алгоритмов интеллектуализированной обработки информации, основанных на эмпирической индукции.

1. Принятие решения при последовательном получении

информации о выборах игроков

Управляющие переменные игроков х\.,..,, хт и ..., уп в игре Г(Гд) [1] могут рассматриваться в приложениях как элементарные составляющие (ЭС) выбираемых стратегий в следующем смысле. Будем считать, что выбор значений элементарных

составляющих х и у связан с выполнением некоторых действий А = . 11.....Л,„ и

В = В1,..., Вп. Если первый (второй) игрок устанавливает переменную в

единицу, то действие . 1(() обязательно выполняется, если устанавливает х,() в ноль, - действие .1(( запрещается, если х,() не устанавливается ни в ноль, ни в единицу, никакой информации о действии А^В^) нет.

48 Блыщик Б.Ф.

Определим многошаговую игру Гд со стратегиями последовательного выбора игроками по одной ЭС поочередно, полагая, что для Гд известна платежная IX} -матрица [4, 5].

Пусть функции логического описания классов (ЛОК) ] = 1,1 имеют вид

М*>у)= V ьфьяТ

и «ход» делает первый игрок. Он устанавливает переменную х, в единицу или ноль или пропускает ход, отказываясь от выбора. Если а^ := о, а £ {0,1}, то подстановка вместо значения а в ЛОК х,у) приведет к упрощению соответствующей ДНФ и получению выражения }']{х\,,,,, £¿-1, а, ^¿+1,..., хт, у\,..., уп) от на единицу меньшего числа переменных.

Рассмотрим пример, где ЛОК имеют следующий вид:

Л (я, у) = /2(ж, у) = х{уг, /з(ж, у) =Уъ

Предположим, х\ := 1; после подстановки этого значения в выражения /!(•) = 0; /2(-) = ух\ /з(-) = у\ определяем новый -набор:

Ь? = 0; ф = 0; = 0; = ух] = гЛ ЬЦ -матрица редуцируется до строки вида показанного на рис, 1,

~У\ У\

И,

Рис. 1. Редуцированная матрица Что соответсвует вычеркиванию из исходной ЬЦ -матрицы строки х\ (рис, 2),

X^

Рис. 2. Вычеркивание из исходной ЬС} -матрицы строки х\.

Следующим ходом второй игрок, выбрав у\ := 0, зафиксирует решение игры в седловой точке.

Определение 1. Операцией удаления элементарной составляющей ()?и. называется подстановка значения какой-либо одной переменной во все ЛОК х,у),= 1,1.

У1 У1

7Г2

При выполнении операции 0|с некоторые из Ь(5 конъюнкций могут обратиться в ноль, что соответствует их вычеркиванию из исходного ЬЦ -списка, а некоторые, при обращении соответствующего литерала в единицу, уменьшатся по рангу на единицу. Поскольку операция 0|с соответствует подстановке значения только одной переменной, то эта переменная будет принадлежать либо множеству {.г,.,,,. ./■„, }•. либо множеству {у1,,,,, уп}. Учитывая, что в ЛОК входят коньюнкции, вообще говоря, из обоих этих множеств, применение операции может привести к следующим исходам, представленным в таблице 1,

Таблица 1. Выполнение операции

.\'"пп Уточнение операции Результат выполнения операции ОдС

1 : = 0 (хг := 1) Конъюнкции множества Ь, в которых переменная Х{ содержится в положительном (отрицательном) литерале, обращаются в ноль. Конъюнкции множества С}, входящие в ЛОК в виде логического сомножителя с обратившейся в ноль конъюнкцией множества Ь также обращаются в ноль. Из конъюнкций множества Ь, в которых переменная Х{ содержится в отрицательном(положительном) литерале указанная переменная вычеркивается. Ранг этой конъюнкции уменьшается на единицу. Если ранг становится нулевым, то указанная конъюнкция удаляется из Ь -списка, а конъюнкции С} -списка остаются без изменений.

2 Уз ■■= 0 (Уз ■■= 1) Результат аналогичен п. 1 с переменой местами в описании списков Ь и исходных конъюнкций ЬЦ -игры.

Рассмотрение возможных результатов выполнения операции ОэС делает очевидным следующее утверждение

Теорема 1. Выполнение операции 0%с равносильно вычеркиванию некоторых строк или столбцов исходной матрицы -игры и, возможно, сокращению на единицу ранга некоторых конъюнкций.

После выполнения операции ОэС список ЬЦ конъюнкций модифицируется, как указано в таблице; будем называть новый список -списком, и соответству-

ющую ему матричную игру - -игрой.

50

Влыщик Б.Ф.

Определение 2. Оптимальным шагом первого (второго) игрока называется такое выполнение операции 0|с, что в полученной LQ(0^c) матричной игре размерности р х q значение максимина max min hij было наибольшим (значение минимак-

_ l<i<P l<i<Q

са min max hij было наименьшим),

l<i<Ql<i<P

Очевидно, что оптимальный шаг обеспечивает игроку выбор наилучшего гарантированного результата в LQ(0|c)^ игре, формируемой после преобразования платежной матрицы в соответствии с теоремой 1,

2, УСЛОВНО КОНТРОЛИРУЮЩИЕ СТРАТЕГИИ И ПОСЛЕДОВАТЕЛЬНЫЙ

выбор решений

Определение 3. Конъюнкция К первого(второго) игрока в LQ(0|c) игре называется условно-контролирующей, если в матрице этой LQ(0^c) игры все значения в соответствующей этой конъюнкции К строке (столбцу) одинаковы и равны h(K)-, величина h(K) называется ценой условно-контролирующей конъюнкции,

В LQ-игре на рис,2 второй игрок имеет условно контролирующую конъюнкцию у\.

Если на очередном шаге (выполнение операции) 0|с в игре LQ(0|c) для имеющего ход первого (второго) игрока существуют условно контролирующие конъюнкции, то они легко определяются путем просмотра строк и столбцов платежной матрицы.

Определение 4. Условно-контролирующая конъюнкция первого (второго) игрока с наибольшей (наименьшей) ценой называется наилучшей.

Перед выполнением очередного шага игры Гд игрок определяет свою наилучшую условно-контролирующую стратегию.

Теорема 2.

1, Если в исходной LQ -игре условно контролирующую конъюнкцию имеет 'только первый (второй) игрок, то в игре Гд он может обеспечить себе выигрыш, равный цене его наилучшей условно контролирующей конъюнкции.

2, Если в исходной LQ -игре оба игрока имеют условно контролирующие конъюнкции и L* и Q* - наилучшие из них, то в игре Гд игроки м,огут обеспечить себе выигрыш, равный h(L*,Q*)-, при этом, пара (L*,Q*) является седловой точкой исходной LQ— игры.

Замечание 1. Если элементарные составляющие из наилучшей условно контролирующей конъюнкции исчерпаны, то игрок может пропускать ходы, и при этом результат игры Гд не изменится.

Следствие 1. Если исходная LQ -игра имеет седловую точку и цену h* и первый (второй) игрок имеет наилучшую условно контролирующую конъюнкцию с ценой hyK > h*(hyK < h*), то он обеспечивает себе выигрыш не меньший (не больший) значения h* цепы исходной LQ -игры.

Алгоритм АI решения многошаговой игры Гд,

1, Если исходная LQ -игра имеет еедловую точку, найти ее и определить цену игры h*.

2, Если существуют наилучшие условно контролирующие конъюнкции первого (второго) игрока с ценой Лук > Л*(Лук < Л*), то выполнять шаги, описанные в доказательстве теоремы 2,

3, Если седловой точки в исходной LQ -игре нет, но условно контролирующие конъюнкции есть у одного игрока с наилучшей ценой Лук принять решение о достаточности выигрыша Лук и реализовать стратегию, соответствующую наилучшей условно контролирующей конъюнкции,

4, Если условно контролирующих конъюнкций нет у обоих игроков, то выполнять оптимальные шаги (определение 2) следующим образом. Поскольку каждый шаг, согласно теореме 1, приводит к вычеркиванию некоторых строк или столбцов платежной матрицы, то рассмотреть все возможные шаги (их число будет не более чем удвоенная сумма рангов L или Q конъюнкций). При выборе каждого шага оценивается гарантированный выигрыш и реализуется оптимальный шаг.

Заключение

Практическое значение полученных результатов состоит в возможности применения разработанных в ней алгоритмов решения многошаговой игры с булевыми стратегиями и принятия решений в рамках теоретико-игрового подхода для построения интеллектуализированных информационных систем, выявления скрытых структурных закономерностей в данных, построения логических описаний классов объектов в виде дизъюнктивных нормальных форм,

список литературы

1. Блыщик В.Ф. Решение игр с булевыми стратегиями и неполной информацией на основе синтеза ДНФ// Искусственный интеллект. - 2000. - № 2. - С.9-12.

2. Блыщик В. Ф. Принятие и визуализация решений при последовательном выборе действий в матричной игре с булевыми стратегиями// International Conference. Problems of Decision Making under Uncertainties (PDMU-2003).Abstracts. - Alushta (Ukraine). 2003. - C.74-76.

3. Блыщик В.Ф. Игры двух лиц с булевыми стратегиями и множеством переменных перехвата// Таврический вестник информатики и математики. - 2004. - № 1. - С.40-47.

4. Блыщик В. Ф. Алгоритм построения классов значений платежной функции по прецедентной начальной информации// Искусственный интеллект. - 2006. —К® 2. - С.10-13.

5. Донской В.И., Башта А.И. Дискретные модели принятия решений при неполной информации. -Симферополь: Таврия, 1992. - 166 с.

Статья поступила в редакцию 24-12.2008

i Надоели баннеры? Вы всегда можете отключить рекламу.