УДК 004.421
А. В. Супруненко
ОПРЕДЕЛЕНИЕ УСТОЙЧИВОСТИ РАВНОВЕСНЫХ СОСТОЯНИЙ В ТЕОРЕТИКО-ИГРОВОЙ МОДЕЛИ СЕТИ ДОВЕРИЯ
Нижегородский государственный технический университет им. Р. Е. Алексеева
Предложен алгоритм определения устойчивости равновесных состояний в теоретико-игровой модели сети доверия, основанный на эволюционно-генетическом моделировании. Приведены результаты работы алгоритма для определённой модели сети доверия.
Ключевые слова: сеть доверия, репутация, равновесие по Нэшу, бескоалиционная игра, эволюционно -генетическое моделирование.
Введение
Одним из способов описания и формализации процесса взаимодействия агентов сетей доверия является использование теоретико-игрового подхода [1]. В данной работе представлен алгоритм определения устойчивости равновесных состояний в теоретико-игровой модели сети доверия, описанной в [2] и использующейся для классификации источников веб-контента.
Агенты сети доверия не взаимодействуют друг с другом напрямую. В качестве показателя доверия используется не мнение об агенте других участников сети, а степень доверия системы данному агенту: репутация. В этом случае является неизменным контекст взаимодействия, а значит, репутация может быть выражена единственным значением. Значение репутации агента используется при расчёте совокупной оценки источника веб-контента, при этом каждый агент оказывает влияние на совокупную оценку, пропорциональное значению его репутации. Изменения значений репутации каждого из агентов происходит на основе опыта его участия в оценке того или иного интернет-ресурса.
Процесс классификации осуществляется следующим образом:
Шаг 1. В сети доверия выбираются т агентов (т <п, п — количество агентов, зарегистрированных в сети доверия на данный момент), образующих подмножество агентов А *, участвующих в оценке источника веб-контента: А * = { а 1, а2,..., ат }, А * £ А.
Шаг 2. Каждый из т агентов оценивает источник веб-контента, выбирая одну оценку из множества X, \X\ = к. Сделанные агентами оценки можно записать в виде матрицы V размером , где в первой строке указываются оценки — элементы множества , а во второй строке — суммы значений репутаций агентов, выбравших соответствующую оценку:
У = (й*1 ■■■ й*к).
Шаг 3. На основании сделанных агентами оценок определяется итоговая оценка источника веб-контента х* как оценка, которую выбрали агенты, обладающие максимальной суммарной репутацией: элемент первой строки матрицы , находящийся в столбце, содержащем максимальное значение во второй строке, т. е.
х*=х^: т ахк Дх^}. (1)
Шаг 4. На основании выбранной итоговой оценки множество агентов А * разделяется на два подмножества:
— подмножество агентов, чья оценка совпала с итоговой оценкой, ,
— подмножество агентов, чья оценка не совпала с итоговой оценкой, , при этом .
© Супруненко А. В., 2017.
Для каждого из подмножеств агентов новые значения репутации рассчитываются следующим образом:
Г '=П>+££ (2)
для агентов, чьи оценки совпали с итоговой оценкой,
г = г0--, (3)
и т-Я ' 4 '
для агентов, чьи оценки не совпали с итоговой оценкой, где
г* — скорректированное значение репутации агента сети доверия;
г0 — текущее значение репутации агента сети доверия;
— сумма значений репутаций агентов, чьи оценки не совпали с итоговой оценкой;
И + — сумма значений репутаций агентов, чьи оценки совпали с итоговой оценкой;
И = £ 1Г — сумма значений репутаций агентов, участвующих в оценке.
При переходе от описания сети доверия к теоретико-игровой модели между используемыми терминами устанавливается следующее соответствие:
• каждому раунду игры соответствует процесс классификации источника веб-контента;
• игроками являются агенты сети доверия, участвующие в оценке источника веб-
контента;
• стратегиям игроков соответствует выбор оценки агентом;
• значением функции выигрыша является новое значение репутации агента.
Такая игра имеет следующие правила:
Правило 1. Ход игрока означает выбор им одной из стратегий (оценок источника веб-контента);
Правило 2. Игроки не знают о количестве других игроков и о ходах, сделанных другими игроками;
Правило 3. Выигрышной стратегией считается та, которую выбрали игроки, обладающие наибольшей суммой значений их репутации (1).
Правило 4. После определения выигрышной стратегии (1) каждый игрок получает новое значение репутации — выигрыш (2) или (3).
Выбор агентами таких оценок, при которых значение их функции выигрыша максимальны (оценок, совпадающих с итоговой оценкой) для описанной теоретико-игровой модели будет являться равновесием по Нэшу - ситуацией в игре, когда ни один игрок не может увеличить свой выигрыш, индивидуально выбрав другую стратегию. Описанная игра всегда имеет определённое количество равновесий по Нэшу, равное количеству элементов множества стратегий игроков. Равновесные ситуации возникают при одновременном выборе всеми игроками одной и той же (выигрышной) стратегии.
Теоретический анализ
Для описанной модели количественное определение устойчивости равновесия позволит выяснить, какое количество игроков должно изменить свою стратегию, чтобы игра перешла из одной точки равновесия в другую. В практическом смысле смена точки равновесия игры означает намеренное изменение оценки веб-контента.
Можно обозначить три свойства устойчивости равновесия по Нэшу [3]:
1. Равновесие называется (в, ¿)-иммунным, если ожидаемый выигрыш игроков не выходит за рамки -окрестности, когда других игроков меняют свои стратегии;
2. Равновесие называется (в, ¿)-толерантным, если равновесные стратегии игроков остаются равновесными в -окрестности, даже если других игроков меняют свои стратегии;
3. Равновесие называется (в, ^-коалиционным, если не существует такого игрока, который может увеличить свой выигрыш больше, чем на , если присоединится к игроков, сменивших свои стратегии.
Учитывая неравнозначность каждого игрока в описанной теоретико-игровой модели,
количество игроков заменяется суммой их репутации, тогда условие устойчивости равновесия будет иметь вид:
И I < И*,
где — сумма значений репутаций игроков для каждой из стратегий, кроме выигрышной;
— сумма значений репутаций игроков для выигрышной стратегии;
— номер стратегии.
Условие устойчивости равновесия для каждого игрока, первый раз принимающего участие в игре:
Угу: И I + г < И*, у = 1 ,ш, где г — значение репутации игрока, первый раз реализующего стратегию (первый раз принимающего участие в игре);
— количество игроков, первый раз принимающего участие в игре.
Учитывая описанную специфику игры, определение устойчивости равновесия сводится к решению трёх задач, в каждой из которых:
• в игре участвуют игроков ( ),
• каждый из игроков имеет значение репутации , ,
• каждый игрок имеет две стратегии: и ,
• все игроки выбирают стратегию . Игра находится в состоянии равновесия,
• игроков ( ) меняют свою стратегию на .
1. Иммунность равновесия
Определить суммарную репутацию игроков, сменивших свою стратегию, при условии, что выигрыш каждого из других игроков не изменился больше, чем на .
2. Толерантность равновесия
Определить суммарную репутацию игроков, сменивших свою стратегию, при условии, что игра осталась в прежней точке равновесия, а выигрыш игроков, не сменивших свои стратегии, не изменился больше, чем на .
3. Коалиционность равновесия
Определить значение репутации игрока, который, если сменит свою стратегию, увеличит свой выигрыш больше, чем на , при условии, что свои стратегии уже сменили игроков.
С учётом требований каждого из свойств равновесия, толерантность является самым строгим требованием, поэтому достаточно показать только толерантность равновесия.
Методика
Для определения устойчивости равновесия предлагается использовать элементы эво-люционно-генетического моделирования.
В качестве элемента популяции выступают п игроков. Для каждого элемента популяции выполняются шаги:
1. Каждому из игроков присваивается случайным образом значение репутации , , принадлежащее некоторому диапазону . Сумма значений репутаций игроков: .
2. Каждый из игроков реализует стратегию (игра находится в состоянии равновесия).
3. Стратегии игроков последовательно изменяются на (мутация), после каждой смены
т
стратегии определяются новые значения репутации игроков: г* = г + ——, как описано в [4].
тхИ
4. Если очередная смена стратегии привела к потере равновесия, то смена стратегии не производится, для игроков определяются:
• суммарное значение первоначальных репутаций игроков, изменивших свои стратегии ;
• суммарное значение проигрыша, как разность суммы первоначальных значений репутаций и суммы конечных значений репутаций проигравших игроков: , где
— сумма значений репутаций проигравших игроков.
В качестве фитнес-функции используется сумма относительных значений суммарной начальной репутации игроков и суммарного проигрыша:
тш,
где — вектор игроков.
Из популяции сохраняется лучший элемент: «особь» с минимальным значением фит-нес-функции. Процесс повторяется, после каждой итерации определяется один лучший элемент популяции. Выводится отношение
Блок-схема алгоритма показана на рис. 1.
Рис. 1. Блок-схема алгоритма определения устойчивости равновесных состояний в теоретико-игровой модели сети доверия
Экспериментальная часть
Была подготовлена программная реализация предложенного алгоритма. Программа запускалась с различным набором входных параметров.
1. , , . Результат работы алгоритма показан на рис. 2.
015
количество итогов
Рис. 2. Результат работы алгоритма с входными параметрами гтП=500, гтах=1500, п=100
2. гт 1 п = 1 О О , г т ах = 2 О О, п = 1 О 0. Результат работы алгоритма показан на рис. 3.
копи честю игрою а
Рис. 3. Результат работы алгоритма с входными параметрами гтп=100, гтах=200, п=100 3. , . Результат работы алгоритма показан на рис. 4.
ш I
«Р в!" е? ^ «Р ^
копичесгао игооюв
Рис. 4. Результат работы алгоритма с входными параметрами гтП=гтлх=1000, п=100
Результаты и выводы
Как видно из графиков (рис. 2-3), значение отношения первоначальной суммарной репутации игроков, сменивших свои стратегии, к сумме значений репутации всех игроков,
принимающих участие в игре, — при количестве игроков от 2 до 10 стремительно растёт,
затем, на участке от 10 до 20 игроков рост замедляется, а при количестве игроков больше 20 наблюдается медленный рост до значения -0,56.
При равных значениях и (рис. 4) кривая имеет ряд колебаний, тем не менее при больших значениях количества игроков колебания происходят вокруг значения 0,56.
Таким образом, можно сделать вывод, что отношение — не зависит от диапазона значений репутации отдельных игроков и от абсолютных значений репутации.
Для процесса классификации этот вывод означает, что для того чтобы изменилась оценка источника веб-контента, необходимо, чтобы свои оценки изменили агенты, обла-
дающие приблизительно 56 % от суммы значений репутации всех игроков, принимающих участие в оценке источника веб-контента.
Библиографический список
1. Губанов, Д. А. Модели репутации и информационного управления в социальных сетях / Д. А. Губанов, Д. А. Новиков, А. Г. Чхартишвили // УБС. - 2009. - №26-1. - С. 209-234.
2. Супруненко, А. В. Модели и алгоритмы классификации веб-контента на основе игрового подхода // Научно-технический вестник Поволжья. — Казань. - 2016. - № 6. - С. 169-171.
3. Gradwohl, R. Fault tolerance in large games / R. Gradwohl, O. Reingold // Proceedings of the 9th ACM Conference on Electronic Commerce. - ACM, 2008. - Р. 274-283.
4. Супруненко, А. В. Способ экспертной оценки с использованием сети репутации для решения задачи классификации веб-контента // Искусственный интеллект и принятие решений. - Институт системного анализа РАН. М., 2016. - № 3. - С. 72-76.
Дата поступления в редакцию 02.02.2017
A. V. Suprunenko
SEARCH FOR THE EQUILIBRIA IN GAME-THEORETICAL MODEL
OF WEB OF TRUST
Nizhny Novgorod state technical university n.a. R.E. Alexeyev
The article describes search for the equilibria in game-theoretical model of web of trust using evolutionary genetic modeling. The article contains results for specific model.
Key words: web of trust, reputation, Nash equilibrium, noncooperative game, evolutionary genetic modeling.