Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
УДК 330.115
Моделирование переговорных процессов в высокотехнологичных производственных системах
Виноградов Г. П., Ивашкин Ю. А.
Постановка задачи: повышение уровня автономности подразделений в наукоемких производствах привело к распределению центров принятия решений. Это сделало актуальной проблему исследования процесса взаимодействия подразделений в интеллектуальных организациях при решении сложных слабоструктурированных проблем в условиях неопределенности внешней среды. Известные методы и подходы не учитывают взаимозависимость субъектов при выработке согласованных решений, их субъективные оценки ситуации выбора, цели, потребности, мотивацию, что делает формальные модели не реализуемыми на практике. Целью работы является разработка механизма взаимодействия подразделений производства в форме переговорного процесса, когда вследствие сложности технологического процесса, требующего специализированного знания, на вышестоящем уровне управления могут быть неизвестны возможности подчитнных уровней или отсутствует возможность детерминировать их поведение силовым путем. Используемые методы: решение задачи построения механизма переговорного процесса основано на оригинальном подходе моделирования субъективно-рационального выбора, учитывающего индивидуальное понимание лицом, принимающим решение, свойств ситуации выбора. Разработка модели выбора основана на использовании положений теории нечетких множеств. Модель механизма переговорного процесса основана на использовании результатов теории активных систем. Новизна: элементами новизны представленного решения являются разработка модели субъективно рационального выбора и построение на ее основе теоретико-игровой модели механизма переговорного процесса, учитывающего взаимозависимость участников, обоснование сходимости переговорного процесса при различных вариантах информированности арбитра о возможностях участников. Результат: предложенный подход согласования интересов участников переговорного процесса позволяет сочетать оценки, полученные формальными методами, с субъективными оценками, полученными на основе знаний, опыта. Использование полученных результатов позволяет повысить объективность вариантов решений, является основой для создания информационных технологий для интеграции «естественных» интеллектов при решении творческих задач, требующих не тривиальных подходов, выработать «идеальные модели» проведения переговоров. Практическая значимость: представленное решение предлагается реализовать на основе использования агентных технологий. Это позволяет выполнять исследование переговорного процесса как системы, динамика которой определяется не глобальными правилами и законами, а тогда, когда эти глобальные правила и законы являются результатом индивидуальной активности членов группы. Цель моделирования - получить представление об этих глобальных правилах, общем поведении системы, исходя из предположений об индивидуальном, частном поведении ее отдельных активных объектов и взаимодействии этих объектов в системе.
Ключевые слова: переговорный процесс, конфликты, принятие решений, мультиагентная система, модель, согласованное управление, компромисс.
Актуаль ность
Современные тенденции в развитии организаций указывают на возрастание необходимости в конструктивных переговорах при решении проблем. Это связано с такими направлениями эволюции организационных систем, как децентрализация; стремление к созданию все меньших по численности и более автономных по статусу подразделений, набирающая в них силу рыночная и предпринимательская ориентация. Повышение уровня автономности и самостоятельности субъектов (в дальнейшем агентов) переориентировало центры принятия решений на нижние уровни иерархии
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
организационных систем. В этих условиях подразделения организации, каждое из которых имеет свои собственные интересы и понимание ситуации выбора, во все большей степени принуждены разрешать стоящие перед ними задачи своими силами и учиться налаживать взаимодействие с другими подразделениями при решении проблем, требующих объединения усилий [1]. Особый интерес представляют конфликтные ситуации между различными уровнями управления при выборе наилучших стратегий и планов достижения общей цели с учетом локальных интересов отдельных звеньев. Это породило для науки управления новое направление - исследование процесса взаимодействия агентов в интеллектуальных организациях при решении сложных слабоструктурированных проблем в условиях неопределенности внешней среды. Его предметной областью стало исследование принципов и механизмов принятия решений взаимодействующими агентами на основе их субъективных представлений о ситуации выбора, их структуры предпочтений и этической системы (духовно-нравственной составляющей), как самих себя, так контрагентов и индивидуального и совместного поведения при решении проблем.
Разрешение конфликтов между различными уровнями иерархии в организации во все большей степени требует использования различных форм организации компромиссного переговорного процесса, учитывающего интересы агентов для определения возможной области согласованных решений. Для слабоструктурированных проблем при формировании согласованных решений его особенность состоит в:
1) невозможности четко сформулировать задачу и способы ее решения;
2) отсутствии меры успеха результата, ее заменяют экспертные оценки или интуиция лица, принимающего решения (ЛПР).
Такие проблемы, как правило, требуют итеративного процесса принятия решения и не всегда имеют известные альтернативные способы решения. Их приходится определять в процессе принятия решения [2, 4]. При этом невозможно игнорировать субъективные, личностные, психологические и духовно-нравственные аспекты процесса принятия решений [38].
Второй фактор, обуславливающий необходимость переговоров, - это неопределенность. Она связана с тем, что агенты могут сформировать лишь приближенное представление о предметной области, а значит, они не могут с большой степенью уверенности гарантировать наступление желаемых состояний (результатов) и требуемых для этого затрат. Часто агенты даже не имеют точного представления о своих реальных целях [3, 4]. Поэтому переговоры часто рассматриваются участниками как один из способов снятия неопределенности или, по крайней мере, ее снижения.
Постановка задачи
Цель данной работы заключается в теоретико-игровом анализе моделей переговоров и разработке алгоритмов проведения рациональных переговоров при решении задачи формирования согласованного плана для высокотехнологичного производства. Объектом исследования являются последовательные переговоры,
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
использующие арбитражные процедуры, учитывающие аспекты влияния репутации сторон на окончательное решение переговоров, а также вопросы устойчивой реализации достигнутых соглашений. Использование игровых моделей в переговорных процессах позволяют: во-первых, более обоснованно выбирать стратегию переговорного процесса, выстраивая его на принципах рациональности и полезности; во-вторых, применение результатов теории игр, теории многоагентных систем, Опё-технологий позволяют выработать так называемые идеальные модели поведения в переговорном процессе. В литературе, посвященной рефлексивному управлению, такие модели получили название «стратегемы» [11].
Для обоснования этого подхода рассмотрим состояние вопроса в этой предметной области.
Современные исследователи в области переговорного процесса акцентируют внимание на разных его сторонах и по-разному определяют понятие переговоры. Одни из них видят в переговорах стремление к консенсусу, взаимопониманию и эффективному сотрудничеству [5]. Другие склонны рассматривать переговоры как средство преодоления конфликта [6-8]. Они считают, что результатом переговоров является выработка некоторого решения, устраивающего в той или иной степени все участвующие стороны. Ряд исследователей полагают, что во время переговоров создается новая реальность, понимаемая как некоторое желаемое состояние предметной области и рассматриваемая как цель. Кроме того, под воздействием обмена информацией происходит трансформация моделей поведения участников, направленная, как правило, на их выравнивание и на согласование представлений о ситуации выбора [9, 10], поскольку каждый участник переговоров оказывает влияние на другого и наоборот.
В производственных системах главным в переговорах является решение проблемы. Хотя на решение проблемы оказывают влияние отношения между сторонами, возможности и притязания сторон, личные интересы, отличные от интересов команды, эффективность внутри групповых дискуссий при нахождении консенсуса и т.п., тем не менее, переговоры следует рассматривать, как умение следовать своим интересам вместе с осознанием неизбежности взаимозависимости. Более того, переговоры даже увеличивают значимость взаимозависимости в том смысле, что люди осознают, как с ее помощью можно получить преимущество. То есть переговоры можно рассматривать как познавательный процесс и последовательное обучение.
Этот анализ ряда сложившихся в науке, посвященной исследованию переговорного процесса, подходов позволяют сформулировать следующее определение понятия переговоров в организационных системах.
Переговоры в организационных системах представляют собой коммуникативное взаимодействие нескольких взаимозависимых сторон, имеющих определенные общие цели, для достижения которых они обмениваются в течение определенного промежутка времени информацией для согласования представлений о состоянии предметной области и своих позиций, а также предложениями, которые следует рассматривать как варианты способов
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
действия в ситуации выбора, для совместного принятия решения, оформленного в определенной письменной форме, например, протоколом.
Основные функции переговоров в организационных системах состоят в следующем:
1) решение проблем;
2) выявление и согласование позиций и представлений о ситуации выбора;
3) поиск согласованного способа действия при решении задач;
4) определение формы организации и контроля совместной деятельности при реализации согласованных решений.
В основу пригодной для практики модели переговорного процесса положены два основных типа общественного поведения:
- первый тип: «сотрудничество - борьба»;
- второй тип: «развертывание - уклонение».
Взаимозависимость - структурный фактор, на котором базируются два этих основных типа поведения. Использование одного из типов поведения неизбежно, и зависит от природы взаимозависимости, даже скорее от сбалансированности сил между сторонами переговоров. Оба эти типа в комплексе предлагают возможные способы оперирования различными формами взаимозависимости. Первый тип координирует и интегрирует наиболее важные переговорные дилеммы с видами деятельности в переговорах. Второй тип относится к фазам в процессе переговоров и процедурам, которые могут быть использованы сторонами.
На результативность переговоров очень сильно влияют субъективные факторы. Важно понимать подоплеку того или иного поведения участников для формирования соответствующего информационного и иного управляющего воздействия. Традиционно это является предметом исследования теории организационного поведения. Рассматриваемые ниже положения выработаны на основе результатов, приведенных в работе [12].
Мотивационно-целевая направленность - свойство личности, которое в качестве устойчивых доминирующих мотивов, связанных с целями и обязательствами и относительно независимых от наличных ситуаций, определяет характер поступков человека.
К мотивирующим факторам относятся:
1) потребности как источники активности (почему человек стал проявлять активность);
2) собственно мотивы, имеющие смысловое значение причины, определяющие выбор направленности и характера поведения (ради чего произведен выбор каких-либо действий и почему действия были направлены на данный объект);
3) установки как способы регуляции динамики поведения (каким образом осуществляется регуляция динамики активности человека).
Потребности рассматриваются как необходимость разрешения сложившегося и развивающегося противоречия между необходимым (удовлетворяющим, внутренне комфортным) состоянием человека и реально
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
существующим, которое ощущается или осознается им как неудовлетворенность, страдание, беспокойство, дискомфорт и в то же время как психическое напряжение, которое образует исходное побуждение к действию.
Реализации потребностей предшествует поисковое поведение - поиск определенных способов действий и предметов удовлетворения потребности. В своем развитии потребности могут превратиться в склонность. Собственно мотив, как осознанное внутреннее побуждение человека и имеющее для него смысловое значение причины того или иного поведения, связаны с самосознанием и мировоззрением человека (взглядами, убеждениями, идеалами, ценностными ориентациями). Понятно, что вся совокупность внешних воздействий на человека - от среды и условий существования до целенаправленного принуждения во многом определяют его поведение. Но именно его мотивация способна не только максимально раскрыть и реализовать потенциал личности, но также усилить или ослабить вплоть до полной компенсации внешнее воздействие на человека.
Мотив, таким образом, - это внутренняя осознанная побудительная сила, толкающая агента на определенные действия или высказывания в целях удовлетворения актуализированной потребности. Поэтому объяснение причин, побудивших агента к выбору данного типа действия, осуществляется посредством мотивировки. С помощью мотивировки он и сам оправдывает свои действия и поступки, приводя их в соответствие с требуемыми нормами поведения в различных ситуациях, а также со своими собственными убеждениями.
В каждый конкретный момент агент стремится, прежде всего, удовлетворить те потребности, которые наименее удовлетворены, и создать наиболее благоприятные условия для удовлетворения будущих потребностей. Общая совокупность побуждений, вызывающих активность агента и определяющих его направленность, образует мотивационную сферу. Надо учитывать, что формирование и развитие мотивации имеет ряд характерных особенностей.
Во-первых, мотивы по своей сложности и принадлежности к потребностям имеют несколько уровней. Заменить мотивацию одного уровня мотивацией другого невозможно, хотя в рамках одного уровня определенная взаимозаменяемость присутствует. Процесс развития мотивации осуществляется в направлении от удовлетворения низших потребностей к высшим.
Во-вторых, при невозможности удовлетворить потребности более высокого порядка развитие мотивации может осуществляться регрессивно (при этом наступает состояние фрустрации - досада, дискомфорт, напряженность, -сопровождающееся либо агрессией, которая может быть направлена как на других, так и на себя, либо снижением ценности недосягаемого объекта) или замещаться другим «равным» мотивом.
В-третьих, развитие высших мотивов в принципе беспредельно, однако низшие мотивы могут сравнительно долго оставаться на первом плане, так как человеку свойственно стремиться к сохранению уже достигнутых форм
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
жизнедеятельности, фиксированного уровня потребления и отвергать неопределенность в качестве нормального состояния.
В-четвертых, мотивы развиваются в постоянном сравнении, как идет процесс удовлетворения насущных потребностей у соседей, знакомых и других людей.
В конечном счете, наибольшее значение для проявления активности человеком имеет мотив достижения, который представляет собой устойчивое стремление к достижению высокого результата. Основу мотива достижения составляют: потребность в самореализации; понимание необходимости решения задачи и возможности успешного достижения намеченной цели; установка на обязательное личное участие в осуществлении данных действий; ожидания в отношении получения запланированных результатов при определенных затратах, в отношении получения определенного вознаграждения за определенные результаты, в отношении ценности (справедливости) вознаграждения (как правило, человека интересует не абсолютный уровень его награды, а в соотнесении с тем, какой вклад вносят и какое вознаграждение получают другие люди). Мотив достижения связан с ориентацией на свой внутренний стандарт качества и может проявляться как стремление к успеху или как стремление избежать неудачи.
При принятии агентом решения о способе действия им, как правило, движут два вида мотивов: обобщенные, придающие действиям определенный смысл, и частные, узкие, непосредственно побуждающие к действию, но не меняющие смысла деятельности (мотивы-стимулы). Действия, лишенные обобщенного мотива, психологически тягостны для человека. Отсутствие мотивов-стимулов не порождает необходимой активности в данный момент. Оптимальное сочетание мотивов-стимулов и широких, обобщенных мотивов обеспечивает надежность, устойчивость поведения человека в любых условиях в соответствии с поставленными целями.
Под самосознанием понимается устойчивая и переживаемая как неповторимая система представлений человека о самом себе (своих достоинствах, заслугах, недостатках, социальной значимости и др.), на основе которой он строит отношение к самому себе и избирает ту или иную линию поведения. Самосознание включает в себя представления о том, каким является человек в данный момент времени; представления о том, каким он себя видит в ближайшей и отдаленной перспективе, исходя из реально сложившейся обстановки; представления о том, каким он хотел бы стать в идеале. Все эти представления касаются Я-физического, Я-интеллектуального, Я-профессионального и др. Реальное и идеальное Я могут не совпадать между собой, что приводит как к позитивным последствиям (стремлению к самосовершенствованию), так и к негативным (появлению внутриличностных конфликтов, ведущих в пределе к срыву адаптационных возможностей личности). Субъект в организации должен чувствовать, что отношение к нему обязательно обернется для него ростом самоуважения.
Ядром самосознания является самоуважение человека. Низкое самоуважение личности может выражаться: в высокой степени развития
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
пассивных форм психологической защиты; в нетерпимом отношении к критике, юмору; в склонности к самообману, боязни правды; в конформистских реакциях; в занижении своих возможностей, самоуничижении; в опасении, что окружающие все время насмехаются над ним; в агрессивном поведении; в перекладывании ответственности на других; в трудностях с осознанием, что он не совершает хорошие поступки, так как считает себя неспособным к ним и т.д.
Если самооценка агента не найдет опоры в данной системе и будет заблокирована реализация одной из базовых потребностей человека -потребность в уважении, то может развиться резкое ощущение личностного дискомфорта, неприязнь к организации, желание найти ту организацию, в которой будет получена необходимая для повышения самоуважения оценка. Высокое самоуважение связано с уверенными действиями, со стремлением любого сотрудника брать ответственность на себя и т.п.
Самосознание человека непосредственно связано с его мировоззрением. Мировоззрение человека включает в себя три взаимно переплетенных представления о мире: обыденное (житейское), которое отражает представления здравого смысла; религиозное, основанное на вере, на необходимости соблюдения определенных заповедей; научное, создающее рациональную картину мира и определяющее в нем место конкретного человека. Такой смешанный характер представлений о мире влияет на постановку целей в ходе планирования и разработку стратегий поведения.
Убеждения человека представляют собой твердые позиции, устоявшиеся взгляды, основанные на осознании собственной правоты, овладевшие чувствами и волей и ставшие потребностью, побуждающей действовать в соответствии с заложенными в них ценностями. По степени приверженности человека определенным убеждениям последние могут принимать форму фанатизма, готовности к жертвам ради идеи. Преданность идее, как правило, сочетается с нетерпимостью к инакомыслящим, повышенной эмоциональностью, некритическим отношением к любой информации, несвязанной с подтверждением идеи.
Убеждения непосредственно связаны с ценностями личности. Ценности отражают положительную и отрицательную значимость явлений окружающего мира для человека, его потребностей и интересов, а ценностные ориентации-предпочтения человека, избирательное отношение к ценностям.
К универсальным ценностям человека относятся: любовь, семья, престиж, уважение, дружба, компетентность, деньги, вещи, свобода, здоровье, долг, честь и достоинство, ответственность, принадлежность к роду, классу, нации, работа. Причем для большинства женщин характерна ориентация на терминальные (базовые) ценности (семья, доверительные супружеские отношения, дом и т.д.), для мужчин - ориентация на инструментальные ценности, связанные с самореализацией и самоутверждением (творчество, профессиональная компетентность, наличие престижных вещей и т.п.).
Следует учитывать, что у агента могут быть сформированы прочные предубеждения, препятствующие адекватному восприятию информации. Особенностью предубеждений является то, что человек не осознает, что он
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
предубежден. Наименее эффективным воздействием на агента будет прямое отрицание его предубеждений. И, наоборот, мягкое формирование новых взглядов, убеждений (без затрагивания сложившихся предубеждений) может оказать решающее влияние на принятие агентом необходимого решения.
Установки как способы регуляции динамики поведения человека не менее важны при изучении мотивации агента. Установки представляют собой особый момент, предвосхищение человеком целей и задач, занятую им позицию, которая заключается в определенном отношении к этим целям и задачам и выражается в избирательной мобилизованности и готовности к деятельности, направленной на их достижение. Поэтому важно формировать у агентов позитивные установки, в основе которых лежит положительное отношение к организации.
В зависимости от того, с какой составной частью деятельности агента в организации связана установка (мотив, цель, действия и операции), выделяются смысловые, целевые и операциональные установки.
Смысловая установка выражает проявляющееся в деятельности агента отношение к целям системы, обсуждаемым вопросам, нормам взаимоотношений между агентом и организацией, способам решения поставленных задач. В структуру установок, связанных с готовностью агента прикладывать усилия, входят: установка на обязательное достижение поставленной цели; установка на полную реализацию ожиданий от своей деятельности; установка на улучшение предлагаемых условий по сравнению с прошлыми условиями или условиями, предлагаемыми другими организациями и др.
Целевые установки вызываются задачей при выполнении производственных обязанностей и определяют устойчиво направленный характер протекания действий и общения агента. В случае прерывания действия целевые установки проявляются в виде динамических тенденций к завершению прерванного действия, которые могут сопровождаться негативными эмоциями. Поэтому не только не следует перебивать агента, когда он высказывает свои пожелания по поводу того, что хотел бы получить от организации, но и необходимо интересоваться деталями.
Операциональные установки реализуются в определенной преднастройке органов чувств и моторной области, что повышает результативность начала тех или иных способов осуществления действия.
Цели являются идеальным представлением результата и, как правило, определяют способ и характер деятельности человека. Порождение целей может быть произвольным и непроизвольным. Среди механизмов целеобразования наиболее часто встречаются: планомерное формирование цели; превращение неожиданно полученной информации в цель; преобразование неосознанных предвосхищений в цель; выделение промежуточных целей; переход от предварительных к окончательным целям и др. Действие механизма целеобразования зависит от сложившейся ситуации и индивидуальных особенностей человека.
Таким образом, модели переговорных процессов тогда будут востребованы, когда в них кроме формальных оценок и расчетов будут
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
учитываться личные качества участников переговоров: их интеллект, субъективные оценки, умение находить решение и т.д. Это связано с тем, что на решение агента основное влияние оказывает его субъективные представления о ситуации выбора и те выводы, которые он на их основе делает. Естественно, что в предложенных вариантах решений он должен видеть их возможно полный учет. Использование средств вычислительной техники должно сочетать оценки и решения, полученные формальными методами, с субъективными оценками, сделанными на основе знаний, опыта и интуиции.
Поскольку решение вырабатывается на основе, как имеющейся объективной информации, так и субъективных представлений, интересов, целей, предпочтений участников переговоров, то процесс переговоров должен позволять осуществлять переход от начальных точек зрения путем информационных воздействий к единому коллективному мнению, с которым согласны участники переговоров и на основе которого вырабатывается согласованное групповое решение.
Необходимость решения задач управления поведением агентов в переговорном процессе обуславливает актуальность разработки адекватной концепция моделирования их поведения и построения соответствующего механизма функционирования переговорного процесса, что предполагает наличие модели поведения людей в организационной системе. Основой построения таких моделей является гипотеза, что с психологической точки зрения мозг имеет несколько уровней обработки информации [13, 14]. В соответствии с этой гипотезой модель поведения субъекта (агента) должна включать:
- 1-й уровень. Окружение и контекст: это некоторая совокупность параметров, которую определяет агент и относительно которых он уверен, что обладает достаточной информацией для правильного понимания процессов, протекающих в конкретной предметной области (неявное индивидуальное абстрагирование вследствие фильтров на уровне подсознания и явное вследствие опыта и знаний);
- 2-й уровень. Поведение: набор способов действия, относительно которых агент уверен, что они гарантируют получение результатов с требуемыми свойствами в различных сферах: духовной, материальной и т.п., в ситуациях с приблизительным совпадением значений параметров-характеристик среды;
- 3-й уровень. Способности и свойства: интеллектуальные, когнитивные, лингвистические, поведенческие, позволяющие агенту вырабатывать представления определенного «качества» об окружении, формировать множество способов действия, принципы и методы принятия решений;
- 4-й уровень. Потребности, ценности (духовные и материальные) и убеждения, то есть все то, что определяет значимость потребностей как мотивов, значения свойств желаемых состояний, критерии оценки ценности возможных результатов от способов действия, их шкалы и конкретные значения в ситуациях выбора.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
- 5-й уровень. Идентификация своей позиции: коммунист, демократ, предприниматель, должностное лицо, семьянин. Это набор параметров, определяющих принадлежность агента к определенной группе. Они позволяют определить набор обязательств, которые принимает агент в соответствии с моделью поведения группы;
- 6-й уровень. Духовность. Она определяет этическую составляющую в модели выбора, способ взаимодействия между агентами, в том числе и коммуникативного, например, любовь и ненависть. Духовность влияет на сходимость при согласовании интересов враждующих, сотрудничающих, соревнующихся, конкурирующих и «безразличных» сторон, доводя их либо до конфликта, либо до компромисса, либо до понимания необходимости объединения усилий для достижения общей цели. Основу этической системы составляют понятия добра и зла и их интерпретация агентом.
Эта многоуровневая модель целеустремленного поведения может быть формализована с помощью: методов правдоподобных рассуждений и индуктивной логики в расплывчатых условиях; понятий нечеткая и лингвистическая переменная, вероятность; измерение значений переменной вероятность в абсолютной шкале с нечувствительностью с помощью интерактивных методов; определение значений переменной вероятность в зоне нечувствительности; измерение функции принадлежности оценки в зоне нечувствительности нечеткой переменной вероятность в шкале порядка (методы экспертных оценок, метод фокус - групп и т.д.); формулы Байеса для нечетких условий.
Приведенные рассуждения позволяют выделить следующие составляющие механизма принятия решения агентами, от которых зависит его поведение (рис. 1).
Информация Способы действия
Духовность
Миссия
Способности, опыт, знания, компетентность
Методы принятия решений
Ценности, потребности
Рис. 1. Основные составляющие механизма принятия решения агентами
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Рефлексивные процессы принятия решений в рамках постнеклассической рациональности
Поведение человека является результатом его когнитивной деятельности, которая придает ему целенаправленность. Характер поведения зависит от отношения человека к наблюдаемым процессам и явлениям, выражающийся в ценностных оценках различного рода. В психологии когнитивная деятельность рассматривается как рефлексивный процесс формирования мысленного образа (результата восприятия) и рефлексивной модели познаваемых и анализируемых объектов, процессов, явлений. В соответствии со сформированной моделью, исходя из фиксированных в сознании установок, правил, обычаев, прошлого жизненного опыта, знаний вырабатывается отношение к рефлексии. Затем в зависимости от этого отношения и рефлексивных оценок степени адекватности объекту результата мысленного отображения и анализа субъект формирует свое поведение, вырабатывая программу действий своего участия (или различной степени участия вплоть до полного неучастия) в событиях, процессах, явлениях, которые он считает важными для себя. Следовательно, один из возможных вариантов преодоления недостатков традиционных способов описания поведения агентов является модификация моделей рационального поведения путем включения в них рефлексивных переменных, которые являются характеристиками поведения человека, используемыми в психологии, социологии и т.п.
Рефлексивные процессы принятие интуитивных решений в рамках постнеклассической рациональности предполагает использование агентом позиции «наблюдателя», «исследователя» или «контролера» по отношению к своему телу, своим действиям, своим мыслям. Они основаны на способности каждого агента занять позицию исследователя по отношению к другому «персонажу», его действиям и мыслям. Технология рефлексии использует интуицию, интуитивные идеи, оценки и решения, образное мышление [13]. Для построения рефлексивных процессов принятие интуитивных решений целесообразно использовать:
- модели поведения НЛП ТОТЕ и SCORE [14];
- технологию обработки нечеткой информации в системах принятия решений [15];
- модель постоянного обновления и согласования знаний в интеллектуальных организациях [16];
- интерактивные навыки решения проблем в понятиях согласия группы;
- креативные процессы группы принятия решений;
- согласование представлений агентов в интеллектуальных многоагентных системах [17].
Теоретико-игровое моделирование рефлексивного моделирования
переговорного процесса
Переговоры в сложных системах, включающих в себя подсистемы, обладающие свойствами автономности и активности [19], следует рассматривать как совокупность взаимодействующих участников, находящихся
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
под общим управлением, где руководитель выступает, как правило, и как участник и в роли арбитра.
В переговорном процессе участники при формировании согласованного решения обмениваются информационными сообщениями, поэтому ситуация принятия решения является интерактивной. При этом существенны не только представления (beliefs) агентов о параметрах ситуации выбора, но и их представления о представлениях других агентов и т.д. Совокупность этих представлений у агента образует иерархию представлений (hierarchy beliefs). Следовательно, цель обмена сообщениями связана с воздействием на иерархию представлений, которое следует рассматривать как информационное управление. В этом процессе формирование взаимодействующими сторонами линии своего поведения происходит на основе взаимного моделирования состояния и возможных вариантов поведения контрагентов. Формально это означает, что в целевую функцию каждого агента входят действия других агентов и эти действия являются частью внешней среды. В теории управления такой процесс называется рефлексией [9].
Трансрефлексия предполагает наличие у агента представлений о представлениях у оппонента и их представлений о нем и т.д. [18]. Это означает, что у каждого агента имеется не только представление о предметной области, но и представление о моделях-представлениях у других агентов, а также его представление об их представлениях о нем самом. Стремление к уточнению и выравниванию моделей-представлений является мотивацией к общению (переговорам). Оно направлено на лучшую предсказуемость поведения оппонентов и дано нам в инстинктах. Это выражение действия гипотезы детерминизма, когда агенты путем общения прилагают усилия для снятия неопределенности. Отсюда слова «договорились, по рукам» и т.п. в противном случае снятие неопределенности осуществляется силовым путем: «нет человека, нет и проблем».
В переговорном процессе в наукоемкой организации агенты стремятся подтвердить свою квалификацию и внести свой вклад в согласованное решение. Поэтому для агентов переговорного процесса характерна особая форма теоретической деятельности, направленная на осмысление:
1) свойств, процессов и законов протекания процессов предметной области;
2) способов своих собственных действий при различных ее состояниях.
В процессе этой деятельности раскрывается ценностная структура предпочтений и духовно-нравственный мир агентов. Такая форма рефлексии называется авторефлексией или рефлексией первого рода [18].
Авторефлексия является существенной тогда, когда агент действует в условиях риска и неопределенности, и стремится максимизировать свою целевую функцию, выбирая одно из этически допустимых действий. В этом случае объективная реальность входит в его модель выбора через ее субъективное описание доступными для агента средствами как некий параметр. Тогда результаты принятого решения будут определяться «качеством» субъективного описания действительности. Результат авторефлексии позволяет
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
изменить действия, выбираемые агентом тогда, когда им будет выявлено и осознано несовпадение его представлений о реальности с ее фактическим состоянием. Соответствующий ее алгоритм для интеллектуального агента в наукоемком производстве будет рассмотрен ниже.
Для формальной характеристики взаимной рефлексии участников переговорного процесса будем использовать понятие «ранг рефлексии» [18]. Для этого введем предположения:
1. Структура организации переговорного процесса в наукоемком производстве имеет два уровня: центр (агент-лидер) и п подчиненные ему агенты-участники.
2. Для агентов-участников выполняется гипотеза благожелательности их по отношению к центру. То есть они считают, что деятельность центра направлена на такое развитее организации, которое увеличивает их благополучие. Тогда можно считать, что агенты-участники ограничиваются первым рангом рефлексии, то есть они в своем поведении в переговорном процессе руководствуется гарантированными (минимаксными) стратегиями. Следовательно, агент-участник выбирает из всех возможных вариантов информационного управления центра наихудший для себя и применительно к нему ведет себя наилучшим образом.
3. Относительно друг друга у агентов имеет место рефлексия второго рода относительно представлений о реальности, принципах принятия решений, авторефлексия вследствие их взаимозависимости. То есть каждый агент А строит свое поведение, предполагая, что агент В имеет первый ранг рефлексии. При этом агенты-участники стремятся к ситуации общего знания путем взятия на себя обязательств, способствующих росту эффективности согласованного решения и созданием обстановки взаимного доверия за счет предъявления моделей поведения друг другу.
4. Поскольку деятельность агентов направлена на максимизацию своей целевой функции, что возможно только при условии максимизации суммарного эффекта всех, то предполагается, что рациональность игроков, то есть следование их гипотезе рационального поведения, является общим знанием.
5. Организационная система создается для достижения некоторой цели. У агентов, как элементов коллектива имеются собственные и общие интересы. Взаимозависимость агентов координирует интересы коллектива агентов и индивидуальные интересы каждого агента на основе принципом запрета эгоизма: каждый субъект, преследуя свои личные цели, не может наносить ущерб коллективу как целому не навредя самому себе.
Тогда при рефлексивном управлении переговорного процесса центр должен стремиться к тому, чтобы путем информационного воздействия заставить (принудить) агентов действовать так, как это выгодно организации в целом, учитывая их интересы. То есть путем передачи агентам-участникам
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
информации, которая принуждает их выбрать стратегию своего поведения (программу действий на некоторую перспективу), выгодную для него и для них. В этом смысле говорят: центр мотивирует поведение агентов. С этой целью центр должен:
а) уяснить потребности и интересы агентов, то есть понять мотивы, определяющие их решения и поступки;
б) узнать (обычно путем проведения комплекса предварительных мероприятий) возможные варианты действий агентов, их конкретные цели и намерения, способы их достижения, ресурсные и коммуникационные возможности, а также внешние ограничивающие факторы;
в) принять (опираясь на эти данные и данные маркетинговых исследований поведения агентов внешней среды) решение относительно собственного поведения и на этой основе рассчитать выгодную для себя нормативную стратегию поведения агентов-участников;
г) передать агентам-участникам данные о состоянии организации, внешней среды, своих намерениях, возможных выигрышах организации в целом и каждого агента в частности, которые побудят их выбрать стратегию поведения, выгодную для центра.
Для взаимной рефлексии характерна неопределенность результатов управления. Агент может не принять или не понять сигналы от центра или, что намного хуже, поняв их и их значение, реагировать на них в своих интересах. Для парирования неопределенности необходимо иметь возможность путем моделирования определять варианты поведения агентов, оценивать ранг их рефлексии агента и свой риск. Ниже рассматривается вариант такой модели, в которой отражено субъективное понимание агентом своих интересов и его понимание ситуации выбора.
Выбор стратегии агентов зависит от индивидуальной оценки ситуации и последствий конфликта, ресурсных ограничений и цены риска; статуса оппонента и значимости того или иного исхода противоречия для субъекта конфликта. Ход переговоров в производственных системах определяется соотношением факторов силы и отношениями зависимости между вовлеченными в переговоры сторонами. Стороны могут быть взаимозависимы не в равной степени, но в процессе переговоров может быть достигнуто некоторое силовое равновесие. Когда различия в силе слишком очевидны, то и поведение сторон отличает манипуляции и эксплуатация с одной стороны, и покорность и недовольство с другой. Определенный баланс сил и осознание того, что стороны нуждаются друг в друге, так как удовлетворить свои потребности субъект производства на желаемом уровне может только при эффективной работе всех. Этот факт можно рассматривать как необходимое условие для конструктивных переговоров.
Теоретико-игровая модель переговорного процесса [9]. Переговорный процесс задается набором параметров, описывающих:
1) множество агентов - участников переговорного процесса;
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
2) предпочтения агентов (зависимостей выигрышей от действий): при этом предполагается (и этим отражается целенаправленность поведения), что каждый агент заинтересован в максимизации своего выигрыша (правило индивидуального рационального выбора);
3) множества допустимых действий агентов;
4) информированность агентов (той информации, которой они обладают на момент принятия решений о выбираемых действиях);
5) порядок функционирования (последовательность выбора действий).
Множество агентов определяет участников игры. Предпочтения
отражают, что хотят агенты, множества допустимых действий - что они могут, информированность - что они знают, а порядок функционирования - как и когда они выбирают действия.
Для описания коллективного поведения агентов в переговорном процессе необходимо учитывать их взаимное влияние: в этом случае возникает игра -взаимодействие, в котором выигрыш каждого агента зависит как от его собственного действия, так и от действий других агентов. Отметим, что переговоры должны привести к разумному соглашению.
Разумным соглашением считается такое, которое максимально отвечает интересам каждой из сторон, справедливо регулирует сталкивающиеся интересы, является долговременным, принимает во внимание интересы производственного персонала и центра.
Для моделирования взаимодействия между n агентами в процессе переговоров предположим, что каждый агент осуществляет выбор действия xi, принадлежащего допустимому множеству X, ieN={1, 2, ..., n}.
Выигрыш i-го агента зависит от его собственного действия xieXi, от вектора действий
X-i = (xi, Х2, ... , Xj_i, Xi+1, ... , Xn) E-X-i e ^ Xj ,
jeN/{i}
оппонентов jeN/{i} и от состояния природы 6eW, и описывается функцией выигрыша
fi=f (6, x), где x=(xi, x_i)=(xi, Х2, ..., Xn)eX' = ^Xj
jeN
- вектор действий всех агентов.
Решением игры (равновесием) называется множество устойчивых в том или ином смысле векторов действий агентов, удовлетворяющему условию разумности.
В силу гипотезы рационального поведения каждый агент будет стремиться выбрать наилучшие для него (с точки зрения значения его целевой функции) действия при заданной обстановке. Обстановкой для него будет совокупность обстановки игры x_ieX_i и состояния природы 6eW. Следовательно, принцип принятия им решения о выбираемом действии можно записать следующим образом (BR обозначает наилучший ответ - best response): BRi(Q, x_i) = arg maxf (6, Xi, x_i), i eN, XieXi. (1)
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Так как для агентов переговорного процесса множество (1) зависит от обстановки, то можно определить многозначное отображение BR(0, x) = (BRi(0, x_i); BR2(Q, x.2), ..., BRn(Q, x.n)).
Если при состоянии природы 0 существует точка x*(0)e^", удовлетворяющая условию:
x*(0) е BR(0, x*(0)), (2)
то исход игры является равновесием Нэша.
Выражение (2) можно также записать в виде: "ieN, "яеХь/(0, x*(0)) >f (0, y, x-* (0)).
Множество EN(0) всех точек вида (2) можно также описать следующим образом:
EN(0) = {x eX' | xi eBRi(0, x-i), ieN}.
Поскольку вектор действий агентов, каждая компонента которого является наилучшим ответом соответствующего агента на ту обстановку игры, которая может реализоваться с его субъективной точки зрения, то рассмотрим возможные случаи.
Предположим, что i-й агент формирует субъективное представление об обстановки игры ("B" обозначает beliefs; аналоги - это термины
«предположение», «догадка» - conjecture) и состоянии природы 0, тогда он выберет
xB е BR (00, 0 ), i е N .
Вектор xB является точечным субъективным равновесием.
Отметим, что при таком определении «равновесия» отсутствует обоснованность предположений агентов о действиях оппонентов, и может оказаться, что е N : x€_i ф xB_i. Обоснованное субъективное равновесие будет в том случае, когда выполняется €Bi = xEBi, i е N. Тогда оно является равновесием Нэша (для этого, в частности, достаточно, чтобы все параметры игры были общим знанием, и чтобы каждый агент при построении моделировал рациональное поведение оппонентов).
В более общем случае i-й агент может рассчитывать на выбор оппонентами действий из множества X_i ç X_i и реализацию состояния природы из множества Wi çW, i е N. Тогда наилучшим ответом будет гарантирующее субъективное равновесие:
xt (X_B1, Qi ) е Arg max min min f (0, xt, x_г ), i е N.
x_, еX0е^.
Если XB = X_t и Qг = Q, i е N, то x,. (XB, Qг ) = xf, i е N, то гарантирующее субъективное равновесие становится «классическим» гарантирующим равновесием. Таким образом, для реализации субъективного равновесия требуется минимальная информированность агентов - каждый из них должен знать свою целевую функцию f(^) и допустимые множества Q и X'. Однако при такой информированности совокупность предположений агентов о
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
состоянии природы и о поведении оппонентов могут быть несогласованными. Для достижения согласованности, необходимо дополнительное предположение о взаимной информированности агентов. Наиболее сильным является предположение об общем знании, которое превращает субъективное точечное равновесие в равновесие Нэша. Ниже будет показано, что выполнение этого условия предполагает использования интерактивного взаимодействия участников переговорного процесса по специальным итерационным схемам. Они должны быть построены так, чтобы на каждом шаге игры взаимная информированность участников переговоров возрастала. При этом представления агента о неопределенных факторах соответствует информационной рефлексии, а представления о принципах принятия решений -стратегической рефлексии. В терминах субъективного равновесия стратегической рефлексии соответствуют предположения агента о том, как оппонент будет вычислять субъективное гарантирующее равновесие, а информационной рефлексии - какие конкретные предположения об обстановке будет использовать его оппонент.
Различают два подхода к описанию информированности -синтаксический и семантический («синтактика - синтаксис знаковых систем -это структура сочетания знаков, правил их образования и преобразования безотносительно к значениям и функциям знаковых систем», «семантика -изучает знаковые систем как средства выражения смысла, основной ее предмет представляют интерпретации знаков и знакосочетаний»). Основы этих подходов были заложены в математической логике.
При синтаксическом подходе иерархия представлений описывается в явном виде путем использования «формул» (в логическом смысле), то есть правил преобразования элементов исходного множества на основе применения логических операций и операторов. При этом знание моделируется предложениями (формулами), конструируемыми в соответствии с определенными синтаксическими правилами.
В рамках семантического подхода представления агентов задаются распределениями вероятностей на множестве состояний природы. Иерархия представлений при этом порождается исходя только из этих распределений. В простейшем детерминированном случае знание представляется множеством О возможных значений неопределенного параметра и разбиениями {Рг}ге^ этого множества. Элемент разбиения Р, включающий 0еО, представляет собой знание 1-го агента - множество значений неопределенного параметра, неразличимых с его точки зрения при известном факте 0. Следовательно, информационные воздействия должны быть направлены на изменение информационной и стратегической рефлексии.
Феноменологическая модель. При моделировании процесса рефлексивного управления будем исходить из того, что исследователю, предпринимающему попытку такого описания, доступны (пусть и не в полном объеме) характеристики рефлексирующих сторон и управляемого процесса (рис. 2). В ее основу положено представление центра, осуществляющего
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
рефлексивное управление, в виде трех функциональных подсистем. Одна подсистема моделирует себя, другая - моделирует механизм принятия решения агентами, третья - контролирует весь процесс и принимает решения. При таком представлении процесс рефлексивного управления, протекающий на некотором интервале времени [¿0, ¿4], расчленяется на этапы: [¿0, ¿1] - рефлексивный маркетинг; [¿1, ¿2] - мотивирование поведения агент; [¿2, ¿з] - контрольный маркетинг; [¿3, ¿4] - корректировка рефлексии.
Рис. 2. Феноменологическая модель рефлексивного управления
На этапе рефлексивного маркетинга центр определяет состояние управляемого процесса и добывает информацию о параметрах модели принятия решений агентом, влияющих на эффективность его поведения - ЭА. Устанавливает закон изменения этих параметров во времени. Конечная цель состоит в построении прогнозных моделей поведения агентов, которые экстраполируются на период [¿2, ¿4]. Они и используются для выбора стратегии рефлексивного управления.
После выбора стратегии на этапе [¿1, ¿2] центр передает агентам такую информацию, которая формирует у них модель ситуации выбора, выгодную центру. Если эта информация позволяет агентам определить выгодные для себя состояния, то они сами сформируют поведение, нужное центру. Результаты своего выбора они сообщают центру. Центр на основе этой информации определяет состояние системы в целом и отклонение этого состояния от желаемого. Если это отклонение невелико и прогнозируемые оценки эффективности ЭА не выходят за допустимый предел (ЭА>Э*), то на интервале [¿3, ¿4] реализуется стратегия, сформированная ранее с незначительными оперативными корректировками. Если же оценка ЭА выходит за допустимый предел (ЭА<Э*), то на основе полученных и дополнительных данных центр
Systems of Control, Communication and Security
sccs.intelgr.com
корректирует прогнозную модель поведения агентов и выбранные ранее управления (или выбирает новую стратегию).
В данной модели предполагается, что ранг рефлексии центра равен 2, а агентов - 1, и выполняется гипотеза благожелательности для агентов.
Если агенты также ведут рефлексивное управление, то для модельной имитации такого процесса поведения другой стороны описывается аналогичным алгоритмом, работа которого совмещается с алгоритмом функционирования центра.
В итоге получается процесс параллельного (совместного) функционирования двух алгоритмов, мысленная или компьютерная реализация которого позволяет «проиграть» различные варианты поведения сторон во всевозможных ситуациях взаимного управления и для различных соотношений рангов рефлексии.
На основе феноменологической модели разработана общая блок-схема алгоритма переговорного процесса (рис. 3). Она включает последовательность возможных операций, которые каждый i-й агент может выполнить в текущий момент переговорного процесса.
Процесс начинается с передачи agi предложения pri km всем другим участникам переговоров ag/, j=1,n; j^i, каждый из которых либо принимает его, либо отклоняет, либо анализирует и дает контрпредложение, либо выходит из переговоров. Если предложение prikm принято всеми агентами, процесс переговоров завершается с достижением согласия. В случае отклонения своего предложения агент agi имеет возможность: изменить отклоненное предложение prikm или подготовить новое предложение pri km+1 с направлением его агенту-лидеру и повторением описанных действий. Очередной раунд переговорного процесса заканчивается, если: достигается согласие; исчерпаны возможности выбора новых реальных предложений; принимается волевое решение.
Для принятия решения о согласии или отказе от очередного предложения i-го агента предлагается критерий согласия Psi в виде некоторого функционала, отражающего степень приближения характеристик и параметров zk текущего предложения к желаемому положительному исходу в допустимой области гибких ограничений:
Pi = П (1 - zg )
g=i
1 -Л wikz,2
ik ik k=1
i = 1, п; к = 1,т, (3)
где Zig - отклонение g-го фактора группы жестких ограничений, определяющих
о
неприемлемость предложения; z.k =——— - относительное отклонение к-го
i ЬхI
фактора в области гибких ограничений в оценке ^го агента; хк, х— -предлагаемое и желаемое значения к-го фактора; Ьхк - допустимое отклонение к-го фактора гибких ограничений от желаемого значения; Wjk - весовые коэффициенты отклонения к-го фактора задаваемые таблицей экспертных оценок.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Systems of Control, Communication and Security
sccs.intelgr.com
При условии £wk = 1 функционал (3) изменяется от 1 до 0, соответственно
к=1
от полного совпадения предлагаемого предложения с желаемым до полной неприемлемости и обращается в нуль при нарушении какого-либо жесткого ограничения, например, обмана при расчете.
Принятие предложения определяется пороговым значением функционала согласия в зависимости от принятой стратегии.
Модель принятия решений интеллектуальным агентом
Выработка стратегии переговорного процесса должно быть основано на понимании модели поведения контрагентов. Исходные посылки и рефлексивные модели поведения агента, которое определяется его субъективной рефлексией окружения в ситуации целеустремленного состояния, были сформулированы в [20]. Используемая в работе модель поведения агента может быть пояснена схемой, приведенной на рис. 4.
Целеустремленное поведение агента всегда связано с выбором, который происходит в ситуации целеустремленного состояния [21]. Агент с индексом к управляет предметной областью, в которой протекают процессы, подчиняющиеся объективным законам, по правилу ХхОх7®У, здесь X множество возможных значений воздействий хк, имеющих регулярную природу и хеХ. О - множество значений случайных возмущений X и £,еО. Агент испытывает на себе управление ик со стороны центра.
/
Среда /
/ I
XkîX /
\
XkîW
\
Обязательства, потреб-ности,мотивы, цели, информация
Uk —управление
xeX
Агент с номером kîN Wk: XkxQkxZk®Yk
1 1 CkîC г ь ZkîZk
Предметная область
W: XxQxZ®Y
f y®OkîOk
ykîYk
Рис 4. Модель принятия решений интеллектуальным агентом
Каждый агент рефлексирует среду, себя и других агентов индивидуально, интерпретируя все это по-своему, переводя их в субъективную реальность, которую следует рассматривать как форму представления бытия субъектом.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Рефлексия моделирует реальность, превращая ее в воображаемую реальность. Только у интеллектуальных агентов возникают реальности как субъективные формы представления бытия.
Субъективный образ целеустремленного состояния у агента складывается из следующих компонент:
- Рефлексивный образ самого себя, как субъекта, осуществляющего выбор (агент), к е К.
- Образ окружения выбора (5), под которым понимается образы множества элементов и их существенных свойств, изменение в любом из которых может стать причиной или продуцировать изменение состояния целеустремленного выбора. Первый тип элементов называется параметрами хкеХк, а второй - возмущениями £,ке^к. Индекс к показывает, что к-й агент выделяет из всего множества входных воздействий некоторое их подмножество, включая в него те параметры, которые он считает существенными.
- Образ возможных при окружении 5 результатов (существенных для агента) - о— е О— , i = 1, т. Рефлексивные оценки результатов производятся с помощью образа параметров, которые называются выходными параметрами ситуации целеустремленного состояния. Параметры результатов о— рассматриваемых агентом являются производными от формальных оценок его вклада в результаты организации _ук.
- Рефлексивные оценки свойств получаемых результатов в результате выбора способа действия (альтернативы). Рефлексивные оценки результата должны отражать интенсивность переживаемой агентом ценности результата тем самым отражать его индивидуальность.
- Образ доступных способов действий с— е С—, j = 1, п к-го агента,
которые могут быть использованы им для достижения ^го результата (их еще называют альтернативами). Каждый образ этого множества характеризуется набором параметров, которые называются управляющими воздействиями.
- Образ ограничений, отражающих представления агента требований, накладываемых ситуацией целеустремленного выбора на выходные переменные и управляющие воздействия.
- Образ ситуации принятия решения, который представляет собой множество соотношений, описывающих представляемую агентом зависимость управляющих воздействий, параметров и возмущений с выходными переменными. Модель представлений агента о ситуации целеустремленного выбора в общем виде описывается отображением Wk вида:
Щ: Х—хС—хПк®Ок. (4)
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Типы моделей в зависимости от вида отображения (4) рассматривались в работе [22].
Введем для описанных компонент меры, которые будут использоваться для оценки целеустремленного состояния.
1. Будем считать, что агент способен выделять факторы - характеристики окружения Хк ={ х—, i = 1, N}, существенные с его точки зрения. Множество
ХкхО,к агент разбивает на подмножества XI xQj, j = 1, пк, которые им рассматриваются как ситуации с схожими свойствами. Вклад каждого фактора в ^ю ситуацию агент оценивает с помощью лингвистической переменой степень влияния фактора т (х—): х— ® [0,1].
Будем предполагать, что для описания влияния выделенных факторов на результаты о— , i = 1, т агент использует аппроксимацию в виде продукционных правил, которые имеют вид:
Если х1 есть Лкг1 и если х2 есть Акг2 и ... и если XN есть Лкм, то
о— = /г хх2,...,XN), г = 1,Я, , (5)
где Я - количество продукционных правил, г - номер текущего продукционного правила, о— = (х1,х2,...,xN) - четкая функция, отражающая представление агента о функциональной связи входных факторов с возможными результатами для г-го правила (г-ая частная модель); Лкг1 -
нечеткие переменные, определенные на Хк = {х—, i = 1, N}.
Будем считать, что агент способен оценивать степень адекватности своих представлений о модели ситуации целеустремленного выбора и характеризует ее посредством таких выражений, как "очень верно", "совершенно верно", "более или менее верно", "ложно", "абсолютно ложно" и т.д.
2. Известные (доступные) агенту способы действий. Агент обладает способностью представлять ситуацию, если он обладает следующими способностями:
а) воспринимать и представлять внешние воздействия и формировать адекватный или неадекватный образ среды;
б) обладать априорной информацией о среде ("вложенной" при создании и накопленной), хранимой в виде образов среды;
в) обладать информацией о самом себе: своих свойствах и возможностях.
В результате сопоставления, распознавания и преобразования
информационных образов осуществляется формирование образов стратегий (способов действий), которые образуют образ поведения агента: воздействие на среду (функциональная деятельность) и воздействие на себя (функциональная морфологическая деятельность).
Назовем набор предположений об их возможных значениях сценарием возможного состояния внешней среды, функциональных возможностей системы и возможности морфологического изменения. Реализация сценариев, например, с помощью правил (5) позволяет сформировать представление о возможных результатах о— , j = 1, тк, а значит, определяет неравнозначность при
Systems of Control, Communication and Security
sccs.intelgr.com
выборе способа действия, которую можно описать как степень уверенности необходимости применения (или привычность, понимаемую как степень владения данным способом получения результата ок) способа действия. Эту
оценку можно описать лингвистической переменной ш]. (ок, ск) е [0,1].
Данная мера является индивидуальной характеристикой агента, которая может меняться в результате обучения и приобретения опыта. Более того, она будет меняться в результате коммуникационного взаимодействия целеустремленных агентов между собой и с центром. Поэтому шк = щ- (ск, Iк | А) е [0,1], где 1к -
информация (знание), которой располагает агент на момент времени tk.
3. Образы возможных результатов при данном окружении выбора. Выбор образа способа действий ск при принятии решения агентом в ситуации
целеустремленного состояния для достижения результата о; связан, как показано в [23-27], с построением количественной оценки интенсивности свойств выбираемого решения. Выбор перечня свойств, параметров их характеризующих целиком и шкал зависит от агента (его индивидуальности).
Представим возможные результаты при заданном окружении выбора агента в виде окг е{ Ок, - = 1,3}, где О к - образ множества возможных
результатов при выборе --го способа действия г е I - образ множества результатов, принимаемых во внимание к-м агентом. Очевидно, что
Ок = 0- (^г X Sг е Я .
4. Интенсивность переживаемой агентом ценности результатов о к . Измерение этого показателя следует из качественного предположения о том, что агент наделен способностью сравнивать блага, которые он приобретает при получении различных видов стимулирования результатов, с затратами труда, которые он должен для этого приложить. Поскольку о- = о-^ г), а s г = sг (сг), то
интенсивность ценности --го вида результата можно оценить следующей лингвистической переменной ф к(ок (о}.)) е [0,1].
5. Представление об эффективности действия с точки зрения результата -это субъективная оценка затрат усилий агентом на получение результата способом действия при известных (или предполагаемых) затратах на его реализацию. Оценка затрат усилий Ек в том, что некоторый способ действия ск будет приводить к результату ок в окружении Я, если агент выберет именно его будет Е^ = Е^ (ок | А выберет ск в Я)е[0,1]. Она является лингвистической
переменной и выражает индивидуальную оценку агента последствий выбора с точки зрения затрат: финансовых, материальных, труда, интенсивности труда.
Модель выбора агента в контексте постнеклассической рациональности
Введенные три лингвистические переменные т] (хк), у -, Е- образуют модель представлений агента (знаний) о ситуации целеустремленного выбора.
Systems of Control, Communication and Security
sccs.intelgr.com
Поскольку С— можно описать в терминах Х—, то для агента существует
база правил, которая связывает с— и ценность ¿-го результата ок. Это позволяет определить интенсивность ценности целеустремленного состояния по ¿-му результату ок для к-го агента в соответствии с правилом Сугэно [15]:
тф—о (с—)) •¥>—, )
Ефк = _
ф' 1Фк«с))
е
По аналогии можно оценить интенсивность ценности целеустремленного состояния для к-го агента по эффективности для ¿-го вида результата:
тЕЕ— (о— (с—)) .у— (с—)
ее— = и_
' = Ту—(с—)
е
Представление агента желательности целеустремленного состояния по ¿-му результату и эффективности его достижения в ситуации выбора задается в виде лингвистической переменной
С—1 =ск (Ефк) е [0,1], с—2 = с2( ЕЕ—) е [0,1].
В основе процесса взаимодействия личности и организации находятся психологический и экономический контракты. Они отражают существенные ожидания личности (интересная работа, достойная оплата, хороший психологический климат, уважение личности, удовлетворенность работой, возможность использования своего творческого потенциала) и соответствующие ожидания организации (высокие результаты деятельности агента, преданность организации, добросовестный труд, организационная культура). Следовательно, можно определить следующие ограничения:
Тс—1(Ефк)>с0 и ЕЕ-)>х2,
7 7
где с0 и с2 - ожидания агента от организации, которые отражают баланс
к
между затратами и вознаграждением за достигнутые результаты о{ .
Образ ситуации выбора для агента представляет множество структурных и функциональных свойств, которыми по его убеждению обладает ситуация выбора и которые по его убеждению влияют на его удовлетворенность или неудовлетворенность ситуацией.
Теперь можно определить целеустремленное состояние для агента или системы.
Образ целеустремленного состояния у целеустремленного агента характеризуется тем, что он осознает, что:
- находится в состоянии выбора: Р(*)>0;
к
- существует, по крайней мере, один потенциальный результат о{ , если существуют другие потенциальные результаты, то их ценности по целеустремленному состоянию по результату не равны;
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
- существуют, по крайней мере, два потенциальных способа действий с; и ск2 такие, что > 0 и у2 > 0;
- эффективности способов действий с1 и с2 таковы, что сумма оценок ценностей целеустремленного состояния по эффективностям получения результатов огк этими двумя способами не равны
X ЕЕ^ (ск)) ЕЕ^ок (ск));
/ /
" " " к
- существует, по крайней мере, один потенциальный результат ог ,
ценность которого для агента больше некоторой пороговой величины
■ к 0
фг , и степень уверенности получения которого у агента также превышает некоторое пороговое значение Цк0.
Это означает, что существует агент, который представляет, что находится в состоянии, когда он хочет получить какой-либо результат. Он располагает для этого несколькими альтернативными способами достижения с разной эффективностью, которыми он может попытаться достичь желаемого результата, и его уверенность в получении желаемого результата значительна.
Показатели - ценность целеустремленного состояния по результату Ефк и ценность целеустремленного состояния по эффективности ЕЕк - позволяют определить интегральный показатель ценности целеустремленного состояния
для к-го индивида как X Ефк • ЕЕ^ , а, учитывая степень уверенности к-го
2
к
агента в получении результата цг , получить показатель ожидаемой удельной ценности для субъекта возможных результатов
X (Ефк • ЕЕк) < р(.)= ЕУк = •
Это означает, что если два субъекта находятся в одной и той же ситуации выбора, то разница в их поведении должна проявляться в значениях оценок удельной ценности по результату и эффективности и в степени уверенности достижения цели.
Личность (индивидуальность) агента: математическая функция я(*),
связывающая ожидаемую удельную ценность в любой ситуации выбора со свойствами возможных способов действий, их возможными результатами и принимаемыми во внимание как существенные переменными окружения.
Смысл введенного определения состоит в том, что, наблюдая поведение агента в различных ситуациях выбора, можно построить некоторое приближение к функции р(*). Один из возможных вариантов принятия решений агентом в ситуации целеустремленного состояния (когда он что-то хочет) с учетом приведенных выше рассуждений может иметь вид:
Systems of Control, Communication and Security
sccs.intelgr.com
Pk 0) = Arg maxE Vk (ok,uk );
ok = ok (У; ) îO°o , У; = fit (zk,xk,0k) îYk, zk eZk tfl xke ^k, 0k îWk, Ik i M, uke Uk ,
fk :of ® [0,1], yk С ® [0,1],
Sfkj (oj С )) •yk (oj, < ) X EEk (ok С )) •yk С )
Efk = " -, EEk = "-v^n-k-
^ф; (oj(ck)) г xykc)
jîj jîJ
<(Efk) > , 4k2(EEk) > 4ko,
л
Eff • ee; ) •z
EVk =->-xz;-, zk : Efk • EEk ® [0,1], zk >Zko,
(6)
где It - информированность агента, определяемая его знаниями, M - известный
на данный момент уровень знаний о предметной области, xfA l = 1,2 - оценки, отражающие эмоциональное отношение агента к ситуации выбора.
Отметим, что модель (6) использует как объективную информацию (ее еще иначе называют количественной), так и оценки, и суждения агента (субъективная или качественная информация). Это отличает предложенный подход от известных, и делает выводы на его основе более реалистичными, обладающими большими прогностическими свойствами.
Данная модель сохраняет гипотезу рационального поведения, заключающуюся в том, что агент с учетом субъективных представлений о ситуации выбора выбирает действия, которые наиболее предпочтительны с точки зрения значений своей целевой функции и позволяет объяснить примеры так называемого иррационального поведения.
Предложенная модель использована для параметрического описания интеллектуального агента Agk в мультиагентной системе Agents = {Ag1, Ag2,... Agn}. Она представлена кортежем параметров и переменных его интеллектуального Ik, эмоционального Emk и социального Sok состояний, параметрами целей, определяемых внешней средой (их будем рассматривать как внешнее управление ZkcUk), локальных целей k-го агента - Ok, стратегий и планов их достижения Ски параметрами внешних связей [28].
Agk = <Uk, Ik, Emk, Sok, Ck, Evk>; к = 1,n, где Zk = {zk1, zk2, ...}- множество целей zki (i-я цель k- го агента);
Ik = {Ik1, Ik2,.} - база знаний k-го агента в j-х областях знаний Ij
Emk = { Cki, l = 1,2, i = 1,m } - характеристики эмоционального состояния и эмоциональной реакции агента;
Ck = {ck, i = 1,m, j = 1,nk } - банк моделей стратегий и планов для получения
i-го результата (цели) j-м способом;
Evk = {Evk(ag1), Evi(ag2), ... , Evk(agj), ...} - описание внешних связей (k^j).
Systems of Control, Communication and Security
sccs.intelgr.com
Моделирование поведения агентов в переговорном процессе при решении
задачи согласованного планирования
Математическая постановка задачи оптимального согласованного планирования (ОСП) имеет вид:
/(х) ® тах; О(х) < Ь; х е X; х е £ .
т
Здесь £ = ^ - множество согласованных планов, таких что
к=1
Як = {хк |тах Ефк (х* х) < Ефк (хк Хк)},
ск, пРи х* = хк;
где Efk ( xl,xk ) = Efk (x* )
+
- целевая функция к-го агента с
0, при х* Ф хк
учетом фонда материального поощренияск, планируемого центром за выполнение предлагаемого им плана хк; хк - план производственной программы, выбираемый к-м агентом с учетом своих интересов и технологических возможностей.
Необходимым и достаточным условием принадлежности выбранного плана к согласованным (х е £) является соотношение:
Ефк (хк) > тах Ефк (х*).
хкехк
Следовательно, условия согласованного планирования будут иметь вид:
т
Ефк(х)+ск > т*1ахЕфк(xk), с(х)-Хск >0.
х*ехк к=1
Описанная задача представляет конфликтную ситуацию между агентом-лидером и другими агентами с переговорными процессами достижения согласия в достижении общей цели с максимальным эффектом.
Алгоритм переговорной стратегии агентов сводится к следующему.
1. Агент-лидер по исходной и дополнительной информации, поступающей на Н-м шаге от каждого к-го агента, рассчитывает и сообщает агентам предлагаемый вариант общего плана х{Н) = {х]н)} и соответствующий
размер фонда материального поощрения с{к)={с]н)} за его исполнение, в виде
{хПи {<£>};
2. Подчиненный агент на Н-м шаге, исходя из гипотезы о локально-оптимальном поведении, выбирает и сообщает лидеру наилучший для себя
(Н)*
план хк ;
3. При несовпадении, т.е. хк)к Ф хк), подчиненный агент сообщает агенту-
лидеру дополнительную информацию и следует переход к первому шагу
алгоритма. В случае совпадения х{к )*=х<к), переговорная процедура
заканчивается согласием.
Алгоритм составления предлагаемого плана агента-лидера зависит от степени его информированности о возможном поведении других агентов:
- полная информация о целевых функциях агентов и их локальных ограничениях, т.е. при исходной информации
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
/ (X), G (X), Ъ, X,Xk, rnax Efk (x*);
xkeXk
- неполная информация о локальных ограничениях агентов при известных
целевых функциях /(x), G (x), Ъ, max Ef k (x*);
x*eXk
- неполная информация о целевых функциях агентов / (x), Efk (xk) при известных ограничениях G(x), Ъ, X, Xk.
В первом случае на основании исходной информации на h-м шаге агент-лидер определяет план действий подчиненным агентом и размер поощрения с учетом показателей выбранных ими планов на предыдущем (h-1) шаге по
рекурсивным формулам:
x(h) _ x(h-1) + в( x(h-1) _ *(h-1)\
Ak ~ Ak "rB^k Ak )■>
ckh) _ ckh-1) + бVmaxEfk(xkh)*) _ Efk(xf-1))",
V xk eXk 0
где а и в - коэффициенты акселерации, выбираемые из соображений, имеющих, как правило, неформальный характер, хотя можно определить правило их изменения.
Агент-лидер принимает лучшую стратегию из предлагаемого им плана
(h) (h)* xk и предлагаемых планов подчиненными агентами xk как:
max { max Efk (xf >*), Efk (x?))}
V x*eXk ;
и, если Efk (xf)) < max Ef k (xf)<!), то x{k r ф x{k ), и процедура повторяется до
xk eXk
(h)* (h) получения xk _ xk'.
В задаче ОП приxf) € Sk (т.е. план лидера не является элементом
множества согласованных планов) и XIS Ф0, сходимость процедуры к
согласию обеспечивается путем корректировки размера фонда материального
(h)
поощрения c по правилу:
c(h)(x) _ c( h-1)( x) + г(С h-1)( x^h )*)) _ c( h-1)(x(h)), где у > 0, что означает уступку выигрыша лидера в пользу агента нижестоящего уровня для обеспечения x е S.
Если в случае xf) е Sk, XIS _0 и Efk (xf)) < max Efk (xf)*), лидер не
x*eX,-
" (h)* (h) учитывает интересы агентов, оставляя свой план, то xk ф xk , и для
сходимости к xkh)* _ x(h) требуется определенное количество шагов h > 1 переговоров.
Если Efk (xkh)) > max Efk (x[h)*) при xf) е Sk и XIS Ф0, то при
x*eXi
выполнении гипотезы доброжелательности агентами принимается максимально эффективный план:
Systems of Control, Communication and Security
sccs.intelgr.com
max {max Ef (xf)*), Efk ( x?))} = max Efk {x[h )*).
yx*îXk ) xk îXk
Тогда х[И)* = х(И) и процедура согласования сходится за один шаг, т.е.
И = 1.
В случае неполной информированности лидера о локальных ограничениях агентов, т.е. о множествах Хк, на каждом шаге задача ОП решается при дополнительных ограничениях с переменными хк, и ск,; к = 1,т с
ти)
Ч '
введением дополнительного фонда материального поощрения дк')
назначаемого центром агентам на '-м шаге вместе с планом хк(7:
Ef; ( 4) ) + cf) > max Ef; ( xf)* ),
xk îXk m h n
c ( x )-Xc-X X д;; > > 0.
(6)
k=1 j=2 k=1 T(J ).
Величина дк' определяется методом множителей Лагранжа как
4) = <Р*-1), хк/-1)>, где рк-1) = бк'-1)вгаё^(х&'-1), у^), к = 1т, вгаёX - градиент функции Лагранжа, объединяющей в задаче ОСП функцию цели Дх) агента, ресурсные ограничения gi(x):
п tri
F (x,y) = f (x) - X у [gi (x)- bi ] + X Уп+k c- ma* Efk (x* )
xk îXk
i=1 k=1
h
+
c ( x )-xc, -ххд;; »
k=1 j=2 k=1
+ У п+т+1
_ к=1 '=2 к=1 _ Путем решения этой задачи центр получает значения х(И), с(И), д(И) и р(И) = grad Ех(х(И), у(И)), где (х(И), у(И)) - седловая точка функции Лагранжа на
множестве Х(И).а(И)> 0, подбирается из условия обеспечения расходов центра на стимулирование агентов за счет роста величины с(х).
Предполагается, что <grad сх(х(И)), х(И) - х(И-1)>- (с(И) - с(И-1)) > 0, т.е. на каждом шаге фонда поощрения должно хватать для стимулирования агентов за выбор напряженного плана и (•) - операция скалярного произведения векторов.
Так как
<б(\radF(х(И),у(И)), х(И) - х(И-1)> + (с(И) - с(И-1)) < <<8^с (х(И)), х(И) - х(Ы)>, ,
то
б(и) < <gradХР(х(И),у(И)), х(И) - х(И-1)>
<gradxc(x(h)), x(h) - x(h-1)> - (c(h) - c(h-1))
,( h ) J h) ( h) ( h )
Значения х ), с1 ), д( ), р1 ) центр сообщает активным элементам.
1. По своей целевой функции
Systems of Control, Communication and Security
sccs.intelgr.com
Ef ( Xh '' )
+
cf)(xf))+jrдк\ xf)* =xf) и xf)'eLk j=2
0, xf)' *xk) и xf )'eXf)
+
ôf ) >0 ôf) <0
агенты в соответствии с гипотезой о локально-оптимальном поведении выбирают наилучшую для себя ситуацию:
max
(rn ax Ef k ( xf)* ) ; Ef, ( xf) + cf) + £ дk>; Ef t ( xf)* ) + c
xk ÎXk j =2
(h )
+
+X д'pkh>, 4 - xf •».
j _1
Для задачи ОП L(h) _ {x| G(x(h)) > Ъ, /(x(h)) >/(x(h)*)}, а для задачи ОСП
Lh) _ {x|G (x(h)) > Ъ, Efk (xk) + Ck > max Efk (xf)*),
' xk eXk v 7
h m
c( xh >) -£cf) -Щ
(h )
i=1
> 0, f (x(h>) > f (x(h)')
(h )'
j=2 k=1 0
план, предлагаемый агентом центру на h шаге;
здесь х( } - план, выбираемый агентом на к-м шаге, х е ' - напряженный
дкк) > 0, при хГ е
Дк) < 0, при хГ е Xк 2. Агенты сообщают центру свои наилучшие стратегии. Если
(к)* (к) (к) лАк) ~
хк Ф хк , хк е Хк , то центр корректирует свое решение по схеме, описанной в п.2. Если хкк) е , то центр обновляет информацию, расширяет множество
X(h ) что
X(h+1) и вычисляет x(h+1), c(h+1), д(h+1), p(h+1). Если xf r=xf), то это означает,
Efk ( xf ) + 4h) +hk) > Efk ( xf* ) +Г +Xih) +<pf, xf - xf>.
j=2 j=1
Так как
Efk ( xkh >* ) + ckh+« > Efk ( xkh >* ) + ckh > > max Efk ( xf>* ),
xk eXk
то
<p?>, xf -Г ><o
для всех k-х агентов, т.е.
xkh) ф xf+1), gradxC(xkh)) ф 0, gradXF(xfKyf) ф 0.
Поэтому б kh) Ф 0 и (grad xF (xf\ yf]), xfY - xf] ><0. Следовательно, точка
(xf\ yf^) оказывается седловой точкой Лагранжа в задаче ОП или ОСП, и значение xf)* _ xf) является соответственно оптимальным планом или оптимальным согласованным планом. Интерактивная процедура заканчивается.
Предположим, что условия образования фонда материального стимулирования таковы, что для любого x е X выполняется неравенство
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
|gradxc(х)| > 0, где |*| - длина вектора. Тогда рост фондов материального
поощрения больше расходов на расширение множества ХИ), поэтому в этом случае допустимое множество
т И т
{х|0(х<И>)>Ь;с(х(И>)-]Гс<И>-]Гдк>; >0;
к=1 ;=2 к=1 (7)
ф (х'(И>*) + ск> > ^, Еф,(х'С>*)} П X"'>
с ростом множества Xй-* монотонно не сужается.
Выполнение условия (6) является достаточным условием сходимости описанного итеративного процесса.
Поскольку хкИ) Е ^, тоф(хкИ)) + скИ) > ПШХф(х^).
хкеХк
Из соотношения cf+1) = cf] + (gradxc(xf+1)), xf+1) - xf) > следует неравенство Ефк(xf)*) + cf+1) > Efk(xf)) + cf) > maxf(xf)*) для х(h)* е Lh).
Согласно условию алгоритма блочного программирования (pf\ xh* - xf) > > 0 для всех x(h}* е Lh). Отсюда следует, что
Efk ( xf ) + cf+■> + ХГ д" + < p?>, xf >* - xf' >>
J=2 h
> Ef, (xf>) + <?> +X Дк >
7=2
Поэтому при решении задачи ОСП агент всегда будет выбирать
x(h е Lh).
Следовательно, на каждом h-м шаге агенты формируют предложения для (h+1)-ro шага в виде значения напряженного плана x(hе iih\ который они могли бы реализовать.
В силу условий (6) и (7) новое множество Xh+1) будет расширяться по сравнению с множеством Xh\ При этом будут выполняться ограничения по фонду материального поощрения и условия совершенного согласования.
Поскольку X(1) с X(2) с ... с X(h) с ... с X, то допустимые множества в задаче ОСП не убывают. За счет расширения допустимого множества значений /x^h)) для каждой задачи ОСП будет только возрастать. Поэтому последовательность /(x^1)), ßX2),..., flx^),... монотонно не убывает и в силу компактности множестваXимеет предел/, т.е. lim/(x(h)) = /* и /* = /(xос).
Можно показать, что если решается задача ОП и нарушено условие совершенного согласования, то xf)* ф xf) и x(h)* £ Lh). Следовательно, xf)* = xf+1) и множество X^h) не расширяется в силу отсутствия у агентов стимулов отыскивать резервы для принятия напряженных планов, и процедура итеративного планирования закончится не достигнув x°.
Systems of Control, Communication and Security
sccs.intelgr.com
В случае полной информированности центра об ограничениях и неполной информации о целевых функциях агентов / (х), Ефк (хк) центр имеет исходную
информацию: О(х), Ь, X, Хк. То есть центр имеет полную математическую
модель системы и ему не надо затрачивать усилия на идентификацию технологического множества системы, но ему не известны мотивы и поведение агентов при выборе ими плановых заданий. В этом случае можно рассмотреть любой итерационный алгоритм, например, использующий релаксационную схему условного градиента.
1. Центр на каждом шаге получает дополнительную информацию:
вгааЕ„(хТ), вп^х/Гх'"-1'-), х"'-'»• и с<"-1>-
2. Центр на каждом "-м шаге в точке х^"+1) выбирает направление поиска на основе решения задачи ОП
<Вгаё х/(х("-1)*), х - х("-1)* > ® тах, О (х) > Ь, х е X ("-1) или задачи ОСП с учетом условий согласования и ограничения по фонду
т
материального поощрения ^ ск < с (х). В последнем случае в задачу
к=1
оптимизации вводится новая переменная ск > 0. Центр сообщает агентам значение плана хк и размер планируемого поощрения ск .
3. Агент по направлению поиска на каждом шаге выбирает наилучший для себя шаг Рк"), решая в соответствии с гипотезой о локально-оптимальном поведении задачи:
f Г Xh + в k ( x? '* -xf-■>* )] + [cf >• + в k (
)* _ cf
® max .
В k î[0,1]
4. По величине шага агент определяет план х1
.(h)*
x (h)* _ x (h-1)* + в (h) Лк ~ Лк "l"bk
( xf >-xf-1>- ), c*k _ c*<k-1> + в к ( ckh Wf-1>- ) ,
который он обязан выполнить за поощрение ск")-,и сообщает его величину центру.
5. Если хк")-»хк"), то центр заканчивает процесс планирования, в противном случае центр запрашивает у агентов дополнительную информацию, т.е. осуществляет переход к п.1 данной схемы.
Алгоритм формирования агентом предложений в процессе переговоров
В производственных системах участники переговоров должны быть уверены в справедливости окончательного решения. В соответствии с определением согласованных состояний будем считать, что переговоры должны быть равноправными и приводить к решению, свободному от дискриминации и от зависти, чтобы его нельзя было улучшить в ущерб кому-то из участников. Принципом удовлетворенности будем называть процедуру, при которой для всех участников выполняется условие равновесия по Нэшу
ск(ок,хк,0-к) = Агё тахЕук(ок,хк,0к,0-к), к е 1,п
ск ЕСк .
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Это означает, достигнутые в результате переговоров результаты соответствуют их ожиданиям, и каждый участник наблюдает и оценивает выигрыши контрагентов.
Переговоры можно считать также успешными, если выполнено условие
EVk(о,,xk,ok,o-k) >EV0, к еЩ
Это условие назовем условием близости приемлемых результатов, которые удовлетворяют ожиданиям агентов.
Следовательно, если предполагают итеративный обмен информационными сообщениями, то на каждом шаге h должно выполняться условие EVhk-1 £ EV^ £... £ EVX k, что означает для агента появление привлекательных состояний.
Агент, обладая более детализированной информацией, может при создании центром более привлекательных условий uk путем решения задачи (6) определять для себя такой вектор xf), который позволяет расширить
множество Xkh) представлений центра о его возможностях, h - шаг итерационного процесса.
Обозначим через щ = {щ2), h = 1,H} е Ak - вектор параметров состояния,
определяющий значения вектора действий xkh) = { xfj\ j е [1,mk ]} е Xf). Можно
считать, что этот вектор описывает знание агента возможностей контролируемого им объекта управления. Здесь Ak - множество возможных значений вектора состояния. Будем считать, что агент обладает способностями, знаниями, которые гарантируют существование Щ :Ak ® Xf).
Доступный агенту уровень знаний о конструктивных особенностях потребляемой продукции и услуг делают справедливым предположение о существовании для k-го агента предельного множества параметров состояния. Обозначим через O* = {o*|ok (xk), xk е Xf ^щ2)), rnf) е Ак} - множество достижимости или множество предельных возможностей.
Будем предполагать, что агент за счет своих креативных способностей, способности к самообучению и поиску новой информации при соответствующем стимулирующем воздействии центра способен определять такие состояния е Ak и е Ak, что возможно Щ2) f Щ1, где символ f означает «более значимо» и при этом X;(1)(^1)) с X()(шШ¡2)). Следовательно,
существует такая последовательность щ^, ,щ.3) ,•••, что lim of) (xf) (щ^))) = O*.
h®¥
То есть агент путем изучения объекта управления способен определить его предельные возможности для достижения желаемого состояния. Последовательность ,щ.2) ^3),... будем называть последовательностью вскрытия резервов от потенциальных конструктивных решений за счет их доработки и упрощения в обслуживании.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Такая способность агента формировать расширяющееся множество способов действия позволяет определить следующие свойства целевой функции агента и областей достижимости:
,Ч21 Е Ак,42) У <,Х»'«') с
= Х™«') а Ефк(хк2') > Ефкю. Это условие означает, что поведение агента при выполнении принципа рациональности соответствует закону повышающихся потребностей, который в литературе по психологии поведения определяет мотивированность и целеустремленность агента.
В реальных условиях агент при превышении некоторого порога значимости А = Еф к (х}2)) - Еф к (х^) изменения ценности ситуации
целеустремленного состояния по результату способен идентифицировать предпочтительные способы действия и видит открывающиеся возможности при изменении структуры своей информированности (знания).
Выработка решения при таком подходе заключается в реализации совокупности последовательных процедур, предназначенных для поиска промежуточных решений, на основании которых агент уточняет свои возможности и формирует окончательное решение. Полный цикл его формирования к-м агентом состоит в выполнении следующих шагов на этапе И:
1. Формирование множеств Ак и X(к) на основе знаний, опыта, интуиции и располагаемой информацией о параметрах состояния ). Просмотр множества Ак и формирование точки ОкИ)* = {окИ)*|окИ)*(хкИ)),хкИ) Е ХкИ)(шkИ)),щкИ) е Ак}. Проверка, существует ли х^* такое, что о^)(х(к )*) = о{к )* . Если - да, то х(к)* - это компромиссное решение, а 0к)* - прогнозируемая ситуация, в противном случае переход к п.2.
2. Решение задачи поиска потенциально-предпочтительного набора
действий х{к )* е Хк;И)(щИ)), позволяющего сформировать вектор о(к) предельных значений критериев при использовании имеющегося на данный момент знания о правиле П|И) и структуре множества Ак. Так как компоненты
—(И) --
оы , I = 1,^ порознь достижимы, а вместе - нет, то делается попытка найти компромиссное решение. Если агент не согласен попытаться найти компромиссное решение за счет компенсаторных уступок по каждому
—(И)
критерию, которые несколько хуже решения о к , то переход к п. 3, иначе к п. 5.
3. Исследование направлений возможного расширения множества А, организация процедур поиска новой информации (знания) о щкИ) е Ак и правиле
Шк :Ак ® Х1И).
4. Если расширение множества Ак возможно, то переход к п. 1, иначе фиксация ситуации, что компромиссное решение не может быть найдено при выбранном векторе о(И)* .
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
5. Получение сведений от агента достаточных для определения вектора Ок) Р 0<к)* , где окк) минимальные требования агента к принимаемым им во внимание результатам.
6. Выполнение процедуры поиска минимально-предпочтительной точки в пространстве критериев по направлению предпочтения о^О^1 }* , определение
вектора ш^* е Лк и хкк) е Xкк)(Щк!}*) - минимального значения плановых
показателей, соответствующих значениям компонент вектора окк) .
(к )* (к)*
7. Если полученные значения для хк , ок принимаются как
компромиссное решение, то процедура останавливается, в противном случае переход к п. 8.
8. Для ограничений на окк) определяется приоритетная координата I е\\,Ык ], по которой делается расширение множеств Лк и X{к), так чтобы о(к\х(к)) = о(к} + Д(к}, где Д(,к} минимально возможное улучшение, которое
/с /с /с /с
является значимым для агента и определяется по его высказываниям о "гибкости" ограничения на основе выполнения процедур поиска дополнительной информации. Переход к п. 1.
Описанный алгоритм использует три типа механизмов, применение которых порождает интерактивный процесс для построения компромиссного решения.
Механизм анализа - это механизм, с помощью которого агент в момент г обрабатывает сведения, полученные на шаге г-1 для построения множеств Рк и
X к с целью определения хк, уо*, с*, 2*. Здесь сопоставляются результаты, полученные на момент г с результатами на шаге г-1. формируется представление о значениях вектора оо* и значений уступок по его компонентам. Строится предварительное представление о желательных значениях показателей £фк (о(уо*)) и ББк (о(уо*)).
Механизм целеполагания - это механизм, который по результатам анализа определяет условия возможности достижения желательных значений
х к, уо*, с*, 2*, Ефк(о(уо*)), ББк(о(уо*)). Рассчитывается идеальная точка в
_*
пространстве оценок о, связанная с множествами Рк и Хк - это точка о ,
_* _ _*
имеющая координаты ог = тах о1 (х(р)), /=1,Ь. То есть о - наибольшее
рерк, хеХк
значение оценки по координате I, которое может быть получено с помощью намеченных действий. Эта точка образует центр области поиска
предпочтительных состояний. Если при найденном значении координат точки
_*
о ограничения не выполняются, то агент рассматривает возможность
расширения множеств Р, X к и С к за счет включения дополнительных переменных, осуществления структурных изменений и т.п. для ослабления наиболее жестких ограничений так, чтобы выполнялось включение
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
(г) С Р (г +1) и Хк (г) с Хк (г +1). Если это невозможно, то формируется
_* _*
сведения о координатах о < ог точки о ф ог , которая была бы достижимой и
_*
лучшим компромиссом в окрестности точки о . Путем минимизации потерь
ь
X \Ог - о°* определяются величины рг = о1 - о°* ф 0 примерно эквивалентные,
небольшие и значащие для агента.
Механизм самоорганизации - это механизм, который приводит к
получению знаний о правилах А и Т для расширения множеств Рк, Хк и Ск. Он может иметь различные формы:
1) проведение экспериментальных исследований на объекте с целью улучшения своего представления о его функционировании;
2) анализ обстановки н-к;
3) привлечение экспертов для подготовки рекомендаций по улучшению режимов ведения процесса;
4) процедуры опроса персонала;
5) процедуры голосования и т.п.
Агентно-ориентированное моделирование переговорного процесса
Реализация описанного подхода предполагает наличие в организационной системе корпоративной сети, которую следует рассматривать как распределенный информационный ресурс с выделенными сетевыми узлами и отдельными приложениями, разрабатываемыми и реализуемыми различными подсистемами организации и пользователями, и основана на результатах, полученных в [32, 33].
Функциональные возможности такой компьютерной системы, имеющей выход в Интернет, создают основу для реализации активного целенаправленного поведения агентов организации при условии их автономности путем использования методов, основанных на переговорах и кооперации, которые лежат в основе агентно-ориентированных систем [29-32]. Это утверждение основано на трех наиболее важные свойствах агентских приложения [29]: 1) данные, механизмы управления, знания и ресурсы распределены; 2) система естественным образом представляется как сообщество автономных сотрудничающих компонентов; 3) система содержит унаследованные компоненты, которые должны взаимодействовать с другими, возможно новыми программными компонентами.
Технологии агентно-ориентированного моделирования, предоставляют возможность исследовать и создавать приложения, разработать которые с использованием традиционных подходов, было практически невозможно. Они обеспечивают и более развитые средства для концептуализации и понимания процессов, происходящих при проведении переговоров, в частности, связанных с моделированием поведения участников, поиском информации для
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
аргументации позиции, определением и обоснованием стратегий переговоров, защитой от сложных сетевых атак и др.
Использование основанного на многоагентных технологиях моделирования процессов поведения сложных систем (в том числе и переговорного процесса) предполагает, что формализуемые процессы представляются в виде взаимодействия различных команд программных агентов в динамической среде, задаваемой посредством модели сети [32, 33]. Агрегированное поведение системы проявляется посредством локальных взаимодействий отдельных агентов. Предполагается, что агенты осуществляют сбор информации из различных источников, оперируют нечеткими знаниями, прогнозируют намерения и действия других агентов, оценивают возможные риски, пытаются обмануть агентов соперничающих команд, реагируют на действия других агентов.
Агентное моделирование используется для исследования автономных систем, динамика функционирования которых определяется не глобальными правилами и законами, а тогда, когда эти глобальные правила и законы являются результатом индивидуальной активности членов группы. Цель агентных моделей - получить представление об этих глобальных правилах, общем поведении системы, исходя из предположений об индивидуальном, частном поведении ее отдельных активных объектов и взаимодействии этих объектов в системе. Под агентом понимается некая сущность, обладающая активностью, автономным поведением, может принимать решения в соответствии с некоторым набором правил, взаимодействовать с окружением, а также самостоятельно изменяться.
Концептуальная модель противоборства и кооперации команд агентов включает в себя [32]: 1) онтологию приложения, содержащую множество понятий приложения и отношений между ними; 2) протоколы командной работы агентов различных команд; 3) модели сценарного индивидуального, группового и общекомандного поведения агентов; 4) коммуникационный компонент, предназначенный для обмена сообщениями между агентами; 5) модели среды функционирования - компьютерной сети, включающие топологический и функциональные компоненты.
Предлагаемый подход к организации командной работы агентов базируется на совместном использовании элементов теории общих намерений, теории разделяемых планов и комбинированных подходов [34] и учитывает опыт программной реализации многоагентных систем (GRATE, OAA, CAST, RETSINA-MAS, COGNET/BATON и др. [35]).
Для формирования команд агентов и координации действий между командами и отдельными агентами в зависимости от задачи моделирования предполагается использовать комбинации следующих методов и моделей [33, 36]: 1) традиционные BDI-модели, определяемые схемами функционирования агентов, обуславливаемыми зависимостями предметной области; 2) методы распределенной оптимизации на основе ограничений, использующие локальные взаимодействия при поиске локального или глобального оптимума; 3) методы распределенного принятия решений на основе частично-
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
наблюдаемых марковских сетей, позволяющих реализовать координацию командной работы при наличии неопределенности в действиях и наблюдениях; 4) теоретико-игровые модели и модели аукциона, фокусирующиеся на координации среди различных команд агентов, использующих описанные выше механизмы принятия решений.
Специализация каждого агента отражается подмножеством узлов онтологии. Некоторые узлы онтологии могут быть общими для пары или большего количества агентов. Обычно только один из этих агентов обладает детально структурированным описанием этого узла. Именно этот агент является обладателем соответствующего фрагмента базы знаний. В то же время, некоторая часть онтологических баз знаний является общей для всех агентов, и именно эта часть знаний является тем фрагментом, который должен играть роль общего контекста (общих знаний). Структура команды агентов описывается в терминах иерархии групповых и индивидуальных ролей. Механизмы взаимодействия и координации агентов базируются на процедурах обеспечения согласованности действий, мониторинга и восстановление функциональности агентов, обеспечение селективности коммуникаций. Спецификация иерархии планов действий осуществляется для каждой из ролей. Для каждого плана описываются: начальные условия, когда план предлагается для исполнения; условия, при которых план прекращает исполняться; действия, выполняемые на уровне команды, как часть общего плана. Для групповых планов явно выражается совместная деятельность. Предполагается, что агенты могут реализовать механизмы само адаптации и эволюционировать в процессе функционирования.
Для реализации представленного подхода предполагается разработка многоуровневой инструментальной среды, отличающейся от известных средств агентно-ориентированного моделирования (например, CORMAS, Repast, Swarm, MadKit, MASON, NetLogo и др.) [30, 37], в первую очередь, использованием в качестве базиса средств (пакетов) имитационного моделирования, позволяющих адекватно имитировать переговорные процессы. Для реализации подхода используется архитектура среды моделирования (рис. 5), включающая базовую систему имитационного моделирования (Simulation Framework), модуль имитации переговорного процесса, подсистему агентно-ориентированного моделирования (Agent-based Framework) и модуль (библиотеку) имитации процессов предметной области (Subject Domain Library).
Компонент Simulation Framework представляет систему моделирования на основе дискретных событий. Остальные компоненты являются надстройками или моделями для Simulation Framework.
Компонент имитации переговорного процесса - комплект модулей, позволяющих реалистично моделировать процессы интерактивного взаимодействия агентов. Он включает в себя модули обработки результатов рефлексивного маркетинга агентов, модули выбора способа рефлексивного управления и схем рефлексивного управления.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
Модуль процессов предметной области
Онтологии предметной области
Модули объектов предметной области
Модуль имитации переговорного процесса
Модели схем интерактивного взаимодействия
Модуль обработки результатов рефлексивного маркетинга агентов
Модуль выбора способа рефлексивного управления
\
Модели схем рефлексивного управления
Подсистема агентно-ориен-тированного моделирования
Модели агентов: типовой агент, специальные агенты
Протоколы: язык взаимодействия агентов, протокол агент-приложение
Модули оценки ранга рефлексии агентов
Модели предметной области агентов
Базовая система имитационного моделирования
Модель имитационного моделирования
Библиотека компонентов
Интерфейсы пользователя: графический, командный
Ядро системы имитационного моделирования
Рис. 5. Архитектура среды моделирования переговорного процесса
Многоагентное моделирование реализуется посредством компонента Agent-based Framework, который использует модуль имитации процессов предметной области. Данный компонент представляет собой библиотеку модулей, задающих интеллектуальных агентов, реализованных в виде приложений.
При проектировании и реализации модулей агентов подразумевается использование элементов абстрактной архитектуры FIPA. Для взаимодействия агентов необходим язык коммуникаций. Передача сообщений между ними происходит поверх TCP-протокола, реализованного в компоненте Internet Simulation Framework. Каталог агентов является обязательным только для
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
агента, координирующего действия других. Агенты могут управлять другими модулями с помощью сообщений.
Компонент Subject Domain Library - это библиотека, служащая для имитации процессов предметной области, а также модули, дополняющие функциональность IP-узла: таблица фильтрации и анализатор пакетов.
Выводы
1. Предложены алгоритмы переговорной стратегии агента-лидера (центра) и m подчиненных агентов в двухуровневой мультиагентной системе.
2. Рассмотрены три варианта процесса в зависимости от полноты информации агента-лидера о поведении подчиненных с ним агентов.
3. Определены условия сходимости переговорной стратегии агентов в зависимости от исходной базы знаний лидера и интересов других агентов. Показано, что при их выполнении допустимое множество с ростом шага итерации расширяется, и выигрыш центра возрастает. Платой за это является рост фондов материального поощрения.
4. Предложен подход к моделированию поведения агентов в интерактивном переговорном процессе. Он может быть использован в задачах информационной борьбы, конкуренции в сфере электронного бизнеса и др. Рассмотрена архитектура среды моделирования, использующая предложенный подход.
5. Дальнейшее развитие работы связано с разработкой формальных моделей поведения сложных систем, совершенствованием среды моделирования (в том числе на основе реализации других задач поведения сложных систем), исследованием эффективности механизмов внутри командного взаимодействия агентов, реализацией механизмов адаптации и самообучения агентов.
Литература
1. Светлов В. А., Семенов В. А. Конфликтология. - СПб.: Питер, 2011. -
352 с.
2. Ларичев О. И., Мовшович Е. М. Качественные методы принятия решений. - М.: Наука, 1996. - 208 с.
3. Конов А. А., Косаченко С. А., Кульба В. В. Модели и методы анализа сценариев развития социально-экономических систем в АСУ // Автоматика и телемеханика. 1999. № 9. С. 122-136.
4. Трахтенгерц Э. А. Субъективность в компьютерной поддержке управленческих решений. - М.: СИНТЕГ, 2001. - 256 с.
5. Фишер Р., Юрии У. Путь к согласию или Переговоры без поражения. -М., 1990. - 144 с. - URL: http://www.f-kotler.narod.ru/download/fisher_rodzher_-_put_k_soglasiyu_ili_peregovory.pdf (дата обращения 10.07.2016).
6. Лебедева М. М. Политическое урегулирование конфликтов. Учебное пособие. - М.: Аспект Пресс, 1999. - 271 с.
7. Селлих К., Джейн С. Переговоры в международном бизнесе. - М.: Добрая книга, 2004. - 336 с.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
8. Белланже Л. Переговоры. - СПб.: Издательский дом «Нева», 2002. -
140 с.
9. Новиков Д. А., Чхартишвили А. Г. Рефлексивные игры. - М.: СИНТЕГ, 2003. - 160 с.
10. Виноградов Г. П., Шматов Г. П., Борзов Д. А. Формирование представлений агента о предметной области в ситуации выбора // Программные продукты и системы. 2015. № 2 (110). С. 83-94.
11. Зенгер Ч. Фон. Стратегемы: О китайском искусстве жить и выживать: в 2-х томах. - М.: Эксмо, 2004. - 512 с.+1024 с.
12. Латфуллин Г. Р., Громова О. Г. Организационное поведение: Учебник для вызов. - СПб.: Питер, 2007. - 432 с.
13. Бендлер Р. Руководство по изменению личности / Пер. с англ. - М.: Эксмо, 2010. - 208 с.
14. Дилтс Р. Моделирование с помощью НЛП. - СПб.: Питер, 2008. -
288 с.
15. Борисов А. Н., Алексеев А. В., Меркурьева Г. В. Обработка нечеткой информации в системах принятия решений. - М.: Радио и связь, 1989. - 304 с.
16. Рубинштейн М. Ф., Фирстенберг А. Р. Интеллектуальная организация. Перенеси будущее в настоящее и преврати творческие идеи в бизнес-решения / Пер. с анг. - М.: ИНФРА-М, 2003. - 192 с.
17. Виноградов Г. П., Кузнецов В. Н., Семенов Н. А. Согласование представлений агентов в интеллектуальной многоагентной системе // Труды Конгресса по интеллектуальным системам и информационным технологиям «AIS - IT'09». - М.: Физматлит, 2009 - С. 135-141.
18. Лефевр В. А. Конфликтующие структуры. 3-е изд. - М.: Институт психологии РАН, 2000. - 158 с.
19. Новиков Д. А. Современные проблемы теории управления организационными системами // Сб. трудов: Человеческий фактор в управлении. - М.: КомКнига, 2006. - С. 391-407.
20. Виноградов Г. П., Кузнецов В. Н. Моделирование поведения агента с учетом субъективных представлений о ситуации выбора // Искусственный интеллект и принятие решений. 2011. № 3. С. 58-72.
21. Виноградов Г. П. Моделирование принятия решений интеллектуальным агентом // Программные продукты и системы. 2010. № 3. С. 35-43.
22. Михалевич В. С., Волкович В. Л. Вычислительные методы исследования и проектирования сложных систем. - М.: Наука. Главная редакция физико-математической литературы, 1982. - 286 с.
23. Акофф Р., Эмери Ф. О целеустремленных системах. - М.: Сов. радио, 1974. - 272 с.
24. Миркин Б. Г. Проблема группового выбора. - М.: Наука, 1974. - 256 с.
25. Статистическое измерение качественных характеристик / Под ред. Е.М. Четыркина. - М.: Статистика, 1972. - 173 с.
26. Стивенс С. С. Математика, измерение и психофизика // Сб.: Экспериментальная психология. Том 1. - М.: ИЛ, 1960. - С. 19-89.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
27. Суппес П., Зинес Дж. Основы теории измерений // В кн.: Психологические измерения. - М.: Мир, 1967. - С. 9-110.
28. Ивашкин Ю. А. Агентные технологии и мультиагентные системы. Учебное пособие. - М.: МФТИ, 2013. - 265 с.
29. Bond A. H., Gasser L. (Eds.). Readings in Distributed Artificial Intelligence. - Morgan Kaufmann, 1988. - 649 p.
30. Macal C. M., North M. J. Tutorial on Agent-based Modeling and Simulation // Proceedings of the 2005 Winter Simulation Conference. WSC'05. 2005. - pp. 151-162.
31. Тарасов В. Б. От многоагентных систем к интеллектуальным организациям: философия, психология, информатика. - М.: УРСС, 2002. -352 с.
32. Городецкий В. И., Котенко И. В. Концептуальные основы стохастического моделирования в среде Интернет // Труды института системного анализа РАН. 2005. Том 9. С. 20-35.
33. Kotenko I. V., Ulanov A. V. Agent-based simulation of DDOS attacks and defense mechanisms // Journal of Computing. 2005. Vol. 4. No. 2. Pp. 49-61.
34. Tambe M. Towards flexible teamwork // Journal of AI Research. 1997. Vol. 7. Pp. 83-124.
35. Fan X., Yen J. Modeling and Simulating Human Teamwork Behaviors Using Intelligent Agents // Journal of Physics of Life Reviews. 2004. Vol. 1. No. 3. Pp. 33-51.
36. Paruchuri P., Bowring E., Nair R., Pearce J. P., Schurr N., Tambe M., Varakantham P. Mutiagent Teamwork: Hybrid Approaches // Computer society of India Communications. 2006. No. 3. Pp. 55-69.
37. Marietto M., David N., Sichman J. S., Coelho H. Requirements Analysis of Agent-Based Simulaton Platforms: State of the Art and New Prospects // Multi-Agent-Based Simulation II, Vol. 2581 of LNAI series, Springer-Verlag. 2002. -Pp. 2132-2141.
38. Белянин А. Канеман Д., Смит В. Экономический анализ человеческого поведения // Вопросы экономики. 2003. № 1. С. 4-23.
References
1. Svetlov V. A., Semenov V. A. Konfliktologiia [Conflictology]. Saint-Petersburg, Piter Publ., 2011. 352 p. (in Russian).
2. Larichev O. I., Movshovich E. M. Kachestvennye metody priniatiia reshenii [Qualitative methods of decision making]. Moscow, Nauka Publ., 1996. 208 p. (in Russian).
3. Kononov D. A., Kosyachenko S. A., Kul'ba V. V. Analysis of scenarios of development of socioeconomic systems in emergency control systems: models and methods. Automation and remote control, 1999, no. 9, part 2, pp. 1315-1325.
4. Trakhtengerts E. A. Sub"ektivnost' v komp'iuternoi podderzhke upravlencheskikh reshenii [Subjectivity in a computer support of managerial decisions]. Moscow, Sinteg Publ., 2001. 256 p. (in Russian).
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
5. Fisher R., Iurii U. Put' k soglasiiu ili Peregovory bez porazheniia [The way to an agreement or Negotiations without defeat]. Moscow, 1990. 144 p. Available at: http ://www. f-kotler.narod.ru/download/ fisher_rodzher_-_put_k_soglasiyu_ili_peregovory.pdf (accessed 10 June 2016) (in Russian).
6. Lebedeva M. M. Politicheskoe uregulirovanie konfliktov [A political settlement of the conflict]. Moscow, Aspekt Press Publ., 1999. 271 p. (in Russian).
7. Sellikh K., Dzhein S. Peregovory v mezhdunarodnom biznese [Negotiations in international business]. Moscow, Dobraia kniga Publ., 2004. 336 p. (in Russian).
8. Bellanzhe L. Peregovory [Negotiations]. Saint-Petersburg, Neva Publ., 2002. 140 p. (in Russian).
9. Novikov D. A., Chkhartishvili A. G. Refleksivnye igry [Reflexive games]. Moscow, Sinteg Publ., 2003. 160 p. (in Russian).
10. Vinogradov G. P., Shmatov G. P., Borzov D. A. Formation of agent's representations of the domain in a situation of choice. Software & Systems, 2015, vol. 10, no. 2, pp. 83-94 (in Russian).
11. Zenger Ch. Fon. Strategemy: O kitaiskom iskusstve zhit' i vyzhivat' [Stratagems: the Chinese art to live and survive]. 2 volumes. Moscow, Eksmo Publ., 2004. (in Russian).
12. Latfullin G. R., Gromova O. G. Organizatsionnoe povedenie [Organizational behavior]. Saint-Petersburg, Piter Publ., 2007. 432 p. (in Russian).
13. Bendler R. Rukovodstvo po izmeneniiu lichnosti [Guide to personality change]. Moscow, Eksmo Publ., 2010. 208 p. (in Russian).
14. Dilts R. Modelirovanie s pomoshch'iu NLP [Modeling using neuro-linguistic programming]. Saint-Petersburg, Piter Publ., 2008. 288 p. (in Russian).
15. Borisov A. N., Alekseev A. V., Merkur'eva G. V. Obrabotka nechetkoi informatsii v sistemakh priniatiia reshenii [Processing fuzzy information in decisionmaking systems]. Moscow, Radio i sviaz' Publ., 1989. 304 p. (in Russian).
16. Rubinshtein M. F., Firstenberg A. R. Intellektual'naia organizatsiia. Perenesi budushchee v nastoiashchee i prevrati tvorcheskie idei v biznes-resheniia [Intellectual organization. Bring the future into the present and turn creative ideas into business solutions]. Moscow, INFRA-M Publ., 2003. 192 p. (in Russian).
17. Vinogradov G. P., Kuznetsov V. N., Semenov N. A. Soglasovanie predstavlenii agentov v intellektual'noi mnogoagentnoi sisteme [Approval of the beliefs of agents in an intelligent multi-agent system]. Trudy Kongressa po intellektual'nym sistemam i informatsionnym tekhnologiiam «AIS - IT'09» [Congress on intellectual systems and information technologies "AIS - IT'09"]. Moscow, Fizmatlit Publ., 2009 pp. 135-141 (in Russian).
18. Lefevr V. A. Konfliktuiushchie struktury [Conflicting structures]. Moscow, Institute of Psychology of RAS, 2000. 158 p. (in Russian).
19. Novikov D. A. Sovremzennye problemy teorii upravleniia organizatsionnymi sistemami [Modern problems of the theory of control of organizational systems]. Proc. "Chelovecheskii faktor v upravlenii", Moscow, KomKniga Publ., 2006. pp. 391-407 (in Russian).
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
20. Vinogradov G. P., Kuznetsov V. N. Modeling agent's behavior based subjective perceptions on the situation of choice. Artificial intelligence and decision making, 2011, no. 3, pp. 58-72 (in Russian).
21. Vinogradov G. P. Modelirovanie priniatiia reshenii intellektual'nym agentom [Modeling decision making intelligent agent]. Software & Systems, 2010, no. 3, pp. 35-43 (in Russian).
22. Mikhalevich V. S., Volkovich V. L. Vychislitel'nye metody issledovaniia i proektirovaniia slozhnykh system [Computational methods for research and design of complex systems]. Moscow, Nauka Publ., 1982. 286 p. (in Russian).
23. Akoff R., Emeri F. O tseleustremlennykh sistemakh [On purposeful systems]. Moscow, Sov. Radio Publ., 1974. 272 p. (in Russian).
24. Mirkin B. G. Problema gruppovogo vybora [The problem of group selection]. Moscow, Nauka Publ., 1974. 256 p. (in Russian).
25. Chetyrkin E. M. (at edit.) Statisticheskoe izmerenie kachestvennykh kharakteristik [Statistical measurement of quality characteristics]. Moscow, Statistika Publ., 1972. 173 p. (in Russian).
26. Stivens S. S. Matematika, izmerenie i psikhofizika [Mathematics, Measurement and Psychophysics]. Proc. "Eksperimental'naia psikhologiia", Moscow, Vol. 1, 1960. pp. 19-89 (in Russian).
27. Suppes P., Zines Dj. Osnovy teorii izmerenii [Fundamentals of measurement theory]. Proc. "Psikhologicheskie izmereniia", Moscow, Mir Publ., 1967. pp. 9-110 (in Russian).
28. Ivashkin Iu. A. Agentnye tekhnologii i mul'tiagentnye sistemy [Agent technologies and multiagent systems]. Moscow, MIPT Publ., 2013. 265 p. (in Russian).
29. Bond A. H., Gasser L. (Eds.). Readings in Distributed Artificial Intelligence. Morgan Kaufmann, 1988. 649 p.
30. Macal C. M., North M. J. Tutorial on Agent-based Modeling and Simulation. Proceedings of the 2005 Winter Simulation Conference. WSC'05, 2005, pp. 151-162
31. Tarasov V. B. Ot mnogoagentnykh sistem k intellektual'nym organizatsiiam: filosofiia, psikhologiia, informatika [From multiagent systems to intellectual organizations: philosophy, psychology, computer science]. Moscow, Editorial URSS, 2002. 352 p. (in Russian).
32. Gorodetskiy V. I., Kotenko I. V. Kontseptual'nye osnovy stokhasticheskogo modelirovaniia v srede Internet [The conceptual framework of stochastic modelling in the Internet environment]. Trudy instituta sistemnogo analiza RAN, 2005, vol. 9, pp. 20-35 (in Russian).
33. Kotenko I. V., Ulanov A. V. Agent-based simulation of DDOS attacks and defense mechanisms. Journal of Computing, 2005, vol. 4, no. 2, pp. 49-61.
34. Tambe M. Towards flexible teamwork. Journal of AI Research, 1997, vol. 7, pp. 83-124.
35. Fan X., Yen J. Modeling and Simulating Human Teamwork Behaviors Using Intelligent Agents. Journal of Physics of Life Reviews, 2004, vol. 1, no. 3, pp. 33-51.
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
36. Paruchuri P., Bowring E., Nair R., Pearce J. P., Schurr N., Tambe M., Varakantham P. Mutiagent Teamwork: Hybrid Approaches. Computer society of India Communications, 2006, no. 3, pp. 55-69.
37. Marietto M., David N., Sichman J. S., Coelho H. Requirements Analysis of Agent-Based Simulaton Platforms: State of the Art and New Prospects. Multi-Agent-Based Simulation II, Vol. 2581 of LNAI series, Springer-Verlag, 2002, pp. 21322141.
38. Belianin A. Kaneman D., Smit V. Ekonomicheskii analiz chelovecheskogo povedeniia [Economic analysis of human behavior]. Voprosy Ekonomiki, 2003, no. 1, pp. 4-23 (in Russian).
Статья поступила 6 июля 2016 г.
Информация об авторах
Виноградов Геннадий Павлович - доктор технических наук, профессор. Профессор кафедры информатики и прикладной математики. Федеральное государственное бюджетное образовательное учреждение высшего образования «Тверской государственный технический университет». Область научных интересов: теория принятия решений; теория нечетких множеств; мультиагентные системы. E-mail: wgp272ng@mail.ru
Адрес: Россия, 170026, г. Тверь, наб. А. Никитина, д. 22.
Ивашкин Юрий Алексеевич - доктор технических наук, профессор. Главный научный сотрудник научно-методического центра. Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный университет пищевых производств». Область научных интересов: Мультиагентные системы; искусственный интеллект. E-mail: ivashkin@nextmail.ru
Адрес: Россия, 125080, г. Москва, Волоколамское шоссе, д. 11.
Modeling Negotiation Processes in High-tech Production Systems
G. P. Vinogradov, Y. A. Ivashkin
Problem statement: increasing the level of autonomy of the divisions in knowledge-intensive industries has led to the allocation of decision-making centers. It made the actual problem of research of process of interaction of divisions in the intellectual organizations in solving semi-structured complex problems in conditions of uncertainty of external environment. Known methods and approaches do not take into account the interdependence of actors in making coordinated decisions, their subjective assessment of the situation of choice, goals, needs, motivation, what makes the formal model is not feasible in practice. The aim of this work is development of the mechanism of interaction of divisions of production in the form of the negotiation process, when due to the complexity of the technological process, requiring specialist knowledge at a higher level of control can be known of the ability of subordinate levels or no opportunity to determine their behavior by force. The aim of this work is development of the mechanism of interaction of divisions of production in the form of the negotiation process, when due to the complexity of the technological process, requiring specialist knowledge at a higher level of control can be known of
Системы управления, связи и безопасности №2. 2016
Systems of Control, Communication and Security sccs.intelgr.com
the ability of subordinate levels or no opportunity to determine their behavior by force. Methodology: the solution to the problem of constructing the mechanism of the negotiation process based on the original approach of modeling subjectively rational choice that takes into account individual perceptions of the decision maker properties of a situation of choice. Development of a selection model based on the theory of fuzzy sets. A model of the mechanism of the negotiation process is based on the results of the theory of active systems. Novelty: the elements of novelty of the presented solution are the development of the model subjectively rational choice and building on its basis a game-theoretic model of the mechanism of the negotiation process that takes into account the interdependence of participants, justification of the convergence of the negotiation process with different variants of awareness of an arbitrator on the possibilities of the participants. Result: the proposed approach of coordination of interests of participants of the negotiation process allows you to combine the estimates obtained formal methods with subjective estimates based on experience and knowledge. Using the results obtained allows to increase the objectivity of the solutions is the basis for creation of information technologies for the integration of "natural" intelligence in the solution of creative tasks that require non-trivial approaches to develop an ideal model of negotiation. Practical significance: the decision to implement usage-based agent technologies. This enables the study of the negotiation process as a system whose dynamics is determined not by global rules and laws, and when these global rules and laws are the result of individual activity of group members. The purpose of modeling is to gain insight into these global rules, the General behavior of system, proceeding from assumptions of individual, private behavior of its separate active objects and the interaction of these objects in the system.
Key words: negotiations, conflicts, decision-making, multi-agent system model, consistent management, a compromise.
Information about Authors
Gennady Pavlovich Vinogradov - Dr. habil. of Engineering Sciences, Professor. Professor at the Department of Informatics and applied mathematics. Federal State budgetary educational institution of the higher Education. Field of research: theory of decision making; theory of fuzzy sets; multiagentny systems. E-mail: wgp272ng@mail.ru
Address: Russia, 170026, Tver, A. Nikitin Emb., 22.
Yury Alekseevich Ivashkin - Dr. habil. of Engineering Sciences, Professor. Chief researcher of the MSU scientific and methodical center. Federal State budgetary educational institution of the higher education "Moscow State University of food productions". Field of research: information security; multiagentny systems; artificial intelligence. E-mail: ivashkin@nextmail.ru
Address: Russia, 125080, Moscow, Volokolamskoye Highway, 11.