Научная статья на тему 'Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы'

Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
265
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИАГЕНТНЫЙ ЧАСТИЧНО НАБЛЮДАЕМЫЙ МАРКОВСКИЙ ПРОЦЕСС ПРИНЯТИЯ РЕШЕНИЙ / ДЕЛЬФИ-ПРОЦЕСС / СОВМЕСТНАЯ ПОЛИТИКА / БИЗНЕС-ОБУСЛОВЛЕННАЯ ТОЧКА ЗРЕНИЯ / СЕМЕЙСТВО ОНТОЛОГИЙ ЭКСПЕРТНЫХ ТОЧЕК ЗРЕНИЯ / ФУНКЦИЯ КОГНИТИВНОЙ ПОЛЕЗНОСТИ / ЭФФЕКТИВНОСТЬ МНОГОТУРОВОЙ ЭКСПЕРТИЗЫ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ильина Е. П., Слабоспицкая О. А.

Разработан формальный аппарат моделирования эффективности Дельфи-процесса оценки скалярного параметра. Он основан на моделях мультиагентного частично наблюдаемого марковского процесса принятия решений и семейства онтологий экспертных точек зрения. Предложен алгоритм экспертного процесса, чередующего реальные туры с виртуальными мультиагентными

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The formal device for Delphi process efficiency modeling of scalar parameter estimation was developed. It is based on both Decentralized POMDP and expert viewpoints ontology models family. The algorithm for expert process alternating real tours and virtual multi-agent ones was proposed

Текст научной работы на тему «Мультиагентная модель для управления эффективностью Дельфи-процесса многотуровой экспертизы»

УДК 519.711

Е.П. ИЛЬИНА, О .А. СЛАБОСПИЦКАЯ

МУЛЬТИАГЕНТНАЯ МОДЕЛЬ ДЛЯ УПРАВЛЕНИЯ ЭФФЕКТИВНОСТЬЮ ДЕЛЬФИ-ПРОЦЕССА МНОГОТУРОВОЙ ЭКСПЕРТИЗЫ________________________________________________

Анотація. Розроблено формальний апарат моделювання ефективності Дельфі-процесу оцінки скалярного параметра. Він ґрунтується на моделях мультиагентного частково спостережуваного марківського процесу прийняття рішень та сімейства онтологій експертних точок зору. Запропоновано алгоритм експертного процесу, що здійснює чергування реальних турів з віртуальними мультиагентними.

Ключові слова: мультиагентний частково спостережуваний марківський процес прийняття рішень, Дельфі-процес, спільна політика, бізнес-обумовлена точка зору, сімейство онтологій експертних точок зору, функція когнітивної корисності, ефективність багатотурової експертизи.

Аннотация. Разработан формальный аппарат моделирования эффективности Дельфи-процесса оценки скалярного параметра. Он основан на моделях мультиагентного частично наблюдаемого марковского процесса принятия решений и семейства онтологий экспертных точек зрения. Предложен алгоритм экспертного процесса, чередующего реальные туры с виртуальными мультиа-гентными.

Ключевые слова: мультиагентный частично наблюдаемый марковский процесс принятия решений, Дельфи-процесс, совместная политика, бизнес-обусловленная точка зрения, семейство онтологий экспертных точек зрения, функция когнитивной полезности, эффективность многотуровой экспертизы.

Abstract. The formal device for Delphi process efficiency modeling of scalar parameter estimation was developed. It is based on both Decentralized POMDP and expert viewpoints ontology models family. The algorithm for expert process alternating real tours and virtual multi-agent ones was proposed.

Keywords: multy-agent partially observable markov decision process, Delphi-process, general policy, business-related viewpoint, ontologies family of expert viewpoints, cognitive utility function, effectiveness of multi-rounded expertize.

1. Введение. Постановка проблемы

Современные процессы принятия сложных и ответственных решений по управлению широко используют аппарат экспертной методологии [1]. Это обеспечивает непосредственное привлечение опыта специалистов в предметных областях, актуальных для объекта управления, с целью отсеивания, приоритетного выбора и обоснования решений в условиях слабой формализованности, информационной неопределенности и различий профессиональных и ведомственных взглядов на решаемую задачу.

Использование экспертной методологии осуществляется в самых разнообразных формах. В аспекте постановки задачи экспертизы распространены и анкетирование по поводу наличия у объекта заданных свойств и появлений, и ранжирование во множестве альтернатив [1, 2], и непосредственное оценивание как скалярного критерия, так и терминальных параметров в иерархической модели критерия предпочтений [1, 3]. В аспекте формы процедуры и природы итоговой оценки полярными являются индивидуальное оценивание с последующим обобщением и коллективное оценивание [1, 2]. Индивидуальное оценивание позволяет избежать давления на мнение экспертов. Однако в его стандартном варианте неясной остается стратегия дальнейших действий организатора экспертизы при неудовлетворительной согласованности индивидуальных оценок. Такой эффект может быть вызван совершенно разными причинами (различие информированности об объекте, разная смысловая интерпретация параметра его качества, предвзятое отношение к отдель-

© Ильина Е.П., Слабоспицкая О.А., 2012

ISSN 1028-9763. Математичні машини і системи, 2012, № 3

ным альтернативам и т.д.). Для подавления подобных негативных влияний прибегают к специальным процедурам подбора экспертов, предоставлению информационного контекста оценивания в рамках постановки проблемы, использованию многокритериальных моделей (опосредованное оценивание качества), сопровождению оценок их структурированным обоснованием. Одним из подходов, наиболее широко используемых с 60-х годов XX века, является метод Дельфи [5], балансирующий между индивидуальным оцениванием и коллективным. Все имеющиеся разновидности этого метода, которые различаются далеко не только технологически, но и в целевом, и в когнитивном плане [5], объединяет следующая схема.

Реализуется многотуровая процедура. В ней после обобщения индивидуальных оценок, полученных в очередном туре, при условии недостигнутости априорно заданного уровня их согласованности, участникам предоставляется некоторая информация о результатах тура. При этом открывается новый тур, дающий возможность изменить свои прежние оценки и во многих процедурах дать аргументацию своей позиции. Предоставляемая экспертам информация о проведенном туре рассматривается в модели Дельфи как содержание обратной связи между шагом обобщения и шагом индивидуального оценивания [5]. Во всех вариантах метода ее состав более узок, чем общедоступные данные при коллективном оценивании.

Как и следовало ожидать, при сохраняющемся действии неопределенного и неоднородного поля причин рассогласованности оценок не удается оценить шансы на сходимость процесса и, тем более, ее скорость. То же можно сказать об априорном выборе содержания обратных связей и рекомендуемом числе туров.

В предположении решающего влияния бизнес-обусловленных концептуальных взглядов экспертов на объекты экспертизы шансы для решения обозначенной выше проблемы управления эффективностью Дельфи-процесса предоставляет использование априорной информации о таких концепциях, соответствующих ведомственной и профессиональной принадлежности экспертов [6].

В данной работе исследуется подход к управлению эффективностью Дельфи-процесса, модель которого:

- использует для аргументирования индивидуальных оценок указание элементов профессиональной деятельности экспертов, представленных в априорной онтологической модели корпоративной точки зрения [7];

- постулирует принципы рационального поведения в согласовательном процессе;

- исходит из начального множества аргументированных индивидуальных оценок (результаты первого тура);

- формирует виртуальные туры с участием искусственных агентов, репрезентирующих выявленные позиции реальных экспертов.

Такой подход является актуальным для систем поддержки принятия экспертных решений, которое выполняется многократно (на этапах жизненного цикла экспертируемо-го объекта); касается взаимозависимых объектов; требует учета точек зрения, различающихся, но принадлежащих фиксированному множеству. В [8] показано, что именно таким условиям соответствуют процессы стратегического управления организациями и отраслями. В частности, соответствующие средства поддержки принятия экспертных решений необходимы в системах экспертно-аналитического сопровождения целевых программ [8].

Целью работы является построение модели Дельфи-процесса, обеспечивающей анализ перспектив его развертывания на основе аргументированных индивидуальных оценок в первом туре и априорной информации о точках зрения на предметную область, представители которых привлечены к экспертизе.

В качестве базового математического аппарата исследования были взяты:

- модель мультиагентного частично наблюдаемого марковского процесса принятия решений (МЧНМПР);

- парадигма онтологически базированных Дельфи-процессов (обозначаемых далее О-Дельфи) [7], развитием которой служит предлагаемый подход.

2. Используемые положения модели МЧНМПР

Обобщение трактовок, предложенных специалистами для базовых понятий децентрализованных марковских процессов принятия решений [9], позволяет сформулировать

Определение 1. Мультиагентный частично наблюдаемый марковский процесс принятия решений (МЧНМПР) с конечным горизонтом - это девятиэлементный кортеж

РЯ = (/; 5; {(Л,, О,); I = 1,..., п} Р; О; Я; Т; В), (1)

где I ={1,..., п} - конечное множество агентов, произвольным образом индексированных их номерами;

£ - конечное множество состояний мира;

Лі ={а ц, І >1} - конечное множество действий аі}-, доступных агенту і;

Пі ={ю ік, к >1} - конечное множество наблюдений состояния мира юік, доступных агенту і ;

Р = р(и | у,а* ) * - матричное представление марковской функции переходов

II І1и,ує5, а*€®Лі

между состояниями, где элемент р(и | у,а*) обозначает условную вероятность перехода мира из состояния V в состояние и в результате выполнения всеми агентами в состоянии V совместного действия а* = (а1,..., ап) є®г. =1 п Лі;

О =

* * * * о(ю | и,а ) * * - матрица, элементы о(ю | и,а ) которой - условные

и €5, а

вероятности совместного наблюдения ю* = (ю1,..., юп)€ ®г- =1 п О, в состоянии мира и€5 после выполнения всеми агентами совместного действия а* = (а1,..., ап)€ ®,=1 п Л1 и перехода мира в состояние и ;

Я :5х®г=1,...,п Лг ® ( -¥; ¥) - функция вознаграждения, значение Я(и,в *) которой представляет собой объем вознаграждения, совместно получаемого всеми агентами за выполнение в состоянии мира и€5 совместного действия в * = (в1,..., в п) €®г.=1 п Л,;

Т < ¥ - временной горизонт;

В = (Ъ(и), и€5) - начальное распределение вероятностей на множестве состояний мира, элемент Ъ(и) которого обозначает вероятность, что на момент начала процесса мир находится в состоянии и .

Применение приведенной модели МЧНМПР (1) для опосредованного управления мультиагентными процессами требует поиска локальных политик для каждого агента, которые совместно максимизируют их ожидаемое общее вознаграждение на протяжении периода Т при условии, что начальным распределением вероятностей на множестве состояний мира является В0 .

Модель МЧНМПР (1) определяет [9] представление локальной политики агента I € I = {1,..., п} в виде дерева (ориентированного ациклического графа). Вершинами этого графа являются действия агента ( а ^ €Л,, см. определение 1), а ребрами - его наблюдения (юш € О,), которые, с определенными вероятностями, могут иметь место после выполнения соответствующих действий.

Листьями дерева локальной политики являются действия, потенциально возможные на последнем, Т-м шаге процесса после соответствующей предыстории действий и наблюдений на протяжении Т-1 шагов.

Придерживаясь некоторой политики при выполнении МЧНМПР, агент на первом шаге выполняет действие, являющееся корнем соответствующего ей дерева, а дальше на каждом шаге процесса итеративно выбирает вложенную политику, представленную поддеревом, связанным с текущей вершиной-действием ребром, которое представляет действительное наблюдение агента после выполнения этого действия. Описанную сущность политики формализует рекурсивное

Определение 2 [10]. Случайная локальная подполитика агента 1-го уровня t (на шаге t) МЧНМПР - это пара

ч\ = (VI, П t)€ , (2)

где Qti - множество деревьев, являющихся представлениями допустимых подполитик уровня t;

VI : Лх Qit ®[0;1] - функция выбора действий, определяющая условные вероятности р(а, |^/) на множестве действий в зависимости от подполитики, выбранной на шаге t;

:Qit-1 хQ\хО, ®[0;1] - функция перехода, определяющая условные вероятности (обозначим их р(^{-11,юi )) выбора подполитик ( — 1)-го шага (т.е. qti-1 ) при условии, что на шаге t будет выбираться подполитика qti и иметь место наблюдение ю, € О,.

В данной работе для мультиагентной поддержки моделирования процесса О-Дельфи выбран оптимизационный подход [10] к пошаговому построению совместной политики агентов МЧНМПР с использованием определения 2. Сущность этого подхода фиксирует

Определение 3. Оптимизационная задача построения общей подполитики уровня t=1,...,Т состоит в определении кортежа отображений 5*=51,...,5п), таких, что

5»(8,(ю,),...,5(юп))=^;,...,);5, :О, ®,I = 1,...,п, (3)

которые максимизируют функцию ценности формируемой политики уровня (;+1)

V(ж)(а*,Ъ)=Я(а*,Ъ) + ю8Рг(ю*, 55 |а*,Ъ)Vt (5*(ю*),55) (4)

для заданного распределения вероятностей на множестве состояний мира Ъ€ В, совместного действия а*€ ®г=1 п Л1, множеств подполитик Q*t = ,...,Qt^ и функции ценности

уровня t :

Vt :Q* ®5®Я; Рг(ю*,55 |а*,Ъ) = о(ю* 155,а*) ^р(55|5,а*)Ъ(5); Я(а*,Ъ)=^Ъ(5)Я(5,а*).

3. Предметная область процесса О-Дельфи и принципы его моделирования

Целью организации и применения многотурового процесса поэтапного сближения индивидуальных экспертных оценок является повышение эффективности экспертного оценивания в условиях неоднородной информированности и заинтересованности экспертов относительно различных свойств, связей и проявлений экспертируемых объектов и процессов.

Основу парадигмы О-Дельфи составляет тезис о существенном вкладе в такую неоднородность различных бизнес-обусловленных точек зрения, представленных экспертами. Используя априорные знания о точках зрения, можно получить возможность создания искусственных агентов для их репрезентации. Это позволяет формировать виртуальные

туры Дельфи-процесса, строя и исследуя соответствующие модели класса МЧНМПР (1)-(4). Виртуальные туры могут как предшествовать реальным турам при участии экспертов, так и следовать за ними.

Реальными участниками процесса являются постановщики проблемы и эксперты, входящие в состав экспертной группы, модель которой определяет множество учитываемых точек зрения.

Виртуальные участники - это искусственные агенты. Каждый из них руководствуется в своих действиях знаниями о предметной области экспертизы, онтологически специфицированными для репрезентируемой им точки зрения, в составе используемых структур априорного знания.

Этап Дельфи-процесса является действием каждого из участников, включающим обязательные элементы:

- предоставление индивидуальной оценки скалярного целевого параметра X, характеризующего объект экспертизы;

- предоставление онтологически обусловленной аргументации оценки.

Кроме того, для большинства туров процесса к числу формируемых участниками элементов принадлежат также:

- оценка силы собственной предоставленной аргументации;

- оценка силы чужой аргументации, предоставленной другим экспертом вместе с его индивидуальной оценкой целевого параметра на предыдущем туре.

Рассмотрим базовые характеристики О-Дельфи в связи с предложенным в [7, 11] формализмом семейства онтологий экспертных точек зрения (СОЭТ), элементы которого используются как априорные структуры знаний об актуальных концептуальных взглядах на предметную область и об отношениях между концептами. Обозначим:

О - концепт, соответствующий классу экспертируемого объекта О;

X(О) - целевой параметр с искомым значением ХК и его оценками Х{ , предоставленными участниками I;

Р - постановка экспертной задачи, включающая, помимо О и X(О), множество УУ={У}, к которому принадлежат концепты из контекста решения проблемы, представленные своими объектами У.

Положим:

ХК € ББ, Хг € ББ, \ББ\ =М, Бг =(/ - 1)х(Н -Ь) /М + (Н -Ь)/(2М)€ ББ,

где ББ - множество дискретов, Б{ - центр I -го интервала.

Такая дискретизация значений параметра X с областью определения [Ь; Н], с одной стороны, предоставляет возможность работать с дискретной моделью МЧНМПР, а с другой, является естественной формализацией качественной шкалы, в которой отображаются М градаций X, где М определено как параметр знаний о концепте О .

Пусть для концепта О задано такое множество ЯЛ (О, X ,С) = {га} отношений между О и концептами С из состава СОЭТ, что каждое из отношений:

- определяет потенциальную возможность С служить аргументацией XK ;

- основывается в предикате, осуществляющем такое определение, только на системе частичных определений О и С в СОЭТ и на отношениях между концептами [11].

Определим множества концептов РЛ(О,X)={С| га(О, X, С)} - потенциальную аргументацию (О, X]). Кроме того, положим существование предиката Рг, определяющего

сужение множества потенциальной аргументации до множества аргументации, актуальной в условиях определенной постановки задачи:

Рг({X},{СР|СР€ Р}, РЛЛ(О,X)),

где Р - постановка экспертной проблемы;

Рг({X},{СР|СР€ Р}, РЛЛ(О,X)), РЛЛ(О,X)сРЛ(О,X) - множество актуальной аргументации.

Отметим, что предикат Рг может входить в число элементов частичного определения концепта соответствующей проблемы в СОЭТ, а может быть установлен посредством анализа предыстории решения проблем этого класса в ретроспективе экспертиз [8].

Предложенные определения предоставляют возможность автоматического формирования множества аргументов в виртуальных турах Дельфи-процесса, а также пересмотра множества аргументов в следующем виртуальном туре, вслед за сменой Xi .

Относительно оценки силы для Xi элемента аргументации Л, выдвинутого I -м

агентом - субъектом оценки, в качестве ее меры может использоваться значение метрики отношения информативности ЖЕ(О, Л), вычисленное в онтологии, соответствующей агенту точки зрения, как предложено в [11].

Оценка силы чужой аргументации, принадлежащей онтологии ] -й точки зрения, может быть выполнена агентом I -й точки зрения с применением аппарата функции когнитивной полезности, предложенного в [7]. При этом онтологический концепт С, используемый агентом ] как аргумент, получает свое определение в онтологии ] посредством выполнения операции погружения [11] его ближайшей семантической окрестности. Функция полезности результата операции для онтологии ] аккумулирует вклады позитивных эффектов (прояснение недоопределенности знаний о концептах, усвоение новых концептов) и конкурирующих с ними негативных (противоречия с имеющимися в ] знаниями, непо-нимаемость определений С в терминах концептов ] ). Количественный учет этих эффектов осуществляется использованием метрик соответствующих отношений, разработанных в аппарате СОЭТ [11].

Отдельный аспект парадигмы О-Дельфи, моделируемого с помощью аппарата МЧНМПР (1)-(4), составляют принципы рационального поведения экспертов. В данной работе к ним отнесены:

а) желание сохранить свои взгляды (минимальность уступки);

б) конструктивная реакция на убедительную аргументацию;

в) готовность к уступке ради компромисса.

В целом соответствия между основными концептами Дельфи-процесса и модели МЧНМПР приведены в табл. 1.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 1. Взаимоотношение концептов модели Дельфи-процесса и МЧНМПР

№ Концепт Дельфи-процесса Концепт МЧНМПР

1 Цель (получение эффективно согласованных оценок) Функция вознаграждения (зависящая от аргументированности оценок и расстояний между ними)

2 Эксперт Агент

3 Оценка, полученная в невиртуальном первом туре Начальное состояние мира

4 Рациональность поведения (соблюдение собственных убеждений) Матрица вероятностей переходов (зависящая от скачка собственной оценки )

5 Индивидуальное экспертное мнение в повторном туре (аргументированная оценка целевого параметра и аргументации Действие

Продолж. табл. 1

чужих мнений предыдущего тура)

6 Содержание обратных связей (оценки и аргументация предыдущего тура) Наблюдения, доступные агенту в текущем состоянии мира

7 Предельное количество туров Установленный временной горизонт

8 Шкала оценивания целевого параметра Возможные состояния мира

9 Сценарий поведения искусственных агентов, представляющих точки зрения из состава модели экспертной группы Политика

Рассмотрим собственно формализацию Дельфи-процесса с помощью модели МЧНМПР.

Для применения модели МЧНМПР процесс О-Дельфи рассматривается в следующем варианте постановки задачи. Многотуровый процесс принятия решений используется для установления такого значения некоторой скалярной характеристики XK€ [Ь; Н],0 < Ь < Н на заданном числовом промежутке [Ь; Н ], которое осуществляет компромисс индивидуальных мнений привлеченных экспертов. Дополнительно допускается независимость наблюдений экспертов. Вводится также параметр риска О-Дельфи о € [0; 1].

Предусматриваются две формы туров О-Дельфи:

- реальный тур, на протяжении которого каждый эксперт к предоставляет свои оценки ёк для XK и оценки в*(к, аг(к, ёк ));

- виртуальный тур, смысл которого заключается в поиске совместной политики всех экспертов на основании предоставленных ими оценок и априорного знания относительно предметной области, а также оценки характеристик последующего хода процесса при реализации такой политики.

Пусть определены три вспомогательных функции:

аг (к, йк): ¡Б® 8Б ® РЛ(О, X)

- аргументирования экспертом к дискрета ёк , выбранного им при действии ак ;

е(к, аг(I, ёг)): ¡Б ® РЛ(О, X) ® [0; Л]

- оценивания экспертом к аргументации, предоставленной другим экспертом и Ф к для выбранного им дискрета в рамках его действия аи на предыдущем шаге О-Дельфи, при выполнении экспертом к действия ак ;

е* (к, аг (к, йк )): ¡Б ® РЛ(О, X) ®[0; Л]

- оценивания экспертом к аргументации, предоставленной им самим для выбранного дискрета на текущем шаге Дельфи-процесса при выполнении действия ак, где Л -максимально возможное значение оценки аргументации.

Формальное представление содержательных определений элементов модели МЧНМПР (1), предложенных для описания Дельфи-процесса в табл. 1, фиксирует

Определение 4. Представление Дельфи-процесса как МЧНМПР с конечным горизонтом - это девятиэлементный кортеж

БР = (¡Б;8Б;ЛБ;О.Б;РБ;ОБ,ЯБ;ТБ;ВБ ), (5)

где ¡Б = {1,..., и} - множество экспертов, привлеченных к Дельфи-процессу;

РБ

и^ ,а~€®-АБ - V — \р*(и | ^аг*)/(Т р(и | у,а*)),\и~у | <а’

£Б - множество дискретов априорно определенного размера (Н_Ь)/М ;

^Б = {//,/ =[Ь + (/_ 1)(Н _Ь)/М;Ь+/(Н _Ь)/М]/ = 1,...,М}, (6)

средние точки которых рассматриваются в роли оценок искомого значения XK€ [Ь; Н];

Н и Ь - верхняя и нижняя границы числового интервала, где разворачивается Дельфи-процесс;

М - параметр точности искомого результата Дельфи-процесса;

ЛБ = {ак } - множество индивидуальных действий произвольного эксперта к :

ак =(ак, аг(к, ак X Ек); ак €^б ; аг(к, ¿к)€ PЛ(0, X);

Ек ={е(к, аг (1, ¿1)), е(к, аг (2, ¿2)),..., е(к, аг (к _ 1, ¿к-1)), е* (к, аг (к, ёк )),..., е(к, аг (и, ёп )^; (7)

¿к - дискрет, выбранный экспертом к при выполнении им действия ак ;

ОБ ={ю к} - множество индивидуальных наблюдений, доступных для произвольного эксперта к (т - отметка транспонирования строки);

Ю к =( Бк ; ЛЯк ; ЕЕк ); Бк = (¿1, ¿2,-., ¿к _1, ¿к+1,"., ¿п ); ЕЕк = (Е1, Е2,..., Ек _1, Ек+1,..., Еп ) ; (8)

ЛЯк = ( аг (1, ¿1), аг (2, ё 2)),..., аг (к, ёк _1)), аг (к, ёк+1)),..., аг (и, ёп ));

0,| и-V |>^

'/(! |и ^|<а

р * (и^,а *)=| и - V | х|{а к € а * | / (а к )=и} / и; а * = (а1, а 2,..., а п )€ ®п ЛБ;

/ :ЛБ ® £Б, /(ак )=¿к - функция, сопоставляющая индивидуальному действию эксперта (ак) выбранный им дискрет ( ¿к );

О =|\о° (Ю | V,а * | ш*€®п оБ,и €5Б,а*€®пЛБ ; ^ (Ю |и,а * ) = Пк =1,...,пР(Ю к М * ); (10)

( I ^ I1, приЮк Бк = (/(а1), . ,У(ак_1),У(ак+1),.,/(ап ))

Р(юк|и,а )=< ;

[0 - иначе

юк .Бк - вектор наблюдаемых дискретов, выбранных агентами О-Дельфи IФ к на предыдущем шаге Дельфи-процесса, в составе наблюдения ю к;

Я : 8Б х ®п ЛБ ® [- 50; 50] - функция вознаграждения специального вида

Я(и, в *)=100 х[1/2 - (|ц(/ (в к)) _ и И/ф к ))х^(г(Р к .Ек))/ (Н - Ь))Ц (11)

в к .Ек - вектор оценок аргументации (6), которые будут предоставлены во время вы-

полнения действия вк;

ц(») - медиана выборки, а у(») - выборочный квартальный коэффициент вариации [8], то есть отношение медианы к удвоенной разности третьего и первого квартилей;

ТБ - количество шагов процесса О-Дельфи;

ВБ = (ЪБ (и), и€$Б ) - вектор вероятностей события, что в начале процесса оценкой XK является и € $Б, которые имеют вид

р (и|^а ) „„€*б,а.€®пЛБ; р (ик,а )=(9)

**

ЪБ (и ) = .I1, при и = (^к^.^к^ ,аг (к ,ак )))/Ек=1,...,пе*(к ,аг (к ,ак )).

[0 - иначе

¿к €SБ - дискрет, выбранный экспертом к во время выполнения его действия ак .

Предложенная модель представления процесса О-Дельфи как МЧНМПР и алгоритмы ее использования включают три параметра управления: точность (М ), продолжительность, или горизонт (ТБ), рискованность (о), значения которых при моделировании

должны задаваться априорно.

Точность (М) определяет шкалу дискретов и связана с количеством качественных

градаций, целесообразным для селевого параметра. Как правило, спектр таких градаций легко выявляется посредством предварительного интервьюирования специалистов ПрО. Продолжительность связана с количеством туров процесса О-Дельфи, которое является приемлемым для организаторов по критерию «качество/цена». Рискованность (о) введена для отображения готовности к риску, ожидаемой от участников процесса. Можно рекомендовать начинать моделирование, принимая о=и1 /М, где и1 - состояние мира, достигнутое в реальном туре (соответствует осторожной стратегии).

4. Использование МЧНМПР для повышения эффективности многотуровых экспертиз, организуемых с привлечением априорных знаний

Предложенная в данной работе формализация О-Дельфи предоставляет последующее развитие результатов [7], осуществляемое для частного случая задачи экспертизы (оценка скалярного критерия). Такая возможность возникает за счет экспериментирования с моделью развития Дельфи-процесса, который стартует с реальных начальных условий и протекает согласно принципам, воспроизводящим концептуальное соотношение реально привлеченных точек зрения, ожидаемое на основании априорной информации относительно ПрО принятия решений. В пределах заложенных предположений экспериментирование позволяет получить:

- прогноз эффективности последующих к туров;

- консультацию относительно ожидаемых возражений и непониманий в последующих турах для участников, частично продемонстрировавших свою позицию;

- оценку эффективности построения многотурового процесса на основе другой, альтернативной парадигмы.

На рис. 1 приведена схема динамического управления процессом О-Дельфи, которая включает:

- основные действия, выполняемые при динамическом управлении Дельфи-процессом в соответствии с рассматриваемым подходом (обозначенные ромбами);

- концептуальные и ретроспективные знания относительно ПрО экспертизы (параллелепипеды);

- постановку задачи на разных стадиях ее интерпретации и актуализации (прямоугольники с двойным контуром);

- промежуточные структуры знаний, продуцируемые и используемые выполняемыми действиями (закругленные прямоугольники).

Целью организуемого процесса является получение такой оценки целевого параметра экспертируемого объекта, которая обеспечивает наиболее полное и непротиворечивое воспроизведение точек зрения на этот объект, имеющих место в ПрО. На схеме видно, какие трансформации претерпевает постановка задачи экспертизы. Из постановки, идентифицирующей потребности внешнего субъекта, она, прежде всего, трансформируется в

вопрос, поставленный в терминах и в контексте объектного и субъектного измерения проблемной ситуации в ПрО.

Это происходит посредством:

- онтологизации элементов постановки (интерпретации базовых элементов концептами СОЭТ и извлечения релевантных знаний из структур априорного знания о ПрО);

- концептуальной идентификации экспертной группы (выявления состава точек зрения, носителями которых являются эксперты).

Полученная постановка адресована участникам реального тура процесса оценивания.

Рис. 1. Организация Дельфи-процесса с использованием МЧНМПР

Если такой тур не является первым, дополнением к нему служит содержание обратных связей, позволяющих реализовать функцию консультирования для экспертов.

Наконец, наиболее удаленной от изначально заданной является постановка для моделирования виртуального тура. Она формируется на основе интерпретации исходных структур модели МЧНМПР, описанных выше, при аналитическом рассмотрении результатов действия “Выполнение реального тура”.

Означивание ряда элементов постановки, представляющих собой параметры управления, остается неформальной процедурой, хотя и производится на основе формально полученных характеристик.

Так, увеличение горизонта Т° с последующим увеличением рискованности а потенцируется низкой согласованностью индивидуальных оценок в нескольких реальных турах подряд при выявлении тех же тенденций в сопутствующих виртуальных турах, а уменьшение параметра рискованности а целесообразно, когда результаты реального тура, хотя и неудовлетворительные, оказываются лучше, чем результаты виртуального.

Среди действий, включенных в схему, можно выделить:

- средства адаптации к имеющимся знаниям относительно ПрО и опыту работы в ней («Онтологизация постановки экспертной задачи» и «Концептуальная идентификация экспертной группы»);

- средства поддержки реального и виртуального туров;

- средства аналитической поддержки выбора последующего сценария и формирования контекста его реализации («Аналитическая обработка результатов тура», «Формирование обратных связей»).

Аналитическая обработка результатов тура формирует, по результатам реального тура, результаты интеграции экспертных мнений и оценок качества такой интеграции, рассмотренные в предыдущих исследованиях по онтологически базированным экспертизам [11]. Кроме того, формируются версия аргументационного поля, скорректированная экспертами, и перекрестные оценки предоставленной аргументации, вычисленные формально с помощью средств использования априорных знаний [7]. К свойствам оценок добавляется характеристика полезности тура , и,:

и, = (£=,...|х, -ХК, \хСЕ„)/ (Лх п х (Н-I)), (12)

где X, - оценка / -го эксперта в туре ,;

ХК, - результирующая оценка для тура ,;

СЕ, - средняя, для всех вычисленных, оценка аргументированности X, ;

Н и Ь - границы области изменения X;

п - количество экспертов;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Л - максимально возможная оценка аргументации.

Выводы, которые формируются после этого аналитического действия, касаются выбора дальнейших действий.

Действие «Моделирование виртуального тура» продуцирует компромиссные оценки и их аргументацию вместе с историей их достижения (потурово), а также оценки полезности: и Ф для финального тура, для которого она вычисляется как вознаграждение (11), и для процесса в целом: иПР =иф -и1, где и1 оценивается по формуле (12).

Действие «Формирование обратных связей» определяет множества:

- конфликтных агентов, к которым принадлежат те, чьи действия создают самые низкие вклады в вознаграждение;

- конфликтных аспектов элементов аргументации, которые обусловливают наиболее существенную долю обнаруженных противоречий;

- свойств получаемого в виртуальном туре гипотетического компромисса, вклю-

чающих интегральную оценку его аргументированности, а также оценки полезности: иПР, иф и коэффициент к = ^и Ф ) / ^ и.

Управление процессом О-Дельфи в рамках предложенной схемы начинается с проведения реального первого тура экспертизы. Если выводы после аналитической обработки его результатов свидетельствуют об их неудовлетворительности или неубедительности, осуществляется обращение к моделированию виртуального тура. Последнее может быть многократным с различными значениями горизонта моделирования. Целью является формирование решения о целесообразности многотуровой процедуры, которое относится к выводам при выполнении действия «Формирование обратных связей».

Частный случай составляет ситуация, когда свойства решения начального реального тура свидетельствовали о возможности разбиения экспертной группы на две партии, представляющие полярные взгляды на объект экспертизы [5, 7]. В этом случае моделирование

виртуальных туров осуществляется отдельно для каждой из сформированных партий, а вывод о реальном осуществлении следующих туров делается только тогда, когда удовлетворительный прогноз получен для каждой из партий.

При продолжении процесса О-Дельфи (с одной или двумя экспертными группами) каждому реальному туру предшествует проведение виртуального, который поставляет участникам реальных туров консультативную информацию, повышающую шансы на эффективную коррекцию ими оценок и их аргументации. Очевидно, что необходимыми условиями достижения позитивного эффекта использования рассмотренного алгоритма являются:

- актуальное состояние априорных знаний о ПрО;

- соответствие состава экспертной группы ее модели;

- достаточно широкое варьирование значений параметров управления при моделировании виртуальных туров.

5. Выводы

1. Предложенное формальное представление многотурового Дельфи-процесса как муль-тиагентного частично наблюдаемого марковского процесса принятия решений открывает возможность для управления его эффективностью.

2. Онтологическая базированность моделируемого Дельфи-процесса обеспечивает формирование политики, направленной не только на сближение оценок, но и на повышение убедительности их аргументации.

3. Разработанный алгоритм последовательного использования реальных и виртуальных туров Дельфи-процесса позволяет принимать решения по поводу:

- целесообразности применения многотуровой процедуры;

- выбора ее эффективной формы (с одной экспертной группой либо парой полярно ориентированных групп);

- содержания обратных связей для реальных туров;

- перспективного количества осуществляемых туров.

СПИСОК ЛИТЕРАТУРЫ

1. Тоценко В.Г. Методы и системы поддержки принятия решений. Алгоритмический аспект. - К., Наукова думка, 2002. - 381 с.

2. Крымский С.Б. и др. Экспертные оценки в социологических исследованиях. - К.: Наукова думка, 1990. - 320 с.

3. Von Winterfeldt D. Decision Analysis and Behavioral Research / D. von Winterfeldt, W. Edwards. -Cambridge: Cambridge University Press, International edition, 1986. - 604 p.

4. Научно-техническое прогнозирование для промышленности и правительственных учреждений / Пер. с англ.; под ред. Г.М. Доброва. - М.: Прогресс, 1972. - 185 с.

5. Turoff M. The Delphi Method: Techniques and Applications [Електронний ресурс] / М. Turoff, Н. Linstone. - Addison-Wesley, 2002. - 608 р. - Режим доступу: http://www.is.njit.edu/ pubs/delphibook.

6. Ильина Е.П. Задачи и методы аналитического сопровождения экспертиз в партисипативных процессах стратегического управления / Ильина Е.П. // Проблемы программирования. - 2006. -№ 2-3.- C. 421 - 430.

7. Ильина Е.П. Функции и методы поддержки современных парадигм метода Дельфи / Е.П. Ильина // Проблемы программирования. - 2009. - № 1. - С. 36 - 52.

8. Ильина Е.П. Автоматизированная поддержка принятия решений по управлению программами фундаментальных научных исследований с использованием экспертной методологии / Ильина Е.П., Слабоспицкая О.А., Синицын И.П., Яблокова Т.Л. - Киев, 2010. - 94 с. (Препринт / Институт программных систем НАН Украины).

9. Seuken S. Formal Models and Algorithms for Decentralized Decision Making under Uncertainty /

S. Seuken, S. Zilberstein // Journal of Autonomous Agents and Multi-Agent Systems. - 2008. - № 17 (2).

- P. 90 - 250.

10. Wu F. Trial-Based Dynamic Programming for Multi-Agent Planning [Електронний ресурс] / F. Wu,

S. Zilberstein, X. Chen. - 2010. - 6 p. - Режим доступу: www.aaai.org.

11. Ильина Е.П. Оценка и использование показателей качества экспертного решения проблемы / Е.П. Ильина // Проблемы программирования. - 2006. - № 1. - С. 38 - 45.

Стаття надійшла до редакції 05.12.2012

i Надоели баннеры? Вы всегда можете отключить рекламу.