УДК 681.3.06
ФОРМИРОВАНИЕ ЭКСПЕРТНОГО ВЫВОДА НА ОСНОВЕ ТЕОРИИ СВИДЕТЕЛЬСТВ
Е.А. Ганцева, В.А. Каладзе, А.М. Поляков
В процедурах получения обобщённого экспертного вывода используются методы теории случайных множеств или теории свидетельств, называемой также по имени её авторов - теории Демпстера-Шефера, основанные на специальных функциях доверия, правдоподобия и правил объединения функций доверия, сформулированных для свидетельств, полученных из разных информационных источников
Ключевые слова: теория свидетельств, экспертный вывод, доверие, правдоподобие
Проблема управления персоналом в нашей стране по большей части является предметом научных и прикладных изысканий гуманитарных наук, таких как философия, социология, психология, педагогика. Математические методы исследований в сфере управления персоналом пока что не заняли достойного места: серьёзно ими занимается сравнительно небольшой круг отечественных учёных. Однако и в зарубежной литературе в этом направлении использованию современных математических методов исследования не уделяется должного внимания. По своей важности и ответственности управление персоналом должно занимать одно из центральных мест в управлении организацией, кадровыми ресурсами, основной составляющей в котором является процедура отбора кадрового состава.
В работе на основе математической теории свидетельств Демпстера-Шефера (ТСДШ) предложено решение задачи получения результирующего заключения путём объединения экспертных высказываний, полученных из разных источников и, вообще говоря, с разной информационной ценностью. При этом полученное решение должно быть сбалансированным и достоверным в рамках поставленной проблемы.
Реальные социально-профессиональные характеристики (СПХ) исследуемого конкурсанта как объекта исследования принадлежат к разным классам с достаточно точно очерченными границами, в которых представлены свойства каждого конкретного испытуемого.
Пусть, например, предложены два высказывания по одной характеристике СПХ, которая определяется тремя специфическими аксиомами уь у2 и у3, отражающими особенности экспертного вывода, из стандартного [1] множества Г. В ТСДШ эти аксиомы называются гипотезами, и этой терминологии в данной работе будем придерживаться. В этих высказываниях необходимо различить присутствие или отсутствие этих гипотез, а также выделить и согласовать общую полезную информацию, которая
Ганцева Екатерина Александровна - ВГТУ, канд. техн. наук, доцент, e-mail:[email protected] Каладзе Владимир Александрович - МИКТ, д-р техн. наук, ст. науч. сотрудник, e-mail: [email protected] Поляков Александр Михайлович - ВИВТ, аспирант, e-mail: [email protected]
может способствовать установлению на их основе достоверной результирующей оценки [2].
Однако результаты тестирования, экспертизы, анкетирования, изучения в фокус-группах и т.п. не дают точного описания СПХ, поскольку представлены в субъективной реализации и достаточно размытыми формулировками в виде высказываний. Поэтому результаты таких освидетельствований могут быть схожими, противоречивыми, а чаще всего имеют близкие описательные формы [3]. Для различения в таких аморфных высказываниях искомых СПХ объектов исследования необходимо учитывать связь с оценками СПХ шаблонного состава описательных характеристик освидетельствования объектов [3], оценки которых будем рассматривать как исходные гипотезы исследования, выраженные в форме высказываний профессиональных аналитиков заинтересованной организации.
Для формирования обоснованного мнения по исследуемой проблеме на множестве высказываний (логических рассуждений) экспертов использована математическая теория свидетельств Демпстера-Шефера. Данный подход позволяет в структурированном пространстве гипотез при наличии информационной неопределённости получить достоверную оценку результирующего мнения коллектива экспертов с обоснованным уровнем уверенности. С этой целью формируется функция доверия, позволяющая скомбинировать сложное высказывание из частных высказываний экспертов как собственных подмножеств, относительно их базовых мер. Далее по мере накопления новых свидетельств применяется специализированный аппарат оперативного обновления доверительного множества высказываний.
Методы теории Демпстера-Шефера, опирающиеся на интервальное представление оценок, являются альтернативой интуитивным способам обработки неопределённых данных, поскольку имеют математическое обоснование, построенное на круге аксиом, в отличие от эвристических методов, использующих, например, эмпирические коэффициенты неопределённости.
Для корректного использования методов ТСДШ в области экспертного оценивания воспользуемся основными допущениями и выводами этой теории.
Рассматривая гипотезы как элементарные случайные события, положим, что они составляют пол-
ную группу, т.е. сами исходные свидетельства - гипотезы jj 6 Г (с присвоенными им обобщёнными, базовыми вероятностями) являются взаимно исключающими, а их набор Г - исчерпывающим, обеспечивающим полноту. Высказанные требования в каждом конкретном случае гарантируют достоверность лишь одной гипотезы из шаблонного состава СПХ [3].
Вероятности гипотез как возможных исходов некоторого сложного события (рассматриваемого высказывания) присваиваются в зависимости от информации, определяющей один из исходов более вероятным по отношению к другим. При этом понятие вероятности здесь следует рассматривать как обобщение классического понятия вероятности, определённое не на самом Г, а на его булеане.
Полагается также, что возможно выработать способ формирования свидетельств не только в пользу каждой гипотезы у,-, но и в пользу любых высказываний как подмножеств A, ç B, построенных на универсальном множестве гипотез, которые могут быть сформированы на основе объединения гипотез. Здесь B - булеан на множестве Г. Мощности m, 6 M подмножеств A, как меры высказываний нормированы на B и формируют свидетельства в пользу соответствующих высказываний. Таким образом, свидетельство по каждому высказыванию определяется однозначно и независимо относительно свидетельств по другим высказываниям.
Поскольку каждая мера является элементом множества M, то построение соответствия между M и B позволяет связать элементы из M с подмножествами пространства B. Определяя каждое такое подмножество как единственный элемент фокального множества A, 6 A [4], устанавливаем тем самым однозначное отображение элементов множества M на элементы множества A.
Выдвинутое предположение об исчерпывающей полноте множества гипотез Г означает, что ни один из элементов m, 6 M не отображается на пустое множество, т.е. для каждого свидетельства существует хотя бы одна гипотеза или высказывание, достоверность которого подтверждает данное свидетельство.
Для каждого фокального элемента A, 6 A как подмножества булеана (A,- ç B) могут быть определены верхняя и нижняя границы его интервала возможностей [5]. Оценка вероятности фокального элемента A, будет ограничена снизу оценкой доверия к Aj, а сверху - оценкой правдоподобия A,, поэтому расчётную информацию о точечной оценке меры данного подмножества удобно рассматривать в интервальной форме в виде доверительного интервала [bel{A,), pls(A,)]. Этот интервал содержит точную величину вероятности рассматриваемого подмножества (в классическом смысле) и ограничен двумя интегральными (аддитивными в дискретном случае) мерами, определяемыми как доверие и правдоподобие
bel (Ai ) < P(A ) < pls(A ). (1)
Величина этого интервала определяет погрешность оценки вероятности подмножества и может служить оценкой неуверенности в справедливости свидетельств по Л, из исходного множества гипотез.
Функция доверия в ТСДШ - это также функция (в англоязычной литературе) присвоения базовых вероятностей (basic probability assignment). Суммарное доверие bel для любого фокального элемента Лi определяет суммарный уровень уверенности к нему и может быть найдено суммированием значений m по всем подмножествам в Л,.
Доверие (belief) bel(A) к множеству определяется [5] как сумма всех мер его собственных подмножеств Лр
bel (A,) = £ m(Aj ) . (2)
Ве1(В) всегда равно 1 независимо от значений мер его множеств, что непосредственно вытекает из правила присвоения базовых вероятностей. Значения bel и m равны, если множество не содержит собственных подмножеств.
В ТСДШ изменение уровня доверия к подмножеству высказываний Л, не приводит к изменению доверия к остальным гипотезам, поскольку
Ье1(Л) + bel( A) < 1. Остаток после суммирования
уровней доверия Л, и к Д. - это уровень игнорирования гипотезы Л,.
Правдоподобие (plausibility) рЩЛ) - это сумма мер всех множеств Лk с B, пересекающихся со множеством Лi (Л, п Лк ^0)
pls(A) = Zm(Ak). (3)
k
Оценка правдоподобия рЬ(Л,) представляет возможность совместимости свидетельства с гипотезами в Л,. Значение оценки рЬ^Л,) можно рассматривать как предел, до которого можно повышать доверие к гипотезам из Л, при известных свидетельствах в пользу гипотез-конкурентов.
Эти обе меры связаны между собой
pls( A ) = 1- bel (A ). (4)
Поскольку определенная таким образом оценка правдоподобия Л, есть не что иное, как мера
нашего недоверия к A . По любой из этих характеристик можно вычислить две другие.
Для объединения нескольких высказываний из разных информационных источников, отличающихся уровнем достоверности, используется комбинационное правило Демпстера [6]. Объединение, рассматриваемое как присоединённая мера mi2, вычисляется при двух источниках информации для соответствующей пары мер mi е Mi и m2 е M2 следующим образом
да12 (0) = 0, ЩМ) = 7^ Z mi(C)m20D), (5)
1 - K
CnDe A #0
где
к = £ т (Е)т ср). (6)
Е л ^=0
Выражения (5) - (6) легко распространяются на произвольное число источников.
Следует учитывать, что значения т\ и т2 сформированы по независимым источникам свидетельств в пределах того же пространства гипотез.
К определяет меру конфликта между двумя наборами мер. Нормализирующий множитель, 1 - К, позволяет полностью нивелировать [7] несоответствия информационных источников и предотвратить в случае конфликта отображения меры на пустое множество.
Завершающим этапом процедуры является проведение действий, направленных на выявление высказываний, наиболее хорошо отвечающих цели основной задачи. Для этого в качестве критерия используем принцип максимального правдоподобия [8]:
тах[ рк(А*)], (7)
где А* - /-е сложное высказывание, полученное после объединения исходных высказываний с помощью комбинационного правила Демпстера.
Прикладная реализация ТСДШ в задаче управления кадрами предприятия, в которой заложена большая доля субъективного подхода, приводит порой к пересмотру самой постановки [9].
Задача управления процедурой отбора кадрового состава предприятия актуальна как с точки зрения выбора подходов, используемых при проведении экспертизы, так и с точки зрения методов, используемых при обработке её результатов. Про-
фессиональные качества - это в большей степени субъективное понятие. В связи с этим одной из сложностей, возникающих на этапе отбора кандидата на вакантную должность, является определение относительной ценности этих качеств. В этой связи рабочей группе экспертов при отборе персонала сложно прийти к единому решению. Для решения этой задачи были предложены [2] процедуры построения композиционной модели, включающие в себя такие инструменты, как экспертные системы, теория Демпстера-Шефера, нечёткая логика, семантические сети, а применение нейронных сетей позволит производить оценку данных на основе ранних прецедентов [10]. В данном случае рассмотрим использование теории свидетельств Демпстера-Шефера для решения наиболее спорных моментов, возникающих у экспертов при экспертизе кадрового состава. Внедрение данного подхода возможно, как на этапе предварительного отбора рекрутов, так и при оценке профессиональных качеств сотрудников. На этапе формирования исходных данных по оцениванию компетенций респондентов необходимо учитывать, что набор компетенций подбирается для каждой должности отдельно. Важно учитывать ранее уже отмечавшуюся субъективность подходов, существующее у каждого сотрудника по работе с персоналом своё понятийное представление по каждому из профессиональных качеств. Чтобы снизить влияние такой субъективности в оценке данных показателей предлагается использовать численную оценку данных качеств.
Таблица 1
Профессиональные качества рекрута
Балльные оценки Профессиональные навыки Умение работать в команде Аналитические способности Адаптация к новым условиям Внимательность Ответственность Коммуникабельность Организаторские способности Стрессоустойчивость Способность к рутине Работа в ночное время Ценность
Профессиональные навыки 3 2 1 3 3 2 2 1 2 3 22
Умение работать в команде 3 2 1 2 3 3 3 3 2 1 23
Аналитические способности 2 2 2 1 2 2 1 2 3 2 19
Адаптация к новым условиям 1 2 2 3 2 2 2 3 1 3 21
Внимательность 3 2 1 1 3 2 1 1 3 3 20
Ответственность 3 3 3 1 3 2 3 1 3 3 25
Коммуникабельность 2 2 1 1 2 2 1 1 1 2 15
Организаторские способности 1 2 2 3 3 1 3 3 3 1 22
Стрессоустойчивость 1 3 2 3 1 1 1 3 2 2 19
Способность к рутине 2 2 3 1 3 3 1 3 2 1 21
Работа в ночное время 3 1 2 3 3 3 2 1 2 1 21
Рекрут, не обладающий совокупностью указанных профессиональных качеств, мало пригоден для работы в банке. Совокупность профессиональных качеств является основной частью стандартов экспертизы. Представленный набор профессионально важных свойств сотрудников является основой для формирования множества гипотез в используемой ТСДШ.
Применение теории свидетельств позволяет отказаться от используемой в настоящее время сложной и малопродуктивной оценки профессиональных качеств экспертов, которая сводится к следующему. Создаётся экспертная группа из п независимых экспертов, которые производят оценку ситуации в условиях неопределённости в форме набора высказываний А,' = 1, - П , представленного на
множестве возможных альтернатив по оценке количеств рекрутов. Для определения качества полученных высказываний проводится предварительная оценка компетентности самих экспертов.
Таблица 2
Весовые коэффициенты компетентности экспертов
Эксперт 1 Эксперт 2 Эксперт 3 Эксперт 4 Эксперт 5
0,9 0,5 0,7 0,7 0,7
Каждый этап экспертизы предполагается независимым в ходе всей процедуры. За коллективную оценку А принимается общая часть всех экспертных оценок как пересечение множеств А. Недостатком такого подхода является возможность получения коллективной оценки в виде пустого множества. Для выхода из данной ситуации за коллективную оценку рекрута обычно принимается индивидуальная оценка наиболее компетентного эксперта, что не является корректным решением проблемы.
Результирующая информация, получаемая от группы экспертов, может быть представлена в виде:
- числовых оценок,
- лингвистических величин.
Экспертные оценки лежат в расчётных интервалах и для разрешения такой ситуации обычно применяются данные типа табл. 3, в которой уже проставлены весовые коэффициенты каждого оцениваемого качества рекрута.
По числовым значениям проводится оценка статистическими методами, что нельзя сказать о лингвистических величинах.
В этом случае для обработки данных применяются методы принятия решений в условиях неопределённости, такие как методы Вальда, Севиджа, Гурвица и т.п.
Таблица 3 Шкала экспертных оценок
Оценка Характеристика Коэффициент
Новичок (первая работа) Плохо представляет себе основные цели и задачи, которые необходимо будет выполнять в рамках будущих компетенций 0,0 -0,3
Не первый опыт работы, но первый опыт в рамках новых компетенций Имеет представление об основных целях и задачах, которые будут в рамках будущей компетенции 0,4 -0,6
Не первый опыт работы в рамках данной компетенции Имеет чёткое и устоявшееся представление об основных целях и задачах, которые будут в рамках будущей компетенции 0,7 -0,9
В более продвинутых случаях применяются нечёткие (fuzzy) методы с манипуляциями над функциями принадлежности.
Однако оценки экспертной группы часто сложно совместить с подобными методиками, поскольку на оценки экспертов могут влиять как их внутренние проблемы, так и необходимость жестких компромиссов из-за сложившихся отношений внутри экспертной группы. Кроме того, результаты экспертизы могут поступать не только от экспертной группы, но и из анкетирования, тестов и т.п.
В разрешении такого рода ситуаций оказывается наиболее целесообразным применение математической теории Демпстера-Шефера, которая оказывается эффективной в случае неоднородности информации, неопределённости и недостатка исходных данных.
Рассмотрим следующий пример.
Таблица 4
Случайные множества Присвоенные базовые меры Доверие Правдоподобие
Пустое 0 0 0
Исходные гипотезы Г = 0uyiuy2uy3 yi 0.17 0.17 0.37
У2 0.26 0.26 0.47
Уз 0.32 0.32 0.54
Сложные высказывания У1^У2 0.03 0.46 0.68
У1^Уз 0.04 0.53 0.74
У2^Уз 0.05 0.63 0.83
Универсальное 0.13 1 1
Выбор способа представления является определяющим для организации структуры любого приложения. Наиболее эффективным в рассматриваемой ситуации является представление знаний в интеллектуальных системах, в частности в экспертных системах [2]. А использование искусственных нейронных сетей позволит производить оценку профессиональных качеств по ранним прецедентам.
Литература
1. Поляков, А.М. Применение теории Демпстера-Шефера к системе построенной на нечетких отношениях [Текст] / А.М. Поляков // Информатика: проблемы, методология, технологии: сб. тр. XIV междунар. конф. - Воронеж, 2014. - С. 243-244.
2. Ганцева, Е.А. Интеллектуальный критерий качества математических моделей сложных систем: идеология, перспективы разработки [Текст] / Е.А. Ганцева, В.А. Каладзе, А.М. Поляков // Вестник Воронежского государственного технического университета. - 2013. - Т. 9, № 5.1. - С. 52-56.
3. Поляков, А.М. Экспертное оценивание компетенций при отборе персонала [Текст] / А.М. Поляков // Информатика: проблемы, методология, технологии: сб. тр. XIV междунар. конф. - Воронеж, 2013. - С. 156.
4. Smets P. The application of the matrix calculus to belief functions [Text] / P. Smets // Int. Journal of Approximate Reasoning. - 2002. - Vol. 31. - P. 1-30.
Воронежский государственный технический универси Международный институт компьютерных технологий Воронежский институт высоких технологий
5. Shafer, G. A Mathematical Theory of Evidence [Text] / G. Shafer- Princeton: Princeton University Press, 1976. - 297 p.
6. Dempster, A.P. A generalization of Bayesian inference [Text] / A.P. Dempster // Journal of the Royal Statistical Society. - 1968. - Vol. 30. - P. 205-247.
7. Jiang W. A New Method to Determine BPA in Evidence Theory [Text] / W. Jiang, Y. Deng, J. Peng // Journal of Computers. - 2011. - Vol. 6, № 6. - P. 1162-1167.
8. Левин, Б.Р. Теоретические основы статистической радиотехники [Текст] / Б.Р. Левин. - 3-е изд., пере-раб. и доп. - М.: Радио и связь, 1989. - 656 с.
9. Подвальный, С.Л. Многоальтернативность как основа обеспечения интеллектуальности систем управления [Текст] / С.Л. Подвальный, Т.М. Леденева // Вестник Воронежского государственного технического университета. - 2012. - Т. 8, № 11. - С. 17-23.
10. Проблемы разработки интеллектуальных систем многоальтернативного моделирования [Текст] / С.Л. Подвальный, Т.М. Леденева, А.Д. Поваляев, Е.С. Подвальный // Вестник Воронежского государственного технического университета. - 2013. - Т. 3.1, № 9.- С. 19-23.
11. Podval'ny, S.L. Intelligent modeling systems:Design principles / S.L. Podval'ny, T.M. Ledeneva // Automation and Remote Control. - 2013. - Vol. 74. - №7. - P.1201-1210.
12. Барабанов В.Ф. Основы автоматизации проектирования, тестирования и управления жизненным циклом изделия [Текст] / В.Ф. Барабанов, А.Д. Поваляев, С.Л. Подвальный, С.В. Тюрин. - Воронеж. 2011
. Воронеж)
SHAPING OF AN EXPERT CONCLUSION ON THE BASIS OF THE THEORY OF EVIDENCE
E.A. Gantseva, V.A. Kaladze, A.M. Poljakov
In procedures of deriving of the generalised expert conclusion methods of the theory of casual sets or the theory of evidence named also by name of its authors - theories Dempster-Shefer based on special functions of belief, a plausibility and the rules of association of functions of the belief formulated for testimonies received from different informational radiants are used
Key words: the theory of evidence, an expert conclusion, belief, plausibility