Научная статья на тему 'Поиск стратегий поведения человека-оператора в ходе проведения эксперимента'

Поиск стратегий поведения человека-оператора в ходе проведения эксперимента Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
314
84
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Поиск стратегий поведения человека-оператора в ходе проведения эксперимента»

Э.В.Чепиков

ПОИСК СТРАТЕГИЙ ПОВЕДЕНИЯ ЧЕЛОВЕКА-ОПЕРАТОРА В ХОДЕ ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТА

Создание современной интеллектуальной системы с совместным участием человека и машины, предназначенной для поддержки принятия решений человеком в организационных структурах управления и в условиях многоцелевой деятельности, невозможно без создания модели поведения человека. При этом основой принятия решений является система знаний не только о конкретной решаемой задаче пользователя, но и обо всех аспектах его деятельности, так или иначе влияющих на решение.

Деятельность человека-оператора можно рассматривать с разных точек зрения: как элемент цепи управления, как систему обработки запросов, как систему принятия решений. Для каждого из этих подходов используются различные модели: в виде передаточной функции, в терминах модели системы массового обслуживания, в виде конечного недетерминированного автомата. В настоящей работе использовалась модель человека-оператора, основанная на описании поведения нечетким недетерминированным автоматом [1]:

A=<U, X, Y, s0, 8, s>, (1)

где U={U1, U2,..., Um} - конечное множество входов, X={X1, X2,..., Xn} - конечное множество состояний, Y=(Y], Y2,..., Yp} - конечное множество выходов, 8 XxUxX®[0,1] - функция переходов, s: XxUxY®L - функция выходов, s0 - начальное состояние.

Множество Х в модели (1) представляет как набор подзадач, на которые разбивается деятельность по выполнению основной задачи. При подобном рассмотрении цель деятельности декомпозируется на i последовательных (по времени выполнения) этапов. Будем интерпретировать Xi как множество возможных результатов i-го этапа, Yj, jeJ={1, ..., p} - как множество интервалов времени на достижение конечного этапа. Очевидно, что в рассматриваемом типе автомата m=n и может трактоваться как число последовательных этапов (шагов) достижения цели.

Так как процесс деятельности может быть охарактеризован показателями продвижения к поставленной цели во времени, то L будем рассматривать как эффективность, связанную с реализацией выбранного способа деятельности на

интервале времени Yj и полученным результатом X. Показателями эффективности являются достижение цели в заданное время и с заданным расходом ресурсов, качество выполнения работ. В качестве ресурсов могут рассматриваться финансы и психофизиологические показатели. Поскольку эффективность деятельности является интегральной оценкой, то необходимо определить, какая из операций свертки наилучшим образом соответствует реальной обобщенной оценке оператора потенциальной эффективности деятельности.

В случае равнозначности показателей можно выделить три основных стратегии оператора при свертывании отдельных показателей: обобщенная оценка не может быть лучше наихудшей из частных оценок (операции конъюнкции); обобщенная оценка обусловлена наилучшей из частных оценок (операции дизъюнкции); компромиссная стратегия - обобщенная оценка находится на промежуточном уровне между частными оценками (операции осреднения). На практике обычно применяется компромиссная стратегия, для которой в качестве операции сверты-

вания показателей можно взять медиану, определяемую для некоторого порога ае(0, 1):

у, если х < у < а; med(x,y,a)= {а, если х<а< у;

х, если а < х < у.

В случае неравнозначности показателей по важности каждому из них назначается некоторый вес последующим суммированием этих весов в рамках операции свертки. Весовой коэффициент р1 характеризует значимость показателя по отношению к обобщенной оценке:

Е Р1Х.; Е р, =1 *

,=1 ,=1

где q - количество показателей, х,■ - частные оценки показателей.

В соответствии с (1) функция 8 порождает множество нечетких матриц перехода Ти = {8х; X, (и 1 < г 3 п ; функция о порождает нечёткую

матрицу выхода о = {оX,-,У, (У )}1 < г 3 — р . Среди множества

состояний автомата выделяется множество финальных (заключительных) состояний Хп. Нас будут интересовать такой тип автомата, для которого каждое состояние X, 1е!={1, ..., п} зависит от предыдущего состояния Х,.1. Подобная зависимость может определяться последовательностью реализации подцелей, приоритетом выполнения и т.п.

Способы прохождения этапов деятельности и состояния подзадач, протекающие во времени, будем трактовать как нечеткие события на интервале Ур, 1<<<р. При таком подходе функция переходов может задаваться экспертным путем и отражать уже имеющийся опыт. Для учета личностных особенностей выполнения подзадач конкретным оператором необходимо построить индивидуализированную функцию переходов. С этой целью учитывается исходная информация от оператора, заключающаяся в задании прогноза использования того или иного способа освоения материала в зависимости от возможных результатов тестирования в виде функции т Х(хП®[0,1], а также прогноза перехода управляемого процесса обучения из исходного состояния s0 на первом шаге решения в зависимости от ограничений на имеющиеся ресурсы. На основе этой информации программируется автоматная модель. Для этого на каждом шаге решаются композиционные уравнения вида [2]:

т(Х)/ик=т(х-1)/ик-1 ° 8(х-1, х)/ик;

т(Щ =т(х-1) ° т(Хг-1, щ, (2)

где “ ° ” - знак операции “композиция”; тХ)/ик, тХ,-1)/ик-1 - нечеткие оценки возможности управляемого процесса находиться в состояниях X, Х,-1 при применении способов выполнения подцелей ик и ик-1, соответственно; т(ик) - нечеткая оценка выбора оператором способа достижения подцели ик.

Полученные в (2) оценки группируются попарно “способ достижения подцели” - “результат деятельности”, исходя из следующего условия т(Щ<т(Х)/ик. Формирование пар по такому принципу согласуется с реальным выбором решения: результату с максимальной оценкой возможности должен соответствовать

способ достижения подцели также с максимальной оценкой применения его чело-веком-оператором. Выделение пар позволяет выявить наиболее возможные связи по способам деятельности между состояниями подзадач. Дополнительно каждый способ деятельности, маркирующий связь, характеризуется нечеткой оценкой использования его оператором и нечеткой оценкой эффективности деятельности (нормированный доход), субъективно осознаваемой оператором, в зависимости, например, от времени, материальных затрат на деятельность, ценности ожидаемого результата.

Для того чтобы исключить из рассмотрения слабые связи между состояниями фаз деятельности, введем порог ю, который определяется экспертом и учитывается при построении индивидуальной модели поведения оператора. Исключение из рассмотрения слабых связей между состояниями фаз осуществляется следующим образом. Для каждого этапа деятельности решаются уравнения (2) и при формировании пар “способ достижения подцели” - “результаты деятельности”

исключаются пары с оценкой т(и]>Х\ )< ю. Процесс исключения слабых связей повторяется для каждого этапа деятельности. Таким образом, при выявлении возможных вариантов поведения человека-оператора для достижения цели рассматриваются только пары “способ достижения подцели” - “результат деятельности” с нечеткими оценками выше установленного порогового значения ю.

Результаты моделирования поведения оператора более наглядно можно представить в виде ориентированного графа. Построение осуществляется следующим образом. Из исходного состояния в состояния первого этапа деятельности проводятся дуги, маркированные теми способами достижения подцели, использование которых, в соответствии с прогнозом оператора, позволит добиться положительных результатов на первом этапе деятельности, и эти способы характеризуются наибольшей оценкой. В зависимости от означивания этих дуг и на основе сформированных пар “способ достижения подцели” - “результаты тестирования” проводятся означенные дуги от первого до п-го этапа деятельности. В результате построений получаем представленный в виде ориентированного графа нечеткий недетерминированный автомат, моделирующий поведение оператора при различных результатах деятельности на каждом этапе.

Применяя подход, используемый в динамическом программировании, можно выделить классы стратегий оператора. В первую очередь нас будет интересовать тот класс, стратегии которого позволяют достичь цели деятельности и характеризуются максимальными оценками связей между результатами тестов. Для выделения таких стратегий на множестве возможных финальных результатов определяются результаты, соответствующие цели деятельности. Далее выделяются результаты тестирования на (п-1)-м шаге, переход из которых в целевые состояния п-го шага характеризуется способами достижения подцели с оценкой, равной

тт(х у)

а(ип_1)=max(g(m(Un_l )Охп ,,ип , )Х где g(x,у)=—1—:.

Уп-1 1_ \х _ у\

Подобная процедура осуществляется для каждого шага решения, вплоть до состояния $0. Использование процедуры позволяет выделить возможные стратегии деятельности, представляющие собой взвешенные пути на графе от вершины s0 до вершин из множества Хп. Каждый q-й путь представляет собой взвешенную, относительно способов достижения подцели, последовательность вида

Бд = (В0,и0,х1,и1 к,Х^,1]п_1,ХПп ),

где г/, /= 1,п - число результатов /'-го этапа. Элементы множества Хп могут представлять для человека-оператора различную ценность, что отражается заданием на Хп нечеткой цели с функцией принадлежности f^(g) = {т(х!г ),..,т(Хп )}, где к -размерность множестваХп; т( Хр )п = 1,Н - функция принадлежности результата

тестирования Хр нечеткой цели g. В этом случае каждую стратегию из класса п можно оценить следующим образом:

Р($П ) = тт(а(Щ )а(и} ),..,а(ип_} )т(Хп )). (3)

Очевидно, что стратегия, имеющая оценку тах(Р(Бр )), наиболее соответ-

ч

ствует индивидуальному стилю принятия решений человека-оператора, но не всегда может соответствовать максимальной функции принадлежности состояния цели g. Полученное противоречие при построении модели поведения оператора можно избежать, используя следующие способы:

• изменением предпочтений человека-оператора;

• изменением исходных матриц переходов и выходов;

• использованием такой организации управления на основе модели поведения оператора, которая бы учитывала только конечную цель, т.е. состояние нечеткой цели с максимальной функцией принадлежности.

В последнем случае используются смешанные стратегии, т.е. стратегии, образованные частями стратегий из классов п Необходимость в формировании смешанной стратегии определяет трансформацию стратегии, из некоторого класса,

выбранной исходя из критерия тах(/}(8р )), в стратегию из другого класса, исхо-

ч

дя из критерия тах(т(Хр )). Очевидно, что необходимость в трансформации п

возникает в тех случаях, когда выбранная исходная стратегия перестает быть эффективной по отношению к нечетко заданной цели. При этом важно определить те пространственно-временные точки графа (вершины), где подобная трансформация возможна, т.е. такие вершин, для которых существует стратегия, позволяющая достичь цели обучения с максимальной функцией принадлежности. Суть подхода состоит в вычислении коэффициента свободы выбора (КСВ), качественно оценивающего уровень возможности обучаемого в выборе альтернатив управления. Чем больше существует вариантов управляющих решений, тем большее значение принимает КСВ. Под КСВ понимается отношение числа допустимых стратегий из

класса Бр с Р(Бр )>£ к общему числу стратегий из этого же класса. Здесь е означает порог возможностей человека-оператора в достижении поставленной им цели, используя индивидуальный стиль поведения. Очевидно, что чем меньше значение КСВ, тем меньше у оператора вариантов в достижении поставленной цели, без изменения индивидуальной стратегии.

Обобщенный алгоритм построения модели поведения человека-оператора состоит в следующем:

1) строится предварительная модель поведения человека-оператора. Для этого определяется число этапов, на которые разбивается деятельность Х={Х1у Х2,..., Хп}. Выделяются возможные результаты деятельности для каждого этапа

Х\ . Определяются способы достижения подцелей для каждой подцели и={иь и2,..., ит}, и к и интервалы времени на их выполнение Т={У], У2,..., Уг}. Эксперт-

ным путем, либо на основе экспериментальных данных задаются матрицы переходов из состояний одного этапа деятельности в состояния другого этапа при использовании одного из способов достижения подцели;

2) перед началом деятельности человек-оператор задает деятельности

m(g ) = im(хП )}, где h - размерность множества Xn, а также прогноз

использования предлагаемых способов достижения подцели Uk на каждом этапе

X, для всех возможных результатов деятельности Х\ . Все прогнозы для процесса деятельности задаются также в виде матриц (поскольку табличная форма определения автоматной модели является удобной и наглядной). Кроме того, оператором задаются функции выходов автоматной модели в виде матриц, т.е. определяются возможные доходы (расходы) для каждого возможного результата деятельности в

модуле Х\ при выборе конкретного способа достижения подцели Uk и затраченного при этом времени Yj;

3) на основе полученных данных строится модель поведения нечеткого ориентированного графа. Кроме маркировок способами достижения подцелей, каждая дуга графа взвешена нечеткими оценками переходов из состояния в состояние, а также оценками расходов человека-оператора при использовании соответствующих способов достижения подцелей;

4) используя методологию динамического программирования, выделяются

на графе стратегии человека-оператора Sq = (s0,U0,Xr]I ,U]..., X^I] ,Un_}, ХЦ1 ).

Для этого определяются пересечения нечетких оценок целей и оценок способов достижения подцелей. Далее формируются классы стратегий человека-оператора

(в соответствии с возможными состояниями цели m(g )= {т(Х]),..,т(ХП1 )}). Каждая стратегия оценивается на основе (3);

5) определяются стратегии человека-оператора, соответствующие индивидуальному стилю принятия решений, исходя из критерия тах(b(Sq )). В тех слу-

q

чаях, когда выбранная исходная стратегия перестает быть эффективной по отношению к заданной цели, осуществляется трансформация стратегии человека-оператора в стратегию, позволяющую достичь цели деятельности, исходя из критерия тах(т(ХП )). к

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Astanin S.V. The Behavior Model of Strategic Controlling//5th European Congress on Intelli-

gent Techniques & Soft Computing, Aachen, Germany September 8-11, 1997, V.1.

2. Астанин С.В. Нечеткая автоматная модель стратегического управления// Изв. ТРТУ. Интеллектуальные САПР. -Таганрог: Изд-во. ТРТУ, 1997.

i Надоели баннеры? Вы всегда можете отключить рекламу.