Эффективная процедура обучения модели предпочтений ЛПР

Вилисов В.Я.

8. Заявка на патент Украины № 200711992. Лабораторный стенд для дистанционного изучения микропроцессорных систем управления / Аврунин О.Г., Семенец В.В., Байбаков М.Н., Вечур А.В., Крук О.Я., Носова Т.В., Семенец Р.В., Якимович П.В.

9. Патент Украины №79652 МПК 009Б23/18 Лабораторний стенд для изучения микроконтроллерных систем управления / О.Г. Аврунин, О.Я. Крук, В.В. Семене // Пр. Власшсть, 2007. - Бюлл. № 10.

10. Харитонова К.Ю. Разработка системы для риноманометрии // Сб. матер. 11-го Междунар. молодежи. форума «Радиоэлектроника и молодежь в ХХ1 веке». - Харьков: ХНУРЕ, 2007. - Ч.1. - С.318.

11. Биотехническая микроконтроллерная система для гастроэнтерологических исследований // Прикладная радиоэлектроника. - 2007. - Т. 6. - № 1. - С. 72-77.

ЭФФЕКТИВНАЯ ПРОЦЕДУРА ОБУЧЕНИЯ МОДЕЛИ ПРЕДПОЧТЕНИЯМ ЛПР

В.Я. Вилисов, к.т.н., доц., директор департамента разработок Тел.: (495) 519-35-17; E-mail: [email protected] ООО «Энергия ИТ»

Propose the procedure of quick data receive about decision maker's preference for the industrial control system by present him choice situation as active or halfactive experiment. This model is the tool for accumulate expert's knowledge about choice situation.

Введение

Экспертные системы (ЭС) являются одной из бурно развивающихся отраслей науки и практики в последние десятилетия. Это развитие не только обусловлено заинтересованностью прикладных отраслей экономики, но и вызвано достижениями компьютерных технологий последнего времени. Возможности современных компьютеров становятся настолько значительными, что теоретические разработки в области искусственного интеллекта и гибридных систем все чаще отстают от них [1]. Тем не менее, это направление востребовано практикой, и его развитие находит отражение в исследованиях и разработках.

Важной группой задач, решаемых в рамках данного направления, является работа со знаниями. С практической точки зрения важными представляются вопросы:

• извлечения знаний из субъектов, обладающих этими знаниями;

• хранение знаний в виде, удобном для их использования по назначению.

В традиционных экспертных системах, построенных на правилах продукции или нейлоровского типа [2], знания обычно «за-

качиваются» в систему при ее создании, а затем лишь используются для генерации решений. Подобные системы не нашли сколько-нибудь широкого применения в практике автоматизированного управления организационно-экономическими объектами.

Для преодоления недостатков традиционных ЭС с целью привлечения знаний экспертов в практику управления очень динамичными современными экономическими объектами автором разработана методология и ряд технологий [3], позволяющих (в предметной области управления производственными процессами на оперативном горизонте планирования) более гибко извлекать знания из лица, принимающего решения (ЛПР), и компактно хранить их в виде структурных и параметрических элементов экономико-математических моделей. При этом построенные модели оказываются хорошо согласованными с целевыми установками ЛПР, что вызывает доверительное отношение ЛПР (менеджеров, собственников, экспертов и т.п.) к решениям, принимаемым в системе. Предлагаемая методология позволяет подстраивать такие модели в условиях изменчивости среды и/или предпочтений ЛПР.

Построенные таким образом модели представляют собой экспертные знания опытных ЛПР в соответствующей предметной области. Поскольку такие модели работают на некотором поле исходных ситуаций,

требующих принятия решений, а на выходе формируются готовые решения, то знания, хранящиеся в подобных моделях, могут отчуждаться от их первоначального источника (ЛПР) и использоваться в дальнейшем несколькими способами.

Если позволяет контекст задачи, то модели могут использоваться в аналогичной среде в автоматическом режиме (без участия какого-либо ЛПР).

Модели могут быть использованы и как элементы систем поддержки принятия решений для других ЛПР, которым делегированы соответствующие полномочия, тогда модель может служить средством проверки качества решений, принятых ЛПР, или инструментом генерации начального варианта решения.

И, наконец, модель может использоваться как средство обучения менеджеров принятию решений, где на модели, настроенной по опыту более квалифицированного ЛПР, проверяется качество принимаемых решений. При этом следует отметить, что качество принимаемых решений зависит не только от степени «наученности» ЛПР, но и от его «внутренних» характеристик, таких как разрешающая и пропускная способность.

В настоящей статье для класса моделей линейного программирования, используемых в качестве основы процедур распределения ограниченных ресурсов на оперативном горизонте планирования в производственных системах, приведена технология эффективного взаимодействия системы с ЛПР для извлечения из него необходимых знаний.

Указанные модели входят в состав систем поддержки принятия решений (СППР) комплексных информационных систем (КИС) предприятий. Если условия применения моделей выполняются и они оказываются эффективными, то в ряде случаев бывает желательно ускорить процесс настройки параметров целевой функции. Для пользователя всегда желательно, чтобы процесс итерационной настройки был бы как можно короче, а точность настройки модели была бы как можно выше. Эти требования взаимосвязаны и противоречивы, однако в ряде практических случаев их можно, в той или иной степени, выполнить. Рассмотрим, когда и насколько это возможно.

Постановка задачи

Пусть в СППР для выбора решений (например, в контексте задачи распределения

ограниченных ресурсов при запуске партии изделий в производство [3]) используется задача линейного программирования (ЗЛП) на максимум: п

Ь(е,х) = \ е,х,- ^ тах; (1)

1=1 1

^ а 1Х1 - аг0 < 0; х} > 0; г = 1, т; 1 = 1, п, (2)

1=1

где с, х - вектор параметров целевой функции и вектор переменных. Ограничения (2), образующие область допустимых решений (ОДР) и приводящие к необходимости выбора решения, названы ситуацией, требующей принятия решения (СТПР). Они обычно автоматически формируются из данных учетных систем предприятия. Априорная неопределенность задачи (1)-(2) заключается в том, что реально менеджер принимает во внимание не один, а несколько критериев, поэтому коэффициент с, как векторная свертка, не известен. Задачу (1)-(2) будем называть прямой ЗЛП (ПЗЛП). На фазе настройки (обучения) модели по тем предъявлениям (2), для которых принятое ЛПР решение (после их реализации) признано «хорошим», решается обратная ЗЛП (ОЗЛП) с помощью, например, итерационной процедуры, построенной на основе метода наименьших квадратов [3)], в результате чего вычисляются оценки с 1 координат вектора

с . Так, если воспользоваться стохастическим рекуррентным алгоритмом оценивания, то он кратко может быть представлен в таком виде:

ск+1 = ск + Ок О +1)-1 (ч+1- ск), (3)

Ок+1 = Ок - Ок (Ок +1)-1 Ок,

(4)

где к - номер шага итерационной процедуры; Ок - дисперсионная матрица оценок

вектора целевой функции; вк+1 - суммарный вектор (единичной длины), соответствующий гиперплоскостям образующих крайнюю точку ОДР, выбранную ЛПР в качестве оптимальной в (к+1)-м наблюдении. В подобных алгоритмах начальное значение искомого вектора обычно принимают минимально возможным, а элементы (диагональные) дисперсионной матрицы - максимально возможными.

Бизнес-процессы организационно-

экономических систем, в которых используется модель (1), (2), делятся на две группы: на такие, которые допускают вмешательство

в формирование ограничений (2), предъявляемых ЛПР для выбора решений, и на такие, которые не оставляют этой возможности. Для второй группы ускорить процесс настройки не представляется возможным, а для первой существуют два варианта: первый - сформировать ограничения (2) оптимальным (в смысле максимизации прироста информации о векторе с ) способом; второй - не изменяя реально возникших ограничений (2), скомпоновать из них такие отдельные подмножества, которые, будучи предъявленными ЛПР, позволят получить максимальный прирост информации о векторе с . Первый способ назван активным экспериментом над ЛПР, а второй полуактивным. Термин «эксперимент над ЛПР» имеет смысл, т.к. означает взаимодействие с ЛПР как со звеном системы управления бизнес-процессами, характеристики которого необходимо измерить (оценить).

Решение задачи

Для описания вариантов ускорения процесса выявления предпочтений ЛПР введем ряд терминов, описывающих взаимодействие среды (генерирующей ситуации), ЛПР и модели.

В ПЗЛП оптимальные крайние точки области допустимых решений (ОДР) несут различный объем информации о целевой функции. Телесный угол, образованный пучком гиперплоскостей, определяет степени свободы для гиперплоскости ЦФ - чем больше угол, тем более определенным является положение ЦФ. Этот показатель будем называть информативностью СТПР - р. Поскольку априори неизвестно, на какой из вершин будет достигнут оптимум, то, в идеале, желательно иметь ОДР в виде симметричного многогранника, близкого к сфере (гиперсфере).

Способность ЛПР быстро «переварить» некоторое количество ограничений будем называть пропускной способностью ЛПР -¡ил . А его возможность различать альтернативы, расположенные в различной степени удаления друг от друга, будем называть разрешающей способностью ЛПР - Ул . Если ЛПР обладает высокой пропускной и разрешающей способностью, то при достаточно информативной СТПР его предпочтения в рамках рассматриваемого подхода могут быть выявлены практически за один шаг. По аналогии с пропускной способностью ЛПР будем говорить и о плотности потока

альтернатив, предъявляемых ЛПР (или просто плотности альтернатив - X), и понимать под этим количество вершин ОДР в одном предъявлении. Поскольку настраиваемая модель является отражением предпочтений ЛПР, то введем и термин разрешающей способности модели - ум .

Таким образом, информативность СТПР и плотность альтернатив - это характеристики внешней (по отношению к ЛПР) среды. Разрешающая и пропускная способности ЛПР являются характеристиками, от которых зависит качество принимаемых решений. Разрешающая способность модели отражает ее качество как звена выбора решений. Если разрешающая способность модели не хуже )разрешающей способности ЛПР и оценки с 1 не смещены относительно с , то

модель адекватна предпочтениям ЛПР.

Процесс адаптивной настройки модели может быть ускорен на основе применения методов планирования оптимальных экспериментов [4]. Эксперименты над ЛПР (зондирование ЛПР) можно проводить с двумя целями: для выявления предпочтений Л)ПР (решение ОЗЛП для построения оценок с 1 ); для тестирования ЛПР (оценивание его характеристик у л и и л ). Возможна и комбинация этих целей, однако здесь рассмотрим лишь первую из них. При этом будем полагать, что характеристики Ул и ¡¡л априори неизвестны, а значит в соответствии с принципом минимизации данных в каждом предъявлении и для обеспечения максимальной контрастности альтернатив в предъявлении активный и полуактивный эксперименты должны быть организованы следующим образом (покажем на примере двух переменных).

Активный эксперимент (см. рис.1 а). Предъявления выполняются по шагам. На каждом шаге для выбора решения добавляется по одному ограничению (пронумерованы: 1, 2, 3, ...), обеспечивающему максимальную контрастность новых альтернатив. ЛПР на каждом шаге выбирает наилучшую альтернативу в пределах своей разрешающей способности, постепенно приближаясь к идеальной точке на вписанной сфере. Предъявления проводятся одним из двух способов: либо стандартными ограничениями (2), либо в виде набора альтернативных крайних точек ОДР.

Полуактивный эксперимент (см. рис. 1 б). Предъявления также выполняются по

шагам, однако в каждом предъявлении ограничения выбираются из существующего набора (2). Эффект достигается за счет снижения нагрузки на ЛПР на каждом очередном шаге в предположении, что он обладает минимальными уд и и Л . Для примера, приведенного на рис. 1 б, число предъявляемых ограничений постепенно возрастает (1, 2, 3, ...), начиная с одного, вместо исходных семи.

Следует отметить, что максимальную скорость решения ОЗЛП, т.е. получения эффективных оценок c j, обеспечивает активный эксперимент.

Выводы

1. Предложены алгоритмы, существенно повышающие скорость и достоверность выявления предпочтений ЛПР для аппроксимации их линейной целевой функцией. Алгоритмы построены в соответствии с

принципами планирования оптимального эксперимента.

2. Введены формальные характеристики ЛПР как звена системы управления предприятием, которые также могут быть оценены в рамках тестовых экспериментов. Измерение этих характеристик может быть использовано для мониторинга их соответствия требуемым значениям как пороговые уровни требований к ЛПР (менеджерам).

т1 = 1

4

(а) (6)

Рис. 1. ОДР в активном и полуактивном экспериментах

Литература

1. Ярушкина Н. Г. Основы теории нечетких и гибридных систем. - М.: Финансы и статистика, 2004. - 320 с.

2. Черноруцкий И.Г. Методы принятия решений. - СПб.: БХВ-Петербург, 2005. - 416 с.

3. Вилисов В.Я. Методы выбора экономических решений. - М.: Финансы и статистика, 2006. - 228 с.

4. Федоров В.В. Теория оптимального эксперимента. - М.: Наука, 1971. - 312 с.

О ПРОБЛЕМЕ ОБЕСПЕЧЕНИЯ БЕЗОПАСНОГО ВЗАИМОДЕЙСТВИЯ С СЕТЕВЫМИ ОБРАЗОВАТЕЛЬНЫМИ РЕСУРСАМИ

Р.В. Воронов, к.т.н., доц. Тел.: 8-8142-71-10-68; E-mail: [email protected] О.В. Гусев, преп. Тел.: 8-8142-71-10-68; E-mail: [email protected] В.В. Поляков, к.т.н., доц. Тел.: 8-8142-71-10-68; E-mail: [email protected] Кафедра Прикладной математики и кибернетики Петрозаводский государственный университет http://petrsu.karelia.ru

The discussion is about distance education networking and information safety problems. The protocol of interconnection which guarantees authentication, approval authorship and message consistency is offered.

Одна из важнейших проблем, с которой приходится сталкиваться на этапе внедрения информационных технологий в обучение, -формирование доверия к нововведению со стороны участников процесса. Поэтому, учитывая пока еще не привычные возможности взаимодействия обучаемых и препо-

давателей, предоставляемые новыми технологиями, следует признать, что надежная и безопасная организация подобного процесса является одной из приоритетных задач. Нетрудно прогнозировать, что с последующим развитием информационных образовательных технологий в области большей интерак-

Эффективная процедура обучения модели предпочтений ЛПР Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вилисов В. Я.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Вилисов В. Я.

The effective procedure of model teaching for decision maker's preference

Текст научной работы на тему «Эффективная процедура обучения модели предпочтений ЛПР»