Научная статья на тему 'Многопараметрическое управление на основе прецедентов'

Многопараметрическое управление на основе прецедентов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
286
210
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МНОГОПАРАМЕТРИЧЕСКОЕ УПРАВЛЕНИЕ / ТЕОРИИ ПРИНЯТИЯ РЕШЕНИЙ / МЕТОДЫ ДОБЫЧИ ДАННЫХ / ВЫВОД ПО ПРЕЦЕДЕНТАМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Карпов Л. Е., Юдин В. Н.

Ведущаяся разработка связана с решением задачи многопараметрического управления объектом со сложным взаимным влиянием воздействий в ситуациях, когда влияние внешних факторов может оказаться взаимозависимым и даже противоречивым, когда трудно или невозможно получить точную модель поведения объекта. Предлагается подход к математической формализации понятия управления на теории принятия решений, методов добычи данных и вывода по прецедентам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Многопараметрическое управление на основе прецедентов»

Многопараметрическое управление на основе прецедентов

Карпов Л. Е., Юдин В. Н.

Аннотация. Ведущаяся разработка связана с решением задачи многопараметрического управления объектом со сложным взаимным влиянием воздействий в ситуациях, когда влияние внешних факторов может оказаться взаимозависимым и даже противоречивым, когда трудно или невозможно получить точную модель поведения объекта. Предлагается подход к математической формализации понятия управления на теории принятия решений, методов добычи данных и вывода по прецедентам.

1. Введение

Построение системы управления, основанной на учете сразу многих видов внешних воздействий, не сводится к простому построению нескольких систем, совместно решающих общую задачу. Во-первых, влияние внешних факторов может оказаться взаимозависимым, и даже противоречивым, а во-вторых, достаточно часто могут встречаться ситуации, когда среди внешних факторов имеются как зависящие друг от друга воздействия, так и независимые. Другим аспектом, усложняющим построение многопараметрических систем управления, является отсутствие возможности связать с каждым элементарным внешним воздействием ровно один параметр внутреннего состояния системы, на которой это воздействие осуществляется. Остается и даже увеличивается та часть проблем построения систем управления, которая связана со сложностью формализации внешних воздействий и состояний управляемого объекта.

Одна из наиболее простых стратегий управления - реагировать на события по мере их появления - носит название «замкнутого управления» (Рис. 1), или управления с обратной связью, при котором предполагается возможность изменять управление в зависимости от его воздействия на конечный результат.

«Адаптивное управление» отличается от замкнутого наличием модели управляемого объекта (Рис. 2), в которой анализируются возможные последствия управления (прогноз). Правильная реакция возможна лишь при наличии формализованного описания, которое называют «математической моделью» объекта, адекватно отображающей среду функционирования и сам объект управления.

Рис. 1. Структура замкнутого управления.

Рис. 2. Структура адаптивного управления.

При недостаточности наших знаний об объекте и среде, в которой он функционирует, не представляется возможным получить точную модель поведения объекта. Вместо этого мы владеем только априорной информацией о состояниях объекта, управляющих воздействиях на него и результатах воздействий. В таких случаях предлагается иная структура адаптивного управления на основе прецедентов (Рис. 3).

Адаптация воздействия

і г

Воздействие

Прогноз

Состояние

Выбор

прецедента

Сохранение

прецедента

Рис. 3. Схема адаптивного управления по прецедентам.

Ведущаяся в ИСП РАН разработка связана с решением задачи многопараметрического управления процессом со сложным взаимным влиянием воздействий, для которого трудно или невозможно получить точную модель поведения. Разработкой предусматривается построение концептуальной системы управления, работающей в условиях многочисленных, в том числе не зависящих друг от друга внешних воздействиях, влияющих на разные параметры состояния объекта управления. Задача новой системы состоит в том, чтобы дать возможность адекватно учитывать многопараметрические внешние воздействия на объект управления со сложным, непараметризуемым поведением.

Группой разработчиков уже выработаны методика многопараметрического управления плохо формализуемым объектом (процессом) на основе прецедентов, методика разбиения состояний объектов на классы, проведен выбор методики оценки схожести с прецедентом на основе учета входных и целевых факторов, а также разработаны принципы построения программной системы управления на основе разработанной методики.

Управление многомерным процессом подразумевает целенаправленное изменение множества параметров состояния и структуры объекта на основе выработанной стратегии, методов и алгоритмов управления. При попытках управления объектами, для которых не удаётся построить адекватную математическую модель, возникает ситуация, принципиально отличающаяся от «классической». В таких ситуациях вместо точного вида математической модели объекта доступна только априорная информация о состояниях объекта управления, управляющих воздействиях на него и результатах воздействий (прецеденты). Одним из примеров таких объектов является организм человека, законы функционирования которого до конца ещё не известны.

В осуществляемой разработке используется подход, в котором целенаправленность управляющих воздействий базируется на прецедентах. В терминах вывода по прецедентам, информация о состоянии объекта - это описание проблемы, а выдача управляющего воздействия есть решение проблемы, тогда результат воздействия - это результат применения решения.

2. Понятие прецедента в управлении

Схематически любой шаг управления объектом можно представить как совокупность трех элементов (Рис. 4) - состояние объекта до воздействия (с,), управляющее воздействие (е,) и состояние объекта после воздействия (с, ,). Эту тройку составляющих обычно называют «прецедентом», или «случаем».

О-

С1 с1+1

Рис. 4. Элементирный шаг процесса управления.

Состояние объекта описывается набором признаков, причем допускаются как числовые, так и логические признаки. Управляющие воздействия, в зависимости от конкретного приложения, могут иметь разный формат, вплоть до описаний в виде текстового комментария. В технике внешние воздействия могут проявляться, например, в изменениях параметров внешней среды -атмосферного давления, влажности воздуха, его прозрачности и так далее. В медицине воздействие может быть элементом проведенного лечения, например, в качестве воздействия могут восприниматься прием лекарственных средств, выполненные процедуры, а также оперативное вмешательство в работу организма человека.

Случаи, отражающие всю хронологию воздействий на отдельный объект, связываются в так называемую «цепь управляющих воздействий». Эту последовательность состояний и воздействий можно представить в виде цепи, вершины которой - состояния объекта, а дуги - управляющие воздействия (Рис. 5).

О-------Ю--------Ю---------Ю--------Ю

Рис. 5. Цепь элементарных шагов процесса управления.

Такие последовательности состояний и воздействий могут возникать также и по воле управляющего объектом. Например, в медицине в тяжелых случаях принято воздействовать на пациента не сразу, а последовательно приближаясь к норме, то есть, задавая не одно следующее воздействие, а назначая сразу серию последовательных воздействий, каждое из которых лишь немного приближает состояние объекта к желаемому.

Состояние «после воздействия» одновременно является состоянием «до следующего воздействия», поэтому цепь представляет собой совокупность пар «состояние-воздействие». Совокупность состояний объектов и воздействий на них образует так называемую «базу прецедентов».

Значительная часть подходов к управлению, в частности, управление физическими объектами, строится на предположении о жёсткой взаимосвязи отдельных входных воздействий на управляемые объекты с отдельными параметрами состояний этих объектов.

Особенностью разрабатываемой в ИСП РАН системы будет способность адекватно учитывать многопараметрические внешние воздействия на объект управления со сложным взаимным влиянием воздействий. Система позволит управлять объектом в условиях совмещения ряда, возможно, противоречащих, воздействий. В отсутствие математической модели объекта выбор воздействий осуществляется по прецедентам. Чем больше прецедентов в базе, тем больше спектр их возможных значений, тем выше вероятность найти «наиболее подходящий» прецедент и выше качество принимаемого решения.

Обычно состояние объекта представляется набором признаков. Позиционирование состояния объекта до воздействия по отношению к описанным классам производится в его признаковом пространстве. Соответствующая объекту точка сравнивается с расположением классов в проекции на пространство его признаков. Недостаточно полно описанные объекты могут неоднозначно позиционироваться, то есть попадать в область пересечения классов, один из которых - исходный.

На следующем шаге процесса управления выбираются воздействия, которые уже когда-то применялись к сходным состояниям, и сравниваются состояния «после воздействия» в том же пространстве признаков. Прецеденты, в которых достигается нужный класс, считаются наиболее предпочтительными (Рис. 6).

При отборе прецедентов могут встретиться случаи, наборы признаков которых в начальном состоянии совпадают, но для которых одно и то же воздействие приводит к разным исходам, то есть к разным конечным состояниям (Рис. 7). Наличие таких случаев в одной базе прецедентов связано с тем, что иногда состояние объекта описывается недостаточно полно, то есть в этих случаях присутствует неучтенный разделяющий признак. Если бы этот признак был учтен, совпавшие исходные состояния трактовались бы как разные еще при занесении их в базу прецедентов. По этой же причине для не полностью описанных случаев невозможно гарантировать, что воздействие, позаимствованное у прецедента, приведет в нужное состояние.

Состояние «До»

Состояние «После»

Рис. 6. Отбор прецедентов.

Рис. 7. Слипание состояний из-за неполноты описания случая.

3. Многопараметрические воздействия

В реальности объект управления рассматривается как одиночный. При этом воздействие на этот одиночный объект может быть представлено в виде ряда составляющих по разным признакам или группам признаков (параметров состояния), по которым осуществляется контроль и управление. Значительная часть подходов к управлению, в частности, управление физическими объектами, строится на предположении о независимости воздействий по каждому такому признаку. Эго позволяет рассматривать управление по каждому признаку отдельно. В такой трактовке воздействия, влияющие на какой-либо один параметр состояния, никак не влияют на другие параметры.

В условиях независимости воздействий по каждому параметру управление объектом удобней рассматривать в виде нескольких непересекающихся цепей (Рис. 8).

о—ю—ю—ю о—ю—ю—ю

Рис. 8. Цепи управления по двум независимым параметрам.

Наличие нескольких цепей управления есть лишь определенная абстракция, в действительности же существует одна многопараметрическая цепь состояний и воздействий, а рассмотрению на самом деле подлежит один сложный объект.

Такое разделение удобно и оправданно, например, в медицине исторически сложилось, что врач определенной специализации контролирует определенный набор признаков, наиболее характерных для своей (хорошо им изученной) группы заболеваний. В технике механики и электрики также контролируют совершенно разные параметры состояний объектов управления. Но условие независимости воздействий не всегда выполнимо. Для человеческого организма с его сложными внутренними связями и большими компенсаторными возможностями воздействие по одному признаку может проявляться через другие признаки. И тогда, чтобы компенсировать эффект первого воздействия, приходится применять дополнительные воздействия по другим группам признаков. Иногда влияние подобных воздействий носит взаимозависимый и даже взаимоисключающий характер.

Приведем пример из медицины. При интенсивной терапии при серьезных патологиях в условиях нарушенного водно-электролитного баланса у больного возникает опасность избытка жидкости в организме. Контролируется набор показателей: (повышенное) артериальное давление, застойное полнокровие в легких, наличие периферических и полостных отеков и другие осложнения, связанные с избыточным объемом жидкости.

86

Для выравнивания состояния больного в качестве управляющих воздействий применяются различные методы дегидратации, что приводит к снижению артериального давления, снижению перфузии почек, появлению отеков, снижению уровня белка в крови. Такие эффекты, в свою очередь, можно нивелировать исключением натрия и калия, введением белка (альбумина) в организм. Как видно, воздействие по одной группе параметров сказывается на другой. Удержать ситуацию в некоем коридоре - задание трудновыполнимое. Можно представить себе различные виды взаимного влияния воздействий, такое влияние чаще всего не параметризуемо.

Рассмотрим схематически состояние объекта по двум группам признакам, по которым может осуществляться отдельный контроль. Обозначим через Сц начальное состояние объекта по первой группе, с2/ - по второй. Предположим, воздействие е1 переводит объект В состояние С12. оно же приводит к изменению состояния объекта в с22. На схеме это можно обозначить как дополнительное воздействие от с21 к с22 (Рис. 9(а)), либо как разветвленное воздействие от сп к с22 (Рис. 9(Ь)). И, наконец, возможны взаимные влияния по обеим цепям (Рис. 9(с)).

Наличие точки разветвления говорит о том, что управляющее воздействие привело к необходимости оценивать состояние объекта по двум цепям. Возможны и более сложные переплетения взаимных влияний воздействий по разным цепям (Рис. 9(с1)).

В самом общем случае, прецедентом будет одномоментная совокупность состояний объекта до воздействия, вся совокупность воздействий плюс совокупность состояний после множественного воздействия по всем группам признаков.

При наличии нескольких цепей управления задача выбора воздействия предполагает одновременное решение нескольких подзадач, аналогичных той, что приведена на рис. 6. Хороший прогноз воздействия, особенно многофакторного, возможен только при наличии в базе достаточного числа прецедентов, покрывающих весь спектр возможных взаимовлияний. В ней может содержаться или отсутствовать информация о влиянии на какие-либо группы признаков, о взаимном влиянии воздействий. Отсутствие в базе сведений о влиянии каких-либо воздействий на состояние объекта управления не обязательно означает отсутствие влияния этих воздействий на объект. Оно всего лишь означает, что в базе прецедентов не накоплена соответствующая информация. В подобных случаях в соответствии с часто используемым в науке подходом приходится рассматривать воздействия, сведений о которых недостаточно, как независящие друг от друга.

С другой стороны, иногда можно явно указать на отсутствие влияния какой-либо группы признаков на другую. Приведем наглядный пример из медицинской практики. Средство для лечения остеопороза - препарат, регулирующий фосфорно-кальциевый обмен - миакальцик - обладает рядом побочных эффектов, среди которых - реакция гиперчувствительности: кожная

87

сыпь, повышение артериального давления и периферические отеки. Этот негативный эффект можно предотвратить упреждающими воздействиями, даваемыми независимо по каждой цепи: приемом препаратов для снижения давления, противоаллергическими препаратами, снижением натрия в пище. Обратного влияния на первое воздействие эти воздействия не имеют. Поэтому можно воспользоваться прецедентами из базы, отражающими влияние каждого из этих препаратов в отдельности, вне их связи с первым.

Сп о^—о12 Спо^-юС12 Спо^чюС12

С21 (б1) С22 С21 С22 С21 62 с22

(а) (Ь) (с)

Рис. 9. Взаимное влияние различных воздействий на один объект управления.

Поиск золотой середины, то есть оптимального воздействия при выборе многофакторного воздействия - задача сложная, недостаточно формализованная и сильно зависящая от предметной области, даже внутри такой области, как медицина, поэтому на данном этапе она оставлена человеку, являющемуся экспертом в предметной области.

Уменьшение числа показателей при многофакторном управлении, своеобразная регрессия - упрощает задачу выбора воздействия. В примере с нарушением электролитного баланса можно ввести общий показатель, характеризующий состояние больного - внутритканевое сопротивление, условно характеризующее наполнение тканей жидкостью. Но, к сожалению, такое решение возможно не всегда.

Отсутствие подходящего прецедента приводит к тому, что при выборе воздействия приходится руководствоваться случайными критериями, или просто прекращать управление объектом до тех пор, пока он самопроизвольно не перейдет в состояние, для которого прецедент будет обнаружен. В

результате управление превращается из адаптивного - в замкнутое управление или управление без прогноза (Рис. 1 и 2). Когда управление осуществляется без прогноза, остается простая реакция на изменение ситуации, заставляющая объект совершать маятникообразные движения без приближения к цели.

Если воздействие по первой группе привело к непредвиденному изменению состояния по второй, можно поступить несколькими способами. Вот некоторые из них:

• воздействовать на вторую группу, чтобы нейтрализовать нежелательное изменение (нет уверенности, что это не повлияет на первую группу);

• убавить первое воздействие или применить противоположное ему (полностью или частично) с целью убрать его влияние на вторую группу (нет уверенности, что будет получен изначально желаемый результат по первой группе).

Во всех случаях необходимо искать оптимум («золотую середину») в величине воздействий, чтобы добиться приемлемого результата.

4. Выбор управляющего воздействия

Основная проблема в любом выводе, основанном на прецедентах, - выбор наиболее подходящих прецедентов, который упирается в оценку схожести прецедента и текущего случая. Выбор прецедентов связан с выбором параметров состояния объекта управления, которые могут быть разными в разных системах управления, однако он связан также не только с выбором набора (номенклатуры) воздействий, которые могут иметь объективный характер, но и с определением некоторых их параметров, например, силы воздействия, дозы лекарства и т. д. При отборе прецедентов можно использовать предварительно накопленные знания о предметной области. В ситуации, когда известных параметров объекта и окружающей среды недостаточно для полного и однозначного определения его поведения, принимать решение о нужном на очередном шаге управляющем воздействии на объект, зная только его параметры, нельзя. Знание поведения объекта будет полнее и точнее, когда управление осуществляется не по измеряемым извне параметрам его поведения, а по его состояниям. Если на основе априорной информации удается сформировать обобщенные образы - классы состояний, когда реакция объекта, находящегося в состоянии, принадлежащего любому такому классу, известна, то управляющее воздействие можно рассматривать как отображение объекта управления из одного класса в другой. Именно поэтому состояния объектов разбиваются на классы, состояния в каждом из которых настолько близки друг другу, что рассматриваются с точки зрения управления как эквивалентные.

Цель управления - достижение нужного состояния объекта. Как начальное, так и конечное состояния описываются вхождением в соответствующие

классы. Цель отдельного шага управления - перевод объекта из текущего класса в требуемый класс (в частности, целью может быть удержание состояния в том же классе). Для достижения этой цели необходимо, основываясь на состоянии объекта, выбирать наиболее приемлемое из возможных управляющее воздействие. Для прогноза вместо математической модели объекта используется накопленная ранее база прецедентов. Схематически такая взаимосвязь может быть проиллюстрирована таким образом:

о—ю—ю—ю о—о—«о—ю—ю

Рис. 10. Цепи управления по независимым параметрам.

—ю—ю—ю о—о^—о—ю—ю—ю о—ю—о—ю

Рис. 11. Взаимосвязь цепей управления по разным параметрам.

ю—ю о—ю—=*о—ю о——►о

Рис. 12. Сложная взаимосвязь цепей управления по разным параметрам.

Воздействия, влияющие на какой-либо один параметр состояния, могут быть независимыми, то есть никак не влиять на другие параметры (Рис. 10). Однако на практике можно наблюдать взаимосвязь входных воздействий и параметров состояния (Рис. 11).

Некоторые входные воздействия действительно связаны с определенными параметрами состояния объектов, в то время, как другие воздействия могут

влиять на значения сразу нескольких параметров, что серьезно усложняет процесс управления. Возможны и более сложные переплетения взаимных влияний элементарных воздействий и параметров состояний (Рис. 12).

В медицине для такого сложного объекта, каким является человеческий организм, со сложными внутренними связями и большими компенсаторными возможностями, воздействие, соответствующее одному параметру неизменно проявляется в виде изменений, за которые считаются ответственными воздействия, соответствующие другим параметрам. Чтобы компенсировать нежелательный эффект одного воздействия, часто приходится применять другие воздействия. Иногда влияние подобных воздействий носит взаимоисключающий характер. Так, ряд лекарств, предназначенных для снижения артериального давления (например, лозап), одновременно снижает гемоглобин крови. В свою очередь лекарства, повышающие уровень гемоглобина (например, эритропоэтин), повышают артериальное давление. Другой пример - пересадка органов в условиях присоединившегося туберкулеза: взаимоисключающее влияние иммуносупрессорной терапии и противотуберкулёзных средств. Среди возможных решений проблемы -выбор уровня воздействия (в зависимости от состояния объекта, воздействие может лежать в допустимых, равновесных, или кризисных границах) и/или расширение признакового пространства (иногда дополнительное исследование позволяет понять причину реакции на то или иное воздействие).

5. Диаграмма «Сущности-Связи» для базы прецедентов

Основная часть базы прецедентов - совокупность объектов, их состояний и воздействий на них. Кроме этого, в базе хранятся дополнительные структуры, создаваемые над этой совокупностью, в виде описаний классов.

Рис. 13. Модель Сущности-Связи базы прецедентов.

Представим структуру базы прецедентов в виде диаграммы Сущность-Связь (Рис. 13), где связь А-----представляет отношение многие-к-о дно му.

Объект представлен совокупностью состояний. В свою очередь каяедое состояние описывается совокупностью признаков. Воздействие имеет ссылки на состояние «до» и состояние «после» воздействия. С помощью пары этих ссылок можно проследить всю цепь управляющих воздействий на объект.

Рис. 14. Модель Сущности-Связи базы прецедентов в условиях нескольких цепей управления.

6. Организация базы прецедентов многопараметрического управления

Модель Сущности-Связи базы прецедентов, показанная на Рис. 13, в условиях наличия нескольких цепей управления (или многопараметрического управления) изменяется (Рис. 14).

Объект теперь представляется множеством состояний (в разные моменты времени), которым соответствуют сразу несколько групп признаков. Воздействие применяется не к сущности Состояние, а к некоторому виртуальному состоянию, описываемому группой признаков.

92

Литература

[1] V.N. Yudin. Applying Cluster Analysis for Searching for Analogs in Diagnostics and Choice of Treatment // Pattern Recognition and Image Analysis, Vol. 13, No. 4, 2003, pp 706-713.

[2] Карпов JI. E., Юдин В. H. Адаптивное управление по прецедентам, основанное на классификации состояний управляемых объектов // Труды Института Системного Программирования РАН, т. 13, ч.2. М., 2007, стр. 37-57.

[3] Карпов JI Е., Юдин В. Н. Интеграция методов добычи данных и вывода по прецедентам в медицинской диагностике и выборе лечения // Сб. докладов 13-й Всероссийской конференции "Математические методы распознавания образов (ММРО-13)". М., 2007, стр. 589-591.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[4] Карпов JI Е., Юдин В. Н. Система поддержки принятия решений для практикующих врачей // Ежегодная техническая конференция «Корпоративные базы данных-2008», Электронный ресурс. Режим доступа:

http: //www. citforum.ru/ seminars/ cbd2008

[5] Юдин В. Н., Карпов JI Е., Ватазин А. В. Процесс лечения как адаптивное управление человеческим организмом в программной системе «Спутник Врача» // Альманах клинической медицины, т. 17, часть 1. М., 2008, стр. 262-265.

[6] Юдин В. Н., Карпов JI Е., Ватазин А. В. Методы интеллектуального анализа данных и вывода по прецедентам в программной системе поддержки врачебных решений // Альманах клинической медицины, т. 17, часть 1. М., 2008, стр. 266-269.

[7] Ватазин А. В., Карпов JI Е., Юдин В. Н. Виртуальная интеграция и консолидация знаний в распределенной системе поддержки врачебных решений // Альманах клинической медицины, т.20, М., 2009, стр. 83-86.

[8] Klaus-Dieter Althof, Eric Auriol, Ralph Barlette, and Michel Manago. // A Review of Industrial Case-Based Reasoning Tools, AI Intelligence, 1995.

i Надоели баннеры? Вы всегда можете отключить рекламу.