Роль предыстории при оценке сложного объекта в управлении по прецедентам1
Л. Е. Карпов, В. Н. Юдин
Аннотация. Построение системы управления для нестационарных объектов - это дальнейшее развитие подхода к управлению объектами по прецедентам, разработанного в рамках более ранних работ авторов, применительно к нестационарным объектам с неполным описанием. Подход к управлению на основе прецедентов в виде цикла из трёх составляющих (оценка состояния объекта, выработка управляющего воздействия, оценка состояния после воздействия) для нестационарного объекта потребовал существенной доработки из-за неоднозначности в оценке объекта. За время оценки и выработки адекватного управляющего воздействия состояние объекта может самопроизвольно измениться, и заранее подготовленное воздействие станет непригодным. На нынешнем этапе упор сделан на разработку методики, позволяющей снизить неоднозначность оценки объекта до и после воздействия. Источником дополнительной информации может служить предыдущее поведение объекта.
Ключевые слова: система управления, вывод по прецедентам, добыча данных, база прецедентов, нестационарный объект, поведение объекта, мера близости, неполнота описания, дифференциальный ряд состояний.
Введение
Новая версия исследовательской системы поддержки решений, создаваемой в ИСП РАН (см. [1-15]), и существующей на её базе системы поддержки врачебных решений «Спутник Врача», связана с решением задачи управления нестационарными, не поддающимися формализации, объектами с неполным описанием. Основным примером таких объектов является организм человека, состояния которого в силу ограничений по времени и ресурсам могут описываться не полностью. Для такого рода объектов не существует и вряд ли
1 Работа поддержана грантами Российского фонда фундаментальных исследований № 12-01-00780, № 12-07-00214
будет создано в обозримом будущем адекватное описание в виде математической модели.
При попытках управления такими объектами возникает ситуация, принципиально отличающаяся от “классической”. Вместо точного вида математической модели объекта можно опираться только на доступную информацию о состояниях объекта управления, управляющих воздействиях на него и результатах воздействий. В теории вывода по прецедентам это соответствует трём составляющим понятия “случай” (прецедент) - описанию проблемы, применённому решению и результату применения этого решения. Совокупность таких случаев образует так называемую “базу прецедентов”. Построение системы управления на данном этапе - это дальнейшее развитие подхода к управлению по прецедентам, разработанного авторами ранее, применительно к нестационарным объектам с неполным описанием. Подход к управлению на основе прецедентов в виде цикла из трёх составляющих (оценка состояния объекта, выработка управляющего воздействия, оценка состояния после воздействия) для нестационарного объекта потребовал существенной доработки из-за неоднозначности в оценке объекта. Значительная часть подходов к управлению, в частности, управление физическими объектами, строится на предположении о том, что оценка состояния объекта и выработка управляющего воздействия на него -одномоментные события. Однако есть ряд приложений, например, медицина, где оценка объекта и подготовка управляющего воздействия могут занимать значительное время, за которое состояние объекта может самопроизвольно измениться, что сделает подготовленное воздействие непригодным. Причина трансформации объекта во времени - в наличии как внутренних, так и внешних (не зависящих от процесса управления) факторов.
Если принять за основу признаковое описание объекта, когда объект описывается набором своих характеристик, то к моменту применения воздействия объект будет иметь, вообще говоря, отличный от предыдущего набор признаков. Такая ситуация может возникать при управлении сложными объектами любой природы, но мы приведём пример из медицины. При остром аппендиците боли могут возникать в правой подвздошной области, но по мере перехода воспаления с аппендикса на брюшину и развития гангренозной стадии, занимающего несколько часов, боли могут уменьшиться или пройти, создавая впечатление “мнимого благополучия”. В целом, набор симптомов резко изменяется. Кроме того, некоторые важные признаки, которые являются существенными для позиционирования (правильной оценки) объекта, из-за нехватки средств или времени могут отсутствовать.
Особенность новой версии системы - адекватная подготовка управляющего воздействия для нестационарных объектов с неполным описанием. Упор был сделан на разработку методики, позволяющей снизить неоднозначность оценки объекта до и после воздействия, вызванную вполне естественной причиной: неполнотой описания объекта. Такая ситуация встречается на
практике во многих приложениях, в частности, в медицине, чаще всего (но не только) из-за нехватки времени и ресурсов. Основная идея предложенного метода заключается в том, что предыдущее поведение объекта может служить источником дополнительной информации для оценки объекта в текущем состоянии. Эго утверждение вызвало интерес и понимание в кругу врачей разного профиля (всегда учитывавших предысторию болезни и лечения пациента, так называемый анамнез), когда обсуждалась очередная версия программной системы поддержки врачебных решений “Спутник врача”, в которой реализуются эти принципы.
Основная проблема в выводе по прецедентам - выбор наиболее подходящего прецедента, который упирается в оценку схожести прецедента и текущего случая. В наших более ранних работах был введён метод оценки схожести в условиях неполноты описания объектов, основанный на разбиении базы прецедентов на классы состояний.
При оценке текущего случая точка, соответствующая ему, сравнивается с проекциями классов на пространство его признаков. Близкими считаются “аналоги” - прецеденты, принадлежащие классу, в который попадает случай. Если случай при его оценке попал в область пересечения классов, то близкими к нему будут аналоги из всех соответствующих классов, также находящиеся в этой области пересечения. В конечном счёте, аналоги самого высокого ранга находятся в области пересечения всех классов, которые образуют так называемый “дифференциальный ряд” случая. В зависимости от сложности пересечения, мы можем разделить все аналоги на группы (рис. 1). Приведём определение меры близости:
Расстояние между текущим случаем и прецедентом равно разности количества классов, куда попал текущий случай, и количества классов из этого числа, в котором находится прецедент.
Метод
Текший случай
1
1
2
Рис. 1. Мера близости для текущего случая. Дифференциальный ряд.
Для оценки неполностью описанных объектов введено понятие “дифференциального ряда” состояний объекта - совокупности проекций классов в указанном пространстве, в которые попал текущий случай.
Если нельзя однозначно оценить состояние объекта, можно попытаться расширить его признаковое пространство, дифференцировав классы, в которые оно входит, добавлением нового признака. Однако это не всегда возможно, в частности, из-за дефицита времени, средств или оборудования. Понятие цели управления не всегда отождествляется с достижением конкретного состояния. Целью может быть управляемое поведение, учитывающее переходы объекта из одного класса состояний в другой. Так, при лечении хронических заболеваний, задача восстановления больного органа - невыполнима. Тогда целью управления может стать замедление процесса дегенерации рабочей ткани. Поэтому, говоря о цели, мы имеем в виду не какое-то одно конкретное состояние, а оптимальное поведение объекта, выражающееся в принадлежности объекта в заданный конкретный момент времени к тому или иному классу. Требуется найти алгоритм управления, обеспечивающий достижение этой цели за конечное число управляющих воздействий.
Чтобы подобрать воздействие для текущего случая, в базе прецедентов отыскивается прецедент со схожим исходным состоянием С (первая составляющая понятия “прецедент”), схожим конечным состоянием с± (третья составляющая понятия “прецедент”), затем из него заимствуется воздействие (вторая составляющая), которое предположительно должно перевести наш объект в нужное состояние (рис. 2).
Состояние «до воздействия?} Состояние «после воздействия»
Рис. 2. Структура прецедента.
При выборе прецедентов и их управляющих воздействий могут встретиться случаи, наборы признаков которых в начальном состоянии совпадают, но для которых одно и то же воздействие приводит к разным конечным состояниям (рис. 3). Наличие таких случаев в одной базе прецедентов связано с тем, что состояние объекта не всегда описывается достаточно полно, и в этих случаях отсутствует неучтенный разделяющий признак. При наличии такого признака, исходные состояния при занесении их в базу прецедентов трактовались бы как разные. По этой же причине, для не полностью описанных случаев
невозможно гарантировать, что воздействие, заимствованное у прецедента, приведёт объект в нужное состояние.
Неоднозначность в оценке объекта, естественно, отражается и на выборе управляющих воздействий. Так как состояние текущего объекта описывается дифференциальным рядом, то для каждого из классов этого ряда в базе прецедентов существует, вообще говоря, своё воздействие, переводящее объект из этого класса в класс, соответствующий цели управления на текущем шаге. На самом же деле, исходя из предполагаемой оценки случая, выбирается одно воздействие. Таким образом, при отсутствии разделяющего признака, нет полной уверенности, что объект правильно идентифицирован, а выбранное воздействие приведёт его именно в то состояние, которое необходимо (рис. 4).
Рис. 3. Совпадение состояний из-за неполноты описания случая. Состояние "‘до воздействия7' Состояние “после воздействия^
Рис. 4. Элементарный ишг управления.
Так, в медицине практикующему врачу приходится действовать на свой страх и риск, и при неполной идентификации случая заболевания назначать лечение, которое, вообще говоря, может оказаться неадекватным. Но даже в этом случае перевод объекта в состояние, которое не соответствует цели лечения, может оказаться информативным, так как сопоставление полученного состояния с базой прецедентов может прояснить исходное состояние случая. Чем больше прецедентов в базе, тем больше спектр их возможных значений, тем выше вероятность найти “наиболее подходящий” прецедент, и выше качество принимаемого решения.
Оценивать объект, основываясь только на его текущем состоянии - это значит, не использовать всех возможностей для оценки. Принятие во внимание предыстории объекта - его состояний и реакций на воздействия -может снизить степень неоднозначности оценки текущего состояния и, следовательно, ограничить выбор воздействий (достаточно вспомнить понятие “анамнез” в медицине).
Особенность выполняемого авторами исследовательского проекта и новой версии системы управления в том, что управление объектом (оценка состояния и выработка управляющего воздействия) основывается не только на текущем состоянии, но и на всей предыстории поведения объекта.
Чтобы прояснить метод, рассмотрим снова элементарный шаг управления (рис. 5).
Предыдущее состояние (1-2) Текущее состояние (1)
В(Е1) _> 0(Е1)П01
Рис. 5. Формирование дифференциального ряда.
Введём ряд обозначений:
Пусть текущее состояние объекта - 1, а предыдущее -1-1:
• Д; - дифференциальный ряд, основанный (только лишь) на признаках 1-го состояния объекта,
• £>1-1 - дифференциальный ряд, основанный на признаках 1-1 -го (предыдущего) состояния объекта,
• Е± - воздействие, которое перевело объект в 1 -е состояние.
Если представить вместо О дифференциальный ряд, построенный виртуальным применением оптимальных воздействий для каждого из классов дифференциального ряда О из базы прецедентов, то это будет, вообще говоря, другой ряд, назовём его «предполагаемый» дифференциальный ряд 1-го состояния и обозначим 0{Е1).
До воздействия мы имеем только предполагаемый ряд О (Е1), после воздействия - ряд построенный по признакам 1-го состояния. Очевидно, что искомый класс для 1-го состояния должен находиться в пересечении множеств £> (Е1) ПД[.
Если такую процедуру делать в каждом состоянии объекта, начиная с первого, то вместо рядов Ок (к = 1, ... 1) мы будем иметь ряды О(Е ) ГШ . каждый из
которых меньше, либо равен Dk (если это не так, значит, база прецедентов недостаточно полна). Эго позволит на каждом шаге управления объектом сохранять информацию обо всех предшествующих шагах.
Разработанная методика ограничения дифференциального ряда используется в новой версии системы поддержки решений, а также в её медицинском варианте - программе поддержки врачебных решений в диагностике и выборе лечения “Спутник Врача”.
Заключение
Сложность реальных объектов, дополняемая неопределенностью их функционирования и неполнотой описания, затрудняет задачу построения адекватной модели поведения, что увеличивает значимость интеллектуальных методов управления. Основным примером таких объектов является организм человека, состояния которого в силу ограничений по времени и ресурсам могут описываться не полностью.
Для управления такими объектами авторы предложили использовать нетрадиционный и оригинальный подход, основанный на сочетании методов вывода по прецедентам (Case-Based Reasoning) и методов добычи данных (Data Mining).
По мере развития и совершенствования системы подход к управлению на основе прецедентов в виде цикла из трёх составляющих для нестационарных объектов потребовал существенной доработки из-за неоднозначности в оценке объекта. Разработана методика ограничения дифференциального ряда состояний объекта, позволяющая, начиная с первого шага управления, подобно голограмме, отображать на текущем шаге всё предыдущее состояние объекта.
Большой интерес к системам интеллектуального управления подтверждается огромным количеством публикаций и проводимых международных конференций, посвященных этим проблемам. Результаты, полученные авторами при реализации ранее поддержанных проектов, докладывались на представительных международных научных конференциях. Результаты обсуждений и интерес, вызванный докладами, показывает, что ведущаяся работа находится на современном мировом уровне.
Литература
[1] JL Е. Карпов, В. Н. Юдин, «Методы добычи данных при построении локальной метрики в системах вывода по прецедентам», Препринт Института системного программирования РАН, № 18, 2006, стр 1-42, http://citfonmi.ru/consultinz/BI/data mining/
[2] JL Е. Карпов, В. Н. Юдин, «Адаптивное управление по прецедентам, основанное на классификации состояний управляемых объектов», Труды Института системного программирования РАН (ИСП РАН), т. 13, № 2, Институт системного программирования РАН, 2007, стр. 37-57, ISBN 5-
89823-026-2. ISSN 2220-6426 (Online), ISSN 2079-8156 (Print), http://www.ispras.ni/ni/proceedinzs/docs/2007/13/2/isp 2007 13 2 37.pdf http://www.citforum.ru/consultinz/BI/karpov/
[3] JI. E. Карпов, В. H. Юдин, «Интеграция методов добычи данных и вывода по прецедентам в медицинской диагностике и выборе лечения», Математические методы распознавания образов. Сборник докладов 13-й Всероссийской конференции, октябрь 2007, МАКС Пресс, 2007, стр. 589-591, ISBN 978-5-317-02060-6, http://www.mmro. nt/files/mmrol3. pdf
[4] В. H. Юдин, JI. Е. Карпов, А. В. Ватазин, «Процесс лечения как адаптивное управление человеческим организмом в программной системе "Спутник врача"», Альманах клинической медицины, т. 17, № 1, МОНИКИ, 2008, стр. 262-265, ISBN 978-5-98511-032-6 (Т. XVII, ч. 1), ISBN 5-9900012-1-5. http://www.isan.troitsk.ru/win/blockl.pdf
[5] В. Н. Юдин, JI. Е. Карпов, А. В. Ватазин, «Методы интеллектуального анализа данных и вывода по прецедентам в программной системе поддержки врачебных решений», Альманах клинической медицины, т. 17, № 1, МОНИКИ, 2008, стр. 266-269, ISBN 978-5-98511-032-6 (Т. XVII, ч.
1), ISBN 5-9900012-1-5, http://www.isan.troitsk.ru/win/blockl.pdf
[6] JI. E. Карпов, A. H. Томилин, В. H. Юдин, «Репликация и валидация в распределенной системе поддержки врачебных решений», Труды Всероссийской научной конференции "Научный сервис в сети Интернет: решение больших задач", МГУ, 2008, стр. 387-392, ISBN 978-5-211-05616-9, http://azora. zuru. ru/abrau2008/pdf/043. pdf
[7] JI. E. Карпов, В. H. Юдин, А. В. Ватазин, «Виртуальная интеграция и консолидация знаний в распределенной системе поддержки врачебных решений», Научно-практическая конференция ЦФО РФ «Актуальные вопросы гемафереза, хирургической детоксикации и диализа», МОНИКИ, 2009, стр. 36. ISBN 978-5-98511-054-8.
[8] А. В. Ватазин, JI. Е. Карпов, В. Н. Юдин, «Виртуальная интеграция и консолидация знаний в распределенной системе поддержки врачебных решений», Альманах клинической медицины, т. 20, 2009, стр. 83-86. ISSN 2072-0505.
[9] А. В. Ватазин, JI. Е. Карпов, В. Н. Юдин, «Многопараметрическое управление сложным объектом в программной системе поддержки врачебных решений», III Евразийский конгресс по медицинской физике и инженерии "Медицинская физика - 2010", 21-25 июня 2010 г., т. 4, МОНИКИ, 2010, стр. 415-417.
[10] А. В. Ватазин, В. Н. Юдин, JI. Е. Карпов, «Многопараметрическое управление сложным объектом в программной системе поддержки врачебных решений», Ежегодная научно-практическая конференция Центрального Федерального округа РФ "Актуальные вопросы заместительной почечной терапии, гемафереза и трансплантационной координации", МОНИКИ, 2010, стр. 8. ISBN 978-5-98511-091-3.
[11] Leonid Karpov, Valery Yudin, «The Case-Based Software System for Physician's Decision Support», Sami Khari, Lenka Lhotska, Nadia Pisanti (eds.), "Information Technology in Bio- and Medical Informatics, ITBAM 2010", Proceedings of the First International Conference, Bilbao, Spain.
Lecture Notes in Computer Science Sublibrary: SL 3, Springer Verlag, Berlin, Heidelberg, 2010, pp. 78-85. ISSN 0302-9743.
[12] L. E. Karpov, V. N. Yudin, A. V. Vatazin, «Multi-Parametric Control of Complex Object in the Program System for Physician's Decision Support», Proceedings of the 12-th International Workshop on Computer Science and Information Technologies (CSIT'2010), Russia, Moscow - St. Petersburg, September 13-19, v. 1, Ufa State Aviation Technical University, 2010, pp. 28-30.
[13] JI. E. Карпов, В. H. Юдин, «Обмен данными в распределённой системе поддержки решений», Труды Института системного программирования, т. 19, Институт системного программирования РАН, 2010, стр. 71-80, ISBN 978-0-543-57630-9, ISBN 978-5-4221-0085-9, ISSN 2220-6426 (Online), ISSN 2079-8156 (Print),
httv://www.isvras.ru/ru/vroceedinzs/docs/2010/l9/isv 19 2010 71.pdf
[14] Л. E. Карпов, В. H. Юдин, «Многопараметрическое управление на основе прецедентов», Труды Института системного программирования, т. 19, Институт системного программирования РАН, 2010, стр. 81-93, ISBN 978-0-543-57630-9, ISBN 978-5-4221-0085-9, ISSN 2220-6426 (Online), ISSN 2079-8156 (Print),
http://www.isvras.ru/ru/vroceedinzs/docs/2010/19/isv 19 2010 81.vdf
[15] А. В. Ватазин, Л. E. Карпов, Ю. Г. Сметанин, В. Н. Юдин, «Программная система поддержки врачебных решений с гибридной архитектурой на основе правил и прецедентов», V Троицкая конференция "Медицинская физика и инновации в медицине (ТКМФ-5)", Сборник материалов, том 2, стр. 425-427. 2012, РАН, Троицкий Научный Центр, ISBN 978-5-89513-272-2