ВИРТУАЛЬНАЯ ИНТЕГРАЦИЯ И КОНСОЛИДАЦИЯ ЗНАНИЙ В РАСПРЕДЕЛЕННОЙ СИСТЕМЕ ПОДДЕРЖКИ ВРАЧЕБНЫХ РЕШЕНИЙ
А. В. Ватазин1, Л.Е. Карпов2, В.Н. Юдин2
1ГУ МОНИКИ им. М.Ф. Владимирского 2Институт системного программирования РАН
Спутник врача - интеллектуальная система поддержки врачебных решений в диагностике и выборе лечения на основе вывода по прецедентам. Система расширяет возможности использующего ее врача путём привлечения опыта, накопленного другими врачами в подобных системах. Описан переход к распределенному варианту функционирования системы с интеграцией баз прецедентов двух обычно автономных систем. Представлены различные варианты и проблемы такой интеграции.
Ключевые слова: системы поддержки принятия решений, вывод по прецедентам, диагностика, выбор лечения, распознавание образов, репликация баз данных.
VIRTUAL INTEGRATION AND CONSOLIDATION OF KNOWLEDGE IN DISTRIBUTED SOFTWARE SYSTEM FOR PHYSICIAN'S DECISION SUPPORT
A.V. Vatazin1, L.E. Karpov2, V.N. Yudin2
M.F. Vladimirsky Moscow Regional Clinical and Research Institute (MONIKI)
2Institute for System Programming, Russian Academy of Sciences
Doctor's Partner is an intelligent system for physician's decisions support in Diagnostics and Choice of Treatment. Its approach is based on using the Case-Based Reasoning. A natural extension of its possibilities would be bringing in experience, accumulated by other physicians in the similar systems. The transition to the distributed version of the system is described along with the exchange between local case bases. This exchange, in essence, is a knowledge exchange. The options for such an exchange are described.
Key words: systems for physician's decisions support, case-based reasoning, diagnostics, choice of treatment, identification of images, data bases replication.
Система «Спутник врача», разрабатываемая совместно Институтом системного программирования РАН и МОНИКИ им. М.Ф. Владимирского при поддержке Российского фонда фундаментальных исследований по проектам № 09-01-00351-а и № 09-07-00191-а, служит для информационного обеспечения врачебных решений на основе современных информационных технологий: теории принятия решений, вывода по прецедентам и распознавания образов. Система предназначена для помощи врачу в аккумуляции его профессионального опыта путем накопления и интерпретации данных о пациентах в виде «прецедентов» (случаев). Задача системы - поддержка врачебных решений в диагностике и выборе лечения.
Изначально наполненная смоделированными типовыми схемами диагностики и лечения, а в дальней-
шем пополняемая случаями из реальной врачебной практики совокупность прецедентов не является простым набором встретившихся врачу «случаев», слабо связанных между собой. Напротив, эта совокупность структурируется и классифицируется функционирующей системой, образуя так называемую «базу прецедентов». Система, построенная по такому принципу, является самообучаемой: чем больше прецедентов содержится в базе, тем характернее спектр возможных значений их параметров, тем выше вероятность найти «наиболее подходящий» прецедент и, следовательно, тем выше качество принимаемого решения.
Вывод на основе прецедентов представляет собой метод принятия решений, моделирующий человеческие рассуждения. Метод использует знания о предыдущих ситуациях или случаях (прецедентах),
которыми могут быть встречавшиеся ранее проблемы или типичные случаи, а также принятые в связи с ними решения. Как считают I. Watson и соавт. [7], всякий прецедент включает в себя:
- описание некоторого случая или проблемы;
- описание решения проблемы (действий, предпринимаемых в этом случае);
- результат применения решения (исход).
В медицине в качестве прецедентов рассматриваются реальные или смоделированные случаи заболеваний. При выборе лечения в состав описания случая включаются симптомы больного, результаты исследований, анамнез и так далее, в целом обозначаемые как набор признаков больного. Решением проблемы считается лечение, примененное к больному на данном шаге в виде выполненных процедур. Исход (состояние после примененного лечения) представляет собой обратную связь, позволяющую анализировать принятое врачом решение.
При рассмотрении новой проблемы (текущего случая) в системе делается попытка найти похожий прецедент, который в дальнейшем надлежит использовать в качестве аналога. Решение проблемы, выбранное из аналога, частью которого оно является, используется прямо и непосредственно либо адаптируется к текущему случаю. После того как текущий случай будет решен (то есть для него будет сформировано решение и изучен его результат), этот случай вносится в базу прецедентов вместе со своим решением и исходом для его возможного последующего использования.
В основе подходов к отбору прецедентов лежит оценка схожести прецедента и текущего случая. Обычно для определения этой схожести в пространстве признаков вводится специальная метрика, для вычисления которой в этом пространстве определяются точки, соответствующие текущему случаю и его исследуемым аналогам. На основе вычисленных значений метрики находится ближайшая к текущему случаю точка, представляющая прецедент.
В реальной жизни, когда объекты описываются разнородными признаками, в том числе и логическими, ввести метрику не всегда удается. В этих случаях вместо метрики используется так называемая «мера близости». Один из способов - разбиение базы прецедентов на классы. Случаи, принадлежащие одному классу, по определению являются схожими (в дальнейших рассуждениях понятие класс будем считать формализацией понятия заболевание). Разбиение базы прецедентов на отдельные классы в разных системах проводится по-разному. Например, такое разбиение можно проводить с помощью экспертного знания, когда признаки заболеваний и границы допустимых значений этих признаков задаются экспертом на основе его теоретических знаний и имеющегося у него опыта
врачебной практики. Можно также использовать специально разработанные обучающие выборки.
В программной системе «Спутник врача» реализован метод отбора прецедентов, базирующийся на оценке близости, смысл которой описан ниже. В описании случая может быть большое число признаков (часто до нескольких десятков), и иллюстрация будет строиться на примере пространства из двух признаков (рис. 1). Текущий случай сравнивается с описаниями классов в базе прецедентов (задачу отнесения отдельного объекта к одному из классов называют распознаванием объекта). Выбираются прецеденты, находящиеся в одном классе с текущим случаем.
Текущий случай
2 /
• / 2
0
2 \
2
Рис. 1. Степени близости прецедентов: 0 - ближайшая мера близости; 1, 2 - меры близости по возрастанию удаленности
К сожалению, на практике не всегда удается четко определить класс, в который попадает случай. Одной из наиболее частых причин этого является недостаток информации в его описании. Неполностью описанный случай может попасть в пересечение классов (другими словами, оцениваться неоднозначно) только потому, что у него не хватает признака, который дифференцировал бы его от других классов.
В зависимости от сложности пересечения классов, в которое попал исследуемый случай, прецеденты делятся на группы. Те прецеденты, которые находятся во внутренней области пересечения, естественно считать наиболее близкими к текущему случаю.
Система «Спутник врача» была изначально предназначена для персонального использования на локальном компьютере. Каждый врач хранит описания встретившихся именно ему прецедентов, формируя собственную базу прецедентов. Доступа к опыту других врачей он не имеет. Однако естественным расширением возможностей системы было бы как раз привлечение опыта, накопленного другими врачами в подобных системах. Для этого нужно воспользоваться данными, хранящимися в базе прецедентов локальной системы, находящейся в ведении другого врача. Обмен данными между аналогичными системами по сути представляет собой обмен накопленными знаниями.
Обмен может осуществляться двумя способами. Первый вариант - это запрос из базовой («своей») системы в удаленный компьютер врача-коллеги с показателями текущего случая (рис. 2).
Рис. 2. Оценка текущего случая с помощью запроса к удаленному компьютеру
В ответ на запрос удаленный компьютер сообщает базовой системе наиболее подходящие прецеденты вместе с описаниями их классов (заболеваний). В базовой системе формируется картина из прецедентов и пересекающихся классов, полученная в результате объединения информации (рис. 3).
Рис. 3. Оценка текущего случая методом виртуальной интеграции: а - в базовой системе до интеграции; б - в удаленном компьютере; в - в базовой системе после интеграции
Такая интеграция называется виртуальной, так как реального пополнения базы прецедентов базовой системы при рассмотрении конкретного случая не происходит. Виртуальная интеграция позволяет проводить на практике оценку текущего случая, принимая во внимание опыт, накопленный в каждой из локальных систем. В классической медицине аналогом такой интеграции является консилиум врачей, когда мнение другого врача может помочь в оценке картины заболевания. Объединение данных из нескольких систем при рассмотрении сложного случая позволяет существенно повысить качество принимаемого решения, как и в случае консилиума. В частности, в базовой системе вообще могут отсутствовать прецеденты и классы, необходимые для оценки текущего случая. Тогда виртуальная картина будет собираться из того, что получено по запросу из удаленных компьютеров.
Реально картина на экране компьютера не выглядит так просто, как на рис. 3. Многомерный случай размерностью больше двух невозможно достаточно наглядно представить двухмерной проекцией. Наиболее информативный вариант - представление в виде
так называемой реляционной модели, в виде нескольких взаимосвязанных таблиц.
На рис. 4 показаны прецеденты, найденные системой для смоделированного случая «симптомы острого живота». Источником двух первых прецедентов является базовая система, третьего - удаленный компьютер.
Рис. 4. «Спутник врача»: прецеденты с симптомами «острого живота»
Работа по первому варианту имеет смысл, когда информация из удаленной системы может оказать дополнительную помощь в диагностике, но не относится прямо к области деятельности врача, ведущего работу с базовой системой. При рассмотрении последующих случаев полученная информация более участвовать не будет (виртуальная интеграция должна проводиться заново при рассмотрении каждого нового случая). Если же зафиксированный случай оказался более интересным, и врач предполагает, что в дальнейшем он будет сталкиваться с подобными случаями повторно, ему будет полезнее импортировать все прецеденты удаленной системы или определенную их часть в свою базу прецедентов. Тогда он решает позаимствовать из нее часть прецедентов вместе с описаниями их классов, либо некоторые классы целиком. Возникает второй вариант обмена - консолидация знаний. В этом случае осуществляется доступ не к сервису, а к данным удаленного компьютера.
В распределенных базах данных процесс тиражирования данных (распространение изменений, первоначально выполненных на одной копии блока данных, на другие копии) называется репликацией данных. Здесь репликация - это не просто импорт прецедентов (или их части) из одного компьютера в другой, но и сопутствующая ему реорганизация базы прецедентов.
Импорт - это процесс, который может выполняться как в автоматизированном, так и в ручном режиме. Прецеденты и классы из удаленной системы копируются в базовую систему, что приводит к необходимости переопределения границ классов с учетом воз-
можных коллизий. Реорганизация может привести к выявлению новых классов, ранее отсутствовавших в реплицируемой базе.
Пользователь базовой системы может контролировать процесс импорта. Сначала на экране системы высвечивается картина, отражающая содержимое, полученное по запросу с удаленного компьютера (рис. 3,б). Оператор помечает прецеденты, которые нужно импортировать, затем переключается в интегрированный режим для просмотра ожидаемого результата (рис. 3,в). При необходимости цикл повторяется многократно.
Оба рассмотренных варианта имеют очень важную модификацию, существенным образом влияющую на процесс взаимодействия систем между собой. Эта модификация процесса распространения информации между системами состоит в том, что в качестве одного из источников дополнительных данных может выбираться крупный информационный центр коллективного доступа, который содержит выверенные данные, поступающие из локальных систем различных практикующих врачей (рис. 5).
Рис. 5. Совместное использование локальных систем и информационных центров коллективного доступа
Заполнение коллективной базы прецедентов, которая используется врачами, имеющими различный опыт, не может осуществляться путем простой репликации данных. Репликация должна в обязательном порядке сопровождаться также валидацией описаний прецедентов, то есть синхронизацией терминологии, уточнением численных и логических показателей, отсеиванием сомнительных и откровенно ошибочных данных.
Перспективы использования описанной технологии находятся в создании систем поддержки принятия решений, удаленный доступ к которым может получить врач любой специальности, сталкивающийся с нозологическими формами, отличными от привычных ему форм, и таким образом оптимизировать диагностику, лечение и реабилитацию наблюдаемых им больных.
Чтобы обеспечить возможность такого доступа и облегчить его технически как в локальных, так и в глобальных сетях (в том числе в сети Интернет), при разработке программного обеспечения предлагается использовать совокупность стандартов, на которых базируются современные сетевые службы. Изучение тенденций развития сетевых служб показывает, что их разработчики все чаще стремятся использовать единые подходы, независимо от того, предполагается ли работать только в локальных сетях или возможен выход и в глобальные сети (корпоративные или общедоступные).
Дальнейшая работа группы разработчиков направлена на использование системы удаленного доступа через Интернет к информационным центрам коллективного доступа, в которых аккумулирован большой объем данных (в медицине такую роль выполняют крупные медицинские центры). Это позволит широкому кругу врачей пользоваться накопленными там данными, используя содержащиеся в них реальные объекты и ситуации как прецеденты.
ЛИТЕРАТУРА
1. Карпов Л.Е., Юдин В.Н. Методы добычи данных при построении локальной метрики в системах вывода по прецедентам. М., 2006.
2. Карпов Л.Е., Юдин В.Н. Адаптивное управление по прецедентам, основанное на классификации состояний управляемых объектов // Труды Ин-та системного программирования РАН, т.13, ч.2. М., 2007. С.37-57.
3. Карпов Л.Е., Юдин В.Н. Интеграция методов добычи данных и вывода по прецедентам в медицинской диагностике и выборе лечения // Сб. докл. 13-й Всерос. конф. «Математические методы распознавания образов (ММРО-13)». М., 2007. С.589-591.
4. Карпов Л.Е., Юдин В.Н. Система поддержки принятия решений для практикующих врачей // Ежегодная техническая конференция «Корпоративные базы дан-ных-2008». Электронный ресурс. Режим доступа: http:// www.citforum.ru/seminars/cbd2008.
5. Юдин В.Н., Карпов Л.Е., Ватазин А.В. Процесс лечения как адаптивное управление человеческим организмом в программной системе «Спутник врача» // Альманах клинической медицины, т.17, часть 1. М., 2008. С.262-265.
6. Юдин В.Н., КарповЛ.Е., Ватазин А.В. Методы интеллектуального анализа данных и вывода по прецедентам в программной системе поддержки врачебных решений // Альманах клинической медицины, т. 17, часть 1. М., 2008. С. 266-269.
7. Watson I., Marir F. Case-Based Reasoning: A Review // Knowled. Engineer. Rev. 1994. V.9. No.4.