Синтез комбинированного решающего правила в задаче медицинской диагностики

Бурцев М.В.; Поворознюк А.И.

УДК 681.3

М.В. БУРЦЕВ, магистр НТУ "ХПИ" (г. Харьков),

А.И. ПОВОРОЗНЮК, канд. техн. наук, проф. НТУ "ХПИ" (г. Харьков)

СИНТЕЗ КОМБИНИРОВАННОГО РЕШАЮЩЕГО ПРАВИЛА В

ЗАДАЧЕ МЕДИЦИНСКОЙ ДИАГНОСТИКИ

Проведен обзор методов и алгоритмов синтеза решающих правил, применяемых в существующих медицинских системах поддержки принятия решений, выполнен анализ их достоинств и недостатков. Предложено комбинированное решающее правило, включающее вероятностный метод Вальда и описание структуры симптомокомплексов. Ил.: 3. Библиогр.: 14 назв.

Ключевые слова: поддержка принятия решений, метод Вальда, симптомокомплекс,

комбинированное решающее правило.

Постановка проблемы и анализ литературы. Активное развитие информационных технологий ведет к компьютеризации всех областей социальной деятельности человека. Современный вычислитель способен если не полностью заменить специалиста, то значительно упростить его работу. Это особенно важно для областей плохо формализуемых задач, одной из которых является медицинская диагностика.

На сегодняшний день существуют такие медицинские системы поддержки принятия решений: PUFF - выполняет диагностику легочных заболеваний; VM - осуществляет контроль состояния здоровья пациентов палат интенсивной терапии; MUCIN - диагностирует инфекционные заболевания; AI/COAG - заболевания крови, а AI/RHEUM - ревматические заболевания, [1]; "Гарвей" - контролирует состояние сердечно-сосудистой системы (для реанимационных отделений, операционных, палат интенсивной терапии, кабинетов функциональной диагностики); "Айболит" - оценивает свойства системы кровообращения по индивидуализированной модели пациента отделения интенсивной терапии [2]; АСПОН - автоматизированная система профилактических осмотров населения [3]; INTERNIST [4], MDX2 [5]

- интегрированные медицинские системы [6] и другие.

В основу решающих правил (РП), применяемых в этих системах, легли следующие алгоритмы и методы.

1. Метод Байеса. Основан на вычислении вероятности возможных диагнозов по вероятностям появления комплексов некоторых признаков и априорным вероятностям самих диагнозов. В расчете используется формула Байеса. Полученное значение вероятности сравнивается с некоторым порогом, в случае превышения которого делается вывод о наличии диагноза.

Требования: независимые признаки x}-.

Достоинства: простота реализации.

Недостатки: необходим большой объем и репрезентативность

обучающей выборки.

2. Метод Вальда. Основан на вычислении отношения правдоподобия для

последовательности признаков, и его сравнении со значением области

неопределенности, полученным на основании анализа обучающей выборки.

Для двух диагнозов и и системы признаков Х отношение

правдоподобия имеет вид:

Р( Ш.)

О =----ч—, (1)

Р(хшк) ()

при

Р(Бд ) + Р(БК ) = 1, (2)

где Р(ХЮк) — условная вероятность наличия системы признаков Х при диагнозе Вк.

В случае, когда Х рассматривается как система независимых признаков

вида

Х = (Хг, х2, х3,...,хт) , (3)

отношение правдоподобия (1) преобразуется в

т Р(X,■ / Ва)

О = П—----------—. (4)

^ Р(xJ / ) ( )

Анализ признаков х{ в (4) осуществляется в порядке убывания их информативно сти:

(х1) > (х2) > (х3) > ... > 1Э1 (хт) . (5)

Полученное значение ^ сравнивается с порогами:

л = 1-1; (6)

а

в = -Р-, (7)

1-а

где а - вероятность ошибки принятия диагноза при правильном диагнозе Б ; р - вероятность ошибочно принятого диагноза Б при наличии у

больного диагноза Ок .

Если О > А , то делается вывод о наличии диагноза Бд. Если О < В, то

делается вывод о наличии БК. В противном случае выполняется отказ от

постановки диагноза.

Требования: независимые признаки XJ..

Достоинства: возможность постановки уточняющего диагноза [7]. Недостатки: отношение правдоподобия может быть вычислено только для двух состояний, поэтому необходима дихотомизация диагностируемых состояний [8].

3. Методы распознавание образов. Основаны на представлении объекта

точкой в пространстве признаков. Данный класс методов включает множество различных алгоритмов, отличающихся вычисляемыми расстояниями (расстояния Эвклида, Минковского, Хэмминга, Камберра, Кендала и др.) [9], а также критериями их оценки (сравнение с прототипом, анализ к ближайших соседей, алгоритмы голосования и др.). К этому же классу относятся методы, в основе которых лежат нейронные сети.

Достоинства: высокая эффективность.

Недостатки: сложность реализации; проблема кластеризации объектов в виде компактных, четко различимых множеств.

4. Детерминистические методы, основанные на применении симптомокомплексов. Каждый диагноз определяется набором симптомов (диагностических признаков), которые образуют симптомокомплекс данного заболевания (вариантом представления является вектор дихотомических признаков [10]). Информацию о симптомах заболеваний в неформализованном виде можно найти в различных медицинских справочниках [11], сведения которых можно считать экспертной оценкой заболевания, выработанной многими поколениями врачей.

Различают следующие типы симптомов, формирующих симптомокомплексы: патогномонические (однозначно свидетельствуют о наличии заданного заболевания), специфические (присутствуют при заданном заболевании, но не указывают однозначно на его наличие), неспецифические (могут присутствовать при заданном заболевании).

Процесс диагностики представляет собой сравнение вектора признаков диагностируемого объекта с симптомокомплексами известных заболеваний. В качестве критерия сходства в простейшем случае может быть использовано расстояние Хэмминга [12].

Достоинства: простота реализации.

Недостатки: данный класс методов применим только для

дихотомических признаков, для численных - необходимо определение соответствующих областей (например, с помощью лингвистических переменных или разбивки на интервалы [13]); существует проблема составления симптомокомплексов для новых заболеваний.

Целью статьи является анализ достоинств и недостатков существующих методов синтеза решающего правила, являющегося ядром диагностической подсистемы, а также разработка комбинированного решающего правила, с целью повышения эффективности процесса постановки диагноза.

Синтез комбинированного решающего правила. Анализ достоинств и недостатков существующих алгоритмов показывает, что перспективным является применение комбинированного РП, основанного на объединении вероятностного и детерминистического подходов.

Вероятностный подход, реализуемый методом Вальда, подразумевает вычисление объективных априорных условных вероятностей Р(х^ / Бк) на

основании обучающей выборки. Для этого производится разбивка численных признаков XJ на непересекающиеся диагностически значимые интервалы х,

(/ = 1, п), по которым выполняется построение гистограмм,

аппроксимирующих теоретический закон распределения / (хJ■ / Дк)

анализируемого признака, для двух диагнозов Дд и ДК в одной системе координат. Вероятности Р(х -г- / Дк), относящиеся к гистограммам, рассчитываются как

^х,Ок

Р(хл / Бк) = —^, (8)

ЖДк

где Ых Д - количество объектов обучающей выборки со значением признака

j к

Хл при диагнозе Дк, попадающих в соответствующий интервал т, (т.е. Хл^ е т,), - общее число объектов обучающей выборки с диагнозом Дк .

На рис.1 приведены примеры теоретических законов распределения вероятностей /(хл / Дд) и /(хл- / Д), а также аппроксимация этих законов

распределения гистограммами.

х,

Рис. 1. Теоретические законы распределения условных вероятностей и их аппроксимация гистограммами

Если у пациента измеренный признак хл- попадает в интервал ^, то берется соответствующая условная вероятность Р(хл, / Дк), относящаяся к xi,

и подставляется в (4). Полученное значение сравниваются с порогами (6) и (7), на основании чего делается заключение о наличии диагноза (Дд или Д„), или же выполняется отказ от дальнейшей диагностики, если в РП вошли все признаки х л .

Подход, основанный на нечеткой логике [14], является выражением мнения экспертов. Он состоит в вычислении значения некоторой непрерывной функции ц(х ■ / Д) - функции принадлежности, полученной исходя из мнения

специалиста, которая выражает степень соответствия значения численного

признака х л некоторой лингвистической переменной, описывающей

рассматриваемый признак (например, "высокая температура" или "повышенное артериальное давление").

На рис. 2 показан внешний вид функций принадлежности ц(х, / Дд) и

ц(х, / Дм). Для данных функций справедливы соотношения:

Ц(х, / Дд ) = Ц(х, / Д ) = 1 - Ц(х, / Дм, ) ,

- (9)

Ц(х, / Дм ) = Ц(х, / Дд ) = 1 - Ц(х, / Дд ) .

Ц(х, /Дд) Ц(х, /Дм)

Рис. 2. Функции принадлежности ц(хг / Д ) и ц(хг / Д)

Кроме того, каждому из признаков хл- выставляется экспертная оценка,

выражающая его вес в симптомокомплексе. Эти оценки используются для взвешивания значения ц(хл / Дк) и принимают значения е0, е1, е2, е3, где е0 -

вес патогномонических симптомов; ег - вес специфических симптомов; е2 -вес неспецифических симптомов; е3 - вес показателей, не входящих в симптомокомплекс данного заболевания.

При этом справедливо неравенство

3

ео ^ е1 ^ е2 ^ eз, ^ = 1 • (10)

i=0

Таким образом, учитывая оценки ег, функция принадлежности принимает

вид

^1(х, / Дк ) = е,- • ^(х, / Дк ) . (11)

В конечном итоге, разные подходы (вероятностный подход, и подход на основе нечеткой логики) предназначены для решения одной и той же задачи классификации. Будучи полученными из разных предпосылок (статистика и мнение эксперта), они описывают общую проблему с различных позиций. Естественным является предположение, что их совместное использование

перспективно, поэтому могут быть предложены следующие варианты их

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

совместного использования:

1. Коллектив РП [9]. Данный метод может быть проиллюстрирован следующим образом (рис. 3).

О,,

Рис. 3. Структурная схема коллектива решающих правил

Симптомокомплекс Х анализируется с помощью каждого из РП, которым задана степень доверия wi. Блок логического вывода формулирует окончательный диагноз О, на основании взвешенных результатов работы всех решающих правил. При таком подходе, основанном на нечеткой логике, необходимо выполнение дефазификации.

2. Взвешивание. Отношение правдоподобия (4) с учетом (8) и (11) преобразуется к виду:

р(Х]1 / О) •ц1(/ О)

, =1 Р(Х], / Dw) •Ц1(Х] / Dw). ( )

Однако, при такой реализации нет возможности установить степень доверия к каждому из подходов отдельно.

3. Суммирование оценок. Так как условные вероятности Р(Х] / О,) и

значения функции принадлежности ц(х - / Д) являются нормированными

величинами, то можно выполнить их усреднение с учетом весовых коэффициентов ,. Тогда выражение (11) с учетом (8) преобразуется в

КХ] / Д) = к1р(х], / Д) + *2^1(Х] / Д), (13)

где , > 0, ^, = 1, ■ = 1,2 , а отношение правдоподобия приобретает вид

о = П-

тИ(Х : / )

^ = П—-^------ч—

,= 1 А(х, / Dw )

(14)

Выводы. Проведен анализ существующих алгоритмов и методов реализации решающих правил, применяемых в медицинских системах поддержки принятия решений, выявлены их сильные и слабые стороны. Предложен вариант комбинированного РП, которое позволяет учесть не только объективные вероятности, но и субъективные оценки экспертов.

Список литературы: 1. Джарратано Дж. Экспертные системы: принципы разработки и программирование, 4-е издание. / Дж. Джарратано, Г. Райли. - М.: ООО "И. Д. Вильямс", 2007. -1152 с. 2. Лищук В.А. Об инфраструктуре информационной поддержки клинической медицины / В.А. Лищук, А.В. Гаврилов, Г.В. Шевченко // Медицинская техника. - 2003. - № 4. - С. 36 - 42.

3. Лхушин В.М. Формальная модель автоматизированной системы профилактических осмотров населения / В.М. Axymm, В.В. Шanовaлов // Медицинская техника. - 2002. - № 1. - С. З-7.

4. Miller R.A. INTERNIST-l, An Experimental Computer-Based Diagnostic Consultant for General Internal Medicine / R.A. Miller, Jr. H.E. Pople, J.D. Myers // New England Journal of Medicine. - 1989. -Vol. 30?. - Р. 468-476. 5. Sticklen J. MDX2: An Integrated Medical Diagnostic System / J. Sticklen // PhD thesis, Department of Computer and Information Science, The Ohio State University. - 2000. -Р. 746 . 6. Генкин A.A. Новая информационная технология анализа медицинских данных (программный комплекс ОМИС) / A.A. Генкин. - СПб.: Политехника, 1999. - 191 с. 7. ПовоpознюкАИ. Метод постановки уточняющего диагноза в компьютерных системах медицинской диагностики при иерархической структуре диагностических признаков / АИ. Повоpознюк // Збірник наукових праць Харківського університету Повітряних Сил. Х.: ХУПС, 2006. - Вип. З (9). - С. 125-130. 8. Повоpознюк АИ. Синтез иерархической структуры диагностических признаков в компьютерных системах медицинской диагностики / АИ. Повоpознюк // Вісник Національного технічного університету "ХПІ". - Харків: НТУ "ХПІ", 2003. - № 7. - Т. 2. - С. 39-44. 9. Дюк B.A. Компьютерная психодиагностика / B.A. Дюк. - СПб.: Братство, 1994. - З64 с. 10. Тимофієвa Н.К. Моделювання цільової функції в задачі клінічної діагностики на основі теорії комбінаторної оптимізації / Н.К. Тимофієвa // Інтелектуальні системи прийняття рішень і проблеми обчислювального інтелекту. Матеріали міжнародної наукової конференції. Євпаторія 18-22 травня 2009 р. - Том 1. - Херсон: ХНТУ, 2009. - С. 219-223. 11. Справочник практического врача / Под pед. A.A. Mихaйловa, Л.И. Двоpецького. - М.: Новая Волна, 2001. - 528 с. 12. Повоpознюк A.И. Компьютерные системы медицинской диагностики: Лабораторный практикум: в 2 ч. - Ч.2. / AM. Повоpознюк, A.E. Филamовa, A.H. Шеин. - Харьков: НТУ "ХПИ", 2007. - 96 с. 13. Повоpознюк АИ. Формирование диагностических интервалов численных признаков при дифференциальной диагностике / АИ. Повоpознюк // Вісник Хмельницького національного університету. - Хмельницький: ХНУ - 2007. - N° 3. - Т. 1. - С. 106109. 14. Pуmковcкaя Д. Нейронные сети, генетические алгоритмы и нечеткие системы: / Д. Pуmковcкaя, М. Пилиньский, Л. Pуmковcкий. - М.: Горячая линия - Телеком, 2006. - 452 с.

Сmamья npедcmaвленa дж.н. npоф. HTy "ХПИ" Сеpковым A.A.

УДК 681.3

Синтез комбінованого вирішального правила в задачі медичної діагностики / Бурцев М.В., Поворознюк А.І. // Вісник НТУ "ХПІ". Тематичний випуск: Інформатика і моделювання. - Харків: НТУ "ХПІ". - 2009. - № 43. - С. 27 - 33.

Проведено огляд методів та алгоритмів синтезу вирішальних правил, що застосовуються в існуючих медичних системах підтримки прийняття рішень, виконано аналіз їхніх переваг і недоліків. Запропоновано комбіноване вирішальне правило, що включає імовірнісний метод Вальда та опис структури симптомокомплексів. Іл.: З. Бібліогр.: 14 назв.

Ключові слова: підтримка прийняття рішень, метод Вальда, симптомокомплекс,

комбіноване вирішальне правило.

UDC 681.3

Synthesis of the combined solving rule in the problem of medical diagnostics / Burtsev M.V., Povoroznuk A.I. // Herald of the National Technical University "KhPI". Subject issue: Information Science and Modeling. - Kharkov: NTU "KhPI". - 2009. - №. 43. - P. 27 - 33.

The solving rules methods and synthesis algorithms applied in existing medical systems of decision-making support are reviewed, and analysis of their merits and demerits is made. The combined solving rule including a both Wald’s method and the complex of symptoms structure description is offered. Figs.: 3. Refs.: 14 titles.

Key words: decision-making support, Wald’s method, complex of symptoms, combined solving

rule.

Поcmуn^илa в pедaкцию 19.10.2009

Синтез комбинированного решающего правила в задаче медицинской диагностики Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бурцев М. В., Поворознюк А. И.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Бурцев М. В., Поворознюк А. И.

Synthesis of the combined solving rule in the problem of medical diagnostics

Текст научной работы на тему «Синтез комбинированного решающего правила в задаче медицинской диагностики»