Научная статья на тему 'Система поддержки принятия решения в медицине на основе синтеза структурированных моделей объектов диагностики'

Система поддержки принятия решения в медицине на основе синтеза структурированных моделей объектов диагностики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
538
124
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕДИЦИНСКАЯ ДИАГНОСТИКА / КОМПЬЮТЕРНАЯ СИСТЕМА / СТРУКТУРИРОВАННАЯ МОДЕЛЬ / НЕОПРЕДЕЛЕННОСТЬ ПАРАМЕТРОВ / ЭКСПЕРТНЫЕ ОЦЕНКИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Поворознюк А. И.

Разработан метод синтеза структурированных моделей объектов диагностики при построении компьютерных систем поддержки принятия решений в медицине на всех этапах преобразования информации. При этом учитывается не только структурный и функциональный базисы, но и неопределенность параметров модели и экспертные оценки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Поворознюк А. И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Система поддержки принятия решения в медицине на основе синтеза структурированных моделей объектов диагностики»

УДК 681.5

СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЯ В МЕДИЦИНЕ НА ОСНОВЕ СИНТЕЗА СТРУКТУРИРОВАННЫХ МОДЕЛЕЙ ОБЪЕКТОВ ДИАГНОСТИКИ

А. И. ПОВОРОЗНЮК Разра(5отан метод синтеза структурированных моделей объ-

ектов диагностики при построении компьютерных систем под-Национальный держки принятия решений в медицине на всех этапах преобразо-

технический вания информации. При этом учитывается не только структурный

университет и функциональный базисы, но и неопределенность параметров

«Харьковскии ^ модели и экспертные оценки.

политехнический

институт» Ключевые слова: медицинская диагностика, компьютерная

e-mail-perederiy@mail ги система, структурированная модель, неопределенность парамет-

ров, экспертные оценки.

Постановка проблемы и анализ литературы

Внедрение новых информационных технологий в медицину обуславливает переход от традиционных медицинских информационно-поисковых систем к интеллектуальным компьютерным системам поддержки принятия решений в медицине (ИКСППМ) с развитым математическим аппаратом и элементами экспертных систем. Разработчики ИКСППМ отмечают следующие актуальные оптимизационные задачи, которые требуют первоочередного решения [1, 2]:

— выделения диагностически-значимых структурных элементов на фоне артефактов и помех (структурная идентификация) при анализе биологических сигналов и медицинских изображений;

— формализация, оценка информативности и формирование минимально необходимого множества информативных признаков;

— синтез решающего правила (РП), согласно которому выполняется процесс диагностики пациентов.

Как отмечается в [1], применение традиционных математических методов (детерминистических, вероятностных, и др.) для решения отмеченных оптимизационных задач в медицине является не совсем корректным, так как применяемые методы рассматривают модель объектов диагностики (ОД) в виде "черного ящика", не учитывают сложности организации диагностируемых подсистем организма, особенностей формирования системы разнотипных диагностических признаков (числовые, ранговые, дихотомические), разнородность методик их получения (анкетирования, осмотр, клинические исследования, анализ биологических сигналов и медицинских изображений), а также сложной итерационной процедуры постановки диагноза (от предварительного до уточненного), поэтому актуальной является задача разработки адекватных моделей ОД и РП на этих моделях.

Цель работы

Целью работы является разработка методов построения интеллектуальных компьютерных системам поддержки принятия решений в медицине на основе единого формализованного подхода синтеза структурированных моделей объектов диагностики на всех этапах преобразования информации.

Синтез структурированных моделей объектов диагностики.

Синтез структурированных моделей ОД основан на концепции эволюционной идентификации структурированных моделей (С-моделей), разработанной в работах Букатовой И. Л. [3], при этом базовым понятием является С-модель, реализующая преобразование И: X^ У, то есть отображение входного вектора X в выходной У через набор операторов f из множества И (/ е Г) в соответствии с некоторой структурой Б, которая определяет порядок следования f. Таким образом, С-модель задается графом, вершинами которого являются функциональные элементы f заданного класса моделей, а информационная связь вершин задается структурой 5, то есть С = ^ 5}.

Учитывая отмеченные выше оптимизационные задачи при построении ИКСППМ, разнородность диагностических признаков, итерационную процедуру постановки диагноза и необходимость учета экспертных оценок при формировании диагностического вывода, автором в [2] формализованы следующие этапы преобразования информации в ИКСППМ:

— структурная идентификация биологических квазипериодических сигналов (БКС), которые отражают циклические процессы в организме — электрокардиограмма (ЭКГ), реограмма (РГ), и др. и медицинских изображений внутренних органов (МИ) - томограмма, ренгенограмма, УЗИ;

— формализация описания разнородных диагностических признаков;

— синтез иерархических структур диагностируемых состояний 5о и диагностических признаков Б/;

— синтез диагностических РП при взаимодействии 5о и 52;

— синтез индивидуальных диагностических прогнозирующих моделей;

— рекомендации по выбору оптимальной методики лечения.

На каждом из отмеченных этапов решается локальная оптимизационная задача, для которой используется свой набор исходных данных, свой критерий оптимальности и алгоритм оптимизационной процедуры, поэтому в [4] автором вводится понятие понятие расширенной С- модели (С-модель) и процедура реконфигурации модели. С-модель задается следующим образом

С' = {8,Е,Е, 8а,8д} , (1)

где: Б ={Р,У} — структура модели, которая задана множествами вершин Р и

дуг V;

И — функциональный базис модели, причем функции могут приписываться как вершинам fp, так и дугам /V;

Е — экспертные оценки, которые при необходимости дополняют И компоненты;

8а — неопределенность параметров Г-базиса, которая зависит от статистических свойств обучающей выборки;

8д — неопределенность параметров Г-базиса, которая зависит от точности их задания (шага квантования).

Значения 8а и 8д используется не только в качестве оценки параметров модели, но и являются параметрами оптимизационных процедур при синтезе модели. При реализации последовательности этапов преобразования информации, на каждом из которых используется критерий О/, выполняется реконфигурация модели /-1 этапа путем структурных и функциональных преобразований. Рассмотрим применение С-моделей при реализации отмеченных ранее этапов преобразования информации.

Этап выделение информативных структурных элементов БКС, параметры которых являются диагностическими признаками, является наиболее ответственным и трудоемким этапом их обработки, так как ошибки структурной идентификации (пропуск структурного элемента или ложная идентификация) приводят к грубым ошибкам вычисления диагностических показателей и ошибкам компьютерного диагноза (если не предусмотрены специальные средства выявления указанного типа ошибок, в частности отказ от обработки "подозрительного" периода или подтверждение чело-века-оператора правильности структурной идентификации).

Сложность идентификации состоит в том, что амплитудные и временные характеристики структурных элементов содержат информацию о работе диагностируемых подсистем организма и подвержены вариабельности в широком диапазоне, кроме того, эти сигналы могут содержать артефакты (резкое изменение некоторых характеристик в отдельных периодах) и снимаются на фоне помех. Традиционные методы обработки БКС во временной области (контурный анализ) являются по сути эвристическими, с трудом адаптируются к другим типам сигналов и не удовлетворяют возрастающим требованиям к качеству структурной идентификации.

Автором разработана формализованная процедура идентификации структурных элементов БКС на основе построения индивидуального пространства параметров для каждого типа структурного элемента с использованием методологии и вычислительных процедур преобразования Хока [4, 5]. При этом строится С'-модель (1) эталона каждого типа структурного элемента, параметрами которой являются:

— Б — граф неточечного преобразования Хока фрагмента БКС из временной области х(Ъ) в пространство параметров У(Р);

— Р — вычислительные процедуры преобразования Хока;

— Е — априорная информация о структуре БКС (адаптивная временная маска);

— 8д — неопределенность квантования пространства параметров.

Синтез Бй выполняется процедурой иерархической кластеризации Р1: {Р}^Бэ множества диагностируемых состояний {й} в признаковом пространстве {X}, при этом параметрами С'-модели (1) являются:

— Б — граф диагностируемых состояний (бинарное дерево решений);

— Р — вычислительные процедуры кластеризации;

— Е — экспертная информация о структуре симптомокомплексов.

Синтез Б2 выполняется в результате преобразований Р2: {Х}^-Бх, Р3: Бх^-Бу и Р4: Бу^Б (Р3 и Р4 — реконфигурация структур). Параметры С'-модели (1):

— Б ={Бх, Бу, Б1} — графы диагностических признаков;

— Р — вычислительные процедуры синтеза Б;

— Е — экспертная информация о структуре симптомокомплексов;

— 8д — неопределенность квантования числовых признаков;

— 8а — неопределенность, обусловленная ограниченностью обучающей выборки.

Преобразование Р2 удовлетворяет критериям минимума корреляционной связи и для его реализации в [2] предложена процедура иерархической кластеризации, основанная на представлении задачи кластеризации в виде потоковой модели. При этом исходные признаки представляются вершинами полносвязного графа, а дугам такого графа приписываются некоторые численные данные (кц — коэффициент парной корреляции, хотя возможно применение других статистических мер связи). Тогда задача иерархической кластеризации вершин сводится к последовательной процедуре поиска минимального разреза графа в потоковой задаче с ограничениями, для решения которой предлагается адаптация алгоритма “дефекта” [6]. В потоковых задачах с ограничениями каждая дуга Vij характеризуется следующими параметрами: ^ — поток по дуге; Ц — нижняя пропускная способность дуги; и — верхняя пропускная способность дуги; С — стоимость прохождения единицы потока по дуге.

Для рассматриваемой задачи кластеризации диагностических признаков Ц = 0, — кц. Значение С при отсутствии априорной информации принимается

равным 1 для всех дуг, а при ее наличии устанавливаются с помощью экспертных оценок, т.е. С = Ец, Ец < 1 для тех вершин, которые соответствуют признакам, входящим в симптомокомплекс одного заболевания. Значения потоков ^ определяются после завершения работы алгоритма ”дефекта”, для которого необходимо задать начальную конечную вершины (исток э

и сток I).

Задание э и I выполняется на основе оценочной кластеризации вершин по методу корреляционных плеяд, при котором исходное множество вершин N распадается на два непересекающихся подмножества N3 и №, после чего в каждом из них определяется наиболее связанная с остальными вершина (5 е Ns и / е Ы1.), удовлетворяющая условию Ni = тах ^ Су , причем 5 = N ^У у е Ns и ^ = N\^У у е . После определе-1 1

ния потоков на всех дугах определяется минимальный разрез графа Р^, для которого справедливы соотношения:

^ = и ц VУjj е (^,^),

111 (2)

^ = 0 VУ;. е N, N5).

Минимальный разрез разделяет все вершины графа на два непересекающихся множества (N3, включающее начальную вершину э и №, включающее конечную вершину 0 таким образом, что потоки насыщают все прямые дуги разреза и нулевые на всех обратных дугах разреза (2). В результате иерархической кластеризации синтезируется иерархическая структура Бх, на нижнем уровне иерархии которой могут быть как отдельные диагностические признаки (если они информативны и независимы), так и кластеры коррелированных признаков, а также схема объединения кластеров на остальных уровнях.

Преобразование Г3 выполняется по критерию минимума интегральной неопределенности 8к, которая включает 8д и 8а и возникает при замене динамического диапазона изменения значений числового признака при разбивке А на т неравномерных диагностически-значимых интервалов А* и построения соответствующих гистограмм. В [7] получено выражение оценки 8к и итерационная процедура формирования А*, при которой минимизируется 8к .

Целью преобразования является согласование топологий 52 и 5о для реали-

зации диагностического РП и обеспечения оптимального плана обследования конкретного пациента. При этом, каждой паре элементов 5о, имеющей общего родителя, ставится в соответствие один элемент структуры 52. Элементы структуры 52 формируются из элементов структуры 5у с учетом их информационной полноты

кип(Ху.О) = 1В(Ху)/Н(П),

где 1П (Ху) — информативность признака Xj относительно состояний О; Н(О) — энтропия о, и диагностической ценности

кдц (Х1 ’ П) = кип (Х] > П)/Г (Х] ) ,

где г (Ху) — суммарная оценка сложности измерения признака х).

В работе реализуется метод синтеза уточняющего диагноза [8], который является модификацией метода последовательного анализа (метода Вальда) и основан на анализе взаимодействия иерархических структур диагностических признаков 52 и диагнозов 5о. На каждом /-м этапе последовательного анализа, при дифференциальной диагностике между двумя диагнозами Од и О, вычисляются отношения правдоподобия

ЕкдР(Хк / Пд)

ЕШР(Хгк / П) , ( )

которое сравнивается с порогами

© > А , © < В , (4)

где А и В — верхняя и нижняя границы неопределенности, необходимые для принятия решения.

При выполнении одного из условий (4) принимается решение о диагнозе Од или О1 соответственно и выполняется переход на более низкий уровень иерархии диагнозов с целью уточнения диагноза. При невыполнении обеих неравенств (4) добавляется следующий / + 1 признак и процедура повторяется. Для реализации комбинированного решающего правила, в выражении (3) учитывается неопределенность оценок условных вероятностей, кроме того, условные вероятности взвешиваются системой экспертных оценок о структуре симптомокомплексов Ещ и Еш, методика расчетов которых приводится в [9].

Разработка структурной схемы СППРМ.

Для программной реализации рассмотренных ранее математических методов структурной идентификации ОД, СППРМ должна работать в двух режимах: режим обу-

0 = П

і

чения и рабочий режим постановки диагноза. В режиме обучения выполняется формирование БЗ, в процессе которого выполняется синтез и настройка параметров структурированных моделей структурных элементов БКС и медицинских изображений, диагностических признаков и диагностируемых состояний, комбинированного РП. В режиме постановки диагноза выполняется анализ биологической информации, полученной от пациента и формирование диагностического заключения. На рис. 1 показана структурная схема СППРМ, в которой сплошными стрелками показаны информационные потоки в режиме обучения, а пунктирными — в режиме постановки диагноза.

Рис. 1. Структурная схема СППРМ

Назначение модулей следующее:

— БД — база данных, которая хранит результаты обследований пациентов и верификацию диагностического заключения. Следует отметить, что при анализе БКС и медицинских изображений, в БД хранятся как исходные сигналы, так и результаты их структурной идентификации и сформированное множество вторичных диагностических признаков;

— БЗ — база знаний, которая хранит параметры отмеченных ранее структурированных моделей ОД.

— модуль ввода перечня диагностических признаков, диагностируемых состояний и экспертных оценок структур симптомокомплексов;

— модуль ввода значений первичных диагностических признаков;

— модули ввода БКС и медицинских изображений;

— модуль синтеза структурированных моделей структурных элементов БКС и медицинских изображений;

— модуль синтеза структурированой модели (иерархическая кластеризация) диагностируемых состояний;

— модуль синтеза и реконфигурации структурированой модели диагностических признаков;

— модуль реализации комбинированного РП;

— модуль формирования выходных экранных форм и документов, а также реализации интерактивного интерфейса с ЛПР.

Выполнен анализ средств для создания программного обеспечения, в результате которого обоснован выбор интерактивной среды программирования Inprise (Borland) Delphi на базе языка программирования высокого уровня Pascal, который характеризуются высокой точностью вычислений при работе с вещественными типами данных. Отмеченая особенность языка явилась определяющей при значительном объеме вычислений, который выполняет СППРМ (особенно в режиме обучения). На этапе исследований и тестовых проверок использовался пакет "СТАТИСТИКА".

Апробация метода и обсуждение результатов.

Для апробация метода синтеза Sz и реализации РП, взята выборка из 434 пациентов, у которых диагностировалось 10 диагнозов (в скобках указано количество пациентов): Di — здоров (243), D2 — анемия неуточненная (29), D3 — кардиомиопатия (10), D4 — хроническая ишемическая болезнь сердца неуточненная (17), D5 — аллергический геморрагический васкулит (24), De — хронический холецистит (21), D7 — пневмония неуточненная (16), De — инфекционный мононуклеоз неуточненный (28), D9 — хронический лимфоидный лейкоз (26), D10 — почечная недостаточность неуточненная (20). Анализировались 9 показателей клинического анализа крови: Eritr — эритроциты, Hb — гемоглобин, Leic — лейкоциты, Limf — лимфоциты, Eozin — эозинофи-лы, Pal — нейтрофилы палочкоядерные, Seg — нейтрофилы сегментоядерные, Mon — моноциты, Coe — скорость оседания эритроцитов. Полученные показатели качества классификации приведены в табл. 1.

Таблица 1

Показатели качества классификации

Di D2 D3 D4 D5 De D7 D8 D9 D10 Среднее

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

W % 97,53 75,86 40,00 29,41 91,67 85,71 62,50 85,71 88,46 95,0 88,48

% 98,5 67 62 69 98,4 97,3 79 98,4 93 95 92,8

Mx 2,2 6,68 7,82 6,42 5,39 3,67 4,58 5,39 5,75 3,73 3,61

В табл. 1 в первой строке указана достоверность классификации ^ стандартным методом дискриминантного анализа в пространстве 9 исходных признаков, а во второй ^' — предлагаемым методом уточняющего диагноза с использованием оптимальной схемы обследования пациентов. В третьей строке Мх — среднее число анализируемых признаков у одного пациента. Последний столбец таблицы расчитан по формуле среднего для неравномерных групп

- V N

х = у х, —-,

* ! N

где х/ — показатель качества; N/ — количество объектов в /—й группе; N — суммарный объем выборки.

Из табл. 1 следует, что в предлагаемом методе среднее число анализируемых признаков равно 3,61, что в 2,5 раза меньше исходных 9 признаков. При применении предлагаемого метода средняя достоверность диагноза повысилась с 88,48% до 92,8%, при этом из общего числа отрицательных ответов (31 ответ из 434) получена дифференциация 25 отрицательных ответов о невозможности постановки диагноза на предварительные диагнозы разного уровня. Кроме того, существенно повысилась достоверность тех диагнозов, у которых в обучающей выборке имеется недостаточно объектов (£>3, £л, £7, ...) за счет незначительного снижения достоверности диагноза с наибольшей выборкой — Д. Это свидетельствует об эффективности применения предлагаемого метода на обучающих выборках с существенной неравномерностью количества объектов в анализируемых классах.

Выводы

Разработаны методы построения ИКСППМ на основе синтеза структурированных моделей ОД, которые учитывают не только структурный и функциональные

базисы, но и неопределенность параметров, а также позволяют учитывать экспертные оценки. Показано применение метода структурной идентификации на всех этапах преобразования информации. Разработанные методы позволяют снять ограничения на размерность пространства диагностических признаков, повысить достоверность компьютерного диагноза и адаптироваться к конкретным объектам медицинской диагностики.

Литература

1. Ахутин В.М. Оценка качества формализованных медицинских документов [Текст] / В.М. Ахутин, В.В. Шаповалов, М.О. Иоффе / / Медицинская техника М.: 2002. № 2. С. 27 - 31.

2. Поворознюк А.И. Формализация этапов проектирования интеллектуальных компьютерных систем медицинской диагностики [Текст] / А.И. Поворознюк // Электронное моделирование К.: ІПМЕ, 2006. - Т. 28. №1 С. 85 - 97.

3. Букатова И.Л. Эвоинформатика: теория и практика эволюционного моделирования. [Текст] / И.Л. Букатова, Ю.И. Михасев, А.М. Шаров - М.: Наука, 1990.- 212с.

4. Поворознюк А.И. Система поддержки принятия решений в медицине на основе структурной идентификации объектов диагностики [Текст] / А.И. Поворознюк //Сборник научных трудов СНУЯЕиП. Севастополь: СНУЯЕиП, 2008. № 1 (25) С. 234 - 245.

5. Поворознюк А.И. Применение преобразования Хока для структурной идентификации физиологических сигналов // Моделювання та інформаційні технології. Збірник наукових праць інституту проблем моделювання в енергетиці. . К.: ІПМЕ, 2003. - Вип. 22, с.143 - 149.

6. Филлипс Д. Методы анализа сетей / Пер. с англ. [Текст] / Д. Филлипс, А. Гарсиа-Диас - М: Мир, 1984. - 648 с.

7. Поворознюк А.И. Формирование диагностических интервалов численных признаков при дифференциальной диагностике// Вісник Хмельницького національного університету. - Хмельницький: ХНУ, 2007.-№з, Т.1. С.106 - 109.

8. Поворознюк А.И. Метод постановки уточняющего диагноза в компьютерных системах медицинской диагностики при иерархической структуре диагностических признаков [Текст] / А.И. Поворознюк // Збірник наукових праць Харківського університету Повітряних Сил. Х: ХУПС, 2006. - Вип. 3(9). С. 125 - 130.

9. Поворознюк А.И. Интеллектуальная система поддержки принятия решений в медицине [Текст] / А.И. Поворознюк // Материалы XIII международной конференции с автоматического управления (Автоматика 2006), г.Винница 25-28 сентября 2006г. - Винница: УНИ-ВЕРСУМ-Винница, 2007. С. 364 - 368.

DECISION SUPPORT SYSTEM IN MEDICINE ON BASE OF THE SYNTHESES OF THE OUTLINE MODELS OBJECT DIAGNOSTICSES

A. I. POVOROZNYUK

National technical university "Kharkovpolytechnic institute" Kharkov, Ukraine

The Designed method of the syntheses of the outline models object diagnosticses at building computer decision support system in medicine on all stage of the transformation to information. Is it Herewith taken into account not only structured and functional bases, but also uncertainty parameter to models and expert estimations.

e-mail: [email protected] Key words: medical diagnostics, computer system, outline model,

uncertainty parameter, expert estimations.

i Надоели баннеры? Вы всегда можете отключить рекламу.