Научная статья на тему 'Автоматизированная система количественной оценки операционного риска'

Автоматизированная система количественной оценки операционного риска Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
348
73
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Драгун И. А., Устинов Г. Г., Зацепин П. М.

Разработана и реализована автоматизированная система количественной оценки операционного риска, которая является экспертной объектно-модульной системой поддержки принятия клинических решений посредствам анализа нейросетевыми и вероятностно-статистическими методами медико-биологических данных и извлечения знаний из эмпирической информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Драгун И. А., Устинов Г. Г., Зацепин П. М.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Автоматизированная система количественной оценки операционного риска»

УДК 004.891

АВТОМАТИЗИРОВАННАЯ СИСТЕМА КОЛИЧЕСТВЕННОЙ ОЦЕНКИ ОПЕРАЦИОННОГО РИСКА

И.А. Драгун, Г.Г. Устинов, П.М. Зацепин

Алтайский государственный университет, г. Барнаул E-mail: [email protected], [email protected]

Разработана и реализована автоматизированная система количественной оценки операционного риска, которая является экспертной объектно-модульной системой поддержки принятия клинических решений посредствам анализа нейросетевыми и вероятностно-статистическими методами медико-биологических данных и извлечения знаний из эмпирической информации.

Введение

В клинической практике, при проведении планового лечения пациентов, основываясь на собственном опыте, врач-клиницист ставит диагноз, качественно оценивает степень тяжести состояния больного, и риск проведения лечебных мероприятий. В ситуациях с тяжело устанавливаемым или неясным диагнозом часто очень важно количественно оценить тяжесть заболевания, в то время как универсальных методов количественной оценки тяжести не существует.

Одной из наиболее важных проблем в современной медицине является получение количественной оценки операционного риска. Оценка операционного риска подразумевает оценку степени тяжести предоперационного состояния пациента при угрозе летального исхода или возможных послеоперационных осложнений. Сложность оценки степени тяжести состояния обусловлена большим количеством симптомов, различных для каждого заболевания и большой лабильностью клинических проявлений заболевания. На практике степень тяжести состояния пациента определяется качественно. При этом используется небольшой набор 5-10 симптомов или факторов риска, значения которых наиболее явно отражают заболевание пациента, в то время как менее значимые симптомы не учитываются. Поэтому одним из путей повышения эффективности оценки операционного риска является применение математических методов обработки медико-биологических данных и разработка проблемно-ориентированных систем анализа информации. Это позволит более точно оценивать степень тяжести предоперационного состояния при определенном заболевании пациента и своевременно проводить лечебные мероприятия. В силу этого актуальной является задача разработки и реализации автоматизированной системы количественной оценки операционного риска.

Исходные данные

Исследования по количественной оценке операционного риска проводились на статистическом материале больных желчно-каменной болезнью (ЖКБ), прооперированных за последние 12 лет (1990-2002 гг.) в Больнице № 5 г. Барнаула. Выбор именно желчно-каменной болезни обусловлен её частотой и достаточно высокой послеоперацион-

ной летальностью при осложнениях. База исходных данных содержит клинико-лабораторные показатели 1172 пациентов, из них 268 больных ЖКБ, умерших после операции, и 904 пациента, прооперированных успешно. Каждая запись в базе данных содержит информацию, состоящую из трех логических блоков:

• информация о тяжести предоперационного состояния, характеризованная летальным исходом операции либо его отсутствием;

• качественная информация о наличии обнаруженных у пациента осложнений основного заболевания, сопутствующих заболеваниях, об отклонениях в функционировании той или иной системе жизнедеятельности организма (22 показателя);

• количественные данные лабораторных и инструментальных тестов предоперационного состояния больного ЖКБ (30 показателей).

Таким образом, тяжесть предоперационного состояния больных ЖКБ, характеризованная летальностью после операции, оценивалась по предоперационным клиническим данным. При такой постановке задачи оценка операционного риска может трактоваться как задача клинического прогнозирования послеоперационного состояния по предоперационным данным, как и задача диагностики предоперационного состояния пациента. То есть, для решения задачи количественной оценки степени операционного риска применимы математические методы диагностики и прогнозирования.

Математические методы диагностики и прогнозирования

Анализ существующих и традиционно применяемых в медицине для диагностики и прогнозирования методов показал, что вероятностно-статистические и нейросетевые модели позволяют наиболее адекватно представлять и анализировать систему сложных взаимосвязей симптомов заболеваний. Вероятностные методы более гибки и удобны для обработки клинико-лабораторных данных, нежели детерминированные многопараметрические статистические модели, обремененные условиями нормальности распределений значений, ортогональности рассматриваемого пространства и т. п. [1]. Помимо этого, математический аппарат искусственных нейронных сетей (ИНС) разрабатывался

для моделирования поведения биологических объектов [2], поэтому данные методы позволяют более точно оценивать предоперационные состояния пациентов в условиях большой лабильности клинических проявлений.

Вероятностно-статистические методы. Основными методами, решающими задачу диагностики в вероятностном пространстве симптомов являются методы распознавания образов, опирающиеся на стратегии Байеса, Неймана-Пирсона и Вальда. Введение вероятностной меры в пространстве клинико-лабораторных признаков осуществляется вычислением частот значений в интервалах, образованных квантованием диапазона значений признака. Наиболее мощным критерием различия распределений является непараметрическая информационная мера Кульбака, позволяющая найти границы интервалов таким образом, чтобы подчеркнуть наиболее значимую дифференциально-диагностическую информацию и минимизировать влияние случайных флуктуаций [1]. Для двух дискретных распределений A1 и A2 признака х мера Кульбака J(xi;AbA2) выражается формулой:

3(х,.;Л,:Л2) =

= Е№* /Л2) -Рх /Л)]1прХгду>

где P(xiJA1) и P(x¡s/A2) - вероятности наличия признака х, значения которого х принадлежат интервалу с номером ^. При справедливости нулевой гипотезы (т. е. выборки неразличимы), величина J асимптотически имеет распределение с 5—1 степенями свободы. Таким образом, с учетом принятого в медико-биологических исследованиях уровня значимости 0,05, признак считается информативным с соответствующими информативностью J и уровнем значимости Р}.

Рассчитанные при помощи такого квантования интервалы одномерного симптома называются интервальной структурой, а признак, сформированный парой интервальных структур - бинарной структурой. Одномерные и двумерные признаки, уровень значимости которых менее 0,05, ранжируются по убыванию их информативности (величине меры Кульбака), тем самым выделяется подмножество наиболее информативных, значимых признаков.

Исследования вероятностно-статистическими методами организованы следующими тремя стратегиями распознавания образов, каждая из которых дает вероятность летального исхода операции у конкретного пациента, и тем самым количественно оценивает риск операции [1]:

• стратегия Вальда, когда принятие решения основывается на вычислении отношения правдоподобия последовательно для признаков, упорядоченных по убыванию информативности; при этом отношения правдоподобия на каждом шаге сравниваются с двумя порогами, при превы-

шении одного из которых выносится решение о наиболее вероятной клинической ситуации;

• стратегия Байеса, когда решение принимается в соответствии с формулой Байеса. Вероятность клинической ситуации А] при значении х признака х определяется через вероятности этого значения для каждой из клинических ситуаций и априорные вероятности этих клинических ситуаций;

• последовательная стратегия Байеса, когда признаки упорядочиваются по убыванию информативности и на каждом шаге используется формула Байеса, в которой априорной вероятностью считается апостериорная вероятность, вычисленная на предыдущем шаге; решение принимается на последнем шаге в пользу той гипотезы, для которой апостериорная вероятность оказывается наибольшей.

Для оптимальной работы данных стратегий нами разработаны и реализованы алгоритмы поиска набора факторов риска. Это подмножество информационно-ценных признаков, обеспечивающее не менее низкие результаты распознавания, чем все информативные признаки и являющееся оптимальным в отношении количества и порядка признаков при использовании последовательных стратегий распознавания.

В табл. 1 представлены усредненные результаты перекрестного тестирования обучающих и тестовых данных для указанных стратегий распознавания опасного состояния (летальный исход). В соответствии с принятым среди клиницистов уровнем, верным считается прогноз, вероятность которого превышает 0,8.

Таблица 1. Результаты перекрестного тестирования при прогнозировании исхода операции вероятностно-статистическими методами

Состояния Стратегия распознавания Процент верных прогно- зов Процент ошибочных прогнозов Se, % Sp, %

А1 (успешная операция) Байеса 81,53 18,47 81,53 85,14

Байеса (многошаговая) 77,71 22,29 77,71 81,10

Вальда 88,32 11,68 88,32 88,32

Среднее для всех стратегий 82,52 17,48 82,52 84,85

A2 (летальный исход после операции) Байеса 76,86 23,14 76,86 80,99

Байеса (многошаговая) 80,99 19,01 80,99 82,64

Вальда 58,68 41,32 58,68 58,68

Среднее для всех стратегий 72,18 27,82 72,18 74,10

В последних двух столбцах табл. 1 приведены значения параметров, часто используемых в медицине для оценки качества метода диагностики -чувствительность (Бе) и специфичность (Бр), являющиеся аналогами ошибок первого и второго

рода теории принятия решений Неймана-Пирсона [1]. Как видно из табл. 1 вероятностно-статистические методы больше смещают оценку риска в сторону специфичных тестов, в то время как основным требованием к методу оценки риска следует считать его высокую чувствительность и специфичность. Однако следует отметить некоторые особенности анализа информации вероятностными методами: это отсутствие необходимости предварительной обработки данных, возможности выявления дифференциально-диагностических границ значений отдельных признаков и выделения факторов риска - оптимального для диагностики набора признаков.

Нейросетевые методы. В медицине для прогнозирования и диагностики наиболее часто применяют многослойные искусственные нейронные сети прямого распространения, также называемые многослойным персептроном. Благодаря способности многослойного персептрона к обобщению анализируемой информации, при обучении неявным образом выявляются взаимосвязи между входными и выходными данными. Результат работы каждого выходного нейрона обученной нейросети носит нечеткий характер и дает количественную оценку уверенности в соответствии входных данных выходным. Таким образом, при распознавании тяжелого, угрожающего состояния на выходе нейросети мы получаем количественную оценку уверенности наличия этого состояния, тем самым количественно оцениваем риск. Кроме того, для обученной нейросети, можно количественно оценить вклад каждого входного нейрона при классификации или распознавании [2]. То есть можно выделить набор наиболее информативных при оценке риска признаков - факторов риска.

Т. к. нейросети способны обрабатывать лишь количественную информацию, была проведена предварительная обработка исходных данных, состоящая из этапов:

• восстановление, пропущенной при сборе, недостающей информации;

• предобработка количественной информации, заключавшаяся в преобразованию к безразмерному виду, путем масштабирования к единой шкале (от 0 до 1);

• предобработка качественной информации путем кодирования числовыми значениями наличия (1) либо отсутствия (0) признака.

Для анализа применимости модели многослойного персептрона при количественной оценке операционного риска был проведен численный эксперимент по поиску наиболее безошибочных архитектур нейросетей, обучаемых по алгоритму обратного распространения ошибки. В эксперименте, при перекрестном обучении и тестировании, анализировались чувствительность и специфичность моделей прогнозирования летального исхода (1 выходной нейрон) и классификации предоперацион-

ного состояния больного (2 выходных нейрона). В табл. 2 и 3 представлены характеристики качества работы трех архитектур нейросетей, средние значения безошибочности которых, при перекрестном тестировании оказались наибольшими. Прогноз и диагноз, также как и для вероятностных методов, считались верными, если выход сети был более 0,8.

Также проведен эксперимент по обучению нейросетей на наиболее информативных признаках, выделенных вероятностно-статистическими методами и сравнение с факторами риска, выделенных нейронными сетями. В результате: перекрестное обучение и тестирование нейросетей на информативных признаках, найденных вероятностными методами, давало примерно те же показатели чувствительности и специфичности, что и на всех данных, с той лишь разницей, что скрытый слой сетей содержал меньшее количество нейронов. Сравнение наборов факторов риска, выделенных нейросетями и вероятностными методами, особых различий в наборах не выявило, в то время как оба метода позволяли примерно вдвое сократить количество признаков, необходимое для оценки риска с хорошей точностью.

Таблица 2. Результаты обучения нейросетей с одним выходным нейроном

Состояния Архитектура нейросети Про- цент вер- ных прог- нозов Про- цент оши- бочных прог- нозов 5е, % 5р, %

Сло- ев Нейронов в слое Харак- тери- стика сигмо- ида Ско- рость об- уче- ния

А1 (успешная операция) 2 5 2,5 0,6 19,29 80,71 19,3 20,3

2 5 3 0,5 17,77 82,23 17,8 18,3

2 10 2,5 0,3 6,59 93,41 6,6 7,11

А2(летальный исход после операции) 2 5 2,5 0,6 97,34 2,66 97,3 97,3

2 5 3 0,5 96 4 96 96

2 10 2,5 0,3 94,67 5,33 94,7 96

Таблица 3. Результаты обучения нейросетей с двумя выходными нейронами

Состояния Архитектура нейросети Про- цент вер- ных прог- нозов Про- цент оши- бочных прог- нозов 5е, % 5р, %

Сло- ев Нейронов в слое Харак- тери- стика сигмо- ида Ско- рость об- уче- ния

А1 (успешная операция) 3 25 1 0,3 94,42 5,58 94,4 95,9

2 5 2 0,1 94,42 5,58 94,4 95,9

2 25 1,5 0,1 93,91 6,09 93,9 96,5

А2(летальный исход после операции) 3 25 1 0,3 94,67 5,33 94,7 96

2 5 2 0,1 93,34 6,66 93,3 94,7

2 25 1,5 0,1 93,34 6,66 93,3 97,3

Анализируя показатели чувствительности и специфичности количественной оценки операционного риска у больных ЖКБ при помощи нейро-сетевых моделей, следует отметить что, анализ медико-биологических данных многослойными ИНС является высокочувствительным и высокоспецифичным тестом. То есть при оценке операционного риска с помощью нейросетей количество ошибочных ответов, как и количество нераспознанных состояний, будет допустимо малым. Учитывая имеющийся средний процент летальных исходов после операции у больных желчно-каменной болезнью в Больнице № 5 г. Барнаула, можно предположить что, применение нейросетевых технологий для оценки риска операций поможет снизить до допустимых норм уровень летальности.

Учитывая характеристики, достоинства и недостатки, вероятностно-статистических и нейросетевых методов, при разработке автоматизированной системы количественной оценки операционного риска, вероятностно-статистические модели можно порекомендовать для быстрой, предварительной обработки данных при оценке риска, в то время как нейросете-вые методы - для более точного анализа данных.

Экспертная система

Реализованная нами автоматизированная система количественной оценки операционного риска (АСКОР) является экспертной объектно-модульной системой поддержки принятия клинических решений посредством анализа нейросетевы-ми и вероятностно-статистическими методами клинико-лабораторных данных и извлечения знаний из эмпирической информации. Результатом обработки данных является основной объект системы - компьютерный образ состояния, содержащий информационные структуры, отражающие взаимосвязи между интересующей клинической ситуации и эмпирической информацией, рисунок.

Рисунок. Соотношения между объектами АСКОР

Система АСКОР включает:

• систему управления проектами;

• конструктор оболочки предметной области (генератор компьютерного образа состояния);

• информационную систему бланков, для удобного и быстрого ввода клинической, лабораторной и инструментальной информации;

• исследовательский модуль - математический инструментарий адекватного анализа эмпирических данных;

• механизм формирования базы знаний на основании результатов работы исследовательского модуля;

• экспертный модуль, обеспечивающий общение с базой знаний и принятие экспертных решений. Конструктор оболочки предметной области -

это модуль, создающий систему бланков для сбора медико-физиологических данных, здесь так же конкретизируются клинические ситуации, распознавание которых проводит экспертный модуль, и происходит обработка статистического материала (исследовательский модуль).

Исследовательский модуль содержит следующие функции:

• предварительная обработка данных: восстановление пропущенной при сборе информации, кодирование качественных и преобразование количественных данных;

• формирование интервальных и бинарных структур - анализ распределений значений признаков в вероятностном пространстве;

• поиск множества информативных признаков -факторов риска;

• обучение нейронных сетей и вероятностных стратегий распознавания;

• вычисление процента обучения системы.

При желании пользователя по результатам работы исследовательского модуля может быть сформирован подробный отчет, в котором поэтапно отражен процесс обработки данных и результаты тестирования.

Для восстановления пропущенной информации в АСКОР реализованы два метода: заполнение пропусков наиболее вероятными значениями по выборке и предложенная нами модификация разработки Лаборатории неравновесных систем Института вычислительного моделирования СО РАН (г. Красноярск). Данный метод представляет собой итерационный процесс построения последовательности одномерных квазилинейных моделей [3].

Процесс принятия решений в АСКОР реализован следующим образом. Посредством системы бланков, взаимодействующей с базой знаний, формируется компьютерный образ состояния пациента. Экспертный модуль обеспечивает количественную оценку соответствия компьютерного образа пациента распознаваемому состоянию нейросете-выми и вероятностно-статистическими методами. Результатом работы экспертного модуля является отчёт экспертизы, в котором фиксируются:

• значения всех медико-биологических показателей пациента;

• результаты количественной оценки риска (тяжести) состояния, на основе которых могут приниматься решения о назначении или изменении планового клинического лечения;

• таблица факторов риска конкретного пациента - признаки, значения которых отражают патологию тех или иных органов.

Все модули системы разработаны современными визуальными средствами программирования Windows-приложений. Отчеты, формируемые АСКОР, имеют форматы файлов Microsoft Excel (исследовательский модуль) и Microsoft Word (экспертный модуль) и могут быть распечатаны непосредственно самой системой, так и указанными программами.

Выводы и результаты исследований

Проведенные исследования по количественной оценке операционного риска у больных желчнокаменной болезнью позволяют судить о высокой эффективности применения нейросетевых и вероятностно-статистических методов в данной области. Разработанная и реализованная нами система АСКОР реализует новейшие методы анализа и об-

СПИСОК ЛИТЕРАТУРЫ

1. Генкин А.А. Новая информационная технология анализа медицинских данных. - СПб.: Политехника., 1999. - 191 с.

2. Нейроинформатика / А.Н. Горбань, В.Л. Дунин-Барковский, А.Н. Кирдин и др. - Новосибирск: Наука, 1998. - 296 с.

3. Драгун И.А., Поляков В.В., Устинов Г.Г., Зацепин П.М. Предобработка данных для нейросетевой оценки операционного риска // Нейроинформатика и ее приложения: Матер. XIII Всеросс. семинара. - Красноярск, 2005. - С. 60-61.

работки медико-биологических данных и может применяться для:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• количественной оценки риска операций;

• количественной оценки тяжести клинических ситуаций;

• диагностики и прогнозирования одного из двух альтернативных заболеваний;

• поддержки принятия клинических решений. Работа системы АСКОР протестирована на двух

проектах количественной оценки операционного риска больных механической желтухой и желчно-каменной болезнью и внедрена для практического применения в Больнице № 5 г. Барнаула. Получена официальная регистрация экспертного модуля АСКОР [4].

4. Свидетельство об официальной регистрации программы для ЭВМ № 2006611654. Прогнозирование летального исхода операции больных механической желтухой (Прогнозирование) / И.А. Драгун, Г.Г. Устинов, В.В. Поляков, П.М. Зацепин. Зарегистрировано в Реестре программ для ЭВМ 17.05.2006 г.

Поступила 21.06.2006г.

i Надоели баннеры? Вы всегда можете отключить рекламу.