Системы поддержки принятия решений wwwidmzru
' ' -
2018, № 2
A.А. ХАЛАФЯН,
д.т.н., профессор кафедры прикладной математики, Кубанский государственный университет, г. Краснодар, Россия, [email protected] Р.А. ВИНОГРАДОВ,
к.м.н., заведующий отделением сосудистой хирургии, ГБУЗ «НИИ - Краевая клиническая больница № 1 им. проф. С.В. Очаповского» министерства здравоохранения Краснодарского края, г. Краснодар, Россия, [email protected]
B.А. АКИНЬШИНА,
к.п.н., доцент, доцент кафедры прикладной математики, Кубанский государственный университет, г. Краснодар, Россия, [email protected] А.А. КОШКАРОВ,
начальник информационно-вычислительного отдела, ГБУЗ «Клинический онкологический диспансер № 1» министерства здравоохранения Краснодарского края, г. Краснодар, Россия, [email protected]
СИСТЕМА ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ ВЫБОРЕ ТАКТИКИ КОРРЕКЦИИ СТЕНОЗА ВНУТРЕННИХ СОННЫХ АРТЕРИЙ
УДК 519.711
Халафян А.А., Виноградов Р.А, Акиньшина В.А., Кошкаров А.А. Система поддержки принятия решений при выборе тактики коррекции стеноза внутренних сонных артерий (Кубанский государственный университет, г. Краснодар, Россия; ГБУЗ «НИИ - Краевая клиническая больница № 1 им. проф. С.В. Очаповского» министерства здравоохранения Краснодарского края, г. Краснодар, Россия; ГБУЗ «Клинический онкологический диспансер № 1» министерства здравоохранения Краснодарского края, г. Краснодар, Россия)
Аннотация. Наряду с разработкой медицинских информационных систем важной является задача создания медицинских систем поддержки принятия решений (СППР), в частности, способных прогнозировать возможность послеоперационных осложнений. Компьютерные методы анализа данных позволяют успешно использовать как классические методы прикладной статистики, так и современные эвристические процедуры для выявления латентных (скрытых) знаний в базах данных больных с последующим построением прогностических моделей. В статье описана СППР, которая по клиническим показателям состояния больного до лечения и технологическим параметрам оперативного вмешательства автоматизирует прогнозирование возможности осложнений при оперативном лечении стеноза внутренних сонных артерий методами каротидной эндартерэктомии и ангиостентирования. В основе СППР лежат методы классификации на обучающей выборке, включающей сведения о больных, прошедших лечение, а также данные о наличии или отсутствии осложнений. Исследования, предваряющие разработку СППР, были реализованы в среде пакета STATISTICA. Ввод в программу автоматизирован. По команде пользователя необходимые для вычислений данные больного из таблицы Excel импортируются в модуль программы для предсказания возможности осложнений. Также по желанию пользователя результаты прогноза могут быть сохранены в исходной таблице.
Ключевые слова: медицинская система поддержки принятия решений, деревья классификации, нейронные сети, каротидная эндартерэктомия, ангиостентирование.
UDC 519.711
Khalafyan A.A., Vinogradov R.A., Akin'shina V.A., Koshkarov A.A. Decision Support System for Choosing Correction Tactics of Internal Carotid Arteries Stenosis (Kuban State University, Krasnodar, Russia; Ochapowski Regional Hospital, Krasnodar, Russia; Krasnodar Regional Oncological Dispenser, Krasnodar, Russia)
© А.А. Халафян, Р.А. Виноградов, В.А. Акиньшина, А.А. Кошкаров, 2018 г.
Abstract. Along with the medical systems development there is an important task on creation of medical decision support systems (DSS), in particular, capable of predicting the probability of postoperative complications. Computer methods of data analysis make it possible to successfully use both classical methods of applied statistics and modern heuristic procedures for identifying latent (hidden) knowledge in patients' databases with subsequent construction of predictive models. The article describes the DSS, which automates the prediction of complications probability in the surgical treatment of internal carotid arteries stenoses by carotid endarterectomy and angiosten-tiation methods basing on the clinical parameters of the patient's condition before treatment and the technological parameters of the operative intervention. The DSS is based on such classification methods as classification trees and neural networks, the training sample for the classification is the database of patients, who have been treated, with the information of complications presence or absence availiable. Studies, preceding the DSS development were implemented in the STATISTICA package environment. The entrance into program is automated. At the user's require, the patient data, needed for the calculation is imported into the prediction program module of complications probability from the Excel table. Also, at the user's request, the prediction results can be saved in the source table.
Keywords: medical decision support system, classification trees, neural networks, carotid endarterectomy, angiostenting.
ВВЕДЕНИЕ
Развитие медицины сопровождается появлением новых инструментальных и лабораторных методов оценки состояния здоровья больных. Но какой бы многообразной ни была информация о состоянии больного в виде результатов клинико-лабораторных или рентгенологических исследований по ряду объективных и субъективных причин возможны послеоперационные осложнения. Поэтому в настоящее время наряду с разработкой медицинских информационных систем (МИС) важной является задача создания медицинских систем поддержки принятия решений (СППР) [4], [7], способных в частности прогнозировать возможность осложнений. СППР - это наукоемкие информационные системы, так как предполагают использование определенных научных направлений, в том числе и методов компьютерного анализа данных.
Компьютерные методы анализа данных позволяют успешно использовать как классические методы прикладной статистики, так и современные эвристические процедуры, например, нейронные сети для выявления латентных (скрытых) знаний в базах данных больных, содержащих информацию об их состоянии как до лечения, так и после лечения - терапевтического или оперативного. Латентные знания представляют собою сложные стохастические взаимосвязи между определенной совокупностью как количественных, так и качественных показателей, характеризующих состояние больных.
МАТЕРИАЛЫ И МЕТОДЫ
В настоящее время клинические руководства рекомендуют использовать комплексный индивидуальный подход для решения вопроса о методе коррекции стеноза внутренних сонных артерий (ВСА), однако алгоритм выбора остается неясным [1-3]. В статье описана СППР, которая по клиническим показателям состояния больного,
Системы поддержки принятия решений www.idmz.ru ._
2018, № 2 ^
позволяет прогнозировать возможность осложнений при оперативном лечении стеноза внутренних сонных артерий (ВСА) двумя методами - каротидной эндартерэктомии (КЭЭ) и ангиостентирования (КАС). В основе СППР лежат методы классификации на обучающей выборке - базе данных больных, прошедших лечение, о наличии или отсутствии осложнений, у которых известно. Выборка больных состоит из 1088 и 1269 больных, прошедших курс лечения методами КЭЭ и КАС с 2010 по 2016 гг. в отделении сосудистой хирургии ГБУЗ «Научно-исследовательский институт - Краевая клиническая больница № 1 проф. С.В. Оча-повског» г. Краснодара. При использовании метода КЭЭ осложнения были у 73 больных (6,71%); метода КАС - у 51(4,02%) больного.
Методы классификации представлены деревьями классификации и нейронными сетями. Исследования, предваряющие разработку СППР, были реализованы в среде пакета STATISTICA [8]. Ввод в программу автоматизирован. По команде пользователя необходимые для вычислений данные больного из таблицы Excel импортируются в модуль программы для предсказания возможности осложнений. Также по желанию пользователя результаты прогноза могут быть сохранены в исходной таблице.
Для каждой из групп больных при помощи коэффициента корреляции Спирмена из совокупности 37 показателей были выявлены показатели, характеризующие либо состояние больных до лечения, либо технологию оперативного лечения со статистически значимыми (p < 0,05) корреляционными связями с показателем Осложнения, который принимал значения «да», «нет».
Для метода КЭЭ - это качественные характеристики состояния больных (в скобках указаны их возможные значения): ХСМН - хроническая сосудисто-мозговая недостаточность (1, 2, 3, 4); ПИВСА - патологическая извитость внутренней сонной артерии (0, 1); стенокардия
ФК -функциональный класс стенокардии (0, 1, 2, 3); ХСН - хроническая сердечная недостаточность (1, 2а, 2б, 3); ФК по ^НА - функциональный класс по Нью-Йоркской Ассоциации Кардиологов (0, 1, 2, 3, 4); ХОБЛ - хроническая обструктивная болезнь легких (0, 1, 2, 3); ОНМК в анамнезе - количество острых нарушений мозгового кровообращения в анамнезе (0, 1, 2); технологические - вид КЭЭ (классическая, эверсионная), «заплата» (заплата при ушивании артериотомического отверстия со значениями Goretex, аутовена, нет), ВПШ (временный внутрипросветный шунт со значениями «да», «нет»).
Для метода КАС - это ХСМН, ХСН, ФК по ^НА, ХОБЛ, ОНМК в анамнезе, тип стента КАС (открытый, закрытый).
В программе STATISTICA реализованы методы построения бинарных деревьев классификации, основанные на ветвлении по одному показателю (предиктору). Бинарное, т.е. двоичное дерево предполагает ветвление только по двум возможным направлениям каждого предиктора. Возможность графического представления результатов и простота интерпретации во многом объясняют большую популярность деревьев классификации в прикладных областях, однако наиболее важные отличительные свойства деревьев классификации -их иерархичность и широкая применимость, а также абсолютная прозрачность процедуры классификации. Структура метода такова, что пользователь имеет возможность по управляемым параметрам строить деревья произвольной сложности, добиваясь минимальных ошибок классификации. Но по сложному дереву из-за большой совокупности решающих правил затруднительно классифицировать новый объект. Поэтому при построении дерева классификации следует найти разумный компромисс между сложностью дерева и трудоемкостью процедуры классификации. Преимуществом деревьев классификации перед другими методами классификации объектов по
Врач Ли
' и информационные
технологии
> обучающей выборке (обучение с учителем) -дискриминантным анализом, логит и пробит регрессии, является то, что он непараметрический, а значит предикторами модели вместе с количественными переменными могут быть качественные предикторы, принимающие текстовые значения [9].
Для технологии КЭЭ метод ветвления -полный перебор для одномерных ветвлений; при правиле остановки - прямая остановка; доли неверно классифицированных объектов - 0,02; критерия согласия Джини; при пользовательских ценах ошибок классификации, заданных таблицей 1, удалось построить приемлемое дерево классификации, в котором достигнут компромисс между сложностью дерева и количеством ошибочных классификаций (рис. 1).
Таблица 1
Матрица цен ошибок классификации
Предсказанные (строки)
Класс и наблюдаемые (столбцы)
Класс: нет Класс: да
нет 10,00
да 1,00
Вершины (узлы) дерева изображены в виде прямоугольников. Номер узла написан в левом верхнем углу прямоугольника, над которым отображено количество больных, причисленных к этому узлу. Внутри каждой вершины графы дерева изображены столбчатые диаграммы, представляющие классы (группы больных с наличием или отсутствием осложнений - «да», «нет»).
Рис. 1. Дерево классификации возможности осложнений для метода КЭЭ
Системы поддержки принятия решений
www.idmz.ru
F4H
2018, № 2
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ
Об адекватности построенной модели классификации можно судить по количеству правильно классифицированных больных обучающей выборки деревом. Так, из 1015 больных группы «нет» 888 (87,5%) были правильно отнесены к группе «нет», из 73 больных группы «да» были правильно отнесены к группе «да» 65 (89%). Построить дерево приемлемых размеров с более высокой прогностической точностью не удалось из-за значительного преобладания количества больных без осложнений (1015) над числом больных с осложнениями (73) - отличие почти 14-кратное.
По дереву классификации был составлен алгоритм, при помощи которого по выделенным характеристикам больного можно предсказать возможность осложнений:
Шаг 1. Если ХОБЛ = 0, переходим к шагу 2, в противном случае - к шагу 13.
Шаг 2. Если «заплата» = Goretex, переходим к шагу 3, в противном случае - к шагу 8.
Шаг 3. Если ОНМК в анамнезе = J, 0, то переходим к шагу 4, в противном случае больной принадлежит к группе «да».
Шаг 4. Если ФК по NYHA = 2, 0, то переходим к шагу 5, в противном случае больной принадлежит к группе «да».
Шаг 5. Если ХСМН = J, 4, 3, переходим к шагу 6, в противном случае больной принадлежит к группе «да».
Шаг 6. Если ПИВСА = 0, переходим к шагу 7, в противном случае больной принадлежит к группе «да».
Шаг 7. Если стенокардия ФК = 2, больной принадлежит к группе «да», в противном случае (стенокардия ФК = 0, J, 3) больной принадлежит к группе «нет».
Шаг 8. Если стенокардия ФК = 0, J, 2, переходим к шагу 9, в противном случае больной принадлежит к группе «да».
Шаг 9. Если ОНМК в анамнезе = J, 0, то переходим к шагу 10, в противном случае - к шагу 12.
Шаг 10. Если ВПШ = нет, больной принадлежит к группе «нет», в противном случае переходим к шагу 11.
Шаг 11. Если ОНМК в анамнезе = 0, больной принадлежит к группе «нет», в противном случае больной принадлежит к группе «да».
Шаг 12. Если ФК по ЫУНА = 2, больной принадлежит к группе «нет», в противном случае больной принадлежит к группе «да».
Шаг 13. Если ХОБЛ = 1, переходим к шагу 14, в противном случае - к шагу 16.
Шаг 14. Если ФК по ЫУНА = 3, больной принадлежит к группе «да», в противном случае переходим к шагу 15.
Шаг 15. Если ХСМН = 4, больной принадлежит к группе «да», в противном случае больной принадлежит к группе «нет».
Шаг 16. Если ХСН = 1, больной принадлежит к группе «нет», в противном случае переходим к шагу 17.
Шаг 17. Если вид КЭЭ = эверсионная, классическая, больной принадлежит к группе «да», в противном случае больной принадлежит к группе «нет».
Аналогично, для технологии КАС практически при тех же установках параметров модуля было построено приемлемое дерево классификации, изображенное на рис. 2.
Об адекватности построенной модели классификации также можно судить по количеству правильно классифицированных больных деревом. Так, из 1218 больных группы «нет» 1095 (89,9%) были правильно отнесены к группе «нет», из 51 больных группы «да» были правильно отнесены к группе «да» 43 (84,3%). Построить дерево приемлемых размеров с более высокой прогностической точностью также, как и для метода КЭЭ не удалось.
По дереву классификации был составлен алгоритм, при помощи которого по выделенным характеристикам больного можно предсказать возможность осложнений:
Шаг 1. Если ОНМК в анамнезе = 1 или 0, переходим к шагу 2, в противном случае
>
Рис. 2. Дерево классификации возможности осложнений для метода КАС
(ОНМК в анамнезе = 2) больной принадлежит ЫУНА
к группе «да».
Шаг 2. Если ОНМК в анамнезе = 0, переходим к шагу 3, в противном случае -к шагу 4.
Шаг 3. Если ХСН = 3, больной принадлежит к группе «да», в противном случае - «нет».
Шаг 4. Если тип стента ТБА = открытый, переходим к шагу 5, в противном случае -к шагу 7.
Шаг 5. Если ХОБЛ = 2, 1, 0 переходим к шагу 6, в противном случае (ХОБЛ =3) больной принадлежит к группе «да».
Шаг 6. Если ФК по ЫУНА = 0, то больной принадлежит к группе «да», в противном случае - «нет».
Шаг 7. Если ФК по ЫУНА = 0, 1, 2, то пе-
3, 4) больной принадлежит к группе «да».
Шаг 8. Если ХСМН = 3, то больной принадлежит к группе «да», в противном случае -к группе «нет».
Для увеличения достоверности прогнозирования возможности осложнений наряду с деревьями классификации использовали нейронные сети (многослойный персептрон - MLP), которые являются обучающимися системами, имитирующими деятельность нейронных сетей человеческого мозга [5, 6].
К сожалению, если распределения объектов в классах «кособокое», то сети дают очень высокий процент ошибочных классификаций в классе с малым количеством объектов. В нашей выборке распределение
реходим к шагу 8, в противном случае (ФК по более чем «кособокое» - из 1088 больных,
■ ■■
F4H
лечившихся методом КЭЭ, осложнения были только у 73 больных; из 1289 больных, лечившихся методом КАС, осложнения были только у 51 больного. Поэтому для увеличения прогностической точности сетей мы вынуждены были искусственно преодолеть «кособокость», случайным образом уменьшив общие объемы выборок примерно до 10% от общего, но сохранив всех больных с осложнениями.
Нейронная сеть строится путем многократных экспериментов, и контрольная выборка играет ключевую роль при выборе наилучшей сети, становясь частью процесса обучения, для улучшения прогностических возможностей сети резервируется еще одна выборка - тестовая. Поэтому для увеличения надежности прогностических результатов нейронную сеть строили по тем же характеристикам больных, что и деревья классификации, но предварительно разбив выборки на 3 части - обучающую (train), тестовую (test) и контрольную
2018, № 2
(validation). Для метода КЭЭ объемы выборок составили соответственно 109, 12 и 6 человек.
В таблице 2 отображено количество ошибочных классификаций для метода каротид-ной эндартерэктомии в трех частях выборки - обучающей, тестовой и контрольной. Архитектура MLP указана в столбце 1. Первое число указывает на количество переменных в модели сети, в нашем случае вычисляется как суммарное количество значений, принимаемых всеми качественными характеристиками состояния больных. Второе и третье - число скрытых и выходных нейронов в модели. В строке Total указано количество больных в группах «да», «нет» и общее количество. В строке Correct - число правильно классифицированных сетью больных, соответственно в строке Incorrect - число неверно классифицированных больных. Из таблицы видно, что верно классифицированные больные в обучающей, тестовой и контрольной
Таблица 2
Количество ошибок классификации для метода КЭЭ
Осложнения (Classification summary) Samples: Train
да нет все
MLP 33-6-2 Total 60.000 49.000 109.000
Correct 56.000 43.000 99.000
Incorrect 4.000 6.000 10.000
Correct (%) 93.333 87.755 90.825
Incorrect (%) 6.666 12.244 9.174
Осложнения (Classification summary) Samples: Test 1
да 1 нет I все 1
MLP 33-6-2 Total 9.000 3.000 12.000
Correct 8.000 1.000 9.000
Incorrect 1.000 2.000 3.000
Correct (%) 88.888 33.333 75.000
Incorrect (%) 11.111 66.666 25.000
Осложнения (Classification summary) Samples: Validation |
да нет все 1
MLP 33-6-2 Total 9.000 3.000 12.000
Correct 8.000 1.000 9.000
Incorrect 1.000 2.000 3.000
Correct (%) 88.888 33.333 75.000
Incorrect (%) 11.111 66.666 25.000
V-
выборке составили соответственно 90,825%, 75%, 100%.
В таблице 3 отображено количество ошибочных классификаций для метода ангио-стентирования в трех частях выборки - обучающей, тестовой и контрольной, состоящих соответственно из 90, 10 и 5 человек. Из таблицы видно, что верно классифицированные больные в обучающей, тестовой и контрольной выборке составили соответственно
97,619%, 100%, 50%.
Таким образом, для каждого из методов оперативной коррекции стеноза ВСА удалось построить вполне приемлемые по точности прогноза нейронные сети, которые могут быть применены для предсказания возможности послеоперационных осложнений больных. К сожалению, нейронные сети не позволяют
иллюстрировать их работу в виде алгоритма или в какой либо другой форме.
На языке Microsoft Visual C#(Sharp) было написано программное приложение, реализующее вычисления по нейронной сети и деревьям классификации. Окно программы изображено на рис. 3.
Работа приложения начинается с ввода номера больного в таблице Excel. После нажатия кнопки Импортировать данные, из соответствующих ячеек таблицы будут импортированы необходимые для расчетов клинико-лабораторные показатели больного. На следующем этапе следует указать метод коррекции стеноза. Если выбран метод КЭЭ, в окне появятся поля для выбора вида КЭЭ (классическая, эверсионная), Заплаты (Goretex, аутовена, нет), ВПШ (да, нет). Если
Таблица 3
Количество ошибок классификации для метода КАС
Осложнения (Classification summary) Samples: , rain
да нет все
MLP 22-9-2 Total 42.000 48.000 90.000
Correct 41.000 40.000 81.000
Incorrect 1.000 8.000 9.000
Correct (%) 97.619 83.333 90.000
Incorrect (%) 2.381 16.666 10.000
Осложнения (Classification summary) Samples: Test
да нет все
MLP 22-9-2 Total 7.000 3.000 10.000
Correct 7.000 3.000 10.000
Incorrect 0.000 0.000 0.000
Correct (%) 100.000 100.000 100.000
Incorrect (%) 100.000 100.000 100.000
Осложнения (Classification summary) Samples: Validation
да нет все
MLP 22-9-2 Total 2.000 3.000 5.000
Correct 1.000 2.000 3.000
Incorrect 1.000 1.000 2.000
Correct (%) 50.000 66.666 60.000
Incorrect (%) 50.000 33.333 40.000
■ ■■
РЧН
2018, № 2
Рис. 3. Интерфейсное окно приложения
выбран метод КАС, то появится поле с предложением выбрать тип стента (открытый, закрытый). Далее следует щелкнуть по кнопке Прогнозирование осложнений, программа произведет необходимые вычисления нейронными сетями и деревьями классификации. Результаты будут выведены в виде сообщений - прогноз неблагоприятный или прогноз благоприятный. По желанию пользователя результаты прогнозирования могут быть экспортированы в базу и сохранены в предусмотренных для этого полях.
ВЫВОДЫ
Таким образом, показана возможность использования современных технологий компьютерного анализа данных при разработке медицинской системы поддержки принятия
решений, которая по клиническим показателям состояния больного и технологическим параметрам оперативного вмешательства автоматизирует прогнозирование осложнений при оперативном лечении стеноза внутренних сонных артерий методом каротидной эндартерэктомии и ангиостентированием. СППР представляет собою интегрированную систему, состоящую из статистического метода - деревьев классификации и эвристической процедуры - нейронные сети. Построение деревьев классификации и нейронной сети выполняли в среде пакета STATISTICA, но СППР представляет собою автономный программный продукт, не «привязанный» к STATISTICA - для работы пользователю не нужны знания современных технологий анализа данных.
и информационные
технологии
ЛИТЕРАТУРА
1. Виноградов Р.А. Каротидная эндартерэктомия и стентирование: влияние коморбидности на выбор тактики лечения / Р.А. Виноградов, И.Н. Здановская, А.А. Халафян, В.А. Акинь-шина // Врач-аспирант. - 2017. - Т. 83. - № 4. - С. 4-11.
2. Виноградов Р.А. Сравнение рисков развития послеооперационных осложнений при ка-ротидной эндартерэктомии и каротидной ангиопластике / Р.А. Виноградов, К.А. Лашкевич, В.С. Пыхтеев // Ангиология и сосудистая хирургия. - 2017. - Т. 23. - № 3. - С. 133-139.
3. Виноградов Р.А., Акиньшина В.А. Возможности выбора варианта оперативного вмешательства в зависимости от статистически значимых факторов. Ангиология и сосудистая хирургия: материалы XXXIII Международой конференции Российского общества ангиологов и сосудистых хирургов, г. Сочи, 22-24 июня 2017 г. [Электронный ресурс]. - Режим доступа: http://www.angiolsurgery.org/events/2017/06/22/theses.pdf (9.01.18). - Т. 23-2. г. Сочи, Россия, Ангиология инфо. - 2017. - С. 76-77.
4. Гусев А.В. Поддержка принятия врачебных решений в медицинских информационных системах медицинской организации / А.В. Гусев, Т.В. Зарубина // Врач и информационные технологии. - 2017. - № 2. - С. 60-72.
5. Гусев А.В. Перспективы нейронных сетей и глубокого машинного обучения в создании решений для здравоохранения / А.В. Гусев // Врач и информационные технологии. -2017. - № 3. - С. 92-105.
6. Нейронные сети STATISTICA Neural Networks. Методология и технологии современного анализа данных: учебное пособие. 2-e изд., перераб. и доп. Под редакцией Боровикова В.П. М.: Горячая линия - Телеком. - 2008. - 392 с.
7. Халафян А.А. Анализ и синтез медицинских систем поддержки принятия решений на основе технологий статистического моделирования. Краснодар 2010, автореферат диссертации на соискание ученой степени доктора технических наук.
8. Халафян А.А. STATISTICA 6. Математическая статистика с элементами теории вероятностей. М.: Бином. - 2010. - 491 с.
9. Халафян А.А. Современные статистические методы медицинских исследований. М.: URSS, ЛКИ. - 2013. - 320 с.