Научная статья на тему 'МЕТОДЫ КЛАССИФИКАЦИИ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЙ В МЕДИЦИНЕ'

МЕТОДЫ КЛАССИФИКАЦИИ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЙ В МЕДИЦИНЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
38
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АНАЛИЗ МЕДИЦИНСКИХ ДАННЫХ / ДЕРЕВЬЯ РЕШЕНИЙ / МАШИНА ОПОРНЫХ ВЕКТОРОВ / МЕТРИКИ ОЦЕНКИ КЛАССИФИКАЦИИ / MEDICAL DATA ANALYSIS / DECISION TREES / SUPPORT VECTOR MACHINE / CLASSIFICATION EVALUATION METRICS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Микшина В.С., Павлов С.И.

Приведены результаты сравнения методов классификации в медицинских задачах диагностики на примере исходов операции аортокоронарного шунтирования при остром инфаркте миокарда. Рассмотрены вероятности вариантов исхода операции при применении различных техник защиты миокарда: кровяной кардиоплегии или кардиоплегии с использованием Кустодиола (Custodiol). Сравниваются результаты моделирования, полученные с помощью таких методов классификации, как логистическая регрессия, деревья решений (decision tree), машина опорных векторов (support vector machine). В качестве сравниваемых критериев использованы: таблица сопряженности, площадь под ROC - кривой (Area Under Curve), точность, полнота, F-мера, коэффициент корреляции Метьюса (the Matthews correlation coefficient). В результате выявлено, что некоторые модели являются более предпочтительными для использования в качестве математического ядра при создании информационных систем поддержки принятия решения по выбору способа кардиоплегии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Микшина В.С., Павлов С.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLASSIFICATION METHODS IN PROBLEMS OF DECISION-MAKING IN MEDICINE

The results of comparison of classification methods in medical diagnostics problems are presented on the example of outcomes of coronary artery bypass graft surgery in acute myocardial infarction. We consider the probability of an outcome for an operation with the use of various techniques of myocardium protection: blood cardioplegia or cardioplegia using the Custodiol. The article compares simulation results obtained using such classification methods as logistic regression, decision trees and support vector machine. As compared criteria were used: contingency table, Area Under Curve, accuracy, completeness, F-measure, the Matthews correlation coefficient. As a result, it was revealed that some models are more preferable for use as a mathematical core when creating decision support information systems for choosing the method of cardioplegia.

Текст научной работы на тему «МЕТОДЫ КЛАССИФИКАЦИИ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЙ В МЕДИЦИНЕ»

УДК 616.127-089:519.81

МЕТОДЫ КЛАССИФИКАЦИИ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЙ

В МЕДИЦИНЕ

В. С. Микшина, С. И. Павлов

Сургутский государственный университет, sergey8991@mail.ru; mikshinavs@gmail.com

Приведены результаты сравнения методов классификации в медицинских задачах диагностики на примере исходов операции аортокоронарного шунтирования при остром инфаркте миокарда. Рассмотрены вероятности вариантов исхода операции при применении различных техник защиты миокарда: кровяной кардиоплегии или кардиоплегии с использованием Кустодиола (Custodiol). Сравниваются результаты моделирования, полученные с помощью таких методов классификации, как логистическая регрессия, деревья решений (decision tree), машина опорных векторов (support vector machine). В качестве сравниваемых критериев использованы: таблица сопряженности, площадь под ROC - кривой (Area Under Curve), точность, полнота, F-мера, коэффициент корреляции Метьюса (the Matthews correlation coefficient). В результате выявлено, что некоторые модели являются более предпочтительными для использования в качестве математического ядра при создании информационных систем поддержки принятия решения по выбору способа кардиоплегии.

Ключевые слова: анализ медицинских данных, деревья решений, машина опорных векторов, метрики оценки классификации.

CLASSIFICATION METHODS IN PROBLEMS OF DECISION-MAKING

IN MEDICINE

V. S. Mikshina, S. I. Pavlov

Surgut State University, sergey8991@mail.ru; mikshinavs@gmail.com

The results of comparison of classification methods in medical diagnostics problems are presented on the example of outcomes of coronary artery bypass graft surgery in acute myocardial infarction. We consider the probability of an outcome for an operation with the use of various techniques of myocardium protection: blood cardioplegia or cardioplegia using the Custodiol. The article compares simulation results obtained using such classification methods as logistic regression, decision trees and support vector machine. As compared criteria were used: contingency table, Area Under Curve, accuracy, completeness, F-measure, the Matthews correlation coefficient. As a result, it was revealed that some models are more preferable for use as a mathematical core when creating decision support information systems for choosing the method of cardioplegia.

Keywords: medical data analysis, decision trees, support vector machine, classification evaluation metrics.

Введение. Заболевания сердечно-сосудистой системы являются наиболее частой причиной смерти современного человека. Ишемическая болезнь сердца (ИБС) -патологическое состояние, характеризующееся недостаточным обеспечением кислородом сердечной мышцы. ИБС составляет львиную долю всех заболеваний сердечно сосудистой системы человека по данным Всемирной организации здоровья. На ИБС приходится почти половина случаев болезней. Острый инфаркт миокарда одна из форм течения ИБС, проявление которой выражаются некротическими поражениями миокарда в результате

недостаточного его кровоснабжения. Стоит отметить, что при инфаркте миокарда одним из условий благополучного течения заболевания является минимальное время оказания профессиональной медицинской помощи. Одним из наиболее эффективных способов лечения ИБС при остром инфаркте миокарда является операция аортокоронарного шунтирования (АКШ). Стандартный способ проведения данной операции предполагает осуществление манипуляций с коронарными сосудами на «открытом сердце». Для защиты сердечной мышцы от ишемии в ходе операции применяется комплекс процедур, называемый кардиоплегия. В настоящее время наиболее распространены два способа кардиоплегии: кровяная и с использование раствора Кустодиол. Данная работа посвящена поиску более предпочтительного способа с помощью инструментов математической статистики и анализа данных для конкретного пациента, обладающего уникальным набором параметров состояния [1-4].

Начиная с восьмидесятых годов XX века развиваются технологии анализа данных за счет активного применения вычислительной техники. Также стоит отметить фундаментальные работы в области машинного обучения, связанные с понятием эмпирического риска. Результатами синергетического взаимодействия методов анализа данных, машинного обучения в различных медицинских задачах становятся системы поддержки принятия решений, системы автоматизированного контроля состояния пациентов в реанимации, системы обработки статистических данных. В течение последних двух лет наблюдается значительный рост количества работ, связанных с анализом данных и машинным обучением, по большей части это связанно с взрывным ростом количества информационных услуг в Интернет. В связи с этим происходит новый виток развития в данных областях, что и мотивирует исследователей активно применять технологии анализа данных. Работа посвящена поиску лучшего метода для моделирования результата операции АКШ при остром инфаркте миокарда. В качестве сравниваемых методов математического моделирования используются: логистическая регрессия, деревья решений и машина опорных векторов [3-6].

Исходными данными для моделирования являются истории болезней 318 пациентов, проживающих на территории Западной Сибири. Для описания пациентов используется признаковое описание объектов, на основании которого требуется определить результат исхода операции. Задача прогноза результата операции может быть сформулирована как задача обучения по прецедентам. Задача формулируется следующим образом: задано множество объектов X и множество ответов У, существует функция у*: Х^У, значения которойу1 = у*(хг) известны только на конечном множестве объектов {х1, ..., х^} с X. Пары объектов «объект - ответ» (хг-, уг) называются прецедентами. Совокупность пар X = (хг-, уг)/ называется обучающей выборкой. Задача обучения по прецедентам заключается в восстановлении зависимости у* по обучающей выборке X1, т. е. необходимо найти решающую функцию а: X^■У, которая определяет ответ (у), наиболее приближенный к ответу, полученному с помощью функции у*(хг). Данное требование распространяется также не только на объекты обучающей выборки, но и на все множество X [5].

Признаком / объекта х будем называть результат измерения некоторой характеристики объекта. Можно определить отображение / Б/, где Б/ - множество допустимых значений признака. Таким образом, даже отнесение объекта к некоторому классу также является признаком. Множество Б/ может определять совершенно разные признаки:

Б/ = {0,1}, то/биноминальный признак;

Б/- конечное множество, то/- номинальный признак;

Б/- конечное упорядоченное множество, то/ - порядковый признак;

Б/- М, то/количественный признак.

Пусть имеется набор признаков /¡, ...,/«. Вектор /1(х), ..., /п(х)) называют признаковым описанием объекта хеХ. Можно записать признаковые описания всех объектов в одну матрицу, где в каждом столбце будет находиться описание конкретного признака -такая матрица размера I х п - матрица «объект - признак».

(Л М - Л

' =11Л (х)| ,.„

Л (х) - Л (х \

(1)

Так как мы не можем представить объект ни в одном виде, кроме признакового описания, не будем различать объекты из множества X и их признаковые описания, определивXкакX = Б/ х ... х Б/п.

Таблица 1

Показатели состояния пациента перед операцией АКШ

№ Фактор (переменная) Обознач ение Шкала измерен ия Ед. изм. № Фактор (переменная) Обознач ение Шкала измерен ия Ед. изм.

1 Возраст Х\ абс. год 16 Конечный диастолический объем Х16 абс. мм

2 Вес Х2 абс. кг 17 Конечный систолический объем Х17 абс. мм

3 Пол Хз номинал 18 Конечный диастолический размер Х18 абс. мм

4 Сахарный диабет Х4 номинал 19 Конечный систолический размер Х19 абс. мм

5 Гипертоническая болезнь Х5 номинал 20 Удельный объем Х20 абс. мл

6 Поражение брахио-цефального ствола Хб номинал 21 СДЛА Х21 абс. мм рт.ст.

7 Нарушения ритма сердца Х7 номинал 22 Аортальный клапан градиент давления Х22 абс. мм рт.ст.

8 Гипокинезы Х8 номинал 23 Аортальный клапан скорость кровотока Х23 абс. м/с

9 Проходимость левой коронарной артерии (ЛКА) Х9 абс. % 24 Аортальный клапан степень регургитации Х24 порядк овая

10 Проходимость ветви тупого края (ТВК) Х10 абс. % 25 Митральный клапан градиент давления Х25 абс. мм рт.ст.

11 Проходимость передней межжелудочковой ветви (ПМЖВ) Хп абс. % 26 Митральный клапан скорость кровотока Х26 абс. м/с

12 Проходимость огибающей ветви (ОВ) Х12 абс. % 27 Митральный клапан степень регургитации Х27 порядк овая

13 Проходимость правой коронарной артерии (ПКА) Х13 абс. % 28 Срок болевого синдрома Х28 кол-во дни

Проходимость

14 задней межжелудочковой ветви (ЗМЖВ) Х14 абс. % 29 Тропонины I Х29 абс. нг/мл

15 Фракция выброса Xl5 абс. 30 Тропонины T ^30 абс. нг/мл

Логистическая регрессия. Логистическая регрессия - это математическая модель, основанная на определении знака уравнения регрессии. При применении регрессии сигма преобразования классификация происходит сравнением с некоторым порогом классификации (обычно принимаемым равным 1/2). Для нахождения коэффициентов регрессии решается задача минимизация эмпирического риска (средняя величина ошибки

алгоритма на обучающей выборке).

i

Q(w) = £ ln(1 + exp(-y ■{xt ■ w)))-> min., (2)

i=1

где w - коэффициенты регрессионного уравнения.

При выполнении условия нормального распределения признакового пространства с помощью сигма преобразования можно получить вероятность принадлежности некоторого объекта к классу.

P{y | x}=a(y(x,W),У e Y

a = Al + * >)

(3)

где z - значения уравнения регрессии.

В ходе работы было получено два уравнения логистической регрессии. Одно уравнение для кровяной кардиоплегии, второе - для кардиоплегии с использованием раствора Кустодиол [6].

ры (x) = [1 + exp(—21.009 • X5 - 0,021 • Х9 +1,024 • X1S — 2,049 • X23 + 25,256)]—1

(4)

р (x) = [1 + exp(—18,841 • X5 + 0,847 • X18 — 0,923 • X2 —1,809 • Xn — 1,124X10 +15,158)]—1, (5)

где Pku(x) - вероятность неблагоприятного исхода операции при использовании Кустодиола; Pkr(x) - вероятность неблагоприятного исхода операции при использовании кровяной кардиоплегии.

В моделях (3)-(4) переменные отбирались методом прямого отбора (forward selection). В табл. 2 приводится пример представления результатов моделирования с использованием логистической регрессии. Представленные показатели описывают классификационную способность моделей [7-8].

Пусть D - бинарный вектор, соответствующий истинной классификации, а вектор M -предсказание некоторого алгоритма, обозначим за M отрицание бинарного вектора. Составим таблицу из скалярных произведений бинарных векторов и их отрицаний, полученная таблица называется таблицей сопряженности (табл. 2).

Таблица 2

Общий вид таблицы сопряженности

M M"

D TP FP

D" FN TN

В табл. 2 ТР - реальные положительные исходы, БР - случаи, ошибочно классифицированные как положительные исходы, БК - случаи, ошибочно классифицированные как отрицательные исходы, ТК - реальные негативные исходы.

Для оценки качества моделирования исходов операции с помощью логистической регресии при применении различных методов кардиоплегии рассчитываются несколько показателей:

1. Точность (Precision) оценивается как отношение правильно классифицированных случаев к общему количеству случаев благоприятных или неблагоприятных исходов операции с использованием Кустодиола:

TP

PrecisionpOSltlve = (6) p TP + FP

2. Полнота (Recall) оценивается как доля правильно классифицированных случаев некоторого класса (благоприятный или неблагоприятный исход) относительно всех случаев этого класса:

Recall

TP

positive

TP + FN

(7)

3. Б-мера (Б-теаБиге) - это усредненное значение точности и полноты. Она представляет собой гармоническое среднее между точностью и полнотой. Б-мера стремится к нулю, если точность или полнота стремится к нулю:

F,

measure — ■

2 • Precision • Recall Precision + Recall

(8)

4. МСС - коэффициент корреляции Мэтьюса, в машинном обучении или коэффициент среднеквадратичной (взаимной) сопряженности в статистике ф [7]:

MCC =

TP • TN - FP • FN

•7(TP + FP) • (TP + FN) • (TF + FP) • (TN + FN)

(9)

В табл. 3 представлены результаты моделирования исходов операции при использовании различных методов кардиоплегии [10].

Таблица 3

Результаты классификации с использованием логистической регрессии

Типы кардиоплегии Предсказано Показатели моделей

выжило умерло точность полнота F-мера MCC AUC

Кустодиол Реальные данные выжило 169 10 0,988 0,944 0,966 0,807 0,908

умерло 4 30 0,750 0,938 0,833

Кровяная кардиоплегия выжило 88 7 0,978 0,926 0,951 0,609 0,896

умерло 2 8 0,533 0,800 0,640

Площадь под ROC-кривой (Area Under Curve - AUC) - это количественная оценка классификатора, которая представляет собой площадь, ограниченную ROC-кривой и осью доли ложноположительных результатов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Например, для класса «выжило», будет TP = 169, FP = 4, FN = 10, TN = 30 (табл. 3);

Precision

1 69

= 0.977

Fm

positive i 69 + 4

2 • 0,977 • 0,944

Recall

positive

measure

positive

0,977 + 0,944

= 0,960 MCC =

TP

-= 0.944

TP + FN

1 69 • 30 -1 0 • 4

■7(169 +10)- (169 + 4)- (30 +10)-(30 + 4)

При заполнении табл. 3 и последующих таблиц с результатами классификации в столбцах «точность» и «полнота» указаны значения, соответствующие каждому классу («выжило» или «умерло»). Обе модели показывают более высокую точность для результата «выжило» - 0,997 и 0,978 соответственно, и свидетельствуют о приемлемом качестве классификации модели. Также высокие значения получены для обеих моделей по Б-мере, что свидетельствует о высоких значениях точности и полноты.

Приведенные значения показателей качества классификации свидетельствуют о высокой классификационной способности моделей.

Деревья решений. Одним из методов построения классификационных моделей является деревья решений. Деревья решений применяются повсеместно в задачах кредитного скоринга, а также в задачах принятия решения в медицинских процессах. Данные модели отличаются высокой интерпретируемостью, что упрощает их восприятие и использование специалистами, не обладающими специальной подготовкой в области математического моделирования. Распространено несколько различных методик построения деревьев решений или деревьев классификации. Существует методика построения деревьев классификации, допускающая возможность работы с пропусками в данных. Данная методика подразумевает ограничения переобучения модели посредством усечения ветвей после построения дерева решений. Дерево решений представляет собой ориентированный граф. На ребрах («ветках») дерева решения записаны атрибуты, от которых зависит целевая функция, в «листьях» записаны значения результата классификации, а в остальных узлах - признаки, по которым различаются случаи [9].

Чтобы классифицировать новый случай, надо спуститься по дереву от корня до листа и получить соответствующее значение. В узлах дерева находятся переменные, по которым происходит разбиение на подмножества пациентов, имеющих разные значения переменной, по которой производится разбиение. В настоящей модели значение зависимой переменной (исход операции) соответствуют: у = 1 - в случае летального исхода; у = 0 - в случае выживания пациента после операции. Основным критерием, подвергающимся оптимизации, является ОатеЯайо:

1(Т) - энтропия множества Т, которое разбивается на подмножества Tl, ... Тт, Тк -множество объектов, имеющих одинаковое значение переменной XI [12]. На каждом шаге выбор вершины осуществляется таким образом, чтобы значение критерия ОатеЯайо было максимальным. На рис. 1 представлена модель результата операции АШК при кардиоплегии.

ОатеЯаНо

I (Т) -

(10)

Рис. 1. Модель результата операции АШК при кардиоплегии с использованием раствора Кустодиол

Рис. 2 демонстрирует результаты моделирования исхода операции АШК при использовании кровяной кардиоплегии.

Рис. 2. Модель результата операции АШК при использовании кровяной кардиоплегии

Полученные деревья отличаются друг от друга как глубиной (количество решающих правил), так и количеством листьев. Тем не менее, существует и некоторое сходство,

заключающееся в наличии одинаковых условияй отнесения пациента к листьям, на которых наблюдается неблагоприятный исход.

Как видно из рис. 1 и рис. 2, наиболее информативным относительно результата операции является переменная Х3 (наличие гипертонической болезни): 38 случаев положительных исходов при использовании Кустодиола и 26 случаев при использовании кровяной кардиоплегии.

Следующим фактором по информативности в обеих моделях является Х18 > 5,8 -увеличенный конечный диастолический размер (КДР). Он выявляет в каждой модели большее число негативных исходов. Действительно, КДР в норме может находиться в пределах от 4,6 до 5,7 см, выход за эти пределы в сторону увеличения говорит об увеличение размера левого желудочка. Наличие данного факта является свидетельством ухудшения работы сердечной мышцы, а также фактором риска развития кардиологических заболеваний [6, 9, 11-12].

Результаты проверки классификационной способности деревьев решений приведены в табл. 3.

Таблица 3

Результаты классификации с использованием деревьев решений

Кардио-плегия Предсказано Показатели моделей

выжило умерло точность полнота F-мера MCC AUC

Кустодиол Реальные данные выжило 169 10 1,000 0,961 0,980 0,89 5 0,97 8

умерло 4 30 0,833 1,000 0,909

Кровяная выжило 96 2 0,980 0,980 0,980 0,83 9 0,98 9

умерло 2 34 0,944 0,944 0,944

Данная модель показывает более высокое качество классификации по сравнению с логистической регрессией. Кроме того, модель классификации с помощью деревьев решений позволяет использовать данные о пациентах с пропущенными значениями некоторых признаков. Таким образом, при построении модели появилась возможность добавить данные о пациентах, у которых при операции АКШ с использованием кровяной кардиоплегии были не заполнены некоторые значения в матрице «объект - признак».

Машина опорных векторов. Предыдущие методы поиска классификационной модели базировались на итеративной минимизации квадрата расстояния до разделяющей гиперплоскости, в случае логистической регрессии и максимизации критерия, связанного с информативностью классификационной модели в случае дерева решений, полученных посредством применения алгоритма C4.5 [13].

Следующий подход основан на переводе исходных векторов в пространство более высокой размерности и поиском разделяющей гиперплоскости. Две параллельных гиперплоскости строятся по обеим сторонам от гиперплоскости, разделяющей классы. Разделяющей гиперплоскостью будем называть такую гиперплоскость, расстояние до которой от параллельных гиперплоскостей будет максимальным. При описании метода, называемого машиной опорных векторов (support vector machine - SVM), следует отметить случай линейной неразделимости классов, и в данном случае алгоритму позволено допускать ошибки. Дополнительно вводятся переменные ^ > 0, характеризующие величину ошибки

классификации на обучающей выборке. На практике решается следующая задача оптимизации:

1 1

w,w+с ^ —>

((w,xt) - w0)> 1 , i = 1.....£; (11)

> 0, i = 1,...,I

где C - параметр алгоритма, выбираемый исследователем;

вектор w = (w,w2,---w„) el" и порог разделения классов w0 являются параметрами алгоритма.

Уравнение {w,x) = w0 описывает гиперплоскость, разделяющую классы в

пространстве l". Постановка задачи в таком виде называется машиной опорных векторов с мягким зазором (soft margin SVM). В табл. 4 приведены результаты классификации с использованием машины опорных векторов [13].

Таблица 4

Результаты классификации с использованием машины опорных векторов

Кардио-плегия Предсказано Показатели моделей

выжило умерло точность полнота F-мера MCC AUC

Кустодиол Реальные данные выжило 169 10 0,983 0,944 0,963 0,795 0,856

умерло 3 31 0,756 0,912 0,827

Кровяная выжило 88 7 0,926 0,926 0,926 0,738 0,784

умерло 0 10 1,000 0,588 0,741

Модель результата операции, полученная с помощью машины опорных векторов, демонстрирует высокое качество классификации для ложноотрицательных случаев. Данный факт исключает ситуации, при которых результат операции может быть классифицирован как положительным, в то время как в действительности оказался негативным.

Обсуждение результатов. Проведено моделирования варианта исхода операции АКШ в зависимости от выбранного способа кардиоплегии. Задача прогнозирования исхода операции была решена как задача распознавания, основанная на обучении по прецедентам [2]. Табл. 2-4 демонстрируют высокую классификационную способность представленных моделей.

На рис. 3 в сводной диаграмме наглядно представлены результаты кроссвалидационной проверки алгоритмов классификации.

0,95

0,9

0,85 —

0,8

0,75

0,7

9,0

9,0

9,0

9,0

£

Логистическая

регрессия выживаемость

Логистическая регрессия смертность

Деревья решений выживаемость

Деревья решений смертность

Машина опорных векторов выживаемость

Машина опорных векторов смертность

1

□ Точность "Кустодиол" □ Полнота "Кустодиол"

□ Г-мера "Кустодиол" □ Точность "Кровяная кардиоплегия"

□ Полнота "Кровяная кардиоплегия" □ Г -мера " Кровяная кардиоплегия"

Рис. 3. Сводная диаграмма результатов моделирования исхода операции АКШ в зависимости от способа кардиоплегии

На рис. 3 проводится сравнение моделей по ряду показателей. Некоторые модели с максимальной точностью позволяют предсказать положительный или отрицательный исход операции, такими моделями являются дерево решений для положительного исхода при использовании Кустодиола и машина опорных векторов для неблагоприятного исхода операции с использованием кровяной кардиоплегии.

В ходе анализа случаев и точности предсказания неблагоприятного результата операции было выявлено, что во всех моделях присутствует доля ложноположительных результатов. Такие случаи выявляются в ситуациях, когда среди большинства операций на пациентах, имеющих координаты в признаковом пространстве, соответствующие неблагоприятному исходу, обнаруживаются случаи выживания. По мнению авторов работы, данный факт объясняется наличием некоторой случайной составляющей в реакции пациентов на действия кардиохирурга.

Заключение. На основании приведенных в работе значений критериев была выявлена модель, наиболее подходящая для использования в качестве рекомендательной для прогнозирования исходов операции АКШ с применением двух различных методов подготовки операции. Показана высокая обобщающая способность полученных моделей. Несмотря на высокие значения таких показателей как МСС и АИС прогностические модели, могут быть улучшены за счет увеличения размера обучающей выборки что, несомненно, является мотивацией к проведению дальнейших исследований в данной области. Также следует отметить, что данные модели могут стать основой для информационной системы поддержки принятия решения по выбору кардиоплегии во время операции АКШ при остром инфаркте миокарда.

Литература

1. Сердечно-сосудистые заболевания // Информ. бюл. 2015. №°317.

2. Вапник В. Н. Восстановление зависимостей по эмпирическим данным. М. : Наука,

1979.

3. Witten I. H., Frank E., Hall M. A. Data Mining: Practical Machine Learning Tools and Techniques. 3rd Edition. Morgan Kaufmann, 2011.

4. Микшина В. С. Павлов С. И. Математическое моделирование принятия решений при выборе способа кардиоплегии врачом-кардиохирургом // Перспективные направления развития отечественных информационных технологий : материалы II междунар. науч.-практич. конф., Севастополь, 13-17 сентября 2016 г. Севастопол. гос. ун-т ; Севастополь : СевГУ, 2016. С. 93-95.

5. Павлов С. И., Григоренко В. В., Микшина В. С. Mathematical modeling of the patient's conditions in cardiology based on the use of factor analysis // Информационные инновационные технологии : междунар. науч.-практич. конф. Прага, 2017.

6. Павлов С. И., Микшина В. С., Григоренко В. В., Повидишь О. Б. Применение деревьев решений для выбора способа кардиоплегии при аортокоронарном шунтировании // Вестн. новых мед. технологий. 2017. Т. 24. № 2. С. 29-36.

7. Matthews B.W. Comparison of the predicted and observed secondary structure of T 4 phage lysozyme // Biochimica et Biophysica Acta (BBA). Protein Structure. 1975. № 405 (2). Р. 442-451.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

8. Чазов Е. И. Болезни сердца и сосудов : рук. для врачей в 4 т. Т. 2. М. : Медицина, 1992. 448 с.

9. Quinlan J. R. Improved Use of Continuous Attributes in C4.5 // Journal of Artificial Intelligence Research. 1996. V. 4. Is. 1. January. P. 77-90.

10. Data Mining and Knowledge Discovery Handbook. Springer, 2013.

i Надоели баннеры? Вы всегда можете отключить рекламу.