Нейросетевой анализ предикторов летального риска у больных после перенесенного острого коронарного синдрома

Швец Д. А.; Карасёв А. Ю.; Смоляков М. В.; Поветкин С. В.; Вишневский В. И.

https://russjcardiol.elpub.ru doi:10.15829/1560-4071-2020-3-3645

ISSN 1560-4071 (print) ISSN 2618-7620 (online)

Нейросетевой анализ предикторов летального риска у больных после перенесенного острого коронарного синдрома

112 3 4

Швец Д. А., Карасёв А. Ю., Смоляков М. В. , Поветкин С. В. , Вишневский В. И.

Цель. Изучить возможности применения нейросетевого анализа клинико-инструментальных данных для прогнозирования риска летальных исходов у больных после перенесенного острого коронарного синдрома (ОКС). Материал и методы. Четыреста пациентов после перенесенного ОКС наблюдались в течение 62 мес. Критерий осложнённого течения ишемической болезни сердца (ИБС) — летальный исход кардиогенной причины. Группу 1 наблюдения составили 310 больных с неосложненным течением и 2 группу 90 больных с осложненным течением ИБС. Для прогнозирования летального риска использовали метод машинного обучения и нейросетевого анализа. Машинное обучение проводилось с включением клинических, лабораторных и инструментальных (электрокардиография, эхокардиография) признаков (всего 49). Для решения задач классификации использованы два вида архитектур нейросетей: многослойный персептрон (Multilayer Perceptron (MLP)) и свёрточная нейронная сеть (Convolutional Neural Networks (CNN)). Соотношение в примерах на обучение и валидацию составило 340/60. Использовался метод обучения с учителем на имеющихся данных, в которых были известны исходы, а параметры нейронной сети подстраивались так, чтобы минимизировать ошибку. Результаты. Наибольший вклад в риск летального исхода после ОКС вносят возраст больных, перенесенный ранее ИМ и острое нарушение мозгового кровообращения, наличие фибрилляции предсердий, 2 стадия и 3 функциональный класс хронической недостаточности кровообращения, отсутствие чрескожного коронарного вмешательства, 3 стадия хронической болезни почек, сниженная фракция выброса левого желудочка. Большая часть летальных случаев приходилась на 2 и 4 годы наблюдения больных, что, возможно, связано с низкой эффективностью вторичной профилактики ИБС. Исследуемая архитектура свёрточной нейронной сети оказалась более точной моделью диагностики. Чувствительность 68% и специфичность 84%, при хорошем качестве модели (area under curve (AUC) =0,74). К преимуществам CNN относится возможность анализировать закономерности во времени, используя рекуррентные нейронные сети. Заключение. Нейросетевой анализ подготовленных клинических, лабораторных и инструментальных данных позволяет настроить параметры сети для последующего прогнозирования летального риска. Использование свёрточной нейронной сети с чувствительностью 68% и специфичностью 84% прогнозирует риск летального исхода на протяжении 5 лет после ОКС.

Ключевые слова: нейронная сеть, машинное обучение, острый коронарный синдром, летальность.

Отношения и деятельность: нет.

БУЗ Орловской области Орловская областная клиническая больница, Орёл; 2ООО "АктивБизнесКонсалт", Орёл; 3фГБОУ ВО Курский государственный медицинский университет, Курск; 4ФГБОУ ВО Орловский государственный университет им. И. С. Тургенева, Орёл, Россия.

Швец Д. А.* — к.м.н., врач кардиолог отделения кардиологии 1 с ПРИТ, ORCID: 0000-0002-1551-9767 Карасёв А. Ю. — врач кардиолог отделения кардиологии 1 с ПРИТ, ORCID: 0000-0002-8334-0988, Смоляков М. В. — главный программист, ORCID: 0000-0001-6059-7126, Поветкин С. В. — д.м.н., профессор, зав. кафедрой клинической фармакологии, ORCID: 0000-0002-1302-9326, Вишневский В. И. — д.м.н., профессор, зав. кафедрой внутренних болезней медицинского института, ORCID: 0000-0002-3004-9687.

*Автор, ответственный за переписку (Corresponding author): denpost-card@mall.ru

ИБС — ишемическая болезнь сердца, ОКС — острый коронарный синдром, ИМ — инфаркт миокарда, ЛЖ — левый желудочек, ХБП — хроническая болезнь почек, ЕКО — европейское кардиологическое общество, КАГ — коронарогра-фия, ЧКВ — чрескожное коронарное вмешательство, ОНМК — острое нарушение мозгового кровообращения, ЭКГ — электрокардиограмма, Эхо-КГ — эхо-кардиография.

Рукопись получена 0312.2019 Рецензия получена 1712.2019 Принята к публикации 2212.2019

Для цитирования: ШвецД. А., Карасёв А. Ю., Смоляков М. В., Поветкин С. В., Вишневский В. И. Нейросетевой анализ предикторов летального риска у больных после перенесенного острого коронарного синдрома. Российский кардиологический журнал. 2020;25(3):3645. do¡:10.15829/1560-4071-2020-3-3645

Neural network analysis of mortality risk predictors in patients after acute coronary syndrome

11 2 3 4

ShvetsD. A., Karasev A. Yu., Smolyakov M. V. , Povetkin S. V. , Vishnevsky V. I.

Aim. To study the possibilities of neural network analysis of clinical and Instrumental data to predict the mortality risk in patients after acute coronary syndrome (ACS). Material and methods. The study involved 400 patients after ACS which who observed for 62 months. The criterion for the complicated course of coronary artery disease (CAD) is the cardiovascular death. Group 1 consisted of 310 patients with uncomplicated course of CAD; group 2 — 90 patients with complicated course of CAD. To predict mortality risk, the machine learning method and neural network analysis was used. Machine learning was carried out with the inclusion of clinical, laboratory and instrumental (electrocardiography, echocardiography) parameters (49 in total). To solve the classification problems, two types of neural network architectures were used: Multilayer Perceptron (MLP) and Convolutional Neural Networks

(CNN). The ratio in the examples for learning and validation was 340/60. The method of learning with a teacher was used on the available data in which the outcomes were known, and the neural network parameters were adjusted so as to minimize the error. Results. The following factors made the highest contribution to the mortality risk after ACS: age; history of MI and acute cerebrovascular accident; atrial fibrillation, class 2-3 heart failure; no history of percutaneous coronary intervention; stage 3 chronic kidney disease; reduced left ventricle ejection fraction. Most of the deaths occurred in the 2nd and 4th years of follow-up, which may be due to the low effectiveness of secondary prevention of CAD. CNN architecture had higher accuracy (sensitivity — 68%; specificity — 84%; area under curve=0,74). An advantage of CNN is its ability to analyze patterns over time using recurrent neural networks.

Conclusion. Neural network analysis of clinical, laboratory and Instrumental data allows configuring network parameters for mortality risk prediction. CNN predicts 5-year mortality risk after ACS with a sensitivity of 68% and a specificity of 84%.

Key words: neural network, machine learning, acute coronary syndrome, mortality.

Relationships and activities: not.

'Orel Regional Clinical Hospital, Orel; 2OOO ActivBusinesConsult, Orel; 3Kursk State Medical University, Kursk; 4I.S. Turgenev Orel State University, Orel, Russia.

Shvets D.A. ORCID: 0000-0002-1551-9767, Karasev A. Yu. ORCID: 0000-00028334-0988, Smolyakov M.V. ORCID: 0000-0001-6059-7126, Povetkin S. V. ORCID: 0000-0002-1302-9326, Vishnevsky V. I. ORCID: 0000-0002-3004-9687

Received: 0312.2019 Revision Received: 1712.2019 Accepted: 2212.2019

For citation: Shvets D. A., Karasev A. Yu., Smolyakov M. V., Povetkin S.V., Vishnevsky V. I. Neural network analysis of mortality risk predictors in patients after acute coronary syndrome. Russian Journal of Cardiology. 2020;25(3):3645. (In Russ.) doi:10.15829/1560-4071-2020-3-3645

Ишемическая болезнь сердца (ИБС) является основной нозологией в структуре смертности населения большинства стран мира. Самой распространённой причиной летальных исходов являются острые формы ИБС. Стандартизированный коэффициент смертности от ИБС в возрасте старше 50 лет составляет для мужчин 2153,1, для женщин 1288,2 на 100 тыс. больных ИБС, что превышает аналогичный показатель развитых стран. По результатам многочисленных международных регистров GRACE, TIMI, CRUSADE, CADILLAK, EHS-ACS и других разработаны шкалы оценки риска, позволяющие прогнозировать вероятность больничной и отдалённой смертности (до 3 лет) [1, 2].

В последнее время в медицинских исследованиях всё чаще применяются различные методы машинного обучения и технологии искусственного интеллекта. Идея заключается в том, чтобы не программировать алгоритм решения задачи вручную, а "выучить" его из большого количества предоставленных данных. На сегодняшний день накоплены и систематизированы самые разнообразные подходы в применении статистических и математических алгоритмов для построения систем искусственного интеллекта, такие как: байесовские методы, логистическая регрессия, метод опорных векторов, решающие деревья, ансамбли алгоритмов и т.д. [3]. Машинное обучение (machine learning (ML)) — это процесс машинного анализа подготовленных статистических данных для поиска закономерностей и создания на их основе нужных алгоритмов (настройки параметров нейронной сети), которые затем будут использоваться для оценки прогноза. Различают 3 основных подхода к машинному обучению: обучение с учителем, обучение с подкреплением, обучение без учителя (самообучение). В целом модели прогнозирования на основе ML более универсальны и эффективны, чем статистические модели [4-6]. Использование такой методологии для анализа больших данных в клинических исследованиях может способствовать разработке широко применимых моделей прогнозирования, а также улучшению способности предсказывать будущие события, что является основным направлением в эпоху точной медицины. Кроме того, способность включать множество переменных без

предвзятого представления о вероятных важных предикторах в конечном счете поможет выявить новые ассоциации факторов риска. В результате одним из подходов стала концепция "искусственного нейрона" — математической функции, которая преобразует несколько входных факторов в один выходной, назначая для них веса влияния.

В некоторых исследованиях было показано, что система прогноза способна показать свою наивысшую эффективность в популяции, где были взяты данные для ее обучения [1]. Поэтому актуальным является сбор регистровых данных в каждом регионе с дальнейшим применением машинного обучения и технологии искусственного интеллекта для получения более точной прогностической информации и улучшения качества оказания помощи больным с ИБС.

Целью исследования является изучение возможности применения нейросетевого анализа клинико-инструментальных данных для прогнозирования риска летальных исходов у больных после перенесенного острого коронарного синдрома (ОКС).

Материал и методы

В исследовании приняли участие 400 больных с ОКС, выписанных из отделения неотложной кардиологии в период с 2012 по 2016гг. Таким образом, в исследование включены 6,2% случайно выбранных больных, из всех выписанных с ОКС за период 20122016гг. Диагноз был верифицирован согласно рекомендациям Европейского общества кардиологов (ЕОК). Критериев исключения не было. Исследование было выполнено в соответствии со стандартами надлежащей клинической практики (Good Clinical Practice) и принципами Хельсинской Декларации. Протокол исследования был одобрен этическими комитетом (выписка из протокола РЭК № 5 от 14.11.2011г). Анализировались данные медицинской карты (жалобы, анамнез, объективные, лабораторные и инструментальные данные). Повторные сведения о состоянии больных собирались посредством заочного опроса больных или их родственников (почтой или по телефону), по запросу из территориального отдела записи актов гражданского состояния (ЗАГС) (летальные случаи) и при повторном

Таблица 1

Характеристика и однофакторный анализ факторов риска, ассоциированных с летальностью исследованных больных с ИБС (OR (отношение шансов) с 95% доверительным интервалом)

Показатель Осложнённое течение (п=90) Неосложнённое течение(п=310) Риск летальности ОЯ [-95%; 95%]

Средний возраст, годы 675±12,1*** 59,4±111 1,06 [1,04; 1,01]

Пол мужчины 55(611) 209 (67,4) 1,3 [0,8; 2,2]

женщины 35 (38,9) 101 (32,6)

Место жительства город 16 (17,8)* 93(30) 1,9 [1,09; 3,6]

село 74 (82,2)* 217(70)

Нозология нестабильная стенокардия 39 (43,3) 119 (38,4) 0,8 [0,5; 1,3]

инфаркт миокарда 51 (56,7) 191 (61,6)

Факторы риска ИБС артериальная гипертензия 80 (88,9) 249 (80,3) 1,9 [0,95; 4,0]

курение 34 (37,8) 132 (42,6) 0,8 [0,5; 1,3]

дислипидемия 51 (56,7) 141 (45,6) 0,6 [0,39; 1,0]

сахарный диабет 17 (18,9) 52 (16,8) 0,6 [11; 0,63]

индекс массы тела, кг/м2 275±5,2* 28,8±4,9 0,95 [0,89; 0,99]

ожирение 29 (32,2) 121 (39,0) 0,89 [0,63; 1,2]

Недостаточность кровообращения стадия 1 48 (53,3)*** 274 (88,4) 6,6 [3,9; 11,4]

2 42 (46,7)*** 36 (11,6)

ИУНА 1 ФК 8 (8,9)*** 71 (22,9) 3,4 [2,2; 5,0]

2 ФК 33 (36,7) 181 (58,4)

3 ФК 49 (54,4)*** 58 (18,7)

Исходный уровень АД САД, мм рт.ст. 145 [120; 160] 140 [130; 160] 1,0 [0,99; 1,01]

ДАД, мм рт.ст. 80 [80; 90] 90 [80; 90] 1,0 [0,98; 1,02]

ПАД, мм рт.ст. 55 [40; 75] 60 [50; 70] 1,0 [0,98; 1,01]

Стенокардия до поступления 75 (83,3)** 213 (68,7) 2,3 [1,2; 4,2]

ИМ в анамнезе 39 (43,3)*** 62(20) 3,0 [1,8; 5,0]

Начало симптомов ОКС до 72 ч 56 (62,2) 175 (56,4) 0,79 [0,48; 1,3]

Количество коронароангиографий 31 (34,4)*** 200 (64,5) 0,29 [018; 0,47]

Количество ЧКВ 20 (22,2)*** 132 (42,5) 0,36 [0,2; 0,63]

ОНМК в анамнезе 13 (14,4)** 14 (4,5) 3,6 [1,6; 79]

Внесердечный атеросклероз 7 (7,8) 25 (81) 0,96 [0,4; 2,3]

Фибрилляция предсердий 21 (23,3)** 32 (10,3) 2,6 [1,4; 4,9]

Фармакологическая терапия проводилась 47 (52,2) 146 (471) 1,2 [0,77; 1,9]

до госпитализации не было 43 (47,8) 164 (52,9)

статины 17 (18,9) 35 (11,3) 1,8 [0,96; 3,4]

БАБ 25 (27,8) 80 (25,8) 11 [0,65; 1,9]

иАПФ/АРА 36(40) 110 (35,5) 1,2 [0,75; 1,9]

антиагреганты 34 (37,8)* 79 (25,5) 1,8 [11; 2,9]

ЧСС, уд./мин 78,8±19,6* 73,8±171 1,01 [1,0; 1,03]

Эритроциты, млн/л 4,3±0,6 4,5±0,6 0,72 [0,49; 1,07]

Гемоглобин, г/л 136 [120; 150] 142 [130; 154] 0,99 [0,98; 1,0]

Лейкоциты, тыс./л 81 [6,5; 9,3] 8,0 [6,3; 9,7] 1,04 [0,99; 11]

СОЭ, мм/ч 20 [12; 32]* 17 [10; 26] 1,02 [1,0; 1,04]

СКФ, мл/мин/1,73 м2 66,5±21,9*** 78,3±20,4 0,97 [0,96; 0,98]

ХБП 1 11 (12,2)*** 100 (32,2) 2,2 [1,5; 31]

2 47 (52,2) 152 (49,0)

3 32 (35,6)*** 58 (18,8)

Сахар крови, ммоль/л 71 ±2,2 71±2,9 0,99 [0,91; 11]

Позитивные тропонины 50 (55,5) 137 (44,2) 1,6 [0,98; 2,5]

иКДО ЛЖ, мл/м2 65,3±274*** 53,6±15,3 1,03 [1,2; 1,04]

иКСО ЛЖ, мл/м2 29,4 [18,9; 41,8]** 19,4 [141; 261] 1,05 [1,03; 1,07]

ФВ, % 52,4±12,5*** 60,9±10,8 0,94 [0,92; 0,96]

Примечание: * — р<0,05, ** — р<0,01, *** — р<0,001.

Сокращения: АД — артериальное давление, АРА — антагонисты рецепторов ангиотензина II, БАБ — блокаторы р1-адренорецепторов сердца, ДАД — диастолическое АД, иАПФ — ингибиторы ангиотензинпревращающего фермента, ИМ — инфаркт миокарда, НМГ — низкомолекулярный гепарин, НФГ — нефракционированный гепарин, ОНМК — острое нарушение мозгового кровообращения, ПАД — пульсовое АД, САД — систолическое АД, СКФ — скорость клубочковой фильтрации, СОЭ — скорость оседания эритроцитов, ТЛТ — тромболитическая терапия, ФК — функциональный класс, ХБП — хроническая болезнь почек, ЧКВ — чрескожное коронарное вмешательство, ЧСС — частота сердечных сокращений.

Таблица 1. Продолжение

Показатель Осложнённое течение (n=90) Неосложнённое течение(n=310) Риск летальности OR [-95%; 95%]

ТЛТ 11 (12,2) 23 (74) 1,7 [0,81; 3,7]

НМГиНФГ 76 (878) 283 (91,2) 1,5 [0,77; 3,1]

БАБ в первый день 75 (86,7) 272 (878) 0,7 [0,4; 1,3]

Аторвастатин-симвастатин 67 (74,4) 251 (80,9) 0,56 [0,35; 0,91]

очном исследовании больного (повторная госпитализация или амбулаторный приём по вызову из дома). Телефонный опрос больных и родственников осуществлялся на протяжении 2018г, включая больных, пролеченных повторно в стационаре до 2018г. Таким образом, из 400 больных, включённых в исследование, 211 больных (52,7%) исследованы повторно очно, информацию о 152 больных удалось получить заочно (по телефону или почтой) и 37 случаев были регистрированы в отделе ЗАГС. Медиана наблюдения составила 62 [36; 71] мес. Критерий осложнённого течения ИБС — летальный исход. Таким образом, 1 группу составили 310 больных с неосложненным течением и 2 группу 90 больных с осложненным течением ИБС. Смерть признавалась кардиогенной при достоверных клинико-инструментальных и секционных данных, в том числе при обстоятельствах, когда другие причины были маловероятны.

Проводился сбор жалоб, анамнеза, объективные и лабораторно-инструментальные исследования. Среди анамнестических данных выясняли характер проводимой ранее терапии (группы препаратов), факторы риска атеросклероза, перенесенный инфаркт миокарда (ИМ), острое нарушение мозгового кровообращения (ОНМК), сопутствующий вне-сердечный атеросклероз. Лабораторные данные, проводимые у всех больных: общеклинический и биохимический анализы крови (скорость клубочковой фильтрации (СКФ) рассчитывался по формуле CKD-EPI (2011) на основании концентрации креатинина крови при поступлении стационар), исследование липидного спектра, качественное определение тро-понинового теста. Частота сердечных сокращений рассчитывалась на основании электрокардиограммы (ЭКГ) (при поступлении в стационар). Эхокардио-графия (Эхо-КГ) выполнялась в первые сутки с определением нормированных к площади поверхности тела (Mosteller RD (1987)) конечный диастолический объем левого желудочка (ЛЖ) и конечный систолический объем ЛЖ. Фракция выброса ЛЖ определялась по методике Simpson JS (1989). При наличии показа-

ний проводилась коронарография (КАГ) и чрескожное коронарное вмешательство (ЧКВ). Учитывалась терапия в первые сутки лечения (тромболизис, прямые антикоагулянты, БАБ). Таким образом, анализу были доступны 49 параметров (ключевые признаки), которые выбирались на основании диагностической информативности и доступности.

Для статистической оценки полученных данных использовали методы параметрической и непараметрической статистики. В случае нормального распределения (для оценки использовался критерий Колмогорова-Смирнова) при определении значимости различия между средними величинами применялся критерий Стьюдента. При отсутствии нормального распределения признака проводилось сравнение при помощи U-теста Манна-Уитни. Данные в таблицах представлены в виде среднего (М) и стандартного отклонения (SD) при параметрическом методе и в виде медианы [25-го и 75-го квартилей] при непараметрическом методе сравнения. Для оценки роли определенного фактора (признака) в предсказании исследуемого события (летального риска) с помощью однофакторной логистической регрессии рассчитывалось отношение шансов (OR — odds ratio) с 95% доверительным интервалом. В качестве программного обеспечения для построения различных архитектур нейросетей использовали наборы библиотек для языка программирования Python (pandas — для работы с табличными данными; scikit-learn — подготовка данных для обучения; keras — для конструирования нейронных сетей и их обучения). Обучение проводили на 85% подготовленных данных и 15% больных составили отложенную (тестирующую) выборку (учитывая небольшой набор данных). Общие рекомендации для отложенной выборки составляют от 15 до 33% [7]. В конечном варианте соотношение в примерах на обучение и валидацию составило 340/60. Использовался метод обучения с учителем на имеющихся данных, в которых были известны исходы, а параметры нейронной сети подстраивались так, чтобы минимизировать ошибку. Перед проведе-

120

100

80

60

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

§ 40

20

-10 0 10 20 30 40 50 60 70 80 90 100 Время наблюдения, мес.

Рис. 1. Распределение количества больных в зависимости от длительности периода наблюдения после ОКС.

Примечание: время наблюдения (мес.) — период времени от возникновения ОКС до момента окончания наблюдения.

35 ■ 30 ■ 25 ■ 20 ■ 15 10 5 0

31,1%

it

24,4%

13,3%

_ _10%_

7,8%

Inn

1 2 3 4 5 6 7

Рис. 2. Распределение случаев летальных исходов исследуемых больных ИБС на протяжении 7 лет наблюдения после перенесенного ОКС. Примечание: по оси абсцисс — годы от момента ОКС; по оси ординат — доля больных, имеющих летальный исход, %.

нием обучения проводился этап подготовки данных, который заключался в исключении из обучающей выборки тех признаков, которые сильно коррелируют между собой, что приводит непосредственно к переобучению модели. Так как многослойный перцеп-трон чувствителен к разбросу значений признаков, проведен этап нормализации, который заключался в приведении значений всех признаков к единой шкале значений от 0 до 1. Для преодоления переобучения из-за большого разброса величин используется Ь2-регуляризация, которая "штрафует" сильно отличающиеся признаки и позволяет снизить размерность пространства, что улучшает качество классификатора и скорость его работы. В качестве описания функции потерь использовалась формула кросс-энтропии. В работе использовали и сравнивали по точности прогноза две архитектуры нейронной сети: многослойный персептрон (Multilayer Perceptron

(MLP)) и свёрточную нейронную сеть (Convolutional Neural Networks (CNN)).

Результаты

Перед началом машинного обучения проведено сравнение анализируемых параметров в зависимости от варианта течения ИБС. В таблице 1 представлены 49 клинических, лабораторных и инструментальных признаков исследуемых больных.

Из таблицы 1 видно, что наибольшая ассоциация с риском последующего летального исхода у следующих параметров: возраста, стадии и функционального класса недостаточности кровообращения, скорости клубочковой фильтрации, фракции выброса ЛЖ, ИМ в анамнезе и проведения ЧКВ. Как видно, нозология и традиционные факторы риска атеросклероза в исследуемой группе больных не оказывают влияния на летальность.

На рисунке 1 представлено распределение количества больных в зависимости от длительности периода наблюдения после перенесенного ОКС.

Как видно из рисунка 1, около половины больных наблюдались <5 лет и примерно такая же часть больных наблюдалась >5 лет. Медиана наблюдения составила 62 [36; 71] мес.

На рисунке 2 представлено распределение случаев летальных исходов на протяжении 7 лет после перенесенного ОКС.

Медиана летальных исходов составила 35 [21; 49] мес. Можно видеть, что увеличение числа летальных исходов приходится на 2 год наблюдения (каждый третий летальный случай). Ещё четверть смертей фиксируется на 4 году наблюдений. Сопоставляя рисунок 1 и рисунок 2, можно сделать вывод, что прекращение наблюдения больных до 5 лет в основном обусловлено летальными исходами.

В качестве гипотезы предполагается, что предлагаемый набор факторов оказывает значительное влияние при классификации пациентов, определяя вероятность летального исхода. Используя данные только по этим признакам, возможна достаточно высокая степень точности и полноты прогноза. Для получения статистических метрик производилось вычисление нелинейной функции отклика зависимых переменных от независимых путем "обучения" статистических моделей классификации на исследуемых данных.

В исследовании применена архитектура нейронной сети MLP с двумя скрытыми слоями. Данная нейронная сеть относится к разновидности многослойного перцептрона, внутри которого каждый нейрон использует нелинейную функцию активации. В нашем случае используется сигмоида. Наличие нескольких скрытых слоев и обучения за счет обратного распространения ошибки позволяет осуществить глубокое обучение.

model_aeeuracy

model Г055

100 130

цяс!К

Рис. 3. Кривые сравнения точности (слева) и ошибочной оценки (справа) вероятности летального исхода обучающей (train) и тестовой (validation) выборок архитектурой MLP исследуемых больных с ИБС.

Примечание: здесь и на рисунке 5, по оси абсцисс — количество эпох обучения, по оси ординат — доля правильных ответов (точность классификации) (слева) и значения функции ошибки прогноза (справа).

Свёрточные нейронные сети отличаются от многослойного персептрона, состоящего только из полносвязных слоев. Сверточная сеть состоит из блока сверток, извлекающие "особенности" из данных, и блока полносвязных слоев, которые могут играть роль классификатора.

На рисунке 3 представлены результаты, полученные при обучении данных архитектурой MLP в виде кривых точности и ошибочной оценки вероятности летального исхода после ОКС исследуемых больных.

Как видно на рисунке 3, модель MLP существенно не переобучается, вследствие чего кривые на обучающем и тестовом множествах не расходятся. Кроме того, величина функции потерь снижается с увеличением числа наблюдаемых больных.

Диагностическая точность MLP в прогнозе летального исхода после ОКС невысока (рис. 4).

Видно, что при низкой чувствительности имеет место довольно высокая специфичность модели (51% и 84%, соответственно).

На рисунке 5 представлены результаты, полученные при обучении данных архитектурой CNN в виде кривых точности и ошибочной оценки вероятности летального исхода после ОКС исследуемых больных.

Диагностическая точность CNN в прогнозе летального исхода после ОКС выше, чем у MLP (рис. 6).

Как видно из рисунка, чувствительность модели меньше специфичности (68% и 84%, соответственно).

Обсуждение

В современной медицине принятие решений — сложный процесс, который базируется на наличии объективных и надежных доказательств, непосредственном доступе к знаниям, а также на правильной

Receiver Operating Characteristic

1,0

0,8

0,6

^ 0,4

e

S н

0,2

0,0

0,0 0,2 AUC=0,63

0,4 0,6

False Positive Rate

0,8

1,0

Рис. 4. ROC кривая чувствительности и специфичности диагностики риска летального исхода исследуемых больных с ИБС. Примечание: данные обучены архитектурой MLP; р<0,05.

интерпретации имеющихся данных с учетом соотношения риска и пользы для пациента. Важным аспектом лечения больных стало предсказание вероятности сердечно-сосудистого события на относительно длительный период времени. Эпидемиологические исследования, используемые для получения таких прогностических моделей, часто содержат сотни или тысячи переменных. Именно в этом контексте методы машинного обучения могут быть полезны в качестве средства выявления наилучших предикторов из большого числа фенотипических данных. Точность прогнозирования сердечно-сосудистого риска на основании традиционных методов регрессии ограничена из-за корреляции и нелинейности переменных и может меняться с течением времени. Как

Рис. 5. Кривые сравнения точности (слева) и ошибочной оценки (справа) вероятности летального исхода обучающей (train) и тестовой (validation) выборок архитектурой CNN исследуемых больных с ИБС.

Receiver Operating Characteristic

1,0

0,8

0,6

^ 0,4

e

S н

0,2

0,0

0,0 0,2 AUC=0,74

0,4 0,6

False Positive Rate

0,8

1,0

Рис. 6. ROC кривая чувствительности и специфичности диагностики риска летального исхода исследуемых больных с ИБС. Примечание: данные обучены архитектурой CNN; р<0,01.

пример, оценка риска осложнений после ОКС на основании модели GRACE, данные которой получены >20 лет назад, в настоящее время менее специфична. В отличие от традиционных алгоритмов, требующих обновления и пересчёта данных, преимуществом нейросетей является их обучаемость, благодаря чему они адаптируются к различным изменениям, каждый раз применяя новые данные для поиска решения поставленной задачи [5, 6, 8].

В исследуемой группе больных по результатам однофакторного анализа, традиционные факторы риска атеросклероза и нозология не увеличивали вероятность летального исхода. В то же время, возраст, перенесенный ранее ИМ, стадия и функциональный класс ХСН, снижение систолической функции левого желудочка и выделительной функции почек существенно ухудшали прогноз. Это означает, что до клинического проявления коронарной болез-

ни (ОКС) и после данного эпизода патогенетический вклад факторов риска в скорость прогрессирования болезни может различаться. ML и НС в отличие от обычно используемых статистических методов поможет выявить не отдельные факторы риска с их влиянием на вероятность летального исхода, а ассоциации таких факторов. Используя своё ключевое преимущество — обучаемость, при увеличении количества данных нейросеть позволяет не только улучшить качество прогноза, но за счёт выявления таких ассоциаций правильно расставить ориентиры дальнейшего профилактического лечения.

Ежегодно трудами исследователей появляется большое количество моделей оценки сердечно-сосудистого риска. Большинство моделей основаны на данных рандомизированных клинических и регистровых исследований. Однако только небольшая часть из моделей используется в реальной клинической практике. Очевидно, что вместо создания очередной нежизнеспособной модели необходим качественно иной подход. В проведенном исследовании использовали относительно небольшое количество данных: 49 признаков, полученных у 400 больных. В связи с этими были построены архитектуры сетей с небольшим количеством параметров (19600). Применение более глубоких нейронных сетей может привести к переобучению. Поэтому, в своей работе мы использовали относительно неглубокую сеть. Указанное обстоятельство несколько снижает чувствительность созданной прогностической модели [9].

Сравнение диагностической точности (по показателю AUC) двух конфигураций нейронных сетей позволило выявить наибольшую чувствительность и специфичность для CNN в сравнении с MLP (0,74; р<0,01 против 0,68; р<0,05). Наиболее частое применение свёрточных нейронных сетей — классификация и распознавание изображений. Однако, помимо двухмерных можно использовать и одномерные свёрт-

ки (исследуемый пример: 49; 1), используя в качестве входного вектора набор факторов (признаков — 49) и 1 временной интервал. Результат бинарной классификации предполагаемых летальных исходов архитектурой CNN показал диагностическую чувствительность 68% и специфичность 84% при хорошем качестве модели (AUC =0,74). Другим важным преимуществом CNN является возможность анализировать закономерности во времени, используя рекуррентные нейронные сети. Данная разновидность CNN может отслеживать предшествующие данные и их динамику с течением времени. Дальнейшее увеличение обучаемой выборки позволит выявить наиболее значимые признаки, исследовать признаки на наличие выбросов. С помощью искусственного увеличения тренировочного корпуса, путем различных аугментаций можно нарастить мощность нейронной сети за счёт добавления свёрточных и рекуррентных слоев, что позволит анализировать выявленные закономерности во времени [9-11].

В результате исследования выявлены предикторы неблагоприятного прогноза. Наибольший вклад в риск летального исхода вносят: возраст больных, перенесенный ранее ИМ и ОНМК, наличие фибрилляции предсердий, 2 стадия и 3 функциональный класс хронической недостаточности кровообращения, отсутствие ЧКВ, 3 стадия ХБП, сниженная ФВ левого желудочка (<55%). Менее значимыми факторами являются: проживание больного в городе или в селе, наличие стенокардии и приём антиагрегантов до поступления в стационар, ЧСС, СОЭ. Выявлено неравномерное распределение летальных случаев за исследуемый период времени, что можно объяснить неудовлетворительной вторичной профилактикой ИБС и прерывистым характером лечения. В начале 2 года после ОКС часть больных вслед за отменой кло-пидогрела прекращают приём большинства препара-

Литература/References

1. Boytsov SA, Demkina AE, Oshchepkova EV, et al. Achievements and problems of practical cardiology in Russia at the present stage. Kardiologiia. 2019;59(3):53-9. (In Russ.) Бойцов С.А., Демкина А.Е., Ощепкова Е.В., и др. Достижения и проблемы практической кардиологии в России на современном этапе. Кардиология. 2019;59(3):53-9. doi:10.18087/cardio.2019.3.10242.

2. Vedanthan R, Seligman B, Fuster V. Global Perspective on Acute Coronary Syndrome a Burden on the Young and Poor Circulation Research. 2014;114:1959-75. doi:!^ 161/ CIRCRESAHA1114.302782.

3. Al'Aref SJ, Singh G, van Rosendael AR, et al. Determinants of In-Hospital Mortality After Percutaneous Coronary Intervention: A Machine Learning. Journal of the American Heart Association. 2019;8:e011160. doi:10.1161/JAHA.118.011160.

4. Kakadiaris IA, Vrigkas M, Yen AA, et al. Machine Learning Outperforms ACC/AHA CVD Risk Calculator in MESA. Journal of the American Heart Association. 2018;7:e009476. doi:1011161/JAHA1118.009476.

5. Alaa AM, Bolton T, Di Angelantonio E, et al. Cardiovascular disease risk prediction using automated machine learning: A prospective study of 423,604 UK Biobank participants. PLoS One. 2019;14(5):e0213653. doi:1011371/journal.pone.0213653.

6. Ambale-Venkatesh B, Yang X, Wu CO, et al. Cardiovascular Event Prediction by Machine Learning: The Multi-Ethnic Study of Atherosclerosis. Circ Res. 2017;121 (9):1092-101. doi:101i161/CIRCRESAHA117.311312.

тов, что приводит к увеличению числа осложнений. Кроме того, большую роль играет недостаточно часто проводимая повторная реваскуляризация миокарда, что в совокупности с недостаточной вторичной медикаментозной профилактикой может объяснить второй пик смертности через 4 года от момента ОКС.

Созданная модель нейросетевого анализа позволяет с достаточной вероятностью предсказывать риск летального исхода. Профиль больного высокого риска: больной старше 65 лет, житель села с перенесенным ранее ИМ и/или ОНМК, имеющий фибрилляцию предсердий, 2 стадию и 3 ФК недостаточности кровообращения, сниженную ФВ, страдающий ХБП 3 стадии и без реваскуляризации при ОКС. Учитывая повышенный риск смертности у таких больных, можно рекомендовать продлённую терапию клопи-догрелом, более частое (ежеквартальное) наблюдение кардиолога с проведением нагрузочных проб для верификации ишемии левого желудочка. Возможно, стоит рассмотреть вопрос о проведении таким больным КАГ и реваскуляризации миокарда и без верификации остаточной ишемии миокарда, учитывая отсутствие возможности проведения специфичных нагрузочных тестов в большинстве клиник РФ.

Заключение

Нейросетевой анализ подготовленных клинических, лабораторных и инструментальных данных позволяет настроить параметры сети для последующего прогнозирования летального риска. Использование свёрточной нейронной сети с чувствительностью 68% и специфичностью 84% прогнозирует риск летального исхода на протяжении 5 лет после ОКС.

Отношения и деятельность: все авторы заявляют об отсутствии потенциального конфликта интересов, требующего раскрытия в данной статье.

7.Gudfellou YA, Bendzhlo I, Kurvill A. Deep learning. М.: DMK Press, 2018. с. 652. (In Russ.) Гудфеллоу Я, Бенджио И, Курвилль А. Глубокое обучение. М.: ДМК Пресс, 2018. с. 652. ISBN 978-5-97060-618-6.

8. Gerber Y, Weston SA, Enrlquez-Sarano M, et al. Contemporary Risk Stratification After Myocardial Infarction in the Community: Performance of Scores and Incremental Value of Soluble Suppression of Tumorigenicity-2. J Am Heart Assoc. 2017;6(10). pii:e005958. doi:10.1161/JAHA.117.005958.

9. Kwon JM, Kim KH, Jeon KH, et al. Artificial intelligence algorithm for predicting mortality of patients with acute heart failure. PLoS One. 2019;14(7):e0219302. doi:101371/journal. pone.0219302.

10. Duan H, Sun Z, Dong W, et al. Utilizing dynamic treatment information for MACE prediction of acute coronary syndrome. BMC Med Inform Decis Mak. 2019;19(1):5. doi:101186/ s12911-018-0730-7.

11. Benjamins JW, van Leeuwen K, Hofstra L, et al. Enhancing cardiovascular artificial intelligence (AI) research in the Netherlands: CVON-AI consortium. Neth Heart J. 2019;27(9):414-25. doi:101007/s12471-019-1281-y.

Аннотация научной статьи по клинической медицине, автор научной работы — Швец Д. А., Карасёв А. Ю., Смоляков М. В., Поветкин С. В., Вишневский В. И.

Похожие темы научных работ по клинической медицине , автор научной работы — Швец Д. А., Карасёв А. Ю., Смоляков М. В., Поветкин С. В., Вишневский В. И.

NEURAL NETWORK ANALYSIS OF MORTALITY RISK PREDICTORS IN PATIENTS AFTER ACUTE CORONARY SYNDROME

Текст научной работы на тему «Нейросетевой анализ предикторов летального риска у больных после перенесенного острого коронарного синдрома»