ОРИГИНАЛЬНЫЕ ИССЛЕДОВАНИЯ
Выявление поражения коронарных артерий при помоши алгоритмов глубокого обучения
Абдуалимов Т.П.1, Обрезан А.Г.2, 3
1 Общество с ограниченной ответственностью Международный медицинский центр «СОГАЗ», 191186, г. Санкт-Петербург, Российская Федерация
2 Федеральное государственное бюджетное образовательное учреждение высшего образования
«Санкт-Петербургский государственный университет», 199034, г. Санкт-Петербург, Российская Федерация
3 Группа клиник «СОГАЗ МЕДИЦИНА», 191186, г. Санкт-Петербург, Российская Федерация
Цель - изучить возможность применения нейросетевого анализа для прогнозирования факта и степени поражения коронарного русла.
Материал и методы. В исследовании приняли участие 120 пациентов, которым была выполнена коронарография (КАГ) в плановом или экстренном порядке, соответствующих критериям включения и исключения.
Критерии включения: пациенты старше 18 лет, выполненная КАГ, снятая электрокардиографическая (ЭКГ) лента за сутки и/или менее до выполнения КАГ.
Критерии исключения: нарушения ритма на ЭКГ в виде фибрилляции предсердий, атриовентрику-лярной узловой или желудочковой тахикардии в момент записи, ранее проведенное стентирование и/или шунтирование коронарных артерий (КА).
Для прогнозирования поражения коронарного русла использовали метод нейросетевого анализа. Машинное обучение проводилось с включением клинических, лабораторных, инструментальных (ЭКГ-изображение) признаков (суммарно 23 показателя). Для решения задач классификации использована нейронная сеть, принимающая на вход структурированные данные и изображение и подающая на выходе мультифакторную характеристику магистральных КА. Соотношение в примерах обучение/тест составило 100/20. Использовался метод обучения с учителем на имеющихся данных, в которых были известны исходы, а параметры нейронной сети подстраивались таким образом, чтобы минимизировать ошибку методом обратного распространения.
Результаты. На тестовой выборке, состоящей из 20 пациентов, результат AUC score (AREA UNDER RECEIVER OPERATING CHARACTERISTIC CURVE) составил 0,74; точность достигала 80%, чувствительность - 63%, специфичность - 88%.
Заключение. Нейросетевой анализ подготовленных клинических, лабораторных и инструментальных данных позволяет настроить параметры сети для последующего прогнозирования поражения КА. Полученные результаты в виде оценки AUC score дают возможность говорить о работоспособности метода при диагностике патологии коронарного русла.
Финансирование. Исследование не имело спонсорской поддержки. Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Для цитирования: Абдуалимов Т.П., Обрезан А.Г. Выявление поражения коронарных артерий при помощи алгоритмов глубокого обучения // Кардиология: новости, мнения, обучение. 2021. Т. 9, № 2. С. 9-13. DOI: https://doi.org/10.33029/2309-1908-2021-9-2-9-13
Статья поступила в редакцию 22.07.2021. Принята в печать 27.08.2021.
Ключевые слова:
коронарные артерии, нейронные сети, глубокое обучение, чрескожное коронарное вмешательство, риск сердечно-сосудистого заболевания
Detection of coronary artery disease using deep learning algorithms
Abdualimov T.P.1, Obrezan A.G.2'3 1 International Medical Center "SOGAZ", 191186, St. Petersburg,
Russian Federation
2 Saint-Petersburg State University, 199034, Saint-Petersburg, Russian Federation
3 SOGAZ MEDICINE Group of Clinics, 191186, Saint Petersburg, Russian Federation
Aim of the study was to analyze the possibility of using neural network analysis to predict the severity of coronary bed lesion.
Material and methods. The study included 120 patients, who underwent elective or emergency coronary catherization and met the inclusion and exclusion criteria.
Inclusion criteria: patients older 18 years, performed coronary catherization, recorded electrocardiography one day before/or less before the operation.
Exclusion criteria: ECG identification of arrhythmias as the atrial fibrillation, atrioventricular nodal reentrant tachycardia, ventricular tachycardia while recording, previous coronary stenting and/or coronary artery bypass grafting. The method of neural network analysis was used to predict the coronary bed lesion. The machine learning included clinical, laboratory, instrumental (ECG-images) parameters (23 parameters in total). The neural network was used to solve the classification problems, receiving input as the structured data and images and providing output as a multifactorial classification of the main coronary arteries. The ratio for training and testing was 100/20. Supervised learning was used on the available data, where the outcomes were known, and neural network parameters were adjusted to minimize the error by backpropagation.
Results. On a test sample including 20 patients, the AUC score was 0.74, where the accuracy was 80%, sensitivity was 63%, and the specificity was 88%.
Conclusion. Neural network analysis of the available clinical, laboratory and instrumentation data allow to configure the network parameters for further prediction of coronary artery disease. The results obtained in the form of an AUC score allow to consider this method to be effective in the coronary artery disease diagnosis.
Funding. The study had no sponsor support.
Conflict of interests. The authors declare no conflict of interests.
For citation: Abdualimov T.P., Obrezan A.G. Detection of coronary artery disease using deep learning algorithms. Kardiologiya: novosti, mneniya, obuchenie [Cardiology: News, Opinions, Training]. 2021; 9 (2): 9-13. DOI: https://doi.org/10.33029/2309-1908-2021-9-2-9-13 (in Russian)
Received 22.07.2021. Accepted for publication 27.08.2021.
Keywords:
coronary arteries, neural networks, deep learning, percutaneous coronary intervention, cardiovascular disease risk
В последнее время в медицинских исследованиях все чаще применяют разные методы машинного обучения и технологии искусственного интеллекта. Идея заключается в том, чтобы не программировать алгоритм решения задачи вручную, а «выучить» его из большого количества предоставленных данных. На сегодняшний день накоплены и систематизированы самые разнообразные подходы в применении статистических и математических алгоритмов для построения систем искусственного интеллекта: байесовские методы, логистическая регрессия, метод опорных векторов, «решающие деревья», ансамбли алгоритмов и т.д. [1, 2].
Машинное обучение (machine learning, ML) - это анализ подготовленных статистических данных для поиска закономерностей и создания на их основе нужных алгоритмов (настройки параметров нейронной сети), которые затем будут использоваться для оценки прогноза. Различают 3 основных подхода к ML: с учителем, с подкреплением, без учителя (самообучение).
В целом модели прогнозирования на основе ML более универсальны и эффективны, чем статистические [3-5]. Использование такой методологии для анализа больших данных в клинических исследованиях может способствовать разработке широко применимых моделей прогнозирования, а также улучшению способности предсказывать будущие события, что является основным направлением в эпоху точной медицины.
Кроме того, способность включать множество переменных без предвзятого представления о вероятных
важных предикторах в конечном счете поможет выявить новые ассоциации факторов риска. В результате одним из подходов к выявлению патологии методом ML стала концепция искусственного нейрона - математической функции, которая преобразует несколько входных факторов с назначенными математически весами влияния в один выходной.
В некоторых исследованиях было установлено, что система прогноза способна проявить свою наивысшую эффективность в популяции, где были взяты данные для ее обучения [1]. Поэтому актуальным является сбор регистровых данных в каждом регионе с дальнейшим применением ML и технологии искусственного интеллекта для получения более точной прогностической информации и улучшения качества оказания помощи больным с ише-мической болезнью сердца (ИБС).
Цель исследования - изучение возможности применения нейросетевого анализа клинико-инструментальных данных для прогнозирования факта и степени поражения коронарных артерий(КА).
МАТЕРИАЛ И МЕТОДЫ
В исследовании приняли участие 120 пациентов, которым была выполнена коронарография (КАГ) в плановом и экстренном порядке. Показания к КАГ были верифицированы согласно рекомендациям Европейского общества кардиологов (ЕОК). Исследование выполнено в соответствии со стандартами надлежащей клинической практики (Good
Clinical Practice) и принципами Хельсинкской декларации. Были определены критерии включения и исключения.
Критерии включения: подписанное до проведения исследования информированное согласие, в том числе на проведение статистической обработки данных истории болезни; возраст старше 18 лет; наличие показаний (плановых или экстренных) к выполнению КАГ; документированная электрокардиографическая запись (ЭКГ, скорость 25 мм), выполненная за сутки и/или менее до КАГ.
Критерия исключения: нарушения ритма на ЭКГ в виде фибрилляции предсердий, АВ-узловой или желудочковой тахикардии в момент записи; ранее проведенное стенти-рование и/или шунтирование КА; выраженные помехи и артефакты на снятой ЭКГ; регистрация ЭКГ более 24 ч перед КАГ; любое хирургическое или медицинское состояние, которое, по мнению исследователя, могло бы значительно помешать работе алгоритма ML применительно к точности результатов.
Врач, проводящий исследование, анализировал данные медицинской карты (жалобы, анамнез, объективные, лабораторные и инструментальные данные) и вносил эти результаты в базу данных ML в бинарном формате.
На I этапе сбора данных по каждому наблюдению внесены структурированные параметры в табличную форму, а также введены изображения ЭКГ-записи в формате jpeg в базу данных. Для обучения нейронных сетей использовали многочисленные морфометрические, объективные, лабораторные и инструментальные данные пациентов.
Такими данными были возраст, пол, острый (ОКС) или хронический коронарный синдром, патология сегмента ST на ЭКГ, наличие или отсутствие сопутствующей патологии (сахарного диабета, гипертонической болезни, ожирения, анемии, перенесенного острого нарушения мозгового кровообращения, атеросклероза, аритмии, дислипидемии), отягощенная наследственность, наличие вредных привычек (курение, злоупотребление алкоголем), наличие стрессовых факторов, низкая физическая активность, менопауза, повышенное питание.
Вышеописанные факторы фиксировали в структурированном бинарном виде (0, 1) в табличном формате. Регистрацию ЭКГ проводили с использованием одного вида аппарата, запись передавалась оператору ML в электронном виде в формате jpeg. Таким образом, для выработки алгоритма обучения нейронной сети суммарно были использованы 22 параметра (ключевые признаки).
Нейронная сеть обучалась на данных, полученных при анализе коронарограмм. В качестве таргетных значений взяты выполненное стентирование или рекомендованное аортокоронарное шунтирование по результатам КАГ, атеросклероз КА, стеноз и субокклюзия ствола левой КА, окклюзия, субокклюзия и стеноз передней межжелудочковой артерии, окклюзия, субокклюзия и стеноз огибающей артерии, окклюзия, субокклюзия или стеноз правой КА.
Значение стеноза КА было внесено в таблицу в процентах, а далее переведено в бинарный вид (1 - стеноз >50%), остальные показатели заполнялись в бинарном виде по наличию или отсутствию поражения. Вышеописанные таргетные значения предсказывал обученный алгоритм ML.
Алгоритму было необходимо решить задачу классификации КА, спрогнозировать отсутствие или наличие поражения. Для решения задачи классификации использована нейронная сеть, принимающая на вход структурированные данные и изображение, на выходе получена мультифак-торная классификация КА. Соотношение в примерах на обучение и тест составило 100/20. Прогнозирование и оценка результатов проведены на тестовой выборке. Пациенты в тестовой выборке были с нетипичной клинической картиной и сложной патологией КА. Данное условие было взято специально для проверки работы алгоритма в реальной клинической практике.
В качестве программного обеспечения для построения архитектуры нейронной сети использованы наборы библиотек для языка программирования Python (pandas - для работы с табличными данными; tensorflow - для конструирования нейронных сетей и их обучения). Использовался метод обучения с учителем на имеющихся данных, в которых были известны исходы, а параметры нейронной сети подстраивались так, чтобы минимизировать ошибку.
Проводился анализ структурированных табличных данных. Средний возраст пациентов составил 64 года (31-89 лет); 52 мужчины и 48 женщин. Медианное значение возраста мужчин меньше, чем у женщин. У 62 из 100 человек верифицирован ОКС. У 19 из них диагностирован подъем сегмента ST. У 53 пациентов из 62 с ОКС определялись типичные ангинозные боли.
Типичные ангинозные боли также были выявлены в 14 случаях у пациентов без ОКС, в основном с хронической ИБС в анамнезе. У 28 пациентов из 100 был диагностирован сахарный диабет 2-го типа. В большинстве случаев в анамнезе присутствовала гипертоническая болезнь. У 44 человек верифицирован атеросклероз. У 25 человек есть нарушения ритма: фибрилляция предсердий в анамнезе, желудочковая экстрасистолия высоких градаций Ryan. У 27 пациентов верифицировано ожирение. У 18 пациентов - анемия различной степени тяжести. У 5 наблюдаемых в анамнезе перенесенное острое нарушение мозгового кровообращения. В 36 случаях пациенты жаловались на одышку в различных вариациях. У 27 пациентов определено повышение уровня холестерина, в 17 случаях повышение липопротеинов низкой плотности. У 24 человек в анамнезе курение табака. 32 человека в «трейновой» выборке регулярно испытывают психоэмоциональные перегрузки. Злоупотребление алкоголем выявлено у 3 человек. 32 человека с низкой физической активностью, ведут малоподвижный образ жизни. 24 человека повышенного питания.
РЕЗУЛЬТАТЫ
На вход нейронной сети одновременно поступали изображения ЭКГ размером 200, 200, 1 и структурированные табличные данные. На выходе нейронная сеть прогнозировала мультиуровневые значения пораженных коронарных значений в вероятностном виде.
В качестве слоев нейронной сети для обработки изображений были взяты полносвязные, сверточные, батч-
нормализирующие (слой пакетной нормализации), dropout (слой исключения). Для обработки структурированных данных взяты только полносвязные слои. Внутри нейронной сети использовался связывающий concatenate layer (объединяющий слой) для обобщения весов изображения и набора данных (датасета). После обобщающего слоя следуют 2 полносвязных слоя. Выходной слой состоит из 13 нейронов для предсказаний по каждому параметру. В качестве оптимизатора взят Adam (алгоритм оптимизации адаптивной скорости обучения путем вычисления экспоненциального скользящего среднего градиента и квадратичного градиента), лосс-функция - бинарная кросс-энтропия.
Обучение производилось на 100 эпохах (1 эпоха -1 прямой и 1 обратный проход всех обучающих примеров). Размер батча (количества обучающих примеров за одну итерацию) - 8, размер валидационной выборки 0,1. Подбор параметров и структуры нейронной сети проведен опытным путем. В качестве отправной метрики для оценки качества модели выбрана AUC (площадь под ROC-кривой).
На тестовой выборке, состоящей из 20 пациентов со сложной патологией КА, результат AUC составил 0,74, точность - 80%, чувствительность - 63%, специфичность -88%.
ОБСУЖДЕНИЕ
В современной медицине принятие решений -сложный процесс, который базируется на объективных и надежных доказательствах, непосредственном доступе к знаниям, а также на правильной интерпретации имеющихся данных с учетом соотношения риска и пользы для пациента. Важным аспектом лечения больных стало предсказание вероятности сердечно-сосудистого события на относительно длительный период времени. Эпидемиологические исследования, используемые для получения
таких прогностических моделей, часто содержат сотни или тысячи переменных. Именно в этом контексте методы ML могут быть полезны в качестве средства выявления наилучших предикторов из большого числа фенотипи-ческих данных.
Ежегодно трудами исследователей появляется большое количество моделей оценки сердечно-сосудистого риска. Большинство моделей основаны на данных рандомизированных клинических и регистровых исследований. Однако только небольшая часть моделей используется в реальной клинической практике. Очевидно, что вместо создания очередной нежизнеспособной модели необходим качественно иной подход. В проведенном исследовании использовали относительно небольшое количество данных: 22 признака, ЭКГ-изображение, полученные у 120 больных. В связи с этими была построена архитектура нейронной сети с небольшим количеством параметров.
Результат мультиуровневой классификации предполагаемых поражений по каждой магистральной КА выбранной архитектурой нейронной сети показал диагностическую чувствительность 63% и специфичность 88% при хорошем качестве модели (AUC=0,74). Созданная модель нейро-сетевого анализа позволяет с достаточно высокой вероятностью прогнозировать поражение магистральных КА.
ЗАКЛЮЧЕНИЕ
Нейросетевой анализ подготовленных клинических, лабораторных и инструментальных данных позволяет настроить параметры сети для последующего прогнозирования поражения магистральных КА. Обученная нами нейронная сеть прогнозирует поражение магистральных КА с чувствительностью 63%, специфичностью 88%, AUC 0,74. Полученные результаты в виде оценки AUC score позволяют говорить о работоспособности метода в диагностике патологии магистральных КА.
СВЕДЕНИЯ ОБ АВТОРАХ
Абдуалимов Тимур Пулатович (Timur P. Abdualimov)* - врач-кардиолог ООО ММЦ «СОГАЗ», Санкт-Петербург, Российская Федерация E-mail: [email protected] https://orcid.org/0000-0002-3158-8500
Обрезан Андрей Григорьевич (Andrey G. Obrezan) - доктор медицинских наук, профессор, заведующий кафедрой госпитальной терапии медицинского факультета Санкт-Петербургского государственного университета, главный врач группы клиник «СОГАЗ МЕДИЦИНА», Санкт-Петербург, Российская Федерация E-mail: [email protected] https://orcid.org/0000-0001-6115-7923
ЛИТЕРАТУРА
1. Бойцов С.А., Демкина А.Е., Ощепкова Е.В., Долгушева Ю.А. Достижения и проблемы практической кардиологии в России на современном этапе // Кардиология. 2019. Т. 59, № 3. С. 53-59. DOI: https://www.doi.Org/10.18087/cardio.2019.3.10242
2. Al'Aref S.J., Singh G, van Rosendael A.R., Kolli K.K., Ma X., Mali-akal G., Pandey M., Lee B.C., Wang J., Xu Z., Zhang Y., Min J.K., Wong S.C.,
* Автор для корреспонденции.
Minutello R.M. Determinants of In-Hospital Mortality After Percutaneous Coronary Intervention: A Machine Learning // J. Am. Heart Assoc. 2019. Vol. 8. P. e011160. DOI: https://www.doi.org/10.1161/ JAHA.118.011160
3. Kakadiaris I.A., Vrigkas M., Yen A.A., Kuznetsova T., Budoff M., Na-ghavi M. Machine Learning Outperforms ACC/AHA CVD Risk Calculator in
MESA // J. Am. Heart Assoc. 2018. Vol. 7. P. e009476. DOI: https://www. doi.org/10.1161/JAHA.118.009476
4. Alaa A.M., Bolton T., Di Angelantonio E., Rudd J.H.F., van der Schaar M. Cardiovascular disease risk prediction using automated machine learning: A prospective study of 423,604 UK Biobank participants // PLoS One. 2019. Vol. 14, N 5. P. e0213653. DOI: https://www.doi.org/10.1371/ journal.pone.0213653
5. Ambale-Venkatesh B., Yang X., Wu C.O., Liu K., Hundley W.G., McClelland R., Gomes A.S., Folsom A.R., Shea S., Guallar E., Bluemke D.A., Lima J.A.C. Cardiovascular Event Prediction by Machine Learning: The Multi-Ethnic Study of Atherosclerosis // Circ Res. 2017. Vol. 121, N 9. P. 1092-1101. DOI: https://www.doi.org/10.1161/CIRCRE-SAHA.117.311312
REFERENCES
1. Boytsov S.A., Demklna A.E., Oshchepkova E.V., Dolgusheva Yu.A. Progress and Problems of Practical Cardiology in Russia at the Present Stage. Kardiologiia [Cardiology]. 2019; 59 (3): 53-9. DOI: https://doi. org/10.18087/cardio.2019.3.10242 (in Russian)
2. Al'Aref S.J., Singh G, van Rosendael A.R., Kolli K.K., Ma X., Mali-akal G., Pandey M., Lee B.C., Wang J., Xu Z., Zhang Y., Min J.K., Wong S.C., Minutello R.M. Determinants of In-Hospital Mortality After Percutaneous Coronary Intervention: A Machine Learning. Journal of the American Heart Association. 2019; 8: e011160. DOI: https://www.doi.org/10.1161/ JAHA.118.011160
3. Kakadiaris I.A., Vrigkas M., Yen A.A., Kuznetsova T., Budoff M., Na-ghavi M. Machine Learning Outperforms ACC/AHA CVD Risk Calculator in
MESA. Journal of the American Heart Association. 2018; 7: e009476. DOI: https://www.doi.org/10.1161/JAHA.118.009476
4. Alaa A.M., Bolton T., Di Angelantonio E., Rudd J.H.F., van der Schaar M. Cardiovascular disease risk prediction using automated machine learning: A prospective study of 423,604 UK Biobank participants. PLoS One. 2019; 14 (5): e0213653. DOI: https://www.doi.org/10.1371/ journal.pone.0213653
5. Ambale-Venkatesh B., Yang X., Wu C.O., Liu K., Hundley W.G., McClelland R., Gomes A.S., Folsom A.R., Shea S., Guallar E., Bluemke D.A., Lima J.A.C. Cardiovascular Event Prediction by Machine Learning: The Multi-Ethnic Study of Atherosclerosis. Circ Res. 2017; 121 (9): 1092-101. DOI: https://www.doi.org/10.1161/CIRCRESAHA.117.311312