Научная статья на тему 'ОЦЕНКА ВЛИЯНИЯ РАЗЛИЧНЫХ НЕАРХИТЕКТУРНЫХ ИЗМЕНЕНИЙ ПРЕДСКАЗАТЕЛЬНОЙ МОДЕЛИ НА КАЧЕСТВО КЛАССИФИКАЦИИ ЭКГ'

ОЦЕНКА ВЛИЯНИЯ РАЗЛИЧНЫХ НЕАРХИТЕКТУРНЫХ ИЗМЕНЕНИЙ ПРЕДСКАЗАТЕЛЬНОЙ МОДЕЛИ НА КАЧЕСТВО КЛАССИФИКАЦИИ ЭКГ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
215
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАССИФИКАЦИЯ ЭКГ / СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ / ГЛУБОКОЕ ОБУЧЕНИЕ / ШУМОПОДАВЛЕНИЕ / САМОАДАПТИВНОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ананьев В.В., Скорик С.Н., Шаклеин В.В., Аветисян А.А., Терегулов Ю.Э.

Запись и расшифровка электрокардиограммы в 12 отведениях является наиболее распространенной процедурой для определения сердечных заболеваний. В последнее время предлагаются различные методы машинного обучения для автоматической постановки диагноза по электрокардиограмме. Их задача - предоставить второе мнение для врача и помочь обнаружить патологию на ранней стадии. В статье рассматриваются методы улучшения качества автоматического определения патологий по ЭКГ: добавление метаданных пациента, уменьшение шума электрокардиограммы и самоадаптивное обучение. Также представлены результаты экспериментального исследования влияние различных ЭКГ отведений, значимости длины электрокардиограммы и объема обучающей выборки на результаты работы алгоритмов. Проведенные эксперименты показывают релевантность описываемых подходов, а также предлагают оптимальную оценку параметров входных данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ананьев В.В., Скорик С.Н., Шаклеин В.В., Аветисян А.А., Терегулов Ю.Э.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ASSESSMENT OF THE IMPACT OF NON-ARCHITECTURAL CHANGES IN THE PREDICTIVE MODEL ON THE QUALITY OF ECG CLASSIFICATION

Recording and analyzing 12-lead electrocardiograms is the most common procedure for detecting heart disease. Recently, various deep learning methods have been proposed for the automatic diagnosis by an electrocardiogram. The proposed methods can provide a second opinion for the doctor and help detect pathologies at an early stage. Various methods are proposed in the paper to improve the quality of prediction of ECG recording pathologies. Techniques include adding patient metadata, ECG noise reduction, and self-adaptive learning. The significance of data parameters in training a classification model is also explored. Among the considered parameters, the influence of various ECG leads, the length of the electrocardiogram and the volume of the training sample is studied. The experiments carried out show the relevance of the described approaches and offer an optimal estimate of the input data parameters.

Текст научной работы на тему «ОЦЕНКА ВЛИЯНИЯ РАЗЛИЧНЫХ НЕАРХИТЕКТУРНЫХ ИЗМЕНЕНИЙ ПРЕДСКАЗАТЕЛЬНОЙ МОДЕЛИ НА КАЧЕСТВО КЛАССИФИКАЦИИ ЭКГ»

DOI: 10.15514/ISPRAS-2021-33(4)-7

Оценка влияния различных неархитектурных изменений предсказательной модели на качество классификации ЭКГ

1'2 В.В. Ананьев, ORCID: 0000-0002-5070-8117 <novisp53@ispras.ru>

3 С.Н. Скорик, ORCID: 0000-0002-8316-7302 <skorik@ispras.ru> 2В.В. Шаклеин, ORCID: 0000-0002-4239-0807 <shaklein@ispras.ru> 4 А.А. Аветисян, ORCID: 0000-0002-7066-6954 <a.a.avetisyan@ispras.ru> 5-6-7 Ю.Э. Терегулов, ORCID: 0000-0001-9120-142X <tereg2@mail.ru> 1-4Д.Ю. Турдаков, ORCID: 0000-0001-8745-0984 <turdakov@ispras.ru> 8 В. Глинер, ORCID: 0000-0003-2900-3291 <vadim.gliner@gmail.com> 8 А. Шустер, ORCID: 0000-0002-3311-6937 <assaf@technion.ac.il> 1 Е.А. Карпулевич, ORCID: 0000-0002-6771-2163 <karpulevich@ispras.ru> 1 Институт системного программирования им. В.П. Иванникова РАН, 109004, Россия, г. Москва, ул. А. Солженицына, д. 25 2 Новгородский Государственный Университет им. Ярослава Мудрого, 173003, Россия, г. Великий Новгород, ул. Большая Санкт-Петербургская, д. 41

3Московский физико-технический институт, 141700, Россия, Московская область, г. Долгопрудный, Институтский пер., 9 4Московский государственный университет имени М.В. Ломоносова, 119991, Россия, Москва, Ленинские горы, д. 1.

5 Казанский государственный медицинский университет, 420012, Россия, Республика Татарстан, г. Казань, ул. Бутлерова, д. 49. 6Казанская государственная медицинская академия - филиал РМАНПО МЗ РФ, 420012, Россия, Республика Татарстан, г. Казань, ул. Бутлерова, д. 36.

7 Республиканская клиническая больница МЗ РТ, 420064, Россия, Республика Татарстан, г. Казань, Оренбургский тракт, д. 138.

8 Факультет компьютерных наук, Технион, 3200003, Израиль, г. Хайфа

Аннотация. Запись и расшифровка электрокардиограммы в 12 отведениях является наиболее распространенной процедурой для определения сердечных заболеваний. В последнее время предлагаются различные методы машинного обучения для автоматической постановки диагноза по электрокардиограмме. Их задача - предоставить второе мнение для врача и помочь обнаружить патологию на ранней стадии. В статье рассматриваются методы улучшения качества автоматического определения патологий по ЭКГ: добавление метаданных пациента, уменьшение шума электрокардиограммы и самоадаптивное обучение. Также представлены результаты экспериментального исследования влияние различных ЭКГ отведений, значимости длины электрокардиограммы и объема обучающей выборки на результаты работы алгоритмов. Проведенные эксперименты показывают релевантность описываемых подходов, а также предлагают оптимальную оценку параметров входных данных.

Ключевые слова: классификация ЭКГ; сверточная нейронная сеть; глубокое обучение; шумоподавление; самоадаптивное обучение

Для цитирования: Ананьев В.В., Скорик С.Н., Шаклеин В.В., Аветисян А.А., Терегулов Ю.Э., Турдаков Д.Ю., Глинер В., Шустер А., Карпулевич Е.А. Оценка влияния различных неархитектурных изменений предсказательной модели на качество классификации ЭКГ. Труды ИСП РАН, том 33, вып. 4, 2021 г., стр. 87-98. DOI: 10.15514/ISPRAS-2021-33(4)-7

Благодарности: Исследование выполнено при финансовой поддержке РФФИ и МНТИ в рамках научного проекта № 19-57-06004

Assessment of the impact of non-architectural changes in the predictive model on the quality of ECG classification

1,2 V.V. Ananev, ORCID: 0000-0002-5070-8117 <novisp53@Jspras.ru>

3 S.N. Skorik, ORCID: 0000-0002-8316-7302 <skorik@ispras.ru> 2 V.V. Shaklein, ORCID: 0000-0002-4239-0807 <shaklein@jspras.ru> 4A.A. Avetisyan, ORCID: 0000-0002-7066-6954 <a.a.avetisyan@Jspras.ru>

5A7 Y.E Teregulov, ORCID: 0000-0001-9120-142X <tereg2@mail.ru> MD.Yu. Turdakov, ORCID: 0000-0001-8745-0984 <turdakov@jspras.ru> 8 V. Gliner, ORCID: 0000-0003-2900-3291 <vadim.gliner@gmail.com> 8A. Schuster, ORCID: 0000-0002-3311-6937 <assaf@technion.ac.il> 1 E.A. Karpulevich, ORCID: 0000-0002-6771-2163 <karpulevich@ispras.ru>

1 Ivannikov Institute for System Programming of the RAS, 25, Alexander Solzhenitsyn Str., Moscow, 109004, Russia

2 Yaroslav-the-Wise Novgorod State University, 173003, Russia, Veliky Novgorod, st. Bolshaya St. Petersburg, 41

3 Moscow Institute of Physics and Technology, 9, Institutskiyper., Dolgoprudniy, 141701, Russia

4 Lomonosov Moscow State University, GSP-1, Leninskie Gory, Moscow, 119991, Russian Federation 5 Kazan State Medical University, 49, Butlerova Str., Kazan, Republic of Tatarstan, 420012, Russian Federation 6 Kazan State Medical Academy - Branch Campus of the RMACPE MOH Russia, 36, Butlerova Str., Kazan, Republic of Tatarstan, 420012, Russian Federation 7 Republican Clinical Hospital of the Ministry of Health of the Republic of Tatarstan, 138, Orenburgskiy trakt, Kazan, Republic of Tatarstan, 420064, Russian Federation 8 Computer Science Department, Technion-IIT, Haifa, 3200003, Israel

Abstract. Recording and analyzing 12-lead electrocardiograms is the most common procedure for detecting heart disease. Recently, various deep learning methods have been proposed for the automatic diagnosis by an electrocardiogram. The proposed methods can provide a second opinion for the doctor and help detect pathologies at an early stage. Various methods are proposed in the paper to improve the quality of prediction of ECG recording pathologies. Techniques include adding patient metadata, ECG noise reduction, and self-adaptive learning. The significance of data parameters in training a classification model is also explored. Among the considered parameters, the influence of various ECG leads, the length of the electrocardiogram and the volume of the training sample is studied. The experiments carried out show the relevance of the described approaches and offer an optimal estimate of the input data parameters.

Keywords: ECG Classification; Convolutional Neural Network; Deep Learning; Denoising; Self-Adaptive Learning

For citation: Ananev V.V., Skorik S.N., Shaklein V.V., Avetisyan A.A., Teregulov Y.E, Turdakov D.Y, Gliner V., Schuster A., Karpulevich E.A. Assessment of the impact of non-architectural changes in the predictive model on the quality of ECG classification. Trudy ISP RAN/Proc. ISP RAS, vol. 32, issue 4, 2021. pp. 87-98 (in Russian). DOI: 10.15514/ISPRAS-2020-32(2)-7

Acknowledgments: The reported study was funded by RFBR and MOST according to the research project № 19-57-06004

1. Введение

Общепринятая процедура для диагностики сердечных патологий — электрокардиография в 12 отведениях. Снятая электрокардиограмма представляет собой кривые, которые отражают изменение биоэлектрических потенциалов, генерируемых мыш-цами работающего сердца, во времени. 12 отведений ЭКГ принято делить на две группы:

• 6 отведений от конечностей: 3 униполярных (I, II, III) и 3 биполярных (aVR, avL, aVF);

• 6 грудных отведений (V1, V2, V3, V4, V5, V6).

Несмотря на больше количество работ, посвященных построению эффективных алгоритмов автоматической классификации электрокардиограмм, эта проблема по-прежнему остается актуальной. Модели, основанные на вручную созданных методах извлечения признаков, могут не учитывать скрытые зависимости, необходимые для более точной классификации. В то же время модели глубоких нейронных сетей не требуют человеческих знаний о предметной области, в которой они применяются и могут быть обучены независимо от них, выделяя наиболее важные закономерности в сигналах для извлечения признаков или классификации. Глубокие нейронные сети были впервые использованы для классификации ЭКГ относительно недавно, но они сразу же показали многообещающие результаты, продемонстрировав качество распознавания некоторых патологий, сопоставимое с человеческим. Тем не менее, такие модели чувствительны к типу входного сигнала, качеству и количеству разметки, а также к различным метаданным.

В представленной статье мы рассматриваем неархитектурные способы улучшения качества классификации ЭКГ с использованием глубокой нейронной сети. В статье рассматриваются такие способы, как включение метаданных пациента, устранение шума и обучение самоадаптивной модели. Поставлены различные эксперименты, оценивающие важность различных параметров для обучения модели, таких как длина ЭКГ записи, количество и выбор отведений, объем обучающей выборки. Эксперименты, проведенные на полученных объемах данных, свидетельствуют о релевантности предложенных методов и важности выбора параметров обучения.

2. Обзор существующих решений

В этом разделе кратко описываются недавно появившиеся алгоритмы классификации ЭКГ. Широкое распространение цифровых систем диагностики здоровья привело к накоплению больших массивов медицинских данных и, как следствие, к возможности улучшения существующих систем автоматической диагностики за счет использования нейронных сетей [1] [2].

Для решения задачи классификации электрокардиограмм были предложены различные архитектуры глубоких нейронных сетей. Например, в [3] рекуррентные нейронные сети использовались для распознавания аритмий. В работе сравнивались архитектуры на основе долгой краткосрочной памяти (LSTM) и управляемых рекуррентных блоков (GRU). В качестве входных данных использовался сигнал только одного отведения. Кроме того, авторы ограничились задачей бинарной классификации. Рекуррентная нейронная сеть на базе LSTM также использовалась в качестве алгоритма для извлечения глобальных признаков [4]. В [5] распознавание аритмий осуществлялось с помощью вероятностной нейронной сети (PNN). На вход ей подавался вектор признаков, полученный с помощью цифровой обработки сигнала, которая состояла из вейвлет-преобразования, детектирования R-пика, QRS-комплекса, а также P и T волн. В [6] классифицировались только три типа сердечных ритмов и для них использовалась нейронная сеть с многослойным персептроном (MLP NN). На вход

ей также подавался вектор признаков, однако помимо обработки сигналов и извлечения признаков в работе также использовался независимый компонентный анализ (ICA) для понижения размерности. Вектор признаков подавался и на вход двойной полносвязной нейронной сети [7]. Применение такой архитектуры было обусловлено борьбой с несбалансированностью четырех классов. Они были разделены на две группы и первая нейронная сеть училась определять сигнал в одну из этих групп. Вторая нейронная сеть использовалась для классификации сигнала внутри первой группы. Внутри второй группы классификация проводилась с помощью оценки RR-интервала.

Проблема несбалансированности классов является типичной для электрокардиографии и вызывает трудности, связанные с обучением нейронных сетей. Одним из способов преодоления дисбаланса являются классические методы увеличения данных, таких как сдвиги, повороты изображения вдоль горизонтальной или вертикальной осей, вращение, которые стали важным шагом в задачах компьютерного зрения [8]. Однако такие преобразования могут нарушить зависимость между некоторыми признаками в сигналах, что отрицательно скажется на качестве этих данных. Алгоритм SMOTE (Synthetic Minority Oversampling Technique) также является методом увеличения количества примеров в наименее распространенных классах, однако в отличие от классических приемов аугментации, SMOTE создает «близкие» к исходным примеры, которые не являются преобразованием какого-то одного сигнала и не нарушают зависимость между признаками. Такие примеры являются промежуточными, между двумя соседними в наборе данных. Этот алгоритм использовался, например, в [9] и [10]. Тем не менее, алгоритм SMOTE никак не учитывает плотность распределения менее распространенных классов. Если они равномерно с низкой плотностью распределены в мажоритарных классах, то SMOTE нарушит это распределение.

Впрочем, существуют генеративные модели, которые учатся восстанавливать такое распределение и по нему синтезировать новые примеры. Одним из видов генеративных моделей являются генеративно-состязательные сети (GAN), которые показали свою эффективность при синтезе изображений в нескольких областях [11]. Так в работе [12] показали, что сигналы, синтезированные с помощью генеративно-состязательных сетей вносят больший вклад в качество классификации, чем другие распространенные методы увеличения данных.

Наиболее часто используемой для классификации ЭКГ архитектурой глубокой нейронной сети является сверточная нейронная сеть (CNN), так как CNN действуют одновременно как алгоритм извлечения признаков и как классификатор. Для обнаружения фибрилляции предсердий Ся (Yong Xia) и др. [13] используют двумерные сверточные сети для классификации электрокардиограмм по спектрограммам, полученным с по-мощью оконного преобразования Фурье или дискретного вейвлет-преобразования. Глинер (Vadim Gliner) и др. [14] предложили две разные архитектуры CNN, одну, обученную с использованием цифровых сигналов, а другую с помощью изображений. Эти методы показали высокие результаты в выявлении фибрилляции предсердий (AF).

В [15] и [16] CNN применялись непосредственно к сигналу ЭКГ. Наборы данных, используемые в этих статьях, были значительно больше, чем во всех ранее упомянутых наборах, поскольку они не являются общедоступными. В рамках исследования [15] был получен набор записей ЭКГ в одном отведении. Собранные данные были аннотированы сертифицированными кардиологами. Затем, одномерная CNN с остаточными блоками была обучена предсказывать тип ритма каждые 1.21 секунды на основе соответствующего сигнала ЭКГ без предварительной обработки.

Рибейро (Antônio H. Ribeiro) и др. [16] использовали данные системы теледиагностического мониторинга ЭКГ. Использованная выборка состояла из 2 470 424 записей ЭКГ в 12 отведениях, что соответствует 1 676 384 пациентам. Как и в [15], модель представляет собой

одномерную CNN с остаточными блоками. Обученная в этом исследовании модель достигла более высокого качества классификации патологий, чем человек, для некоторых из рассматриваемых патологий.

В работе [17] проводится ряд результатов сравнительного анализа недавно опубликованного набора данных PTB-XL, охватывающих различные задачи машинного обучения для ЭКГ. Важно отметить, что авторы коснулись сравнения различных архитектур нейронных сетей для задачи классификации ЭКГ и предоставили исходный код для их тестирования в общий доступ. Текущая работа построена на их реализации архитектуры нейронной сети resnet1d50.

3. Методология 3.1 Модель

Для классификации ЭКГ использовалась сверточная нейронная сеть с остаточными блоками resnet1d50, адаптированная для работы с одномерными данными (сигнал ЭКГ в исходном виде). Модель была разработана с использованием фреймворка Pytorch, на основе реализации, представленной в [17]. Архитектура модели представлена на рис. 1.

Рис. 1. Архитектура нейронной сети. Conv - операция одномерной свертки, BN - батч-нормализация, ReLU - функция нелинейности, Drop - операция исключения, MaxPool - объединение по функции максимума, Lin - полносвязный линейный слой, Concat - конкатенация векторов Fig. 1. The neural network architecture. Conv - unidimensional convolution operation, BN - batch normalization, ReLU - nonlinearity function, Drop - dropout operation, MaxPool - pooling by the maximum function, Lin - fully connected linear layer, Concat - vector concatenation, Sigm - element-wise sigmoid

function

В качестве входных данных для модели выступают ЭКГ в 12 отведениях, представленные в виде матрицы 10000x12, а также метаданные (возраст пациента в виде натурального числа от 18 до 96). 10000 - это количество измерений, которое соответствует 10 секундам записи при частоте дискретизации 1000 Гц. В наборе данных также были представлены данные с

частотой ниже 1000 Гц. Для таких данных была проведена процедура передискретизации к частоте 1000 Гц. Чтобы уменьшить влияние некорректно размеченных образцов ЭКГ на процесс обучения, была реализована недавно предложенная техника самоадаптивного обучения [18]. Обученная модель позволяет предсказывать наличие на ЭКГ патологий следующих классов: желудочковые экстрасистолы (PVC), синусовая брадикардия (SBRAD), синусовая тахикардия (STACH), блокада левой ножки пучка Гиса (LBBB), блокада правой ножки пучка Гиса (RBBB), фибрилляция предсердий (AFIB). Выходные данные модели представлены в виде набора значений в интервале (0, 1), где каждое значение показывает вероятность присутствия соответствующей патологии на рассматриваемой ЭКГ.

3.2 Данные

Набор данных, содержащий записи ЭКГ в 12 отведениях, используемых в этой работе, был получен от ООО «Телемедицинские информационные системы». Данные были собраны с разных географических точек Татарстана с помощью телемедицинской системы и размечены более 200 врачами Татарстана в режиме обследования. Полезной особенностью системы сбора данных является стандартизованная классификация патологий с применением дерева патологий, что облегчает работу с данными. Распределение ЭКГ по исследуемым патологиям (п. 3.1) представлено на рис. 2.

STACH LBBB RBBB 5BRAD AFIB PVC

Рис. 2. Распределение образцов ЭКГ по классам. Число на пересечение i-й строки и j-го столбца соответствует количеству записей, в которых одновременно представлены i-я и j-я патологии, i-е

число на диагонали обозначает общее количество записей, соответствующих i-ой патологии Fig. 2. Distribution of ECG samples by class. The number at the intersection of the i-th row and j-th column corresponds to the number of records in which the i-th and j-th pathologies are simultaneously represented, the i-th number on the diagonal indicates the total number of records corresponding to the i-th pathology Длина каждой записи в наборе варьируется от 4 до 69 секунд. Для экспериментов были отобраны сигналы длиной 10 секунд, а также более длительные записи, которые нарезались на 10 секундные отрезки. В результате было получено 74931 анонимизированных записей ЭКГ, соответствующих пациентам в возрасте от 18 лет. Распределение записей по возрасту пациентов приведено на рис. 3.

На многих записях присутствуют помехи в виде «блуждающей изолинии». Для того чтобы скорректировать изолинию, каждая запись была предварительно обработана методом локально-взвешенного сглаживания LOWESS.

° 2 8000 | I

Ijmoo

-И ЛЛ

р : lidll Ii.

20 30 40 50 60 70 80 90 100 age

Рис. 3. Распределение записей ЭКГ по возрасту пациентов Fig. 3. Distribution of ECG records by age of patients

4. Эксперименты

В разделе описаны эксперименты, оценивающие влияние различных неархитектурных изменений модели на качество предсказания. В поставленных экспериментах изучается зависимость качества классификации от предобработки сигнала, количества отведений, длины записи, объема обучающей выборки и использования техники самоадаптивного обучения. В большинстве представленных экспериментов была проведена 5-кратная перекрестная проверка. В качестве показателей эффективности классификации были выбраны: площадь под ROC-кривой (ROC-AUC), средняя точность (AP) и F-мера (F1-score).

Рис. 4. Зависимость показателей метрик качества от методологии, используемой для классификации ЭКГ. (a) - усредненные по классам; (b) - для каждого класса. baseline - исходная модель (resnet1d50) с необработанными сигналами в качестве входных данных, PREP - предварительная обработка сигналов (LOWESS), MET -включение метаданных в модель, SELFAD - техника самоадаптивного обучения Fig. 4. Dependence of quality metrics indicators on the methodology used for ECG classification. (a) - class averaged; (b) - for each class. baseline - original model (resnet1d50) with raw signals as input, PREP - signal preprocessing (LOWESS), MET -including metadata in the model, SELFAD - self-adaptive learning technique

4.1 Зависимость качества классификации от методов предобработки данных

В процессе изучения подходов к улучшению качества классификации, которые не затрагивают архитектуру модели, был проведен эксперимент, в котором сравнивались модели с различными входными данными и разметкой. Для эксперимента были отобраны 5 моделей:

• модель resnet1d50 с необработанными ЭКГ в качестве входных данных;

• модель с предварительно обработанными ЭКГ (метод LOWESS);

• модель с предварительно обработанными ЭКГ + метаданные (возраст пациента);

• модель с предварительно обработанными ЭКГ + техника самоадаптивного обучения;

• модель с предварительно обработанными ЭКГ + метаданные + техника самоадаптивного

обучения.

Положительная динамика изменения метрик качества (рис. 4) свидетельствует о том, что использование предложенных методов позволяет повысить качество классификации. Эксперименты показали, что предобработка ЭКГ сигнала и техника самоадаптивного обучения модели улучшают качество работы модели. При этом выяснилось, что добавление возраста пациента не дает существенного прироста качества для рассматриваемых патологий (см. 3.1).

4.2 Зависимость качества классификации от размеров обучающей выборки

Важную роль в машинном обучении играет размер обучающей выборки. Для изучения его влияния был поставлен эксперимент, в котором модель PREP обучалась на различных объемах данных. Чтобы более объективно отразить зависимость качества классификации от размера выборки, вместо использования 5-кратной перекрестной проверки, набор данных был поделен на непересекающиеся множества тренировочной, валидационной и тестовой выборки. Далее из тренировочной выборки отбиралась некоторая часть, на которой производилось обучение модели.

Рис. 5. Зависимость метрик качества от размера использованной обучающей выборки выраженного в долях от 75 тысяч образцов (максимально доступный размер обучающей выборки на кросс-валидации). (a) - усредненные по классам; (b) - для каждого класса Fig. 5. Dependence of quality metrics on the size of the used training sample expressed in fractions of 75 thousand samples (the maximum available size of the training sample for cross-validation). (a) - class

averaged; (b) - for each class

По графикам (рис. 5) видно, что качество классификации снижается при умень-шением размера обучающей выборки, но данная зависимость имеет нелинейный характер. Отсюда можно сделать следующие выводы.

• Дополнение тренировочной выборки новыми образцами потенциально пр-ведет к

дальнейшему улучшению качества классификации некоторых патологий(PVC, LBBB, RBBB, SBRAD), в то время как для других патологий^ТАСН, АЕШ) при использовании размера обучающей более 45% наблюдается ситуация с выходом на плато.

• Для более быстрого подбора гиперпараметров можно использовать 45% от объема

имеющейся тренировочной выборки.

4.3 Зависимость качества классификации от длины входного сигнала

Еще одним фактором, влияющим на качество классификации, является длина входного сигнала, используемого при тренировке. В связи с этим был проведен эксперимент с варьированием длины входного сигнала ЭКГ при обучении модели. В рамках эксперимента длина сигнала варьировалась в соответствии с сеткой [2, 4, 6, 8, 10] секунд. Стоит отметить, что длина сигналов в тестовой выборке при этом оставалась равной 10 секундам, что позволяет проводить прямое сравнение результатов с другими экспериментами. По результатам эксперимента (см. рис. 6) можно сделать вывод, что среди патологий из п. 3.1 существенную зависимость от длины сигнала на этапе тренировки имеет только PVC. Качество классификации остальных патологий выходит на плато при тренировке на сигналах длиной более 4 секунд.

Рис. 6. Зависимость метрик качества от длины входного сигнала. (a) - усредненные по классам; (b) -

для каждого класса

Fig. 6. Dependence of quality metrics on the length of the input signal. (a) - class averaged; (b) - for each

class

4.4 Зависимость качества классификации от набора отведений

В рамках представленного исследования было изучено влияние различных наборов отведений на качество предсказания выбранных патологий. Оценка характера зависимости качества классификации от количества отведений на ЭКГ проводилась по методологии схожей с методологией, использованной в 4.1. В эксперименте рассматривается 5 наборов отведений:

• I, II;

• I, II, V1;

• V1, V2, V3, V4, V5, V6;

• I, II, III, aVL, aVR, aVF, V1;

• I, II, V1, V2, V3, V4, V5, V6;

Результаты эксперимента (рис. 7) показывают, что при использовании комбинаций 'three_lead' и 'eight_lead' достигается наибольшее значение метрик качества. Модели 'two_lead' и 'six_lead', которые предсказывают патологии только по отведениям на конечностях и грудным отведениям соответственно, уступают по качеству другим представленным моделям. Для более высокого качества классификации ЭКГ по выбранным патологиям необходимо изучать и грудные отведения, и отведения на конечностях. Использование комбинации 'three_lead' для рассматриваемых патологий позволяет существенно сократить объем входных данных, и, как следствие, ускорить процесс обучения модели, без существенных потерь в качестве.

Рис. 7: Зависимость метрик качества от использованного набора отведений. (a) - усредненные по классам; (b) - для каждого класса. 'twolead' - отведения I, II; 'threelead' - отведения I, II, V1; 'sixlead' - отведения V1, V2, V3, V4, V5, V6; 'sevenlead' - отведения I, II, III, aVL, aVR, aVF, V1;

'eightlead' - отведения I, II, V1, V2, V3, V4, V5, V6 Fig. 7: Dependence of quality metrics on the set of leads used. (a) - class averaged; (b) - for each class. 'Two lead' - leads I, II; 'Three lead' - leads I, II, V1; 'Six lead' - leads V1, V2, V3, V4, V5, V6; 'Seven lead' - leads I, II, III, aVL, aVR, aVF, V1; 'Eight lead' - Leads I, II, V1, V2, V3, V4, V5, V6

5. Заключение

В представленной статье были предложены методы улучшения классификации ЭКГ по патологиям, не меняющие архитектуру модели. Кроме того, было оценено влияние формата данных обучаемой модели на качество предсказания. Эксперименты, проведенные на большом наборе данных, доказали релевантность предложенных методов и предложили оптимальные значения параметров входных данных, таких как длина ЭКГ записи, выбор отведений для предсказания и объем обучающей выборки. Предложенные оценки формата данных и неизменяемые архитектуру подходы, которые улучшают качество классификации, дают возможность применять их в других глубоких нейронных сетях.

Список литературы / References

[1] V. Gulshan, L. Peng et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs. Jama, vol. 316, issue 22, 2016, pp. 2402-2410.

[2] A. Esteva, B. Kuprel et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature, vol. 542, issue 7639, 2017, pp. 115-118.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[3] S. Singh, S.K. Pandey et al. Classification of ecg arrhythmia using recurrent neural networks. Procedia computer science, vol. 132, 2018, pp. 1290-1297.

[4] T. Teijeiro, C. A. Garcia et al. Arrhythmia classification from the abductive interpretation of short single-lead ecg records. In Proc. of the 2017 Computing in Cardiology (CinC), 2017, pp. 1-4.

[5] J.A. Gutierrez-Gnecchi, R. Morfin-Magana et al. Dsp-based arrhythmia classification using wavelet transform and probabilistic neural network. Biomedical Signal Processing and Control, vol. 32, 2017, pp. 44-56.

[6] M. Ramkumar, C.G. Babu et al. ECG cardiac arrhythmias classification using DWT, ICA and MLP neural networks. Journal of Physics: Conference Series, vol. 1831, 2021, article no. 012015.

[7] H. Wang, H. Shi et al. A high-precision arrhythmia classification method based on dual fully connected neural network. Biomedical Signal Processing and Control, vol. 58, 2020, article no. 101874.

[8] A. Krizhevsky, I. Sutskever, and G.E. Hinton. Imagenet classification with deep convolutional neural networks. Advances in neural information processing systems, vol. 25, 2012, pp. 1097-1105.

[9] S. Mousavi и F. Afghah. Inter-and intra-patient ecg heartbeat classification for arrhythmia detection: a sequence to sequence deep learning approach. In Proc. of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2019, pp. 1308-1312.

[10] K. N. Rajesh и R. Dhuli. Classification of imbalanced ecg beats using re-sampling techniques and adaboost ensemble classifier. Biomedical Signal Processing and Control, vol. 41, 2018, 242-254.

[11] I. Goodfellow, J. Pouget-Abadie et al. Generative adversarial nets. Advances in neural information processing systems, vol. 27, 2014, pp. 2672-2680.

[12] A.M. Shaker, M. Tantawi et al. Generalization of convolutional neural networks for ecg classification using generative adversarial networks. IEEE Access, vol. 8, 2020, pp. 35592-35605.

[13] Y. Xia, N. Wulan et al. Detecting atrial fibrillation by deep convolutional neural networks. Computers in biology and medicine, vol. 93, 2018, pp. 84-92.

[14] V. Gliner, N. Keidar et al. Automatic classification of healthy and disease conditions from images or digital standard 12-lead electrocardiograms. Scientific Reports, vol. 10, issue 1, 2020, pp. 1-12.

[15] A.Y. Hannun, P. Rajpurkar et al. Cardiologist-level arrhythmia detection and classification in ambulatory electrocardiograms using a deep neural network. Nature medicine, vol. 25, issue 1, 2019, pp. 65-69.

[16] A.H. Ribeiro, M.H. Ribeiro et al. Automatic diagnosis of the 12-lead ecg using a deep neural network. Nature communications, vol. 11, issue 1, pp. 1-9.

[17] N. Strodthoff, P. Wagner, et al. Deep learning for ecg analysis: benchmarks and insights from ptb-xl. IEEE Journal of Biomedical and Health Informatics, vol. 25, issue 5, 2020, pp. 1519-1528.

[18] L. Huang, C. Zhang и H. Zhang. Self-adaptive training: beyond empirical risk minimization. Advances in neural information processing systems, vol. 33, 2020, pp. 19365-19376.

Информация об авторах / Information about authors

Владислав Валерьевич АНАНЬЕВ является выпускником и ассистентом кафедры информационных технологий и систем НовГУ, сотрудник ИСП РАН. Сфера научных интересов: анализ и разметка данных из различных сфер деятельности, глубокое обучение, компьютерное зрение и обработка изображений.

Vladislav Valerievich ANANEV is a graduate of the magistracy and assistant of the Department of Information Technologies and Systems, Novgorod State University, an employee of ISP RAS. Area of research interests: data labeling and analysis for various fields of activity, deep learning, computer vision and image processing.

Сергей Николаевич СКОРИК, студент бакалавриата МФТИ. Научные интересы: машинное обучение, методы оптимизации.

Sergej Nikolaevich SKORIK undergraduate student of Moscow Institute of Physics and Technology. Research interests: machine learning, optimization methods.

Всеволод Владиславович ШАКЛЕИН, студент бакалавриата НОВГУ. Научные интересы: машинное обучение, анализ данных.

Vsevolod Vladislavovich SHAKLEIN, undergraduate student of Novgorod State University. Research interests: machine learning, data analysis.

Арам Арутюнович АВЕТИСЯН, студент магистратуры факультета ВМК МГУ. Научные интересы: сбор данных, анализ информационных потоков в сети Интернет.

Aram Arutyunovich AVETISYAN, graduate student of the faculty of CMC at Moscow State University. Research interests: data collection, analysis of information flows on the Internet.

Юрий Эмильевич ТЕРЕГУЛОВ — доктор медицинских наук, доцент, заведующий кафедрой функциональной диагностики, доцент кафедры госпитальной терапии, заведующий отделением функциональной диагностики. Сферой научных интересов является изучение эндотелиальной дисфункции, гемодинамических особенностей артериальных гипертензий, оценка жесткости артериальной системы на основе математической модели сердечно сосудистой системы.

Yurij Emilevich TEREGULOV — D. Med. Sc., Associate Professor, Head of the Department of Functional Diagnostics, Associate Professor of the Department of Hospital Therapy. Research interests include endothelial dysfunction, hemodynamic features of arterial hypertension, assessment of the rigidity of the arterial system based on a mathematical model of the cardiovascular system

Денис Юрьевич ТУРДАКОВ - к.ф.-м.н., заведующий отделом «Информационные системы» ИСП РАН, доцент МГУ. Сфера научных интересов: машинное обучение, интеллектуальный анализ данных, извлечение информации, обработка естественного языка, сложные сети, анализ социальных сетей, большие данные.

Denis Yuryevich TURDAKOV, Ph.D. in Physics and Mathematics, Head of the Information Systems Department at ISP RAS, Associate Professor of the System Programming Department of Moscow State University. Research interests: natural language processing, machine learning, data mining, social network analysis, distributed data processing.

Вадим ГЛИНЕР, Ph.D., руководитель группы. Исследовательское интересы включают разработку и внедрение алгоритмов (комплексная цифровая обработка биосигналов, электромагнитное моделирование, алгоритмы локализации\навигации, алгоритмы искусственного интеллекта и машинного обучения), электромагнетизм и электрооптику.

Vadim GLINER, Ph.D., team leader. Research interests include algorithms development and implementation (complex digital signal processing of bio-signals and others, electromagnetic simulations, localization\navigation algorithms, artificial intelligence and machine learning algorithms), Hardware Engineering, & Physics (electromagnetism and electro-optics).

А^аф ШУСТЕР, Ph.D., профессор. Исследовательские интересы Машинное и глубокое обучение, большие данные, кибербезопасность, параллельные и распределенные вычисления.

Assaf SCHUSTER, Ph.D., Professor. Research interests: Machine and Deep Learning, Big Data, Cyber Security, Parallel and Distributed Computing,

Евгений Андреевич КАРПУЛЕВИЧ является специалистом отдела «Информацион-ные системы». Сфера научных интересов: применение алгоритмов анализа данных к биомедицинскому домену, разработку систем распределенного хранения и анализа данных.

Evgeny Andreevich KARPULEVICH is a specialist of the Information Systems Department. Research interests: application of data analysis algorithms to the biomedical domain, development of systems for distributed data storage and analysis.

i Надоели баннеры? Вы всегда можете отключить рекламу.