УДК 621.37
АЛГОРИТМ АНАЛИЗА ФОРМ КАРДИОЦИКЛОВ ЭКГ С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ1
А. К. Лагирвандзе, А. Н. Калиниченко, Т. В. Моргунова
ECG CYCLES FORMS ANALYSIS BASED ON MACHINE LEARNING TECHNIQUES
A. K. Lagirvandze, A. N. Kalinichenko, T. V. Morgunova
Аннотация. Мониторинг работы сердца и возможность своевременного обнаружения патологий в его работе считаются одними из главных задач современной медицины, поскольку заболевания сердечно-сосудистой системы являются лидирующими по распространенности среди причин смерти пациентов. Излагается разработка нейросетевого алгоритма бинарной классификации QRS-комплексов ЭКГ на формы, относящиеся к фоновому ритму («норма») и отклоняющиеся от него («патология»). В качестве методов были использованы принципы векторного преобразования сигналов, где в роли координат вектора принимаются значения каждого из отведений в отдельный момент времени. В работе были исследованы три варианта анализа классификации для повышения устойчивости алгоритма к потерям каких-либо составляющих ЭКГ-сигнала: с использованием одного, двух и трех отведений. Предварительно все отведения подвергались фильтрации от различного рода шумов с помощью сплайн-интерполяции и цифровых фильтров. Для непосредственного проведения классификации была сконструирована нейронная сеть прямого распространения с одним скрытым слоем и с использованием методов прореживания и регуляризации весов, снижающих вероятность переобучения. Результаты работы алгоритма продемонстрировали высокие показатели оценки точности. При этом наибольшая точность достигается при анализе всех трех отведений, т.е. при использовании наиболее полной информации о сигнале. Представленный в статье подход к анализу форм QRS-комплексов может быть взят за основу для разработки устойчивого алгоритма распознавания нарушений ритма сердца с помощью векторного представления сигналов ЭКГ.
Ключевые слова: электрокардиограмма, векторкардиограмма, QRS-комплекс, классификация, фильтрация сигналов, обработка сигналов, нейронные сети.
Abstract. Monitoring of the heart activity and possibility of timely detection of pathologies in its work is still considered as one of the main tasks of modern medicine, since diseases of the cardiovascular system are leading in prevalence among the causes of death. This article is devoted to the development of a neural network algorithm for binary classification of ECG QRS-complexes into forms related to the background rhythm ("normal") and deviating from it ("pathology"). The vectorized ECG signal derived from several synchronous leads was used for detection of informative features. Three variants of classification analysis were investigated to improve the algorithm stability to losses of any ECG signal components: using one, two and three leads. Previously, all leads were filtered from various types of noise using spline interpolation and digital filters. For direct classification, a neural network of direct propagation with one hidden layer and using methods of thinning and
1 Работа выполнена в рамках гранта РФФИ 19-07-00963 А.
75
regularization of weights reducing the probability of retraining was constructed. The results of the algorithm showed high accuracy rates: the highest accuracy was achieved in the case of all three leads analysis. Thus, the approach to the analysis of forms of QRS-complexes presented in the article can be taken as a basis for the development of a more stable algorithm for recognizing heart rhythm disturbances.
Keywords: electrocardiogram, vectorcardiogram, QRS-complex, classification, signal filtering, signal processing, neural networks.
Введение
На сегодняшний день большое распространение получили приборы, осуществляющие контроль за состоянием работы сердца - кардиомониторы. В таких системах первостепенным элементом анализа сердечной деятельности и анализа аритмий является обнаружение QRS-комплексов ЭКГ, а также кластеризация или классификация их форм [1]. Трудности при проведении классификации QRS-комплексов связаны с разнообразием форм ЭКГ у разных пациентов, а также сложностями выделения каких-то «образцовых» форм сигнала. Кроме того, имеет место наличие искажающих форму ЭКГ помех, связанных с дыханием, изменением состояния или положения пациента. В связи с этим анализ ЭКГ должен включать в себя предварительную обработку сигнала [1-3].
Целью данного исследования является разработка точного и помехоустойчивого алгоритма для классификации форм ЭКГ. В основе метода, рассматриваемого в данной работе, лежит представление сигнала ЭКГ в векторном виде. В качестве координат векторов (X, Y, Z) принимаются отсчеты трех отведений [4]. Данный алгоритм включает в себя все три возможных варианта анализа: с использованием одного, двух и трех отведений ЭКГ, так как иногда невозможен полный анализ всех отведений по причине сильной зашумленности или утери одного из них.
Материалы и методика
Данные, по которым производилась разработка алгоритма классификации форм QRS-комплексов и последующее его тестирование, представляют собой набор из 48 записей трехканальной электрокардиограммы. Длительность каждой записи составляет 60 с, частота дискретизации равна 250 Гц. Также на этапе разработки использовались файлы с заранее верифицированными границами кардиоциклов.
1. Предварительная обработка. Первоначально выполнялось удаление линейного тренда с целью исключения постоянной составляющей в сигнале. Затем для устранения низкочастотного шума, связанного с дыханием и плохим контактом электродов, использовалась сплайн-интерполяция [3, 4]. В качестве узлов для построения сплайна принимались точки на PQ-сегменте. Для удаления остаточных высокочастотных и низкочастотных помех использовалось два цифровых фильтра (ЦФ) верхних и нижних частот с частотами среза 3 Гц и 100 Гц, соответственно [5, 6], реализованные как фильтры Бат-терворта с нулевым фазовым сдвигом [1].
2. Метод векторного представления сигнала. Векторкардиограмма (ВКГ) строится по трем или двум ортогональным отведениям, представляю-
щим из себя в каждый момент времени значения в декартовой системе координат - X, Y и Ъ [7, 8]. В данной работе для каждого QRS-комплекса рассчитывался суммарный вектор по формуле
V = £ у, ,
1=1
где V - вектор QRS-комплекса; 1 - номер отсчета в пределах QRS-комплекса; 1тах - количество отсчетов в пределах QRS-комплекса; V1 - вектор для 1-го отсчета, имеющий размерность 1, 2 или 3, в зависимости от числа используемых отведений [9]. Результат преобразования представлен на рис. 1. Оттенком серого отмечена принадлежность QRS к одному из двух имеющихся классов.
-1000..
-2000 ..
-ЭООО,
г -им . ч~
-5000.,
-еооси
-7005.
•мои
14000
» -5(10
Рис. 1. Векторное представление СЖЕ-комплексов ЭКГ
3. Расчет параметров классификации. Для каждой записи ЭКГ-сигнала определяется опорный вектор, показывающий доминирующее направление векторов комплексов фонового ритма. Координаты этого вектора определяются как медианные значения всех соответствующих координат кардиокомплексов. После этого для всех векторов, представляющих каждый QRS-комплекс, подсчитывается проекция на направление этого «медианного» вектора [4]:
х.Х + у У + 2.2 р = __±2_1
1 у/х2 + У2 + 22 :
(2)
где Р - сигнал проекции; 1 - номер отсчета; х, у, 2 - значения сигналов 1-го, 2-го и 3-го отведений; X, У, 2 - координаты конца «медианного» вектора [10, 11] (рис. 2).
Рис. 2. ЭКГ в трех отведениях (верхние три графика) и сигнал, рассчитанный как проекция на «медианный» вектор
По данному сигналу проекции были рассчитаны параметры формы QRS-комплексов, представленные на рис. 3:
1) длительность - Т (с);
2) размах - А (мВ);
3) смещение относительно нулевой линии - (мВ);
4) суммарная площадь волн - Р (мВ*с) [2];
5) оценки спектральной плотности мощности комплекса в диапазоне 3-30 Гц, рассчитанные с помощью быстрого преобразования Фурье (БПФ) с шагом 3 Гц [12];
6) угол между вектором кардиокомплекса и «медианным» вектором -а (рад) (вычисляется только для случая использования более одного отведения).
Расчет углов между векторами, относящимися к желудочковым комплексам, и «медианным» вектором производится с помощью формулы
а = arccos (cos а) =
V W
XX+УУ +&
+ у2 + ^ X2 + У2 + 72
где 1 - номер QRS-комплекса; - величина угла между V и W; V ={х, yi, zi} - значение вектора 1-го QRS-комплекса и его координат; W={X, У, 7} - значение «медианного» вектора и его координат; |W| и |у | -модули векторов [9, 10].
экг. мв 1 -
0.8
О 5 10 15 20 п, отсч.
Рис. 3. Расчет признаков формы рЯ8-комплекса
На рис. 4 представлен полученный «медианный» вектор, относительно которого и рассчитываются углы. Он обозначен черным цветом.
Рис. 4. «Медианный» вектор (отмечен черным цветом)
4. Разработка классификатора на основе нейронной сети. В качестве классификатора использовалась полносвязная искусственная нейронная сеть (ИНС) прямого распространения, реализованная на языке Python с помощью библиотеки Keras [13].
Выбор архитектуры сети выполнялся эмпирически. Были испробованы сети прямого распространения без скрытого слоя, с одним и с двумя скрытыми слоями. Кроме того, была осуществлена проверка эффективности добавления регуляризации весов (L1- и L2-регуляризация) и прореживания (Dropout). Эти два метода позволяют снижать риск переобучения модели [13-15].
В данной работе выполнялась бинарная классификация QRS-комплексов на два вида: «норма» - фоновый ритм и «патология». Входными данными являлись две матрицы: первая матрица включала в себя нормированные по среднему значению признаки (параметры форм ЭКГ) для всех записей ЭКГ;
вторая - известные номера классов «0» и «1». Так как имелся небольшой набор данных, то для более надежной оценки качества модели было принято решение применить перекрестную проверку по К блокам. По полученным К оценкам вычислялось среднее значение, которое и представлялось как оценка точности модели [13]. Результаты тестирования различных вариантов ИНС представлены на рис. 5-7.
а) б) в)
Рис. 5. Оценки точности ИНС с разным количеством слоев без использования регуляризации и прореживания: а - ИНС без скрытого слоя с 64 входными нейронами; б - НС с одним скрытым слоем с 64 входными нейронами; в - ИНС с двумя скрытыми слоями с 64 входными нейронами
Точность на этапе обучения и проверки Точность на ]Та№ обучения и проверни Точность на »тане обучения и поовеоки
а) б) в)
Рис. 6. Оценки точности ИНС с разным количеством слоев с использованием L2-регуляризации: а - ИНС без скрытого слоя с 64 входными нейронами; б - НС с одним скрытым слоем с 64 входными нейронами; в - ИНС с двумя скрытыми слоями с 64 входными нейронами
а) б) в)
Рис. 7. Оценки точности ИНС с разным количеством слоев с использованием
L2-регуляризации и прореживания: а - ИНС без скрытого слоя с 64 входными нейронами; б - ИНС с одним скрытым слоем с 64 входными нейронами; в - ИНС с двумя скрытыми слоями с 64 входными нейронами
Как видно из рис. 5-7, добавление методов предотвращения переобучения (регуляризация и прореживание) снижает значение оценки точности модели, но при этом прореживание устраняет скачки на кривой оценки точности на этапе проверки.
Эксперименты, представленные на рисунках выше, демонстрируют случай использования трех отведений. Из результатов видно, что наиболее высокие оценки точности обеспечивает сеть с одним скрытым слоем с добавлением L2-регуляризации и прореживания (рис. 7,6).
Результаты и обсуждение
На рис. 8-10 показаны результаты оценки точности и потерь на этапах обучения и проверки в течение 100 эпох.
а)
б)
Рис. 8. Графики оценок потерь и точности для случая использования одного
отведения
а) б)
Рис. 9. Графики оценок потерь и точности для случая использования двух отведений
Как видно из рисунков, более стабильную и точную работу нейронная сеть демонстрирует для случая использования трех отведений. Это можно оценить как визуально (на рис. 8 и 9 нейронные сети показывают более низкую стабильность, о чем свидетельствуют скачки на кривых), так и количественно: при анализе трех отведений НС показывает наилучший результат по
сравнению с двумя оставшимися случаями: максимальная точность составляет около 96 %.
а) б)
Рис. 10. Графики оценок потерь и точности для случая использования трех отведений
Тем не менее разработанный алгоритм успешно справляется с задачей бинарной классификации, показывая значения точности более 90 % для всех трех случаев.
Заключение
Показан нейросетевой алгоритм классификации форм кардиокомплек-сов ЭКГ с использованием векторного представления ЭКГ. Продемонстрированные показатели работы данного метода на основе векторного представления сигналов подтверждают результативность и возможность его применения в качестве альтернативы привычному скалярному представлению сигналов ЭКГ. Дальнейшим этапом развития и усовершенствования предложенного метода будет разработка точного алгоритма определения границ QRS-комплексов, а также создание модели нейронной сети для классификации на несколько классов и распознавания разного вида патологий. Также стоит уделить внимание увеличению помехоустойчивости алгоритма и его быстродействию.
Библиографический список
1. Рангайян, Р. М. Анализ биомедицинских сигналов: практический подход / Р. М. Рангайян. - Москва : Физматлит, 2007. - 440 с.
2. Немирко, А. П. Математические методы анализа биомедицинских данных / А. П. Немирко, Л. А. Манило, А. Н. Калиниченко. - Санкт-Петербург : СПбГЭТУ «ЛЭТИ», 2013. - 175 с.
3. Оппенгейм, А. В. Цифровая обработка сигналов / А. В. Оппенгейм, Р. В. Шафер. -Минск : Техносфера, 2006. - 856 с.
4. Фролов, С. В. Методы и приборы функциональной диагностики : учеб. пособие / С. В. Фролов. - Тамбов : Тамб. гос. техн. ун-т, 2008. - 80 с.
5. Хоровиц, П. Искусство схемотехники / П. Хоровиц, У. Хилл. - Москва : Бином, 2016. - 704 с.
6. Айфичер, Э. Цифровая обработка сигналов. Практический подход / Э. Айфичер, Б. Джервис. - Санкт-Петербург : Вильямс, 2008. - 992 с.
7. Калиниченко, А. Н. Алгоритмы анализа сигналов в медицинских приборах и системах / А. Н. Калиниченко. - Санкт-Петербург : Изд-во СПбГЭТУ «ЛЭТИ», 2011. - 88 с.
8. Акулиничев, И. Т. Векторкардиография / И. Т. Акулиничев // Большая медицинская энциклопедия. - URL: https://бмэ.орг/index.php/ВЕКТОРКАРДИОГРАФИЯ (дата обращения: 20.02.2019).
9. Тихонов, А. А. Векторная алгебра - язык современной механики : учеб. пособие / А. А. Тихонов. - Санкт-Петербург : СПбГТУРП, 2008. - 30 с.
10. Литова, Г. Г. Основы векторной алгебры / Г. Г. Литова, Д. Ю. Ханукаева. -Москва : РГУ нефти и газа им. И. М. Губкина, 2009. - 90 с.
11. Abedin, Z. ECG Interpretation. The Self - Assesment Approach / Z. Abedin, R. Conner. - Willey Blackwell, 2007. - 240 p.
12. Марпл-мл., С. Л. Цифровой спектральный анализ и его приложения / С. Л. Марпл-мл. - Москва : Москва, 1990. - 584 с.
13. Шолле, Ф. Глубокое обучение на Python / Ф. Шолле. - Санкт-Петербург : Питер, 2013. - 400 с.
14. Мэтиз, Э. Изучаем Python. Программирование игр, визуализация данных, веб-приложения / Э. Мэтиз. - Санкт-Петербург : Питер, 2017. - 497 с.
15. Raschka, S. Python Machine Learning / S. Raschka. - 1st ed. - Bermingham : Packt Publishing, 2016. - 430 p.
References
1. Rangayyan R. M. Analiz biomeditsinskikh signalov: prakticheskiy podkhod [Biomedical signal analysis: a practical approach]. Moscow: Fizmatlit, 2007, 440 p. [In Russian]
2. Nemirko A. P., Manilo L. A., Kalinichenko A. N. Matematicheskie metody analiza biomeditsinskikh dannykh [Mathematical methods of biomedical data analysis]. Saint-Petersburg: SPbGETU «LETI», 2013, 175 p. [In Russian]
3. Oppengeym A. V., Shafer R. V. Tsifrovaya obrabotka signalov [Digital signal processing]. Minsk: Tekhnosfera, 2006, 856 p. [In Russian]
4. Frolov S. V. Metody i pribory funktsional'noy diagnostiki: ucheb. posobie [Methods and devices of functional diagnostics: studies. benefit]. Tambov: Tamb. gos. tekhn. un-t, 2008, 80 p. [In Russian]
5. Khorovits P., Khill U. Iskusstvo skhemotekhniki [The art of circuitry]. Moscow: Binom, 2016, 704 p. [In Russian]
6. Ayficher E., Dzhervis B. Tsifrovaya obrabotka signalov. Prakticheskiy podkhod [Digital signal processing. Practical approach]. Saint-Petersburg: Vil'yams, 2008, 992 p. [In Russian]
7. Kalinichenko A. N. Algoritmy analiza signalov v meditsinskikh priborakh i sistemakh [Algorithms for signal analysis in medical devices and systems]. Saint-Petersburg: Izd-vo SPbGETU «LETI», 2011, 88 p. [In Russian]
8. Akulinichev I. T. Bol'shaya meditsinskaya entsiklopediya [Great medical encyclopedia]. Available at: https://bme.org/index.php/VEKTORKARDIOGRAFIYa (accessed Febr. 20, 2019). [In Russian]
9. Tikhonov A. A. Vektornaya algebra - yazyk sovremennoy mekhaniki: ucheb. posobie [Vector algebra-the language of modern mechanics: studies. benefit]. Saint-Petersburg: SPbGTURP, 2008, 30 p. [In Russian]
10. Litova G. G., Khanukaeva D. Yu. Osnovy vektornoy algebry [Basics of vector algebra]. Moscow: RGU nefti i gaza im. I. M. Gubkina, 2009, 90 p. [In Russian]
11. Abedin Z., Conner R. ECG Interpretation. The Self - Assesment Approach. Willey Blackwell, 2007, 240 p.
12. Marpl-ml. S. L. Tsifrovoy spektral'nyy analiz i ego prilozheniya [Digital spectral analysis and its applications]. Moscow: Moskva, 1990, 584 p. [In Russian]
13. Sholle F. Glubokoe obuchenie na Python [Deep learning in Python]. Saint-Petersburg: Piter, 2013, 400 p. [In Russian]
14. Metiz E. Izuchaem Python. Programmirovanie igr, vizualizatsiya dannykh, veb-prilozheniya [Learning Python. Game programming, data visualization, web applications]. Saint-Petersburg: Piter, 2017, 497 p. [In Russian]
15. Raschka S. Python Machine Learning. 1st ed. Bermingham: Packt Publishing, 2016, 430 p.
Лагирвандзе Ангелина Кахаевна
студентка,
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина) (Россия, г. Санкт-Петербург, ул. Профессора Попова, 5) E-mail: [email protected]
Калиниченко Александр Николаевич
доктор технических наук, профессор, старший научный сотрудник, кафедра биотехнических систем, Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина) (Россия, г. Санкт-Петербург, ул. Профессора Попова, 5) E-mail: [email protected]
Моргунова Татьяна Валерьевна
системный аналитик отдела
обязательного медицинского страхования,
ЗАО «СП.АРМ»
(Россия, г. Санкт-Петербург,
Гаккелевская улица, 21А)
E-mail: [email protected]
Lagirvandze Angelina Kahayevna student,
St. Petersburg State Electrotechnical
University "LETI" named after
V. I. Ulyanov (Lenin)
(5 Professor Popov street, St. Petersburg,
Russia)
Kalinichenko Aleksandr Nikolaevich doctor of technical sciences, professor, senior researcher,
sub-department of bioengineering systems,
St. Petersburg State Electrotechnical
University "LETI" named after
V. I. Ulyanov (Lenin)
(5 Professor Popov street, St. Petersburg,
Russia)
Morgunova Tatiana Valer'evna system analyst of the department of compulsory medical insurance, CJSC "SP.ARM" (21A Gakkelevskaya street, St. Petersburg, Russia)
Образец цитирования:
Лагирвандзе, А. К. Алгоритм анализа форм кардиоциклов ЭКГ с использованием технологий машинного обучения / А. К. Лагирвандзе, А. Н. Калиниченко, Т. В. Моргунова // Модели, системы, сети в экономике, технике, природе и обществе. - 2019. -№ 4 (32). - С. 75-84.