Научная статья на тему 'Выбор метода кластеризации для алгоритма выявления мерцательной аритмии'

Выбор метода кластеризации для алгоритма выявления мерцательной аритмии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
150
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЧЕСКИЙ АНАЛИЗ ЭКГ / AUTOMATIC ECG ANALYSIS / МЕРЦАТЕЛЬНАЯ АРИТМИЯ / ATRIAL FIBRILLATION / ФАЗОВЫЙ ПОРТРЕТ / PHASE PORTRAIT / ВЕКТОР / VECTOR / МЕТОДЫ КЛАСТЕРИЗАЦИИ / CLUSTERING METHODS / ГРАФ / GRAPH

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Моторина Светлана Валерьевна, Калиниченко Александр Николаевич, Немирко Анатолий Павлович

Мерцательная аритмия (фибрилляция предсердий) является одним из наиболее опасных видов аритмий. Сегодня существует множество алгоритмов выявления мерцательной аритмии, при этом точность лучших из них не превышает 94,5 %. В настоящей работе рассмотрен выбор решающего правила для алгоритма, основанного на изучении закономерностей в порядке следования и длине R-R-интервалов (расстояний между соседними R-зубцами кардиограммы).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Моторина Светлана Валерьевна, Калиниченко Александр Николаевич, Немирко Анатолий Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Selection of clustering method for the atrial fibrillation recognition algorithm

The algorithm for detection of atrial fibrillation based on graphical methods, which allows identification of the characteristics of different types of heart rhythm, and clustering methods used as a decision rule to recognize these types of rhythm were considered. The method of joined components detection providing the best values of sensitivity, specificity and total error was selected. The efficiency of the selected algorithm in combination with the clustering method was evaluated with the use of the same parameters.

Текст научной работы на тему «Выбор метода кластеризации для алгоритма выявления мерцательной аритмии»

2

Обработка и анализ биомедицинской информации

УДК 615.47:616-072.7

С. В. Моторина, А. Н. Калиниченко, А. П. Немирко

Выбор метода кластеризации для алгоритма выявления мерцательной аритмии

Ключевые слова: автоматический анализ ЭКГ, мерцательная аритмия, фазовый портрет, вектор, методы кластеризации, граф.

Keywords: automatic ECG analysis, atrial fibrillation, phase portrait, vector, clustering methods, graph.

Мерцательная аритмия (фибрилляция предсердий) является одним из наиболее опасных видов аритмий. Сегодня существует множество алгоритмов выявления мерцательной аритмии, при этом точность лучших из них не превышает 94,5 %. В настоящей работе рассмотрен выбор решающего правила для алгоритма, основанного на изучении закономерностей в порядке следования и длине Я—Я-интервалов (расстояний между соседними Я-зубцами кардиограммы).

Введение

Одним из наиболее опасных видов нарушений сердечного ритма является мерцательная аритмия (фибрилляция предсердий). Поэтому своевременная и надежная автоматическая диагностика этой патологии должна быть важнейшей функцией приборов и систем мониторинга сердечного ритма человека. Точность лучших из предложенных на сегодня алгоритмов выявления мерцательной аритмии не превышает 94,5 % [1]. В настоящей работе рассматривается алгоритм, который основан на графических методах, позволяющих выделять характерные признаки различных типов сердечного ритма.

Исследуемый алгоритм основан на представлении линий фазового портрета (последовательно соединенных точек, абсцисса которых равна текущему Я—Я-интервалу, а ордината — последующему) в виде векторов, характеризующихся длиной и направлением (углом наклона к оси абсцисс). Вектора строятся в полярной системе координат, при этом начало отсчета определяется так, чтобы информативные участки (пучки векторов) не попадали на границу, разделяющую первую и четвертую четверти пространства координат [2]. На изображении векторов в полярной системе координат хорошо видны особенности типов сердечного ритма:

1) для фонового ритма характерна малая длина векторов;

2) для всех видов аритмий, кроме фибрилляции предсердий, характерна концентрация векторов по определенным направлениям;

3) для мерцательной аритмии — хаотическое распределение векторов по длинам и направлениям.

Для автоматического распознавания этих особенностей используются следующие численные признаки.

1. Признак сходства анализируемого ритма с нормальным синусовым ритмом N0, для вычисления которого определяется количество векторов длиной, не превышающей порогового значения Ъп, и нормируется по числу Я—Я-интервалов в записи N:

N

Nn =■

N

Ni = 1, Ni = 0,

Li < L > L„.

2. Признак нерегулярности Я, для вычисления которого для каждой пары векторов используется счетчик числа пар векторов Яразность которых по длинам и направлениям не превышает пороговых значений АЪ и АР:

N

Rk = N Ri,

i=1

Ri = 1,

Ri = 0,

L, - Lj < AL;

Li+1- Lj+1 <AL; Pi -Pj <AP; Pi+1 -Pj+1 <AP;

Li - Lj > AL;

Li+1 - Lj+1 > AL;

j = 1, N,

i = 1N,

Р; -Р} >ДР; _Р;+1 -Р}+1 >ДР,

где Ъц, Р; — длина и направление оцениваемого вектора; Ъ}, Р} — длина и направление вектора, с которым он сравнивается.

№ 4(40)/2015 |

биотехносфера

1

0,4 0,6

N0

Рис. 1

Распределение объектов обучающей выборки в пространстве признаков

Максимальное значение счетчика нормируется по количеству R—R-интервалов в записи:

max Rk

R =

Ч

N

Для проведения экспериментального исследования из набора холтеровских записей была сформирована выборка данных, состоящая из 138 фрагментов по 80 R—R-интервалам. Эта выборка содержит фрагменты трех типов сердечного ритма:

1) фоновый ритм (52 фрагмента);

2) мерцательная аритмия (58 фрагментов);

3) другие виды аритмий (28 фрагментов).

На рис. 1 показано распределение объектов обучающей выборки в пространстве описанных выше признаков (о — мерцательная аритмия, х — фоновый ритм, + — другие виды аритмий).

Выбор метода кластеризации

В математической статистике под кластерами понимают сравнительно однородные группы объектов, определенных в пространстве признаков. Методы кластеризации делятся на иерархические, которые подразделяются на агломеративные и ди-визимные, и неиерархические [3].

При иерархической кластеризации выполняется последовательное объединение меньших кластеров в большие (агломеративные) или разделение больших кластеров на меньшие (дивизимные) на основании степени близости между ними. К иерархическим методам относятся:

1) метод одиночной связи (степень близости между объектом и кластером определяется расстоянием между объектом и наиболее близким к нему элементом кластера);

2) метод полной связи (степень близости между объектом и кластером определяется расстоянием между объектом и наиболее дальним от него элементом кластера);

3) метод Уорда (степень близости между объектом и кластером определяется суммой квадратов отклонений признаков объекта от средних значений этих признаков внутри кластера).

Иерархические методы применяются в тех случаях, когда внутрикластерные расстояния между объектами меньше межкластерных. При этом методы одиночной и полной связи показывают хорошие результаты при применении к кластерным структурам с выраженным центром, но неэффективны при сложной форме кластеров.

В неиерархических методах кластеризации применяется итерационное дробление исходной совокупности. К ним относятся:

1) метод к-средних (объекты распределяются между к кластерами так, чтобы их суммарное квадратичное отклонение от центров кластеров было минимальным);

2) графовые методы (пространство координат представляется в виде графа, узлами которого являются объекты, а ребрами — соединяющие их отрезки):

• метод минимального покрывающего дерева (строится граф, так чтобы каждый объект был связан хотя бы с одним другим объектом и чтобы сумма весов всех ребер была минимальна; ребра с максимальным весом последовательно удаляются, пока граф не распадется на необходимое количество кластеров);

• метод выделения связных компонент (строится граф, так чтобы все объекты были соединены между собой ребрами; все ребра, длина которых меньше заданного параметра, удаляются из графа, и он распадается на несколько кластеров).

Неиерархические методы применяются при любом типе кластерных структур, если между кластерами нет перемычек.

При выборе оптимального метода кластеризации учитывается тип кластерных структур исследуемой выборки. На рис. 1 хорошо видно, что кластеры обучающей выборки относятся к ленточному типу. Исходя из этого методы одиночной и полной связи к ней не применимы.

Все графовые методы дают примерно одинаковый результат, но различаются областью использования. В данном исследовании применен метод выделения связных компонент, характеризующийся простотой программной реализации, но большим количеством итераций.

Таким образом, для исследования были выбраны следующие методы кластеризации:

1) метод Уорда;

2) метод к-средних;

3) метод выделения связных компонент.

В качестве показателей эффективности кластеризации использованы чувствительность Бе, специ-

R

Таблица 1 Значения показателей эффективности исследуемых методов, %

Метод Se Sp e

Уорда 98,61 96,00 2,91

k-средних 98,61 92,00 5,23

Выделения связных компонент 93,06 100,00 2,91

а)

1

0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1

0 0,2 0,4 0,6 0,8

N0

б) 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1

R

0 0,2 0,4 0,6 0,8

N0

Рис. 2 I Результаты применения метода связных компонент

фичность Яр и суммарная ошибка е. Следует отметить, что эти показатели рассчитаны с учетом поставленной задачи — выявление мерцательной аритмии, поэтому все полученные кластеры, кроме искомого, были объединены в один. Таким образом, получены два кластера: «мерцательная аритмия» и «другие типы сердечного ритма». Значения показателей эффективности исследуемых методов кластеризации при применении их к данным обучающей выборки приведены в табл. 1.

По данным, приведенным в табл. 2, видно, что наиболее предпочтительным в рамках решаемой

задачи методом кластеризации является метод выделения связных компонент, поскольку он обладает малой суммарной ошибкой и максимальной специфичностью (что позволяет избежать гипердиагностики) при допустимом уровне чувствительности.

При применении метода связных компонент строится граф, так чтобы все объекты были соединены между собой ребрами. Все ребра, длина которых меньше заданного параметра Р, удаляются из графа, и он распадается на несколько кластеров. Оптимальное значение параметра определялось эмпирическим путем и составило 0,075. Результат применения метода связных компонент к данным обучающей выборки приведен на рис. 2: в виде графа (рис. 2, а); в виде распределения объектов в пространстве признаков (рис. 2, б, о — мерцательная аритмия, + — другие типы сердечного ритма).

В результате применения метода связных компонент к данным обучающей выборки сформированы два кластера: «мерцательная аритмия» и «другие типы сердечного ритма». При формулировке решающего правила первый кластер использован в качестве исходного массива В. Для каждого объекта, пропускаемого через алгоритм, вычислены расстояния до всех элементов В; этого массива. В случае, если хотя бы одно расстояние меньше параметра Р, объект относится к мерцательной аритмии, в противном случае — к другим типам ритма.

Таким образом, решающее правило имеет следующий вид:

\Ио, В - X < Р;

И |вг - X > Р,

где Но — основная гипотеза о том, что запись содержит участки с мерцательной аритмией; Н1 — альтернативная гипотеза о том, что в записи отсутствуют участки с мерцательной аритмией; х — вектор признаков анализируемого объекта.

Результаты

Для оценки качества алгоритма выявления мерцательной аритмии на основе графических методов использована база данных MIT-BIH AF Database, содержащая записи с мерцательной аритмией и доступная на официальном сайте www.physionet.org [5]. Результаты тестирования приведены в табл. 2.

Таблица 2 Показатели эффективности алгоритмов, %

Алгоритм Se Sp e

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Исследуемый 93,78 95,79 4,63

Муди [6] 87,54 95,14 7,88

Татенто [7] 91,20 96,08 5,32

Шмидта [8] 89,20 94,58 7,57

Бабайзадеха [9] 87,27 95,47 7,80

R

№ 4(40)/2015 |

биотехносфера

Обработка и анализ биомедицинской информации

Также в ней приведены данные по другим описанным в литературе алгоритмам, которые проходили проверку на той же выборке и показали наилучшие результаты.

По данным таблицы видно, что по уровню суммарной ошибки и чувствительности исследуемый алгоритм превосходит каждый из представленных алгоритмов не менее чем на 1 %, а по уровню специфичности уступает лишь алгоритму Татенто.

Заключение

Исследуемый алгоритм выявления мерцательной аритмии показал хорошие результаты при использовании в нем метода выделения связных компонент. Дальнейшее его улучшение может быть достигнуто за счет более точного определения границ эпизодов мерцательной аритмии и использования весовой оценки ребер графа. Также функционал алгоритма может быть расширен на распознавание не только мерцательной аритмии, но и других типов патологий.

I Литература I

1. Larburu N., Lopetegi T., Romero I. Comparative Study of Algorithms for Atrial Fibrillation Detection. Computers in Cardiology, 2013.

2. Моторина С. В., Калиниченко А. Н. Алгоритм распознавания мерцательной аритмии на основе графических методов. Изв. СПбГЭТУ «ЛЭТИ». 2014. № 10.

3. Прикладная статистика: классификация и снижение размерности / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков, Л. Д. Мешалкин. М.: Финансы и статистика, 1989. 607 с.

4. Physionet: the reseach resource for complex physiologic signals. www.physionet.org [online]

5. Moody G. B., Mark R. G. A new method for detecting atrial fibrillation using R—R intervals. Computers in Cardiology, 1983.

6. Tatento K., Glass L. Automatic detection of atrial fibrillation using the coefficient of variation and density histograms of RR and _RR intervals. Medical & Biological Engineering & Computing, 2001.

7. Atrial Fibrillation Detection / R. Schmidt, M. Harris, D. Novac, M. Perkhun // Patent Cooperation Treaty, 2008. Eindhoven, Netherlands.

8. Improvements in atrial fibrillation detection for real-time monitoring / S. Babaeizadeh, R. E. Gregg, E. D. Helfenbein [et al.] // Journ. of Electrocardiology, 2009.

гг л

Уважаемые авторы!

Для полноценной работы со ссылками в Научной электронной библиотеке (НЭБ) просим вас предоставлять в статьях точные библиографические сведения об источниках цитирования.

Ссылки должны быть составлены по ГОСТ 7.0.5.-2008. Особое внимание просим уделять написанию названий издательств и журналов. Предпочтение отдается полной форме. В случае сокращенного написания, пожалуйста, сверяйтесь с принятой формой сокращения наименования данного журнала или издательства в НЭБ (если они зареги-стированы). В противном случае НЭБ не сможет индексировать ссылку. Ответственность за предоставляемую информацию несет автор.

Редакция журнала «Биотехносфера»

i Надоели баннеры? Вы всегда можете отключить рекламу.