Научная статья на тему 'Биометрическая идентификация человека по его электрокардиограмме'

Биометрическая идентификация человека по его электрокардиограмме Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
364
61
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОКАРДИОГРАММА / ХАРАКТЕРНЫЕ ПРИЗНАКИ ЭКГ / CHARACTERISTIC FEATURES OF ECG / ИДЕНТИФИКАЦИЯ / IDENTIFICATION / АППРОКСИМАЦИЯ / APPROXIMATION / ПАРАМЕТРИЧЕСКИЙ СПЛАЙН / PARAMETRIC SPLINE / КЛАССИФИКАЦИЯ / CLASSIFICATION / ELECTROCARDIOGRAM (ECG)

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вишневский В. В., Романенко Т. Н., Кизуб Л. А.

Обсуждается алгоритм биометрической идентификации человека по его электрокардиограмме (ЭКГ) с использованием нейросети для классификации характерных признаков, выделенных при аппроксимации параметрическими сплайнами трехмерных дуг, соответствующих QRS-комплексам.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Вишневский В. В., Романенко Т. Н., Кизуб Л. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The paper deals with the algorithm of biometric identification of a person according to his/her electrocardiogram (ECG) using a neural network for the classification of characteristic features that were found during approximating parametric splines of three-dimensional arcs that correspond to QRS complexes.

Текст научной работы на тему «Биометрическая идентификация человека по его электрокардиограмме»

УДК 004.896

В.В. ВИШНЕВСКИЙ*, Т.Н. РОМАНЕНКО*, Л.А. КИЗУБ*

БИОМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ ЧЕЛОВЕКА ПО ЕГО ЭЛЕКТРОКАРДИОГРАММЕ

Институт проблем математических машин и систем НАН Украины, г. Киев, Украина

Анотаця. Обговорюеться алгоритм б^ометричног ¡дентифтацп людини за ïï електрокард1огра-мою (ЕКГ) з використанням нейромереж1 для класифтацп характерних ознак, знайдених при ап-роксимацИ' параметричними сплайнами тривим1рних дуг, якг в1дпов1дають QRS-комплексам. Ключов1 слова: електрокард1ограма, характерт ознаки ЕКГ, ¡дентифтащя, апроксимац^я, пара-метричний сплайн, класифгкацгя.

Аннотация. Обсуждается алгоритм биометрической идентификации человека по его электрокардиограмме (ЭКГ) с использованием нейросети для классификации характерных признаков, выделенных при аппроксимации параметрическими сплайнами трехмерных дуг, соответствующих QRS-комплексам.

Ключевые слова: электрокардиограмма, характерные признаки ЭКГ, идентификация, аппроксимация, параметрический сплайн, классификация.

Abstract. The paper deals with the algorithm of biometric identification of a person according to his/her electrocardiogram (ECG) using a neural network for the classification of characteristic features that were found during approximating parametric splines of three-dimensional arcs that correspond to QRS complexes.

Keywords: electrocardiogram (ECG), characteristic features of ECG, identification, approximation, parametric spline, classification.

1. Введение

Идеи использования специальных методов обработки электрокардиограммы с целью биометрической идентификации человека (аутентификации) впервые сформулированы относительно недавно [1-3]. Однако развитие телемедицинских технологий делает идею такой аутентификации все более привлекательной. Дело в том, что благодаря широкому распространению смартфонов и мобильного интернета на фоне стагнации рынка медицинских приборов для кабинетов функциональной диагностики экспертами уже сейчас фиксируется бурное развитие малогабаритных мобильных медицинских приборов, в частности, электрокардиографов [4]. Сначала эти приборы будут использоваться врачами в рамках идеи «мобильной медицины», но очень скоро пациенты начнут использовать эти приборы в рамках концепции «домашней медицины». Иными словами, применение электрокардиографов станет столь же простым, каким сейчас является использование тонометров для измерения артериального давления. Но, в отличие от тонометров, автоматизированная обработка электрокардиограмм больше нуждается именно в телемедицинских решениях. При этом явно наблюдается кластеризация телемедицинских решений на два типа: для мониторинга состояния пациента на расстоянии с целью своевременного установления диагноза и телемедицинские решения для фитнеса.

Следует отметить, что телемедицинские решения для фитнеса используют упрощенные схемы электрокардиографии, которые сужены к анализу ритма сердца или анализу только первого стандартного отведения электрокардиограммы. Для диагностических же задач используются мобильные устройства-электрокардиографы, измеряющие 6 или 12 стандартных отведений. Алгоритм и технология, о которых идет речь в статье, имеют отношение именно к этой группе телемедицинских технологий.

Поскольку диагностические выводы для пациента на основе его электрокардио-

© Вишневский В.В., Романенко Т.Н., Кизуб Л.А., 2018 ISSN 1028-9763. Математичш машини i системи, 2018, № 2

граммы (6 или 12 отведений) выполняются на расстоянии, актуальность биометрической аутентификации приобретает особое значение, поскольку даже для анализа динамики изменений в кардиосигнале врач должен быть уверен, что анализирует сигнал одного и того же человека. Не менее актуальным является решение задачи аутентификации по электрокардиограмме в условиях внедрения страховой медицины и парадигмы персонализированной диагностики [5].

Таким образом, аутентификация человека по его электрокардиограмме в 6-ти или 12-ти стандартных отведениях является актуальной именно сейчас, на современном этапе развития мобильных медицинских устройств, для эффективной организации телемедицинских консультаций.

2. Описание алгоритма

Стандартная электрокардиограмма состоит из 12 отведений, то есть 12 сигналов. С помощью специальных алгоритмов осуществляется предварительная обработка этих сигналов, которая включает в себя: преобразование в три ортогональных отведения, фильтрацию и разметку - разделение на кардиоциклы и элементы циклов [6]. Кроме стандартной ЭКГ на 12 отведений, существует также ЭКГ по Франку, схема наложения электродов которой позволяет сразу получить три ортогональные отведения, что может несколько упростить предварительную обработку сигнала. ЭКГ в ортогональных отведениях может быть представлена в фазовом пространстве координат в виде вектор-кардиограммы [1, 5].

В каждом цикле размеченной ЭКГ возьмем ту часть, которая отвечает комплексу. Имея три отведения, можем представить ее в виде трехмерной дуги (рис. 1).

ЭКГ покоя содержит более 150 кардиоциклов. Среди них есть некоторое количество нетипичных циклов, то есть таких, которые значительно отличаются от большинства. Использование таких нетипичных циклов в дальнейшем может исказить результат классификации, поэтому их нужно изъять из рассмотрения. Для удаления таких нетипичных циклов используем метрику Хаусдорфа. Для этого рассчитываем Хаусдорфовы расстояния для каждой трехмерной дуги до всех остальных дуг, представляющих рЯ8-комплексы данной ЭКГ [3]. После ранжирования дуг по возрастанию Хаусдорфовых расстояний нетипичные циклы разместятся в конце списка, откуда их можно удалить и в дальнейшем не брать в расчет. Кардиоцикл, который получил первое место в ранжированном списке как наиболее типичный, будем называть репрезентативным. После удаления из рассмотрения нетипичных рЯ5-комплексов можно рассчитать усредненный кардиоцикл. Как и репрезентативный, усредненный кардиоцикл можно использовать для представления всей ЭКГ.

Количество точек в трехмерной дуге, представляющей рЯ8-комплекс в трех отведениях, достаточно большое, к тому же различается для разных ЭКГ. Поэтому непосредственное использование координат этих точек как признаков для классификации ЭКГ с помощью нейросети невозможно: во-первых, большое количество параметров требует значительного объема данных для обучения нейросети, а во-вторых, количество парамет-

Рис. 1. Три ортогональных отведения ЭКГ и отвечающая им трехмерная дуга

ров должно быть одинаковым для всех классифицируемых дуг.

Чтобы избавиться от вышеописанных недостатков, трехмерную дугу, соответствующую QRS-комплексу, аппроксимируем параметрическими сплайнами. При этом получаем значительно меньшее количество точек, характеризующих форму дуги. Для аппроксимации используем канонический сплайн (cardinal spline), также можно использовать кривую Безье [7, 8].

Приведем более подробно алгоритм аппроксимации трехмерной дуги параметрическими сплайнами. Итак, исходными данными являются отсчеты трехмерной дуги, которая представляет собой часть кардиоцикла, соответствующую QRS-комплексу: X = {x(m)},Y = {y(m)},Z = {z(m)} . Эти данные можно заменить аналитическими кривыми, которые достаточно хорошо совпадают по форме с трехмерной дугой, соответствующей QRS-комплексу, и в то же время являются инвариантными относительно изменения масштаба, количества измерений, уровня помех. Такие кривые задаются функциями x(k), y(k), z(k) , которые представляют собой полиномы r -ной степени от параметра к :

х(к) = апк' +ахкг 1 +... + аг_хк + аг, у(к) = Ъ0кг + Ъкг-1 + ... + Ъг_,к+ ЪГ, z(k) = cnkr + Cj£r-1 +... + сг_хк + сг.

Выбор r -ной степени полиномов зависит от сложности аппроксимируемых дуг. Как было указано выше, для аппроксимации трехмерной дуги, соответствующей QRS-комплексу, применяем канонический сплайн (cardinal spline) третьего порядка.

Канонический сплайн - это последовательность полиномов третьего порядка, каждый из которых может быть записан параметрическим уравнением общего вида:

x(t) = a J3 + hxr + с J + dx,

y(t) = a/+b/+cyt + dy,

z(t) = a:t3+b:t2+cj + d:,

где t - параметр, изменяющийся в промежутке [0, 1].

Кривые, соответствующие полиномам, начинаются и заканчиваются в управляющих точках, образуя плавную односвязную кривую (рис. 2).

Для случая канонического сплайна с четырьмя управляющими точками коэффициенты уравнений можно рассчитать по формулам:

ах = Т(х2 — х0) + Т(хъ - Xj) + 2Xj - 2х2,

: Т{У2 -Уо) + Т(у3 -)\) + 2ух -2у2,

X, У

Рис. 2. Канонический сплайн

a, = T(z2 - z0) + Т(гъ -zl) + 2zl- 2z2,

bx = —2T(x2 — x0) - T(xз - Xj) - 3Xj + 3x2, by = -2T(y2 -y0) -T(y3 3^ + 3y2,

b, = -2 T(z2 - z0 )-T(z3-zl)-3zl+3z2,

c, =T(x2-x0), су=Т(у2-у0), с, =T{z2-z0), dx=xx,

dy =У1, d=z,,

где x0, У0, z0, x, У, zi, x2, У 2, z2, X, Уз, z3 - координаты четырех управляющих точек

P0(Х0, Ус, zoX P1(У1, zi). P2(У2' ^X P3(Уз> Zs) ;

T - коэффициент натяжения (обычно равен 0,5).

Для трехмерной дуги, которую необходимо аппроксимировать, находим такую кривую, которая наилучшим образом отображает ее форму, то есть вычисляем координаты управляющих точек этой кривой и, следовательно, коэффициенты сплайна. В результате отсчеты трехмерной дуги будут представлены вектором v, компонентами которого являются коэффициенты канонического сплайна:

v = (х , у ,z }.

^ п? s п? п )

В качестве меры сходства аппроксимирующего канонического сплайна и исходной трехмерной дуги будем использовать оценку площади фигуры, ограниченной контуром, образованным этим сплайном и ломаной линией, последовательно соединяющей экспериментальные данные S = (G, Р) . Тогда поиск сплайна, наилучшим образом аппроксимирующего исходную трехмерную дугу, будет состоять в вычислении оптимальных коэффициентов v t, при которых минимизируется значение оценки площади:

К,,, - argmin S((j, Р),

r V

где G - точки исходной трехмерной дуги gm (xgm, У§т, zgm ) ; P - точки канонического сплайна pm (xpm, Урт, zpm ) ; m = 0, M ;

M - количество точек в исходной трехмерной дуге.

Минимизации меры сходства достигаем методом градиентного спуска.

Общий алгоритм итерационной процедуры аппроксимации трехмерной дуги, соответствующей QRS-комплексу ЭКГ, параметрическими сплайнами с использованием итерационного метода градиентного спуска состоит в следующем. В начале алгоритма имеем произвольное приближение сплайна к исходной трехмерной дуге. Оцениваем меру сходства и производим один шаг итерации: изменяем координаты управляющих точек канонического сплайна в одном из возможных направлений, в том, которое даст наилучшее изменение меры сходства, то есть наилучшее уменьшение оценки площади. Это происходит в направлении градиента. Снова оцениваем меру сходства и делаем следующий шаг в градиентном спуске. Такая процедура выполняется до тех пор, пока величина изменения меры сходства становится меньше некоторого заранее заданного значения s . Возможная ситуация с отсутствием сходимости итерационного алгоритма блокируется заранее заданным максимальным количеством итераций.

Графическая интерпретация алгоритма приведена на рис. 3.

В дальнейшем классификация с помощью нейросети осуществляется для координат управляющих точек параметрического сплайна, количество которых может быть ограничено, например, четырьмя. Тогда количество признаков, характеризующих трехмерную дугу QRS-комплекса, будет равно 12.

Для классификации аппроксимированных QRS-комплексов используется нейросеть. Классификация осуществляется попарно, то есть нейросеть обучается на распознавание двух классов. Для обучения у каждого пациента используются QRS-комплексы одной эталонной ЭКГ (после предварительного удаления нетипичных циклов). Для классификации используются либо репрезентативный, либо усредненный циклы, рассчитанные для каждой идентифицируемой ЭКГ [9].

Схемы обучения нейросети и классификации ЭКГ для задачи биометрической

идентификации человека представлены на рис. 4.

4. Экспериментальная проверка алгоритма

Описанный метод был проверен экспериментально.

Для эксперимента были зарегистрированы электрокардиограммы разных, функционально здоровых людей мужского и женского пола, в возрасте от 25 до 55 лет. Исследования проводились в разное время дня, семь пациентов находились в различном эмоциональном и физическом состоянии. Для каждого были зарегистрированы по 10 ЭКГ.

Согласно описанному выше алгоритму, была проведена предварительная обработка данных. Для каждой ЭКГ выполнялись такие действия: преобразование 12 отведений в 3 ортогональные отведения, разделение сигнала на кардиоциклы, выделение в каждом из циклов QRS-комплекса. На следующем этапе удалили нетипичные циклы, а также определили репрезентативный цикл, используя для этого расчеты метрики Хаусдорфа. Далее все трехмерные QRS-комплексы ЭКГ аппроксимировали каноническими сплайнами. После этого форма каждого QRS-комплекса определяется четырьмя управляющими точками параметрического сплайна.

Для классификации аппроксимированных ЭКГ использовали нейросеть. Проводили попарную классификацию, то есть каждого пациента сравнивали с каждым. Обучение нейросети осуществлялось на одной из ЭКГ пациента, а остальные девять использовались для идентификации. Обучение проводилось по всем циклам ЭКГ (за исключением нетипичных), а идентификация - по репрезентативным циклам.

Регистрация эталонной ЭКГ

Предварительная обработка эталонной ЭКГ

Формирование QRS-комплексов в 3D-пространстве кооординат

Удаление из эталонной ЭКГ нетипичных QRS-комплексов

Аппроксимация QRS -комплексов параметрическими сплайнами

Формирование векторов характерных признаков

1

Обучение нейросети на эталонной ЭКГ

Класс эталонной ЭКГ

а)

Регистрация текущей ЭКГ

Предварительная обработка текущей ЭКГ

Формирование QRS-комплексов в 3D-пространстве кооординат

Определение наиболее характерного QRS-комплекса в текущей ЭКГ

Аппроксимация наиболее характерного QRS-комплекса параметрическими сплайнами

Формирование вектора характерных признаков для наиболее характерного QRS -комплекса

Классификация вектора характерных признаков

б)

Рис. 4. Схемы обучения нейросети и классификации ЭКГ: а) обучение нейросети на эталонной ЭКГ; б) классификация ЭКГ нейросетью

Для каждой пары пациентов по результатам идентификации были рассчитаны пока-

затели чувствительности и специфичности метода.

Под чувствительностью метода будем понимать способность правильно идентифицировать первого пациента из пары, которая определяется как часть правильно идентифицированных ЭКГ первого пациента («истинно положительные» результаты) среди всех ЭКГ, отнесенных к первому пациенту. Рассчитать чувствительность (Ч) можно по формуле

ИП

4 =-х 100%,

ИП + ЛО

где Ч - чувствительность метода;

ИП - «истинно положительные» результаты (правильная идентификация первого пациента);

ЛО - «ложно отрицательные» результаты (неправильное определение второго пациента).

Под специфичностью метода будем понимать способность метода не давать неправильных результатов идентификации второго пациента из пар, которая определяется как часть правильно идентифицированных ЭКГ второго пациента («истинно отрицательные» результаты) среди ЭКГ, отнесенных ко второму пациенту. Рассчитать специфичность (С) можно по формуле

ИО

С =-х 100%,

ио + лп

где С - специфичность метода;

ИО - «истинно отрицательные» результаты (правильная идентификация второго пациента);

ЛП - «ложно положительные» результаты (неправильное определение первого пациента).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Подробный порядок проведения эксперимента описан в работе [10]. Средняя чувствительность метода для эксперимента с ортогональными отведениями при попарной классификации будет равняться 97,0%, средняя специфичность - 97,0%.

5. Выводы

Использование аппроксимации трехмерной дуги параметрическими сплайнами для трех отведений электрокардиограммы позволяет построить систему характерных признаков, которые будут чувствительны к форме этой кривой. Такая система признаков удобна для решения задач классификации, одной из которых является задача биометрической идентификации и аутентификации человека.

Результаты экспериментов по оценке валидности (чувствительность и специфичность метода) показали возможность построения эффективной технологии для биометрической идентификации человека, основывающейся на обработке ЭКГ в трехмерном пространстве координат.

На базе данной технологии мы можем строить различные виды прикладных сервисов для телемедицинских систем: аутентификация пациента, автоматическая идентификация пациентов в группе (например, идентификация членов одной семьи), «очистка» базы данных пациентов и другие.

СПИСОК ИСТОЧНИКОВ

1. Fainzilberg L.S. Computer Analysis and Recognition of Cognitive Phase Space Electrocardiographic Image / L.S. Fainzilberg, T.P. Potapova // Proc. of 6th International Conference on Computer analysis of Images and Patterns (CAIP-95). - Prague, 1995. - P. 668 - 673.

2. Biel L. ECG analysis: a new approach in human identification / L. Biel, O. Petersson, L. Philipson [et al.] // IEEE Transactions on Instrumentation and Measurement. - 2001. - N 3. - P. 808 - 812.

3. Файнзильберг Л.С. Информационные технологии обработки сигналов сложной формы. Теория и практика. - Киев: Наукова думка, 2008. - 333 с.

4. Nymi Band [Электронный ресурс]. - Режим доступа: https: //nymi. com.

5. Вишневський В.В. Бюметрична щентифшащя за допомогою електрокардюграми / В.В. Вишнев-ський, Т.М. Романенко, Л.А. Юзуб // П'ята мiжнар. наук.-практ. конф. «1нформацшш технологи та комп'ютерна iнженерiя» 1ТК1 2015. - 1вано-Франювськ, 2015. - С. 130 - 131.

6. Чайковский И.А. Анализ электрокардиограммы в одном, шести и двенадцати отведениях с точки зрения информационной ценности: электрокардиографический каскад / И.А. Чайковский // Клиническая информатика и телемедицина. - 2012. - № 2. - C. 102 - 106.

7. Вишневский В.В. Аппроксимация экспериментальных данных кривыми Безье / В.В. Вишневский, В.Г. Калмыков, Т.Н. Романенко // XIII-th International Conference KDS 2007. -Varna, Bulgaria, 2007. - June. - P. 3 - 9.

8. Вишневский В.В. Аппроксимация одно-, дву- и трехмерных дуг кривых параметрическими сплайнами / В.В. Вишневский, В.Г. Калмыков, Т.Н. Романенко // Математичш машини i системи. -

2015. - № 4. - С. 57 - 64.

9. Vishnevsky V. Experimental verification of possibility of human identification by the electrocardiogram / V. Vishnevsky, T. Romanenko, L. Kizub // 5th International Conference on Application of Information and Communication Technology and Statistics and Economy and Education (ICAICTSEE -2015). - Sofia, Bulgaria, 2015. - P. 318.

10. Вишневский В.В. Використання електрокардюграм i !х характеристик для щентифшацп особи / В.В. Вишневський, Т.М. Романенко, Л.А. Юзуб // Вюник Вшницького полтехшчного шституту. -

2016. - № 5. - С. 7 - 10.

Стаття над1йшла до редакцп 26.04.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.