УДК 004.08; 004.94
В. А. Аль-Хайдри, Р. В. Исаков, Л. Т. Сушкова
Возможности применения искусственных нейронных сетей для обнаружения искажений ЭКГ
Ключевые слова: ЭКГ, артефакт, искусственные нейронные сети, многослойный персептрон, количество нейронов. Keywords: ECG, artifact, artificial neural network, multilayer perceptron, number of neurons.
Работа посвящена проблеме контроля и повышения качества ЭКГ-сигнала путем обнаружения искажений, которые снижают достоверность диагностической информации, что может привести к ложным заключениям. Эта проблема весьма актуальна, поскольку от ее решения зависит точность анализа ЭКГ пациентов. В статье изучается возможность применения относительно нового перспективного подхода на основе применения искусственных нейронных сетей (ИНС). Для исследования были созданы базы данных ЭКГ образов с искажениями и без них. ИНС была обучена в среде MatLab. Результаты исследований показали возможность применения ИНС для обнаружения искажений с высокой эффективностью.
Введение
Одним из самых распространенных и эффективных методов исследования динамики сердца и диагностики режима его функционирования считается анализ электрокардиограммы (ЭКГ), регистрируемой в процессе электрокардиографии, широко применяемой в медицине и экспериментальной физиологии [1].
Электрокардиосигнал (ЭКС), как и другие биомедицинские сигналы, очень слабый и окружен множеством других сигналов различного происхождения, которые являются помехой или просто шумом [2]. В медицине такие сигналы относятся к артефактам. Наложение их на ЭКС приводит к снижению достоверности и точности функциональной диагностики работы сердца.
Известно [3], что кардиодиагностика зачастую сопряжена с ошибками. Примерно 38 % электрофизиологов принимают артефакт кардиосигнала за желудочковую тахикардию [4], а 55 % врачебных заключений Холтеровского суточного мониториро-вания содержат ошибки методического характера [5]. До 43 % ложных тревог от прикроватных мо-
ниторов ЭКГ вызваны неверной интерпретацией артефактов сигнала встроенным программным обеспечением [7]. Ошибки электрокардиодиагностики недопустимо часто приводят к тому, что пациенту назначается неправильное лечение, вплоть до операций по имплантации электрокардиостимулятора [6]. Очевидно, что обнаружение искажений в биомедицинском сигнале важно и актуально для обеспечения достоверности анализа полученной диагностической информации.
Обзор методов обнаружения и выделения помех, которые часто встречаются при регистрации того или иного медицинского сигнала, показал, что одним из перспективных и многообещающих средств решения проблемы является применение искусственных нейронных сетей (ИНС) [8]. В статье рассматривается возможность применения ИНС для обнаружения в электрокардиографическом сигнале искажений из-за помех.
Материалы и методы исследования
В настоящее время при решении прикладных задач в различных областях науки и техники активно исследуются и развиваются нейросетевые технологии. К таким задачам, успешно решаемым искусственными нейронными сетями, относятся прогнозирование и классификация [9]. Искусственные нейронные сети — это системы обработки информации, отличающиеся от обычных систем параллельным характером передачи информации и наличием процессов самообучения и саморегуляции для обеспечения заданной целевой функции [10]. Благодаря таким свойствам ИНС применяют в медицинской диагностике в целях повышения достоверности полученных данных о функциональном состоянии организма человека в процессе обработки биоэлектрических сигналов.
ИНС представляет собой систему взаимодействующих нейронов, каждый из которых выполняет определенное функциональное преобразование над
сигналами [11, 12]. Адаптация и самоорганизация искусственных нейронных сетей достигается в процессе их обучения. Целью обучения нейронных сетей является подстройка их весов, обеспечивающая для некоторого множества входов требуемое множество выходов. При решении прикладных задач с помощью нейронных сетей необходимо иметь представительный объем данных для обучения нейронной сети в целях последующего выполнения целевой функции. Обучающий набор данных — это набор наблюдений, содержащих признаки изучаемого объекта [13].
В общем случае обучение обеспечивает такой выбор параметров сети, при котором сеть эффективно решает заданную целевую функцию. По сути, обучение — это задача многомерной оптимизации, для решения которой существует множество алгоритмов [14].
В работе рассматривается нейронная сеть типа «многослойный персептрон» (МП), состоящая из одного входного, двух скрытых и одного выходного слоев. Количество элементов во входном слое определяется размером входного массива, характеризующего электрокардиоинтервал. Каждый из входов соединен с нейронами скрытого слоя. Выходной слой имеет три выхода, которые соответствуют трем классам: «допустимый ЭКС», «НЧ искажения» и «ВЧ искажения». Отсчеты кардиоцик-ла поступают на входы, обрабатываются скрытым слоем, после чего принимается решение о принадлежности сигнала к одному из трех вышеуказанных классов.
Создание и обучение НС осуществлялись в среде MatLab. При обучении НС использовались следующие параметры:
• алгоритм обучения — градиентный метод обратного распространения ошибки с моментом;
• количество циклов обучения — 10 000;
• минимальная ошибка, при достижении которой прерывается обучение, — 0,0001.
В работе [17] показано, что выбор таких параметров способен обеспечить эффективные результаты обучения НС.
Строгой теории выбора оптимального количества скрытых слоев и нейронов в скрытых слоях пока не существует. В общем случае на практике количество нейронов в скрытых слоях выбирают
а)
1
0,8 0,6 0,4 0,2 0
б)
100 200 300 400
0,4 0,2 0
Таблица 11 Обучающая и тестовая БД
Класс искажения Обозначение выхода ИНС Обучающая БД Тестовая БД
Сигнал без помех 40 25
Низкочастотные искажения 40 25
Высокочастотные искажения ^3 25 25
в диапазоне от Их/2 до 3ИХ, где Их — количество элементов (размер входного массива) во входном слое [18]. Проведенные в работе [17] исследования показали, что выбор необходимого количества нейронов в скрытых слоях МП можно осуществить по формуле, являющейся следствием из теорем Ар-нольда—Колмогорова—Хехт—Нильсена, согласно которой количество нейронов скрытого слоя определяется как 2ИХ + 1. В той же работе исследована структура МП, в процессе обучения которой количество нейронов скрытого слоя изменялось от 1 до 610 с шагом 10, и показано, что при таких параметрах исследования нейросеть эффективна.
Исходя из выше изложенного и учитывая, что в нашей работе ширина временного окна кардио-цикла составляет около 0,85 с при частоте дискретизации 360 Гц, размер входного массива Их = 306, для исследования структуры МП можно взять такие же исходные данные.
В качестве обучающего набора данных используются записи ЭКГ, снятые у группы условно здоровых людей (1-е отведение), в том числе содержащие типовые низкочастотные и высокочастотные искажения. В качестве исходной информации используется кардиоцикл, по форме и параметрам которого традиционно анализируется работа сердца. Поэтому каждый ЭКС был сегментирован на отдельные кардиоциклы (КЦ). Полученный объем данных по КЦ был разделен на две независимые базы данных: обучающую и тестовую, как показано в табл. 1.
Таким образом, обучающая база включала 105 кардиоциклов, разделенных на три класса: первый класс (допустимый ЭКС) — 40; второй класс (КЦ с низкочастотными искажениями ) — 40; третий класс (КЦ с высокочастотными искажения-
в)
100 200 300 400
0,8 0,6 0,4 0,2 0
100 200 300 400
Рис. 1
Примеры типичных КЦ: а — допустимый ЭКС; б — ЭКС с низкочастотным искажением, в — ЭКС с высокочастотным искажением
1
Таблица 21 Структура соответствия состояния входов и выходов ИНС
X! Х2 Хз ХМ У1 У2 Уз
Допустимый ЭКС 1 0 0
ЭКС с низкочастотными искажениями 0 1 0
ЭКС с высокочастотными искажениями 0 0 1
Нейросетевой модуль 1
Рис. 2
Модульный вариант построения нейронной сети для распознавания артефактов в ЭКС:
М — количество элементов образа ЭКС; K — число нейронов
ми) — 25. Тестовая база данных включала 75 КЦ, разделенных на три одинаковых по объему данных класса. На рис. 1 приведены типичные примеры КЦ из каждой группы.
Для обучения нейронной сети использовалась структура соответствия состояний ее входов и выходов (кодирование), приведенная в табл. 2. Здесь Х1, ..., Xм — вектор значений ЭКС, M = 306 входов МП, У1 — выход, соответствующий допустимому ЭКС (без искажений), Y2 — выход, соответствующий ЭКС с низкочастотными искажениями, Yз — выход, соответствующий ЭКС с высокочастотными искажениями.
Для распознавания типа искажений в электро-кардиосигнале на основе ИНС был выбран модульный вариант нейронной сети (рис. 2), который состоит из трех параллельно расположенных нейро-сетевых модулей, построенных на основе структуры многослойного персептрона (МП). Преимуществом такой структуры является то, что каждый модуль концентрирует свои ресурсы на распознавание только одного класса ЭКС, что должно уменьшить вероятность ошибки неверного заключения
для всей системы в целом [16]. Также модульная организация системы позволяет расширять функциональные возможности ИНС путем увеличения количества модулей, а следовательно, количество доступных для распознавания артефактов в ЭКС без переобучения всей системы.
Выбор функции активации и количества скрытых слоев
Существует множество факторов, которые могут повлиять на обучение МП. К ним относятся выбор архитектуры, инициализация весов и выбор данных обучения. Немаловажную роль играет выбор передаточной функции (функции активации) [15]. Существует множество функций активации, самые известные — линейная, сигмоидальная, гиперболический тангенс, экспонента и гауссова кривая. В работе [16] исследованы наиболее распространенные и часто применяемые для биомедицинских задач функции активации, а именно линейная, сиг-моидальная и гиперболический тангенс. Анализ
■в
2 н § &
и й 2 н
13 н
® Ь
2 О & °
£ з
й м
о §
н
и &
о
И
^
79 77 75 73 71 69 67 65
— равная;
— сужающаяся;
— расширяющаяся
200
400 600
Количество нейронов
800
1000
Рис. 3
Зависимость скользящего среднего значения чувствительности и специфичности от общего количества нейронов в скрытых слоях
результатов показал, что наиболее стабильной является НС с сигмоидами и линейным выходом. Из анализа литературных источников следует, что сигмоидальная функция более глубоко изучена и чаще применяема по сравнению с гиперболическим тангенсом. Очевидно, что предпочтительным вариантом МП для решения поставленной задачи распознавания артефактов в электрокардиосигнале является НС с линейным выходом и сигмоидальными функциями в двух скрытых слоях.
Известно, что эффективность функционирования нейронной сети прямо зависит от количества скрытых слоев. В работе [16] исследовалось влияние количества скрытых слоев на эффективность работы нейронной сети. Результаты обучения МП с двумя скрытыми слоями показали свое превосходство по сравнению с результатами обучения сети с одним скрытым слоем. Поэтому в нашей работе использовался МП с двумя скрытыми слоями. Анализ литературы показывает, что дальнейшее увеличение количества скрытых слоев нецелесообразно, поскольку это слабо влияет на результат обучения.
Выше был обоснован выбор нейронной сети с двумя скрытыми слоями. В таком случае возникает вопрос о соотношении количества нейронов между первым и вторым скрытыми слоями. Для определения количества нейронов в слоях была поставлена задача исследования эффективности работы МП для трех возможных вариантов соотношения количества нейронов в скрытых слоях:
1) количество нейронов в первом скрытом слое равно количеству нейронов во втором скрытом слое (П1 = п2), где П1 — количество нейронов в первом скрытом слое, а П2 — количество нейронов во втором скрытом слое;
2) количество нейронов в первом скрытом слое в два раза меньше количества нейронов во втором скрытом слое (п1 = 2п2);
3) количество нейронов в первом скрытом слое в два раза больше количества нейронов во втором скрытом слое (2п1 = п2).
Первый вариант структуры МП можно условно назвать равной сетью, а второй и третий — рас-
ширяющейся и сужающейся сетями соответственно. На рис. 3 представлен результат этого исследования.
По оси абсцисс отложено общее количество нейронов в скрытых слоях, в то время как по оси ординат откладывается скользящее среднее значение чувствительности и специфичности (критерии эффективности работы ИНС). Анализ графиков показывает, что наиболее высокие результаты имеет НС сужающейся структуры, т. е. сеть, количество нейронов которой в первом скрытом слое в два раза больше количества нейронов во втором скрытом слое. В литературе считается, что такой тип сетей применяется в задачах, связанных с обобщением информации, что является преимуществом этой сети по сравнению с другими видами структур.
В результате проведенных исследований вариантов реализации ИНС для решения задачи обнаружения артефактов в ЭКС была выбрана нейросеть со следующими характеристиками:
1) модульная структура;
2) два скрытых слоя;
3) сужающаяся структура скрытых слоев, т. е. количество нейронов в первом скрытом слое в два раза больше количества нейронов во втором скрытом слое;
4) сигмоидальная функция активации в обоих скрытых слоях и линейная на выходе.
Выбор оптимального количества нейронов скрытых слоев
Кроме выбора указанных выше параметров нейронной сети необходимо определить оптимальное количество нейронов скрытых слоев для каждого класса. Для этого была исследована зависимость чувствительности и специфичности от количества нейронов в скрытых слоях.
Для оценки эффективности функционирования МП применяются известные критерии [17]: чувствительность, которая характеризует спо-
0
Приборостроение, метрология и информационно-измерительные приборы и системы
5
6
о о и № н
ф & &
ti я ф ф
ft н
U V
ф а ф и
я в
105 100 95 90 85 80 75 70 65 60 55
— допустимый ЭКС;
— НЧ искажения;
— ВЧ искажения
0
100 200 300 400
Количество нейронов
500
600
700
Рис. 4 Графики зависимости среднего значения чувствительности и специфичности от количества нейронов скрытых слоев
собность НС обнаруживать присутствие искомого класса ЭКС и определяется как
* = ДП , ДП + ЛО
и специфичность, которая показывает точность определения отсутствия других классов ЭКС и оп-ределяется как
ДО
С = .
ДО + ЛП
В приведенных формулах: ДО — достоверно-отрицательный результат тестирования; ЛП — ложноположительный результат тестирования, ДП — достоверноположительный результат тестирования, ЛО — ложноотрицательный результат тестирования.
Для выбора оптимального количества нейронов необходимо принимать во внимание оба параметра (чувствительность и специфичность). Поскольку оценка по одному параметру может противоречить оценке по другому, было решено использовать среднее значение чувствительности и специфичности для каждой конфигурации. Тогда можно считать,
Таблица 3 Оптимальное количество нейронов скрытых слоев для каждого класса
Параметр Класс 1 «допустимый ЭКС» Класс 2 «НЧ искажения» Класс 2 «ВЧ искажения»
Количество нейронов первого скрытого слоя п1 11 161 181
Количество нейронов второго скрытого слоя П2 6 81 91
Чувствительность 100 100 72
Специфичность 100 74 94
что оптимальное количество нейронов скрытых слоев — это то количество нейронов, при котором сумма чувствительности и специфичности является максимальной. На рис. 4 приведены результаты исследования зависимости эффективности нейронной сети от количества нейронов скрытых слоев. На графике показано лишь количество нейронов первого скрытого слоя щ. Количество нейронов во втором скрытом слое зависит от количества ней-
Layer
Layer
Layer
Input
Output
OO—t-O
J
Допустимый ЭКС
11
Layer
6
Layer
1
Layer
ГГ
(7) tx >—C-Q
НЧ искажения
161 Layer
81 Layer
1
Layer
306
тТГвИНтТ ©x
ВЧ искажения
-txi—¡>0
181
91
Рис. 5 \ Модульная структура ИНС для распознавания наличия артефактов в ЭКС
1
1
1
1
ронов в первом скрытом слое и выражается через формулу П2 = П1/2.
Приведенные на рис. 4 графики показывают зависимость среднего значения чувствительности и специфичности от количества нейронов в скрытых слоях для каждого класса. Наиболее высокие результаты имеет класс «допустимый ЭКС», который представляет собой кардиоциклы допустимого качества, т. е. класс данных с высокой диагностической значимостью. На основе полученных результатов выбрано оптимальное количество нейронов скрытых слоев для каждого класса, соответствующее максимальному среднему значению чувствительности и специфичности.
В табл. 3 приведены максимальные значения чувствительности и специфичности при оптимальном количестве нейронов скрытых слоев для каждого класса. Из таблицы видно, что для первого класса оптимальное количество нейронов составляет: 11 — в первом скрытом слое, 6 — во втором скрытом слое. При таком количестве нейронов чувствительность и специфичность сети достигают максимального возможного значения 100. Для второго класса оптимальное количество нейронов составляет: 161 — в первом скрытом слое, 81 — во втором скрытом слое. При таком количестве нейронов чувствительность сети достигает максимального возможного значения 100, а специфичность — 74. Значения чувствительности и специфичности для третьего класса составляют 73 и 94 соответственно при количестве нейронов, равном 181 в первом скрытом слое и 91 во втором скрытом слое.
Результатом всех вышеприведенных исследований является модульная структура ИНС, приведенная на рис. 5.
Заключение
Электрокардиография широко применяется в медицине и экспериментальной физиологии, так как позволяет исследовать динамику распространения возбуждения в сердце, а также судить о различных функциональных нарушениях сердечной деятельности [1].
Контроль и повышение качества электрокардиографического сигнала являются весьма актуальными задачами, поскольку от решения зависят достоверность анализа ЭКГ пациентов и дальнейшее лечебное воздействие. Следовательно, необходимо разработать методы и алгоритмы для оценки качества ЭКГ-сигнала и повышения его диагностической значимости. В литературе насчитывается множество работ, посвященных этой проблематике, где применяются различные подходы для ее решения.
Анализ литературных источников показывает, что для решения подобных задач одним из перспективных и многообещающих методов является использование технологии искусственных нейронных сетей.
В статье приведены результаты исследования различных вариантов структур ИНС типа многослойного персептрона, а также зависимости эффективности работы нейросети от количества нейронов скрытого слоя. Это позволило выбрать и обосновать структуру нейросетевого классификатора для обнаружения искажений, вызванных помехами и шумами и, как следствие, снижающих качество ЭКС. Результаты исследования показали возможность эффективного применения ИНС типа многослойного персептрона для обнаружения искажений ЭКС.
Литература
1. Павлова О. Н., Павлов А. Н. Регистрация и предварительная обработка сигналов с помощью измерительного комплекса MP100: учеб. пособие. Саратов: Науч. кн., 2008. 80 с.
2. Рангайян Р. М. Анализ биомедицинских сигналов. Практический подход. М.: Физматлит, 2007.
3. Козюра А. В. Оценка диагностической значимости электрокардиографического сигнала // Тр. Х Междунар. науч. конф. «Физика и радиоэлектроника в медицине и экологии». Владимир, 2012. Т. 1. С. 152-155.
4. Garcha-NiebIa. J. Technical Mistakes during the Acquisition of the Electrocardiogram / P. Llontop-Garraa, J. I. Valle-Racero, G. Serra-Autonell [et al.] // Ann. Noninvasive Electrocardiology. 2009. N 14 (4). P. 389-403.
5. Качество врачебных заключений по данным суточного мониторирования ЭКГ / Ю. В. Шубик, И. В. Апарина, М. М. Медведев, А. П. Фельдман // Вестн. аритмологии. 2007. № 49. С. 25-34.
6. Clinical consequences of electrocardiographic artifact mimicking ventricular tachycardia / B. P. Knight, F. Pelosi, G. F. Michaud [et al.] // N. Eng. Jurn. Med. 1999. N 341. P. 1270-1274.
7. Reducing false alarm rates for critical arrhythmias using arterial blood pressure waveform / A. Abokuhall, L. Nielsen, M. Saeed [et al.] // Journ. of Biomedical Informatics. 2008. Vol. 41, is. 3. P. 442-451.
8. Аль-Хайдри В. А., Исаков Р. В., Сушкова Л. Т. Обзор основных методов обнаружения артефактов в биомедицинских сигналах. ФРЭМЭ-2014. С. 379-382.
9. Слепнев Е. С. Применение искусственных нейронных сетей для анализа предаварийных ситуаций турбоагрегатов электростанций // Интернет-журнал «Науковедение». 2014. Вып. 3.
10. Аль-Хулейди Н. А., Исаков Р. В., Сушкова Л. Т. Исследование методов кодирования выходов искусственных нейронных сетей при классификации вариабельности сердечного ритма // Нейрокомпьютеры: разработка, применение. 2013. № 6. С. 48-54.
11. Hassoun M. H. Fundamentals of Artificial Neural Networks. The MIT Press, 1995. 511 p.
12. Лекричевский М. Интеллектуальные методы в менеджменте. СПб.: Питер, 2005. 304 с.
13. Калацкая Л. В., Новиков В. А., Садов В. С. Организация и обучение искусственных нейронных сетей: учеб. пособие. Минск, 2002.
14. Заенцев И. В. Нейронные сети: основные модели: учеб. пособие. Воронеж: Воронеж. гос. ун-т, 1999.
15. Piekniewski F., Tybicki L. Visual comparison of performance for different activation functions in MLP networks // Proceedings of International Joint Conference on Neural Networks: IJCNN '04. 2004. Vol. 4. Р. 2947-2952.
16. Аль-Хайдри В. А., Исаков Р. В., Сушкова Л. Т. Исследование влияния выбора функций активации на эффективность работы многослойного персептрона // Нейрокомпьютеры: разработка и применение. 2015. № 7. С. 60-66.
17. Аль-Хулейди Н. А., Исаков Р. В., Сушкова Л. Т. Результаты исследования нейронных сетей в задачах распознавания вариабельности сердечного ритма // Нейрокомпьютеры: разработка, применение. 2012. № 6. С. 61-67.
18. Ясницкий Л. Н. Искусственный интеллект: популярное введение для учителей и школьников. http://inf.1september. ru/view_article.php?ID=200902304