УДК 004.352.242
ПРИМЕНЕНИЕ НЕЙРОННОЙ СЕТИ И ДИСКРЕТНОГО ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ ДЛЯ АНАЛИЗА И КЛАССИФИКАЦИИ ЭЛЕКТРОКАРДИОГРАММ
Д.С. Григорьев, В.Г. Спицын
Томский политехнический университет E-mail: [email protected]
Разработана и представлена система для анализа и классификации оцифрованных электрокардиограмм на основе применения вейвлет-преобразования и искусственной нейронной сети. Осуществлен выбор оптимальной конфигурации элементов системы. Проанализированы результаты численных экспериментов по распознаванию электрокардиограммы с аритмией и нормальным синусоидальным ритмом.
Ключевые слова:
Оцифрованные электрокардиограммы, вейвлет-преобразование, аритмия, искусственные нейронные сети, вейвлеты Добеши. Key words:
Digital electrocardiograms, wavelet transform, arrhythmia, artificial neural networks, Daubeches wavelets.
Введение
В электрокардиографии для обнаружения, извлечения и анализа различных компонентов электрокардиограммы (ЭКГ) применяются различные методы обработки цифровых сигналов.
Классическим приемом, применяемым для анализа ЭКГ, является использование известных методов анализа характеристик сигнала в зависимости от времени (стандартное ЭКГ-измерение, измерение частоты сердечных сокращений, определение дисперсии реполяризации) [1].
Следует отметить, что указанные методы анализа характеристик сигнала не всегда позволяют описать все существенные особенности ЭКГ Например, определение позднего потенциала, расположенного в комплексе QRS, не может быть выполнено с использованием таких методов. Тем не менее, анализ временной области частоты сердечных сокращений дает полную информацию о поведении RR-интервалов и парасимпатическом воздействии. Однако анализ симпатического упорядочивания не может быть проведен на основе измере-
ний частоты сердечных сокращений во временной области [1]. Использование аппарата вейвлет-анализа позволяет получать исчерпывающую информацию, находящуюся как во временной, так и в частотных областях.
Возможность одновременного анализа частотной и временной областей обосновывает выбор аппарата вейвлет-преобразования для анализа ЭКГ, который с успехом применяется в анализе частотно-временных характеристик компонент сигнала [1, 2].
Задачу диагностирования отклонений от нормы, в данном случае на ЭКГ, можно отнести к задаче распознавания образов. Применение в данной работе искусственной нейронной сети в качестве классификатора обусловлено ее способностью к обработке нечетких и сложных исходных данных для их классификации [3].
Целью данной работы является разработка метода распознавания отклонений от нормы на ЭКГ на основе совместного применения дискретного вейвлет-преобразования (ДВП) и искусственной нейронной сети (НС).
Рис. 1. ЭКГ нормального синусоидального ритма в отведениях: а) одном; б) двух
Исходные данные
Исходные данные, которые были использованы при тестировании системы, представляют собой оцифрованные сигналы ЭКГ в различных отведениях. Оцифрованные ЭКГ представляли собой вектора значений потенциала (напряжения), снятых с частотой 128 Гц за 10 с. Используемый набор состоит из 173 ЭКГ, включает в себя сигналы аритмии, а также нормального синусоидального ритма. Все сигналы взяты из открытой базы данных MIT [4].
Одномерное дискретное вейвлет-преобразование
В отличие от преобразования Фурье, базисными функциями которого являются гармонические функции, вейвлет-преобразование основано на разложении по функциям, изменяющейся частоты и ограниченным повремени [5]. Вейвлеты является приемлемым инструментом для обработки сигналов, позволяющим проводить анализ в нескольких временных масштабах локальных свойств нестационарного сигнала.
Как известно, кратномасштабный анализ инвариантен к целочисленным сдвигам по временной оси и по отношению к растяжениям, кратным степеням 2. В данной работе для получения коэффициентов разложения исходного сигнала выбирается метод кратномасштабного анализа.
Так как электрокардиограмма представляет собой функцию одного аргумента, то, задав масштабирующую и вейвлет-функции, выполним алгоритм быстрого вейвлет-преобразования (БВП). Семейство базисных функций, определенное с помощью операций сдвигов и изменений масштаба имеет вид:
<р( 2 J х - к) = X\(т - 2к)у/2<р(2]'+1 - т), (1)
т
(2 Jx - к) = X (т - 2к)V2 (2J +1 - m). (2)
m
Здесь ht, hv - масштабные коэффициенты масштабирующей и вейвлет-функции.
Аналогично разложению в ряд Фурье, разложение в вейвлет-ряд ставит в соответствие непрерывной функции последовательность коэффициентов. В нашем случае разложение определяется следующими преобразованиями:
W(^ к) = -т= X f( x)<J к( х) (3)
yjM х
% и, к) = X /((х)- (4)
Здесь х=0,1,2,...,М-1: /=0,1,2,.../-1, ¿=0,1,2,...,2". Коэффициенты, описываемые ур. (3) и (4), являются соответственно коэффициентами аппроксимации и детализации. Для реализации вычислений ДВП, используется взаимосвязь между коэффициентами ДВП соседних масштабов. Коэффициенты самого крупного масштаба - исходные данные для последующих вычислений, W<f(J,n)=f(x), где J- самый крупный масштаб [6].
В нашем случае, блок фильтров, рис. 2, используется в качестве базового элемента для итеративной многоступенчатой структуры вычисления БВП - коэффициентов в двух последовательных масштабах.
Тип вейвлет-функции
Для того чтобы в полной мере использовать свойство внутренней симметричности кратномасштабного анализа, требуется фактическое построение базисных масштабирующей и вейвлет-функций, удовлетворяющих условиям ортонормирован-ности. Таковыми являются вейвлеты Добеши - это непрерывные не тождественные нулю и недифференцируемые на конечном отрезке функции. Область задания у ортонормальных вейвлетов Доб-еши шире, чем у вейвлетов Хаара, они обеспечивают при вейвлет-преобразовании большее количество малозначимых коэффициентов разложения, сохраняя информационную ценность исходных данных.
Тип используемой вейвлет-функции - функция Добеши 4 порядка. Порядок функции обусловлен величиной вектора коэффициентов аппроксимации. При его увеличении соответственно растет вектор коэффициентов, поданный на входной слой нейронной сети, что ведет к возрастанию вычислительной сложности. Примеры результатов работы блока вейвлет-преобразования представлен на рис. 3, 4.
Уровень вейвлет-преобразования
В результате применения ДВП к ЭКГ происходило извлечение коэффициентов аппроксимации и коэффициентов детализации. В дальнейшем использовался только набор коэффициентов аппроксимации: в качестве точки отсчета для последующего применения блока фильтров БВП, а также
Рис. 2. Блок фильтров ДВП анализа
2 Коэффициенты аппроксимации
1 1 1 1 1 1 1 1 1
0 1 “
1 1 1 I I 1 1 1 1
200 400 600 800 1000 1200 1400 1600 1800 2000
б
Рис. 3. Сигнал ЭКГ с аритмией в отведении V5: а) исходный; б, в) представленный в виде коэффициентов аппроксимации идетализации
б
Рис. 4. Коэффициенты после повторного применения блока БВП: а) детализации; б) аппроксимации
в качестве входного сигнала для нейронной сети. Результат тестирования показал, что оптимальное количество применения блоков БВП фильтров равно 2. При каждом последующем применении блока БВП размер вектора коэффициентов аппроксимации сокращается вдвое, при уменьшающейся информативности самого вектора, а также при понижении процента распознавания.
Используя только один уровень применения БВП фильтра, получаем большую размерность вектора коэффициентов, что существенно уменьшает скорость сходимости нейронной сети. Таким образом, при исходном количестве в 3600 значений, после применения блока фильтров БВП размерность вектора коэффициентов сокращается до 1800.
Применение двухуровневого БВП преобразования показало наилучшую скорость сходимости нейронной сети при обучении и высокий процент распознавания.
Нейронная сеть
Искусственные нейронные сети с их высокой способностью извлекать требуемые значения из сложных или неточных исходных данных, часто используются в качестве классификатора для распознавания образов [3]. Еще одно положительное качество НС - это обнаружение характерных свойств исследуемых объектов, сложных для их обнаружения людьми или же некоторыми машинными средствами. Именно поэтому НС являются одними из самых эффективных методов классификации образов.
Выходной сигнал каждого отдельного нейрона выходного слоя определяется выражением:
( к ( N
Ук = f
Z wk
i=0
f
Z wx
v>°
(5)
В качестве активационной функции каждого отдельного нейрона была выбрана непрерывная сигмоидальная биполярная функция, так как для разработки обучающего правила необходима дифференцируемость вдоль всех связей НС [5]:
f (х) = th( х). (6)
Функционирование нейронной сети происходит в два этапа: обучения и тестирования. Для обучения НС выбрано три алгоритма:
• Левенберга-Марквардта;
• Сопряженных градиентов;
• Обратного распространения ошибки.
Пусть у=[у1,у2,---,уи]г' - вектор фактических выходных сигналов; d=[d1,d2,...,dJT- вектор ожидаемых выходных сигналов; - весовые значения синапсов.
В этом случае целевая функция минимизации ошибки алгоритмов обучения имеет вид:
1 M
E (W) = - Zfe (W)]2,
2 /=1
(7)
где в(Щ=[у (Щ-й].
Преимущество алгоритма обратного распространения ошибки состоит в относительно простой реализации. Однако он не гарантирует нахождение глобального минимума целевой функции. В частности, реализованный в алгоритме градиентный спуск может привести к нахождению локального минимума, вместо глобального.
Алгоритм сопряженных градиентов при достаточно хорошем начальном приближении обладает приемлемой производительностью. Однако при его применении существует проблема остановки в локальном минимуме. Алгоритм Левенберга-Марквардта сочетает в себе свойства градиентного спуска и метода Гаусса-Ньютона, и в отличие
от метода сопряженных градиентов использует матрицу Якоби вместо градиента вектора параметров.
Результаты экспериментов
Все части системы были реализованы и протестированы при помощи пакетов разработки Microsoft Visual Studio 2010 и MATLAB. Результаты работы системы представлены в табл. 1, 2.
Таблица 1. Результаты распознавания на обучающей и тестовой выборках
Алгоритм обучения Размер обучающей выборки Время обучения, мин. Время тестирования, мин. Процент распознавания на обучающей выборке, % Время тестирования, мин. Процент распознавания на тестовой выборке, %
Левенбер- га-Марквардта 20:17 05:13 100 04:09 89
Сопряженных градиентов 173 29:43 03:45 100 02:10 69
Обратного распространения ошибки 38:21 04:12 100 03:11 76
Результаты численных экспериментов, представленных в табл. 1, показывают, что наибольшей классификационной точностью обладает алгоритм Левенберга-Марквардта - 89 %.
Так как разрабатываемый метод представляет собой разновидность диагностического метода, то следует обратиться к способам оценки результативности метода, применяемым в доказательной медицине. Результат пригодности системы по данным оценкам приведен в табл. 2.
Таблица 2. Результаты оценки методов
Алгоритм обучения Чувствительность, % Специфичность, %
Левенберга-Мар- квардта 91,5 86,8
Сопряженных градиентов 69,4 68,7
Обратного распространения ошибки 75,0 77,1
Из табл. 2 видно, что близкие показатели значений чувствительности и специфичности работы сети после обучения алгоритмом сопряженных градиентов говорят о его несбалансированности по ложноположительным и ложноотрицательным диагнозам. Основные показатели пригодности системы для диагностирования оказались наилучшими после обучения алгоритмом Левенберга-Мар-квардта. Алгоритм обладает достаточно высокой чувствительностью в 91 %, а специфичность составила почти 87 %. Этот факт в совокупности с высоким показателем классификационной точности делает данный алгоритм более приемлемым для использования его в дальнейшем.
Заключение
1. Предложен метод анализа и классификации ЭКГ, заключающийся в вейвлет-анализе сигналов и нейросетевом распознавании образов на основе многослойного персептрона.
2. Осуществлен выбор оптимальных вариантов базисной вейвлет-функции и алгоритма обучения персептрона. Ими оказались вейвлет-функция Добеши четвертого порядка и алго-
ритм Левенбергам-Марквардта для обучения нейронной сети.
3. Работоспособность разработанного метода диагностирования была доказана на основе численных экспериментов.
4. Следующим этапом разработки системы будет ее оптимизация и тестирование на более длительных сигналах с целью диагностирования более широкого спектра заболеваний.
СПИСОК ЛИТЕРАТУРЫ
1. Бойцов С.А., Гришаев С.Л., Солнцев В.Н., Кудрявцев Ю.С. Анализ сигнал-усредненной ЭКГ (по данным вейвлет-преобразования) у здоровых и больных ИБС // Вестник аритмоло-гии. - 2001. - №23. - С. 32-34.
2. Misiti M., Misiti Y., Oppenheim G., Poggi J. Wavelets and their applications. - London: ISTE. - 2007. - 352 с.
3. Блаттер К. Вейвлет-анализ. Основы теории. - М.: Техносфера. - 2004. - 280 с.
4. Открытая база данных ЭКГ MIT. 2012. URL: http://www.phys-ionet.org/cgi-bin/atm/ATM (дата обращения 30.01.2012).
5. Добеши И. Десять лекций по вейвлетам. - Ижевск: Регулярная и хаотическая динамика. - 2001. - 464 с.
6. Гонсалес Р., Вудс Р. Цифровая обработка изображений. - М.: Техносфера, 2006. - 1072 с.
Поступила 17.09.2012 г.
УДК 519.174.1
ЗАДАЧА РАЗБИЕНИЯ МНОЖЕСТВА ОБЪЕКТОВ ТЕРРИТОРИАЛЬНО РАСПРЕДЕЛЕННОЙ СИСТЕМЫ НА ПОДМНОЖЕСТВА НЕРАВНОЙ МОЩНОСТИ
Ал.В. Погребной, В.К. Погребной
Томский политехнический университет E-mail: [email protected]
Рассмотрена задача компактного разбиения множества объектов территориально распределенной системы на подмножества, число и мощность которых может меняться в заданных интервалах значений. Введено понятие естественных и относительных скоплений объектов. Разработан метод выделения скоплений, использующий компактные множества объектов и полученные на их основе функцию плотности и граф парных пересечений компактных множеств. Решение задачи разбиения сведено к установлению максимального соответствия между скоплениями и подмножествами.
Ключевые слова:
Задача разбиения, компактное множество, скопление объектов, функция плотности, граф парных пересечений.
Key words:
Decomposition task, compact set, collection of objects, density function, graph of the pair intersections.
Объекты территориально распределенных технических систем во многих случаях объединяются в иерархическую структуру, реализующую функции сбора данных, контроля и управления. Множество объектов на нижнем уровне иерархии разбиваются на подмножества, подключаемые к своему центру. В свою очередь, центры также могут группироваться в подмножества и подключаться к центрам более высокого уровня. Ниже исследуется задача формирования совокупности множеств объектов нижнего уровня иерархии. Принимается, что координаты размещения объектов на территории (топологическом поле [1]) известны, а фактор расстояний между объектами и центрами их подключения играет важную роль.
Задача компактного разбиения множества объектов, заданных координатами на топологиче-
ском поле, на подмножества равной мощности подробно рассмотрена в [1, 2]. Для алгоритма решения данной задачи, предложенного в [1], условие равной мощности подмножеств является существенным. Вместе с тем, во многих практических приложениях условие равной мощности подмножеств рассматривается как недостаток данного алгоритма. Очевидно, что этот недостаток в большей мере проявляется в тех случаях, когда объекты на топологическом поле расположены неравномерно. Кроме того, допускается, что число объектов подключаемых к центру, может меняться в некотором заранее установленном интервале. В этих условиях для решения задачи важно уметь выявлять компактные скопления объектов, мощность которых не выходит за пределы интервала значений мощностей, установленных для подмножеств.