Научная статья на тему 'Информационная система прогнозирования восстановления ритма у больных с фибрилляцией предсердий (диск_з)'

Информационная система прогнозирования восстановления ритма у больных с фибрилляцией предсердий (диск_з) Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
56
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВАРИАБЕЛЬНОСТЬ РИТМА СЕРДЦА / ДИАГНОСТИКА / ДЕРЕВО РЕШЕНИЙ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Баллод Борис Анатольевич, Муромкина Анна Владимировна, Ковалев Денис Евгеньевич

Приведены результаты многомерного интеллектуального анализа вариабельности ритма сердца у больных с фибрилляцией предсердий. Разработана модель принятия решений и еt программная реализация, позволяющая диагностировать пароксизмальную форму нарушения ритма сердца.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Баллод Борис Анатольевич, Муромкина Анна Владимировна, Ковалев Денис Евгеньевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Информационная система прогнозирования восстановления ритма у больных с фибрилляцией предсердий (диск_з)»

УДК 004.896

Информационная система прогнозирования восстановления ритма у больных с фибрилляцией предсердий (ДИСК_З)

Баллод Б.А., канд. техн. наук, Муромкина А.В., канд. мед. наук, Ковалев Д.Е., студ.

Приведены результаты многомерного интеллектуального анализа вариабельности ритма сердца у больных с фибрилляцией предсердий. Разработана модель принятия решений и е! программная реализация, позволяющая диагностировать пароксизмальную форму нарушения ритма сердца.

Ключевые слова: вариабельность ритма сердца, диагностика, дерево решений.

Information System for Forecasting Heart Rhythm Restoration Patients with Fibrillation of Auricles (DISK_Z)

B.A. Ballod, Candidate of Engineering, A.V. Muromkina, Candidate of Medical Science, D.E. Kovalev, Student

The results of multidimensional intellectual analysis of heart rhythm variability of patients with fibrillation of auricles are given. Decision-making model and its program implementation allowing to diagnose Bouveret's disease the form of disturbance of heart rhythm are developed.

Keywords: heart rhythm variability, diagnostics, a tree of decisions.

К наиболее трудоемким задачам медицины относятся постановка диагноза и выбор курса лечения. Традиционно врачи решали эти задачи, полагаясь лишь на собственную интуицию и опыт. Сегодня в их арсенал все чаще входят способы, основанные на высоких технологиях и позволяющие обрабатывать большие потоки информации. Для этой цели применяются разнообразные регрессионные модели, основанные на применении технологии интеллектуального анализа данных (Data Mining): деревья решений, нейронные сети, карты Кохонена и др.

Анализ вариабельности ритма сердца (ВРС) является неотъемлемой частью обследования кардиологических больных. В последние годы предпринимаются попытки оценки ВРС у больных с фибрилляцией предсердий (ФП). Разброс кардиоциклов объясняется отсутствием единого водителя ритма и особенностями атриовентрикулярного поведения при ФП.

Цель исследования - разработка интеллектуальной системы принятия решений о вероятности восстановления синусового ритма у больных с фибрилляцией предсердий.

На базе Data Mining легко создавать экспертные системы для диагностики заболеваний, которые используют накопленные данные клинических исследований, автоматически выявляют значимые признаки и моделируют сложные зависимости между симптомами и заболеваниями.

Для проведения анализа была составлена обучающая выборка, содержащая значения факторов ВРС пациентов кардиологического диспансера (объемом более 100). После исключения выбросов и пропусков объем выборки, фрагмент которой представлен в табл. 1, составил N = 85.

Таблица 1. Фрагмент обучающей выборки

ФИО Пет*** Афе****

Группа А А

TP 11379 21513

VLF 1611 1726

LF 2094 4568

HF 7675 15219

RRNN 704 517

SDNNf 131 149

SDNNf \RRNNf 0,186 0,288

Ста*’

В

29072

2175

6572

20325

709

190

0,268

Фед*'

А

32528

5393

9532

17602

903

195

0,216

Абр*'

В

24624

2124

6790

15710

769

175

0,228

и т.д.

Примечания. Группа А - пароксизмальная форма нарушения ритма; группа В - постоянная форма нарушения ритма; TP - общая мощность спектра ритмограммы; VLF - очень медленные волны; LF - медленные волны; HF - быстрые волны; RRNN - средняя продолжительность интервала между кардиоциклами; SDNNf - стандартное отклонение, квадратный корень из разброса интервалов RR; SDNNf \RRNNf -отношение стандартного отклонения к средней продолжительности интервала между кардиоциклами.

Задачи классификации с большим успехом решаются одним из методов Data Mining -при помощи деревьев решений. Деревья решений - классификатор, полученный из обучающего множества, содержащего объекты и их характеристики, на основе обучения. Дерево состоит из листьев, указывающих на класс, и узлов, содержащих правила классификации. Оно может использоваться для классификации объектов, не вошедших в обучающее множество. Получаемая модель - это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.

Результат построения дерева приведен на

рис. 1.

121

VLF

21 3

SDNN \ SDNN

Рис. 1. Пример построения дерева решений (число узлов - 9; число терминальных вершин - 10)

Полученную модель можно использовать при определении класса заболевания, к которому следует отнести вновь поступившего больного. Среди множества алгоритмов построения деревьев решений часто используется алгоритм C&RT (сокращение от Classification And Regression Tree -«Дерево Классификации и Регрессии»). Основными отличиями алгоритма CART являются:

• бинарное представление дерева решений;

• функция оценки качества разбиения;

• механизм отсечения дерева;

• алгоритм обработки пропущенных значений;

• построение деревьев регрессии.

В алгоритме C&RT каждый узел дерева решений имеет двух потомков. На каждом шаге построения дерева правило, формируемое в узле, делит заданное множество примеров (обучающую выборку) на две части - часть, в которой выполняется правило (потомок right), и часть, в которой правило не выполняется (потомок left). Для выбора оптимального правила используется функция оценки качества разбиения.

В алгоритме C&RT оценка качества формализована в индексе Gini. Если набор данных Т содержит данные n классов, тогда индекс Gini определяется как

Gini, (T) = 1 -£ Pf,

i=i

где pi - вероятность (относительная частота) класса i в T.

При построении дерева все известные ситуации обучающей выборки сначала попадают в верхний узел, а потом распределяются по узлам, которые, в свою очередь, также могут быть разбиты на дочерние узлы. Критерий разбиения - различные значения какого-либо входного фактора. Для определения фактора, по которому будет происходить разбиение, используется показатель, называемый энтропия - мера неопределенности. Выбирается тот фактор, при разбиении по которому устраняется больше неопределенности. Неопределенность тем выше, чем больше примесей (объектов, относящихся к различным классам) находятся в одном узле. Энтропия равна нулю, если в узле будут находиться объекты, относящиеся к одному классу.

Построение дерева решений по алгоритму C&RT (полный перебор) реализовано соответствующим модулем пакета статистического анализа БТАТ^ТЮА, диалоговое окно которого показано на рис. 2.

И Деревья классификации : ТаблицаДА ? -

Быстрый | Дополнительно Методы | Параметры остановки | Опции выбора ] И OK 1

Тип вет 0

С Дискриминантное одномерное ветвление для катег. и порядковых предикторов С Дискриминантное ветвление по лин. комбинациям порядковых предикторов (* [Полный перебор для одномерных ветвлений по методу С&ПТ] Опции ▼ | (г3? Данные

Дискриминантные сетелен с не годе QUEST (Quick. U - Критерий согласия (• Мера Джини ( Хи-кваарат i (л-квадрат nbiased, Efficient Statistical Trees). Me -Априорные вероятности Оцениваемые Равные Пользовательские sfrl| чного дискриминантного анализа как тод C&RT осуществляет поиск - Цены ошибок классификации (• Равные Г Пользовательские Ы| 5ШСТ у | ^ g

Рис. 2. Диалоговое окно системы БТАТ^ТЮА © ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина»

В табл. 2 и на рис. 3 представлены ошибки классификации на обучающей выборке объемом N = 85. Количество ошибок в группе А равно 5, в группе В - 3, что составляет менее 10 % от числа диагностируемых. Такой результат вполне пригоден для практического использования.

Таблица 2. Ошибки классификации

Класс Ошибки классификации на обуч выборке (ТаблицаДА) Предсказ (строки) и наблюдаемые (столбцы) Объем обуч. выб. Ы= 85

Класс а Класс в

а 5

в 3

Оценка значимости исходных факторов ВРС приведена в табл. 3, где среди статистических наиболее значимыми являются факторы БОЫМ и а среди частотных - ТР,

ИР, ЬР и VLF.

Рис. 3. Предсказываемые и наблюдаемые размеры классов А, В

Таблица 3. Ранги значимости факторов ВРС

Перемен. Ранги значимости предикторов (ТаблицаДА) Одномерные ветвления 0 = низкая значимость. 100 = высокая

Ранг

ТР 91

VLF 78

LF 84

HF 86

SDNNf 100

SDNNf\RRNNf 83

Общая структура дерева, содержащего 9 узлов и 10 вершин, представлена в табл. 4.

Таблица 4. Структура дерева решений

и / / Узел Структура (ТаблицаДА) Дочерние вершины, наб предсказанные классы, юдаемые, условия ветвления

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Л ев ля ветвь Правая ветвь Класс а Класс в Предск. класс Ветвл.по постоян. Ветвл.по перемен.

1 2 3 54 31 а -1462,5 VLF

2 4 5 12 20 в -127,5 SDNNf

3 6 7 42 11 а -128,0 SDNNf

4 8 9 12 12 в -94,5 SDNNf

5 0 8 в

Є 0 2 в

7 10 11 42 9 а -0,2 SDNNfVRRNNf

8 2 10 в

9 10 2 а

10 14 0 а

11 12 13 2В 9 а -10395,0 LF

12 14 15 14 0 а -4727,5 LF

13 14 1 а

14 5 0 а

15 16 17 9 8 в -0,3 SDNNftRRNNf

16 18 19 6 8 в -2191,5 VLF

17 3 0 а

18 5 2 а

19 1 Б в

Для практического применения модель дерева решений была реализована в EXEL популярного офисного пакета MS Office. Интерфейс программы приведен на рис. 4.

Технология диагностирования предусматривает следующие этапы.

Этап 1. С помощью программы «Полиспектр» производится запись и первичный анализ кардиограммы больного (фрагмент протокола приведен на рис. 5).

Этап 2. Данные предварительного анализа заносятся в диалоговую форму программы ДИСК_З, представленную на рис.5.

Этап 3. После выполнения расчета в окне «прогноз» выводится решение интеллектуальной системы: «ВОССТАНОВЛЕН» (или «АРИТМИЯ») (рис.5), что означает прогнозируемую оценку восстановления ритма сердца после соответствующего лечения. Такое решение принято, потому что в процессе диагностирования по результатам предварительного анализа больной был отнесен к группе В - с пароксизмальной формой нарушения ритма сердца, т.е. с исходом в восстановление ритма.

Одобренное врачом решение заносится в базу данных, которая служит обучающей выборкой (табл. 5) для дальнейшей корректировки модели дерева решений.

- диск_з----------------------------------------------------------------------------------------------

Диагностическая система кардиологических заболеваний на основе анализа вариабельности ритма сердца

Матрица дерева решений

ТР VLF LF HF RRNN SDNNf SDNNf RRNNf

Ветвь 1 1462 Узел 1

12В Узел 2

0,22 Узел 3

127 Узел 4

94,5 Узел 5

Ветвь 2 103Э5 Узел 6

4727 Узел 7

0,2785 Узел 8

491 Узел 9

прогнозирование течения фибрилляции предсердий

СПЕКТРАЛЬНЫЙ ВРЕМЕННОЙ АНАЛИЗ ПРОГНОЗ

ФИО больного ТР VLF LF HF RRNN SDNNf SDNNf RRNNf ветвьі ветвь2 решение

Ива“ 34251 2883 6830 24538 819 213 0,26 В ВОССТАНОВЛЕН

Ввод данным

Расчет

Запись

Рис. 4. Интерфейс программы диагностирования

Отделение: кардио -3

Пациент Ива*****, 44 года, 180 сил, 80,0 кг, ИМТ: 24,7 (норма)

Предварительный диагноз: ГБ 2ст. Перемет. ФП (перед ЭИТ). Конкор

Тип обследования: ВР С от 18.08.2009

Прибор: Поли-Спектр-8/ЕX (программа анализа 'Поли-Спектр')_лицензи я №000081 84

Фоновая ¡апмсь

Положение пациента при записи: лежа. Продолжительность записи сердечного ритмэ 5 мин.(300 с). Зарегистрировано комплексов (ЖБ: 366.

Ритм ФП. Средняя ЧСС: 73 уд.Лимн. - нормальная частота сердечного ритма.

Р і ш.югра мма Спектрограм иа

700 З 600 ■ 500 400 300 1 200 100 0

I

J і 1 і

1, , 1 ,1 1 1 ■ ■ 1 1. ІІ

ГТІІЇ' Г’ТІ T'Tfif v ті ™

0 05 0,1

0,15 0,2

істота

0,25

Гц

0,3 0,35 0/

Покаіателп временного аналіііаПокаіателп спектрального аналша

Параметр Значение Параметр Значение

R-R min, мс 465 ТР, мсА2 34251

R-R max, мс 1667 VLF, мсл2 2883

RRNN, мс 81 9 LF, мсл2 6830

SDNN,мс 21 3 HF, мс*2 24538

RM SSD,мс 31 6 LF norm, n.u. 21,8

pNNSO, % 85,8 HF norm , n.u. 78,2

CV, % 26,1 LF/HF 0,278

Структура спектра

%VLF 8,42

%LF 1 9,9

%HF 71,6

Рис. 5. Фрагмент протокола © ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина»

Таблица 5. Хранилище прогнозов

Спектральный анализ Временной анализ Прогноз

ФИО TP VLF LF HF RRNN SDNNf SDNNf\RRNNf Вет1 Вет2 Решение

Ива*** 34251 2883 6830 24538 819 213 0,26 B Восстановлен

Пет*** 11379 1611 2094 7675 704 131 0,186 A АРИТМ

Афе**** 21513 1726 4568 15219 517 149 0,288 A АРИТМ

Этап 4. На основании предварительного анализа ВРС и решения интеллектуальной системы врач делает заключение о вероятности восстановления синусового ритма у конкретного пациента с ФП.

Заключение

Методом интеллектуального анализа данных (Data Mining) на основе алгоритма деревьев решений построена модель диагностирования формы ФП (пароксизмальная или постоянная) и прогнозирования восстановления сердечного ритма.

Модель реализована в виде программного продукта ДИСК_З и может использоваться в виде интеллектуального помощника врача-кардиолога.

Список литературы

1. Баллод Б.А., Елизарова Н.Н. Методы и алгоритмы принятия решений: Учеб. пособие. - М.: Финансы и статистика; ИНФРА-М, 2009.

2. Михайлов В.М. Вариабельность ритма сердца. -Иваново: НейроСофт, 2000.

3. Муромкина А.В. Оценка вариабельности желудочковых сокращений на фоне фибрилляции предсердий // Вестник ИГМА. - 2009. - № 2. - С. 22-24.

Баллод Борис Анатольевич,

ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина», кандидат технических наук, доцент кафедры информационных технологий, e-mail: ballod@it.ispu.ru

Муромкина Анна Владимировна,

ГУЗ Кардиологический диспансер, врач, кандидат медицинских наук, e-mail: ballod@it.ispu.ru

Ковалев Денис Евгеньевич,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ГОУВПО «Ивановский государственный энергетический университет имени В.И. Ленина», студент кафедры информационных технологий, e-mail: ballod@it.ispu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.