Научная статья на тему 'ВЫЯВЛЕНИЕ И ПРЕДУПРЕЖДЕНИЕ РИСКОВ ЗАБОЛЕВАНИЙ ПАЦИЕНТОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕЙ НА ПРИМЕРЕ ДИАГНОСТИКИ РАЗЛИЧНОГО ВИДА АРИТМИЙ ПО ЭЛЕКТРОКАРДИОГРАММЕ'

ВЫЯВЛЕНИЕ И ПРЕДУПРЕЖДЕНИЕ РИСКОВ ЗАБОЛЕВАНИЙ ПАЦИЕНТОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕЙ НА ПРИМЕРЕ ДИАГНОСТИКИ РАЗЛИЧНОГО ВИДА АРИТМИЙ ПО ЭЛЕКТРОКАРДИОГРАММЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
31
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИАГНОСТИКА ПАЦИЕНТОВ / МЕДИЦИНСКАЯ ДИАГНОСТИКА / ВЫЯВЛЕНИЕ И ПРЕДУПРЕЖДЕНИЕ ЗАБОЛЕВАНИЙ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / НЕЙРОСЕТИ / МНОГОСЛОЙНЫЙ ПЕРЦЕПТРОН / ТЕЛЕМЕДИЦИНА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кистанова И.А.

В статье описаны разработка и тестирование нейросети - полносвязного многослойного перцептрона, позволяющего диагностировать и прогнозировать развитие аритмии по кардиограмме. Для обучения нейросети используется алгоритм обратного распространения ошибки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кистанова И.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PATIENTS MEDICAL DISEASES RISKS DETECTION AND PREVENTION USING NEURAL NETWORKS DESCRIBED BY EXAMPLE OF DIFFERENT TYPES OF ARRHYTHMIAS ELECTROCARDIOGRAMS DATA ANALYSIS

The article describes the development and testing of neural network (multilayer perceptron) that allows to diagnose and predict the different types of arrhythmia by electrocardiogram data intellectual analysis. Backpropagation algorithm is used for neural network training.

Текст научной работы на тему «ВЫЯВЛЕНИЕ И ПРЕДУПРЕЖДЕНИЕ РИСКОВ ЗАБОЛЕВАНИЙ ПАЦИЕНТОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕЙ НА ПРИМЕРЕ ДИАГНОСТИКИ РАЗЛИЧНОГО ВИДА АРИТМИЙ ПО ЭЛЕКТРОКАРДИОГРАММЕ»

УДК 004.891

Кистанова И. А. студент магистратуры 2 курса направление подготовки «Информационные

системы и технологии» кафедра «Информационных систем и технологий» Поволжский государственный университет телекоммуникаций и информатики

Россия, г. Самара ВЫЯВЛЕНИЕ И ПРЕДУПРЕЖДЕНИЕ РИСКОВ ЗАБОЛЕВАНИЙ ПАЦИЕНТОВ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕЙ НА ПРИМЕРЕ ДИАГНОСТИКИ РАЗЛИЧНОГО ВИДА АРИТМИЙ ПО ЭЛЕКТРОКАРДИОГРАММЕ

В статье описаны разработка и тестирование нейросети -полносвязного многослойного перцептрона, позволяющего диагностировать и прогнозировать развитие аритмии по кардиограмме. Для обучения нейросети используется алгоритм обратного распространения ошибки.

Ключевые слова: медицинская диагностика, диагностика пациентов, выявление и предупреждение заболеваний, интеллектуальный анализ данных, нейросети, многослойный перцептрон, телемедицина.

Kistanova I.A.

2nd year education Master's degree student «Information systems and technologies» scientific field department «Information systems and technologies» department Povolzhskiy state university of telecommunications and informatics

Russia, Samara

PATIENTS MEDICAL DISEASES RISKS DETECTION AND

PREVENTION USING NEURAL NETWORKS DESCRIBED BY EXAMPLE OF DIFFERENT TYPES OF ARRHYTHMIAS ELECTROCARDIOGRAMS DATA ANALYSIS

The article describes the development and testing of neural network (multilayer perceptron) that allows to diagnose and predict the different types of arrhythmia by electrocardiogram data intellectual analysis. Backpropagation algorithm is used for neural network training.

Key words: medical diagnosis, medical diseases detection and prevention, data mining, neural networks, multilayer perceptron, telemedicine.

Данная работа посвящена реализации и апробированию нейросети, позволяющей диагностировать несколько видов аритмии по данным о пациенте и его кардиограмме, полученным с портативного кардиографа. Результаты работы будут использованы в магистерской диссертации в качестве реализации подхода к диагностированию, предупреждению и

профилактике заболеваний на основе комплексного использования интеллектуального анализа данных (математической статистики и нейросетевых технологий) и телемедицины.

Под аритмией сердца понимается «несогласованность, нескладность», патологическое состояние, при котором происходят нарушения частоты, ритмичности и последовательности возбуждения и сокращения сердечной мышцы. Термин «аритмия» объединяет различные по механизму, клиническим проявлениям и прогностическому значению нарушения образования и проведения электрического импульса в сердечной мышце. [1]

В данной работе диагностика будет проводиться по следующим 15 типам аритмии:

- ишемическая болезнь сердца,

- острый передний инфаркт миокарда,

- острый нижний инфаркт миокарда,

- синусовая тахикардия,

- синусовая брадикардия,

- желудочковая экстрасистолия,

- верхнежелудочковая экстрасистолия,

- блокада левой ножки пучка Гиса,

- блокада правой ножки пучка Гиса,

- первая степень атриовентрикулярной блокады,

- вторая степень атриовентрикулярной блокады,

- третья степень атриовентрикулярной блокады,

- гипертрофия левого желудочка,

- фибрилляция (трепетание) предсердий,

- другой тип аритмии.

В качестве инструмента для разработки нейросети использовалась интегрированная среда разработки RStudio [2], позволяющая производить исследования на программном языке статистического анализа данных R [3], широко используемом в международном сообществе исследователей по анализу данных. Для обучения и апробирования нейросети использовалась библиотека машинного обучения H2O, интегрированная с библиотекой Sparkling Water [4, 5], реализующей алгоритмы машинного обучения на базе Apache Spark - движка для эффективного и быстрого анализа больших данных [6]. В языке R данные библиотеки подключаются через модули rsparkling, sparklyr и h2o.

В качестве исходных статистических данных для разработки, обучения и тестирования нейросети использовались открытые данные по аритмии Калифорнийского университета в Ирвине, США [7]. Анализируемые данные содержат 452 измерения по 279 функциональным показателям пациентов, в том числе показателям электрокардиограммы (ЭКГ), а также информацию о принадлежности каждого из измерений к одному из 15 типов аритмии,

перечисленных в данной работе выше, либо к классу, соответствующему здоровой ЭКГ (без аритмии).

Полный список функциональных показателей, содержащихся в исходной статистической выборке, выглядит следующим образом (указаны номер и название каждого показателя):

1. Возраст пациента: в годах.

2. Пол пациента: 0 = мужчина; 1 = женщина.

3. Рост: в сантиметрах.

4. Вес: в килограммах.

5. QRS-интервал: среднее по QRS-интервалу в миллисекундах.

6. P-R-интервал: средняя длина интервала между началом P-зубца и Q-зубца в миллисекундах.

7. Q-T-интервал: средняя длина между началом Q-зубца и смещением Т-волны в миллисекундах.

8. Т-интервал: средняя длина Т-волны в миллисекундах.

9. P-интервал: средняя длина P-волны в миллисекундах.

Векторные углы на передней плоскости:

10. QRS 11. T 12. P 13. QRST 14. J

15. Частота сердечных сокращений: частота сокращения сердечной мышцы в минуту.

Канал В1:средняя ширина (в миллисекундах):

16. Q-интервал. 17. R- интервал. 18. S- интервал. 19. интервал, маленький пик после R. 20. S'- интервал.

21. Число внутренних отклонений.

22. Существование разрывов R-интервала.

23. Существование двухфазного R-интервала.

24. Существование разрывов P-интервала.

25. Существование двухфазного P-интервала.

26. Существование разрывов Т-интервала.

27. Существование двухфазного Т-интервала.

28 .. 39. Канал В11 (аналогичны показателям 16 .. 27 канала DI)

40 .. 51. Каналы В111 52 .. 63. КаналЛУЯ

64 .. 75. Канал ЛУЬ 76 .. 87. Канал ЛУГ

88 .. 99. Канал У1 100 .. 111. Канал У2

112 .. 123. Канал У3 124 .. 135. Канал У4

136 .. 147. Канал У5 148 .. 159. Канал У6

Канал В1: Амплитуда, умноженная на 0.1 милливольт: 160. JJ-интервал. 161. Q-интервал. 162. R-интервал.

163. S-интервал. 164. ^-интервал. 165. S'-интервал.

166. Р-интервал. 167. Т-интервал.

168. QRSA , сумма площадей всех сегментов, деленная на 10, (Площадь сегмента = ширина * высота / 2 ).

169. QRSTA = QRSA + 0.5 * ширина Т-интервала * 0.1 * высоту Т-

интервала. (Если T двухфазный, то берется наибольший сегмент).

170 .. 179. Канал DII 180 .. 189. Канал DIII 190 .. 199. Канал AVR 200 .. 209. Канал AVL 210 .. 219. Канал AVF 220 .. 229. Канал V1 230 .. 239. Канал V2 240 .. 249. Канал V3 250 .. 259. Канал V4 260 .. 269. Канал V5 270 .. 279. Канал V6

На рисунке 1 представлено распределение каждого из измерений из исходной статистической выборки по классам - 15 классам аритмии и одному классу, соответствующему здоровой ЭКГ (без аритмии).

Рисунок 1 - Распределение значений статистической выборки по классам аритмии и классу «здоровой» ЭКГ Из рисунка 1 видно, что измерений с аритмией и измерений без аритмии («здоровая» ЭКГ) в исходной статистической выборке почти поровну - примерно по 200 измерений.

Далее попробуем проанализировать насколько разнятся классы аритмии, применив к исходной статистической выборке метод главных компонент (principal component analysis, PCA) [8]. Для этого в используемом нами языке R существует библиотека pcaGoPromoter. Визуализация результатов PCA-анализа представлена на рисунке 2. По результатам PCA-анализа и их визуализации можно сделать вывод о том, что между подавляющим большинством классов аритмии нет каких-либо серьезных отличий, что может затруднить анализ кардиограммы и определение типа аритмии с помощью нейросети. Для корректного определения типа аритмии потребуется подобрать такую структуру нейросети, которая позволит достичь минимальной ошибки в определении типа (класса) аритмии. Также по рисунку 2 видно, что класс 9 сильно отличается от других классов и, так как изначальные веса нейросети для более качественного ее обучения рекомендуется назначать произвольным образом, то назначим для измерений, попадающих в этот класс, более высокий первоначальный вес, чтобы нейросеть сразу, уже в самом начале своего обучения, «понимала»,

что подобные измерения отличаются от других.

40

20

с

я

>

/

см £ 0

20

ж. ,7" '¡Ш

-20 10 0 10 РС1 8% vanance

class

8 ft

S 10 >

СЧ л

О 0

CL

diagnosis

OThythrma » [bcallhy

•Им

РС1 8% vanance

Рисунок 2 - Визуализация распределения статистических измерений

по классам аритмии Далее целесообразно определить дисперсию входных параметров нейросети (функциональных показателей пациента), чтобы понять какие из данных параметров оказывают существенное влияние на определение типа аритмии, а какие почти не оказывают никакого влияния. Значения дисперсии каждого из 279 входов (входных параметров) нейросети представлены на рисунке 3. Параметры, слабо влияющие на диагностирование аритмии, мы исключим из анализа и не будем использовать в качестве входов нейросети.

feature

Рисунок 2 - Визуализация распределения статистических измерений

по классам аритмии На следующем шаге можно приступать к построению нейросети. В качестве типа нейросети был выбран многослойный перцептрон Румельхарта [9].

В первую очередь, необходимо определить структуру нейросети:

число нейронов входного слоя соответствует числу подаваемых на вход нейросети функциональных показателей - после исключения на предыдущем шаге тех показателей, которые существенно не влияют на результаты диагностики (показатели с низкой дисперсией), из 279 их осталось 90. Число нейронов в выходном слое нейросети будет равно 16 и соответствует числу классов, то есть возможных результатов диагностики: 15 классов - по одному на каждый из типов аритмии и один класс на нормальную ЭКГ (здоровую, без аритмии). Доказано, что для решения большинства практических задач достаточно всего одного скрытого слоя в нейросети, два слоя применяются как резерв в особых случаях, а сети с тремя слоями практически не применяются [10]. Опытным путем для разрабатываемой в данной работе нейросети был выбран один скрытый слой, содержащий 400 нейронов. Такой вариант структуры нейросети позволяет решать поставленную задачу классификации аритмии с достаточным для практики уровнем точности.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Также необходимо определиться с функцией активации нейронов. В данном случае для всех нейронов использовалась функция активации rectifier function [11], аппроксимировать которую можно следующей аналитической функцией: f(x) = ln( 1 + ех) [12]. Данная функция активации используется в задачах deep learning и хорошо зарекомендовала себя на практике.

Нейронная сеть с описанными параметрами была реализована в среде RStudio с помощью библиотеки машинного обучения h2o.

Исходная статистическая выборка была разбита на три части: подвыборку для обучения, подвыборку для тестирования и подвыборку для валидации (оценки качества) нейросети. В выборку для обучения вошло 70% измерений от исходной статистической выборки (от 452 измерений), в выборки для тестирования и валидации - по 15% оставшихся измерений в каждую.

Для оценки качества нейросети использовалась оценка среднеквадратичной ошибки (Mean Squared Error, MSE), значение которой было также рассчитано в RStudio и равно 0.197, что говорит о том, что более 80% прогноза нейросети является достоверным. Стоит также отметить, что разработанная нейросеть определяет «здоровую» ЭКГ с нулевой ошибкой, то есть со 100% уровнем достоверности. Ошибки в примерно 20% прогнозов нейросеть допускает только в случае определения типа аритмии, но при этом всегда достоверно известно, что аритмия точно имеет место и пациенту требуется либо дополнительная диагностика, либо лечение.

Использованные источники:

1. Аритмия [Электронный ресурс] / Википедия. Свободная энциклопедия. URL: https://ru.wikipedia.org/wiki/Аритмия

2. Rstudio [Электронный ресурс] / URL: https://www.rstudio.com/products/rstudio/

3. The R Project for Statistical Computing [Электронный ресурс] / URL: https://www.r-project.org/

4. Building deep neural nets with h2o and rsparkling that predict arrhythmia of the heart [Электронный ресурс] / URL: https://www.r-bloggers.com/building-deep-neural-nets-with-h2o-and-rsparkling-that-predict-arrhythmia-of-the-heart/

5. Sparkling Water [Электронный ресурс] / URL: http://www.h2o.ai/sparkling-water/

6. Apache Spark [Электронный ресурс] / URL:http://spark.apache.org/

7. Arrhythmia Data Set [Электронный ресурс] / URL: https://archive.ics.uci.edu/ml/datasets/Arrhythmia

8. Метод главных компонент [Электронный ресурс] / Википедия. Свободная энциклопедия. URL: https://ru.wikipedia. о^/шЫ/Метод_главных_компонент

9. Многослойный перцептрон Румельхарта [Электронный ресурс] / Википедия. Свободная энциклопедия. URL: https://ru.wikipedia.org/wiki/Многослойный_перцептрон_Румельхарта

10. Нейронные сети [Электронный ресурс] / StatSoft электронный учебник по статистике. URL: http://statsoft.ru/home/textbook/modules/ stneunet.html

11.Xavier Glorot, Antoine Bordes and Yoshua Bengio (2011). Deep sparse rectifier neural networks.

12.C. Dugas, Y. Bengio, F. Belisle, C. Nadeau, R. Garcia, NIPS'2000, (2001), Incorporating Second-Order Functional Knowledge for Better Option Pricing.

УДК 378.147

Кодирова Ш. С. Явминова Н.М.

Наманганский инжинерно-педагогический институт

Узбекистан, г. Наманган АНАЛИЗ ЯЗЫКОВОЙ РЕАЛИЗАЦИИ ФРЕЙМА «ЦЕЛЕНАПРАВЛЕННОЕ ЗРИТЕЛЬНОЕ ВОСПРИЯТИЕ» В

АНГЛИЙСКОМ ЯЗЫКЕ Аннотация: Целью статьи является изучение языковой реализации фрейма «Целенаправленное зрительное восприятие» в английском языке. Особенности организации лексико-семантической системы русского языка на примере одного из её фрагментов - глаголов зрительного восприятия была осуществлена А.А.Кретовым. также в работе Л.В.Молчановой была проведена системная классификация немецких глаголов зрительного восприятия.

Ключевые слова: активность, целенаправленность, отсубъектная направленность, экстраспекное

Abstract: The purpose of the article is to study the language implementation of the frame "Purposeful visual perception" in the English language. Features of the organization of the lexical-semantic system of the Russian language on the example of one of its fragments - verbs of visual perception was implemented by A.

i Надоели баннеры? Вы всегда можете отключить рекламу.