Научная статья на тему 'Кластерный анализ кардиологических данных'

Кластерный анализ кардиологических данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1247
205
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
кластеризация / цифровая экономика / кардиология / большие данные / математическое моделирование / clustering / digital economy / cardiology / big data / mathematical modeling

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Екатерина Юрьевна Зимина

В статье рассматривается применение статистического метода, а именно кластерного анализа на примере исследования кардиологических данных. Использованы методы классификации Data Mining для обработки кардиологических данных, анализа состояния пациента. Целью данного исследования было поставлено проверка гипотезы о возможности диагностики состояния здоровья сердца пациента, а также выявления у него патологий, при помощи анализа серий ЭКГ и выделения схожих кластеров по результатам данного проводимого анализа. Тематика применимости известных методов кластеризации применительно к обработке и анализу электрокардиограммам по признакам подобия из форм ранее широко не исследовалась. В модели сердца, которая применяется в данном исследовании, в основе явления возврата ФПУ является понятия состояния сердца, в качестве фиксируемого колебательного процесса. Но, с другой стороны, так как сердце является автоколебательной системой и ему не требуется для начала колебаний получения энергии «возмущения», то при исследовании сердца вводится понятие автовозврата ФПУ. Сердце можно рассматривать как распределенную автоколебательную систему, которая имеет бесконечное число автовозвратов Ферми-Паста-Улама (ФПУ), при которых вводится понятие кластера, получаемого в процессе серии сравнений ЭКГ спектров Фурье друг с другом и выявления повторяющихся. Сравнение Фурье спектров ЭКГ производится на основе явления возврата ФПУ, на основе визуального восприятия спектра. Для этого было введено понятие формы спектра. Форма спектра – сглаженная кривая. В ходе работы было произведено математическое моделирование работы сердца путем использования разложения ФПУ и представлено формальное описание математической модели сердца как система связанных клеток миоцитов, представляющих отдельные автоколебательные степени свободы, описываемые системой связанных нелинейных дифференциальных уравнений второго порядка как уравнения Ван дер Поля. Кластерный анализ проводится на основе поиска схожих форм спектров Фурье, полученных путем моделирования работы сердца ФПУ. Таким образом, разрабатывается система обработки кардиологической информации, обеспечивающая персонифицированный мониторинг, анализ и прогнозирование развития состояния пациента в реальном времени. Система представляет собой устройство для съема ЭКГ и пульсовой волны, с помощью которого сразу после окончания сбора данных пациента информация отправляется посредством Интернет в облако для дальнейшей обработки, анализа и хранения. На данный момент были уже получены результаты: гипотеза подтвердилась. При математическом моделировании работы сердца ФПУ, на основе которых были выделены формы спектров Фурье, были выделены кластеры, среди которых образовались различные подмножества как форм спектров Фурье с патологиями, так и форм спектра Фурье здоровых людей. Из данного проведенного исследования следует, что по результатам кластерного анализа электрокардиограммы возможно отнести данную ЭКГ к какому-либо кластеру и тем самым продиагностировать состояние кардиологического здоровья данного пациента.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Екатерина Юрьевна Зимина

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Cluster analysis of cardiac data

The article includes the observation of the cluster analysis of medical data on the example of the cardiac data. One of the main effective and commonly used Data Mining methods that applied to the large amounts of information (for example, mathematical economics) are clustering methods: the search for signs of similarity between objects in the study of the subject area and the subsequent merger of objects into subsets (clusters) according to the established affinity. The main purpose of the investigation is to examine the hypothesis of the possibility of diagnosing the patient health status, as well as identifying his pathologies, using the analysis of electrocardiogram (ECG) series and the allocation of similar clusters based on the results of this analysis. However, the subject of clustering techniques implementation to the ECG on the grounds of similarity of forms have not previously been extensively investigated. In the model of the heart, which is used in this study, the state of the heart is taken as a fixed oscillatory process of the phenomenon of the FPU auto-return. But, on the other hand, since the heart is an self-oscillating system and it has no need to start the oscillations by obtaining the energy of “perturbation”, the concept of FPU autoreturn is introduced in the study of the heart. The mathematical modeling of the heart work by using a decomposition of the Fermi-Pasta-Ulam (FPU) was investigated. The formal description of the mathematical model of the heart as a system of connected cells myocytes is presented. This represents a single oscillatory degree of freedom described by a system of coupled nonlinear differential equations of the second order equation of Van der Pol. Cluster analysis bases on the search of similar clusters of Fourier spectrum which are received by FPU recurrence. The current results that are obtained show that the hypothesis is confirmed. In mathematical modeling of the FPU heart modeling, which is based on the forms of Fourier spectra, were identified. Subsets were identified, among which various subsets of both forms of Fourier spectra with pathologies and forms of the Fourier spectrum of healthy people were formed. From this study it follows that the cluster analysis of the electrocardiogram may refer this ECG to any cluster and thereby diagnose the state of cardiac health of the patient.

Текст научной работы на тему «Кластерный анализ кардиологических данных»

УДК 519.23, 519.25

DOI: http://dx.doi.org/10.21686/2500-3925-2018-2-30-37

Кластерный анализ кардиологических данных

Е.Ю. Зимина

НИУ ВШЭ, Москва, Россия

В статье рассматривается применение статистического метода, а именно кластерного анализа на примере исследования кардиологических данных. Использованы методы классификации Data Mining для обработки кардиологических данных, анализа состояния пациента. Целью данного исследования было поставлено проверка гипотезы о возможности диагностики состояния здоровья сердца пациента, а также выявления у него патологий, при помощи анализа серий ЭКГ и выделения схожих кластеров по результатам данного проводимого анализа. Тематика применимости известных методов кластеризации применительно к обработке и анализу электрокардиограммам по признакам подобия из форм ранее широко не исследовалась. В модели сердца, которая применяется в данном исследовании, в основе явления возврата ФПУявляется понятия состояния сердца, в качестве фиксируемого колебательного процесса. Но, с другой стороны, так как сердце является автоколебательной системой и ему не требуется для начала колебаний получения энергии «возмущения», то при исследовании сердца вводится понятие автовозврата ФПУ.

Сердце можно рассматривать как распределенную автоколебательную систему, которая имеет бесконечное число автовозвратов Ферми-Паста-Улама (ФПУ), при которых вводится понятие кластера, получаемого в процессе серии сравнений ЭКГ спектров Фурье друг с другом и выявления повторяющихся. Сравнение Фурье спектров ЭКГ производится на основе явления возврата ФПУ, на основе визуального восприятия спектра. Для этого было введено понятие формы спектра. Форма спектра — сглаженная кривая. В ходе работы было произведено математическое моделирование работы сердца путем использования разложения ФПУ

и представлено формальное описание математической модели сердца как система связанных клеток миоцитов, представляющих отдельные автоколебательные степени свободы, описываемые системой связанных нелинейных дифференциальных уравнений второго порядка как уравнения Ван дер Поля. Кластерный анализ проводится на основе поиска схожих форм спектров Фурье, полученных путем моделирования работы сердца ФПУ.

Таким образом, разрабатывается система обработки кардиологической информации, обеспечивающая персонифицированный мониторинг, анализ и прогнозирование развития состояния пациента в реальном времени. Система представляет собой устройство для съема ЭКГ и пульсовой волны, с помощью которого сразу после окончания сбора данных пациента информация отправляется посредством Интернет в облако для дальнейшей обработки, анализа и хранения. На данный момент были уже получены результаты: гипотеза подтвердилась. При математическом моделировании работы сердца ФПУ, на основе которых были выделены формы спектров Фурье, были выделены кластеры, среди которых образовались различные подмножества как форм спектров Фурье с патологиями, так и форм спектра Фурье здоровых людей. Из данного проведенного исследования следует, что по результатам кластерного анализа электрокардиограммы возможно отнести данную ЭКГ к какому-либо кластеру и тем самым продиагностировать состояние кардиологического здоровья данного пациента.

Ключевые слова: кластеризация, цифровая экономика, кардиология, большие данные, математическое моделирование

Ekaterina Y. Zimina

Higher School of Economics, Moscow, Russia

Cluster analysis of cardiac data

The article includes the observation of the cluster analysis of medical data on the example of the cardiac data. One of the main effective and commonly used Data Mining methods that applied to the large amounts of information (for example, mathematical economics) are clustering methods: the search for signs of similarity between objects in the study of the subject area and the subsequent merger of objects into subsets (clusters) according to the established affinity. The main purpose of the investigation is to examine the hypothesis of the possibility of diagnosing the patient health status, as well as identifying his pathologies, using the analysis of electrocardiogram (ECG) series and the allocation of similar clusters based on the results of this analysis.

However, the subject of clustering techniques implementation to the ECG on the grounds of similarity of forms have not previously been extensively investigated.

In the model of the heart, which is used in this study, the state of the heart is taken as a fixed oscillatory process of the phenomenon of the FPU auto-return. But, on the other hand, since the heart is an self-oscillating system and it has no need to start the oscillations by obtaining the energy of "perturbation", the concept of FPU auto-return is introduced in the study of the heart.

The mathematical modeling of the heart work by using a decomposition of the Fermi-Pasta-Ulam (FPU) was investigated. The formal description of the mathematical model of the heart as a system of connected cells myocytes is presented. This represents a single oscillatory degree of freedom described by a system of coupled nonlinear differential equations of the second order equation of Van der Pol.

Cluster analysis bases on the search of similar clusters of Fourier spectrum which are received by FPU recurrence. The current results that are obtained show that the hypothesis is confirmed. In mathematical modeling of the FPU heart modeling, which is based on the forms of Fourier spectra, were identified. Subsets were identified, among which various subsets of both forms of Fourier spectra with pathologies and forms of the Fourier spectrum of healthy people were formed. From this study it follows that the cluster analysis of the electrocardiogram may refer this ECG to any cluster and thereby diagnose the state of cardiac health of the patient.

Keywords: clustering, digital economy, cardiology, big data, mathematical modeling

Введение

Применение методов статистики для анализа медицинской информации в настоящее время недостаточно распространено. С развитием технологий расширяется сфера их использования, в том числе развиваются и методы обработки информации, Data Mining.

Одним из основных эффективных и массово используемых методов Data Mining применительно к большим объёмам информации, в том числе и в математической экономике, являются методы кластеризации: поиска признаков подобия между объектами в исследуемой предметной области и последующего объединения объектов в подмножества (кластеры) по установленным признакам подобия.

Data Mining включает в себя методы обнаружения, сбора данных, а также их интеллектуальный анализ. [1] Data Mining — это мультидисципли-нарная область, возникшая и развивающаяся на базе таких наук как прикладная статистика, распознавание образов, искусственный интеллект, теория баз данных и др. [2]

В модели сердца, которая применяется в данном исследовании, в основе явления возврата ФПУ является понятия состояния сердца, в качестве фиксируемого колебательного процесса. Но, с другой стороны, так как сердце является автоколебательной системой и ему не требуется для начала колебаний получения энергии «возмущения», то при исследовании сердца вводится понятие автовозврата ФПУ.

Сердце можно рассматривать как распределенную автоколебательную систему, которая имеет бесконечное число автовозвратов Ферми-Паста-Улама (ФПУ), при которых вводится понятие кластера, получаемого в процессе серии

сравнений ЭКГ спектров Фурье друг с другом и выявления повторяющихся. Сравнение Фурье спектров ЭКГ производится на основе явления возврата ФПУ, на основе визуального восприятия спектра. Для этого было введено понятие формы спектра. Форма спектра — сглаженная кривая основанная на медиане верхних значений в окне 2 Гц, взятая в диапазоне от 0 до 40 Гц.

Реализация процесса кластеризации представляется конструктивным, так как из-за бесконечного числа состояний модели ФПУ сердца следует, что для практического кардиолога все бесконечное множество картин автовозвратов состояний сердца должно укладываться в конечное число предполагаемых диагнозов.

Получаемые при сравнении спектров серий ЭКГ кластеры могут быть разделены на группы по схожести у разных пациентов: как у здоровых, так и у имеющих различные кардио патологии. Таким образом, задачей данного исследования является проверить предположение, что предполагаемые кластеры могут быть использованы как для анализа различных патологий у пациентов, так и для оценки кардиологического статуса здоровых людей.

На данный момент применение средств кластеризации для анализа медицинских данных практически не исследовалось. Существуют схожие по тематике исследования, которые направлены на установление длин интервалов на ЭКГ, но в данных работах отсуствует анализ кардиологических данных с целью диагностики состояния здоровья пациента. [3]

Кластерный анализ применительно к медицинским данным использовался для выявления аритмии человека, но не для полной диагностики работы сердца пациента с целью выявления патологий или факты их отсутствия. [4]

Актуальность тематики анализа медицинских данных для РФ подчеркивается принятием Федерального Закона от 29 июля 2017 года № 242-ФЗ «О внесении изменений в отдельные законодательные акты Российской Федерации по вопросам применения информационных технологий в сфере охраны здоровья», который определяет порядок оказания медпомощи с применением телемедицинских технологий. [5]

По данным Всемирной Организации Здравоохранения на 2015 год почти 30% причиной всех смертей являются ишеми-ческая болезнь сердца и инсульт. [6] Такая значительная распространённость хронической сердечной недостаточности ведёт к высокой смертности кардиологических больных и требует больших затрат на лечение.

Исследования в направлении телемедицины проводятся в МИЭМ НИУ ВШЭ рамках проекта по созданию централизованной системы ранней массовой диагностики (ЦСР-МД) заболеваний населения РФ вне пределов лечебно-профилактических учреждений (ЛПУ), обеспечивающей персонифицированный мониторинг, анализ и прогнозирование развития состояния пациента в реальном времени до его первого появления в ЛПУ, а также сопровождение пациентов после постановки диагноза и выписки из ЛПУ.

Системообразующей компонентой ЦСРДМ в данном проекте является облако, объединяющее в единую АС с одной стороны оконечные мобильные устройства и группировку обучаемых компьютеров, реализованных в ЦИАС, а с другой стороны — линейный медицинский персонал, принимающий решения по сценариям взаимодействия с пациентами.

Таким образом, разрабатывается система обработки кардиологической информации,

обеспечивающая персонифицированный мониторинг, анализ и прогнозирование развития состояния пациента в реальном времени.

Применение облачных технологий при обработке кардиограмм

Расчеты производятся на основе частотных и энергетических характеристик полученных сигналов. Происходит выделение типовых и переходных частотных состояний для каждого пациента в отдельности и для целевых выборок сигналов, разделенных по возрасту, полу и наличию патологий у пациента.

В ходе анализа определяется близость пациента к одному из определенных частотных состояний по данным одного обследования. Отслеживается движение состояния пациента между типовыми состояниями самого пациента и целевых выборок для определения тенденции развития патологий, действия медикаментов, послеоперационной реабилитации, а также производится мониторинг острых состояний пациента, требующих профессиональной помощи.

По удлинению траектории движения состояния пациента между типовыми состояниями самого пациента и целевых выборок производится прогнозирование будущих состояний пациента на ближайшие несколько дней.

Облако позволяет принимать и обрабатывать кардиограммы (любого числа отведений), фотоплетизмограммы (пульсовая волна), эхокардиог-раммы, сейсмокардиограммы для дальнейшего проведения расчётов. Во время проведения ЭКГ используется такое понятие, как электрокардиографические отведения (разница потенциалов в электрокардиографии). Для глубокого анализа требуется наличие первого отведения, но любые

дополнительные отведения только уточняют дальнейший анализ. [9]

Облако пополняется посредством API и специализированных адаптеров, предназначенных для самостоятельной выгрузки данных и адаптеров, предназначенных которые служат для чтения форматов ЭКГ, полученных со специализированных устройств.

Облако предназначено для хранения и обработки с помощью технологий Big Data информации полученной из специальных учреждений или мобильных устройств пользователя, что являет собой телемедицину.

Результаты анализа также предоставляются посредством API и специальных адаптеров для интеграции с внешними системами.

Расчеты производятся на основе частотных и энергетических характеристик полученных сигналов. Происходит выделение типовых и переходных частотных состояний для каждого пациента в отдельности и для целевых выборок сигналов, разделенных по возрасту, полу и наличию патологий у пациента.

В ходе анализа определяется близость пациента к одному из определенных частотных состояний по данным одного обследования. Отслеживается движение состояния пациента между типовыми состояниями самого пациента и целевых выборок для определения тенденции развития патологий, действия медикаментов, послеоперационной реабилитации.

Определяется биологический возраст сердечно-сосудистой системы пациента, как отдельный вид траектории. Отслеживаются острые состояния пациента требующих профессиональной помощи.

По удлинению траектории движения состояния пациента между типовыми состояниями самого пациента и целевых

выборок производится прогнозирование будущих состояний пациента на ближайшие несколько дней.

При поступлении новой кардиограммы в БД инициируются 2 вида обработок: обработка кардиограммы относительно текущего пациента и обработка обновленного множества всех кардиограмм из БД.

Обработка кардиограмм

Исследование кардиограмм необходимо для получения расчётов, на основе которых будет произведен анализ состояние пациента и прогнозирование его состояния. Обработка новой поступившей кардиограммы производится в последовательном выполнении нескольких видов заданий:

— подготовка кардиограммы к дальнейшим расчетам;

— расчёт спектра Фурье и его характеристик (гармоники и энергии) для нефильтрованного сигнала, сигнала с исправленной изолинией и сигнала с исправленной изолинией и очищенного от дефектов;

— расчет формы спектра для сигнала с исправленной изолинией и очищенного от дефектов;

— перерасчет кластеров кардиограмм во всей серии кардиограмм пациента с различными параметрами кластеризации;

— расчет показателей тенденции пациента (биологического возраста).

Обработка обновленного множества всех кардиограмм производится по расписанию и для различных целевых групп по возрасту, полу, информации о патологиях для различных параметров кластеризации.

Возрастные группы выделяются следующие: все возраста, и 5 отдельных возрастных групп от молодых к старым. Группы по полу выделяются следующие: мужчины и женщины.

По патологиям выделяются следующие группы:

• размеченная выборка кардиограмм по диагнозу ишемия (подтвержденная и не подтвержденная)

• размеченная выборка кардиограмм по диагнозу туберкулез (подтвержденная и не подтвержденная)

• размеченная выборка кардиограмм по диагнозу диабет (подтвержденная и не подтвержденная).

Если в группе с момента выполнения последней кластеризации не появилось новых кардиограмм, запуск новой кластеризации не производится.

При обработке отдельной кардиограммы перед проведением расчетов и исследования у неё необходимо исправить изолинию, т.е. удалить дрейф изолинии, и очистить её от сильных дефектов, т.к. это сильно портит частотные характеристики кардиограммы, необходимый необходимые для дальнейшего анализа.

Дрейф изолинии удаляется двухмедианным методом, для этого из исходного сигнала поэлементно вычитается рассчитанная посредством двух медиан изолиния.

Математическое моделирование

Автоматизация анализа кардиологических данных ранее не исследовалась, все полученные данные обрабатывались вручную врачами-кардиологами. В связи с этим применение информационных технологий, а именно методов кластеризации для обработки и анализа кардиологических данных достаточно ново.

В работе рассматривается математическое моделирование работы сердца путем использования разложения ФПУ. [9] При использовании свойств полного возврата ФПУ для моделирования ЭКГ необходимо учесть, что функционирование сердца происходит в автоколе-

бательном режиме, подразумевающем наличие аналогичного принципа динамики в структуре возврата ФПУ, используемого для моделирования сердечной активности.

Норберт Винер впервые сформулировал математическую задачу о проводимости в сети связанных возбуждаемых элементов в применении к модели функционирования сердечной мышцы [10]. Для формального описания математической модели сердца необходимо представить его как систему связанных клеток миоцитов, представляющих отдельные автоколебательные степени свободы, описываемые системой связанных нелинейных дифференциальных уравнений второго порядка. Такими уравнениями, в частности, являются уравнения Ван дер Поля, который впервые предложил модель описания электрических колебаний сердца в рамках релаксационного решения уравнения Ван дер Поля [11].

При этом, если применить теорему о возможности замены волновых связей на запаздывающие, то можно в простейшем приближении представить математическую модель электрической активности сердца в виде связанных уравнений Ван дер Поля с запаздыванием в следующем виде [12]:

—2х - а1 (1 -¥1 )-1- +

dt2

dt

+ а>1 (1 + a1M2 )M1 = d2 M,

= Ci

dt2

- + d1F1 + d2 F2,

(1)

dY

bY^ = M2 dt

d 2M,

- «2 (1 -Y2

)dM2 ~dt~

dt2

+ a>2 (1 + a2M1 )M2 = d 2M1 dt2

= C2—T2T + d1F1 + d2F2, (2)

Ь2У2 +Т2 ^ = М\

где М1 — величина, пропорциональная динамическому элек-

трическому потенциалу всего миокарда, М2 — величина, пропорциональная динамическому электрическому потенциалу небольшой локальности миоцитов на поверхности миокарда, Y1 — величина, пропорциональная запаздыванию при распространении электрического импульса в миокарде, Y2 — величина, пропорциональная запаздыванию при распространении электрического импульса в локальности миоцитов, Ь1 — величина, пропорциональная площади поверхности миокарда, Ь2 — величина, пропорциональная площади поверхности локальности миоцитов, Т1 — величина, пропорциональная времени сокращения миокарда, Т2 — величина, пропорциональная периоду колебаний в локальности миоцитов, F1 — функция резонансного воздействия внешней среды на сердце на частоте сердцебиений (около 1Гц), F2 — функция резонансного воздействия внешней среды на сердце на высокой частоте около 20 Гц, с1, с2, d1, d2 —константы.

Обнаруженные в процессе исследования свойства спектров ЭКГ здоровых людей и пациентов с ишемической болезнью сердца позволят сформулировать задачу о математическом моделировании электрической динамики сердца с описанием наблюдаемых в эксперименте явлений так, что сердце может быть представлено как открытая динамическая структура со многими автоколебательными степенями свободы, как показано на формулах 1 и 2.

Подходы, предложенные Норбертом Винером и Гинзбургом, и Ландау, оказались успешными для модельного описания таких динамических состояний электрической активности сердца, как его нормальное функционирование, ишемическая болезнь и инфаркт миокарда.

+

Кластеризация выборки кардиограмм

Общая схемы системы представлена на рис. 1.

Кластеризация производится для множества кардиограмм, выделенных по определенным признакам. Для заданий кластеризация производится для всех кардиограмм отдельного пациента с различными параметрами кластеризации по выделенным формам спектра. [13]

Также кластеризация может проводиться на основе формы, полученной другим алгоритмом, на основе усредненного кардиоцикла и на основе амплитуд или спектральных плотностей гармоник. [14]

Объединения сходных автоколебательных процессов сердца в кластеры по признаки принадлежности к диагнозу в результате дают конечное число подмножеств. Однако, из модели ФПУ следует, что могут оказаться такие варианты поведения работы сердца, что не будут «попадать» ни в один из кластеров, которым соответствуют известные диагнозы. Такие «выбросы» отражают процессы перехода модели работы сердца из одного состояния (кластера) в другое.

На основе выборки ЭКГ пациентов размером в 27000 измерений были получены кластеры, представленные на рис. 2 и 3: кластер с формами спектров здоровых пациентов и кластер с формами спектров пациентов с ишемической болезнью сердца соответственно.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В ходе исследования было получено, что всегда имеется подмножество с преобладающим количеством ЭКГ, которые в него попали. ЭКГ данного кластера характеризуют обычное состояние пациента. Попавшие в другие кластеры ЭКГ характеризуют в некоторой степени неестественное состояние пациента, которое было вызвано или патологиями, или внешним стрессовым воздействием.

Рис. 1. Общая схема медицинской системы

А(нВ)

А

5

10

15

20

25

30

35

40

ДНЯ)

Рис. 2. Кластер формы спектра Фурье здоровых пациентов

2.2 2 1.8 1.6 1.4 1.2 1 0.8 0.6 0.4

А(нВ)

А

10

15

20

25

30

35

40

ДНЯ)

Рис. 3. Кластер формы спектра Фурье пациентов с ишемической болезнью сердца

5

На основе типичных признаков отдельных полученных подмножеств и данных о патологиях пациентов, выделяются кластеры, схожие по характеристикам формы спектра, которые в дальнейшем вводятся в отдельные группы по патологиям. Данные кластеры выдают определенную точку отсчета в 400-мерном пространстве среди всех форм спектров Фурье, расстояние до которой определяет близость формы спектра ЭКГ пациента к той или иной патологии.

Сравнивая представленные выше 2 и 3 рисунки, можно сделать вывод о различных формах спектра ЭКГ, полученных путем кластерного анализа у здоровых пациентов и пациентов с ишемической болезнью сердца.

Заключение

В статье рассматриваются возможности кластерного анализа медицинских данных на примере серий ЭКГ, а также возможности использования анализа Больших данных в одной из сфер цифровой экономике — телемедицине. Основным результатом проведенного исследования является реализация обработки и хранения медицинских данных для дальнейшего проведения расчётов в облаке.

При проведении исследования был осуществлен обзор возможностей анализа и мониторинга медицинских данных, а также прогнозирования в задачах математического анализа медицинских данных с помощью облачных технологий.

Проведено математическое моделирование работы сердца путем использования разложения Ферми-Пласта-Улана. Для описания математической модели сердца представлена система связанных клеток ми-оцитов, представляющих отдельные автоколебательные степени свободы, описываемые системой связанных нелинейных дифференциальных уравнений Ван дер Поля.

Кластерный анализ проводится на основе поиска схожих форм спектров Фурье, полученных путем моделирования работы сердца ФПУ.

Таким образом, кластерный анализ кардиологических данных может быть использован для определения кардиологического статуса здоровья людей, а также диагностики различных болезней сердца.

Литература

1. Дюк В., Самойленко А. Data Mining: учебный курс (+CD). СПб.: Питер, 2001. 368 с.

2. Национальный открытый университет Интуит. URL: https://www.intuit.ru/studies/ courses/6/6/lecture/158. (Дата обращения: 11.01.2018 г.).

3. Моторина С.В., Калиниченко А.Н. Оценка регулярности в порядке следования и длине кардиоинтервалов методами математической статистики // Биомедицинская радиоэлетрони-ка. 2016. № 8. С. 14-19.

4. Моторина С.В., Калиниченко А.Н., Не-мирко А.П. Выбор метода кластеризации для алгоритма выявления мерцательной аритмии // Биотехносфера. 2015. № 4 (40). С. 2-5.

5. Федеральный Закон от 29 июля 2017 года № 242-ФЗ «О внесении изменений в отдельные законодательные акты Российской Федерации по вопросам применения информационных технологий в сфере охраны здоровья» // Собрание законодательства РФ. 2017. № 242-ФЗ.

6. 10 ведущих причин смерти в мире. Всемирная Организация Здравоохранения. URL: http://www.who.int/mediacentre/factsheets/fs310/ ru/. (Дата обращения: 13.11.2017 г.).

7. Antonopoulos N., Gillam L. Cloud Computing: Principles, Systems and Applications. Springer Science & Business Media, 2010. 382 C. ISBN 978-1-84996-240-7.

8. Математическая кардиология. Теория, клинические результаты, рекомендации, перс-

References

1. Dyuk V., Samoylenko A. Data Mining: uchebnyy kurs (+CD). Saint-Petersburg: Piter, 2001. 368 p. (In Russ.)

2. Natsional'nyy otkrytyy universitet Intuit. URL: https://www.intuit.ru/studies/courses/6/6/ lecture/158. (Accessed: 11.01.2018). (In Russ.)

3. Motorina S.V., Kalinichenko A.N. Otsenka regulyarnosti v poryadke sledovaniya i dline kardiointervalov metodami matematicheskoy statistiki. Biomeditsinskaya radioeletronika. 2016. No. 8. P. 14-19. (In Russ.)

4. Motorina S.V., Kalinichenko A.N., Nemirko A.P. Vybor metoda klasterizatsii dlya algoritma vyyavleniya mertsatel'noy aritmii. Biotekhnosfera. 2015. No. 4 (40). P. 2-5. (In Russ.)

5. Federal'nyy Zakon ot 29 iyulya 2017 goda No. 242-FZ "O vnesenii izmeneniy v otdel'nye zakonodatel'nye akty Rossiyskoy Federatsii po voprosam primeneniya informatsionnykh tekhnologiy v sfere okhrany zdorov'ya". Sobranie zakonodatel'stva RF. 2017. No. 242-FZ. (In Russ.)

6. 10 vedushchikh prichin smerti v mire. Vsemirnaya Organizatsiya Zdravookhraneniya. URL: http://www.who.int/mediacentre/factsheets/ fs310/ru/. (Accessed: 13.11.2017). (In Russ.)

7. Antonopoulos N., Gillam L. Cloud Computing: Principles, Systems and Applications. Springer Science & Business Media, 2010. 382 P. ISBN 978-1-84996-240-7.

8. Matematicheskaya kardiologiya. Teoriya, klinicheskie rezul'taty, rekomendatsii, perspektivy.

пективы / под. ред. В.А. Лищука, Д.Ш. Газизо-вой. М.: ООО «ПРИНТ ПРО». 2015. 228 с.

9. Novopashin M.A., Shmid A.V. D.SC. Berezin A.A. PhD, Forrester's Concept in Modeling Heart Dynamics // IOSR Journal of Computer Engineering.May-Jun. 2017.Vol. 19.Issue 3. Ver.2.

10. Berezin, A.A. Resonant interaction between the Fermi-Pasta-Ulam recurrences // Bulletin of the Lebedev Physics Institute. FIAN. 2004. № 3. P. 13.

11. Wiener N. The mathematical formulation of the problem of conduction of impulses in a network of connected excitable elements, specifically in cardiac muscle // Arch. Del. Instit. De Cardiologia De Mexico. 1946. P. 205-265.

12. Van der Pol B, Van der Mark M. Le battement du coeur considere comme oscillation de relaxation et un model elecrtrique du coeur. L'Onde electrique. 1928. № 7.

13. Форрестер Д. Мировая динамика. М.: АСТ, 2006. С. 384. ISBN 5-17-019253-3.

14. Дж.-О. Ким, Ч.У. Мьюллер, У.Р. Клекка и др. Факторный, дискриминантный и кластерный анализ М.: Финансы и статистика, 1989. 215 C.

15. Fermi E., Pasta J., Ulam S. In: Collected Papers of E. Fermi. 1955. Vol. 2. 978 P.

16. Moyer, V. A. Screening for coronary heart disease with electrocardiography: U.S. Preventive Services Task Force recommendation statement // Annals of Internal Medicine. 2002. P. 157.

17. Nygren A., Fiset C., Firek L., Clark J. W., Lindblad D. S., Clark R. B., Giles W. R. Mathematical model of an adult human atrial cell: The role of K+ currents in repolarization. Circ. Res. 1998. Vol. 82(1). P. 63-81

18. Gray R. A., Pertsov A. M., Jalife J. Incomplete reen-try and epicardial breakthrough patterns during atrial ftbrillation in the sheep heart. Circulation 1996. Vol. 94. P. 2649-2661.

19. Ellis W. S., Sippens Groenewegen A., Auslander D. M., Lesh M. D. The role of the crista terminalis in atrial flutter and fibrillation: A Computer Modelling Study. Annals Biomed Engineer. 2000. Vol. 28. P. 742-754.

20. Cottle M., Hoover W., Kanwal S., Kohn M., Strome T., Treister N. W. Transforming Health Care Through Big Data, Institute for Health Technology Transformation, Washington DC, USA, 2013.

21. Ramirez R. J., Nattel S., Courtemanche M. Mathematical analysis of canine atrial action potentials: Rate, regional factors, and electrical remodeling. Am J Physiol. 2000. Vol. 279. P. 17671785

22. Foster E., Gray R. A., Jalife J. Role of the pectinate muscle structure in atrial fibrillation: A Computer Study. Pacing Clin Electrophysiol. 1997. Vol. 20. 1134 P.

23. Harrild D. M., Henriquez C. S. A computer model of normal conduction in the human atria. Circ Res 2000. Vol. 87(7). P. 25-36

ed. V.A. Lishchuka, D.Sh. Gazizovoy. Moscow: OOO «PRINT PRO». 2015. 228 p. (In Russ.)

9. Novopashin M.A., Shmid A.V. D.SC. Berezin A.A. PhD, Forrester's Concept in Modeling Heart Dynamics. IOSR Journal of Computer Engineering. May-Jun. 2017. Vol. 19. Issue 3, Ver. 2.

10. Berezin, A.A. Resonant interaction between the Fermi-Pasta-Ulam recurrences. Bulletin of the Lebedev Physics Institute. FIAN. 2004. No. 3. P. 13.

11. Wiener N. The mathematical formulation of the problem of conduction of impulses in a network of connected excitable elements, specifically in cardiac muscle. Arch. Del. Instit. De Cardiologia De Mexico. 1946. P. 205-265.

12. Van der Pol B, Van der Mark M. Le battement du coeur considere comme oscillation de relaxation et un model elecrtrique du coeur. L'Onde electrique. 1928. No. 7.

13. Forrester D. Mirovaya dinamika. Moscow: AST, 2006. P. 384. ISBN 5-17-019253-3.

14. Dzh.-O. Kim, Ch.U. M'yuller, U.R. Klekka et al. Faktornyy, diskriminantnyy i klasternyy analiz Moscow: Finansy i statistika, 1989. 215 P. (In Russ.)

15. Fermi E., Pasta J., Ulam P. In: Collected Papers of E. Fermi. 1955. Vol. 2. 978 P.

16. Moyer, V. A. Screening for coronary heart disease with electrocardiography: U.S. Preventive Services Task Force recommendation statement. Annals of Internal Medicine. 2002. P. 157.

17. Nygren A., Fiset C., Firek L., Clark J. W., Lindblad D. S., Clark R. B., Giles W. R. Mathematical model of an adult human atrial cell: The role of K+ currents in repolarization. Circ. Res. 1998. Vol. 82(1). P. 63-81

18. Gray R. A., Pertsov A. M., Jalife J. Incomplete reen-try and epicardial breakthrough patterns during atrial ftbrillation in the sheep heart. Circulation 1996. Vol. 94. P. 2649-2661.

19. Ellis W. S., Sippens Groenewegen A., Auslander D. M., Lesh M. D. The role of the crista terminalis in atrial flutter and fibrillation: A Computer Modelling Study. Annals Biomed Engineer. 2000. Vol. 28. P. 742-754.

20. Cottle M., Hoover W., Kanwal S., Kohn M., Strome T., Treister N. W. Transforming Health Care Through Big Data, Institute for Health Technology Transformation, Washington DC, USA, 2013.

21. Ramirez R. J., Nattel S., Courtemanche M. Mathematical analysis of canine atrial action potentials: Rate, regional factors, and electrical remodeling. Am J Physiol. 2000. Vol. 279. P. 17671785

22. Foster E., Gray R. A., Jalife J. Role of the pectinate muscle structure in atrial fibrillation: A Computer Study. Pacing Clin Electrophysiol. 1997. Vol. 20. 1134 P.

23. Harrild D. M., Henriquez C. P. A computer model of normal conduction in the human atria. Circ Res 2000. Vol. 87(7). P. 25-36

24. Nygren A., Giles W. R. Mathematical simulation of slowing in cardiac conduction velocity by elevated extracellular [K+] in a human atrial strand // Annals Biomed Engineer. 2000. Vol. 28. P. 951-957.

25. Friedman C., Shagina L., Lussier Y., Hripcsak G. Automated encoding of clinical documents based on natural language processing // Journal of the American Medical Informatics Association. 2004. Vol. 11. P. 392-402.

26. Fitz Hugh R. A. Impulses and physiological states in theoretical models of nerve membrane // Biophysics Journal. 1961. Vol. 1. P. 445-466.

27. Luo C-H., Rudy Y. A model of the ventricular cardiac action potential: Depolarization, repolarization, and their interaction. Circ. Res. 1991. Vol. 68(6). P. 1501- 1526.

28. Van Wagoner D. R., Pond A. L., Lamorgese M., Rossie S. S., McCarthy P. M., Nerbonne J.M. Atrial L-type Ca2+ currents and human atrial fibrillation. Circ. Res. 1999. Vol. 85 P. 428-436.

29. Hagar Y., Albers D., Pivovarov R., Chase H., Dukic V., Elhadad N. Survival analysis with electronic health record data: Experiments with chronic kidney disease // Statistical Analysis and Data Mining, ASA Data Sci. J. 2014. Vol. 7. P. 385-403.

30. Jain A. K., Murty M. N., Flynn P. J. Data clustering: A review ACM Computing Surveys. 1999. Vol. 31. P. 264-323.

Сведения об авторе

Екатерина Юрьевна Зимина

Аспирант

НИУ ВШЭ, Москва, Россия Эл. почта: ezimina@hse.ru Тел.: 8 906 082 99 04

24. Nygren A., Giles W. R. Mathematical simulation of slowing in cardiac conduction velocity by elevated extracellular [K+] in a human atrial strand. Annals Biomed Engineer. 2000. Vol. 28. P. 951-957.

25. Friedman C., Shagina L., Lussier Y., Hripcsak G. Automated encoding of clinical documents based on natural language processing. Journal of the American Medical Informatics Association. 2004. Vol. 11. P. 392-402.

26. Fitz Hugh R. A. Impulses and physiological states in theoretical models of nerve membrane. Biophysics Journal. 1961. Vol. 1. P. 445-466.

27. Luo C-H., Rudy Y. A model of the ventricular cardiac action potential: Depolarization, repolarization, and their interaction. Circ. Res. 1991. Vol. 68(6). P. 1501- 1526.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

28. Van Wagoner D. R., Pond A. L., Lamorgese M., Rossie P. S., McCarthy P. M., Nerbonne J.M. Atrial L-type Ca2+ currents and human atrial ftbrillation. Circ. Res. 1999. Vol. 85 P. 428-436.

29. Hagar Y., Albers D., Pivovarov R., Chase H., Dukic V., Elhadad N. Survival analysis with electronic health record data: Experiments with chronic kidney disease. Statistical Analysis and Data Mining, ASA Data Sci. J. 2014. Vol. 7. P. 385-403.

30. Jain A. K., Murty M. N., Flynn P. J. Data clustering: A review ACM Computing Surveys. 1999. Vol. 31. P. 264-323.

Information about the author

Ekaterina Y. Zimina

Postgraduate student

Higher School of Economics, Moscow, Russia E-mail: ezimina@hse.ru Tel. : 8 906 082 99 04

i Надоели баннеры? Вы всегда можете отключить рекламу.