Научная статья на тему 'ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ВЫЯВЛЕНИЯ ИШЕМИЧЕСКОЙ БОЛЕЗНИ СЕРДЦА'

ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ВЫЯВЛЕНИЯ ИШЕМИЧЕСКОЙ БОЛЕЗНИ СЕРДЦА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
132
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИШЕМИЧЕСКАЯ БОЛЕЗНЬ СЕРДЦА / ЗАБОЛЕВАНИЯ СЕРДЦА / МАШИННОЕ ОБУЧЕНИЕ / КЛАССИФИКАЦИЯ / ПРОГНОЗИРОВАНИЕ / КЛАСТЕРИЗАЦИЯ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Леонов Юрий Алексеевич, Царева Галина Вячеславовна, Терехов Максим Владимирович, Гришина Валерия Викторовна

Статья посвящена актуальной проблеме выявления ишемической болезни сердца у пациентов на основе данных об его обследовании. Приведен анализ научных работ для определения популярных методов интеллектуального анализа данных для выявления заболеваний в области кардиологии. Особое внимание уделено проектированию информационноаналитической системы для выявления заболевания сердца и выбору оптимальных методов формализованного анализа. Для решения поставленных задач выявления ишемической болезни сердца, прогнозирования значения метаболического эквивалента и кластеризации списка пациентов было разработано программное обеспечение, часть функционала которого описана в статье. Проведен анализ полученных графиков и результатов работы аналитических моделей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Леонов Юрий Алексеевич, Царева Галина Вячеславовна, Терехов Максим Владимирович, Гришина Валерия Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE USE OF INTELLECTUAL DATA ANALYSIS METHODS FOR DETECTING CORONARY HEART DISEASE

The article is devoted to the actual problem of the detection of coronary heart disease based on the data of the examination ofpatients. The analysis of scientific works to determine popular methods of data mining for detecting diseases in the field of cardiology is presented. Particular attention is paid to the design of an information system for detecting heart disease and the choice of optimal methods for formalized analysis. To solve the problems of detecting coronary heart disease, predicting the metabolic equivalent value and clustering the list of patients, software was developed, part of the functionality of which is described in the article. The analysis of the obtained graphs and the results of the work of analytical models are carried out.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ВЫЯВЛЕНИЯ ИШЕМИЧЕСКОЙ БОЛЕЗНИ СЕРДЦА»

УДК 004.021

DOI: 10.24412/2071-6168-2022-7-171-179

ИСПОЛЬЗОВАНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ВЫЯВЛЕНИЯ ИШЕМИЧЕСКОЙ БОЛЕЗНИ СЕРДЦА

Ю.А. Леонов, Г.В. Царева, М.В. Терехов, В.В. Гришина

Статья посвящена актуальной проблеме выявления ишемической болезни сердца у пациентов на основе данных об его обследовании. Приведен анализ научных работ для определения популярных методов интеллектуального анализа данных для выявления заболеваний в области кардиологии. Особое внимание уделено проектированию информационно-аналитической системы для выявления заболевания сердца и выбору оптимальных методов формализованного анализа. Для решения поставленных задач выявления ишемической болезни сердца, прогнозирования значения метаболического эквивалента и кластеризации списка пациентов было разработано программное обеспечение, часть функционала которого описана в статье. Проведен анализ полученных графиков и результатов работы аналитических моделей.

Ключевые слова: ишемическая болезнь сердца, заболевания сердца, машинное обучение, классификация, прогнозирование, кластеризация, интеллектуальный анализ данных.

Широкая распространенность сердечно-сосудистых заболеваний, сохраняющийся высокий уровень смертности от них, обуславливают необходимость внедрения в клиническую практику современных эффективных методов ранней диагностики этих патологий. Ожидается, что использование методов машинного обучения и статистических методов анализа данных, которые могут предсказать наличие сердечных заболеваний, значительно снизит смертность, а также затраты на здравоохранение.

В рамках исследования в качестве исходных данных был взят набор данных, собранный на основе проведенных исследований людей на наличие ишемической болезни сердца [1]. Данные включают различные измерения состояния здоровья пациентов и статистику сердечнососудистой системы. Представленный набор данных имеет 76 атрибутов, которые можно разбить на некоторые смысловые группы, описывающие состояние пациента и его сердечнососудистой системы.

Основной задачей анализа является выявление ишемической болезни сердца у пациента на основе данных его обследования. Данная задача является задачей классификации, которая позволит выявить наличие или отсутствие болезни у пациента. Также интерес представляет решение задачи прогнозирования, а именно определение значения метаболического эквивалента (metabolic equivalent, MET) для пациента, и решение задачи кластеризации всего списка пациентов для выявления групп риска.

Существует множество научных работ и статей, направленных на исследование развития и диагностики ишемической болезни сердца у людей при помощи методов интеллектуального анализа данных.

В результате проведенного анализа научных работ можно сделать вывод о том, то для диагностики различных заболеваний в области кардиологии находят применение такие методы анализа, как нейронные сети прямого распространения (многослойный персептрон) [2] и метод опорных векторов с RBF ядром [3]. Помимо формализованных методов анализа также применяются различные статистические методы, позволяющие решать проблему того, почему были получены те или иные результаты машинного обучения [4].

Среди существующих программных комплексов в области диагностики сердечных заболеваний многие из них представляют собой автоматизированное рабочее место врачей-кардиологов.

Автоматизированное рабочее место «Врач-кардиолог» от компании MedElement позволяет решать множество задач, среди которых управление расписанием приемов, создание текстовых шаблонов диагнозов, направлений, назначений и рекомендаций [5]. Автоматизированное рабочее место детского кардиолога-аритмолога (АРМДК), разработанное Московским научно-исследовательским институтом педиатрии и детской хирургии, предназначено для выполнения функций, связанных наблюдением и лечением ребенка с нарушением ритма сердца [6].

На основе проведенного анализа можно утверждать, что методы машинного обучения позволяют в полной мере решать задачи, связанные с диагностикой и выявлением заболеваний сердца. Исходя из этого, имеется необходимость в создании информационно-аналитической системы, которая позволит не только автоматизировать деятельность врачей и административного персонала медицинского учреждения, но и выявлять сердечно-сосудистые заболевания, используя методы интеллектуального анализа данных.

В рамках проектирования информационно-аналитической системы была разработана его архитектура, представленная на рис. 1.

В качестве архитектуры программного комплекса была выбрана архитектура «клиент-сервер», при которой сервер способен поддерживать многопользовательский режим работы.

При проектировании клиентской части для достаточного функционирования системы были определены роли доступа, каждая из которых будет иметь свой круг функциональных возможностей. Для клиентского приложения на OC Windows такими ролями являются ассистент врача, администратор, менеджер и аналитик. Приложение под ОС Android будет доступно только для пациентов.

При проектировании серверной части системы была использована модульная структура, которая позволяет реализовывать отдельные задачи независимо друг от друга. Основным модулем является модуль взаимодействия с сервером, предназначенный для выполнения запросов со стороны клиентской части информационно-аналитической системы. Модуль взаимодействия с базой данных предназначен для добавления, удаления и редактирования данных в базе данных. Работа пользователя со статистикой представлена модулем формирования статистических выборок и модулем визуализации графиков и отчетов.

Работа с аналитикой представлена модулем работы и настройки аналитических моделей, а также модулями, которые позволяют решать конкретные задачи: модуль выявления ишемической болезни сердца, модуль прогнозирования метаболического эквивалента нагрузки и модуль выявления групп риска среди пациентов.

Администратор

Менеджер

приложение по ОС windows

Аналитик

Пациент

Приложение под ОС Android

Модуль приватного API сотрудников

Модуль публичного API пациентов

Модуль взаимодействия с сервером

Модуль работы с аналитическими моделями Модуль выявления ишемической болезни сердца

Модуль настройки аналитических моделей Модуль прогнозирования метаболического эквивалента

Модуль просмотра карты посещения пациента Модуль выявления групп риска среди пациентов

Модуль визуализации графиков и отчетов

по выборкам \

Модуль Формирования статистических выборок

Модуль импорта и Экспорта данных

Модуль обработки данных пациентов

Модуль учета

операций (логирование)

Модуль защиты персональных данных

Модуль взаимодействия с базой данных

|1з:гз данных|

Рис. 1. Архитектура информационно-аналитической системы

Среди методов машинного обучения для решения задачи классификации можно выделить метод опорных векторов (SVM), деревья решений, многослойный персептрон (MLP). В результате проведенного корреляционного анализа набора данных были выбраны атрибуты для классификации, представленные в табл. 1.

Таблица 1

Фрагмент данных, участвующих в классификации_

Возраст Пол Тип боли Пульс в покое Прод-сть теста с нагрузкой Макс. пульс Стено-кардия Депрессия ST Наклон ST Рез-т стресс-теста Наличие болезни

63 1 2 60 10.5 150 0 2.3 4 3 0

67 1 5 64 9.5 108 1 1.5 3 2 1

67 1 5 78 8.5 129 1 2.6 3 4 1

37 1 4 84 13 187 0 3.5 4 2 0

41 0 3 71 7 172 0 1.4 2 2 0

В рамках тестирования методов классификации расширения ML.NET для Visual Studio [7] на тестовом наборе данных, модель дерева решений дала точность, близкую к 1 (0.989), модель метода опорных векторов с линейным ядром 0.793, а модели опорных векторов с глубоким обучением показала точность 0.881.

Исходя из вышеприведенного анализа, для выявления ишемической болезни сердца и прогнозирования метаболического эквивалента нагрузки, был использован такой метод машинного обучения, как деревья решения. При этом для выявления заболевания было использовано дерево классификации, а для определения метаболического эквивалента нагрузки дерево регрессии. Для решения задачи прогнозирования были выбраны атрибуты, представленные в табл.2

Таблица 2

Фрагмент данных, участвующих в прогнозировании_

Прод-сть теста с нагрузкой Макс. пульс Макс. диастолическое давление Стенокардия Упражнение при ЭКГ Рез-т стресс-теста Значение MET

10.5 150 90 0 2 3 13

9.5 108 90 1 2 2 13

8.5 129 80 1 2 4 10

13 187 68 0 2 2 17

7 172 74 0 2 2 9

Решающее дерево представляет собой связный ациклический граф, в узлах которого представлены решающие правила, а в листьях - конечное решение с меткой класса. Процесс построения дерева решений заключается в разбиении обучающего множества на подмножества с применением решающих правил и продолжается до тех пор, пока все узлы не станут листьями. Одним из важных этапов построения дерева решений является выбор признака, по которому будет проводиться разбиение множества объектов узла. Для этого существуют такие критерии, как теоретико-информационный и статистический [8].

Теоретико-информационный критерий основан на понятии информационной энтропии

Н:

Н= -Н=1%*1одф, (1)

где п - количество классов в исходном множестве; N - число примеров 7-ого класса; N - число примеров в подмножестве.

В результате лучшим признаком разбиения будет являться тот, для которого значения энтропии будет минимальным, то есть стремиться к нулю.

Статистический подход использует неопределенность Джини (индекс 07п7):

сш = 1-^ф2, (2)

где п - количество классов в исходном множестве; N7 - число примеров >ого класса; N - число примеров в подмножестве.

Данный индекс показывает, насколько часто объект из обучающего множества будет распознан неверно. Таким образом, лучшим является признак, для которого значение индекса Джини также стремится к нулю, как и в случае энтропии.

Для решения задачи определения групп риска среди пациентов были использованы самоорганизующиеся карты Кохонена. В результате корреляционного анализа для решения задачи кластеризации были выбраны атрибуты, представленные в табл. 3.

Таблица 3

Фрагмент данных, участвующих в кластеризации

Возраст Пол Гипертензия Холестерин Сахар в крови Пульс в покое Наличие болезни Макс. пульс Гипогликемия

63 1 1 6 1 60 0 150 0

67 1 1 7.4 0 64 1 108 0

67 1 1 5.9 0 78 1 129 0

37 1 0 6.5 0 84 0 187 0

41 0 1 5.3 0 71 0 172 0

Преимущества данного метода перед другими методами кластеризации, например, алгоритм k-means, EM-алгоритм, алгоритмы семейства FOREL и т.д., заключается в том, что карты Кохонена способны автоматически определять количество кластеров, на которые разделяется набор данных, в отличие от других методов.

Согласно алгоритму самоорганизующейся карты Кохонена для решения поставленной задачи были проведены следующие этапы [9]:

1. Задание структуры (архитектуры) нейронной сети.

2. Нормализация входных данных.

3. Инициализация весовых коэффициентов.

4. Поиск BMU для примера из обучающей выборки.

5. Вычисление радиуса окрестности BMU.

6. Коррекция вектора весов нейронов.

На этапе задания структуры нейронной сети необходимо обозначить количество нейронов выходного слоя K. Помимо этого каждый пример из обучающей выборки представляет собой «-мерный вектор V = (vi, V2, ■■■, v«), а каждый нейрон содержит соответствующий n-мерный вектор весов W = (wi, W2, ■.., w«). Также каждый нейрон имеет свои координаты в двумерной сети х и у.

Этап нормализации входных данных подразумевает приведение всех входных значений к промежутку [0, 1], реже к значениям в промежутке [-1, 1]. Для того чтобы нормализовать данные в пределах [0, 1], необходимо воспользоваться следующей формулой:

„ _ x~xmin (3)

лпогт „ „ , \Jf

хтах xmin

где x - значение параметра пациента, заданное изначально; Xmax - максимальное значение параметра; xmin - минимальное значение параметра.

Инициализировать весовые коэффициенты можно различными способами, однако при нормализации исходных данных в пределах [0, 1] веса wij можно инициализировать случайным образом как:

^-vH^05^ ' (4)

где M - количество входных переменных сети (характеристических признаков пациента).

После инициализации весов необходимо провести поиск нейрона BMU для примера из обучающей выборки.

BMU (Best Matching Unit) - нейрон, компоненты вектора весов которого наиболее близки к компонентам вектора входных сигналов. Для нахождения BMU необходимо вычислить расстояние между входным вектором и вектором весов для каждого из нейронов сети по формуле:

0 = №=о(.Ч-™д2, (5)

где Vi - i-ый компонент вектора V (пример из обучающей выборки), Wi - i-ый компонент вектора W.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нейрон, для которого данное расстояние будет наименьшим, помечается как BMU. После нахождения BMU производится поиск нейронов, которые находятся в окрестности данного BMU. На этапе кластерного анализа BMU определяет принадлежность входного примера к соответствующему кластеру. В дальнейшем, для нейронов, которые входят в радиус окрестности BMU, корректируются значения их весов. При этом, чем ближе нейрон к BMU, тем больше изменяется вес.

Радиус окрестности вычисляется по следующей формуле:

S = S0*e(~}, (6)

где So - радиус окружности на первой итерации; t - номер итерации; X - постоянная времени.

Если нейрон лежит в окрестности ВМи, то необходимо корректировать вектор весов для этого нейрона по формуле:

= № + 61, *(у — №), (7)

где Ж' - вектор весов после коррекции; Ж - вектор весов до коррекции; Q - влияние удаленности нейрона от ВМи; Ь - скорость обучения; V - вектор входных значений, соответствующий

вми.

После корректировки вектора весов необходимо вернуться к шагу нахождения ВМи до тех пор, пока все примеры из выборки не будут использованы в обучении карты Кохонена или скорость обучения не упадет до установленного минимального значения.

На основе разработанной конструкторской документации была разработана информационно-аналитическая система, которая позволяет выявлять наличие ишемической болезни сердца на основе данных приема пациента. Интерфейс программы представлен на рис. 2, 3.

На рис. 2 представлен пользовательский интерфейс ассистента врача, позволяющий вводить данные приема пациента. Данное окно содержит результаты обследования мужчины 75 лет.

ОБЩИЕ ПОКАЗАТЕЛИ

Дл1а Привил: Кур««»?;

Кол-во сигаре» в день Локализация боли, болевое напряже ни? Боль после отдыкл: Тип боли

» Есть.

Гмиертеищя

Сывороточный колестер*« (имоль/л): 7.4 Сахар в крови: > 6 б ииоль/л

Предрасположенность ИБС * Да Члсюм Сердечных сокращений в покое: Систолическое артериальное давление: Дшастолическое артериальное давление Р»»ультат ЭЙ" ■ стог

ПОКАЗАТЕЛИ ЭКГ С НАГРУЗКОЙ

Дота проведения. [15.052021 Е Депрессия 5Т-сегм*нтл: 1.5

Упражнение при проведи'ии Прото» - Время депрессии СТ-свгмента. 6 Продолжительность гни (мин): Наклон 5Т-сесмен»а: Плоская (Прян

Макс частота сердечны* сокращения 108 Стенокардия * £стъ Нег

Макс систолическое давление 160 Гипогликемия: Есть ■ Нет

Макс диастоликеское давление: 90 Результат стресс-теста: Нормально

Информация О приеме ПацивнЮМ ЛвмрсТенны* срыт □ Дигиталис V бега-блоклторы I ! Нитраты

Диурези си О Блокагоры каЛьциеаык каналов

ПОКАЗАТЕЛИ КАТЕТЕРИЗАЦИИ

128.052021

Я Ргок|.А0

1С*

V Ий1А0 □ ИМ

Сосуды, окрашенные стеной сосудов сердца □ РюхКСА

оме

Рис. 2. Вкладка «Данные приема» окна ассистента врача

Рис. 3 содержит интерфейс программы, в котором происходит отображение аналитических результатов, полученных при анализе введенных данных обследования (рис. 2). Решение задачи классификации позволяет определить наличие или отсутствие ишемической болезни сердца, при этом диагноз ставится на основе результатов по общим и медицинским показателям, а также по совокупности показателей. При решении задачи прогнозирования определяется значение МЕТ, которое может быть в пределах от 1 до 17. Результатом кластеризации является номер группы риска пациента, при этом информация обо всех группах и карта Кохонена также отражаются в данном окне.

Рис. 3. Вкладка «Аналитическиерезультаты» окна ассистента врача

175

На основе анализа информации о группе риска, в которую попал пациент, можно сделать вывод о том, что для данной группы характерен средний возраст 51 год с преобладанием пациентов мужского пола. При этом данная группа содержит подавляющее большинство пациентов, у которых отсутствует ишемическая болезнь сердца.

При настройке гиперпараметров аналитических моделей были получены следующие показатели точности:

при построении дерева классификации (выявление ишемической болезни сердца пациентов) по базовым (общим) характеристикам точность дерева составила 0.8, по медицинским характеристикам - 0.9, а по совокупности параметров - 0.98;

при построении дерева регрессии (прогнозирование значения MET) среднее квадратичное отклонение составило 0.18.

Данные результаты говорят о том, что задача классификации и прогнозирования решаются с высокой точностью, так как при прогнозировании отклонение должно стремиться к нулю, а при классификации эффективными являются те методы, точность которых выше 0.75.

На рис. 4 и 5 представлены графики, которые позволяют просматривать различные зависимости в данных, хранящихся в базе.

Зависимость наличия заболевания от пола пациента Нзпичие заб0леаания у „енщин

# Наличие ИБС

ЖеНЩИНЬ А • Отсутсвие ИБС

1 Мужчинь

Наличие ИБС Отсутсвие ИБС

Наличие заболевания

Наличие заболевания у мужчин

в Наличие ИБС # Отсутсвие ИБС

Рис. 4. График зависимости наличия заболевания от пола пациента

При анализе графиков, представленных на рис. 4, можно сделать вывод о том, что в исходном наборе данных большая часть пациентов мужчин. При этом только у 24% пациентов женщин имеется заболевание сердца, тогда как у пациентов мужчин имеют заболевание 63%.

Отсутствие заболевания

Наличие заболевания

Рис. 5. График зависимости наличия заболевания от типа боли в груди

176

При анализе графиков, представленных на рис. 5, можно сделать вывод, что при наличии заболевания пациент, как правило, не имеет каких-либо явных болей в груди. Однако при отсутствии заболевания пациент в основном имеет нетипичную стенокардию или несердечную боль в груди, при этом около ста пациентов из исследуемых девятисот также не имеют симптомов боли.

Заключение. В результате проведенного исследования была разработана информационно-аналитическая система, которая способна выявлять наличие ишемической болезни сердца, прогнозировать значение MET, а также выделять группы риска среди пациентов. Данная система способна с высокой точностью решать задачи классификации, прогнозирования и кластеризации.

Разработанную информационно-аналитическую систему можно модернизировать и улучшать в дальнейшем, так как она имеет модульную архитектуру. Это позволит модифицировать систему, внося изменения в соответствующий модуль без затрагивания других, а также добавлять новые модули при необходимости.

Таким образом, разработанная информационно-аналитическая система подходит для применения в медицинском учреждении, занимающимся выявлением заболеваний сердечнососудистой системы. При этом данную систему можно изменить под нужды конкретной организации в короткие сроки, а сбор и обработка данных о приеме пациентов поспособствуют накоплению данных больших объемов. В дальнейшем эти данные позволят повысить точность решения поставленных задач путем переобучения аналитических моделей.

Список литературы

1. Heart Disease Data Set [Электронный ресурс]. URL: https://archive.ics.uci.edu/ml/datasets/Heart+Disease (дата обращения: 10.05.2022).

2. Выучейская В.М., Крайнова И.Н., Грибанов А.В. Нейросетевые технологии в диагностике заболеваний (обзор) // Журнал медико-биологических исследований. 2018. №3. С. 284-294.

3. Yadav Samir & Jadhav, Shivajirao. (2020). Machine Learning-Based Cardiovascular Disease Diagnosis Using Feature Selection. 7 p. DOI: 10.13140/RG.2.2.15329.33127.

4. Кузнецова А.В., Сенько О.В., Кузнецова Ю.О. Преодоление проблемы «черного ящика» при использовании методов машинного обучения в медицине // Врач и информационные технологии. 2018. №S1. С. 74-80.

5. АРМ «Врач-кардиолог». [Электронный ресурс]. URL: https://medelement.com/page/arm_kardiolog (дата обращения: 10.05.2022).

6. Автоматизированное рабочее место врача - детского кардиолога-аритмолога. [Электронный ресурс]. URL: https://cardio-rus.ru/projects/avtomatizirovannoe-rabochee-mesto-vracha-detskogo-kardiologa-aritmologa (дата обращения: 10.05.2022).

7. Документация по ML.NET. [Электронный ресурс]. URL: https://docs.microsoft.com/ru-ru/dotnet/machine-learning (дата обращения: 10.05.2022).

8. Митрофанов С.А. О модификации алгоритма обучения дерева решений / С.А. Митрофанов // Решетневские чтения. 2018. № 2. С. 138-139.

9. Кохонен Т. Самоорганизующиеся карты. М.: БИНОМ, 2014. 656 с.

10. Филиппов Р.А., Филиппова Л.Б., Сазонова А.С. Интернет вещей: основные понятия: учебно-методическое пособие. Брянск: БГТУ, 2016. 112 с.

11. Леонов Ю.А., Леонов Е.А., Филиппов Р.А., Филиппова Л.Б. Исследование операций: лабораторный практикум. М.: ООО «Флинта», 2018. 94 с.

12. Kuzmenko A.A., Filippova L.B., Sazonova A.S., Filippov R.A. Intelligent System of Classification and Clusterization of Environmental Media for Economic Systems // Proceedings of the International Conference on Economics, Management and Technologies 2020 (ICEMT 2020). Advances in Economics, Business and Management Research, volume 139. P. 583-586.

13. Leonov YU.A., Leonov E.A., Kuzmenko A.A., Martynenko A.A., Averchenkova E.E., Filippov R.A. Selection of rational schemes automation based on working synthesis instruments for technological processes. Yelm, WA, USA: Science Book Publishing House LLC, 2019. 192 p.

14. Leonov E.A., Intellectual subsystems for collecting information from the internet to create knowledge bases for self-learning systems / E.A. Leonov, Y.A. Leonov, Y.M. Kazakov, L.B. Filippova/ In: Abraham A., Kovalev S., Tarassov V., Snasel V., Vasileva M., Sukhanov A. (eds) — Text: electronic // Proceedings of the Second International Scientific Conference "Intelligent Information

177

Technologies for Industry" (IITI'17). IITI 2017. Advances in Intelligent Systems and Computing. Springer, Cham, 2017. Vol 679. P. 95-103. D0I:10.1007/978-3-319-68321-8_10.

15. Кузьменко А.А., Кондратенко С.В., Сазонова А.С., Аверченков А.В., Филиппов Р.А. Разработка структуры WEB-ресурса на основе потребностей конечного пользователя // Новые информационные технологии в научных исследованиях Материалы XXIII Всероссийской научно-технической конференции студентов, молодых ученых и специалистов. Рязань: Рязанский государственный радиотехнический университет, 2018. Т. 2. С. 183-185.

Леонов Юрий Алексеевич, канд. техн. наук. доцент, yorleon@yandex. ru, Россия, Брянск, Брянский государственный технический университет,

Царева Галина Вячеславовна, канд. пед. наук, заведующий кафедрой, tzareva9773@mail.ru, Россия, Брянск, Брянский государственный технический университет,

Терехов Максим Владимирович, канд. техн. наук, доцент, malt86@mail.ru, Россия, Брянск, Брянский государственный технический университет,

Гришина Валерия Викторовна, студент, libv88@yandex.ru, Россия, Брянск, Брянский государственный технический университет

THE USE OF INTELLECTUAL DATA ANALYSIS METHODS FOR DETECTING CORONARY HEART DISEASE

YU.A. Leonov, G.V. Tsareva, M. V. Terekhov, V.V. Grishina

The article is devoted to the actual problem of the detection of coronary heart disease based on the data of the examination ofpatients. The analysis of scientific works to determine popular methods of data mining for detecting diseases in the field of cardiology is presented. Particular attention is paid to the design of an information system for detecting heart disease and the choice of optimal methods for formalized analysis. To solve the problems of detecting coronary heart disease, predicting the metabolic equivalent value and clustering the list of patients, software was developed, part of the functionality of which is described in the article. The analysis of the obtained graphs and the results of the work of analytical models are carried out.

Key words: coronary heart disease, heart disease, machine learning, classification, prediction, clustering, data mining.

Leonov Yuriy Alekseyevich, candidate of technical sciences, docent, yorleon@yandex.ru, Russia, Bryansk, Bryansk state technical University,

Tsareva Galina Vyacheslavovna, candidate ofpedagogical sciences, head of the department, tzareva9773@mail.ru, Russia, Bryansk, Bryansk State Technical University,

Grishina Valeriya Viktorovna, student, libv88@yandex. ru, Bryansk State Technical University

i Надоели баннеры? Вы всегда можете отключить рекламу.