Научная статья на тему 'ПРОГНОЗИРОВАНИЕ РАЗВИТИЯ ГИПЕРТОНИЧЕСКОЙ БОЛЕЗНИ С ИСПОЛЬЗОВАНИЕМ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ В ПОДСИСТЕМЕ ДИСТАНЦИОННОГО КАРДИОМОНИТОРИНГА'

ПРОГНОЗИРОВАНИЕ РАЗВИТИЯ ГИПЕРТОНИЧЕСКОЙ БОЛЕЗНИ С ИСПОЛЬЗОВАНИЕМ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ В ПОДСИСТЕМЕ ДИСТАНЦИОННОГО КАРДИОМОНИТОРИНГА Текст научной статьи по специальности «Клиническая медицина»

CC BY
71
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГИПЕРТОНИЧЕСКАЯ БОЛЕЗНЬ / ПРОГНОЗИРОВАНИЕ / МАШИННОЕ ОБУЧЕНИЕ / ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ / ДЕРЕВО РЕШЕНИЙ

Аннотация научной статьи по клинической медицине, автор научной работы — Белозерова Е.В., Данилов А.В., Исаенкова Е.А., Калинина Л.Б., Манерова О.А.

Одна из задач персонализированной медицины заключается в построении новой организационной модели оказания медицинской помощи пациентам, основываясь на подборе индивидуальных лечебных, диагностических и превентивных средств, оптимально подходящих по особенностям организма. Современные методы искусственного интеллекта позволяют решать задачи подобного типа.Цель исследования - построение и применение прогностических моделей логистической регрессии и дерева решений с использованием методов машинного обучения для выявления пациентов с высоким риском развития гипертонической болезни без необходимости проведения инвазивных клинических процедур.Материалы и методы. Используется сформированный набор данных, состоящий из 395 записей о пациентах Воронежской городской клинической поликлиники № 1. Каждая запись содержит параметры пациентов: пол пациента; возраст пациента; индекс массы тела; окружность талии; окружность бедер; статус курения табака; статус употребления алкоголя; систолическое давление; диастолическое давление. Применяются методы машинного обучения для построения прогностических моделей.Результаты. Построены две модели прогнозирования развития гипертонической болезни, характеризующиеся высокими показателями точности классификации: модель логистической регрессии, предназначенная для расчета индивидуального риска пациента (точность 96%), и модель на основе деревьев решений, предназначенная для прогнозирования возможного заболевания пациента гипертонической болезнью и объяснения причин, по которым может происходить это заболевание (точность 92%).Выводы. Показана целесообразность применения методов машинного обучения при построении прогностических моделей по оценке состояния пациентов, обозначена возможность создания рекомендательного блока на основе полученных моделей в подсистеме дистанционного кардиомониторинга.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по клинической медицине , автор научной работы — Белозерова Е.В., Данилов А.В., Исаенкова Е.А., Калинина Л.Б., Манерова О.А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PREDICTING THE DEVELOPMENT OF HYPERTENSION USING MACHINE LEARNING MODELS IN THE REMOTE CARDIOMONITORING SUBSYSTEM

One of the tasks of personalized medicine is to build a new organizational model for providing medical care to patients, based on the selection of individual medical, diagnostic and preventive agents that are optimally suitable for the peculiarities of the body. Modern artificial intelligence methods allow you to solve problems of this type.Purpose. The aim of the study is to construct and apply predictive logistic regression models and decision tree using machine learning techniques to identify patients at high risk of hypertension without the need for invasive clinical procedures.Materials and methods. A formed data set consisting of 395 patient records of Voronezh City Clinical Clinic No. 1 is used. Each record contains patient parameters: patient sex; patient age; body mass index; waist circumference; hip circumference; tobacco smoking status; alcohol use status; systolic pressure; diastolic pressure. Machine learning methods are used to build prognostic models.Results. Two models for predicting the development of hypertension are constructed, characterized by high indicators of classification accuracy: a logistic regression model designed to calculate the patient’s individual risk (accuracy 96%), and a decision tree model designed to predict the patient’s possible disease with hypertension and explain the reasons why this disease can occur (accuracy 94%). Findings. The expediency of using machine learning methods in constructing prognostic models for assessing the state of patients is shown, the possibility of creating a recommendation block based on the obtained models in the remote cardiomonitoring subsystem is indicated.

Текст научной работы на тему «ПРОГНОЗИРОВАНИЕ РАЗВИТИЯ ГИПЕРТОНИЧЕСКОЙ БОЛЕЗНИ С ИСПОЛЬЗОВАНИЕМ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ В ПОДСИСТЕМЕ ДИСТАНЦИОННОГО КАРДИОМОНИТОРИНГА»

ОРИГИНАЛЬНАЯ СТАТЬЯ

DOI: 10.21045/1811-0185-2022-2-76-84 УДК: 614.2

ПРОГНОЗИРОВАНИЕ РАЗВИТИЯ ГИПЕРТОНИЧЕСКОЙ БОЛЕЗНИ С ИСПОЛЬЗОВАНИЕМ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ В ПОДСИСТЕМЕ ДИСТАНЦИОННОГО КАРДИОМОНИТОРИНГА

Е.В. Белозероваа , А.В. Даниловь, Е.А. Исаенковас, Л.Б. Калинина^ О.А. Манеровае, Ю.И. Усов'

ь' c Воронежский государственный медицинский университет им. Н.Н. Бурденко, г. Воронеж, Россия;

d Бюджетное учреждение здравоохранения Воронежской области «Воронежская городская клиническая поликлиника № 1», г. Воронеж, Россия;

е Первый Московский государственный медицинский университет им. И.М. Сеченова Минздрава России (Сеченовский Университет), г. Москва, Россия; f Территориальный фонд обязательного медицинского страхования Воронежской области, г. Воронеж, Россия

а https://orcid.org/0000-0003-4797-9175 ь https://orcid.org/0000-0001 -6199-8423 c https://orcid.org/0000-0001-6799-9697, d https://orcid.org/0000-0002-7430-9479; е https://orcid.org/0000-0002-1660-9414; f https://orcid.org/0000-0002-3223-6603

И Автор для корреспонденции: Белозерова Е.В.

АННОТАЦИЯ

Одна из задач персонализированной медицины заключается в построении новой организационной модели оказания медицинской помощи пациентам, основываясь на подборе индивидуальных лечебных, диагностических и превентивных средств, оптимально подходящих по особенностям организма. Современные методы искусственного интеллекта позволяют решать задачи подобного типа.

Цель исследования — построение и применение прогностических моделей логистической регрессии и дерева решений с использованием методов машинного обучения для выявления пациентов с высоким риском развития гипертонической болезни без необходимости проведения инвазивных клинических процедур.

Материалы и методы. Используется сформированный набор данных, состоящий из 395 записей о пациентах Воронежской городской клинической поликлиники № 1. Каждая запись содержит параметры пациентов: пол пациента; возраст пациента; индекс массы тела; окружность талии; окружность бедер; статус курения табака; статус употребления алкоголя; систолическое давление; диастолическое давление. Применяются методы машинного обучения для построения прогностических моделей.

Результаты. Построены две модели прогнозирования развития гипертонической болезни, характеризующиеся высокими показателями точности классификации: модель логистической регрессии, предназначенная для расчета индивидуального риска пациента (точность 96%), и модель на основе деревьев решений, предназначенная для прогнозирования возможного заболевания пациента гипертонической болезнью и объяснения причин, по которым может происходить это заболевание (точность 92%).

Выводы. Показана целесообразность применения методов машинного обучения при построении прогностических моделей по оценке состояния пациентов, обозначена возможность создания рекомендательного блока на основе полученных моделей в подсистеме дистанционного кардиомониторинга.

Ключевые слова: гипертоническая болезнь, прогнозирование, машинное обучение, логистическая регрессия, дерево решений.

Для цитирования: Белозерова Е.В., Данилов А.В., Исаенкова Е.А., Калинина Л.Б., Манерова О.А, Усов Ю.И. Прогнозирование развития гипертонической болезни с использованием моделей машинного обучения в подсистеме дистанционного кардиомониторинга // Менеджер здравоохранения. 2022; 2: 76-84. DOI: 10.21045/1811-0185-2022-2-76-84.

© Белозерова Е.В, Данилов А.В, Исаенкова Е.А, Калинина Л.Б., Манерова О.А., Усов Ю.И., 2022 г.

Менеджер / Manager №2

здравоохранения / Zdrevoochrenenie 2022

Гипертоническая болезнь является распространенным заболеванием, которое стало проблемой в современном мире. Это заболевание - часть метаболического синдрома и многофакторного состояния, при котором у человека диагностируют систолическое артериальное давление > 140 мм. рт.ст. и/или диастолическое давление > 90 мм. рт.ст. Его точные причины неизвестны, но генетическая мутация, увеличение потребления соли, снижение физической активности и ожирение способствуют его прогрессированию. В некоторых случаях гипертоническая болезнь действует как «бесшумный убийца» и замечается только при достижении опасного уровня. Для некоторых людей лечение гипертонической болезни может включать только корректировки образа жизни без использования лекарств. Вмешательство в образ жизни включает, но не ограничивается такими мероприятиями, как снижение потребления соли, принятие диеты с низким содержанием жиров, потребление большего количества фруктов и овощей, принятие активного образа жизни и отказ от курения.

Одним из успешных подходов к профилактике является определение лиц, подверженных высокому риску развития такого заболевания. Исследования показали, что на развитие гипертонической болезни влияют не только предгипертонический статус, но и другие факторы, такие как возраст, пол, диета, индекс массы тела, уровень образования, стресс, сопутствующие заболевания, а также клинические показатели.

Из-за огромных затрат на лечение такого хронического заболевания были проведены исследования по оценке риска возникновения гипертонической болезни и предотвращения дальнейшего дорогостоящего лечения. Прогностические модели для прогнозирования гипертонической болезни имеют важное значение в медицинской практике из-за их ценности при уходе за пациентами.

В моделях оценки риска развития гипертонической болезни используются различные методы машинного обучения. Например, методы на основе нейронной сети, опорных векторов, случайного леса, наивного Байеса, градиентного бустин-га, деревьев решений и логистической регрессии [1, 2, 3]. В ряде публикаций на тему машинного обучения принято за правило использование для одного набора данных несколько методов классификации, проведение анализа и выбора такого метода из них, который покажет лучшую точность [4, 5]. При этом следует учитывать, что полученная

оценка точности зависит от различных условий, например, от выбранных предикторов (их состав может быть легко изменен), от характера матрицы ошибок (матрица указывает области, где классификатор работает плохо), от площади под кривой операционной характеристики (близость этой площади к единице указывает на безошибочную классификацию). Поэтому нельзя сделать однозначный вывод о лучшем классификаторе.

Известны обзоры по прогнозированию гипертонической болезни с применением методов искусственного интеллекта [6]. Так, с использованием нескольких методов машинного обучения был выявлен ряд прогностических факторов для прогнозирования гипертонической болезни, например, сопутствующая патология, история приема лекарств, возраст > 60 лет, пол, курение, семейный анамнез гипертонической болезни, индекс массы тела, уровень образования, диета с малым содержанием соли, потребление овощей, фруктов и мяса, регулярные физические упражнения, липиды низкой плотности, профессиональный статус, депрессия и тревожный статус [7]. Повышенный фактор риска сердечно-сосудистых заболеваний связан с ожирением (индекс массы тела > 29,9 кг/м2).

Цель данного исследования заключается в построении и применении прогностических моделей логистической регрессии и дерева решений с использованием методов машинного обучения для выявления пациентов с высоким риском развития гипертонической болезни без необходимости ин-вазивных клинических процедур.

Материалы и методы

Данные были представлены выборкой, состоящей из 395 пациентов Воронежской городской клинической поликлиники № 1 в период февраль -август 2020 г., давших добровольное информированное согласие на участие в исследовании. При формировании выборки была оценена генеральная совокупность по полу, возрасту и предрасположенности к гипертонической болезни. Выборка характеризуется половозрастным составом: 55,7% женщин, 44,3% мужчин в возрасте от 41 до 88 лет (среднее значение = 48,14 и стандартное отклонение = 6,05). Объем выборочной совокупности в 395 пациентов обеспечивает репрезентативность (точности 95% и погрешности ± 5%) генеральной совокупности.

У всех участников исследования был измерен вес и рост, рассчитан индекс массы тела

с

#хс

№2 Мападег

2022 2с1гв^/оос1-1гвпеп1а

/Менеджер

здравоохранения

с использованием этих измерений. Измерены окружность талии и окружность бедер. Потребление алкоголя устанавливалось в случае систематического его приема (не реже одного раза в неделю) в объеме не менее 200 г в переводе на этиловый спирт в неделю, а также при наличии сведений из медицинской документации (наблюдение у нарколога, установленные диагнозы в связи с алкоголизмом). Потребление табака устанавливалось со слов пациентов, и курящими признавались лица, выкуривающие хотя бы одну сигарету в день. Артериальное давление измерялось с помощью монитора артериального давления.

Перечисленные параметры пациентов обозначены как переменные: X] - пол пациента; X2 -возраст пациента (полных лет); X3 - индекс массы тела (кг/м2); X4 - окружность талии (см); X5 - окружность бедер (см); X6 - статус курения табака (1...4); X7 - статус употребления алкоголя (1.4); X8 - систолическое давление (мм.рт.ст.); X9 - диастоличе-ское давление (мм.рт.ст.).

Сформированный набор данных был проверен на внутреннюю согласованность путем вычисления коэффициента альфа Кронбаха. Его значение по 9 переменным составило 0,713, что является удовлетворительным для данного вида исследования. Статистический анализ проводился с использованием пакета программ SPSS Statistic v26.0. Построение моделей машинного обучения проводилось с применением инструментов и библиотек Data Science в среде разработки Python для Windows.

Для проверки взаимосвязи между данными фи-зикального обследования пациентов и значениями независимой переменной проводился корреляционный анализ. Это дало объяснение тому, насколько хорошо переменные соотносятся между собой. Получена матрица корреляций набора данных со значениями состояния пациента, представленная в виде тепловой карты (рис. 1).

Традиционные методы построения моделей основаны на нескольких допущениях, таких как нормальность распределения, линейная зависимость между независимыми и зависимыми переменными, гомоскедастичность и т.д. В отличие от них, методы машинного обучения могут обрабатывать любой тип переменной (порядковый, непрерывный, дихотомический и номинальный), без предположения о распределении, линейности или гомоскедастичности [8].

При разработке математических моделей прогнозирования развития гипертонической болезни использовались методы построения логистической

Рис. 1. Матрица корреляций набора данных для оценки состояния пациентов с признаками гипертонической болезни

регрессии и методы формирования деревьев решений. Логистическая регрессия является расширением множественной регрессии и отличается от последней тем, что в качестве зависимой переменной используется дихотомическая переменная, имеющая лишь два возможных значения (обозначают факт принадлежности/непринадлежности объекта какой-либо группе, ответ типа «Да» или «Нет» и т.п.). Метод деревьев решений представляет особый интерес для исследований состояния здоровья пациентов, поскольку позволяет обнаружить, какая переменная или комбинация переменных лучше предсказывает данный результат (например, наличие повышенного артериального давления), определить пороговые значения для каждой переменной, которая максимально предсказывает выбранный результат. Применительно к нашей задаче при выборе того или иного метода классификации, предпочтение отдается методу деревьев решений по причине его наглядности, интерпретируемости и доступности для использования практикующими врачами поликлиники.

Результаты

Построение модели логистической регрессии с применением методов машинного обучения предполагает разделение исходного набора данных на две части: для обучения и для проверки, в пропорции 75/25. Реализованный алгоритм использует 75% записей для обучения, а 25% записей - для тестирования правильности работы алгоритма

Менеджер

здравоохранения /

Manager №2

ZdrevoochreneniB 2022

и формирования метрик. Разделенный случайным образом набор данных для обучения модели имел 295, а тестовый набор данных - 100 записей. После обучения модели логистической регрессии и ее проверки на тестовом наборе данных были получены следующие значения метрик: ассигасу = 0,96; рrecision = 0,94; recall = 0,90; f1 = 0,95. Среднее абсолютное отклонение 0,04, среднеквадратичная ошибка 0,04, корень из среднеквадратичной ошибки 0,2.

Метрика «accuracy» - это точность модели, или, иначе, доля верных прогнозов в процентах. Метрику «precision» можно интерпретировать как долю записей, которые классификатор счел положительными и которые при этом истинно положительны. Полнота «recall» отображает, долю истинно положительных записей из всех объектов, которые были определены алгоритмом как «положительные». Метрику f1 можно интерпретировать как взвешенное гармоническое среднее значение точности (precision) и полноты (recall). Общая точность полученной модели составляет 96,0%, по метрике f1-95%. Полученная модель достаточно точно классифицирует ложноотрицательные записи, но ошибается при классификации ложноположи-тельных - неверно классифицированы 4 записи. Построение модели логистической регрессии для нашего набора данных и вычисление метрик заняло около 5 с.

Матрица ошибок для модели логистической регрессии изображена на рис. 2.

Логистическая регрессия. Точность: 0.960

s о г

а

г т.

£ о S

П Y-

5

59

37

-50 -40 -30 -20 -10 -О

О 1

Прогнозные значения

Рис. 2. Матрица ошибок классификации тестовой выборки на модели логистической регрессии

Далее, проведен ROC-анализ для определения предсказательной способности полученной модели. Такой анализ позволяет объективно оценить диагностическую значимость тестирования, определить критерии каждой модели классификации. ROC-кривая часто используется для представления результатов бинарной классификации, она показывает зависимость количества верно классифицированных положительных записей (истинно положительных) от количества неверно классифицированных отрицательных записей (ложноотрицательных). Оценка надежности выражается в показателях чувствительности (Sensitivity) и специфичности (Specificity).

Сравнение двух и более тестов проводится с учетом площади под кривыми (AUC). Считается, что чем ближе показатель AUC к 1,0, тем лучшей прогностической силой обладает модель (0,9-1,0 - отличное, 0,8-0,9 - очень хорошее, 0,7-0,8 - хорошее, 0,6-0,7 - среднее, 0,5-0,6 - неудовлетворительное).

Логистическую регрессию использовали для построения прогностической модели, состоящей из факторов риска Xj X^, вносящих независимый вклад в развитие гипертонической болезни у пациентов. В качестве зависимой переменной Y выбрано заключение о состоянии пациента, имеющее следующие значения: 0 - здоров, 1 - признаки гипертонической болезни.

При построении модели логистической регрессии были включены все факторы, которые вносят достоверный вклад в возможное развитие гипертонической болезни у исследуемых пациентов. Получена следующая формула логистической регрессии, определяющая вероятность развития гипертонической болезни:

p(X) = 1/1+e-zX),

где z(X) = -5,19032246^ - 0,02105641X2 -0,80720138X3 + 0,30133361X4 + 0,216851 19X5 -0,29538322X, - 0,28445933X7 + 0,31336595XS -0,00902821 Xp - 8,85167269 (константа).

Значения коэффициентов полученного уравнения показаны на рис. 3.

На рис. 4 приведена ROC-кривая, и рассчитана площадь под этой кривой со значением AUC, равным 0,95.

На основе полученной формулы вычисляли относительный риск развития гипертонической болезни для конкретного пациента. Прогнозирование заключается в получении значений переменных Xj-X9 конкретного пациента, а затем эти значения подставляются в приведенную формулу. Значение

С

#хс

->

№2 Manager

2022 Zdravoochranania

/Менеджер

здравоохранения

precision recall fl-score support

Здоров 0,98 0,92 0,95 60

Гипертоническая болезнь 0,78 0,95 0,86 19

Рис. 3. График, отражающий значения коэффициентов уравнения логистической регрессии

р(Х), равное или превышающее 0,9, свидетельствует о высоком риске развития гипертонической болезни. Это значение дает оптимальное соотношение чувствительности и специфичности.

Далее, для этого же набора данных была определена модель дерева решений. При использовании методов машинного обучения исходный набор данных разделяется на две части: для обучения и для проверки, в пропорции 80/20. Реализованный алгоритм использует 80% записей для обучения, а 20% записей - для тестирования правильности работы алгоритма и формирования метрик. Разделенный случайным образом набор данных для обучения модели имел 316, а тестовый набор данных - 79 записей. После обучения модели деревьев решений и ее проверки на тестовом наборе данных были получены следующие значения метрик:

Рис. 4. ROC-кривая модели логистической регрессии

С целью интерпретации результатов прогнозирования построена матрица ошибок классификации модели деревьев решений (изображена на рис. 5).

Матрица ошибок. Точность: 0.924

в м £

та !

E 5

■50

-10

■30

■20

-10

Среднее абсолютное отклонение 0,076, среднеквадратичная ошибка 0,076. Общая точность полученной модели составляет 92,4%.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Полученная модель достаточно точно классифицирует ложноположительные записи (1 ошибка) и незначительно ошибается при классификации ложноотрицательных - неверно классифицированы 5 записей. Построение модели деревьев решений для нашего набора данных и вычисление метрик заняло около 5 с.

^ Здоров Гиперт.болезнь

и Прогнозные значения

Рис. 5. Матрица ошибок классификации тестовой выборки с применением модели деревьев решений

После того, как классификатор обучен по имеющейся выборке, построено дерево решений, содержащее ветви глубиной до 15 уровней с привлечением комбинации предикторов, обозначенных выше. На рис. 6 приведен фрагмент дерева решений. На основе построенного дерева решений возможно формирование набора продукционных правил, составляющих ядро рекомендательного блока подсистемы дистанционного кардиомониторинга.

Рис. 6. Фрагмент дерева решений для прогнозирования состояния пациента с классами «Здоров», «Гипертоническая болезнь»

Таким образом, построены две взаимодополняющие модели прогнозирования развития гипертонической болезни, характеризующиеся высокими показателями точности классификации, опираясь на индивидуальные параметры пациента Х—Х9 -модель логистической регрессии, предназначенная для расчета индивидуального риска пациента (точность 96%), и модель на основе деревьев решений, предназначенная для прогнозирования возможной гипертонической болезни у пациента и объяснения причин, по которым может происходить это заболевание (точность 92,4%).

Обсуждение

В целом, машинное обучение дает возможность построения точных и быстрых прогностических моделей с использованием неинвазивных предикторов для скрининга гипертонической болезни, дистанционного кардиомониторинга, создания автоматизированных рекомендательных систем. Применяя методы машинного обучения, сформированы

диагностические классификационные модели для выявления гипертонической болезни.

В частности, применение модели заключается в задании параметров пациента (пол, возраст и др.), после чего отображаются результаты прогнозирования одного из значений «Здоров» или «Гипертоническая болезнь». Внесенные в подсистему дистанционного кардиомониторинга данные о пациентах (пол, возраст и др.) и полученные оп1!пе результаты измерения их систолического и диастолического давления позволяют выдать рекомендации либо по дальнейшему применению медикаментозного лечения, корректировке образа жизни, либо признания пациента здоровым с последующим занесения данных о пациенте в информационный архив. Таким образом, использование построенных моделей позволяет получить прогноз для новой группы пациентов, о наличии/отсутствии гипертонической болезни которых было неизвестно [9].

На основе прогнозных данных возможно проведение индивидуальных консультаций для изменения

•ха

поведения пациентов с признаками гипертонической болезни [10]. В ходе таких консультаций пациентам разъяснялась взаимосвязь риска развития сердечно-сосудистых заболеваний и ведение нездорового образа жизни, подчеркивался вред наносимый здоровью человека курением, спиртными напитками, избыточной массой тела и низкой физической активностью. При этом следует мотивировать пациента к принятию самостоятельного решения о необходимости изменении образа жизни, получения дополнительной информации о здоровом питании, уровне физической активности и влиянии стресса на здоровье. Использование построенных моделей позволяет определить пациентов с предгипертонией и провести целевое их информирование и формирование приверженности к ведению здорового образа жизни.

Это исследование имеет некоторые ограничения. Во-первых, модели прогнозирования были построены на относительно небольшом размере выборки, сформированной из данных о пациентах, прикрепленных к городской клинической поликлинике. Представляет интерес оценка точности моделей при увеличении объема выборки путем включения в выборку пациентов, прикрепленных к другим поликлиникам, в том числе и сельским. Во-вторых, результаты прогнозирования гипертонической болезни были получены из выборки с использованием ряда предикторов, и перечень этих предикторов может изменяться с течением времени.

Выводы

Исследование содержало использование методов машинного обучения для построения моделей классификации на основе комбинации переменных, которые лучше всего предсказывают данный результат. Машинное обучение - относительно новая научная область, ориентированная на построение и изучение систем, которые могут

автоматически учиться на данных, создавая высокоточные прогностические модели.

Настоящее исследование имеет основной целью использование методов машинного обучения, таких как логистическая регрессия и дерево решений, в контексте повышенного артериального давления. Область машинного обучения представляет собой набор инновационных методов, которые обеспечивают современные прогнозы с точки зрения точности. Такие методы популярны в различных областях науки, поскольку их интерпретация проста; результаты прогноза легко понятны специалистам в данной области; они применимы к широкому кругу проблем, могут использовать любой тип переменной в качестве предиктора, чувствительны к влиянию дополнительных переменных в прогностической модели.

Включение в подсистему дистанционного кардио-мониторинга обеих прогностических моделей по оценке состояния пациентов, наличие возможности создания рекомендательного блока на основе модели деревьев решений, показывают целесообразность применения методов машинного обучения.

В работе показано применение методов машинного обучения для решения задачи оценки состояния пациентов как в условиях поликлиники при наблюдении врачом, так и в условиях дистанционного кардиомониторинга, когда пациенты подключены к такой подсистеме и через Bluetooth-датчики измерения давления передают данные для анализа. Машинное обучение является составным элементом искусственного интеллекта, поэтому примененный в работе подход может служить начальным элементом при переходе к более развитым интеллектуальным подсистемам, внедряемым в поликлиническую деятельность.

Особенность этого исследования заключается в сосредоточении внимания на неинвазивных данных и изучении более одной модели для прогнозирования гипертонической болезни.

1. LaFreniere D, Zulkernine F., Barber D, Martin K. Using Machine Learning to Predict Hypertension from a Clinical Dataset / IEEE Symposium Series on Computational Intelligence 2016. URL: https://ieeexplore.ieee. org/document/7849886

2. Kwong E.W-Y, Wu H., Pang G.K-H. A prediction model of blood pressure for telemedicine // Health Informatics Journal. - 2018. - Vol. 24(3). - P. 227-244.

3. Tengnah M.J., Sooklall R, Nagowah S.D. A Predictive Model for Hypertension Diagnosis Using Machine Learning Techniques / Telemedicine Technologies. - 2019. - P. 139-152.

4. Tsoi K, Yiu K, Lee H, Cheng H.-M. Applications of artificial intelligence for hypertension Management // J Clin Hypertens. - 2021. - Vol. 23(3). - P. 568-574.

Менеджер

здравоохранения /

Maneger № 2

ZdrevoochrBnenÍB 2022

5. Fang M., Chen Y., Xue R, Wang H. et al. A hybrid machine learning approach for hypertension risk prediction // Neural Computing and Applications. P. 1-11.

6. Sheppard J.P., Tucker K.L., Davison W.J., Stevens R. et al. Self-monitoring of blood pressure in patients with hypertension related multi-morbidity: systematic review and individual patient data meta-analysis. Am J Hypertens. -2019. - Vol. 3(3). - P. 243-251.

7. Yatabe J, Ichihara M.S. The current state and future of internet technology-based hypertension management in Japan // Hypertens Research. - 2021. - Vol. 44. - P. 276-285.

8. Лимановская О.В. Основы машинного обучения: учебное пособие / О.В. Лимановская, Т.И. Алферьева; Мин-во науки и высш. образования РФ. - Екатеринбург: Изд-во Урал. ун-та, 2020. - 88 с.

9. Lu J.F., Chen C.M., Hsu C.Y. Effect of home telehealth care on blood pressure control: a public healthcare centre model. J Telemed Telecare. - 2019. - Vol. 25(1). - P. 35-45.

10. Omboni S, McManus R.J., Bosworth H.B., Chappell L.C. et al. Evidence and Recommendations on the Use of Telemedicine for the Management of Arterial Hypertension // Hypertension. - 2020. - Vol. 76(5). - P. 1368-1383.

ORIGINAL PAPER

PREDICTING THE DEVELOPMENT OF HYPERTENSION USING MACHINE LEARNING MODELS IN THE REMOTE CARDIOMONITORING SUBSYSTEM

E.V. Belozerovaa, A.V. Danilovb, E.A. Isaenkovac, L.B. Kalininad, O.A. Manerovae, Yu.I. Usovf

a, b, cVoronezh State Medical University named after N.N. Burdenko, Voronezh, Russia; d Budget Health Institution of the Voronezh Region "Voronezh City Clinical Clinic No. 1," Voronezh, Russia;

e First Moscow State Medical University named after I.M. Sechenov Ministry of Health of Russia (Sechenov University), Moscow, Russia;

f Territorial compulsory health insurance fund of Voronezh region, Voronezh, Russia

a https://orcid.org/0000-0003-4797-9175 b https://orcid.org/0000-0001-6199-8423 c https://orcid.org/0000-0001-6799-9697 d https://orcid.org/0000-0002-7430-9479 e https://orcid.org/0000-0002-1660-9414 f https://orcid.org/0000-0002-3223-6603 ABSTRACT

One of the tasks of personalized medicine is to build a new organizational model for providing medical care to patients, based on the selection of individual medical, diagnostic and preventive agents that are optimally suitable for the peculiarities of the body. Modern artificial intelligence methods allow you to solve problems of this type.

Purpose. The aim of the study is to construct and apply predictive logistic regression models and decision tree using machine learning techniques to identify patients at high risk of hypertension without the need for invasive clinical procedures. Materials and methods. A formed data set consisting of 395 patient records of Voronezh City Clinical Clinic No. 1 is used. Each record contains patient parameters: patient sex; patient age; body mass index; waist circumference; hip circumference; tobacco smoking status; alcohol use status; systolic pressure; diastolic pressure. Machine learning methods are used to build prognostic models.

Results. Two models for predicting the development of hypertension are constructed, characterized by high indicators of classification accuracy: a logistic regression model designed to calculate the patient's individual risk (accuracy 96%), and a decision tree model designed to predict the patient's possible disease with hypertension and explain the reasons why this disease can occur (accuracy 94%). Findings. The expediency of using machine learning methods in constructing prognostic models for assessing the state of patients is shown, the possibility of creating a recommendation block based on the obtained models in the remote cardiomonitoring subsystem is indicated.

Keywords: hypertension, prediction, machine learning, logistic regression, decision tree.

For citation: Belozerova E.V., Danilov A.V, Isaenkova E.A., Kalinina L.B., Manerova O.A, Usov Yu.I. Predicting the development of hypertension using machine learning models in the remote cardiomonitoring subsystem // Manager Zdravoochranenia. 2022; 2: 76-84. DOI: 10.21045/1811-0185-2022-2-76-84.

•КС

№ 2 Manager

2022 Zdravoochranenia

/Менеджер

здравоохранения

REFERENCES

т

эхо зЯо

зио

1. LaFreniere D, Zulkernine F, Barber D, Martín K. Using Machine Learning to Predict Hypertension from a Clinical Dataset / IEEE Symposium Series on Computational Intelligence 2016. URL: https://ieeexplore.ieee.org/ document/7849886

2. Kwong E.W-Y., Wu H, Pang G.K-H. A prediction model of blood pressure for telemedicine // Health Informatics Journal. - 2018. - Vol. 24(3). - P. 227-244.

3. Tengnah M.J., Sooklall R, Nagowah S.D. A Predictive Model for Hypertension Diagnosis Using Machine Learning Techniques // Telemedicine Technologies. - 2019. - P. 139-152.

4. Tsoi K, Yiu K, Lee H, Cheng H.-M. Applications of artificial intelligence for hypertension Management // J Clin Hypertens. - 2021. - Vol. 23(3). - P. 568-574.

5. Fang M, Chen Y, Xue R, Wang H. et al. A hybrid machine learning approach for hypertension risk prediction // Neural Computing and Applications. P. 1-11.

6. Sheppard J.P., Tucker K.L., Davison W.J., Stevens R. et al. Self-monitoring of blood pressure in patients with hypertension related multi-morbidity: systematic review and individual patient data meta-analysis. Am J Hypertens.

2019. - Vol. 3(3). - P. 243-251.

7. Yatabe J, Ichihara M.S. The current state and future of internet technology-based hypertension management in Japan // Hypertens Research. - 2021. - Vol. 44. - P. 276-285.

8. Limanovskaya O. V. Fundamentals of machine learning: a textbook / O.V. Limanovskaya, T.I. Alferieva; Ministry of Science and Higher Education of the Russian Federation. - Yekaterinburg: Publishing House of the Urals. un-ta,

2020. - 88 p.

9. Lu J.F., Chen C.M., Hsu C.Y. Effect of home telehealth care on blood pressure control: a public healthcare centre model. J Telemed Telecare. - 2019. - Vol. 25(1). - P. 35-45.

10. Omboni S, McManus R.J., Bosworth H.B., Chappell L.C. et al. Evidence and Recommendations on the Use of Telemedicine for the Management of Arterial Hypertension // Hypertension. - 2020. - Vol. 76(5). - P. 1368-1383.

ИНФОРМАЦИЯ ОБ АВТОРАХ / ABOUT THE AUTHORS

Белозерова Елена Владимировна - канд. мед. наук, доцент кафедры управления в здравоохранении ФГБОУ ВО «Воронежский государственный медицинский университет им. Н.Н. Бурденко» Министерства здравоохранения Российской Федерации, г. Воронеж, Россия.

Elena V. Belozerova - Candidate of Medical Sciences, Associate Professor of the Department of Management in Health of the Federal State Budgetary Institution VO «Voronezh State Medical University named after N.N. Burdenko» of the Ministry of Health of the Russian Federation, Voronezh, Russia. E-mail: mail@gpl.zdrav36.ru

Данилов Александр Валентинович - канд. мед. наук, доцент кафедры общественного здоровья, здравоохранения, гигиены и эпидемиологии Института дополнительного профессионального образования ФГБОУ ВО «Воронежский государственный медицинский университет им. Н.Н. Бурденко» Министерства здравоохранения Российской Федерации, г. Воронеж, Россия.

Aleksandr V. Danilov - Candidate of Medical Sciences, associate professor of public health, health care, hygiene and epidemiology of Institute of additional professional education FGBOOU WAUGH «Voronezh state medical university of N.N. Burdenko» of the Ministry of Health of the Russian Federation, Voronezh, Russia. E-mail: danil963@yandex.ru

Исаенкова Евгения Александровна - ассистент кафедры общественного здоровья, здравоохранения, гигиены и эпидемиологии Института дополнительного профессионального образования ФГБОУ ВО «Воронежский государственный медицинский университет им. Н.Н. Бурденко» Министерства здравоохранения Российской Федерации, г. Воронеж, Россия.

Evgeniya A. Isayenkova is the assistant to department of public health, health care, hygiene and epidemiology of Institute of additional professional education FGBOOU WAUGH «The Voronezh state medical university of N.N. Burdenko» of the Ministry of Health of the Russian Federation, Voronezh, Russia. E-mail: isaenkova.l984@mail.ru

Калинина Людмила Борисовна - заместитель главного врача БУЗ Воронежской области «Воронежская городская клиническая поликлиника № l», г. Воронеж, Россия.

Lyudmila B. Kalinina - Deputy Chief Physician of the BUZ of the Voronezh Region «Voronezh City Clinical Clinic No. l», Voronezh, Russia. E-mail: kalininalb@gpl.zdrav36.ru

Манерова Ольга Александровна - д-р мед. наук, профессор кафедры общественного здоровья и здравоохранения имени Н.А. Семашко ФГАОУ ВО Первый Московский государственный медицинский университет им. И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский Университет!, г. Москва, Россия.

Ol'ga A. Manerova - D.M. Sc., Professor of the Department of Public Health and Health named after N.A. Semashko FGAOU VO First Moscow State Medical University named after I.M. Sechenov Ministry of Health of the Russian Federation (Sechenov University), Moscow, Russia. E-mail: omanerova@mail.ru

Усов Юрий Иванович - канд. техн. наук, доцент, Территориальный фонд обязательного медицинского страхования Воронежской области, г. Воронеж, Россия.

Yurij I. Usov - Candidate of Tech. Sciences, associate professor, Territorial Compulsory Health Insurance Fund, Voronezh, Russia. E-mail: yiusov@mai1.ru

Менеджер

здравоохранения /

Maneger № 2

ZdrevoochrBnenÍB 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.