Научная статья на тему 'РАЗРАБОТКА МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ'

РАЗРАБОТКА МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
46
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МАШИННОЕ ОБУЧЕНИЕ / СЕРДЕЧНО-СОСУДИСТЫЕ ЗАБОЛЕВАНИЯ / ПРОГНОЗИРОВАНИЕ / АЛГОРИТМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Киселёв А.А.

Одной из сфер применения машинного обучения является медицина. В данной научной работе представлена разработка модели с применением искусственного интеллекта для прогнозирования сердечно-сосудистых заболеваний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «РАЗРАБОТКА МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ»

IRNSS — индийская региональная спутниковая система навигации, проект которой был принят к реализации правительством Индии. Разработка осуществлялась Индийской организацией космических исследований. Система, получившая с началом эксплуатации название NAVIC, обеспечивает только региональное покрытие самой Индии и частей сопредельных государств. Спутниковая группировка IRNSS состоит из семи спутников на геосинхронных орбитах на высоте около 36 000 км. Три спутника находятся на геостационарной орбите в точках стояния 32,5 градуса, 83 градуса и 131,5 градус восточной долготы. Четыре спутника размещены на наклонной геосинхронной орбите с наклонением в 29 градусов по отношению к экваториальной плоскости, по два на позициях 55 градусов и 111,75 градусов восточной долготы. Все семь спутников имеют непрерывную радиовидимость с наземными управляющими станциями.

Каждая спутниковая система имеет определенные характеристики сигнала, но каждая система стремится быть совместимой с другими, чтобы предотвратить помехи и затухание между сигналами.

Таким образом, в работе были рассмотрены различные наиболее распространенные глобальный навигационные спутниковые системы, выявлены их основные характеристики, которые дают понять сходства и различия одной технологии от другой. Список использованной литературы:

1. Глобальная навигационная спутниковая система ГЛОНАСС. Интерфейсный контрольный документ / Российский институт космического приборостроения. - Ред. 1.0. - 2016.

2. Y. T. Jade Morton, Frank van Diggelen, James J. Spilker Jr. Position, Navigation, and Timing Technologies in the 21st Century: Integrated Satellite Navigation, Sensor Systems, and Civil Applications / The Institute of Electrical and Electronics Engineers. 2020.

3. Тимошкин А. И., Костюк Д. В. Т 41 Спутниковая связь и навигация: учебное пособие (курс лекций). -Ставрополь: Изд-во СКФУ, 2018. - 196 с.

4. Как работают навигационные системы GPS и ГЛОНАСС [Электронный ресурс]. - Режим доступа: https://www.youtube.com/watch?v=o_udfcoflng, свободный. - (дата обращения: 01.01.2023).

© Галигузова Е.В., Илларионова Ю.В., 2023

УДК 004.8

Киселёв А.А.

студент 3го курса ВШТЭ СПбГУПТД г. Санкт-Петербург, РФ Научный руководитель: Слюта М.О.,

Ст. преп. каф. ИИТСУ ВШТЭ СПбГУПТД г. Санкт-Петербург, РФ

РАЗРАБОТКА МОДЕЛИ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ

Аннотация

Одной из сфер применения машинного обучения является медицина. В данной научной работе представлена разработка модели с применением искусственного интеллекта для прогнозирования сердечно-сосудистых заболеваний.

Ключевые слова

искусственный интеллект, машинное обучение, сердечно-сосудистые заболевания,

прогнозирование, алгоритм

В настоящее время наибольшую популярность приобретает машинное обучение. Одной из сфер применения данных технологий является медицина.

На данный момент самым актуальным использованием машинного обучения в медицине является предсказание сердечно-сосудистых заболеваний. Так как данные заболевания являются основной причиной смерти во всем мире. В ходе исследования возможностей применения искусственного интеллекта возникла теоретическая задача предсказания возникновения инфаркта миокарда и ишемии. Таким образом, задача сводится к созданию самообучаемой программы, способной с высокой точностью предсказать возникновение вышеупомянутых заболеваний.

Первым этапом создания модели является обработка данных. Очень важно проанализировать входные данные, по которым модель будет обучаться. Имеются следующие признаки: наличие высокого давления, наличие высокого холестерина, индекс массы тела, был ли инсульт, есть ли диабет, была ли физическая активность последние 30 дней, наличие в рационе одного фрукта в день, наличие в рационе одного овоща в день, прием алкогольных напитков, курение, своя оценка здоровья (1-5), сколько дней из последних 30 психическое здоровье было не стабильным, сколько дней из последних 30 физическое здоровье было не стабильным, трудности при подъёме или ходьбе, пол, возрастная категория. Зависимый признак: были ли обнаружены ишемия или инфаркт миокарда. Все признаки являются числовыми. В случае, если имеются категориальные данные, то их необходимо преобразовать в числовые [2].

Для начала определяется, есть ли пропуски в данных. Для этого все элементы проверяются на тип данных NaN (not a number), и количество таких элементов суммируются. Если сумма не равна 0, то пропуски есть и их необходимо заполнить. Впоследствии необходимо определить наличие дубликатов строк.

Следующим шагом необходимо преобразовать данные. Так как данные разбросаны в значениях, то нужно масштабировать их. В данном случае используется метод RobustScaler. Он масштабирует функции, используя статистику, устойчивую к выбросам. Этот метод удаляет медиану и масштабирует данные в диапазоне от 1-го квартиля до 3-го квартиля. Формула метода выглядит следующим образом:

_ Xi-Qi(x)

1 Qs(x)-Qi(x) ,

где Х( - значения признака, Q1(x) и Q3(x) - первый и третий квартиль [3,4].

После обработки данных можно приступить к обучению модели. Сначала разобьём данные на обучающую выборку и тестовую выборку. На обучающей выборке модель будет учиться, а на тестовой будет проверять свою эффективность. Восемьдесят процентов данных будет приходится на обучающую выборку.

Для обучения модели будет использоваться логистическая регрессия. При решении задачи регрессии предсказывается значение непрерывной переменной на отрезке от 0 до 1. Это достигается с помощью применения следующего регрессионного уравнения (функция сигмоиды):

Р=— ,

1+е-У'

где P - вероятность того, что произойдёт интересующее событие,

у = а + w1x1+ + w2x2 + —+ wnxn -стандартное уравнение регрессии или логит. Коэффициенты w называются коэффициентами (весами) логистической регрессии, а - фиктивным признаком.

Для нахождения коэффициентов логистической регрессии используется метод максимального правдоподобия. Преобразованная функция правдоподобия выглядит следующим образом:

L= Yk [YilnPi(W) + (1 - Yi)ln(1 - Pi(W))]

¿—4=1

issn 2410-700x

международный научный журнал «символ науки»

# 1-1 / 2023

Для нахождения оптимальных коэффициентов необходимо найти минимум данной функции, для этого находится её градиент [1]:

дЬ V1

айтЕ,«-™

Алгоритм нахождения оптимальных весов:

1) Случайно выбираются веса.

2) Вычисляется сигмоида.

3) Вычисляется градиент.

4) Из весов вычитается градиент, умноженный на некоторую константу не превышающую единицу, и осуществляется переход к п.2

Алгоритм продолжается, пока изменение весов не станет достаточно маленьким, или пока не пройдёт определённое число итераций (рис. 1).

Рисунок 1 - Блок-схема алгоритма обучения

После вычисления весов, следует проверить точность модели на тестовой выборке. Для каждой записи вычисляем логит, а затем сигмоиду. Если сигмоида возвратила число от 0.5 до 1, то ответ модели 1, иначе 0 (рис. 2) [2].

В качестве оценки модели используется точность совпадений ответов на тестовой выборке. Количество верных предсказаний делится на общее количество записей.

В ходе работы был изучен и пройден базовый алгоритм тестирования и создания модели. Разработан прототип алгоритма модели машинного обучения, который позволяет предсказывать возникновение инфаркта миокарда и ишемии. Помимо предсказания инфаркта, созданный алгоритм

можно использовать для определения других заболеваний.

^ начале

Принимается на вход

запись X .

Вычисляется логит h - X * W

Вычисляется сигмсида Р = 1/(1-6'-h)

-ic ней

Рисунок 2 - Блок-схема алгоритма получения предсказания

Список использованной литературы:

1. Градиентный бустинг. [Электронный ресурс]. - Режим доступа - URL: https://habr.com/ru/company/ods/blog/327250/

2. Kaggle. [Электронный ресурс]. - Режим доступа - URL: https://www.kaggle.com

3. Асимметрия и эксцесс эмпирического распределения. [Электронный ресурс]. - Режим доступа - URL: http://www.mathprofi.ru/asimmetriya_i_excess.html

4. Умная нормализация данных. [Электронный ресурс]. - Режим доступа - URL: https://habr.com/ru/post/527334/

5. Способы обеспечения качества данных для машинного обучения. [Электронный ресурс]. - Режим доступа - URL: https://habr.com/ru/post/588266/

© Киселёв А.А., 2023

УДК 66-4

Линькова Я.А., Соболева Д.В., Матушкин В.П.

Студенты бакалавриата ФГБОУ ВО ТГТУ,

г. Тамбов, РФ. Научный руководитель: Пахомов А.Н.

Д.т.н. Доцент ФГБОУ ВО ТГТУ, г. Тамбов, РФ

ОПЫТ ПРИМЕНЕНИЯ ПРИБОРА ДЛЯ ОПРЕДЕЛЕНИЯ УТЕЧКИ ПРИРОДНОГО ГАЗА

Аннотация

В статье представлен процесс определения утечки природного газа с помощью специального

i Надоели баннеры? Вы всегда можете отключить рекламу.