Научная статья на тему 'ПРОБЛЕМА ВЫБОРА ОПТИМАЛЬНОГО РАЗМЕРА ВЫБОРКИ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ КЛАССИФИКАЦИИ МЕТОДАМИ ГЛУБОКОГО ОБУЧЕНИЯ'

ПРОБЛЕМА ВЫБОРА ОПТИМАЛЬНОГО РАЗМЕРА ВЫБОРКИ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ КЛАССИФИКАЦИИ МЕТОДАМИ ГЛУБОКОГО ОБУЧЕНИЯ Текст научной статьи по специальности «Математика»

CC BY
18
3
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ПРОБЛЕМА ВЫБОРА ОПТИМАЛЬНОГО РАЗМЕРА ВЫБОРКИ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ КЛАССИФИКАЦИИ МЕТОДАМИ ГЛУБОКОГО ОБУЧЕНИЯ»

Вестник медицинского института «РЕАВИЗ». 2023. Том 13. № 2. Приложение

гемоглобинав крови, характер возбудимости вегетативной нервной системы, состояние сна, настроение, наличие фобий и страхов, наличие целеустановки (социальные показатели).

Рассмотрена схема, характеризующая системную организацию основных регуляторов состояний биосистемы человека на основе функционирования и показаний его:

1. Сенсорных анализаторов (приемных органов): а) глаза/нос/язык/уши, где происходит преобразование воспринимаемых внешних раздражителей в нервные импульсы; б) нервные проводники импульсов в кору мозга; в) группы нервных клеток в центрах коры мозга - анализ ипульсов.

2. Системы кровообращения/-творения.

3. Центральной/периферийной нервной системы, - интеграция полученной информации и ее координат за счет обеспечения направленного (векторного) влияния на деятельность/функционирование всех составляющих психосоматики человека.

4. Дыхательной и выделительной систем, обеспечивающие транспорт газообразной составляющей жизнеобеспечения и функционирования биосистем, а также выведение шлаков.

Для расчета комплексного показателя уровня (индекса) здоровья, оценивая его количественным индексом, целесообразно использовать аналитическое выражение, определяющее количественное значение комплексного энергетического показателя, характеризующего уровень психосоматики в диапазоне основных функциональных систем организма:

Y4-1( Kt х pt)

Пэ/к _ НЬН/N'

Относительное значение каждого i-го показателя биомаркера можно определить:

^отн _ ^~б/с Кб/с

Предложено при оценке уровня здоровья рассматривать 9 основных биомаркеров нулевого типа, достаточно емко характеризующих уровень равновесия психосоматики человека. Таким образом, векторная диаграмма будет представлять правильный девятиугольник с пропорциональным фиксированием линий промежуточных референтных значений.

Показатель уровня (индекса) здоровья (Пэ/к) представляет собой функцию: Пэ/к _ f(J.Xt), определяемую основными факторами, характеризующих как саму биосистему: возраст, комплекс систем ее регуляции, (так и текущие/референсные значения регистрируемых биомаркеров.

ttpll х Pt X

П _ g_ 1(Kiотн X Р,. X Ккорр) _ ^ _ ЛКРб/с 1 РЛ/д )

Пэ/к _ vli /N _ к-Гр, /N'

Таким образом, данное аналитическое решение позволяет определить интегральный i-й энергетический потенциал биосистемы организма; алгоритм анализа и оценки «резерва здоровья» на субклиническом уровне.

ПРОБЛЕМА ВЫБОРА ОПТИМАЛЬНОГО РАЗМЕРА ВЫБОРКИ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ

КЛАССИФИКАЦИИ МЕТОДАМИ ГЛУБОКОГО ОБУЧЕНИЯ

Окуньков С.В., Улитин И.В.

Саратовский государственный университет, Саратов, Россия Научный руководитель: Барулина М.А., д-р физ.-мат. наук

Введение. Одна из самых актуальных проблем машинного обучения на сегодняшний день является проблема нахождения оптимального размера выборки для обучения моделей. Данная проблема аккумулирует в себе три другие основные проблеммы с данными: когда их мало, когда их много и когда они несбалансированы.

Целью данной работы является изучение зависимости результатов обучения современных моделей нейронной сети от размеров выборки и ее дисбалансности на примере мультиклассовой классификации степени хронической варикозной недостаточности нижних конечностей тела по фотографиям.

Параметры выборок данных. В качестве первой выборки были использованы 11 118 фотографий, соотношение классов в которой составило СО (7,84 %), С1 (25,27 %), С2 (13,43 %), С3(33,67 %), С4 (13,76 %), С5 (3,62 %), С6 (2,4 %).

Для получения второй выборки этот набор данных был дополнен до 20 971, при этом степень дисбаланса классов немного возросла: СО (11,89 %), С1 (26,2 %), С2 (13,64 %), С3(32,66 %), С4 (11,38 %), С5 (2,18 %), С6 (2,04 %).

Третья выборка была получена путем урезания второй так, чтобы одни классы несильно перевешивали другие: СО (14,36 %), С1 (14,1 %), С2 (15,3 %), С3(13,94 %), С4 (14,33 %), С5 (14,45 %), С6 (13,47 %).

Используемые модели нейронных сетей. Для проведения экспериментов были использованы следующие современные модели искусственных нейронных сетей для классификации изображений: ResNet50, VIT, DeIT.

Результаты обучения. В качестве целевых метрик для определения качества предсказания моделей были использованы следующие метрики: F1-score и TP для самых малочисленных классов C5 и C6. F1-score был использован для измерения качества прогнозирования модели для всех классов. Она представляет из себя среднее гармоническое между

Информационно-вычислительные технологии, искусственный интеллект и обработка больших данных в медицине

количеством правильных предсказаний целевых классов относительно всех предсказаний модели и правильных предсказаний целевых классов относительно общего количества этих классов. А ТР показывает насколько хорошо модель способна видеть определенный класс.

Результаты качества предсказаний моделей при обучении на каждой из выборок представлены в таблице 1.

Таблица 1. Результат прогноза при обучение на различных выборках

Выборка F1-score TP C5 TP C6

ResNet50 1 выборка 0,61 0,29 0,4

2 выборка 0,58 0,29 0,56

3 выборка 0,72 0,5 0,72

VIT 1 выборка 0,75 0,6 0,6

2 выборка 0,7 0,12 0,63

3 выборка 0,75 0,51 0,69

DeiT 1 выборка 0,77 0,4 0,55

2 выборка 0,73 0,44 0,71

3 выборка 0,75 0,49 0,7

В результате работы было доказано, что лучше всего модели прогнозируют ответ при обучении на маленьких, но сбалансированных выборках. Также было показано, что чем больше выборка, тем сильнее модели переобучаются под более часто встречаемые классы.

Литература

1. Barulina, M.; Sanbaev, A.; Okunkov, S.; Ulitin, I.; Okoneshnikov, I. Deep Learning Approaches to Automatic Chronic Venous Disease Classification. Mathematics 2022;10:3571.

2. https://www.mdpi.com/2227-7390/10/19/3571

МОДЕЛИРОВАНИЕ ВИРУСНОГО ИНФИЦИРОВАНИЯ В ГРУППЕ ИНДИВИДОВ С УЧЕТОМ ИХ СОЦИАЛЬНОГО ПОВЕДЕНИЯ

Панова А.А.

Московский государственный технический университет им. Н. Э. Баумана, Москва, Россия Научный руководитель: Деревич И.В., д-р техн. наук, профессор

Введение. Появление новых вирусных инфекций, вызывающих тяжелые последствия в организме инфицированного индивида, приводит к необходимости ужесточения санитарно-эпидемиологических норм. Однако, соблюдение этих ном в случае реального поведения группы индивидов не всегда выполняется. Наиболее ярко это проявляется при случайном перемещении группы индивидов в местах развлечений, в супермаркетах и нарушается при эвакуации из помещений в условиях паники. В нормах определяется некоторое критическое расстояние между индивидами, при уменьшении которого возрастает вероятность инфицирования. Кроме критического расстояния важным фактором является время экспозиции восприимчивых в радиусе активного заражения вблизи инфицированного индивида. Современным эффективным инструментом оценки вероятности инфицирования в группе индивидов с зараженными членами является математическое моделирование перемещения индивидов в различных условиях в помещениях с учетом препятствий.

В литературе большое внимание уделяется моделированию поведения больших групп в несколько сотен человек при эвакуации в условиях паники. Существующие математические модели построены по аналогии с механикой движения жестких дисков, между которыми возникают силы отталкивания при их сближении и силы «трения» при тесном контакте. Как правило ситуации с тесным контактом реализуются в постановочных экспериментах. При реальной эвакуации из помещений, как видно из фото и видео кадров, люди избегают тесных контактов и стараются соблюдать социальную дистанцию даже в критических условиях.

Методы исследования. В нашей модели, описывающей динамику небольшой группы, социальное поведение индивидов и их взаимодействие со стенками помещения моделируется на основе эффективного потенциала, резко увеличивающегося при сближении индивидов друг с другом и с границами. В динамику социального поведения включается случайная компонента желаемой скорости перемещения, которая моделируется структурированным случайным процессом.

Динамика всех индивидов группы моделируется на основе системы стохастических обыкновенных дифференциальных уравнений, которые решаются численно на основе модернизированных методов Рунге - Кутта. По истории относительного движения инфицированных и восприимчивых индивидов в группе можно оценить время экспозиции в атмосфере инфицированных членов группы.

На рисунке 1, а представлены траектории группы индивидов, покидающих галерею с колоннами в условиях паники (все размеры указаны в м). Паника приводит к заметной амплитуде хаотического движения индивидов. Видно, что вблизи выхода в результате социального взаимодействия индивидов скорость эвакуации существенно снижается и увеличивается время пребывания восприимчивых индивидов на расстоянии меньше критического (2 м) от инфицированного (рис. 1, б).

i Надоели баннеры? Вы всегда можете отключить рекламу.