Научная статья на тему 'МЕТОДЫ СБОРА ДАННЫХ В СЕТИ ИНТЕРНЕТ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ НА ПРИМЕРЕ ЗАДАЧИ КЛАССИФИКАЦИИ ХРОНИЧЕСКОЙ ВЕНОЗНОЙ НЕДОСТАТОЧНОСТИ'

МЕТОДЫ СБОРА ДАННЫХ В СЕТИ ИНТЕРНЕТ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ НА ПРИМЕРЕ ЗАДАЧИ КЛАССИФИКАЦИИ ХРОНИЧЕСКОЙ ВЕНОЗНОЙ НЕДОСТАТОЧНОСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
20
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Улитин И.В., Окуньков С.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МЕТОДЫ СБОРА ДАННЫХ В СЕТИ ИНТЕРНЕТ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ НА ПРИМЕРЕ ЗАДАЧИ КЛАССИФИКАЦИИ ХРОНИЧЕСКОЙ ВЕНОЗНОЙ НЕДОСТАТОЧНОСТИ»

Информационно-вычислительные технологии, искусственный интеллект и обработка больших данных в медицине

МЕТОДЫ СБОРА ДАННЫХ В СЕТИ ИНТЕРНЕТ ДЛЯ РЕШЕНИЯ МЕДИЦИНСКИХ ЗАДАЧ НА ПРИМЕРЕ ЗАДАЧИ КЛАССИФИКАЦИИ ХРОНИЧЕСКОЙ ВЕНОЗНОЙ НЕДОСТАТОЧНОСТИ

Улитин И.В., Окуньков С.В.

Саратовский государственный университет, Саратов, Россия Научный руководитель: Барулина М.А., д-р физ.-мат. наук

Введение. При исследовании возможностей применения искусственного интеллекта в задачах диагностики различных заболеваний важную роль играет сбор и подготовка набора данных. Подготавливаемый набор данных впоследствие будет использован алгоритмами ИИ для решения поставленной задачи. На данном этапе исследования может возникнуть проблема отсутствия такого количества данных, которое было бы необходимо для удовлетворительного результата решения задачи с помощью нейронной сети. Существует множество способов увеличения объема выборки для разных видов данных, однако не все из них применимы для медицинских данных. В ходе решения задачи классификации изображений хронической венозной недостаточности использовалось несколько различных методов [1].

Целью данной работы было исследование возможности сбора медицинских данных из общедоступных ресурсов сети Интернет с помощью программных средств.

Параметры исходного набора данных. Первоначальный объем выборки составлял 2147 фотографий ног с хронической венозной недостаточностью, вручную сделанных флебологом-специалистом. Набор данных был поделен на 7 классов в соответствии с международным стандартом классификации венозных заболеваний CEAP (класс C0 - здоровые ноги, класс C6 - трофическая язва). Характерным недостатком являлось несбалансированное количество изображений разных классов между собой - классы C1 и C3 составляли 25 % и 33 % всей выборки, классы C2 и C4 составляли по 13 % от всей выборки, а остальное приходилось на классы C0, C5 и C6 (около 7 %, 3 % и 2 % от всей выборки соответственно).

Примененные методы сбора данных и результат. Для увеличения объема выборки было принято решение осуществить сбор данных из сети Интернет с помощью нескольких инструментов: Scrapy и Selenium. Пользуясь Scrapy, из социальной сети Instagram был получен набор ссылок на фотографии, которые были загружены в соцсеть флебологами со всего мира. Поиск аккаунтов флебологов, содержащих подходящее количество изображений ног с ХВН (хронической венозной недостаточностью), осуществлялся вручную. После отбора аккаунтов, запускалась программа, разработанная на Python, которая использовала Scrapy для считывания ссылок на фото со всех собранных аккаунтов. Далее, в соответствии с сохраненными ссылками, осуществлялось скачивание изображений. Затем специалист-флеболог вручную классифицировал полученные таким образом изображения, после чего они добавлялись в набор данных. С помощью Scrapy удалось увеличить количество изображений классов, определяющих степени заболевания C4, C5 и C6 (всего набор данных увеличился на 18824 элементов). Для увеличения объема выборки изображений класса C0 (которым соответствовали фотографии здоровых ног) был использован Selenium - инструмент для автоматического использования браузера с помощью написанных скриптов, где в качестве используемого браузера был выбран Yandex Browser. С помощью Selenium удалось увеличить количество изображений здоровых ног в наборе данных, что способствовало уменьшению несбалансированности выборки (после применения было добавлено 2485 изображений). В результате работы была доказана возможность применения специальных программных средств и инструментов для сбора данных при решении медицинских задач посредством искусственного интеллекта.

Литература

1. Barulina, M.; Sanbaev, A.; Okunkov, S.; Ulitin, I.; Okoneshnikov, I. Deep Learning Approaches to Automatic Chronic Venous Disease Classification. Mathematics 2022, 10, 3571. https://www.mdpi.com/2227-7390/10/19/3571

ВЛИЯНИЕ ПРОСМОТРА ЭМОЦИОНАЛЬНО-ЗНАЧИМОГО ВИДЕОИЗОБРАЖЕНИЯ С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ ВИРТУАЛЬНОЙ РЕАЛЬНОСТИ НА ПАРАМЕТРЫ ЭЛЕКТРИЧЕСКОЙ АКТИВНОСТИ МОЗГА И ТОНУС ВЕГЕТАТИВНОЙ НЕРВНОЙ СИСТЕМЫ У СТУДЕНТОВ С РАЗЛИЧНЫМ УРОВНЕМ ТРЕВОЖНОСТИ

Фазульдинов Р.Н.

Медицинского университета «Реавиз», Самара, Россия Научный руководитель: Беляков В.И., канд. биол. наук, доцент

В последнее время в связи с активным применением технологий виртуальной реальности (VR, virtual reality) в практической деятельности человека востребованы медико-биологические исследования по анализу влияния таких разработок на функциональное состояние человека. При этом следует оценивать воздействие VR-технологий прежде всего на параметры деятельности коры мозга и состояние механизмов вегетативной регуляции физиологических функций. Кроме того, мало изученной остается проблема учета индивидуальных особенностей человека и оценки возможных рисков перенапряжения регуляторных механизмов в условиях взаимодействия человека с VR-технологиями.

i Надоели баннеры? Вы всегда можете отключить рекламу.