DOI: 10.6084/m9.figshare.5687176 УДК 004
РАЗРАБОТКА ИНФОРМАЦИОННО-ИЗМЕРИТЕЛЬНОЙ СИСТЕМЫ ДИАГНОСТИКИ ОНКОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ С ПРИМЕНЕНИЕМ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ
Николенко Анастасия Вячеславовна1, Новиков Всеволод Александрович1
1 Херсонский национальный технический университет, Херсон, Украина Адрес для переписки: Анастасия Николенко, студентка Email: [email protected]
Аннотация. Целью работы является создание разработка информационно-измерительной системы онкологических заболеваний с применением технологии машинного обучения.
В данной работе объектом исследования выступает информационно-измерительная система диагностики онкологических заболеваний, а предметом исследования является технология машинного обучения на базе Microsoft Azure.
Базируются на методах эмпирического уровня таких как: подсчеты, измерения, сравнения. Методах экспериментально-теоретического уровня: эксперимент, анализ и моделирование. Методах теоретического уровня: изучение и обобщение, анализ и синтез.
Практическая значимость исследования заключается в разработке и внедрении технологии машинного обучения на базе Microsoft Azure, которое позволит уменьшить время на установить промежуточного диагноза.
Ключевые слова: диагностика, искусственный интеллект, онкология, Microsoft Azure.
Введение. В современной медицине особую роль играют средства ранней диагностики способны в короткое время установить промежуточный диагноз для дальнейшего назначения лечения или дальнейшей более глубокой диагностики.
Слабым местом украинской медицины остается проблема несвоевременной диагностики, поэтому внедрение технологии машинного обучения на базе Microsoft Azure позволит уменьшить время на установить промежуточного диагноза для дальнейшего назначения лечения или
ISSN 2311-1100 CC-BY-NC
дальнейшей более глубокой диагностики, еще одним преимуществом будет разгрузки врачей,
систематизация анализов и удобство.
Несвоевременная диагностика и невозможность получать качественное лечение способствуют прогрессированию раковых заболеваний и повышают уровень смертности от рака. Решения должны быть ориентированы на создание гибкой системы предоставления медицинских услуг, гарантирует надлежащие условия для диагностики и эффективного лечения. Все эти меры будут способствовать уменьшению уровня смертности и улучшения уровня жизни для людей, у которых диагностирован рак.
Появление такой платформы позволяет каждому на практике проверить свои знания в области машинного обучения с подкреплением, сделать свой вклад в развитие алгоритмов, в дальнейшем найдут свое применение в практических задачах, приблизить развитие технологий для создания свободного, доступного всем искусственного интеллекта [3].
Материалы и методы исследования. Microsoft Azure - это открытая и гибкая платформа, позволяющая создавать, внедрять, масштабировать приложения и управлять ими в глобальной сети центров обработки данных Microsoft, используя для этого различные языки программирования, инструменты и рабочие среды [1,2].
Экспериментальную модель создана в программе Microsoft Azure Machine Learning Studio
(Рис.1).
Рис. 1. Модель Anomaly Detection
ISSN 2311-1100 CC-BY-NC
Студия машинного обучения позволяет без труда настроить эксперимент с помощью
модулей, запрограммированных методик прогнозного моделирования. Используя рабочее пространство, можно перетаскивать нужные наборы данных и модули анализа, сочетая их друг с другом, вы создаете эксперимент, который можно запустить в студии машинного обучения. Сначала создается и учится модель, а затем оценивается и тестируется. Процесс разработки модели можно повторить несколько раз, меняя и запуская эксперимент, пока он не даст нужных результатов. Когда модель будет готова, ее можно опубликовать как веб-службу. Это позволит другим пользователям отправлять данные в модель и получать по ним прогнозы [4].
После того, как модель построена надо проверить ее на наличие ошибок, корректности и дееспособности системы.
Следующий шаг- это получить график для визуального изображения, который свидетельствует, что модель работает и результат является достоверным (Рис.2).
О N КО NEW > Eva: u ate Model > Evaluation results
0.& 0.7-
ai -m ПЗ CÉ
gj 0.6
•j=I
1Л
S. 0.5 ■
QJ
* OA 03 0.2 0.1 -
0.0- - 1--1-!-; -; -!--I--; -!---
0.0 0.1 0.2 0.3 04 0.5 0.6 0.7 0:8 0.9 1.0
Рис.2. График модели "Onko new"
Дальнейшие действия будут направлены на то, чтобы перевести модель с теоретической обработки данных на практическое и получения прогнозов относительно риска наличия у пациентов онкологических заболеваний. Для этого нужно уже обученную модель превратить в модель для тестирования пациентов, установить веб-сервис.
ISSN 2311-1100 CC-BY-NC
После создания веб сервиса мы получаем уникальный идентификатор среди других моделей
пользователей этой системы - API-key и возможность тестирования программы. После ввода данных система обрабатывает данные и выдает результат, так называемый риск наличия онкологического заболевания у данного пациента (Рис.3).
■ Défaut! Endpoint API HELP PAGE
REQUE5T/RESPONSI BATCH EXECUTION
Ewei 2013 or later | Ц Excel 2010 or earner workbook 11/3/201711:54:44 AM ÉXCS 201В or «И« W0i HWOK 1V8/201711:54:« CM
V "ONKO NEW [Predictive Exp.]' test returned Г28-,Ч7a2^^yГ^^5V5^T,^^^BÍГ/5V5V^^Г1W/^r,W,^VЗ(r."5■*5*"2■."70"."1" "0.659105241298676"]..
Рис.3. Риск наличия онкологии
Для того чтобы пользователи имели простой и быстрый доступ к нашей обученной модели и могли узнать вероятность наличия онкологического заболевания нужно создать веб приложение. Microsoft Azure дает возможность сделать это очень легко, он генерирует программный код под нашу обученную модель, чтобы создать простой интерфейс для пациентов и пользователей приложения, для быстрого получения результатов, экономии времени, трактовки анализов лабораторных исследований и быстрого реагирования, ведь пациенты смогут узнать риск наличия болезни в любом месте и в любое время с компьютера, планшета и телефона.
Записав данный код в файл и загрузив его на веб hosting, мы получим готовую программу "Онко риск. Общий анализ крови" готовую к использованию. (Рис.4).
ФОРМА ДЛЯ ЗАГАЛЬНОГО АНАЛ13У КРОВ!
НТС RLT
WBC MON
Рис.4. Интерфейс программы
ISSN 2311-1100 CC-BY-NC
После того как пользователь открыл приложение, он должен заполнить все поля (ячейки) в
соответствии с результатами лабораторного общего анализа крови и нажать кнопку "Узнать", приложение отрабатывает программный код в котором указанный API-key нашей модели по этому ключу данные из программы введенные пользователем попадают в нашу модель, обрабатываются там, после чего отправляется ответ с результатами нашего пациента обратно в программу и она показывает результат на экране (рис.5).
ФОРМА ДЛЯ ЗАГАЛЬНОГО АНАЛ13У KPOBI
НТС RLT
ЗБ 180
WBC G RA
5 5 MON
I
10
LYM
30
Д13НАТИСЬ
Ризик наявност! онколопчного захвортовання : 66%
Рис.5. Заполненные ячейки и результат "Онко риск. Общий анализ крови"
Результаты исследования. Построенная и обученная информационно-измерительная система с применением технологии машинного обучения, ускоряет процесс толкования анализов, как результат выдает процентное значение риск наличия онкопатологии, получили результат, убедились, что приложение работает и готов к применению.
Обсуждение результатов. Введение такого приложения очень легкое, для этого нужно лишь: устройство (компьютер, планшет, смартфон), программное обеспечение и постоянный доступ к сети интернет.
ISSN 23ll-ll00
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ:
CC-BY-NC
1. Golubchikov MV, Kovalenko O.S. Ways of Informatization of the Health Care System of Ukraine 2013. - No. 3-4. - P. 106-110 p.
2. Golubchikov MV, Orlova N. M., Kravchuk N.G. Technology of filling basic primary records and controlling the reliability of statistical data in hospitals. Practice of health care institution management. -2013. - No. 9. - 88-95 p.
3. Public health: under the umbrella. for studio higher honey. tutor shut up / [B. F. Moskalenko, O. P. Gulchii, T. S. Gruziev, and others.]; for ed. VF Moskalenko. - 3rd kind. - Vinnitsa: New Book, 2013. -560 p.
4. Kozlov AP, Popov N.N. Medical statistics: tutorial. - Kharkiv, Izdat. Center of KhNU, 2006. - 88 p.