Научная статья на тему 'ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ В МЕДИЦИНЕ'

ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ В МЕДИЦИНЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
656
60
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗДРАВООХРАНЕНИЕ / МЕДИЦИНА / ДИАГНОСТИКА / МАШИННОЕ ОБУЧЕНИЕ / АНАЛИЗ ДАННЫХ / НАУКА О ДАННЫХ / DATA SCIENCE / MACHINE LEARNING / MEDICINE / DIAGNOSTICS / DATA MINING / BIG DATA

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Бодрин К.А., Красноперова А.А.

Данная статья посвящена комплексному исследованию возможностей внедрения методов машинного обучения в сферу здравоохранения. Особое внимание уделено не только описанию и анализу уже существующих в данной области приложений, но и предложению ранее не анонсированных идей. Кроме того, в статье рассматриваются основные методы науки о данных и возможные способы их имплементации как в области диагностики, так и в повседневной жизни людей, уходе за здоровьем. Рассмотрен российский рынок услуг в области здравоохранения и выдвинуты предложения для его развития.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MACHINE LEARNING TECHNOLOGIES IN MEDICINE

This article is dedicated to complex analysis of possibilities of implementation of machine learning methods in healthcare. We pay particular attention not only to describing and analysis of existing applications in this sphere but also to development and introducing of yet not announced ideas. Moreover, this article considers main data science methods and their possible implementations not only in diagnostics, but in everyday life of people, healthcare. Russian market of such services is also analyzed.

Текст научной работы на тему «ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ В МЕДИЦИНЕ»

УДК: 004.8

Бодрин К.А. студент 4 курса

институт цифровой экономики и информационных технологий

Красноперова А. А. студент 4 курса

институт цифровой экономики и информационных технологий

РЭУ им. Г.В. Плеханова Россия, г. Москва

ИСПОЛЬЗОВАНИЕ ТЕХНОЛОГИЙ МАШИННОГО ОБУЧЕНИЯ В

МЕДИЦИНЕ

Аннотация: данная статья посвящена комплексному исследованию возможностей внедрения методов машинного обучения в сферу здравоохранения. Особое внимание уделено не только описанию и анализу уже существующих в данной области приложений, но и предложению ранее не анонсированных идей. Кроме того, в статье рассматриваются основные методы науки о данных и возможные способы их имплементации как в области диагностики, так и в повседневной жизни людей, уходе за здоровьем. Рассмотрен российский рынок услуг в области здравоохранения и выдвинуты предложения для его развития.

Ключевые слова: здравоохранение, медицина, диагностика, машинное обучение, анализ данных, наука о данных.

Bodrin K.A.

4 course

The student of Institute of Digital Economics and Information

Technologies Plekhanov University Russia, Moscow Krasnoperova A.A.

4 course

The student of Institute of Digital Economics and Information

Technologies Plekhanov University Russia, Moscow MACHINE LEARNING TECHNOLOGIES IN MEDICINE.

Annotation: this article is dedicated to complex analysis of possibilities of implementation of machine learning methods in healthcare. We pay particular attention not only to describing and analysis of existing applications in this sphere but also to development and introducing of yet not announced ideas. Moreover, this article considers main data science methods and their possible implementations not only in diagnostics, but in everyday life of people, healthcare. Russian market of such services is also analyzed.

Key-words: data science, machine learning, medicine, diagnostics, data

mining, big data.

Введение

Медицина на данный момент времени имеет дело не только с острыми, но и с хроническими заболеваниями. Перед врачами встает необходимость в лечении лишнего веса, депрессии, болезней пожилых людей, что отвлекает их от решения важных вопросов, касающихся лечения острых заболеваний на тяжелых стадиях, требующих большого количества времени и ресурсов. Однако, в современной медицине возрастает тенденция к возможностям раннего диагностирования заболеваний еще до фазы обострения, что помогает распознать и излечить на ранних стадиях такие недуги, как сахарный диабет, нарушение функций миокарда, аутоиммунные заболевания. Таким образом, появляется превентивная медицина, которая позволяет распознавать склонность к определенным типам заболеваний еще до их проявления и принимать соответствующие меры. Кроме того, стремительно растут объемы медицинских данных, что приводит к увеличению времени на их обработку и снижению качества анализа информации, от которых зависит здоровье людей. Именно этим обосновывается внедрение технологии машинного обучения в сфере здравоохранения.

Большие объемы структурированных и неструктурированных данных привели к образованию социально -экономического феномена Big Data, представляющего современные технологические возможности для анализа огромного количества данных.

Методы машинного обучения работают с Big Data. Поскольку последней тенденцией является именно накопление данных, вызванное широким развитием технологических продуктов, возникает проблема перегруженности информацией и невозможности качественной ее обработки человеком. Ввиду этого, в настоящее время активно распространяются компьютерные технологии и математические модели, способные анализировать существующие данные и предсказывать по ним возможные сценарии развития, классифицировать их по категориям, проводить исследования и строить прогнозы.

Фундаментальная цель данного исследования - анализ текущей ситуации интеграции машинного обучения и области здравоохранения. Работа нацелена на выявление потенциально успешных проектов, их анализ, а также предложение проекта по усовершенствованию здравоохранительной системы в России.

Обзор рынка ML проектов в сфере здравоохранения

В настоящее время медицина - одна из тех областей человеческой жизнедеятельности, которой только предстоит столкнуться с повсеместным использованием технологий больших данных.

Машинные технологии являются полезным инструментом в диагностировании и лечении заболеваний. Принимая во внимания сведения

обо всем анамнезе жизни пациента, машинные технологии предлагают индивидуализированный подход в диагностировании, что значительно упрощает работу врачей. В дополнение, алгоритмы обработки данных способны просканировать научную литературу, изучить прецедентные случаи и на их основе выдвинуть возможный план лечения.

Рынок медицинских услуг только начинает развиваться и аналитикам больших данных предстоит столкнуться с множеством проблем. Но даже несмотря на все эти проблемы, многие инженеры и предприниматели, крупные и мелкие ИТ корпорации уже берутся разрабатывать приложения, базирующиеся на алгоритмах машинного обучения. Далее рассмотрены наиболее крупные проекты и приложения.

Одно из наиболее значимых технологических изобретений в области медицины - продукт компании IBM - IBM Watson for Oncology. Суперкомпьютер IBM Watson, отвечающий на различные вопросы, которые сформулированы на естественном языке, помогает принимать врачебные решения. Программа обладает доступом к таким источникам данных, как энциклопедии, базы научных статей и антологии знаний. Точность ответа на заданные вопросы обеспечивается огромными вычислительными мощностями суперкомпьютера.

Подобный проект позволяет заметно упростить работу врача и автоматизировать его работу. Одна больница, использующая интеллектуальный диагностический компьютер, может позволить себе работать с большим количеством пациентов, при этом очереди могут сократиться или исчезнуть совсем, поскольку компьютеру необходимо малое количество времени для диагностирования каждого пациента.

Подпроект Google DeepMind - Google DeepMind Health известен благодаря применению технологии искусственного интеллекта в сфере медицины. В настоящее время DM Health сотрудничает с лондонской больницей Moorfields Eye Hospital: происходит анализ тысяч глазных снимков с целью выявления первичных симптомов слепоты. Кроме того, в сотрудничестве с больницей University College London Hospital разрабатывается алгоритм на основе искусственного интеллекта, автоматически различающий здоровые и злокачественные ткани в шейной и головной областях.

Human Diagnosis project (Human Dx) — инициатива молодых врачей из Сан-Франциско, которая сочетает в себе результаты коллективного труда и технологию машинного обучения. Проект предполагает интегрированную среду для сбора и анализа медицинских данных, результатов лабораторных исследований, показаний диагностических приборов и носимых устройств, научных публикаций, медицинской статистики. Планируется разработка фундаментальной структуры данных, доступ к которой будут иметь как врачи, так и пациенты, организации, устройства или приложения. Краткосрочной целью проекта является оказание помощи в своевременной и точной диагностике заболеваний и составление плана лечения. Долгосрочная

цель затрагивает радикальное изменение мировой системы здравоохранения в пользу повышения эффективности, доступности информации и сокращения затрат на медицинские услуги.

Машинное обучение в российских больницах.

Трудности, которые сейчас существуют в России заключаются в устаревшем ведении медицинских карт и недоверии общества к новым технологиям. Больницы и поликлиники хранят огромные массивы данных, которые возможно оцифровать и перевести в электронный вид. Определенно, оцифрование медицинских карт - сложная задача, но с ней справилась компания Google в проекте Ocean. Задачей проекта также являлось оцифрование бумажных носителей информации - книг. Для этого инженеры построили специальный сканер большого размера для параллельного сканирования сразу нескольких книг, при этом полученные изображения передавались напрямую в компьютер. После сбора изображений проводился их анализ, далее при помощи алгоритмов машинного обучения информация на изображениях переводилась в цифровой вид. Проект Ocean компании Google в итоге прекратил существование в связи с юридическими трудностями.

Важно понять, что такая глобальная задача, как оцифровка всей медицинской литературы и медицинских карт - это не ответственность одного отдельно взятого медицинского учреждения, а, как минимум, страны. Данных одной поликлиники недостаточно, чтобы полноценно обучить нейросеть, поэтому необходимо вмешательство и регуляция со стороны государства. Прежде всего, оно способно обеспечить необходимую юридическую поддержку для проекта. Также государство способно спонсировать глобальные проекты, которые могут сильнейшим образом повлиять на жизни людей. Если обеспечить правильную анонимизацию данных и их сохранность, то юридических прецедентов может и не произойти.

Выводы

Таким образом, проанализировав существующие интеллектуальные системы в области здравоохранения, мы можем составить следующий вектор развития технологий: компьютерная диагностика станет незаменимым помощником каждого врача. Также машинные алгоритмы будут составлять оптимальные планы лечения для пациентов. Постоянный мониторинг человеческой жизнедеятельности и анализ его медицинских показателей позволит вовремя диагностировать различные заболевания и предотвращать их развитие на ранних стадиях. Алгоритмы машинного обучения сильно изменят жизнь людей. Диагностика различных заболеваний ускорится в разы и человеческие ошибки сведутся к минимуму, так как данные компьютера будут постоянно пополняться. Также сократятся случаи смертей от инфарктов и инсультов, так как некоторые показатели могут постоянно собирать данные техническими средствами и быстро диагностироваться. Использование этих технологий значительно сократит смертность, позволит

найти лекарства, которых еще не существует. С большой вероятностью увеличится и продолжительность жизни. Развитие технологий в медицинской сфере будет влиять и на общее развитие техники и общества.

В Российской Федерации эта отрасль пока не развита. Для того, чтобы иметь подобные технологии нам необходимо собрать большое количество данных, чтобы был материал для обучений нейросетей. Это можно сделать путем оцифровки медицинских карт и их перевод из бумажного формата в цифровой. При переходе больниц на информационные системы сбор и обработка данных значительно упростятся.

Для того, чтобы развивать информационную сферу в России без непосредственных вложений государства, необходимо создать условия для бизнеса, чтобы предприниматели были заинтересованы в развитии и продвижении медицины. Прежде всего, можно пойти по западному пути и объединять медицинские институты с исследовательскими и информационными. При объединенных усилиях студентов-медиков и студентов-аналитиков можно добиться того, что в будущем медицина также будет переходить в новую информационную среду с использованием новых технологий. Для бизнеса необходимо существенно сократить налоги и осуществить господдержку в медицинской сфере. Это выгодно государству по ряду причин: во-первых, совершенствуется информационная сфера, во-вторых, существенно уменьшается количество пациентов, о которых необходимо заботиться государству.

Использованные источники:

1. Caffe: Convolutional Architecture for Fast Feature Embedding / Yangqing Jia, Evan Shelhamer, Jeff Donahue et al. // arXiv preprint arXiv:1408.5093, 2014.

2. Polyak B.T., Tsybakov. Optimal Orders of Accuracy for Search Algorithms of Stochastic Optimization. Probl. Peredachi Inf., 1990.

3. Robbins H., Monro S. Stochastic Approximation Method. — Ann. Math. Statist, 1951.

4. Machine Learning / F. Pedregosa, G. Varoquaux, A. Gramfort et al. // Journal of Machine Learning Research. — Vol. 12. — P. 2825-2830, 2011.

5. Я.З. Цыпкин. Адаптация и обучение в автоматических системах. — Москва: Наука, 1968.

i Надоели баннеры? Вы всегда можете отключить рекламу.