Научная статья на тему 'Искусственный интеллект: как работает и критерии оценки'

Искусственный интеллект: как работает и критерии оценки Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1610
211
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
искусственный интеллект / мобильное приложение / диагностика опухолей кожи / ПроРодинки / artificial intelligence / mobile application / diagnostics of skin tumors / ProRodinki

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гаранина Оксана Евгеньевна, Шливко Ирена Леонидовна, Клеменова Ирина Александровна, Ускова Ксения Александровна, Миронычева Анна Михайловна

Искусственный интеллект – это термин, используемый для описания компьютерных технологий в моделировании интеллектуального поведения и критического мышления, сравнимого с человеческим. На сегодняшний день одними из первых областей медицины, на которые повлияют достижения в области технологий искусственного интеллекта, будут те, которые больше всего зависят от визуализации. К ним относятся офтальмология, радиология и дерматология. В связи с появлением многочисленных приложений медицинской направленности учеными сформулированы критерии их оценки. В этот список включены: проведение клинической валидации, регулярное обновление приложений, функциональная направленность, стоимость, наличие информационного блока для специалистов и пациентов, соответствие условиям государственного регулирования и регистрации. Одним из приложений, отвечающих всем требованиям, является программный комплекс «ПроРодинки», разработанный для использования пациентами и специалистами на территории Российской Федерации. С учетом широкого распространения и стремительной развивающейся конкурентной среды необходимо трезво относиться к ресурсам подобных приложений, не преувеличивая их возможности и не расценивая как замену специалисту.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гаранина Оксана Евгеньевна, Шливко Ирена Леонидовна, Клеменова Ирина Александровна, Ускова Ксения Александровна, Миронычева Анна Михайловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Artificial intelligence: how it works and criteria for assessment

Artificial intelligence is a term used to describe computer technology in the modeling of intelligent behavior and critical thinking comparable to that of humans. To date, some of the first areas of medicine to be influenced by advances in artificial intelligence technologies will be those most dependent on imaging. These include ophthalmology, radiology, and dermatology. In connection with the emergence of numerous medical applications, scientists have formulated criteria for their assessment. This list included: clinical validation, regular application updates, functional focus, cost, availability of an information block for specialists and patients, compliance with the conditions of government regulation, and registration. One of the applications that meet all the requirements is the ProRodinki software package, developed for use by patients and specialists in the Russian Federation. Taking into account a widespread and rapidly developing competitive environment, it is necessary to soberly treat the resources of such applications, not exaggerating their capabilities and not considering them as a substitute for a specialist.

Текст научной работы на тему «Искусственный интеллект: как работает и критерии оценки»

|(CC)]BY-NC-SA 4.0¡1 ОБЗОР

Искусственный интеллект: как работает и критерии оценки

И.Л. Шливко1, О.Е. Гаранина*1, И.А. Клеменова1, К.А. Ускова1, А.М. Миронычева1, В.И. Дардык2, В.Н.Ласьков3

1ФГБОУ ВО «Приволжский исследовательский медицинский университет» Минздрава России, Нижний Новгород, Россия; 2ООО «AIMED», Москва, Россия; 3Карлов университет, Прага, Чехия

Аннотация

Искусственный интеллект - это термин, используемый для описания компьютерных технологий в моделировании интеллектуального поведения и критического мышления, сравнимого с человеческим. На сегодняшний день одними из первых областей медицины, на которые повлияют достижения в области технологий искусственного интеллекта, будут те, которые больше всего зависят от визуализации. К ним относятся офтальмология, радиология и дерматология. В связи с появлением многочисленных приложений медицинской направленности учеными сформулированы критерии их оценки. В этот список включены: проведение клинической валидации, регулярное обновление приложений, функциональная направленность, стоимость, наличие информационного блока для специалистов и пациентов, соответствие условиям государственного регулирования и регистрации. Одним из приложений, отвечающих всем требованиям, является программный комплекс «ПроРодинки», разработанный для использования пациентами и специалистами на территории Российской Федерации. С учетом широкого распространения и стремительной развивающейся конкурентной среды необходимо трезво относиться к ресурсам подобных приложений, не преувеличивая их возможности и не расценивая как замену специалисту.

Ключевые слова: искусственный интеллект, мобильное приложение, диагностика опухолей кожи, ПроРодинки

Для цитирования: Шливко И.Л., Гаранина О.Е., Клеменова И.А., Ускова К.А., Миронычева А.М., Дардык В.И., Ласьков В.Н. Искусственный интеллект: как работает и критерии оценки. Consilium Medicum. 2021; 23 (8): 626-632. DOI: 10.26442/20751753.2021.8.201148

REVIEW

Artificial intelligence: how it works and criteria for assessment

Irena L. Shlivko1, Oxana Ye. Garanina*1, Irina A. Klemenova1, Kseniia A. Uskova1, Anna M. Mironycheva1, Veniamin I. Dardyk2, Viktor N. Laskov3

1Privolzhsky Research Medical University, Nizhny Novgorod, Russia;

2"AIMED" LLC, Moscow, Russia;

3Charles University, Prague, Czech Republic

Abstract

Artificial intelligence is a term used to describe computer technology in the modeling of intelligent behavior and critical thinking comparable to that of humans. To date, some of the first areas of medicine to be influenced by advances in artificial intelligence technologies will be those most dependent on imaging. These include ophthalmology, radiology, and dermatology. In connection with the emergence of numerous medical applications, scientists have formulated criteria for their assessment. This list included: clinical validation, regular application updates, functional focus, cost, availability of an information block for specialists and patients, compliance with the conditions of government regulation, and registration. One of the applications that meet all the requirements is the ProRodinki software package, developed for use by patients and specialists in the Russian

Информация об авторах / Information about the authors

■ Гаранина Оксана Евгеньевна - канд. мед. наук, доц. каф. кожных

и венерических болезней ФГБОУ ВО ПИМУ.

E-mail: [email protected]; ORCID: 0000-0002-7326-7553

Шливко Ирена Леонидовна - д-р мед. наук, доц., зав. каф. кожных и венерических болезней ФГБОУ ВО ПИМУ. E-mail: irshlivko@gmail. com; ORCID: 0000-0001-7253-7091

Клеменова Ирина Александровна - д-р мед. наук, проф., проф. каф. кожных и венерических болезней ФГБОУ ВО ПИМУ. E-mail: [email protected]; ORCID: 0000-0003-1042-8425

Ускова Ксения Александровна - ассистент каф. кожных и венерических болезней ФГБОУ ВО ПИМУ. E-mail: [email protected]; ORCID: 0000-0002-1000-9848

Миронычева Анна Михайловна - ассистент каф. кожных

и венерических болезней ФГБОУ ВО ПИМУ.

E-mail: [email protected]; ORCID: 0000-0002-7535-3025

Дардык Вениамин Иосифович - IT-специалист, ген. дир. ООО «АИМЕД». E-mail: [email protected]; ORCID: 0000-0002-1473-6241

Ласьков Виктор Николаевич - врач отд-ния изотопной диагностики, мл. науч. сотр. Карлова университета. E-mail: [email protected]; ORCID: 0000-0002-0226-4945

*Oxana Ye. Garanina - Cand. Sci. (Med.), Privolzhsky Research Medical University. E-mail: [email protected]; ORCID: 0000-0002-7326-7553

Irena L. Shlivko - D. Sci. (Med.), Assoc. Prof., Privolzhsky Research Medical University. E-mail: [email protected]; ORCID: 0000-0001-7253-7091

Irina A. Klemenova - D. Sci. (Med.), Prof., Privolzhsky Research Medical University. E-mail: [email protected]; ORCID: 0000-0003-1042-8425

Kseniia A. Uskova - Assistant, Privolzhsky Research Medical University. E-mail: [email protected]; ORCID: 0000-0002-1000-9848

Anna M. Mironycheva - Assistant, Privolzhsky Research Medical University. E-mail: [email protected]; ORCID: 0000-0002-7535-3025

Veniamin I. Dardyk - general manager, "AIMED" LLC. E-mail: [email protected]; ORCID: 0000-0002-1473-6241

Viktor N. Laskov - Research Assistant, Third Faculty Medicine, Charles University. E-mail: [email protected]; ORCID: 0000-0002-0226-4945

Federation. Taking into account a widespread and rapidly developing competitive environment, it is necessary to soberly treat the resources of such applications, not exaggerating their capabilities and not considering them as a substitute for a specialist.

Keywords: artificial intelligence, mobile application, diagnostics of skin tumors, ProRodinki

For citation: Shlivko IL, Garanina OYe, Klemenova IA, Uskova KA, Mironycheva AM, Dardyk VI, Laskov VN. Artificial intelligence: how it works and criteria for assessment. Consilium Medicum. 2021; 23 (8): 626-632. DOI: 10.26442/20751753.2021.8.201148

История термина

Искусственный интеллект (ИИ) - это термин, используемый для описания компьютерных технологий в моделировании интеллектуального поведения и критического мышления, сравнимого с человеческим [1].

Разработка программ, выполняющих сложные интеллектуальные задачи, началась после появления современных компьютеров. Начиная с 1950-х годов ученые стали задумываться о возможности создания искусственного мозга. С теста Тьюринга ИИ получил научное развитие. В ходе проведения теста имитировался письменный диалог между судьей, компьютером и человеком, где компьютер должен быть неотличим от человека во владении естественным языком [2]. Датой рождения ИИ как области науки можно считать Дарт-мутский семинар в 1956 г., где впервые официально введен термин ИИ и поставлены задачи обучения машины использованию языка, формирования абстракции и концепции [3].

Принципы обучения ИИ

Обучение нейронных сетей - это закрепление тех связей внутри нее, которые способствуют получению правильного ответа на выходе, и подавление тех связей, которые способствуют получению неправильного ответа [4].

Все машинное обучение можно разделить на обучение без учителя и обучение с учителем [4]. Оба метода могут использоваться как два последовательных этапа в обучении нейронных сетей.

Обучение без учителя - это кластеризация (классификация), которая подразумевает под собой нахождение общего в исходном (или входном) наборе данных с последующим их распределением по заданному количеству категорий классификации.

Обучение с учителем происходит тогда, когда у каждой единицы входных данных (например, на изображениях) есть предварительно поставленная метка, которая определяет нормальное/аномальное изображение, кошка/собака, мужчина/женщина и т.д. Пропуская маркированные

данные во время обучения, нейросеть подбирает необходимые фильтры, которые, возможно, связаны с детекцией ярких признаков, например ушей, хвостов и т.д. С каждым новым объемом обучающих данных нейросеть на выходе будет выдавать вероятность правильного ответа, приближаясь к единице (100%). Таким образом, предъявляя нейросети большое количество размеченных данных, мы в математическом смысле толкаем ее в сторону того, чтобы она подобрала такие фильтры, которые будут способствовать правильной классификации. В последующем при предъявлении нейросети нового немаркированного примера, не фигурировавшего ранее в обучающей выборке, она будет подбирать фильтры, переводя с одного слоя своей архитектуры на другой до момента, когда примет правильное решение. При этом на первых слоях нейросеть будет подбирать фильтры, которые соответствуют более простым формам, или признакам. Карты признаков предыдущего слоя на последующих слоях комбинируются, и формируются новые карты, которые все больше начинают напоминать характерные качества (например, хвосты, уши, лапы). Постепенно нейросеть учится вычленять какие-то признаки, на основе которых она в итоге принимает правильное решение, к какому классу относится то или иное изображение, например кошка это или собака. Наилучшим образом принцип работы нейронных сетей можно понять на примере одной из самых популярных простых нейро-сетей - распознавание рукописных чисел (рис. 1). Можно представить, что нейросеть разбивает изображение на маленькие фрагменты и сравнивает их с входными данными (рис. 2, 3). Однако одни и те же фрагменты могут участвовать в построении изображения абсолютно разных чисел, например 4 и 7 (рис. 4 а, б). Именно поэтому нейронная сеть имеет сложную конструкцию из нескольких (от 2 и даже до 100) промежуточных слоев, которые позволяют распознать важность/уникальность тех или иных фрагментов, а также их расположения между собой (рис. 5). Следует помнить, что это компьютерная программа. Она выполняет вычисления математических функций, которые ей позволяют сопоставить активность сигнала тех или иных пикселей с данными обучающей выборки. Поэтому важным является соблюдение условия сходства новых данных, которые ей будут предъявлены, с данными, на которых она обучалась. Далее одним из главных ограничений является качество входных графических данных, так, на примере из

Рис. 2. Пример возможного пути фрагментации вводных данных.

Рис. 3. Визуализация архитектуры нейросеть - многослойный перцептрон.

Рис. 4: а - пример возможных фрагментов рукописных цифр, активирующих один из скрытых слоев перцептрона; б - демонстрация схожести расположения фрагментов данных (схожесть написания) в разных рукописных цифрах.

О

I

St S + Л +

— 1 + 1 +

а

б

работы I. Goodfellow и соавт. из Google Inc. можно увидеть, что незначительное зашумление графических данных способно быть критичным для классификатора, в то время как для человека это совершенно не меняет восприятие этих же графических данных (рис. 6) [5].

Возможности использования ИИ в медицине

На сегодняшний день одними из первых областей медицины, на которые повлияют достижения в области технологий ИИ, будут те, которые больше всего зависят от визуализации [6]. К ним относятся офтальмология, радиология и дерматология. В данных областях медицины продемонстрирован высокий уровень производительности ИИ на основании многочисленных алгоритмов анализа изображений, в некоторых случаях сравнимый с экспертами [7-14]. Важной вехой в клиническом применении ИИ стал 2018 г., когда Управление по контролю пищевых продуктов и лекарств в США (Food and Drug Administration - FDA) впервые одобрило систему IDx-DR для автономного обнаружения диабетической ретинопатии [15].

Как и в случае любой новой медицинской технологии, успех применения в медицине алгоритмов ИИ для скрининга, диагностики или прогноза будет зависеть от отношения клиницистов и пациентов. Поэтому учет такого отношения и пробелов в знаниях будет иметь важное значение для систем здравоохранения, медицинских преподавателей, профессиональных организаций, разработчиков ИИ и регулирующих органов [16]. В нескольких исследованиях изучалось восприятие врачами различного профиля новых технологий ИИ при оказании медицинской помощи. Большинство опросов показывает, что врачи отмечают потенциальные преимущества ИИ в виде улучшения доступа пациентов к скринингу, повышения диагностической достоверности, сокращения времени, застрачиваемого специалистами на выполнение монотонных задач [17-25]. Однако существуют и потенциальные опасения среди некоторых специалистов, касающиеся риска передачи услуг здравоохранения крупным технологическим и информационным компаниям, озабоченности по поводу медицинской ответственности за машинную ошибку, уменьшения зависимости пациентов от медицинских специалистов [6, 26-28].

Возможности использования ИИ в дерматологии

Наибольший интерес в использовании технологий ИИ в дерматологии сфокусирован на диагностике онихомико-зов, псориаза и новообразований кожи. В отличие от других специальностей использование ИИ получило широкое применение не только специалистами, но и пациентами. Это связано с тем, что за последнее десятилетие станов-

Рис. 6. Демонстрация изменения результата классификации нейронных сетей при зашумлении вводных данных.

«панда» «нематода» «гиббон»

с уверенностью с уверенностью с уверенностью

57,7% 8,2% 99,3%

ление смартфонов как неотъемлемой части повседневной жизни людей и их интеграция с мобильными приложениями для улучшения здоровья с использованием ИИ получили массовое потребление. К 2019 г. насчитывалось около 3,2 млрд пользователей смартфонов во всем мире и 318 тыс. приложений, связанных со здоровьем, которые доступны для скачивания [29, 30]. Лидирующие позиции на сегодняшний день занимают мобильные приложения, связанные с профилактикой и ранней диагностикой злокачественных новообразований кожи.

A. Kassianos и соавт. (2015 г.), A. Ngoo и соавт. (2018 г.). и F. Kong и соавт. (2021 г.) подготовлены систематические обзоры по мобильным приложениям для диагностики опухолей кожи, согласно которым все имеющиеся мобильные приложения сгруппированы в четыре функциональные категории [31-33]:

1) информационные приложения;

2) для мониторинга новообразований кожи;

3) алгоритмический анализ изображений новообразований кожи;

4) приложения для реализации теледерматологических консультаций.

В связи с появлением многочисленных приложений медицинской направленности учеными сформулированы критерии их оценки. В этот список включены: проведение клинической валидации, регулярное обновление приложений, функциональная направленность, стоимость, наличие информационного блока для специалистов и пациентов, соответствие условиям государственного регулирования и регистрации.

Клиническая валидация приложений

(научный и клинический вклад)

Согласно первым двум обзорам A. Ngoo и соавт. и A. Kassianos и соавт. у всех анализируемых приложений отсутствуют данные научного доказательства эффективности в отношении диагностики опухолей кожи, что требует улучшения регулирования рынка приложений. К 2019 г. появилось 5 приложений с доказанной клинической эффективностью (7,6%; n=5/66), представленной в публикациях в рецензируемых журналах, однако 1 из них уже более не доступно на рынке приложений [34-38]. Большинство из них использовало сервис теледерматологических консультаций. При этом об оценке функциональности приложений вовлеченными дерматологами не сообщалось. Многими авторами приложений заявлено о наличии данных, «основанных на доказательствах», однако проверить достоверность информации не представлялось возможным в силу отсутствия ее доступности, что затрудняло оценку обоснованности этих утверждений. С другой стороны, систематический обзор 2017 г. показал, что многие из этих приложений вполне могут иметь исследования клинической валидации, не опубликованные или недоступные к моменту написания обзора [32].

Быстрый оборот и рост рынка приложений

Высокий оборот приложений на виртуальном рынке объясняется исчезновением одних и заменой их другими, но в большем количестве. В 2017 г. представлено чуть меньше 1/2 приложений, чем в 2019 г. (коэффициент истощения 46,5%; n=23/43), при этом только 9 из 39 приложений 2014 г. доступны в 2019 г. (коэффициент истощений 76,9%) [31]. Одной из распространенных причин можно указать низкий уровень использования, что может часто приводить к исчезновению приложений, в которых не заинтересованы пользователи. К 2019 г. наиболее распространенными являлись приложения по мониторингу новообразований кожи (48,5%; n=32/66) с последующим анализом изображений ИИ (39,4%; n=26/66), информационные приложения о раке кожи (37,9%; n=25/66) и 27,3% приложений (n=18/66), предоставляющих теледерматологические услуги [31]. При этом количество приложений, предлагающих анализ изображений новообразований кожи с помощью ИИ, увеличилось с 23,3% в 2017 г. до 39,4%. К сожалению, T. Steeb и соавт. в своем исследов ании продемонстрир ов али, что только 1% людей из 200 амбулаторных онкологических пациентов с раком кожи когда-либо использовали специализированное приложение [39]. Из исследования можно сделать вывод о низком комплаенсе потенциальных пользователей из групп высокого риска, которые могли бы получить определенную информационную выгоду, использовав мобильные приложения, направленные на профилактику и диагностику рака кожи. Однако несмотря на такое большое количество приложений, их рост продолжает увеличиваться не только в онкодерматологии, но и в других областях медицины, например количество приложений, посвященных раку молочной железы, увеличилось со 138 приложений, доступных в 2013 г., до 599 в 2018 г., демонстрируя существенное увеличение на 334% [21, 32, 40, 41]. По сравнению с приростом мобильных приложений, посвященных раку молочной железы, за 5-летний период количество приложений по раку кожи увеличилось только на 77% [31].

Функциональная направленность

К моменту публикации систематического обзора F. Kong и соавт. функциональные возможности мобильных приложений с онкодерматологической направленностью постепенно менялись. Доля приложений, посвященных мониторингу новообразований кожи, и приложений, предлагающих теледерматологические услуги, оставалась относительно стабильной, в то время как доля информационных

приложений снизилась. Если вернуться к приложениям, в которых использовались аналитические возможности ИИ, то можно заметить, что в период с 2014 по 2017 г. отмечалось снижение их количества с последующим увеличением в период 2017-2019 гг. Эта история могла быть связана с первоначальной шумихой вокруг ИИ, за которой последовала неудача, а в последующем и достижения в разработке алгоритмов глубокого обучения [42]. Так, разные группы ученых Стэнфордского университета в своих исследованиях продемонстрировали возможности их сверточных нейронных сетей (тип глубокого обучения ИИ) в классифицировании опухолей кожи с такой же точностью, что и у дерматологов [13, 14, 43]. В качестве маркетингового хода для привлечения пользователей большинство разработчиков мобильных приложений стали использовать аббревиатуру AI (Artificial Intelligence) в названии.

Стоимость приложений

В 2019 г. количество бесплатных приложений увеличилось до 63,6% (n=42/66) по сравнению с 53,5% (n=23/43) в 2017 г. Необходимо отметить, что все приложения (21), основанные на рандомизированных клинических исследованиях, бесплатны [44]. Предполагается, что многофункциональные приложения требуют большего обслуживания и, соответственно, более высоких выплат. Однако в систематическом обзоре А. Ngoo и соавт., не определив взаимосвязи между стоимостью и производительностью, классифицировали приложения по виду графиков оплаты приложений на 4 типа:

1) разовая покупка для загрузки приложения, кроме услуги отказа от рекламы и получения доступа к дополнительным функциям;

2) ежемесячные или ежегодные выплаты согласно подписке;

3) оплата за отдельную услугу (например, консультация дерматолога);

4) оплата дерматоскопических насадок к смартфону [32].

Стоимость разовой покупки для загрузки и получения

полного доступа ко всем функциям приложения варьировала от 0,99 до 15,99 дол. США (n=8/66) и увеличивалась к 2019 г. Более вариабельной являлась стоимость приложений, предлагающих онлайн-консультации дерматолога, которая определялась статусом врача и сроками реализации запроса. В одном из мобильных приложений предлагались покупка и использование дерматоскопических насадок стоимостью 99 или 299 дол. США, что относит такой тип приложений к одним из дорогостоящих наравне с услугой теледерматологической консультации.

Обновления приложений

Все клинические рекомендации по профилактике, диагностике и лечению меланомы и других видов рака кожи регулярно обновляются во всех странах согласно результатам последних значимых клинических исследований, что обязательно должно быть отражено и в существующих специализированных приложениях для получения достоверных знаний пользователями. Согласно данным систематического обзора F. Kong и соавт., в большинстве информационных и образовательных приложений по раку кожи отсутствуют регулярные обновления [31]. Так, В 2019 г. 15 (22,7%) из 66 приложений не обновлялось на протяжении 48 мес, 4 из которых относилось к информационной/образовательной категории, а 1 имело последнее обновление лишь в 2014 г.

Таким образом, с одной стороны, такие приложения без данных последних версий клинических рекомендаций доступны для скачивания в онлайн-магазинах, а с другой стороны, уже не существующие в онлайн-магазинах приложения не удаляются автоматически с телефонов пользователя, что может приводить к получению устаревшей информации пользователями.

Отношение пациентов к мобильным приложениям

с онкодерматологической направленностью

Несмотря на обилие онкодерматологических мобильных приложений, существует крайне малое количество исследований, которые анализировали отношение пользователей к ним. K. Kessel и соавт., проанализировав в своем исследовании отношение 375 онкологических пациентов, находящихся на лечении или под динамическим наблюдением, к приложениям с онкодерматологической направленностью, продемонстрировали, что около 50% участников, чаще молодые мужчины, согласились бы использовать такие приложения [45]. Однако большинство участников исследования отметили некоторые ограничения, такие как отсутствие навыков и соответствующих устройств, а также конфиденциальности предоставляемых данных.

Регулирование и регистрация

мобильных приложений

Вопрос регулирования и регистрации приложений медицинского назначения Росздравнадзором требует определенных усовершенствований. Если провести некоторую параллель с США, то необходимо отметить, что с 2012 г. FDA уполномочено выполнять контроль за мобильными приложениями медицинского назначения [3]. Однако этот мониторинг распространяется только на медицинские приложения, использующие алгоритмы для оценки рисков и диагностики, в то время как приложения, предназначенные для коммуникации и переноса изображений, не включены в эту систему регулирования [3]. В Австралии Администрация лекарственных средств (^erapeutic Goods Administration - TGA) аналогичным образом классифицирует мобильные приложения как медицинское изделие в том случае, если они выполняют функцию диагностики, предотвращения, мониторинга или лечения, но исключает из этой категории любые приложения, которые предоставляют образовательную информацию или пропагандируют здоровый образ жизни [4]. С учетом этих определений FDA и TGA многие из рассмотренных приложений вышли за рамки категории «медицинское изделие» и поэтому освобождены от регулирования, что затрудняет работу государственных органов для мониторинга разработчиков приложений [46].

Та же ситуация просматривается и в Российской Федерации, где согласно ст. 38 Федерального закона №323 «Об основах охраны здоровья граждан в Российской Федерации» с уточнением в Информационном письме Росздрав-надзора от 30.12.2015 №01И-2358/15 программное обеспечение как медицинское изделие имеет более широкое и размытое определение как специального программного обеспечения, предназначенного производителем для профилактики, диагностики, лечения и медицинской реабилитации заболеваний, мониторинга состояния организма человека, проведения медицинских исследований, восстановления, замещения, изменения анатомической структуры или физиологических функций организма, предотвращения или прерывания беременности и др. На международном форуме регуляторов медицинских устройств (International Medical Device Regulators Forum - IMDRF), в который входит Росздравнадзор, дано более узкое определение программного обеспечения медицинского назначения (Software as a Medical Device - SaMD): «Медицинское программное обеспечение: программное обеспечение, предназначенное для использования в одной или нескольких медицинских целях, не являющееся частью аппаратного медицинского изделия». Если SaMD дополнительно к определению IMDRF предназначено для формирования клинически значимой информации, принятия врачебных решений, то оно подлежит обязательной регистрации как медицинского изделия на основании 4 базовых документов, разработанных и принятых IMDRF [47-50].

В настоящее время правила классификации медицинских изделий, включая разделение на классы в зависимости от потенциального риска их применения (1, 2а, 2б, 3-й классы) и на виды в соответствии с номенклатурной классификацией медицинских изделий, регулируются Приказом Минздрава России от 06.06.2012 №4н «Об утверждении номенклатурной классификации медицинских изделий», но недостаточно точны [5, 51]. Особенно это касается программного медицинского изделия на базе ИИ и машинного обучения. Таким образом, вопрос разработки и утверждения прозрачных критериев отнесения программного обеспечения к медицинским изделиям, в том числе и для оценки потенциального риска причинения вреда здоровью, особенно с использованием ИИ и машинного обучения, основываясь на рекомендациях IMDRF, является актуальным. Помимо этого для такого рода программного обеспечения планируется внесение отдельного раздела в номенклатуру медицинских изделий «Специальное программное обеспечение».

Препятствием на пути регулирования приложений медицинского назначения является и отсутствие доказательства клинической эффективности. D. Kim и соавт. провели анализ публикаций в Pubmed, MEDLINE и Embase за 2018 г. в который вошло 516 исследований эффективности применения алгоритмов ИИ при анализе медицинских изображений для поддержки принятия врачебных решений [52]. Согласно результатам анализа только 6% (31 исследование) предусматривало применение внешней проверки результатов и ни одно исследование не использовало проспективный дизайн и одновременное валиди-рование на базе нескольких медицинских организаций. Учитывая особенности программного обеспечения и его отличия от оборудования и лекарств, на сегодняшний день имеется необходимость внесения в правила обязательных клинических испытаний до регистрации, а также проведения дополнительной исследовательской работы по формированию отношений регулятора к системам на базе ИИ и машинного обучения.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Программный комплекс «ПроРодинки»

На территории РФ разработан и предложен программный комплекс «ПроРодинки» для использования пациентами и специалистами. Приложение доступно на смартфонах с операционными системами Android и iOS и предназначено для анализа новообразований кожи на основе фотографий, а также набора риск-факторов, предоставленных пользователем. Фотографии, сделанные пользователями, проходят контроль с помощью алгоритмов компьютерного зрения. Алгоритм определяет качество снимка, а также наличие и размеры новообразования на полученном снимке. Анализ полученных снимков выполняется с применением обученного на верифицированном банке изображений, риск-факторов и динамике новообразований ансамбля нейронных сетей. Нейронные сети построены на основе предобученных глубоких нейронных сетей с использованием банка из 6 тыс. изображений новообразований кожи с подтвержденным патогистологическим диагнозом с дообучением на накопленном банке изображений, получаемых пользователями. Для нахождения оптимальной модели сети и ее гиперпараметров проведено около 400 вычислительных экспериментов. Эксперименты проводились с использованием многопоточной обработки на 20 процессорах. Все изображения в банке из 6 тыс. случаев независимо оценены двумя ведущими экспертами онкодерматологами.

На основе выполненного анализа изображения, риск-факторов и динамики образования приложение выдает рекомендацию по поводу срочности обращения к специалисту для дальнейшего очного обследования данного новообразования. Выполняемый приложением анализ проверяется врачами-экспертами для обеспечения контроля качества ра-

боты приложения и в дальнейшем с дообучением нейросети на основе банка накопленных изображений.

Обработка изображений, риск-факторов и динамики изображений проводится на наборе серверов с общей пропускной способностью сервера нейронных сетей более чем 50 изображений в 1 с, что позволяет анализировать более 2 млн 160 тыс. обращений в 1 мес. Передача изображений на сервер обработки производится по мобильной сети 3G и занимает несколько секунд. Приложение «ПроРодинки» доступно пользователям бесплатно на всей территории России, что предоставляет возможность использования широкому кругу населения на телефонах с операционными системам Android и iOS.

Приложение доступно пользователям со 2 декабря 2020 г., наиболее активно использовалось с 1 февраля 2021 г. и обработало за 6 мес более 110 тыс. изображений. Данные по обращениям пользователей, хранимые на сервере, деперсонализированы и предоставлены для дальнейшего анализа. Анализ произведен с применением пакета Microsoft PowerBI.

Согласно критериям оценки приложений, работающих на основе ИИ, программный комплекс «ПроРодинки» имеет следующие преимущества:

1. Программный комплекс предусматривает экспертную оценку работы нейросети в реальном времени и интеграцию технологии материалов непрерывного обучения на основе согласованных между экспертом и ней-росетью случаев.

2. Инициировано мультицентровое проспективное клиническое исследование по валидации работы приложения «ПроРодинки».

3. Функционально приложение выполняет задачу оценки изображения и риск-факторов с выдачей рекомендаций по тактике ведения пациента и маршрутизации в случае подозрения на злокачественное новообразование.

4. Приложение «ПроРодинки» бесплатное.

5. За 6-месячный период приложение обновлялось 6 раз с улучшением технических характеристик и информационной наполняемости.

6. Отношение пациентов характеризовалось на основании средней оценки в онлайн-провайдерах App Store -4,7 балла из 185 полученных отзывов и Google Play -4,3 из 371. Отрицательные отзывы в большинстве случаев связаны со сложностями выполнения качественной фотографии пользователем.

7. Приложение «ПроРодинки» на территории РФ зарегистрировано Росздравнадзором как немедицинское изделие.

Перспективы развития:

1. Расширение возможности использования ПК «ПроРо-динки» специалистами неонкологических специальностей с возможностью получения второго мнения от эксперта.

2. Внедрение обучающего блока и онлайн-тренингов для врачей первичного звена с поэтапным увеличением сложности экспертизы изображений, предлагаемых специалисту нейросетью.

3. Расширение информационного блока для пациентов по самообследованию, профилактике фотоповреждения и общей информации по доброкачественным и злокачественным новообразованиям.

4. Регистрация ПК и рассмотрение возможностей регистрации как медицинского изделия.

5. Рассмотрение возможности обеспечения коммуникации между пациентом и врачом для получения второго мнения.

Заключение

Для обеспечения безопасности пользователей и защиты глобального рынка приложений любое мобильное приложение медицинской направленности должно проходить

многоуровневую проверку. С учетом широкого распространения и стремительной развивающейся конкурентной среды необходимо трезво относиться к ресурсам подобных приложений, не преувеличивая их возможности и не расценивая как замену специалисту.

Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.

Conflict of interests. The authors declare no conflict of interest.

flMTepaiypa/References

1. Amisha, Malik P, Pathania M, Rathaur VK. Overview of artificial intelligence in medicine. J Family Med Prim Care. 2019;8(7):2328-31.

2. Dzobo K, Adotey S, Thomford NE, Dzobo W. Integrating artificial and human intelligence: a partnership for responsible innovation in biomedical engineering and medicine. Omics. 2020;24(5):247-63.

3. Stanford University. Available at: http://www-formal.stanford.edu/jmc/history/dartmouth/ dartmouth.html. Accessed: 23.07.2021.

4. LeCun Y, Bengio Y, Hinton G. Deep learning. Nature. 2015;521(7553):436-44.

5. Goodfellow IJ, Shlens J, Azegedy C. Explaining and harnessing adversarial examples. arXiv:1412.6572

6. Chockley K, Emanuel E. The end of radiology? Three threats to the future practice of radiology. J Am Coll Radiol. 2016;13(12 Pt. A):1415-20.

7. Li Z, Keel S, Liu C. An automated grading system for detection of vision-threatening referable diabetic retinopathy on the basis of color fundus photographs. Diabetes Care. 2018;41(12):2509-16.

8. Ting DSW, Cheung CY, Lim G, et al. Development and validation of a deep learning system for diabetic retinopathy and related eye diseases using retinal images from multiethnic populations with diabetes. JAMA. 2017;318(22):2211-23.

9. Li Z, He Y, Keel S, et al. Efficacy of a deep learning system for detecting glaucomatous optic neuropathy based on color fundus photographs. Ophthalmology. 2018;125(8):1199-206.

10. Lakhani P, Sundaram B. Deep learning at chest radiography: automated classification of pulmonary tuberculosis by using convolutional neural networks. Radiology. 2017;284(2):574-82.

11. Halicek M, Lu G, Little JV, et al. Deep convolutional neural networks for classifying head and neck cancer using hyperspectral imaging. J Biomed Opt. 2017;22(6):60503.

12. Rajpurkar P, Irvin J, Ball RL, et al. Deep learning for chest radiograph diagnosis: A retrospective comparison ofthe CheXNeXt algorithm to practicing radiologists. PLoS Med. 2018;15(11):e1002686.

13. Haenssle HA, Fink C, Toberer F, et al. Man against machine reloaded: performance of a market-approved convolutional neural network in classifying a broad spectrum of skin lesions in comparison with 96 dermatologists working under less artificial conditions. Ann Oncol. 2020;31(1):137-43.

14. Tschandl P, Codella N, Akay BN, et al. Comparison of the accuracy of human readers versus machine-learning algorithms for pigmented skin lesion classification: an open, web-based, international, diagnostic study. Lancet Oncol. 2019;20(7):938-47.

15. Abramoff MD, Lavin PT, Birch M, et al. Pivotal trial of an autonomous Al-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ Digit Med. 2018;1:39.

16. Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med. 2019;25(1):44-56.

17. Pinto Dos Santos D, Giese D, Brodehl S, et al. Medical students' attitude towards artificial intelligence: a multicentre survey. Eur Radiol. 2019;29(4):1640-6.

18. Sit C, Srinivasan R, Amlani A, et al. Attitudes and perceptions of UK medical students towards artificial intelligence and radiology: a multicentre survey. Insights Imaging. 2020;11(1):14.

19. Waymel Q, Badr S, Demondion X, et al. Impact of the rise of artificial intelligence in radiology: What do radiologists think? Diagn IntervImaging. 2019;100(6):327-36.

20. Van Hoek J, Huber A, Leichtle A, et al. A survey on the future of radiology among radiologists, medical students and surgeons: Students and surgeons tend to be more skeptical about artificial intelligence and radiologists may fear that other disciplines take over. Eur J Radiol. 2019;121:108742.

21. Houghton LC, Howland RE, McDonald JA. Mobilizing breast cancer prevention research through smartphone apps: a systematic review of the literature. Front Public Health. 2019;7:298.

22. Sarwar S, Dent A, Faust K, et al. Physician perspectives on integration of artificial intelligence into diagnostic pathology. NPJ Digit Med. 2019;2:28.

23. Doraiswamy PM, Blease C, Bodner K. Artificial intelligence and the future of psychiatry: Insights from a global physician survey. Artif Intell Med. 2020;102:101753.

24. Blease C, Kaptchuk TJ, Bernstein MH, et al. Artificial intelligence and the future of primary care: exploratory qualitative study of UK general practitioners' views. J Med Internet Res. 2019;21(3):e12802.

25. Oh S, Kim JH, Choi SW, et al. Physician confidence in artificial intelligence: an online mobile survey. J Med Internet Res. 2019;21(3):e12422.

26. Gong B, Nugent JP, Guest W, et al. Influence of artificial intelligence on Canadian medical students' preference for radiology specialty: a national survey study. Acad Radiol. 2019;26(4):566-77.

27. Collado-Mesa F, Alvarez E, Arheart K. The role of artificial intelligence in diagnostic radiology: a survey at a single radiology residency training program. J Am Coll Radiol. 2018;15(12):1753-7.

28. Pakdemirli E. Artificial intelligence in radiology: friend or foe? Where are we now and where are we heading? Acta Radiol Open. 2019;8(2):2058460119830222.

29. Statista. Number of smartphone users worldwide from 2016 to 2021 (in billions). Available at: https://www.statista.com/statistics/330695/number-of-smartphone-users-worldwide. Accessed: 03.08.2019.

30. IQVIA. Evidence and Impact on Human Health and the Healthcare System. 2017.

31. Kong FW, Horsham C, Ngoo A, et al. Review of smartphone mobile applications for skin cancer detection: what are the changes in availability, functionality, and costs to users over time? Int J Dermatol. 2021;60(3):289-308.

32. Ngoo A, Finnane A, McMeniman E, et al. Fighting melanoma with smartphones: a snapshot of where we are a decade after app stores opened their doors. Int J Med Inform. 2018;118:99-112.

33. Kassianos AP, Emery JD, Murchie P, Walter FM. Smartphone applications for melanoma detection by community, patient and generalist clinician users: a review. Br J Dermatol. 2015;172(6):1507-18.

34. Borve A, Terstappen K, Sandberg C, Paoli J. Mobile teledermoscopy-there's an app for that! DermatolPract Concept. 2013;3(2):41-8.

35. Petrie T, Samatham R, Goodyear SM, et al. MoleMapper: an application for crowdsourcing mole images to advance melanoma early-detection research. Semin Cutan Med Surg. 2019;38(1):E49-56.

36. Wadhawan T, Situ N, Lancaster K, et al. SkinScan©: A portable library for melanoma detection on handheld devices. Proc IEEE Int Symp Biomed Imaging. 2011;2011:133-6.

37. Thissen M, Udrea A, Hacking M, et al. mHealth app for risk assessment of pigmented and nonpigmented skin lesions - a study on sensitivity and specificity in detecting malignancy. Telemed J E Health. 2017;23(12):948-54.

38. Phillips M, Marsden H, Jaffe W, et al. Assessment of accuracy of an artificial intelligence algorithm to detect melanoma in images of skin lesions. JAMA Netw Open. 2019;2(10):e1913436.

39. Steeb T, Wessely A, Mastnik S, et al. Patient attitudes and their awareness towards skin cancer-related apps: cross-sectional survey. JMIR Mhealth Uhealth. 2019;7(7):e13844.

40. Giunti G, Giunta DH, Guisado-Fernandez E, et al. A biopsy of breast cancer mobile applications: state of the practice review. Int J Med Inform. 2018;110:1-9.

41. Bender JL, Yue RY, To MJ, et al. A lot of action, but not in the right direction: systematic review and content analysis of smartphone applications for the prevention, detection, and management of cancer. J Med Internet Res. 2013;15(12):e287.

42. Bini SA. Artificial intelligence, machine learning, deep learning, and cognitive computing: what do these terms mean and how will they impact health care? J Arthroplasty. 2018;33(8):2358-61.

43. Esteva A, Kuprel B, Novoa RA, et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature. 2017;542(7639):115-8.

44. Ana FA, Loreto MS, José LM, et al. Mobile applications in oncology: a systematic review of health science databases. Int J Med Inform. 2020;133:104001.

45. Kessel KA, Vogel MM, Kessel C, et al. Mobile health in oncology: a patient survey about app-assisted cancer care. JMIR Mhealth Uhealth. 2017;5(6):e81.

46. Abbott LM, Smith SD. Smartphone apps for skin cancer diagnosis: implications for patients and practitioners. Australas J Dermatol. 2018;59(3):168-70.

47. IMDRF/SaMDWG/N 10:2013 Software as a medical device: key definitions. 18.12.2013. Available at: http://www.imdrf.org/docs/imdrf/final/technical/imdrf-tech-131209-samd-key-definitions-140901.pdf. Accessed: 23.07.2021.

48. IMDRF/SaMDWG/N 12:2014 Software as a medical device: possible framework for risk categorization and corresponding considerations. 14.09.2014. Available at: http://www.imdrf.org/ docs/imdrf/final/technical/imdrf-tech-140918-samd-framework-risk-categorization-141013.pdf. Accessed: 23.07.2021.

49. IMDRF/SaMDWG/N23:2015 Software as a medical device: application of quality management system. 02.10.2015. Available at: http://www.imdrf.org/docs/imdrf/final/technical/imdrf-tech-151002-samd-qms.pdf. Accessed: 23.07.2021.

50. IMDRF/SaMDWG/N41:2017 Software as a medical device: clinical evaluation. 21.09.2017. Available at: http://www.imdrf.org/docs/imdrf/final/technical/imdrf-tech-131209-samd-key-definitions-140901.pdf. Accessed: 23.07.2021.

51. Номенклатурная классификация медицинских изделий по видам. Режим доступа: http:// www.roszdravnadzor.ru/services/mi_reesetr/documents/46242. Ссылка активна на 23.07.2021 [Nomenklaturnaia klassifikatsiia meditsinskikh izdelii po vidam. Available at: http://www. roszdravnadzor.ru/services/mi_reesetr/documents/46242. Accessed: 23.07.2021 (in Russian)].

52. Kim DW, Jang HY, Kim KW, et al. Design characteristics of studies reporting the performance of artificial intelligence algorithms for diagnostic analysis of medical images: results from recently published papers. Korean J Radiol. 2019;20(3):405-10.

Статья поступила в редакцию / The article received: 30.07.2021 Статья принята к печати / The article approved for publication: 11.10.2021

omnidoctor.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.