Научная статья на тему 'ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ В ГЕМАТОЛОГИИ'

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ В ГЕМАТОЛОГИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
588
157
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МАШИННОЕ ОБУЧЕНИЕ / НЕЙРОННАЯ СЕТЬ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Лучинин Александр Сергеевич

«Искусственный интеллект» - это общий термин, описывающий компьютерные технологии для решения задач, которые требуют применения интеллекта человека, например распознавание человеческого голоса или изображений. Большинство продуктов с использованием искусственного интеллекта, применяемых в здравоохранении, связано с машинным обучением - отраслью информатики и статистики, которая генерирует предсказательные или описательные модели путем обучения на основе данных, а не путем программирования четких правил. Машинное обучение получило широкое распространение в патоморфологии, радиологии, геномике и анализе данных электронных медицинских карт. С учетом имеющейся тенденции технологии искусственного интеллекта, вероятно, будут все больше интегрироваться в исследовательскую и практическую медицину, включая гематологию. Таким образом, искусственный интеллект и машинное обучение заслуживают внимания и понимания со стороны исследователей и клиницистов. В данном обзоре описываются важные терминологические понятия и основные концепции обозначенных технологий, а также приводятся примеры их практического использования в научной и практической работе врача-гематолога.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Лучинин Александр Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ARTIFICIAL INTELLIGENCE IN HEMATOLOGY

‘Artificial Intelligence’ is a general term to designate computer technologies for solving the problems that require implementation of human intelligence, for example, human voice or image recognition. Most artificial intelligence products with application in healthcare are associated with machine learning, i.e., a field of informatics and statistics dealing with the generation of predictive or descriptive models through data-based learning, rather than programming of strict rules. Machine learning has been widely used in pathomorphology, radiology, genomics, and electronic medical record data analysis. In line with the current trend, artificial intelligence technologies will most likely become increasingly integrated into health research and practice, including hematology. Thus, artificial intelligence and machine learning call for attention and understanding on the part of researchers and clinical physicians. The present review covers important terms and basic concepts of these technologies, as well as offers examples of their actual use in hematological research and practice.

Текст научной работы на тему «ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ В ГЕМАТОЛОГИИ»

Клиническая онкогематология. 2022;15(1):16-27

Clinical oncohematology. 2022;15(1):16-27

ОБЗОРЫ REVIEWS

Искусственный интеллект не заменит врача, однако врачи, использующие искусственный интеллект, заменят тех, кто его не использует. Dr. Bertalan Mesko, медицинский футурист

"Artificial intelligence will not replace physicians, however, those physicians who use artificial intelligence will

replace those who don't." Dr. Bertalan Mesko, the medical futurist

Искусственный интеллект в гематологии

А.С. Лучинин

ФГБУН «Кировский НИИ гематологии и переливания крови ФМБА», ул. Красноармейская, д. 72, Киров, Российская Федерация, 610027

РЕФЕРАТ

«Искусственный интеллект» — это общий термин, описывающий компьютерные технологии для решения задач, которые требуют применения интеллекта человека, например распознавание человеческого голоса или изображений. Большинство продуктов с использованием искусственного интеллекта, применяемых в здравоохранении, связано с машинным обучением — отраслью информатики и статистики, которая генерирует предсказательные или описательные модели путем обучения на основе данных, а не путем программирования четких правил. Машинное обучение получило широкое распространение в патоморфологии, радиологии, геномике и анализе данных электронных медицинских карт. С учетом имеющейся тенденции технологии искусственного интеллекта, вероятно, будут все больше интегрироваться в исследовательскую и практическую медицину, включая гематологию. Таким образом, искусственный интеллект и машинное обучение заслуживают внимания и понимания со стороны исследователей и клиницистов. В данном обзоре описываются важные терминологические понятия и основные концепции обозначенных технологий, а также приводятся примеры их практического использования в научной и практической работе врача-гематолога.

Ключевые слова: искусственный интеллект, машинное обучение, нейронная сеть.

Получено: 23 сентября 2021 г. Принято в печать: 15 декабря 2021 г.

Для переписки: Александр Сергеевич Лучинин, канд. мед. наук, ул. Красноармейская, д. 72, Киров, Российская Федерация, 610027; тел.: +7(919)506-87-86; e-mail: glivec@mail.ru Для цитирования: Лучинин А.С. Искусственный интеллект в гематологии. Клиническая онкогематология. 2022;15(1):16-27. DOI: 10.21320/2500-2139-2022-15-1-16-27

Artificial Intelligence in Hematology

AS Luchinin

Kirov Research Institute of Hematology and Transfusiology, 72 Krasnoarmeiskaya str., Kirov, Russian Federation, 610027

ABSTRACT

'Artificial Intelligence' is a general term to designate computer technologies for solving the problems that require implementation of human intelligence, for example, human voice or image recognition. Most artificial intelligence products with application in healthcare are associated with machine learning, i.e., a field of informatics and statistics dealing with the generation of predictive or descriptive models through data-based learning, rather than programming of strict rules. Machine learning has been widely used in pathomorphology, radiology, genomics, and electronic medical record data analysis. In line with the current trend, artificial intelligence technologies will most likely become increasingly integrated into health research and practice, including hematology. Thus, artificial intelligence and machine learning call for attention and understanding on the part of researchers and clinical physicians. The present review covers important terms and basic concepts of these technologies, as well as offers examples of their actual use in hematological research and practice.

Keywords: artificial intelligence, machine learning, neural network.

Received: September 23, 2021 Accepted: December 15, 2021

For correspondence: Alexander Sergeevich Luchinin, MD, PhD,

72 Krasnoarmeiskaya str., Kirov, Russian Federation, 610027;

Tel.: +7(919)506-87-86; e-mail: glivec@mail.ru

For citation: Luchinin AS. Artificial Intelligence in Hematology.

Clinical oncohematology. 2022;15(1):16-27. (In Russ).

DOI: 10.21320/2500-2139-2022-15-1-16-27

16 © 2022 практическая медицина

Рис. 1. Виды искусственного интеллекта и машинного обучения Fig. 1. Types of artificial intelligence and machine learning

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ: ТЕРМИНОЛОГИЯ И БАЗОВЫЕ ПОНЯТИЯ

«Искусственный интеллект» (ИИ; artificial intelligence) — это общий термин, описывающий компьютерные технологии для решения задач, которые требуют применения интеллекта человека, например распознавание человеческого голоса или изображений [1]. Подобные задачи возникают в здравоохранении. Поскольку объем медицинских данных растет в геометрической прогрессии, исследователи и клиницисты сталкиваются с проблемой большого количества информации, при этом размеры и сложность генерируемой информации превосходят интеллектуальные возможности человека по их анализу. Подавляющее большинство технологий ИИ, применяемых в здравоохранении, связано с машинным обучением (МО; machine learning). МО — отрасль информатики и статистики, разновидность ИИ и способ создания программных продуктов на основе анализа данных [2]. Термин МО относится к любому компьютерному алгоритму, когда вместо программирования формальных правил для решения конкретной задачи используются исходные данные, которые подвергаются различного рода математическим преобразованиям в рамках поставленной цели. В результате получается алгоритм, часто использующий неочевидную логику, который позволяет решать поставленную задачу с той или иной степенью эффективности.

ВИДЫ МАШИННОГО ОБУЧЕНИЯ

Программные продукты, созданные с помощью МО, основаны на использовании различных типов данных по отдельности или в сочетании друг с другом, степень предварительной обработки которых зависит от применяемой математической модели (рис. 1). Выбор данных для анализа, как правило, необходимо сделать до разработки модели МО, что влечет за собой такие задачи, как поиск и структурирование потенциально полезной информации и удаление ненужной. Эти задачи могут выполняться вручную на основе знания

■ 1 к| 1 | I IÎ Сбор и подготовка данных к анализу: • Обучение с учителем

• Обучение без учителя

ООО Выбор модели МО: ^¿^ • Нейронная сеть (•"у • Другие модели

й Тренировка (обучение): • Тренировочная выборка (70-80 %) • Тестовая выборка (20 30 %)

< # Выбор оптимальной модели: ч • Чувствительность J • Специфичность • Точность (AUC)

—/

Запуск продукта: • Веб-приложение • Интеграция с МИС/ЛИС

WWW ■-- ■—

Рис. 2. Этапы создания искусственного интеллекта с использованием технологий машинного обучения (цит. по [2]) AUC — площадь под кривой; ЛИС — лабораторная информационная система; МИС — медицинская информационная система; МО — машинное обучение.

Fig. 2. Stages of developing artificial intelligence using machine learning technology (quoted from [2]) AUC — area under curve; ЛИС — laboratory information system; МИС — healthcare information system; МО — machine learning.

предметной области (например, исследователь намеренно выбирает параметры общего анализа крови и миелограммы для диагностики гематологических заболеваний), алгоритмически (вспомогательные алгоритмы помогают удалить лишние параметры из выборки или сократить их количество путем объединения — снижение размерности) или эмпирически, когда данные подбираются и меняются на основе полученных результатов уже в ходе МО.

Модель изначально создается на тренировочном (обучающем) наборе данных. Тренировочная (обучающая) выборка нужна для настройки (оптимизации параметров) модели. После создания модели используется тестовая (контрольная) выборка, по которой оценивается качество построенной модели. Этот процесс можно многократно повторять для поиска наиболее качественной модели — метод кросс-валидации. На заключительном этапе применяется валидация на проверочном наборе данных и выбирается наилучшая модель из нескольких построенных, которая соответствует желаемым критериям точности. Далее необходимо предпринять еще несколько шагов для ее практического применения. Эти шаги включают описание принципов работы и прогнозов модели для пользователя, внешнюю валидацию (экспертную проверку) на сторонних данных и реализацию модели в виде удобного для практического использования продукта, например в виде интернет-сайта или интеграции в медицинскую (МИС) либо лабораторную (ЛИС) информационную систему (рис. 2) [2].

Входной слой

Скрытый слой

Выходной слой

Текст

ш

Геномные данные

Табличные д

Изображения «ft

Классификация (сортировка)

Ш--Ш-Ш

д---срч±| ^^ ^

Регрессия (прогноз)

Рис. 3. Структура искусственной нейронной сети (цит. по [2])

Fig. 3. Structure of artificial neural network (quoted from [2])

Модели МО можно классифицировать на контролируемые (обучение с учителем, supervised learning) и неконтролируемые (обучение без учителя, unsupervised learning). Прогнозы контролируемых моделей сравниваются с известными результатами; таким образом, процесс обучения итеративно отражает согласование получаемых прогнозов и заранее размеченной выборки. Модели без учителя обучаются на неразмеченных данных, например на анализах пациентов с неизвестным диагнозом. При этом компьютерный алгоритм самостоятельно идентифицирует похожие паттерны, такие как профиль экспрессии генов, лабораторные параметры или симптомы, и объединяет их в группы (кластерный анализ). В дальнейшем полученные кластеры требуют экспертной оценки специалистами предметной области, чтобы установить значимость или ложность полученных результатов. Кроме того, существует МО с подкреплением (reinforcement learning). При обучении с подкреплением алгоритмы формируются и изменяются в реальном времени в зависимости от положительного или отрицательного результата их работы, тем самым программа подстраивается под меняющиеся условия, чтобы получить нужный результат [3]. Так, например, может работать и обучаться система, контролирующая уровень гликемии у больных сахарным диабетом на фоне непрерывной инсулинотерапии.

НЕЙРОННЫЕ СЕТИ И ГЛУБОКОЕ ОБУЧЕНИЕ

В настоящее время существуют десятки методов, относящихся к МО. Помимо стандартных подходов выделяют методы нейронных сетей (neural network) и глубокого обучения (deep learning). Глубокое обучение — разновидность МО с использованием сложных, многослойных нейронных сетей [4]. Нейронная сеть в биологии — это последовательность нейронов, соединенных между собой синапсами. Структура искусственной нейронной сети (ИНС) заимствована из биологии. ИНС — математическая модель, построенная по принципу организации и функционирования нейронных сетей живого организма. Дизайн ИНС отражает их биологический аналог — нейронную сеть в головном мозге животных и человека. Информация передается по слоям взаимосвязанных узлов — нейронов (рис. 3) [2].

ИНС состоит из искусственных нейронов, каждый из которых представляет собой упрощенную модель биологического нейрона. Искусственный нейрон принимает сигналы из многих входов, обрабатывает их единым образом и передает результат на многие другие искусственные нейроны, как и нейрон биологический. Биологические нейроны связаны между собой аксонами, места стыков называются синапсами. В синапсах происходит усиление или ослабление электрохимических сигналов. Связи между искусственными нейронами тоже называются синаптиче-скими. У синапса имеется один параметр — весовой коэффициент; в зависимости от его значения происходит то или иное изменение информации, когда она передается от одного нейрона к другому. Именно благодаря этому исходные входящие значения подвергаются математическим преобразованиям, а сам процесс обучения нейронной сети основан на экспериментальном подборе весовых коэффициентов для каждого синапса с целью получить нужный результат с минимальной ошибкой. Таким образом, компьютерная модель обретает способность анализировать и запоминать разную информацию. ИНС могут не только анализировать входящую информацию, но и воспроизводить ее из своей памя ти. Слой входных нейронов (input layer) собирает исходные данные, такие как текст, изображения или числа. Последующие скрытые слои связывают их друг с другом через рассчитанные числовые коэффициенты. Наконец, выходной слой (output layer) позволяет получить интерпретируемый результат. Количество скрытых слоев в ИНС может быть произвольно большим — от одного до нескольких десятков или даже сотен [5]. Другими словами, нейросеть — это машинная интерпретация мозга человека. Нейронные сети являются одними из самых продуктивных и эффективно использующихся алгоритмов МО в последние годы.

Сверточные нейронные сети (СНС; convolutional neural network) — разновидность ИНС, которые обычно применяются в так называемом компьютерном зрении (computer vision), когда компьютеры используются для распознавания и извлечения информации из изображений. СНС смоделированы так, что входной слой нейронов представляет собой аналог фоторецепторов, передающих информацию об интенсивности пикселей на фото. Последующие скрытые слои последовательно создают более

высокоуровневые представления информации от простых геометрических линий и текстур до сложных объектов, таких как лица, образы или изображения опухолей. СНС применяются во многих медицинских дисциплинах. В радиологии СНС используются для решения диагностических задач при интерпретации рентгенологических снимков, полученных при стандартной рентгенографии или компьютерной томографии (КТ). В патоморфологической диагностике СНС приблизились или достигли производительности человека в классификации опухолей, обнаружении метастазов и даже в описании молекулярных характеристик опухоли, например экспрессии PD-L1 прямо по цифровым изображениям биоптатов [6, 7]. В 2018 г. технология диагностики ретинопатии с использованием СНС получила разрешение для клинического использования от Управления по контролю за качеством пищевых продуктов и лекарственных средств США (FDA) [8, 9].

Рекуррентные нейронные сети (РНС; recurrent neural network) — вид нейронных сетей, где связи между нейронами образуют направленную во времени последовательность. Они возникли как мощные средства для обработки информации, которая динамически меняется с течением времени. Это делает их применимыми для таких задач, как распознавание текста или речи, когда информация представлена в виде неструктурированных последовательных данных [10]. РНС можно использовать для анализа содержимого электронных медицинских карт. Последние 5 лет РНС активно используются в клинических исследованиях для обработки естественного языка (natural language processing). РНС как метод МО представляют собой эффективный инструмент извлечения ценной информации, содержащейся в медицинских записях.

ЗАДАЧИ МАШИННОГО ОБУЧЕНИЯ И ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ

Помимо ИНС существуют другие стандартные алгоритмы МО, например: метод опорных векторов (support vector machine) для разделения данных в условном многомерном пространстве; метод ближайшего соседа (k-nearest neighbors), который классифицирует данные на основе сходства с другими данными; дерево решений (decision tree) — метод принятия решений на основе древовидного деления информации по значимым переменным. Известно также несколько ансамблевых методов МО (случайные леса [random forest], градиентный бустинг [gradient boosting]), работа которых основана на комбинации из нескольких более слабых моделей (чаще всего — деревьев решений) [11]. Другие алгоритмы МО могут уступать ИНС в решении одних задач, но помогают достичь аналогичных или лучших результатов в решении других. Кроме того, у таких методов есть преимущества в виде меньшей потребности в вычислительных мощностях, объеме данных для обучения и более легкой интерпретации. В то же время ИНС демонстрируют постоянное превосходство в некоторых сферах, например в обработке изображений, хотя такие модели могут потребовать большое число

образцов данных для обучения и мощной аппаратной поддержки.

Методами МО решаются следующие основные задачи:

• классификация — распределение данных по классам (группам), например, при постановке диагноза или при определении группы риска;

• регрессия (прогноз) — возможность предсказывать событие, например прогноз выживаемости по исходным параметрам;

• распознавание — это самое широкое применение нейронных сетей, например распознавание онкологических заболеваний на цифровых изображениях, полученных при КТ.

Независимо от выбранного метода МО результатом является математическая модель — абстракция реального явления, в котором интересующие исследователя отношения между реальными элементами заменены подходящими, зачастую упрощенными, отношениями между математическими объектами. Иными словами, это представление реальной ситуации с помощью математического языка. Понимание клиницистами тонкостей на уровне специалиста в области МО (data scientist) не требуется. Однако грамотность в статистике и в принципах анализа данных является краеугольным камнем современного медицинского образования как для исследователей, так и практикующих врачей. Объем медицинских знаний быстро меняется, и клиницисты должны своевременно получать информацию о новых исследованиях, понимая их дизайн и научную терминологию.

Как и в случае с обычной статистикой, технологии МО хороши настолько, насколько хороши исходные данные. В некоторых случаях исходные данные, используемые для разработки модели, обладают значительной вариабельностью, что зависит от медицинского учреждения, где они были собраны, а также от того, кто и как их собирал. Некачественные и разрозненные исходные данные затрудняют создание универсальной надежной модели, которую можно одинаково эффективно использовать в разных медицинских учреждениях. Когда исходные данные собраны в пределах только одного медицинского центра, что бывает довольно часто, созданные на их базе модели могут иметь ограничения для широкого практического применения и адаптации результатов для других медицинских учреждений. Другими словами, точность работы моделей на сторонних данных сильно снижается. Например, при расшифровке изображений КТ такая проблема может быть связана с разным типом томографов и качеством получаемых изображений в разных больницах.

Важным свойством моделей МО для их практического применения является интерпретируемость. Принятие медицинского решения основано на взвешивании часто противоречивых данных, и врачи должны иметь веские основания при выборе своих действий в отношении пациента. В связи с этим, чем понятнее для врача работает модель МО, тем более уверенно он сможет использовать ее в качестве помощника в принятии врачебного решения. Для этого врач должен понимать основные принципы действия технологий МО и ИИ. Однако архитектура многих моделей МО не поддается интерпретации и воспри-

Тестовая выборка

Истинно положительные (ТР)

Ложноотрицательные (FN)

•••••••••••••••••••а ••••

WW

••••••••••••••••••в

••••••••••••••••••••

•••••••••••••••••в

Ложноположительные (FP) • • •

Прогноз

Истинно отрицательные (TN)

••••••••••

•••••••••••••••••••в ••••••••••••••••••••

WWWWWWWWWW WWWWWWWVWWV

•••••••••••••••••••в ••••••••••••••••••••

••••••••••••••••••в

••••••••••••••••••в

•••••••••••••••••••в ••••••••••••••••••••

V WWWWWWWWWW

Рис. 4. Определение точности модели машинного обучения (цит. по [2])

Точность (accuracy):

TN + TP 91 + 1

TN + TP + FP + FN 91 + 1 + 4 + 4 Точность (precision):

TP 1

: 20 %

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

= 92 %

TP + FP 1 + 4

Fig. 4. Accuracy evaluation of a machine learning model (quoted from [2])

нимается как «черный ящик» (black box problem). По этой причине главными характеристиками модели в ходе ее тестирования являются чувствительность, специфичность и общая точность (рис. 4) [2].

Чувствительность модели — доля истинно положительных результатов, когда модель правильно предсказывает наличие прогнозируемого события (чувствительность может быть от 0 до 100 %). Специфичность модели — доля истинно отрицательных результатов, когда модель правильно предсказывает отсутствие прогнозируемого события (специфичность может быть от 0 до 100 %). Точность модели определяется показателями чувствительности и специфичности, которые должны стремиться к своим максимальным значениям. Расчет точности может быть выполнен двумя способами, результаты которых имеют разную значимость и интерпретацию. Точность (accuracy) высчитывается как сумма истинно отрицательных (специфичность) и истинно положительных (чувствительность) случаев, деленная на общее число тестов. Точность (precision) вычисляется как число истинно положительных случаев (чувствительность), деленное на сумму истинно положительных и ложноположительных случаев (1 - специфичность). Последний расчет точности считается более предпочтительным и верным на выборках данных, где частота изучаемого явления очень мала. В этом случае показатель «accuracy» может быть довольно большим при высокой специфичности модели и низкой чувствительности. В то же время показатель «precision» при низкой чувствительности будет неприемлемым для практического использования модели [2].

Визуализация и расчет точности модели могут быть выполнены при построении характеристической кривой (ROC) — отображения соотношения между долей объектов от общего количества носителей признака, верно классифицированных как несущих признак (т. е. чувствительностью), и долей объектов от общего количества объектов, не несущих признака, ошибочно классифицированных как несущих признак (т. е. специ-

фичностью). При этом метрикой диагностической ценности является площадь под кривой (АиС) — площадь, ограниченная ЯОС-кривой и осью абсцисс. Хорошей моделью (приемлемой для клинической валидации) может считаться та, у которой величина АиС > 0,81, при этом показатели чувствительности и специфичности примерно равны (симметричная модель) [12]. В случае асимметричности модели она может обладать как гипердиагностикой (при низкой специфичности), так и гиподиагностикой (при низкой чувствительности).

Для создания моделей МО нужны данные, которые собираются в датасеты. Датасет — это набор, как правило, структурированной информации, который может быть подвергнут анализу. Структурированными называются данные, отражающие отдельные факты предметной области и упорядоченные определенным образом с целью обеспечить возможность применения к ним различных методов статистической обработки. В классическом виде они упорядочены по вертикали в типизированные столбцы, называемые полями, а по горизонтали — в строки, называемые записями. При этом все записи должны содержать один и тот же набор полей, а все поля — один и тот же набор записей. Обычно каждое поле представляет собой атрибут (признак), а строка — единицу наблюдения. Большинство алгоритмов МО работает только со структурированными данными. В качестве данных могут использоваться изображения (фото, картинки), текстовая информация (записи электронных медицинских карт) и числовые датасеты, содержащие параметры, с которыми можно непосредственно проводить математические вычисления.

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ В ГЕМАТОЛОГИИ СЕГОДНЯ

Достижения в области МО позволили таким технологиям утвердиться в различных сферах медицины,

в т. ч. в гематологии. Сегодняшний прогресс в разработке технологий ИИ обещает оптимизировать существующую лечебно-диагностическую помощь, способствуя новым открытиям эффективных и персонализированных методов терапии. Хотя многие из решений еще находятся на ранних стадиях своего развития и тестирования, они имеют несомненные перспективы для применения в клинической практике. В гематологии МО может использоваться для решения более широкого, чем стандартная статистика, круга задач, число которых растет из года в год [13]. В первую очередь технологии МО используются в радиологии, где с помощью алгоритмов глубокого обучения проводится автоматический анализ изображений томограмм для поиска визуальных признаков различных заболеваний, таких как рак легкого, туберкулез, COVID-19 и др.

Искусственный интеллект в диагностике

гематологических заболеваний

В гематологии метод компьютерного зрения может быть особо полезным при морфологическом анализе оцифрованных (по фото) мазков крови, костного мозга и гистологических препаратов. Так, например, точная классификация лейкоцитов в мазках периферической крови — задача, которая обычно требует значительного времени и знаний, может быть выполнена моделями на базе СНС с точностью более 95 % для большинства клеточных линий. Ошибки неправильной классификации сохраняются между клетками, которые выглядят примерно одинаково, например между лимфоцитами и реактивными лимфоцитами [14-16]. Это может значительно ускорять процесс диагностики и экономить человеческий ресурс. Так, одна из российских исследовательских коммерческих компаний разработала и предлагает технологии ИИ для автоматизированной классификации и подсчета клеток на оцифрованных мазках костного мозга [49]. Цифровое фото мазка костного мозга анализируется с помощью алгоритма ИИ, после чего формируется заключение, которое валидируется врачом (рис. 5).

Актуальной проблемой является гистопатологи-ческая диагностика рака, которая требует высокой квалификации врача-морфолога и в значительной степени зависит от качества изготовления гистологических материалов. Данная проблема в онкологии уже сейчас имеет ряд решений в виде автоматизированных диагностических систем, основанных на глубоком обучении [17]. В опубликованном в 2019 г. исследовании авторы классифицировали 2560 изображений гистологических препаратов лимфатических узлов для обучения компьютерной модели в целях постановки четырех типов диагноза: нормальный лимфатический узел, диффузная В-крупноклеточная лимфома, лимфома Беркитта и лимфома из малых лимфоцитов [18]. В качестве метода МО использовалось глубокое обучение. Диагностическая точность модели на базе СНС по результатам тестирования равнялась 95 %. В другом исследовании ученые смогли добиться 96 % чувствительности и не менее 87 % специфичности при выявлении опухолевых клеток лимфомы по цифровым изображениям мазков пери-

Рис. 5. Распознавание изображении клеток и их подсчет в мазках костного мозга методом компьютерного зрения (цит. по [49])

Fig. 5. Cell image recognition and cell counting in bone marrow smears by computer vision (quoted from [49])

ферической крови [19]. В диагностике множественной миеломы технологии компьютерного зрения могут использоваться для скрининга литических очагов по данным совмещенной КТ и позитронно-эмиссионной компьютерной томографии (ПЭТ-КТ) скелета [20, 21]. Так, с применением методов глубокого обучения исследователи создали ИНС, которая повысила специфичность выявления активных миеломных очагов по данным ПЭТ-КТ до 99,5 % (при чувствительности метода 75,5 %) по сравнению только с КТ-диагностикой (специфичность 73,8 %). На рис. 6 представлены последовательные изображения КТ, ПЭТ и ПЭТ-КТ в сочетании с цветной раскраской, выполненной с помощью ИНС. Красным цветом выделены истинно положительные очаги поражения, зеленым — ложно-положительные, синим — ложноотрицательные [20].

Огромное количество данных ежедневно накапливается в медицинских, лабораторных, информационных системах и регистрах пациентов. В них содержится информация о клинических и лабораторных профилях пациентов, методах терапии и ее результатах. Эта информация может использоваться в качестве субстрата для создания математических моделей, направленных на решение таких важных задач, как дифференциальная диагностика, прогноз и стратификация рисков. В зависимости от поставленных задач исходное количество данных необязательно может быть очень большим, а сами данные хорошо сбалансированными. Несмотря на это, технологии МО могут обеспечить преимущество перед стандартными методами статистического анализа. Следует отметить, что любой профиль пациента можно описать в виде так называемого цифрового следа, который увеличи-

Рис. 6. Распознавание остеолитических очагов на ПЭТ-КТ-изображениях при множественной миеломе (цит. по [20])

Fig. 6. Detection of osteolytic lesions on PET-CT images in multiple myeloma (quoted from [20])

вается по мере продолжительности истории болезни. Под «цифровым следом» здесь понимаются все оцифрованные данные пациента, которые появляются и накапливаются в ходе лечебно-диагностического процесса, включая результаты анализов и лечения. На разных этапах заболевания профиль пациента и его «цифровой след» могут быть использованы и проанализированы для решения научно-практических задач с помощью технологий ИИ.

В одном из исследований, применив технологии МО, авторы создали более точную, чем традиционные балльные системы, модель прогноза рецидива в течение 2 лет для больных диффузной В-крупнокле-точной лимфомой [22]. В исследование включили 518 пациентов, у каждого из которых измерили 52 характеристики (предикторы). Больные получали терапию в период с января 2011 г. по июль 2016 г. В качестве методов МО изучались метод опорных векторов, ИНС, случайные леса и AdaBoost (метод ансамблевого обучения, который использует итеративный подход, чтобы учиться на ошибках слабых классификаторов и превращать их в сильные). В результате значимыми предикторами для лучшей модели оказались стадия заболевания, уровень лактатдегидрогеназы крови, уровень (32-микроглобулина крови, использование ри-туксимаба в лечении, инфекция верхних дыхательных путей и экспрессия виментина на клетках лимфомы. Исследователи смогли получить математическую

модель прогноза рецидива лимфомы с показателем AUC 99,5 %. Достигнуть такой результат удалось в т. ч. через решение проблемы несбалансированности данных, когда один из изучаемых классов превалирует над другим по частоте (применялся метод МО SMOTE для многомерных данных с несбалансированными классами).

Искусственный интеллект в прогнозировании

течения гематологических заболеваний

Наилучшим источником данных для построения моделей МО являются регистры больных, в которых данные структурированы. Результаты исследования, опубликованные в 2018 г. в журнале «American Journal of Clinical Oncology», подтвердили, что сочетание методов МО и общенациональных клинических регистров позволяет создать прогностическую модель выживаемости больных диффузной В-круп-ноклеточной лимфомой, которая превосходит по своей точности Международный прогностический индекс. Для создания модели использовались данные 2759 пациентов датского регистра, а ее точность подтверждена на 2414 пациентах из национального регистра Швеции [23]. Особенностью работы было применение метода стэкинга (суперобучения), когда окончательную математическую модель (супервизор) формируют на основании нескольких независимых первичных моделей, полученных с применением

разных методов МО, комбинируя их прогнозы в один наиболее точный.

Показательный пример использования МО для анализа информации медицинских карт продемонстрировали исследователи отделения клинической гематологии медицинского центра Университета Любляны (Словения). Они собрали данные лабораторных анализов пациентов за период с 2005 по 2015 г., всего — результаты более 370 тыс. лабораторных тестов, взятых у 8233 пациентов в момент первичного обращения и постановки диагноза [24]. Цель исследования — создание модели МО для дифференциальной диагностики гематологических заболеваний по Международной классификации. В качестве алгоритма выбран метод случайных лесов [25]. При тестировании эффективности модели на реальных клинических случаях точность диагностики в сравнении с таковой у врачей-гематологов составила 90 и 77 % соответственно. Полученные результаты стали основой коммерческого продукта.

В гематологии при ряде заболеваний существует проблема неодинаковой точности прогнозов по разным шкалам. Например, при миелодиспластиче-ском синдроме (МДС) такие прогностические модели, как International Prognostic Scoring System (IPSS) и Revised International Prognostic Scoring System (R-IPSS), несмотря на широкое практическое применение, не обладают высокой предиктивной точностью. Так, c-индекс (мера соответствия результатов модели реальным данным, где 1 — идеальный прогноз, а 0,5 — не лучше, чем случайный прогноз) для предсказания общей выживаемости (ОВ) составляет 0,64 для IPSS, 0,66 для R-IPSS, 0,68 для МДС по классификации ВОЗ и 0,69 для балльной прогностической системы онкологического центра MD Anderson. В то же время модели, полученные с помощью МО с использованием клинических и геномных данных, позволяют достичь значения c-индекса 0,78 для прогноза ОВ и 0,8 для прогноза трансформации МДС в острый миелоидный лейкоз [26].

Похожие модели, в которых используются клинические и генетические данные, можно также применять для стратификации риска при трансплантации гемопоэтических стволовых клеток (ГСК). Например, с помощью моделей на основе ИНС можно прогнозировать риск клинического ухудшения у пациентов с заболеваниями системы крови, госпитализированных для трансплантации ГСК, например перевод в отделение интенсивной терапии. Однако полезность таких моделей существенно зависит от исходных данных. Авторы сообщили о прогностической точности 88,7 % у пациентов после трансплантации аллогенных ГСК по сравнению с 31,8 % в группе с трансплантацией аутологичных ГСК. Это подчеркивает важность тщательного отбора пациентов, у которых модель будет использоваться в клинической практике [27].

В исследовании, зарегистрированном на Clinical-Trials.gov под номером NCT03199066, МО применялось для прогноза прогрессирования фолликулярной лим-фомы в течение 2 лет после начала иммунохимиоте-рапии. В исследование включили 1394 пациентов из популяционного регистра Чехии, получавших лечение в период с 2000 по 2016 г. [28]. В качестве методов МО

использовались байесовский сетевой анализ (БСА; Bayesian network analysis) для расчета вероятности изучаемого события на основе вычисления вероятностей комбинаций различных предикторов, связанных с заболеванием или пациентом на этапе диагностики, и многомерная логистическая регрессия. Метод БСА позволяет не только рассчитать индивидуальный прогноз риска для каждого пациента, даже если некоторые из предикторов неизвестны, но и визуализировать сложные отношения между предикторами в виде графической схемы. Результаты исследования показали, что прогностические системы, основанные на методах МО, позволяют лучше стратифицировать пациентов на группы риска, чем традиционный прогностический индекс PRIMA для фолликулярных лимфом.

Технологии МО оказались эффективными и в прогнозировании рецидивов острого лимфобластного лейкоза (ОЛЛ) у детей. В небольшое исследование включили 50 пациентов. Каждый случай характеризовался 15 различными атрибутами. Для определения наиболее полезных отличительных признаков использовались четыре контролируемых алгоритма МО, включая деревья классификации и регрессии (CART), метод случайных лесов, градиентный бустинг и алгоритм дерева решений C5.0. Метод CART показал наилучшие результаты с точностью безошибочного прогноза, равной 99,8 %. Точность метода C5.0 составила 98,6 %, метода случайных лесов — 94,4 %, градиентного бустинга — 95,6 %. Значимыми прогностическими факторами служили уровни тромбоцитов, гемоглобина, лейкоцитов и пол ребенка. При этом отклонение от нормы количества тромбоцитов рассматривалось как наиболее важный фактор, влияющий на прогноз рецидива ОЛЛ у детей. Окончательная точность классификатора в результате десятикратной кросс-валидации составила 87,4 % [29].

Неконтролируемые (без учителя) методы МО также могут применяться при решении задач стратификации риска. В частности, такой подход использовался при изучении прогноза летальности из-за реакции «трансплантат против хозяина» (РТПХ) путем визуализации многомерных данных о реципиенте в виде двухмерного пространства (метод стохастического вложения соседей с t-распределением) с последующим применением алгоритма кластеризации для определения подкластеров пациентов. Это позволило разграничить отдельные клинические профили больных с РТПХ, характеризующиеся вовлечением в патологический процесс органов и систем, на такие, как с преобладанием поражения глаз, с преобладанием поражения печени и с изолированным поражением печени. Полученные кластеры пациентов показывали клинически значимые различия в прогнозе летальности с отношением рисков 2,24 (95%-й доверительный интервал 1,36-3,68) между группами высокого и низкого рисков РТПХ [30].

В другом исследовании показано, что неконтролируемые методы МО повышают точность стратификации риска индолентного течения хронического лимфолейкоза (ХЛЛ) для принятия решения о начале терапии или выборе наблюдательной тактики. Применение кластерного анализа методом K-средних

позволило определять риск течения заболевания с лучшим прогнозом, чем использование традиционных систем прогноза, что имело несомненную пользу для клиницистов [31]. Кластерный анализ (метод K-средних) также использовался для выявления прогностических факторов ОВ у больных ХЛЛ [32]. Метод помог разделить общую группу из 247 пациентов на отдельные кластеры, статистически значимо отличающиеся между собой по ОВ, при этом предикторы выживаемости не были заранее известны. В итоге благоприятный прогноз ОВ оказался связанным с мутантным статусом вариабельной области генов тяжелой цепи иммуноглобулинов, отсутствием экспрессии на опухолевых клетках белка Zap70, женским полом и молодым возрастом.

Искусственный интеллект в лечении

гематологических заболеваний

В целом качественная стратификация пациентов может позволить не только понять прогноз их заболевания, но и ускорить разработку новых методов лечения. Дизайн любого клинического исследования и правильный набор пациентов с учетом критериев включения и исключения являются решающими факторами на завершающих этапах изучения эффективности и безопасности новых лекарственных препаратов. Здесь МО может помочь несколькими способами: автоматический скрининг данных в электронных медицинских картах для поиска подходящих кандидатов, определение фенотипов болезни, которые с наибольшей вероятностью выиграют от назначения исследуемой терапии. Такие подходы могут уменьшить размер выборки пациентов для исследования, снизить затраты и уменьшить риски неудач от проводимого лечения [33].

Одним из высокотехнологичных методов лечения онкогематологических больных является трансплантация аллогенных ГСК. Это метод лечения потенциально курабельных пациентов с острыми лейкозами, но имеющий высокий риск угрожающих жизни осложнений. Алгоритмы МО могут быть использованы для прогнозирования летальности, связанной с трансплантацией аллогенных ГСК. В 2015 г. в «Journal of Clinical Oncology» опубликованы результаты ретроспективного исследования с использованием данных 28 236 взрослых пациентов — реципиентов аллогенных ГСК, полученных из Европейского регистра трансплантации костного мозга (EBMT). Цель исследования — прогнозирование летальности пациентов с острыми миелобластным и лимфобластным лейкозами в течение 100 дней после трансплантации и их 2-летней ОВ [34]. Авторы применяли метод МО, называемый переменным деревом решений (ADtree). Общая летальность в течение 100 дней составила 13,9 % (n = 3936). Из 20 рассматриваемых предикторов в окончательную модель включили 10. Точность рассчитанной модели сравнили с балльной системой прогнозирования риска летальности по шкале EBMT, показатель AUC равнялся 70,1 и 64,6 % соответственно (p < 0,001).

В одном из последних исследований применение методов МО позволило построить персональные модели прогнозирования результатов лечения после

трансплантации аллогенных ГСК у больных МДС, у которых трансплантация также остается единственным потенциально излечивающим вариантом терапии [35]. В анализ включили 1514 пациентов с МДС, у которых выполнено генетическое секвенирование образцов периферической крови на наличие 129 наиболее часто мутирующих генов. Для построения модели ОВ использовался метод случайных лесов, а ее точность оценивалась с помощью c-индекса. Наиболее часто мутировавшими генами были ASXL1 (20 %), TP53 (19 %), DNMT3A (15 %) и ТЕТ2 (12 %). Итоговая модель ОВ базировалась на таких переменных, как возраст пациента, мутация гена TP53, абсолютное число нейтрофилов, цитогенетические нарушения в соответствии с R-IPSS, общее состояние больного по шкале Карновского, режим кондиционирования, возраст донора, количество лейкоцитов, концентрация гемоглобина, вид терапии, содержание бластных клеток в периферической крови, мутации генов семейства RAS, JAK2 и мутации в генах ZRSR2 и CUX1. Полученная модель позволяет рассчитать персонализированную вероятность выживания в различные моменты времени на основе клинических и генетических переменных, перечисленных выше, что может помочь врачу в принятии решения о проведении трансплантации аллогенных ГСК.

Технологии МО способствуют эффективному решению узкоспециализированных задач, связанных с лабораторной диагностикой. Современные гематологические анализаторы работают на основе принципов электропроводности клеток в постоянном и переменном токе, а также использования сигналов светорассеяния с помощью лазера, что позволяет получить исчерпывающую информацию о размере клетки, характеристиках ее поверхности, структуре ядра и цитоплазматических гранул. Задачей исследования, опубликованного в «British Journal of Haematology» в 2018 г., была дифференциальная диагностика лимфоцитоза по данным, полученным на гематологическом анализаторе DXH800 (Beckman Coulter, США), в котором применяется специальная технология для дифференциального подсчета числа лейкоцитов и популяций клеток [36]. Образцы крови от 400 пациентов разделили на три группы: здоровые, пациенты с вирусной инфекцией (вирус Эпштейна—Барр и цитоме-галовирус) и больные ХЛЛ. Окончательный диагноз в каждой группе подтвердили серологическими методами и с помощью иммунофенотипирования крови. В качестве предикторов для МО использовались морфологические характеристики лимфоцитов и их абсолютное число, полученные на гематологическом анализаторе. При моделировании исследователи сравнили разные алгоритмы МО. Наиболее точным оказался метод на основе ИНС (AUC 98 %). Таким образом, сочетание результатов современной аппаратной диагностики с технологиями МО позволяет получить эффективные решения для повседневной клинической практики.

Один из актуальных вопросов ведения онкогемато-логических больных — прогнозирование ответа на лечение. Технологии МО способны решить эту проблему несколькими способами. Одним из перспективных на сегодня считается анализ генетических данных при

Таблица 1. Обзор работ по применению машинного обучения в гематологии

Автор, год Размер выборки_Решаемая задача_Метод_Результаты

K. Kimura et al., 3261 мазок Классификация лейкоцитов; дифференци- СНС, градиентный Чувствительность 93,5 %,

2019 [14] перифериче- альная диагностика АА и МДС бустинг специфичность 96 % для задачи

ской крови выявления лейкоцитов

Чувствительность 96,2 %,

специфичность 100 % для диф-

ференциальной диагностики АА

и МДС

Н.Е. АсИ е1 а1., 128 пациентов Дифференциальная диагностика диф- СНС Точность модели 95 %

2019 [18] фузной В-крупноклеточной лимфомы, для диагностики по стеклам;

лимфомы из малых лимфоцитов, точность 100 % для диагностики

лимфомы Беркитта и нормального по данным пациентов лимфатического узла

S.A. Milgrom et al., 251 пациент Прогноз рефрактерного течения лимфомы СНС AUC модели 95 % для прогноза

2019 [38] Ходжкина по данным ПЭТ-КТ рефрактерного течения

заболеваний

L.O. Moraesetal., 283пациента Дифференциальныйдиагнозхрони- Дереворешений Точностьмодели95%дляклас-

2019 [39] ческого лимфолейкоза и других сификации лимфом по данным

В-клеточных лимфом по результатам иммунофенотипирования проточной цитофлюориметрии

W. Ni et al., 2016 [40] 51 пациент Определение минимальной остаточной болезни у больных ОМЛ по данным проточной цитофлюориметрии Метод опорных векторов Точность модели соответствует точности при ручной интерпретации анализа

K. Fuse et al., 2019 [41] 217 пациентов Прогноз рецидива ОМЛ после трансплантации аллогенных ГСК Дерево решений Аис модели 75 % для прогноза рецидива заболевания

C. Goswami et al., 2019 [42] 347 пациентов Стратификация риска у больных множественной миеломой, получающих лечение с трансплантацией аутоло-гичных ГСК Дерево решений Модель стратификации с выделением критериев высокого риска

А. ^Иа е1 а1., 433 пациента Прогноз резистентности к терапии гипоме- Рекомендательный Улучшенная стратификация риска

2018 [26] тилирующими агентами у больных МДС алгоритм у больных МДС, получающих

по данным геномного секвенирования терапию гипометилирующими

нового поколения агентами

O. Gal et al., 2019 493 пациента Прогноз ответа на терапию у детей с ОМЛ Метод ближайшего AUC модели 84 % для прогноза

[43] соседа ответа на лечение

Аис — площадь под кривой; АА — апластическая анемия; ГСК — гемопоэтические стволовые клетки; МДС — миелодиспластический синдром; ОМЛ — острый миелоидный лейкоз; ПЭТ-КТ — совмещенная позитронно-эмиссионная и компьютерная томография; СНС — сверточная нейронная сеть.

геномном секвенировании нового поколения. Из-за большого объема информации и редких мутаций получаемая информация клинически малозначима, а сами данные слишком сложны для интерпретации и прогнозирования течения болезни у пациента. В качестве решения выступают рекомендательные системы (аналогичные тем, которые используются для формирования таргетированных рекламных предложений в Интернете). Так, в ряде исследований показана возможность прогноза ответа на лечение гипометилирую-щими агентами и леналидомидом у больных МДС с использованием большой панели генетических мутаций, что не поддается анализу стандартными методами статистики [37]. Модели МО помогают определить закономерности между найденными мутациями, клиническими характеристиками пациентов и ответом на лечение или рефрактерностью к нему.

Обзор основных исследований по применению МО в гематологии представлен в табл. 1.

ИИ помогает в открытии новых лекарственных средств. Модели глубокого обучения используются в прогнозировании, какие из химических молекул могут оказаться потенциально эффективными при раке in vitro. Такие исследования с применением компьютерного моделирования называются in silico. Задачи компьютерного дизайна лекарственных

средств нуждаются в больших вычислительных ресурсах и сложнейших методах анализа данных, тем не менее показывают многообещающие перспективы для более эффективного и быстрого открытия новых препаратов [44]. Многие методы лечения рака связаны с серьезными побочными эффектами, хотя они приносят пользу только определенной подгруппе пациентов. Следовательно, существует острая клиническая потребность в инструментах, которые позволят выбирать наиболее безопасную и эффективную терапию. Для решения данной проблемы технологии ИИ применяются в моделировании процесса лечения, что позволяет прогнозировать пользу от него для конкретного пациента. Идея заключается в том, что данные пациентов, получавших разное лечение, но имевших сходные генетические профили опухолей, используются для моделирования ответа на альтернативную терапию. Так, применение подобной технологии к наборам данных, полученных от больных множественной миеломой с известным генетическим профилем, получавших различные схемы лечения на основе бортезомиба и леналидомида, позволило выделить клинически значимые сигнатуры экспрессии генов, двукратно улучшить выживаемость без про-грессирования у 20 % пациентов на фоне бортезомиба и добиться трехкратного улучшения выживаемости

без прогрессирования у 31 % больных на фоне лена-лидомида по сравнению с группами исторического контроля [45].

Несмотря на заметное улучшение результатов лечения пациентов с некоторыми гематологическими злокачественными опухолями, нередко лейкозы и лимфомы по-прежнему остаются неизлечимыми. Новым подходом МО, который может помочь в решении данной проблемы, является обучение с подкреплением. Исследования в этой области основаны на большом количестве ретроспективных и проспективных данных, а алгоритмы строятся на переборе различных комбинаций последовательных стратегий и тактик лечения больных [46]. Например, целью может быть максимальное улучшение выживаемости пациентов, а ИИ необходимо подобрать алгоритм действий в виде различных схем терапии, чтобы достичь желаемого результата в зависимости от клинического профиля больного. Проблема такого подхода в большом числе факторов, меняющих клиническое течение болезни, что часто формирует множество всевозможных комбинаций стратегий, которые трудно проверить.

Методы МО используют для выявления предикторов неудачи применения новой терапевтической опции в ходе клинического исследования, что в перспективе формирует более четкий профиль пациента, способного эффективно ответить на данный вид лечения. Например, такой подход использовался при анализе данных клинического исследования KEYNOTE-183, в котором терапия по схеме помали-домид, дексаметазон и пембролизумаб не показала значимых преимуществ по сравнению с дуплетом по-малидомид и дексаметазон [47]. Применив технологии МО, исследователям удалось определить значимые факторы, которые негативно сказались на результатах новой терапии с включением пембролизумаба, например статус пациента по шкале ECOG [48].

ЗАКЛЮЧЕНИЕ

В заключение следует отметить, что разнообразие научно-практических задач в медицине в целом и в гематологии в частности, при решении которых целесообразно применять МО, достаточно велико. Стандартных методов статистического анализа для этого недостаточно. Современные реалии, связанные с циф-ровизацией общества, необходимость создания новых методов борьбы с онкологическими заболеваниями обусловливают актуальность и перспективность дальнейшей разработки, изучения и использования технологий ИИ.

КОНФЛИКТЫ ИНТЕРЕСОВ

Автор заявляет об отсутствии конфликтов интересов.

ИСТОЧНИКИ ФИНАНСИРОВАНИЯ

Исследование не имело спонсорской поддержки.

ЛИТЕРАТУРА/REFERENCES

1. Muhsen IN, Shyr D, Sung AD, Hashmi SK. Machine Learning Applications in the Diagnosis of Benign and Malignant Hematological Diseases. Clin Hematol Intern. 2021;3(1):13-20. doi: 10.2991/chi.k.201130.001.

2. Radakovich N, Nagy M, Nazha A. Machine learning in haematological malignancies. Lancet Haematol. 2020;7(7):e541-e550. doi: 10.1016/S2352-3026(20)30121-6.

3. Deo RC. Machine Learning in Medicine. Circulation. 2015;132(20):1920-30. doi: 10.1161/CIRCULATI0NAHA.115.001593.

4. Miotto R, Wang F, Wang S, et al. Deep learning for healthcare: review, opportunities and challenges. Brief Bioinform. 2018;19(6):1236-46. doi: 10.1093/ bib/bbx044.

5. Esteva A, Robicquet A, Ramsundar B, et al. A guide to deep learning in healthcare. Nat Med. 2019;25(1):24-9. doi: 10.1038/s41591-018-0316-z.

6. Komura D, Ishikawa S. Machine learning approaches for pathologic diagnosis. Virchows Arch. 2019;475(2):131-8. doi: 10.1007/s00428-019-02594-w.

7. Sha L, Osinski BL, Ho IY, et al. Multi-Field-of-View Deep Learning Model Predicts Nonsmall Cell Lung Cancer Programmed Death-Ligand 1 Status from Whole-Slide Hematoxylin and Eosin Images. J Pathol Inform. 2019;10(1):24. doi: 10.4103/jpi.jpi_24_19.

8. Abramoff MD, Lavin PT, Birch M, et al. Pivotal trial of an autonomous AI-based diagnostic system for detection of diabetic retinopathy in primary care offices. NPJ Digit Med. 2018;1(1):39. doi: 10.1038/s41746-018-0040-6.

9. Benjamens S, Dhunnoo P, Mesko B. The state of artificial intelligence-based FDA-approved medical devices and algorithms: an online database. NPJ Digit Med. 2020;3(1):118. doi: 10.1038/s41746-020-00324-0.

10. Shouval R, Fein JA, Savani B, et al. Machine learning and artificial intelligence in haematology. Br J Haematol. 2021;192(2):239-50. doi: 10.1111/bjh.16915.

11. Shahid AH, Singh MP. Computational intelligence techniques for medical diagnosis and prognosis: problems and current developments. Biocybern Biomed Eng. 2019;39(3):638-72. doi: 10.1016/j.bbe.2019.05.010.

12. Морозов С.П., Владзимирский А.В., Кляшторный В.Г. и др. Клинические испытания программного обеспечения на основе интеллектуальных технологий (лучевая диагностика). Лучшие практики лучевой и инструментальной диагностики. Препринт № ЦДТ-2019-1. М., 2019. 34 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[Morozov SP, Vladzimirskii AV, Klyashtornyi VG, et al. Clinical acceptance of software based on artificial intelligence technologies (radiology). Preprint No. CDT-2019-1. Luchshie praktiki luchevoi i instrumental'noi diagnostiki. (Best practices in medical imaging.) Moscow; 2019. 34 p. (In Russ)]

13. Shekelle PG, Shetty K, Newberry S, et al. Machine Learning Versus Standard Techniques for Updating Searches for Systematic Reviews: A Diagnostic Accuracy Study. Ann Intern Med. 2017;167(3):213-5. doi: 10.7326/L17-0124.

14. Kimura K, Tabe Y, Ai T, et al. A novel automated image analysis system using deep convolutional neural networks can assist to differentiate MDS and AA. Sci Rep. 2019;9(1):13385. doi: 10.1038/s41598-019-49942-z.

15. Wang Q, Bi S, Sun M, et al. Deep learning approach to peripheral leukocyte recognition. PLoS One. 2019;14(6):e0218808. doi: 10.1371/journal.pone.0218808.

16. Hegde RB, Prasad K, Hebbar H, Singh BMK. Comparison of traditional image processing and deep learning approaches for classification of white blood cells in peripheral blood smear images. Biocybern Biomed Eng. 2019;39(2):382-92. doi: 10.1016/j.bbe.2019.01.005.

17. Syrykh C, Abreu A, Amara N, et al. Accurate diagnosis of lymphoma on whole-slide histopathology images using deep learning. NPJ Digit Med. 2020;3(1):63. doi: 10.1038/s41746-020-0272-0.

18. Achi HE, Belousova T, Chen L, et al. Automated Diagnosis of Lymphoma with Digital Pathology Images Using Deep Learning. Ann Clin Lab Sci. 2019;49(2):153-60.

19. Sheng B, Zhou M, Hua M, et al. A blood cell dataset for lymphoma classification using faster R-CNN. Biotechnol Biotechnol Equip. 2020;34(1):413-20. doi: 10.1080/13102818.2020.1765871.

20. Xu L, Tetteh G, Lipkova J, et al. Automated Whole-Body Bone Lesion Detection for Multiple Myeloma on (68)Ga-Pentixafor PET/CT Imaging Using Deep Learning Methods. Contrast Media Mol Imaging. 2018;2018:1-11. doi: 10.1155/2018/2391925.

21. Martinez-Martinez F, Kybic J, Lambert L, Meckova Z. Fully automated classification of bone marrow infiltration in low-dose CT of patients with multiple myeloma based on probabilistic density model and supervised learning. Comput Biol Med. 2016;71:57-66. doi: 10.1016/j.compbiomed.2016.02.001.

22. Wang L, Zhao Z, Luo Y, et al. Classifying 2-year recurrence in patients with DLBCL using clinical variables with imbalanced data and machine learning methods. Comput Meth Program Biomed. 2020;196:105567. doi: 10.1016/j. cmpb.2020.105567.

23. Biccler JL, Eloranta S, de Nully Brown P, et al. Optimizing Outcome Prediction in Diffuse Large B-Cell Lymphoma by Use of Machine Learning and Nationwide Lymphoma Registries: A Nordic Lymphoma Group Study. JCO Clin Cancer Inform. 2018;2:1-13. doi: 10.1200/CCI.18.00025.

24. Guncar G, Kukar M, Notar M, et al. An application of machine learning to haematological diagnosis. Sci Rep. 2018;8(1):411. doi: 10.1038/s41598-017-18564-8.

25. Breiman L. Random forests. Machine Learning. 2001;45:5-32. doi: 10.1023/A:1010933404324.

26. Nazha A, Komrokji RS, Meggendorfer M, et al. A Personalized Prediction Model to Risk Stratify Patients with Myelodysplasie Syndromes. Blood. 2018;132(Suppl 1):793. doi: 10.1182/blood-2018-99-114774.

27. Hu SB, Wong DJ, Correa A, et al. Prediction of Clinical Deterioration in Hospitalized Adult Patients with Hematologic Malignancies Using a Neural Network Model. PLoS One. 2016;11(8):e0161401. doi: 10.1371/journal.pone.0161401.

28. Prochazka VK, Matustikova S, Furst T, et al. Bayesian Network Modelling As a New Tool in Predicting of the Early Progression of Disease in Follicular Lymphoma Patients. Blood. 2020;136(Suppl 1):20-1. doi: 10.1182/blood-2020-139830.

29. Mahmood N, Shahid S, Bakhshi T, et al. Identification of significant risks in pe-diatric acute lymphoblastic leukemia (ALL) through machine learning (ML) approach. Med Biol Eng Comput. 2020;58(11):2631-40. doi: 10.1007/s11517-020-02245-2.

30. Gandelman JS, Byrne MT, Mistry AM, et al. Machine learning reveals chronic graft-versus-host disease phenotypes and stratifies survival after stem cell transplant for hematologic malignancies. Haematologica. 2019;104(1):189-96. doi: 10.3324/haematol.2018.193441.

31. Chen D, Goyal G, Go RS, et al. Improved Interpretability of Machine Learning Model Using Unsupervised Clustering: Predicting Time to First Treatment in Chronic Lymphocytic Leukemia. JCO Clin Cancer Inform. 2019;3:1-11. doi: 10.1200/CCI.18.00137.

32. Coombes CE, Abrams ZB, Li S, et al. Unsupervised machine learning and prognostic factors of survival in chronic lymphocytic leukemia. J Am Med Inform Assoc. 2020;27(7):1019-27. doi: 10.1093/jamia/ocaa060.

33. Shah P, Kendall F, Khozin S, et al. Artificial intelligence and machine learning in clinical development: a translational perspective. NPJ Digit Med. 2019;2(1):69. doi: 10.1038/s41746-019-0148-3.

34. Shouval R, Labopin M, Bondi O, et al. Prediction of Allogeneic Hemato-poietic Stem-Cell Transplantation Mortality 100 Days After Transplantation Using a Machine Learning Algorithm: A European Group for Blood and Marrow Transplantation Acute Leukemia Working Party Retrospective Data Mining Study. J Clin Oncol. 2015;33(28):3144-51. doi: 10.1200/JCO.2014.59.1339.

35. Nazha A, Hu ZH, Wang T, et al. A Personalized Prediction Model for Outcomes after Allogeneic Hematopoietic Cell Transplant in Patients with Myel-odysplastic Syndromes. Biol Blood Marrow Transplant. 2020;26(11):2139-46. doi: 10.1016/j.bbmt.2020.08.003.

36. Bigorra L, Larriba I, Gutierrez-Gallego R. Machine learning algorithms for accurate differential diagnosis of lymphocytosis based on cell population data. Br J Haematol. 2019;184(6):1035-7. doi: 10.1111/bjh.15230.

37. Nazha A, Sekeres MA, Bejar R, et al. Genomic Biomarkers to Predict Resistance to Hypomethylating Agents in Patients with Myelodysplastic Syndromes Using Artificial Intelligence. JCO Precis Oncol. 2019;3:1-11. doi: 10.1200/po.19.00119.

38. Milgrom SA, Elhalawani H, Lee J, et al. A PET Radiomics Model to Predict Refractory Mediastinal Hodgkin Lymphoma. Sci Rep. 2019;9(1):1322. doi: 10.1038/ s41598-018-37197-z.

39. Moraes LO, Pedreira CE, Barrena S, et al. A decision-tree approach for the differential diagnosis of chronic lymphoid leukemias and peripheral B-cell lymphomas. Comput Meth Program Biomed. 2019;178:85-90. doi: 10.1016/j. cmpb.2019.06.014.

40. Ni W, Hu B, Zheng C, et al. Automated analysis of acute myeloid leukemia minimal residual disease using a support vector machine. Oncotarget. 2016;7(44):71915-21. doi: 10.18632/oncotarget.12430.

41. Fuse K, Uemura S, Tamura S, et al. Patient-based prediction algorithm of relapse after allo-HSCT for acute Leukemia and its usefulness in the decision-making process using a machine learning approach. Cancer Med. 2019;8(11):5058-67. doi: 10.1002/cam4.2401.

42. Goswami C, Poonia S, Kumar L, Sengupta D. Staging System to Predict the Risk of Relapse in Multiple Myeloma Patients Undergoing Autologous Stem Cell Transplantation. Front Oncol. 2019;9:633. doi: 10.3389/fonc.2019.00633.

43. Gal O, Auslander N, Fan Y, Meerzaman D. Predicting Complete Remission of Acute Myeloid Leukemia: Machine Learning Applied to Gene Expression. Cancer Inform. 2019;18:1-5. doi: 10.1177/1176935119835544.

44. Huang S, Yang J, Fong S, Zhao Q. Artificial intelligence in cancer diagnosis and prognosis: Opportunities and challenges. Cancer Lett. 2020;471:61-71. doi: 10.1016/j.canlet.2019.12.007.

45. Ubels J, Sonneveld P, van Beers EH, et al. Predicting treatment benefit in multiple myeloma through simulation of alternative treatment effects. Nat Commun. 2018;9(1):2943. doi: 10.1038/s41467-018-05348-5.

46. Shain KH, Hart D, Silva AS, et al. Reinforcement Learning to Optimize the Treatment of Multiple Myeloma. Blood. 2019;134(Suppl_1):5511. doi: 10.1182/blood-2019-132234.

47. Mateos MV, Blacklock H, Schjesvold F, et al. Pembrolizumab plus pomalidomide and dexamethasone for patients with relapsed or refractory multiple myeloma (KEYNOTE-183): a randomised, open-label, phase 3 trial. Lancet Haematol. 2019;6(9):e459-e469. doi: 10.1016/S2352-3026(19)30110-3.

48. Liao JJZ, Farooqui MZH, Marinello P, et al. Using artificial intelligence tools in answering important clinical questions: The KEYNOTE-183 multiple myeloma experience. Contemp Clin Trials. 2020;99:106179. doi: 10.1016/j.cct.2020.106179.

49. Третье мнение. AI для клинической лабораторной диагностики (электронный документ). Доступно по: https://thirdopinion.ai/ru#rec354556522. Ссылка активна на 06.10.2021.

[Third Opinion. AI for clinical laboratory diagnostics (Internet). Available from: https://thirdopinion.ai/ru#rec354556522 (accessed 06.10.2021). (In Russ)]

i Надоели баннеры? Вы всегда можете отключить рекламу.