Научная статья на тему 'ЭФФЕКТИВНОСТЬ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ: СПОСОБЫ И РЕЗУЛЬТАТЫ ОЦЕНКИ'

ЭФФЕКТИВНОСТЬ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ: СПОСОБЫ И РЕЗУЛЬТАТЫ ОЦЕНКИ Текст научной статьи по специальности «Науки о здоровье»

CC BY
307
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ / КЛИНИЧЕСКИЕ ИССЛЕДОВАНИЯ / ЭФФЕКТИВНОСТЬ / БЕЗОПАСНОСТЬ / КАЧЕСТВО ДОКАЗАТЕЛЬСТВ / ИСТИННЫЕ ИСХОДЫ / СУРРОГАТНЫЕ ИСХОДЫ / CLINICAL DECISION SUPPORT SYSTEM / CLINICAL TRIALS / EFFICACY / SAFETY / EFFECTIVENESS / EVIDENCE QUALITY / CLINICAL ENDPOINT / SURROGATE ENDPOINT

Аннотация научной статьи по наукам о здоровье, автор научной работы — Реброва Ольга Юрьевна

Система поддержки принятия врачебных решений (СППВР) - это информационная медицинская технология, проходящая свой жизненный цикл. Оценка ее эффективности и безопасности должна осуществляться на разных его этапах - разработки, клинических исследований, государственной регистрации, клинико-экономического анализа, оценки медицинских технологий. К настоящему времени эффективность и безопасность СППВР варьирует и является неоднозначной - есть как успехи, так и неудачи. Выполнены сотни клинических исследований, более сотни их систематических обзоров. При оценке эффективности и безопасности СППВР обычно оценивают два типа исходов: показатели медицинской помощи (объем, время, затраты и т.д.), исходы пациентов (суррогатные и истинные). Наблюдаемое некоторое увеличение приверженности врачей к клиническим рекомендациям в результате их включения в СППВР приводило к незначительному влиянию на суррогатные исходы, а влияние на клинически значимые исходы пациентов полностью отсутствует. При этом слабое повышение риска в отношении исходов пациентов обнаружено только в единичных исследованиях. Методологическое качество доказательной базы пока является весьма низким. В связи с этим к этапу лицензирования пока подошли немногочисленные продукты на основе искусственного интеллекта. Область СППВР является развивающейся, но пока недостаточно изученной, и впереди длинный путь до настоящих успехов. Существует большой разрыв между постулируемыми и эмпирически продемонстрированными преимуществами СППВР.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о здоровье , автор научной работы — Реброва Ольга Юрьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

EFFICACY OF CLINICAL DECISION SUPPORT SYSTEMS: METHODS AND ESTIMATES

Clinical decision support (CDS) systems are the medical technologies that go through their life cycle. Evaluation of effectiveness and safety should be carried out at its various stages - at the development, in clinical trials, licensing, clinical and economic analysis, health technologies assessment. To date, the effectiveness and safety of CDS systems vary and are ambiguous - there are both successes and failures. Hundreds of clinical trials are carried out, and more than a hundred of systematic reviews are published. When evaluating the efficacy and safety of CDS systems, two types of outcomes are usually estimated: indicators of medical care (volume, time, costs, etc.), and patient outcomes (clinical and surrogate). A slight increase in physicians’ adherence to clinical guidelines has been observed, but it had very small influence on surrogate outcomes, and there is no effect on clinical patient outcomes. A slight increase in risk with respect to patient outcomes was found in only a few studies. However, the methodological quality of the evidence is very low. In this regard, a few products based on artificial intelligence have so far approached the licensing phase. The field of CDS systems is developing, but not yet sufficiently studied, and there is a long way to real successes ahead. Meanwhile, there is a wide gap between the postulated and empirically demonstrated benefits of CDS systems.

Текст научной работы на тему «ЭФФЕКТИВНОСТЬ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ ВРАЧЕБНЫХ РЕШЕНИЙ: СПОСОБЫ И РЕЗУЛЬТАТЫ ОЦЕНКИ»

Научный обзор | Review

Эффективность систем поддержки принятия врачебных решений: способы и результаты оценки ® О.Ю. Реброва

Национальный медицинский исследовательский центр эндокринологии, Москва, Россия

Российский национальный исследовательский медицинский университет им. Н.И. Пирогова, Москва, Россия

Система поддержки принятия врачебных решений (СППВР) — это информационная медицинская технология, проходящая свой жизненный цикл. Оценка ее эффективности и безопасности должна осуществляться на разных его этапах — разработки, клинических исследований, государственной регистрации, клинико-экономического анализа, оценки медицинских технологий. К настоящему времени эффективность и безопасность СППВР варьирует и является неоднозначной — есть как успехи, так и неудачи. Выполнены сотни клинических исследований, более сотни их систематических обзоров. При оценке эффективности и безопасности СППВР обычно оценивают два типа исходов: показатели медицинской помощи (объем, время, затраты и т.д.), исходы пациентов (суррогатные и истинные). Наблюдаемое некоторое увеличение приверженности врачей к клиническим рекомендациям в результате их включения в СППВР приводило к незначительному влиянию на суррогатные исходы, а влияние на клинически значимые исходы пациентов полностью отсутствует. При этом слабое повышение риска в отношении исходов пациентов обнаружено только в единичных исследованиях. Методологическое качество доказательной базы пока является весьма низким. В связи с этим к этапу лицензирования пока подошли немногочисленные продукты на основе искусственного интеллекта. Область СППВР является развивающейся, но пока недостаточно изученной, и впереди длинный путь до настоящих успехов. Существует большой разрыв между постулируемыми и эмпирически продемонстрированными преимуществами СППВР. Ключевые слова: системы поддержки принятия врачебных решений, клинические исследования, эффективность, безопасность, качество доказательств, истинные исходы, суррогатные исходы.

Efficacy of clinical decision support systems: methods and estimates © Olga Yu. Rebrova

Endocrinology Research Centre, Moscow, Russia

Pirogov Russian National Research Medical University, Moscow, Russia

Clinical decision support (CDS) systems are the medical technologies that go through their life cycle. Evaluation of effectiveness and safety should be carried out at its various stages — at the development, in clinical trials, licensing, clinical and economic analysis, health technologies assessment. To date, the effectiveness and safety of CDS systems vary and are ambiguous — there are both successes and failures. Hundreds of clinical trials are carried out, and more than a hundred of systematic reviews are published. When evaluating the efficacy and safety of CDS systems, two types of outcomes are usually estimated: indicators of medical care (volume, time, costs, etc.), and patient outcomes (clinical and surrogate). A slight increase in physicians' adherence to clinical guidelines has been observed, but it had very small influence on surrogate outcomes, and there is no effect on clinical patient outcomes. A slight increase in risk with respect to patient outcomes was found in only a few studies. However, the methodological quality of the evidence is very low. In this regard, a few products based on artificial intelligence have so far approached the licensing phase. The field of CDS systems is developing, but not yet sufficiently studied, and there is a long way to real successes ahead. Meanwhile, there is a wide gap between the postulated and empirically demonstrated benefits of CDS systems.

Key words: clinical decision support system, clinical trials, efficacy, safety, effectiveness, evidence quality, clinical endpoint, surrogate endpoint.

Классификация СППВР

Система поддержки принятия врачебных решений (СППВР) — это программное обеспечение компьютерных систем, позволяющее путем сбора и анализа информации влиять на принятие врачом решения при обследовании пациента, диагностике,

Статья может быть использована на условиях 148 международной лицензии CC BY-NC-ND 4.0.

The article can be used under the CC BY-NC-ND 4.0 license.

назначении лечения с целью снижения ошибок и повышения качества оказываемой медицинской помощи [1].

Различными исследователями и разработчиками определения СППВР и их типы даются несколько по-разному, однако нам кажется целесообразной следующая их классификация (см. врезку).

Классификация СППВР

1. Информационно-справочные СППВР [1]:

— справочно-библиотечные системы;

— электронные медицинские карты;

— интегральный анамнез;

— автоматизация врачебных назначений;

— автоматический контроль требований нормативно-правовых актов;

— автоматический контроль "клинического минимума";

— автоматическая поддержка клинических руководств;

— автоматический контроль критериев качества медицинской помощи.

2. Интеллектуальные СППВР (системы, имитирующие

или моделирующие рассуждения врача, иСППВР):

2.1. Системы, имитирующие рассуждения врача (вычислительные системы):

2.1.1. Модели, построенные с применением методов многомерной математической статистики, нейронных сетей (обычно слабо интерпретируемые, для пользователя-врача выглядят как "черный ящик").

2.1.2. Модели, построенные с применением методов математической логики (обычно хорошо интерпретируемые). Пример: модели, построенные с использованием деревьев решений, ДСМ-метода, логико-статистического подхода.

2.2. Системы, моделирующие рассуждения врача (экспертные системы; системы, построенные на знаниях). Разрабатываются модели знаний, извлеченных из различных источников (главным образом, текстов и экспертов).

3. Гибридные системы — сочетающие информационно-

справочные и интеллектуальные компоненты.

Оценка эффективности СППВР на разных этапах их жизненного цикла

Поскольку в настоящее время многие врачи стараются практиковать в соответствии с концепцией доказательной медицины (ДМ), СППВР рассматривается ими как любая другая медицинская технология (МТ), которая потенциально влияет на состояние больного и которая, соответственно, должна иметь научное обоснование своей эффективности и безопасности. Конечно, степень влияния СППВР на решение врача требует специального изучения, но в дальнейшем мы будем исходить из предположения ее максимального влияния на решение врача. Это позволит рассматривать СППВР в контексте необходимости максимизации ее эффективности и безопасности.

Рассмотрим кратко основные этапы жизненного цикла МТ в применении к СППВР, прежде всего интеллектуальным, и способы оценки эффективности таких систем на разных его этапах. Более полное рассмотрение жизненного цикла СППВР приведено в [2].

I. Разработка и производство

1. Постановка задачи совместно с врачами (в зарубежных документах этому этапу примерно соответствует процесс установки валидных клинических ассоциаций [13]). Необходимо определить, какие именно решения предполагается "поддерживать" и почему это актуально. Инициативное моделирование, которое особенно свойственно "чистым" математикам и инженерам-неофитам в медицине, получающим в руки "большие данные", без согласования постановки задачи с врачами, как мы полагаем, обречено на неудачу.

Для того чтобы оценить новизну и актуальность решаемой задачи, необходимо выполнить систематический обзор — поиск всех имеющихся решений в данной проблемной области. Например, если разрабатывается система диагностики, должны быть изучены все имеющиеся способы диагностики, сопоставлены их операционные характеристики (чувствительность, специфичность, прогностические ценности) с учетом преваленса изучаемых состояний в целевой популяции.

В соответствии с концепцией ДМ на этапе постановки задачи должны быть определены целевая популяция, способ контроля и оцениваемый исход. При определении целевой популяции важно также учитывать условия оказания медицинской помощи будущей СППВР — скорая помощь, поликлиника, диспансер, больница, научный центр и т.п. Очевидно, что популяции систематически отличаются в зависимости от места оказания врачебной помощи. Например, преваленс идентифицируемого состояния при скрининге является низким, при клинической диагностике — высоким.

Контролем в задачах диагностики следует выбрать "золотой стандарт" — наиболее точный из имеющихся способов идентификации, который следует использовать как верифицирующий изучаемые состояния. В задачах прогнозирования таким контрольным идентификатором выступает собственно прогнозируемое событие, которое должно определяться по заранее сформулированным критериям. В задачах поиска подгрупп пациентов контрольная идентификация не требуется (применяется машинное обучение "без учителя").

Оцениваемый исход (состояние, нозология) в задачах диагностики и прогнозирования должен быть

определен на основании принятых критериев диагностики, чтобы верификация выполнялась надежно. Негативный пример: разрабатывается система анализа медицинских изображений для выявления патологических образований. Системе удалось выявить дополнительные (по отношению к результатам врача) случаи, которые были расценены врачами как вероятно позитивные, что представляется разработчиками как успех системы. На самом деле верификация пока не выполнена, и нельзя исключить, что вновь выявленные случаи являются ложноположительными.

Важнейшим компонентом этапа постановки задачи является согласование с врачами подхода к разработке иСППВР — имитирующего или моделирующего. Большинство имитирующих моделей неинтерпретируемы и часто поэтому заведомо неприемлемы для врачей. Этим недостатком не обладают моделирующие рассуждения экспертные системы и построенные на логических подходах имитирующие модели.

Далее необходимо определить способ сбора данных. Заметим, что для моделирующих иСППВР, основанных на знаниях, данные не нужны. При сборе данных важно сформировать несмещенную (репрезентативную) выборку из целевой популяции. В идеале желательно организовывать многоцентровое исследование, с тем чтобы данные были репрезентативны по отношению не к одному источнику (медицинской организации), а к нескольким организациям одного уровня медицинской помощи.

При разработке диагностических систем очень важно предусмотреть сбор позитивных и негативных случаев из общей целевой популяции, с учетом фактического преваленса идентифицируемого состояния. Частой ошибкой, приводящей к систематическому смещению результатов, является набор позитивных случаев из клиники, а негативных — из контрольной группы здоровых лиц. При разработке систем прогнозирования обязательна синхронизация когорты пациентов (клинические случаи должны быть наблюдаемы с одного и того же момента в истории заболевания, например, с момента постановки диагноза, с момента выполнения хирургической операции). В случае поиска подгрупп пациентов также важно понимать происхождение данных и их репрезентативность. Если используются данные ранее выполненного клинического или популяционного исследования, то известны критерии включения и исключения пациентов. Если же используется просто цифровой архив медицинской организации, то качество этих данных будет заведомо спорным и зависящим от характеристик этой конкретной организации.

Для любой разработки, использующей данные, методы получения данных должны быть гармонизи-

рованы или синхронизированы. Например, лабораторные тесты должны быть выполнены одинаковыми лабораторными методами, используемые клинические шкалы и опросники должны быть валидизи-рованными, томографы — иметь близкие технические характеристики. Следует обратить внимание и на возможность исторического смещения в данных — изменения критериев оценки состояний, способов диагностики и т.п.

2. Построение "решателя" с использованием различных методов машинного обучения ("с учителем" или "без учителя"), методов извлечения и представления экспертных знаний. Любая модель имеет смысл, если она с приемлемым качеством описывает реальность. К основным метрикам качества моделей относятся статистически значимая сопряженность результатов применения модели и "золотого стандарта", оценки чувствительности и специфичности и их доверительных интервалов (ДИ), оценки прогностической ценности положительного и отрицательного результата (ПЦПР и ПЦОР) и их ДИ (99%, 95%). В случае если выборка репрезентативна по отношению к целевой популяции в отношении пре-валенса (так происходит обычно при использовании сплошного или случайного метода формирования выборки), поправка на преваленс не нужна. Однако если в исследование отдельно набирались позитивные и негативные случаи, она необходима. Прогностические ценности крайне важны, так как именно с ними работает врач, оценивая результат конкретного больного с учетом вероятности гипер-и гиподиагностики. В некоторых случаях для выбора оптимальной отрезной точки необходимым бывает проведение ЯОС-анализа. О том, какие значения эффективности можно считать успехом разработки, единого мнения не существует. Обычно полагают, что модель приемлема, если ее точность равна или превышает 85%. По нашему мнению, модель хороша, если ДИ для любой из оценок эффективности лежит в диапазоне 85—100%. При этом очевидно, что если любой ДИ включает 50%, то модель вовсе неработоспособна и проще бросать монетку.

3. Аналитическая (техническая) валидизация полученной модели. Может выполняться с использованием кросс-валидации, скользящего экзамена, независимой тестовой выборки (при построении экспертных систем обучающая выборка не нужна, но тестовая обязательна). Поскольку известно, что многие модели, полученные в результате применения машинного обучения, являются переобученными (то есть настроенными на конкретные данные, использованные при обучении), то может применяться и анализ чувствительности к данным.

4. Программная реализация модели возможна в форме модуля локальных информационных систем, облачного сервиса, отдельного программного продукта (веб-приложения, мобильного приложения). Важно, чтобы в интерфейсе пользователю-врачу предоставлялись решающие правила на естественном языке, а также — обязательно — значения операционных характеристик модели. В качестве последних предпочтительны прогностические ценности — показатели, с которыми работает врач, показывающие степень уверенности системы в выдаваемом заключении, и диапазоны их неопределенности (ДИ).

5. Публикация результатов не менее чем в двух профильных рецензируемых научных журналах — в журнале в соответствии с рассматриваемой медицинской проблемой и в журнале по медицинской информатике (например, в журнале "Врач и информационные технологии"). Как и всегда, желательно выбирать наиболее высокоимпактные профильные журналы, как международные, так и российские. На этом этап разработки и производства может считаться законченным, однако успешная разработка диагностических и прогностических систем лишь означает, что разработанный на основе модели программный продукт работает правильно, однако ценность такой системы на данном этапе неизвестна.

II. Клинические исследования (клиническая валидация)

С позиций доказательной медицины независимо от актуального порядка регистрации программного обеспечения (ПО) в национальной юрисдикции за производством МТ должны последовать клинические испытания СППВР. Они необходимы для создания доказательной базы данной МТ. Именно ей могут (или не могут, если испытания проведены плохо) доверять врачи, практикующие ДМ.

В испытаниях диагностических СППВР необходимо оценить не правильность работы системы (что должно было быть ранее оценено при разработке и аналитической валидации), а ее эффективность и безопасность в сравнении с рутинно используемым методом. При этом проверке может быть подвергнута одна из гипотез:

♦ гипотеза превосходства по эффективности, безопасности — при предполагаемой замене старой МТ на СППВР либо при использовании СППВР в дополнение (параллельно или последовательно) к старому способу диагностики;

♦ гипотеза не меньшей эффективности (или эквивалентности) по эффективности, безопасности — при планировании замены инвазивного, дорогого или другого недостаточно хорошего диагностического теста на СППВР.

Для прогностических систем цель испытаний — это обычно доказательство преимущества персонализированного ведения пациента над рутинным (стандартным) ведением на основе оценки рисков исходов. Часто рутинная практика представляет собой отдельную МТ, совокупность МТ или даже отсутствие какой-либо МТ. До проведения испытания врачами на основе полученных при разработке системы решающих правил должна быть сформулирована персонализированная тактика ведения пациентов, которая и будет представлять собой испытываемое вмешательство.

Итак, клинические испытания должны закончиться оценкой эффективности и безопасности СППВР относительно выбранного компаратора, публикации должны появиться в профильных научных изданиях.

III. Государственная регистрация

В соответствии с Основами законодательства Российской Федерации об охране здоровья граждан (статья 43) в практике здравоохранения можно использовать только разрешенные к применению методы профилактики, диагностики, лечения, скрининга. СППВР, будучи ПО, в соответствии с действующими регуляторными нормами в РФ рассматриваются как медицинские изделия. В письме Росздавнадзора от 13.02.2020 [3] раскрыта текущая позиция ведомства относительно критериев отнесения ПО к медицинским изделиям.

IV. Оценка клинико-экономической эффективности

Клинико-экономический анализ (КЭА) выполняется обычно со следующими целями:

♦ для включения клинико-экономического обоснования МТ в клинические рекомендации;

♦ для включения МТ в ограничительные перечни МТ, гарантированно закупаемых государством либо иным плательщиком.

КЭА основан на результатах сравнительных клинических исследований. В нем учитываются следующие виды затрат: прямые медицинские (постоянные, переменные), прямые немедицинские, непрямые, нематериальные. КЭА всегда выполняется на национальном уровне в связи со специфичностью расчета затрат в каждой стране.

V. Оценка медицинских технологий и дальнейшее продвижение

Комплексная экспертиза — оценка медицинских технологий (ОМТ) — включает (но может не ограничиваться) рассмотрение как научных обоснований эффективности и безопасности технологий, полу-

ченных в клинических исследованиях, так и результатов КЭА, а также дополнительных аспектов применения МТ — юридических, психологических, социальных и т.д. В РФ ОМТ выполняется пока только для лекарственных препаратов при формировании Перечня ЖНВЛП, однако в перспективе она должна охватить все типы вмешательств, финансируемых государством. При успешных результатах ОМТ можно рассчитывать на включение СППВР в клинические рекомендации и финансирование их закупок государством или иными плательщиками (ведомствами, страховыми компаниями и др.).

Современное состояние эффективности и безопасности СППВР

Как следует из описанного выше жизненного цикла, за разработкой и производством СППВР должны следовать их клинические испытания или исследования. В них для оценки эффективности и безопасности СППВР оценивают два типа исходов:

♦ показатели медицинской помощи (объем, время, затраты и т.д.);

♦ исходы пациентов (суррогатные и истинные).

К настоящему моменту уже проведены сотни

исследований и выполнены десятки систематических обзоров (СО), однако большинство СО не позволяют сделать какой-либо определенный вывод об эффективности таких систем. Рассмотрим такие обзоры подробнее.

Для подведения итогов оценки эффективности и влияния различных технологий электронного здравоохранения на качество и безопасность медицинской помощи до 2010 г. имеет смысл рассмотреть зонтичный СО [4]. Он включил 53 систематических обзора, опубликованных в период между 1997 и 2010 гг. В целом вся систематическая обзорная литература была признана низкокачественной в отношении методологии, изложения и полезности — средний балл качества публикаций составил 18 из 30 возможных, и только 3 исследования из 53 (6%) находились в верхнем квартиле баллов качества. Авторы обзора анализировали отдельно несколько групп техно-логий.

Для систем хранения и передачи данных (включая госпитальные информационные системы) по безопасности данных, их точности, полноте, вторичному использованию не было обнаружено хотя бы умеренной пользы ни в одном из 11 СО, по доступности данных — только в одном из СО. В то же время безопасность была также скорее нейтральной — лишь в одном обзоре обнаружена умеренная угроза безопасности данных.

Аналогична ситуация с системами РЛСБ — не показано даже умеренное увеличение целостности данных, качества изображений, доступа к ним, экономии времени, точности диагностики. Повышение рисков (потери изображений, увеличение времени и затрат) при этом тоже отсутствует.

Системы автоматизации назначений лабораторных и инструментальных исследований оценивались в 8 СО по следующим показателям: использование ресурсов, состав медицинской помощи, экономия времени, экономия финансовых затрат, исходы пациентов. Ни по одному из показателей не было обнаружено хотя бы умеренного влияния. При этом в одном обзоре был обнаружен умеренный риск увеличения затрат времени и в другом — умеренный риск задержек.

Электронные лекарственные назначения оценивались в 28 СО. Умеренный эффект показан лишь в 10% СО по суррогатным исходам, в 35% СО по безопасности назначений. По остальным показателям (соблюдение клинических рекомендаций, упрощение коммуникации, истинные исходы, экономия ресурсов, экономия времени) эффекты отсутствовали или были слабыми. При этом безопасность таких систем была приемлемой — отсутствовал вред для пациентов. Одновременно обнаружено незначительное увеличение затрат времени и ресурсов.

Для СППВР влияние на показатели эффективности в 18 СО было следующим (рисунок). Влияние на состав медицинской помощи включало увеличение профилактической помощи, назначение специфических для заболевания исследований или анализов, усиление контроля побочных эффектов, снижение избыточных вмешательств. Наблюдаемое некоторое увеличение приверженности врачей к клиническим рекомендациям приводило к незначительному влиянию на суррогатные исходы (обнаружено в 22% СО), а влияние на клинически значимые исходы пациентов полностью отсутствовало. При этом слабое повышение риска в отношении исходов пациентов обнаружено только в 1 из 17 исследований, снижение производительности труда врача — в 1 из 8 исследований.

Авторы обзора делают следующий неутешительный вывод: существует большой разрыв между постулируемыми и эмпирически продемонстрированными преимуществами технологий электронного здравоохранения. Кроме того, отсутствуют надежные исследования рисков внедрения этих технологий и их экономической эффективности. В свете недостатка доказательств в отношении улучшения результатов лечения пациентов, а также отсутствия доказательств их экономической эффективности жизненно важно, чтобы будущие технологии электронного

100 90 80 70 60 50 40 30 20 10

Состав Соблюдение Суррогатные Истинные

медицинской клинических исходы исходы

помощи рекомендаций

Умеренное

|_| Незначительное

Слабое влияние ] Нет влияния ] Не оценивалось

Рисунок. Степени влияния СППВР на показатели медицинской помощи и исходы пациентов (по данным [4]).

здравоохранения оценивались по комплексному набору показателей, в идеале — на всех этапах жизненного цикла технологии.

За последние 10 лет также опубликовано более 60 СО, посвященных СППВР в различных медицинских областях.

Несколько следующих описываемых СО посвящены анализу оригинальных исследований. Так, СО [5] включил 148 рандомизированных контролируемых испытаний (РКИ). В 128 (86%) из них оценивали показатели медицинской помощи, в 29 (20%) — клинические исходы. СППВР улучшали оказание профилактических услуг (отношение шансов (ОШ) 1,42, 95% ДИ [1,27; 1,58]), назначение диагностических исследований (ОШ 1,72, 95% ДИ [1,47; 2,00]) и назначение лекарственной терапии (ОШ 1,57, 95% ДИ [1,35; 1,82]). Из клинических исходов выявлено только небольшое снижение заболеваемости (ОР 0,88, 95% ДИ [0,80; 0,96]), по другим оцененным клиническим исходам (летальность, качество жизни, нежелательные явления) эффекты не обнаружены.

В обзоре [6] также показано некоторое улучшение первичной и вторичной профилактики в результате применения СППВР: по результатам 28 РКИ выявлен сниженный относительный риск новых случаев острых заболеваний (инфаркт миокарда, острое нарушение мозгового кровообращения, пневмония и др.) (ОР 0,82; 95% ДИ [0,68; 0,99]).

Полезность СППВР на основе встраивания клинических рекомендаций для профилактики несколь-

ких состояний показана и в систематическом обзоре [7], однако в него включены неконтролируемые (оценка "до—после") и нерандомизированные исследования, следовательно, полученные доказательства имеют низкий уровень достоверности.

Что касается интеллектуальных СППВР, то таких исследований пока меньше, однако уже выполнены несколько СО.

В СО [8] изучены 39 исследований СППВР по ведению острой и хронической боли, основанных на искусственных нейронных сетях (ИНС), статистических методах машинного обучения, деревьях решений, логических методах и др. Хотя получены отдельные отличные результаты (в основном с использованием ИНС), в целом качество таких систем пока нельзя считать хорошим.

СО [9] включает 10 исследований разных дизайнов, оценивавших способы выявления пациентов с риском увеличения интервала QT с применением методов предиктивной аналитики, и какой-либо определенный вывод сделан не был.

Тридцать исследований разных дизайнов, включенные в СО [10], обобщены с целью оценки качества диагностики рассеянного склероза с использованием систем на основе нечеткой логики, ИНС, формализации правил и других методов. Наилучшие результаты получены с использованием ИНС — чувствительность составила 97%, точность — 99%.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Базирующиеся на вычислениях, имитирующих рассуждения, интеллектуальные СППВР изучались

в СО [11]. Обнаружено лишь 5 РКИ, опубликованных в период 2013—2018 гг. В трех РКИ влияние на исходы пациентов не выявлено, в двух — обнаружено, однако доказательства имели низкое методологическое качество.

В СО [12] анализировались моделирующие рассуждения (основанные на знаниях) СППВР. На основании анализа 38 публикаций сделан вывод о пока низкой распространенности таких систем и необходимости выполнения качественных исследований.

Что касается искусственного интеллекта в области анализа медицинских изображений, то преимущество алгоритмов, построенных на глубоком машинном обучении, над врачебными оценками отсутствует, этот вывод сделан по результатам метаанализа, включившего 82 исследования [13].

Таким образом, сплошных успехов интеллектуальных СППВР тоже пока не наблюдается, а качество имеющихся доказательств низкое.

Отдельно следует упомянуть о безопасности таких систем в связи с недавним судебным случаем компании "Practice Fusion" (США) [14]. Компания получала вознаграждение от фармацевтической компании "Purdue Pharma" в обмен на внедрение специальной всплывающей подсказки в разработанную программу для ведения электронных медицинских карт. Подсказка подводила врачей к клиническим действиям, результатом которых стало непропорционально высокое количество выписанных рецептов на опиоидный препарат пролонгированного действия OxyContin. С 2016 по 2019 г., когда преступный сговор программистов и фармацевтов попал в поле зрения органов правопорядка, модуль поддержки клинического решения "Practice Fusion" всплывал на компьютерах лечащих врачей 230 млн раз.

Итак, до настоящего времени не получены убедительные доказательства эффективности и безопасности СППВР в отношении не только клинических, но и суррогатных исходов пациентов, а также потребления ресурсов здравоохранения. В СО [15] оценены факторы успеха СППВР. Шансы на успех оказались выше для систем, которые требовали от врачей указывать причины, по которым они отказывались от рекомендаций, чем для систем, которые этого не делали. Успех был также более вероятен для систем, которые одновременно давали советы пациентам и практикующим врачам. Наконец, успех чаще выявлялся в исследованиях собственных разработок, чем разработок третьих лиц.

Заключение

К настоящему времени эффективность и безопасность СППВР варьирует и является неоднозначной — есть как успехи, так и неудачи. В связи с этим

к следующим этапам — государственной регистрации, клинико-экономическому анализу и оценке медицинских технологий — пока подошли немногочисленные продукты на основе искусственного интеллекта. Американское агентство FDA пока зарегистрировало лишь единичные продукты, а отечественных зарегистрированных СППВР пока нет [16]. Таким образом, область СППВР является развивающейся, но пока недостаточно изученной, и впереди длинный путь до настоящих успехов.

Дополнительная информация

Конфликт интересов. Автор декларирует отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

Список литературы [References]

1. Гусев А.В., Зарубина Т.В. Поддержка принятия врачебных решений в медицинских информационных системах медицинской организации // Врач и информационные технологии. 2017. №2. С. 60-72. [Gusev A.V., Zarubina T.V. Clinical Decisions Support in medical information systems of a medical organization // Vrach i infomacionnye tehnologii. 2017;(2):60-72. (In Russ.)]

2. Реброва О.Ю. Жизненный цикл систем поддержки принятия врачебных решений как медицинских технологий // Врач и информационные технологии. 2020. №1. С. 27-37. [Rebrova O.Yu. Life cycle of decision support systems as medical technologies // Vrach i infomacionnye tehnologii. 2020;(1): 27-37. (In Russ.)]

3. Письмо Росздравнадзора "О программном обеспечении" от 13.02.2020. [Pis'mo Roszdravnadzora "Oprogrammnom obespeche-nii" ot 13.02.2020. (In Russ.)] https://www.roszdravnadzor.ru/i/ upload/images/ 2020/2/14/1581670651.93473-1-10822.pdf

4. Black AD, Car J, Pagliari C, et al. The impact of eHealth on the quality and safety of health care: a systematic overview. PLoS Med. 2011;8(1):e1000387. https://doi.org/10.1371/journal.pmed.1000387.

5. Bright TJ, Wong A, Dhurjati R, et al. Effect of clinical decision-support systems. A systematic review. Ann Intern Med. 2012;157:29-43. doi: 10.7326/0003-4819-157-1-201207030-00450.

6. Moja L, Kwag KH, Lytras T, et al. Effectiveness of computerized decision support systems linked to electronic health records: a systematic review and meta-analysis. Am J Public Health. 2014; 104(12):e12-e22. https://doi.org/10.2105/AJPH.2014.302164.

7. Varghese J, Kleine M, Gessner SDI, et al. Effects of computerized decision support system implementations on patient outcomes in inpatient care: a systematic review. J Am Med Inform Assoc. 2018;25(5):593-602. https://doi.org/10.1093/jamia/ocx100.

8. Pombo N, Araujo P, Viana J. Knowledge discovery in clinical decision support systems for pain management: a systematic review. Artif IntellMed. 2014;60(1):1-11. https://doi.org/10.1016Xj.artmed.2013.11.005.

9. Tomaselli Muensterman E, Tisdale JE. Predictive analytics for identification of patients at risk for QT interval prolongation: a systematic review. Pharmacotherapy. 2018;38(8):813-821. https://doi.org/10.1002/phar.2146.

10. Arani LA, Hosseini A, Asadi F, et al. Intelligent computer systems for multiple sclerosis diagnosis: a systematic review of reasoning techniques and methods. Acta Inform Med. 2018;26(4):258-264. https://doi.org/10.5455/aim.2018.26.258-264.

11. Cresswell K, Callaghan M, Khan S, et al. Investigating the use of data-driven artificial intelligence in computerised decision support systems for health and social care: a systematic review. Health Informatics J. 1460458219900452, 2020 Jan 22 [Online ahead of print]

12. Dissanayake PI, Colicchio TK, Cimino JJ. Using clinical reasoning ontologies to make smarter clinical decision support systems: a systematic review and data synthesis. J Am Med Inform Assoc. 2020;27(1):159-174. https://doi.org/10.1093/jamia/ocz169.

13. Liu X, Faes L, Kale AU, et al. A comparison of deep learning performance against health-care professionals in detecting diseases from medical imaging: a systematic review and meta-analysis. The Lancet Digital Health. 2019;1(6):e271-e297. https://doi.org/10.1016/S2589-7500(19)30123-2.

14. Electronic health records vendor to pay largest criminal fine in Vermont history and a total of $145 million to resolve criminal and civil investigations. Department of Justice, U.S. Attorney's Office, District of Vermont // https://www.justice.gov/usao-vt/pr/elec-tronic-health-records-vendor-pay-largest-criminal-fine-vermont-history-and-total-145.

15. Roshanov PS, Fernandes N, Wilczynski JM, et al. Features of effective computerised clinical decision support systems: metaregression of 162 randomised trials. BMJ. 346, f657, 2013 Feb 14. https://doi.org/10.1136/bmj.f657.

16. Государственный реестр медицинских изделий и организаций (индивидуальных предпринимателей), осуществляющих производство и изготовление медицинских изделий. [Gosudarstvennyj reestr medicinskih izdelij i organizacij (individual'nyh predprinimatelej), osushhestvljajushhih proizvodstvo i izgotovlenie medicinskih izdelij. (In Russ.)] https://www.rosz-dravnadzor.ru/services/misearch

Информация об авторах [Authors info]

Реброва Ольга Юрьевна, д.м.н. [Olga Yu. Rebrova, PhD, DHab]; адрес: Россия, 117036, Москва, ул. Дм. Ульянова, д. 11 [address: 11 Dm. Ulyanova street, 117036 Moscow, Russia]; телефон: 89104042359; ORCID: http://orcid.org/0000-0002-6733-0958; eLibrary SPIN: 7360-3254; e-mail: o.yu.rebrova@gmail.com

Как цитировать [To cite this article]

Реброва О.Ю. Эффективность систем поддержки принятия врачебных решений: способы и результаты оценки // Клиническая и экспериментальная тиреоидология. — 2019. — Т. 15. — №4. — С. 148-155. doi: https://doi: .org/10.14341/ket12377

Rebrova OYu. Efficacy of clinical decision support systems: methods and estimates. Clinical and experimental thyroidology. 2019;15(4): 148-155. doi: https://doi: .org/10.14341/ket12377

Рукопись получена: 06.04.2020. Рукопись одобрена: 29.05.2020. Опубликована online: 04.06.2020. Received: 06.04.2020. Accepted: 29.05.2020. Published online: 04.06.2020.

i Надоели баннеры? Вы всегда можете отключить рекламу.