Доказательная медицина
<
СО
Научное обоснование эффективности медицинских технологий
О. Ю. Реброва
НИИ клинико-экономической экспертизы и фармакоэкономики РГМУ им. Н. И. Пирогова (НИИ КЭЭФ РГМУ), Москва, Россия
о
со <
X <
К
Медицинские технологии (лечебные и профилактические вмешательства, методы диагностики и скрининга и др.) проходят своего рода жизненный цикл, один из главных этапов которого — научное обоснование безопасности, клинической или популяционной эффективности. В статье рассматриваются вопросы исследования эффективности медицинских вмешательств и диагностических методов.
КЛЮЧЕВЫЕ СЛОВА: медицинская технология; клиническая эффективность; популяционная эффективность; безопасность; дизайн исследования; медицинское вмешательство; диагностический метод; скрининг; клинико-экономический анализ.
< Сй
о с! ш
и и
Медицинские технологии (МТ) — это все методы диагностики, лечения, профилактики и реабилитации, включая лекарственные препараты (ЛП) и изделия медицинского назначения, вакцины, медицинские процедуры, в том числе хирургические, а также любые другие мероприятия для охраны и поддержания здоровья человека [1].
Любая МТ имеет свой жизненный цикл: от возникновения идеи до исчезновения МТ из медицинской практики, вследствие морального либо материального устаревания. Схематично этапы жизненного цикла МТ можно представить следующим образом (см. рисунок).
Последовательность представленных этапов жизненного цикла является достаточно жесткой. Так, оценку экономической эффективности МТ нецелесообразно проводить до тех пор, пока не доказана ее клиническая/популяционная эффективность, а включение МТ в ограничительные перечни не должно осуществляться при отсутствии ее экономического обоснования.
В настоящее время наиболее отработанным является жизненный цикл ЛП, основные этапы которого представлены в таблице. Эти этапы включают исследования безопасности, клинической и клинико-экономической эффективности ЛП. Отметим, что в то время как безопасность изучается на всех этапах жизненного цикла, клиническая эффективность оценивается только начиная с этапа 4, когда безопасность уже в той или иной мере доказана. В свою очередь, клинико-экономический анализ (этап 6), который необходим прежде всего государственным органам здравоохранения для принятия решений о включении ЛП в ограничительные списки (Перечень ЖВНЛС и др.), проводится только
после того, как доказана клиническая эффективность ЛП.
Далее мы остановимся на втором этапе жизненного цикла МТ (см. рис.) — этапе предрегистраци-онных исследований, который является основным при изучении клинической либо популяционной эффективности МТ, а также их безопасности.
Основные этапы жизненного цикла медицинской технологии
9
10
Исследование безопасности
Первоочередной задачей разработчика любой новой МТ является исследование и доказательство ее безопасности.
Под безопасностью МТ следует понимать отсутствие либо очень низкую частоту неблагоприятных (нежелательных) реакций (НР) на применение данной МТ. Принято выделять три степени тяжести НР:
• легкой степени (например, кожный зуд, крапивница, извращение вкуса);
• средней степени тяжести (экзематозный дерматит, токсико-аллергический миокардит, лихорадка, гипокалиемия);
• тяжелой степени — состояния, представляющие угрозу для жизни или продлевающие нахождение пациента в стационаре (анафилактический шок, эксфолиативный дерматит).
Как нам представляется, предложенная классификация НР ЛП по степени тяжести может быть принята и для всех других МТ.
В соответствии с действующими в Российской Федерации правилами [2], на любом этапе жизненного цикла регуляторными органами или компанией-производителем могут быть приняты следующие меры в связи с проблемами безопасности ЛП:
• Отзыв или приостановка действия регистрации.
• Ограничения на распространение.
• Приостановка клинических исследований.
• Изменение дозировок.
• Изменение целевой популяции или показаний к
применению.
• Изменения лекарственной формы.
На практике доказательства безопасности зачастую оказывается достаточно (в соответствии с действующей нормативной базой), чтобы медицинское вмешательство было разрешено регуляторными органами к свободной продаже — обращению за счет пациента. Таким путем на рынок попадают средства с недоказанной эффективностью — многие БАДы, «лечебные» аппараты для домашнего применения и пр. Правда, на упаковке БАД должно быть указано «Не является лекарством», однако в реальности это не всегда соблюдается, и потребители вводятся в заблуждение агрессивной рекламой средств «от ста болезней», поскольку не дифференцируют собственно медицинские и параме-дицинские вмешательства. Остается надеяться, что безопасность этих вмешательств достаточна, хотя общеизвестны и обратные примеры.
Большинство МТ применяются в клинической (стационарной и амбулаторной) практике, другие (первичная профилактика, вакцинация, скрининг и др.) — на популяционном уровне, поэтому мы предлагаем пользоваться терминами клиническая и популяционная эффективность МТ соответственно.
Далее рассмотрим последовательно методологию исследований эффективности медицинских вмешательств и диагностических методов.
Жизненный цикл лекарственных препаратов
№ этапа Этап Участники Цель исследования Значение результатов
1 Доклинические исследования Лабораторные животные Разработка начальной дозы, кратности, пути введения; оценка безопасности Принимается решение о целесообразности КИ*
2 I фаза КИ (фармакологическая) Добровольцы Оценка безопасности; изучение фар-макокинетики, фармакодинамики По результатам фазы I принимается решение о дальнейшей разработке препарата
3 IIa фаза КИ (пробные КИ, pilot trials) Нозологическая группа (плацебоконтролируемые исследования) Оценка краткосрочной безопасности По результатам фазы II принимается решение о дальнейшей разработке препарата
4 IIb фаза КИ (базовые КИ, pivotal trials) Оценка клинической эффективности и безопасности, разработка режимов дозирования
5 III фаза КИ (предрегистрационная) Нозологическая группа с сопутствующей патологией, приближенная к реальной практике (многоцентровые рандомизированные КИ тысяч пациентов) Оценка польза/риск (клиническая эффективность/безопасность). Расширение показаний По результатам III фазы принимается решение государственными органами о разрешении продаж ЛП
6 IV фаза КИ (пострегистрационная, постмаркетинговая) Обширная нозологическая группа (в пределах разрешенных показаний) с сопутствующей патологией. Реальная практика применения препарата Сравнение с аналогами, клини-ко-экономические исследования, выявление побочных эффектов, оценка долгосрочной безопасности Могут давать данные для пересмотра оценок эффективности и безопасности
7 Постмаркетинговое наблюдение Реальная практика Мониторинг безопасности Могут давать данные для пересмотра оценки безопасности
Примечание.
1 — клинические исследования.
Исследование
клинической/популяционной эффективности медицинских вмешательств
К медицинским вмешательствам можно отнести все способы воздействия на пациента, способные вызывать улучшение его состояния либо предотвратить болезнь:
— ЛП
— хирургические операции
— физиотерапевтические методы
— профилактические мероприятия
— другие.
Оценка клинической/популяционной эффективности должна проводиться в рамках специально организованного проспективного исследования. Напомним, что проспективное исследование — это исследование, в котором сначала проводится набор участников (объектов) исследования, а затем в соответствии с разработанным заранее планом (протоколом) производится сбор данных и наблюдение. Проспективное исследование всегда является динамическим, т.е. включающем как минимум две временные точки наблюдения участника исследования — до применения вмешательства и после него.
Другие дизайны исследований, которые часто применяются для оценки эффективности медицинских вмешательств (ретроспективные исследования «случай-контроль», когортные исследования), чреваты значительным числом систематических ошибок (смещений), что приводит к переоценке или недооценке величины изучаемого эффекта.
Стандартом проведения клинических исследований медицинских вмешательств в настоящее время признается документ CONSORT Statement (Consolidated Standards of Reporting Trials, http://www.consort-statement.org), включающий минимальный набор требований для проведения клинических испытаний. По современным представлениям, получение надежных научно-обоснованных результатов об эффективности лечебных вмешательств возможно в исследовании, имеющем следующие характеристики:
1. Четко сформулирована цель (гипотеза) исследования, например:
новый метод лечения превосходит по клинической эффективности лучший из применяемых в настоящее время;
новый метод эквивалентен по клинической эффективности лучшему из применяемых в настоящее время;
новый метод не хуже по клинической эффективности лучшего из применяемых в настоящее время.
2. Изучаются истинные (клинические) эффекты (исходы заболевания, возникновение осложнений, предотвращение рецидивов и др.), а не только сур-
рогатные (физиологические или биохимические параметры).
3. Ясно определена популяция больных — перечислены критерии включения и исключения участников.
4. Исследование является контролируемым (сопоставительным), т.е. имеются как минимум две исследуемые группы — группа исследуемого вмешательства и группа контроля. В группе контроля может применяться плацебо (имитация вмешательства) либо стандартная схема лечения.
5. Включение участников в исследование проводится до распределения по группам, в соответствии с критериями включения и исключения. Это необходимо для того, чтобы избежать систематических смещений при формировании групп.
6. Число участников (объектов) исследования является достаточным для выявления эффекта заранее определенной клинически значимой величины.
7. Для распределения по группам применяется рандомизация1. Целью рандомизации является случайное распределение объектов с различными (известными и неизвестными) свойствами, потенциально влияющими на эффект вмешательства, по исследуемым группам. К таким свойствам относятся, прежде всего, пол, возраст, тяжесть заболевания. Однако надо помнить, что рандомизация не гарантирует сопоставимость групп, особенно при небольших выборках (в этих случаях применяют специальные модификации процедуры рандомизации), поэтому при анализе данных прежде всего должна быть доказана исходная (до применения вмешательств) сопоставимость групп.
8. Выполняется маскирование вмешательства (там, где это возможно, используется плацебо).
9. Оценивание эффектов применения лечебного вмешательства проводится «вслепую» (например, независимым врачом).
10. На всем протяжении исследования должна фиксироваться информация об осложнениях и побочных эффектах лечения, о числе выбывших больных, о правильности выполнения протокола. При выбывании по ходу исследования более 20 % больных исходная сопоставимость групп с большой вероятностью нарушается, что может привести в конечном счете к невозможности оценки величины эффекта.
11. Статистический анализ должен быть проведен корректно. Отметим, что статистическое сопровождение исследования должно начинаться на этапе его планирования и заканчиваться на этапе подготовки отчета (публикации). Подробно о статистическом сопровождении см. в [3].
1 Рандомизация (от аигл. random — случайный) — истинно случайное (с использованием генератора случайных чисел) распределение участников (объектов) исследования по группам.
11
<
со
о
(Г)
со S
с; <
X <
о;
<
CQ О CZ
ш ^
и и
12
CL
О ш -Q Ш
3
О
О с; О х X ш
О X
а
ш
Основным результатом исследования должна являться оценка величины эффекта изучаемой МТ, подтвержденная статистическим анализом. Помимо точечной оценки эффекта, необходим расчет и ее 95 %-ного доверительного интервала. При интерпретации результата должна быть оценена клиническая значимость выявленной величины эффекта.
Перечисленные аспекты методологии исследования, конечно, не являются исчерпывающей характеристикой доказательного научного исследования медицинского вмешательства, однако если они проигнорированы, то надеяться на научно-обоснованную оценку эффективности МТ не приходится. Подробнее методология исследования эффективности медицинских вмешательств рассмотрена в работе [4].
Исследование
клинической/популяционной эффективности методов диагностики
Эффективность диагностического метода (теста) в идеале должна оцениваться на основании того, насколько его выполнение улучшает исход заболевания. Однако такое влияние теста оценить практически невозможно, так как оно опосредуется лечебным вмешательством. Поэтому когда говорят об оценке диагностических тестов, имеют в виду так называемую диагностическую точность теста — соответствие диагноза, установленного с помощью некоторого метода, диагнозу, установленному с помощью референтного теста («золотого стандарта») [5].
Методы диагностики можно разделить на клинические и скрининговые. При разработке нового метода диагностики необходимо сразу ставить определенную цель — для какого применения данный метод (или модификация метода) разрабатывается. Если речь идет о клинической диагностике, которая проводится в условиях высокой относительной частоты диагностируемого состояния, то важно оптимизировать диагностическую чувствительность метода, минимизируя гиподиагностику (ложно-отрицательные результаты). Если же диагностический метод будет применяться как скрининговый (для обследования населения без жалоб), т.е. в условиях низкой распространенности (относительной частоты, преваленса) искомого заболевания, то важно оптимизировать диагностическую специфичность, минимизируя гипердиагностику (частоту ложно-положительных результатов). Кроме того, для оценки эффективности клинического метода должно проводиться одномоментное исследование, а для оценки эффективности скринингового метода — проспективное.
Ориентиром для проведения исследований методов диагностики в настоящее время признается до-
кумент STARD Statement (STAndards for the Reporting of Diagnostic accuracy studies, http://www.stard-statement.org). Более 200 биомедицинских журналов мира рекомендуют применять данный стандарт для описания исследований диагностических методов.
По современным представлениям, получение надежных научно-обоснованных результатов об эффективности клинического диагностического метода возможно в исследовании, характеризующемся следующими признаками:
1. Исследование является сопоставительным — диагностика проводится как новым методом, так и с использованием «золотого стандарта» (наилучшего из существующих методов).
2. Исследование проводится с использованием «ослепления» (маскирования). Это означает, что при проведении диагностики каждым из двух сопоставляемых методов результаты применения другого метода диагностики являются неизвестными. Маскирование проводится во избежание смещения результатов двух методов в сторону большей согласованности.
3. Спектр заболевания у обследованных больных должен быть достаточно широк, т.е. в исследование следует включать больных с легким и тяжелым течением/формой заболевания, лечившихся и нелеченных, с сопутствующей патологией. Целевая популяция должна быть описана подробно.
4. Проведена оценка надежности и воспроизводимости результатов теста.
5. Проведены расчеты операционных характеристик теста (диагностической чувствительности и специфичности), а также их доверительных интервалов.
6. Проведены расчеты прогностической ценности положительного и отрицательного результатов с поправкой на распространенность диагностируемого состояния в целевой популяции.
7. Если результат теста является количественным, то должна быть обоснована точка разделения двух дифференцируемых состояний (например, здоровых и больных пациентов).
8. Если тест предлагается как дополнение к какому-либо комплексу исследований, то должно быть доказано, что применение данного теста позволяет увеличить общую диагностическую ценность комплекса исследований.
9. Детально описана тактика и техника применения теста.
10. Оценена общая полезность теста.
Что касается разработки методов скрининга, то она достаточно сложна, такие исследования чреваты систематическими смещениями, в частности:
• смещением от участия добровольцев
• смещением от ранней постановки диагноза
• смещением от выявления медленно развивающихся случаев заболевания.
Решение о необходимости проведения программы скрининга, и, следовательно, о целесообразности разработки метода скрининга, принимается на основе ее соответствия десяти критериям Вильсо-на-Джаннера, рекомендованным ВОЗ [5]. Для оценки эффективности скрининга необходимы полномасштабные испытания эффективности с рандомизацией целых территорий, одни из которых становятся районами экспериментального вмешательства, а другие — контрольными. В испытании должно быть показано, что скрининг действительно приводит к благоприятному изменению важных исходов.
Подробнее методология исследования эффективности диагностических и скрининговых методов рассмотрена в работах [6, 7].
Клинико-экономический анализ
Клинико-экономический анализ (КЭА) — это сравнительная оценка двух и более методов профилактики, диагностики, лекарственного и нелекарственного лечения на основе комплексного учета результатов медицинского вмешательства и экономических затрат на его выполнение, т.е. обоснование применения новых методов на основе учета цены и эффекта.
КЭА может проводиться [8]:
1. в рамках клинических исследований МТ одновременно с изучением их эффективности и безопасности;
2. как самостоятельное исследование: ретроспективное (анализ документации) или проспективное наблюдательное;
3. с применением методов логического и математического моделирования.
В настоящее время наибольшее распространение в нашей стране имеет последний вариант КЭА — с применением методов моделирования. В этом случае экономическое обоснование новой МТ проводится на основе сведений о величине клиническо -го/популяционного эффекта, выраженного в изме-
нении частоты истинных исходов (конечных точек) — снижении летальности, частоты обострений или рецидивов, частоты осложнений, частоты повторных госпитализаций и т.д. Располагая сведениями о затратах государства (прямых, косвенных и труд-ноинтерпретируемых) и/или населения в связи с заболеванием и его исходами, можно оценить экономическую эффективность МТ. Различные аспекты КЭА будут освещаться в последующих публикациях на страницах данного журнала.
Литература
1. The Use of Health Technology Assessments to evaluate Medicines. Principles and Guidance for implementation in different healthcare environments. EFPIAHTAToolkit — Final. 04.02.2008.
2. Руководство no организации системы мониторинга безопасности лекарственных средств (фармаконадзора) в компаниях-производителях лекарственных средств или держателях регистрационных удостоверений. Росздравнадзор, 05.10.2009. http://www.roszdravnadzor.ru/ i/upload/files/1259308046.59082-6730.pdf.
3. Реброва О. Ю. Роль и место статистического анализа в современных медицинских исследованиях. Мед. технол. Оценка и выбор. 2010;№1:24—27.
4. Власов В. В., Реброва О. Ю. Доказательная медицина: оценка лечебных и профилактических вмешательств. Зам. глав. врача. 2010;№7:53-64.
5. Wilson J. M. G., Jungner G. Principles and Practice of Screening for Disease. WHO Chronicle 1968; 22(11):473.
6. Власов В. В., Реброва О. Ю. Доказательная медицина: оценка эффективности диагностических вмешательств. Зам. глав. врача. 2010;№4:50 - 60.
7. Власов В. В., Реброва О. Ю. Скрининг с позиций доказательной медицины: польза или вред? Зам. глав. врача. 2010;№5:48 - 58.
8. Клинико-экономический анализ. Под ред. П. А. Воробьева. М.: Нью-диамед, 2008;129 -131.
Сведения об авторе:
Реброва Ольга Юрьевна
зав. НИЛ биостатистики НИИ КЭЭФ РГМУ, д-р мед. наук
Адрес для переписки:
119435, Москва, ул. Россолимо, д. 14 Телефон: +7 (499) 245-3807 E-mail: [email protected]
13
RESEARCH. ANALYSIS. EXAMINATION
Evidence-Based Medicine
Scientific substantiation of medical technologies' efficacy
O. Yu. Rebrova
The article considers issues related to research in the field of efficacy of medical interventions and diagnostic methods. Medical technologies (treatment and preventive interventions, diagnostic techniques and screening, etc.) have their own life cycle, one of the main stages of which is scientific substantiation of safety, clinical or population efficacy.
KEYWORDS: medical technology; clinical efficacy; population efficacy; safety; study design; medical interventions; diagnostics; screening; clinical and economic analysis.