ПРОВЕДЕНИЕ КОСВЕННОГО СРАВНЕНИЯ МЕДИЦИНСКИХ ТЕХНОЛОГИЙ И СЕТЕВОГО МЕТА-АНАЛИЗА: ДОКЛАД ГРУППЫ ISPOR О НАДЛЕЖАЩЕЙ ИССЛЕДОВАТЕЛЬСКОЙ ПРАКТИКЕ КОСВЕННОГО СРАВНЕНИЯ Часть 2
Дэвид С. Хоглин1, Нил Хокинс2, Йерун П. Янсен3, Дэвид А. Скотт2,
Робин Итцлер4, Джозеф С. Капеллери5, Корнелис Боерсма6, Дэвид Томпсон7,
Кей М. Лархольт8, Мирея Диас9, Аннабель Баррет10
1 Независимый консультант, Садбери, Массачусетс, США;
2 Исходы Оксфорд, Оксфорд, Великобритания;
3 МАПИ, Бостон, Массачусетс, США;
4 Лабораторий Мерк, Северный Уэльс, Пенсильвания, США;
5 Пфайзер., Нью-Лондон, штат Коннектикут, США;
6 Университет в Гронингене, Гронинген, Нидерланды;
7 ИННОВУС, Медфорд, Массачусетс, США;
8 Хельтх Коре, Андовер, Массачусетс, США;
9 Система здравоохранения Генри Форд, Детройт, Мичиган, США;
10 Эли Лиллу, Виндельсхам, Суррей, Великобритания
Перевод: Л.Ю. Безмельницына
Рецензенты: П.А. Воробьев, Л.С. Краснова, М.А. Холовня, А.В. Лунева
Межрегиональная общественная организация «Общество фармакоэкономических исследований»
Принятие решений на основе медицины доказательств в здравоохранении требует сравнения всех существующих альтернативных методов лечения. При отсутствии рандомизированных контролируемых исследований, включающих в себя прямое сравнение всех анализируемых способов лечения, косвенное сравнение и сетевой мета-анализ позволяют получить полезные доказательства для обоснованного выбора лучшей медицинской технологии(ий) (МТ). Комбинированное сравнение медицинских технологий — специальный случай сетевого мета-анализа, который сочетает в себе прямые и непрямые доказательства, в частности для парных сравнений, в результате чего удается объединить большую часть имеющихся доказательств по сравнению с традиционным мета-анализом. Этот доклад Международного общества фармакоэкономических исследований (ISPOR) содержит руководство по проведению сетевого мета-анализа (используя этот термин, мы подразумеваем, что он включает мета-анализ в контексте сети доказательств). Мы начнем с обсуждения стратегии развития сети доказательств.
Copyright © 2011, Международное общество фармакоэкономических исследований
и оценки результатов (ISPOR). Издатель Эльсервер Инк.
Затем последует короткий обзор допущений в сетевом мета-анализе. Далее мы сфокусируемся на статистической обработке данных: цели, модели (постоянные и случайные эффекты), сравнение частотного и Байесовского подхода, валидация модели. Контрольный список, содержащий основные компоненты сетевого мета-анализа, примеры, иллюстрирующие непрямое сравнение медицинских технологий (как частотный, так и Байесовский подход) и сетевой мета-анализ. Следующий раздел рассматривает 8 ключевых областей для последующих исследований.
Ключевые слова: Байесовский мета-анализ, прямое сравнение МТ, сеть доказательств, частотный мета-анализ, гетерогенность (неоднородность), несоответствие, косвенное сравнение МТ, смешанное сравнение МТ
Предпосылки для создания Рабочей группы
Совет директоров Международного общества фармакоэкономических исследований (^РОИ) в 2009 г. утвердил образование Рабочей группы по Надлежащей исследовательской практике непрямого сравнения медицинских технологий для разработки документа(ов). В рабочую группу были приглашены исследователи, имеющие опыт в проведении систематических обзоров, сетевых мета-анализов, синтеза доказательств и сходных статистических методов, работающие в высших учебных заведениях, исследовательских организациях, фармацевтической промышленности или государственных структурах из США, Канады и Европы. Также в рабочую группу были включены несколько исследователей, принимающих решения в здравоохранении и использующих как прямые, так и косвенные сравнения доказательств эффективности МТ. Встречи участников рабочей группы проходили преимущественно с использованием средств телеконференций и переписки по электронной почте. Встреча участников состоялась в апреле 2010 г. с целью согласования тем, которые подлежат рассмотрению, плана и проекта отчета. Ведущая группа определила, что для адекватного применения надлежащей исследовательской практики и этого сравнения при принятии решений в здра-
воохранении, доклад группы должен состоять из 2 частей: «Интерпретация косвенного сравнения тактик лечения и сетевых мета-анализов при принятии решений в здравоохранении: рабочая группа ISPOR по надлежащей исследовательской практике по косвенным сравнениям тактик лечения — часть 1» и «Проведение косвенного сравнения медицинских технологий и сетевого мета-анализа: доклад группы ISPOR о надлежащей исследовательской практике косвенного сравнения — часть 2». Тезисы были представлены для обсуждения на XV ежегодном Международном совещании, проходившем в мае 2010 г. в Атланте. В июле 2010 г. проекты документов были направлены на рассмотрение целевой группой рецензентов, состоявшей из 103 приглашенных и пожелавших участвовать лиц, заинтересованных в данной теме. Авторы рассмотрели комментарии рецензентов и перенаправили проекты документов членам ISPOR (5550) в сентябре 2010 г. В общей сложности было получено 23 комментария к первой части и 13 — ко второй. Все полученные комментарии были размещены на сайте ISPOR. Авторы проектов рассмотрели их (большинство были значимыми и конструктивными), внесли изменения и опубликовали окончательные версии документов в журнале «Value in health».
ВВЕДЕНИЕ
Рабочая группа по надлежащей исследовательской практике косвенных сравнений МТ опубликовала отчет в 2 статьях. Настоящая статья основывается на первой части отчета [1], содержащей информацию о мотивации, концепции и существующей терминологии (например, косвенное сравнение МТ (КСМТ), комбинированное сравнение МТ, сетевой мета-анализ, гетерогенность, сходство и однородность).
Терминология для косвенного и комбинированного сравнения МТ, сетевого мета-анализа отличается в различных литературных источниках. На практике все эти методы включают в себя мета-анализ в контексте сети доказательств. В связи с этим целесообразно использовать один термин — «сетевой мета-анализ» для всех терминов, за исключением простейших исследований, и применять его в случаях, если доказательная база состоит более чем из 2 рандомизированных контролируемых исследований (РКИ) и более чем 2 вмешательств.
В первой части особое внимание уделено аспектам сетевого мета-анализа, которые имеют наибольшее значение для лиц, принимающих решения, и всех, кто учитывает и использует результаты таких исследований. Мы рекомендуем читателям ознакомиться с ними перед работой с данной статьей, которая, в свою очередь, посвящена преимущественно техническим аспектам проведения сетевого мета-анализа. В последующих разделах обсуждаются стратегии для развития сети доказательств, допущений и статистических методов (целей, моделей сопоставление частотного и Байесовского подхода и ва-лидация модели). Далее представлен перечень для надлежащей исследовательской практики, обсуждаем показательные примеры, в заключение выделяем 8 областей текущих и необходимых исследований.
Определение сети доказательств
Сетевой мета-анализ начинается с сети доказательств: релевантные МТ и клинические исследования, напрямую сравнивающие эти МТ. Ее структура, как правило, может быть отображена в виде диаграммы, в которой каждая точка графика представляет собой МТ (или отдельный класс МТ), а каждая линия или угол соединяет
МТ, которые непосредственно сравнивались между собой в одном или нескольких РКИ [2]. В первой части отчета представлена диаграмма для нескольких типов доказательных сетей.
При поиске литературы для построения сети в рамках сетевого мета-анализа применяются те же стандарты, что и для мета-анализа, проводимого для прямого сравнения [3—6]. Если сфокусироваться на сравнении 2 технологий, например В и С, то целью поиска является выделение всех исследований, которые включают в себя В и другую технологию сравнения, также все исследования, в которых С сравнивается с другими технологиями, и любые исследования, в которых напрямую сравниваются В и С.
При отсутствии прямого сравнения В и С, но если каждая из МТ была сравнена с одной и той же МТ, назовем ее А, то, возможно, будет целесообразно построить непрямое (косвенное) сравнение В и С на основании прямых сравнений В и А, а также С и А. Помимо этой простой ситуации, В и С могут иметь другие общие технологии для сравнения или, напротив, не иметь их.
При отсутствии прямого сравнения В и С, но если каждая из МТ была сравнена с одной и той же МТ, назовем ее А, то, возможно, будет целесообразно построить непрямое (косвенное) сравнение В и С на основании прямых сравнений В и А, а также С и А. Помимо этой простой ситуации, В и С могут иметь другие общие технологии для сравнения или, напротив, не иметь их.
В случае отсутствия общей технологии сравнения для В и С, МТ, с которыми они сравнивались, могут иметь общий параметр сравнения или для соединения с этим параметром могут понадобиться дополнительные связи. Если В и С разделяют более чем несколько пунктов, то косвенное сравнение может быть недостоверным, так как каждая дополнительная ссылка приводит к повышению числа стандартных ошибок при косвенном сравнении [7]. Значимость связи зависит от множества факторов, включая число исследований, лежащих в основе этого прямого сравнения, размер выборки в исследованиях и однородность критериев, применяемых в рамках исследования. Поэтому для принятия решения о проведении косвенного анализа необходимо изучить больше информации, чем просто число связей.
Также возможны затруднения с выделением всех релевантных технологий для сравнения с изучаемой МТ, любой поиск подразумевает затраты и компромиссы. Возможно, будет более эффективна поэтапная работа с использованием одной из стратегий, разработанных ранее [7]. Согласно данной методике, МТ, которая подлежит сравнению, называется первичной. МТ, которые напрямую сравниваются с первичной, называются вторичными. МТ, напрямую сравниваемые со вторичными, — третичными и т. д. Порядок сравнения определяется числом промежуточных сравниваемых параметров. Таким образом, сравниваемые технологии первого порядка являются прямыми, второго рода непрямые сравниваемые параметры основываются на исследованиях, которые имеют один промежуточный компаратор (сравниваемую МТ), при непрямом сравнении третьего порядка вовлечены 2 непрямых сравниваемых МТ и т. д.
В табл. 1 перечисляется 5 первых схем поиска для первичной расширенной стратегии. В схемах поиска, исключающих технологию сравнения, возможно, снизить бюджет поиска путем исключения исследований, которые, вероятней всего, будут представлены в большом количестве (например, плацебоконтролируемые исследования). Каждая схема поиска из последовательности будет находиться в выбранной базе данных (MEDLINE, EMBASE), все клинические исследования будут вносить вклад в косвенное сравне-
Таблица 1
Первые пять схем поиска в первичной
расширенной стратегии. Каждая схема использует отношение шансов Болеана с целью объединения сравниваемых технологий
ние в следующем порядке: схема 1 — все первичные (прямые) сравнения; схема 2 — все вторичные — косвенные сравнения и т. д. Благодаря этому поиску, дополнительные МТ, которые могли не рассматриваться как технологии сравнения или же были за границами оценки (например, в некоторых случаях нелицензированные методы лечения) могут войти в сеть доказательств.
Первичная глубинная стратегия начинается с того же поиска, как и первичная расширенная стратегия, но она не включает в себя исключенные в любой предыдущий поиск технологии сравнения. Схема 2 нацелена на все вторичные технологии сравнения, выделенные в первом поиске, схема 3 — на все третичные, выделенные во втором и т. д. (Howkins е! а1.) [7,8] представляющие детальное обсуждение поиска и результирующих параметров сравнения для МТ второй линии терапии прогрессирующего/метастатического немелкоклеточного рака легкого.
Обзор литературы также должен включать в себя поиск любых мета-анализов, в которых уже были проведены прямые (или даже непрямые) сравнения потенциально релевантных МТ, чтобы провести эмпирическую валидацию проводимого анализа.
Предположения
Как уже обсуждалось в 1-й части [1], сетевой мета-анализ основан на рандомизации в РКИ, в которых проведено прямое сравнение МТ. Он также включает аналогичные предположения: «Объединенные исследования должны рассматриваться только в том случае, если они сходны клинически и методологически» [9]. Тем не менее, «не существуют единых утвержденных стандартов (определений), какие исследования являются идентичными в достаточной степени» [9]. Для сетевого мета-анализа ко-варианты, которые расцениваются как сходные модификаторы, должны быть схожими во всех исследованиях (или настроены для применения мета-регрессии). Когда это сочетает в себе косвенные и прямые доказательства, сетевой мета-анализ добавляет предположение о совместимости: косвенные доказательства должны быть совместимы с прямыми.
Мета-анализ для прямого сравнения обычно требует, чтобы отдельные исследования оценивали либо общий эффект лечения, либо специфич-
Поиск Сравниваемые технологии
1 Все первичные сравниваемые технологии за
исключением одной
2 Все первичные сравниваемые технологии
3 Все вторичные сравниваемые за исключением
одной
4 Все вторичные сравниваемые технологии
5 Все третичные сравниваемые технологии за
исключением одной
Заимствовано из таблицы 1 Hawkins et al. [7].
ные эффекты терапии, распространенные в рамках типичного значения [10]. Выбор между общим эффектом и распространением эффектов обусловливает применение подходов постоянных или случайных эффектов соответственно. Разнородность среди исследований прямого сравнения приемлема до тех пор, пока их терапевтические эффекты входят в общее типичное значение, и это может даже увеличить гетерогенность. С другой стороны, разнородность между множеством исследований, которая больше способствует прямому сравнению, нежели непрямому (косвенному) сравнению или сетевому мета-анализу, будет свидетельствовать об отсутствии сходства.
Обсуждение модели, в которой следует применять допущения об однородности, сходстве и согласованности по мере необходимости. На практике эти предположения следует проверять во всех возможных случаях. «Исследователи должны основывать решения об объединении исследований на основании подробного изучения клинического и методологического разнообразия, а также данных об изменении величины эффекта» [9]. Соглашение достигается редко и часто могут требоваться как клинические, так и экономические оценки (например, пересмотр информации, представленной в отчетах некоторых исследований, пересчет прямых и косвенных расчетных данных до проведения сетевого мета-анализа). Также возможно регулировать различия в характеристиках на уровне исследования (путем мета-регрессии), но за счет такой корректировки вряд ли удастся преодолеть существующие различия между исследованиями. Эти ограничения следует учитывать при интерпретации результатов.
СТАТИСТИЧЕСКИЕ МЕТОДЫ Цели
Цели сетевого мета-анализа могут включать рассмотрение всех соответствующих доказательств, ответы на вопросы исследователя при отсутствии прямого доказательства, повышение точности оценок путем объединения прямых и косвенных доказательств, ранжирование медицинских технологий и оценку влияния конкретных компонентов сети доказательств.
Выбор меры измерения оценки должен определяться клиническими вопросами и характе-
ром данных. Общие измерения сходных эффектов включают отношение шансов, относительный риск, среднее различие и соотношение рисков. Модели, представленные ниже, применимы к любому измерению сходных эффектов до тех пор, пока определены необходимые параметры (например, вероятность и связь функций).
Модели
Представлена последовательность моделей, начиная с обычного мета-анализа и заканчивая фиксированными и редкими эффектами, которая показывает естественную прогрессию для модели фиксированных и случайных эффектов и затем мета-регрессионную модель, обеспечивающую взаимодействие МТ с ко-вариантом [11,12]. Некоторые модели для сетей могут содержать данные многих исследований, включение таких исследований может увеличить сложность анализа.
Модели, представленные ниже, касаются основного результата лечения и меняются в соответствии с определенным анализом (логарифма шансов, отклонения от базовой линии, логарифма отношения рисков). Вероятностное распределение рассмотренных результатов (бимодальное, нормальное) будет рассмотрена отдельно. Анализ, основанный на этих моделях, может использовать как частотный, так и Байесовский метод, мы вкратце опишем оба.
Постоянные и случайные эффекты мета-анализа для АВ-испытаний. Уравнение 1 показывает модели постоянных эффектов для мета-анализа, в котором сравниваются технологии лечения А и В
Уравнение 1.
П
И/
к = А
И/ + ( к = В
(1)
П.к отражает основной результат лечения к в исследовании ], и представляет этот результат для метода А в исследовании ], и й — эффект лечения В по отношению к лечению А.
В анализе постоянных эффектов й — один и тот же для каждого исследования. Модель редких эффектов, уравнение 2, й заменяет 5.., исследование-специфичный эффект лечения В по сравнению с А, при этом й становится средним в
распределении (обычно нормальном) редких эффектов, которое имеет дисперсию (82).
И/
к = А
И/ + й к = В
(2)
5, - N(й, а2)
Сетевой мета-анализ постоянных эффектов. Когда сеть фактических данных состоит из нескольких парных сравнений (АВ исследования, АС исследования, ВС исследования и т. д.) установленный параметр для сравнения обычно меняется от исследования к исследованию, что усложняет обозначение. Один подход — это обозначение эффектов А, В, С и т. д., при этом А используется для первичной ссылки на лечение в анализе. В каждом исследовании это обозначает одно исследование Ь в качестве базового лечения. Маркировка оцениваемых технологий может проводиться таким образом, что основные методики следуют за А (В, С и т. д.), а неосновные — после основных по алфавиту. В различных моделях понятие «после» относится к алфавитному порядку. Общая модель сетевого мета-анализа для фиксированных эффектов может быть представлена следующим образом.
Пк
и/ь Ь = А, В, С, if к = Ъ
и/ь + йЬк = н/ь + йак - йАь
к = В, С, D, if к is «after» Ь
(3)
ёАА = 0
Ир — результат лечения Ь в исследовании р, и йЬк — постоянный эффект лечения к по отношению к терапии Ь. йЬк определяется путем выражения их в перерасчете на эффекты по отношению к терапии А: ёЬк = в,Ак — ёАЬ, где ёАА = 0. (порядок индексов йьк — традиционный, но нелогичный). Для основных эффектов это отношение является результатом последовательности: «прямой эффект» йьк и непрямой эффект йАк — ёАЬ равны.
Самое простое косвенное соотношение технологий, А — первичное указанное лечение и также базовое для АВ и АС исследований. Термин «отрегулированное косвенное сравнение» применяется для такого анализа, однако это неудачный термин, потому что сравнение включает в себя не сравнение в традиционном смысле этого слова. Мы предпочитаем термин «надежное косвенное
сравнение»; косвенное сравнение В и С, проверенное на А.
Сетевой мета-анализ случайных эффектов. Как уже было сказано выше, модель случайных эффектов заменяет йЬк на 5]Ш, ассоциированная с исследованием эффекта к по сравнению с эффектом Ь. Эти специфические для исследования эффекты отражаются распределением случайных эффектов: 5рЬк N - (йЬк, 52). Снова, йЬк определены путем перерасчета относительно терапии А, обозначенной как первичной. В этой модели предполагается, что дисперсия редких эффектов 52 для всех сравнений одинакова, но ограничение может быть ослаблено (модель постоянных эффектов, если 52 = 0).
Ъ = А, В, С, if к = Ъ
/ =
и ь
и/ь + 5/ Ьк к = В, С, D, если к после Ъ
2 2 (4) 5/Ьк - N(йЬк а ) = N(йАк - йаЬ а )
йаа = 0
Мета-регрессионная модель с взаимодействием ко-вариантов сравниваемых технологий
Мета-регрессионная модель включает ко-ва-рианты уровня исследования и обеспечивает способ оценки, в такой степени ко-варианты учитывают разнородность эффектов лечения. Они также могут уменьшать смещение и несоответствие между сравниваемыми технологиями, когда распределение ко-вариантов является неправильным [13,14]. Ко-варианты включаются в модель через среднее распределение случайных эффектов. В модели, представленной ниже, используется значения уровня исследования одного ко-вариан-та X. и позволяет ее коэффициенту рЬк варьировать среди сравнения [12]. Центрировать ко-ва-рианты (например, все их общие средние) можно, чтобы облегчить интерпретацию результатов.
/ =
И/ Ь Ъ = А, В, С, ^ к = Ъ
И/ь + 5/ Ьк к = В, С, D, если к после Ъ
5/ Ьк - N( йЬк + PьkX/, а ) =
= n(йАк - йАЬ + (Рак - Раь)х.а2)
йаа = 0
Раа = 0
Другие модели могут использовать значения ко-вариантов для комбинации исследования и лечения. При упрощении модели, представленной выше, используются один и тот же коэффициент для всех сравнений:
/ =
С И/ Ь = А, В, С, К к = Ь (6)
[ И/ь + 5/ьк к = В, С, D, если к после Ь
N (ьк + в X, а2)=М( ( а к - (аь + в X, а2) К Ь = А
IМ((ьк, а2) = ЛТ((Ак - (аь, а2) К Ь Ф А
(аа = 0
Если модель с постоянной в удовлетворительная, то сравнение технологий (учитывая вклад ко-варианта) простое, потому что йАк — йАЬ применим для любого значения ко-варианта (уровень исследования или уровень технологии в исследовании). В модели с вЬк учет ко-вариантов может улучшить внутреннюю валидность, но аналитик должен выбрать значение Х при котором будет проводиться сравнение между МТ. Мета-регрессия также имеет недостаток в том, что связь между результатами и ко-вариантами данных на уровне пациентов может различаться и даже может быть противоположной по сравнению с исследованием обобщающего уровня.
Если сеть включает многоцелевое разветвленное исследование, исключение его из анализа может спровоцировать смещение. Аналитик должен рассматривать также корреляцию между эффектами, установленными для пары в каждой ветви; определенные анализы позволяют сделать это проще. Будет неправильным анализировать попарно эффекты из разветвленного исследования, если они были получены из отдельных исследований. Эта ошибка нередко встречается, например, в докладе Канадского Агентства Лекарств и Медицинских технологий внесенные данные для трех прямых сравнений в 3-целевое испытание как 3 отдельных исследования [15]. £а1ап1:1 е1 а1. [16] проиллюстрировал анализ, включающий корреляцию между этими ветвями.
Частотный и Байесовский подходы
Частотный метод: термин «частотный» применяется для большинства традиционных статистических методов, используемых при сравнении, включая оценку значений с доверительным ин-
тервалом (основанным на предположении о нормальном распределении) при мета-анализе постоянных и случайных эффектов и оценке тап1е1-Наепге1 (например, для отношения шансов) (процедура постоянных эффектов). В такой модели, как сетевой мета-анализ и мета-регрессия, оценка и выводы основаны на определенной форме максимальной вероятности.
Байесовский подход: метод, комбинирующий вероятность (данные задаются параметрами) с предварительным распределением вероятностей (что отражает предыдущее утверждение о возможном распределении этих параметров), чтобы получить последующее распределение параметров [17], что позволяет упростить прогнозирование, и предыдущее распределение может включать в себя различные источники изменчивости. Для таких параметров, как эффект лечения, предварительное распределение обычно не является информативным. Предположение перед рассмотрением данных, что все значения параметра в равной степени вероятны, сводит к минимуму влияние предварительного распределения на последующие результаты. Когда информация о параметре доступна (например, из обсервационного исследования или предыдущего анализа), предварительное распределение позволяет включить ее естественным образом.
Для модели редких эффектов, в которой результаты оцениваются логарифмом шансов, Байесовский анализ содержит следующие компоненты:
г.к ~ Ь1пот1а1(р]к, п.к)
Модель:
( Ргк) =
_ ГИ/ь Ь = А, В, С, к = Ь (7)
[И/ь + 5/ Ьк к = В, С, D, если к после Ь
5/ ьк - м ((ьк а2) = м (( а к - (аь а2)
(аа = 0
предшественники
йАк - погта1(0,106) к = В, С, D а - ит1огт[0.2].
Вероятность рассмотренного числа случаев
для технологии к в исследовании /, л. имеет
кк
бимодальное распределение (независимо от дру-
гих методик в исследовании j и других исследованиях), частотная вероятность которой — pjk, описываемая в модели. Параметры в распределении редких эффектов не имеют четкого предварительного распределения: N (0, 106) для dAk (независимо) и равномерное (0,2) для а. Эти предшественники являются общими в таких моделях.
Различия: для большинства моделей анализ поддерживается как с использованием частотного, так и Байесовского метода. В текущей практике в большинстве мета-анализов для прямого сравнения используются частотные методы. Для более сложных моделей, в частности сети, включающие комбинированное сравнение МТ, Байесовский метод получили гораздо большее развитие, что способствовало успеху в вычислении, которые поддерживают их вычисляемую интенсивность и необходимы для контроля конвергенции (схождения) последующего распределения. Lumley [18] описал максимальный вероятностный подход с использованием линейных смешанных моделей, его метод был применен в нескольких статьях [19—21].
Кратко, частотный анализ дает точечные оценки и доверительные интервалы. Типичный Байесовский анализ предоставляет эмпирическую версию для объединенного последующего распределения параметров, из которой выводятся суммарные значения для определенного параметра, такого как среднее значение и доверительный интервал (Crl) (например, конечная точка для 95% Crl — 2,5 и 97,5 перцентиль для последующего распределения), также как последующее распределение функции параметра (например, оценка вероятности, что каждый параметр — лучший). Байесовские Crls отражают неточности в установленной неоднородности, в то время как модели с использованием частотного подхода не передают эту неопределенность.
Выбор предварительного распределения является в некоторой степени произвольным и часто подвергается анализу чувствительности, что может быть особенно важно для оценки неоднородности в модели случайных эффектов Lambert et al. [22]. С другой стороны, некоторые частотные методы включают в себя приближение и допущения, которые не являются точно установленными или проверенными, как применяемые методы. Поэтому как представление о
чувствительности Байесовского анализа, так и предположения о точности и транспарентности представленных предположений, лежащих в основе частотного анализа, являются очень важными.
Валидация модели
Валидация предположений. Как было упомянуто ранее, все предположения должны быть проверены. Для того чтобы добиться сходства, исследователи могут использовать статистическую информацию, но они должны опираться, прежде всего, на клинические суждения о том, что различия между исследованиями могут оказывать влияние при сравнении МТ и их сравнение будет неправомерным.
Оценка однородности и постоянства (если сеть поддерживает как прямое, так и косвенное сравнение) должна быть указана как компонент анализа и отражать риски и преимущества объединения данных для конкретного вопроса исследователя.
Последующее обсуждение сопровождается кратким очерком настоящего утверждения о некоторых подходах изучения гомогенности и постоянства.
Традиционно при проведении мета-анализа (особенно частотного анализа) принято оценивать гетерогенность эффектов в качестве основы для выбора между моделью постоянных и случайных эффектов. Воге^!еш е! а1. [23] высказываются против рассмотрения модели постоянных эффектов как наилучшего выбора, объясняя это тем, что модели постоянных эффектов и модели редких эффектов отражают фундаментально разные предположения о распределении данных. Поэтому выбор должен быть сделан при понимании основных целей анализа и оценки того содержат ли изучаемые исследования общий эффект. Эти вопросы по меньшей мере важны при сетевом мета-анализе. Когда информация о неоднородности доступна в рамках прямого сравнения, ее рассмотрение может быть подготовительным шагом в сети мета-анализа, но прежде всего следует изучить потенциальные факторы, меняющие эффект, т. к. неравенство между исследованиями может препятствовать анализу сети. Общие единицы измерения гетерогенности при прямом сравнении — используемые в исследованиях оценки у. (I = 1, ..., к),
эффект и предполагаемая дисперсия оценки эффекта , чтобы сформировать взвешенную среднюю ут = (Его.у.)/Его.), где = 1/в22 (уш (с палочкой наверху) постоянный оцененный общий эффект). На основании этих данных статистическая 0 может быть посчитана по формуле:
о=ш - У* )2
либо передана хи-квадрат распределению к — 1 градусов свободы или посчитать разнородность в отношении I2 = [0 — (к — 1)]/0 [24]. I2 (обычно выражается в процентах) оценивает общую дисперсию среди установленных эффектов, обусловленную гетерогенностью: I2 < 30% свидетельствует о гетерогенности средней степени, I2 > 50% — признак значительной разнородности (гетерогенности). Deeks е1 а1. [25] обсуждают стратегию решения проблем, связанных с неоднородностью исследований. Важно оценить эффекты графически, чтобы представить группы и исключения; числовые меры и тесты должны иметь только второстепенное значение [9,26]. Известно, что применяемое для большой выборки приближение для распределения 0, не будет точно для выборки среднего размера. Таким образом, использование 0 для оценки гетерогенности должно быть заменено более точными тестами.
Отступление от последовательности возникает, когда прямые и косвенные оценки эффекта различаются (например, непосредственная оценка йВС не совпадает с косвенной оценкой, полученной от ^ас — ^ав ). Включенные методики и их сравнения должны принадлежать к определенной петле в сети доказательств, поэтому однородность - свойство преимущественно сети (петель), а не отдельных сравнений. Исследователи должны отличать отклонения от согласованности и определять, как их интерпретировать. Sa1ani е1 а1. [16] представили много ценных руководств. Многие агентства, в которых могли бы быть размещены в настоящее время результаты сетевого мета-анализа, требуют, чтобы прямые и косвенные оценки были посчитаны по отдельности, в результате чего была бы подтверждена однородность, прежде чем объединять прямые и косвенные доказательства.
Методы для оценки однородности активно исследовались. В сети, содержащей единичную
петлю (при отсутствии многоцелевых исследований), Bucher et al. [28] сравнили косвенные оценки эффектов терапии с соответствующими прямыми оценками (однако результирующий тест на однородность имеет недостатки, которые могут обусловить ненадежность полученных результатов). Для сетей, содержащих 2х-целевые исследования, содержащие петли, Lumley [18] представил частотную модель, в которой использован один параметр дисперсии с целью обобщения имеющихся несоответствий в сети. Lu и Ades [13] сосредоточились на структуре сети и расширили иерархическую Байесовскую модель путем добавления одного параметра к каждому независимому отношению последовательности. Путем сравнения моделей с и без этого параметра возможно оценить общую неоднородность, последующее распределение добавленного параметра показывает наличие неоднородности в различных петлях. Графическая оценка может быть использована для биржевой диаграммы Lam и Owen [29] изучали однородности между прямыми и непрямыми оценками. В иерархической Байесовской настройке Dias et al. [30] расширили подход Bucher et al. [28] до общей сети (без использования косвенных доказательств из многоцентровых исследований), путем получения взвешенной разницы между оценками из сети и прямым сравнением. Построив в последующем концентрацию из прямых, косвенных и сетевых доказательств, они показали, как прямые и косвенные доказательства объединяются в сеть доказательств. Для каждого эффекта, имеющего прямые доказательства Dias et al. [30], также разделяют информацию на прямую и косвенную и изучают последующее распределение разницы между результирующими прямыми и косвенными оценками. Они обсуждают, как проводить многоцелевые исследования в этом анализе.
Оценка соответствия модели. В частотном анализе меры соответствия анализа сходны с таковыми для прямых доказательств и зависят от мер конкретного исследования. Байесовский анализ обычно использует аномальность (единица измерения, основанная на доказательствах) — чем меньше остаточные отклонения, тем больше соответствие. Для сравнения моделей критерий информации об отклонении (КИО) добавили штрафной срок, равноценный эффективному числу параметров в модели [31]. Если модель
плохо соответствует, то графические техники помогут более детальному изучению.
Анализ чувствительности. При проведении анализа чувствительности необходимо сконцентрировать внимание на областях, имеющих наибольшую неопределенность. Потенциальные эффекты модификатора могут быть изучены путем стратификации на изменения дизайна исследования или исследуемой популяции. Сравнение между случайными и постоянными эффектами также может быть целесообразным. Байесовский анализ должен также изучить влияние выбора различного предварительного распределения.
Таблица 2
Перечень надлежащих исследовательских практик для проведения предоставления результатов сетевого мета-анализа
Пункты перечня Рекомендация(ии)
Стратегия поиска Следуйте обычным принципам систематического поиска литературы, удостоверьтесь в используемых терминах, литературе и временных рамках, избегайте использования специализированных данных Рассмотрите итерационные методы поиска для определения более высокого порядка косвенных сравнений, которые не вошли в первоначальный поиск, направленный на косвенные сравнения низшего уровня
Сбор данных Изложенные данные сети демонстрируют прямые и косвенные доказательства между технологиями, основанные на отчетах этих исследований Следуйте конкретным руководствам по сбору данных, используйте предварительно подготовленный протокол и формы для извлечения данных Включите достаточно подробные детали в форму извлечения данных из исследований, что позволит оценить их сопоставимость и однородность (например, характеристики пациентов и исследования, сравниваемые параметры и меры измерения результатов)
План статистического анализа Подготовьте план статистического анализа еще до проведения анализа, однако следует разрешить внесение изменений во время проведения анализа, если это необходимо Предоставьте пошаговое описание всех анализов, включая утверждения предположений и процедуру их проверки Опишите аналитические черты, специфичные для сетевого мета-анализа, включая однородность и гомогенность, синтез, анализ чувствительности, подгрупповой анализ и мета-регрессию, а также специфические типы результатов
Анализ данных Следуйте обычным руководствам по статистической диагностике модели Оцените наличие несоблюдения предположений о сходстве и неоднородности Если сходство или однородность являются проблемой, используйте мета-регрессионную модели, где технология *ко-вариантные вмешательства, что уменьшает смещение
Отчет Следуйте рекомендациям PRISMA для отчета по мета-анализу Точно указывайте научные исследовательские вопросы (например в разделе «Введение» или «Цели») Предоставьте графическое описанное сети доказательств Укажите программное обеспечение, используемое в анализе и предоставьте код (как минимум в он-лайн приложении)
Перечень документов для надлежащей клинической практики
Практика проведения и представления результатов систематического обзора и мета-анализа получила широкое обсуждение с середины 80-х годов. Были предложены руководства и рекомендации, последним из которых является отчет PRISMA. В связи с тем что сетевой мета-анализ имеет много общего с систематическим обзором и мета-анализом, мы рекомендуем соблюдать все применяемые части отчета PRISMA. В дополнение к табл. 2 идет перечень в части 1
[ 1 ] с выделенными ключевыми компонентами исследования в форме сетевого мета-анализа, зоны, в которых они имеют различные требования (часто дополнительные) и последнее развитие. Этот перечень мы приводим в свете текущего подробного изучения мета-анализа. Усовершенствование методов и их применение приведут к изменениям в перечне.
Наглядные примеры
Отдельный анализ части данных из 2 обширных мета-анализов иллюстрируют ITC (частотный и Байесовский подход) и сетевой мета-анализ. Этот раздел также описывает доступное программное обеспечение.
Settler et al. [32] сообщают о совместном сетевом мета-анализе результатов, связанных с двумя стентами, покрытыми лекарственными препаратами (паклитаксел-стент (ПАС) и сера-лимус-стент (СЕС) и металлическим стентом без покрытия (МСБП). В результате поиска было найдено 7 РКИ, в которых сравниваются ПАС и МСБП, 15 — сравнивающих СЕС и МСБП, 14 — СЕС и ПАС, и 1 в котором сравниваются все 3.
Анализ общей смертности и других первичных конечных точек является показательным примером Байесовской модели с эффектов для сети мета-анализов, включающих несколько последовательных раз [33]. Этот пример сфокусирован на частоте нарушения реваскуляризации в течение года (ТНР), анализе чувствительности вторичных конечных точек, под которыми подразумевается последующее чрескожное вмешательство.
В приложении к этой статье (found at doi: 10.1016/j.jval.2011.01.011) представлены детали Байесовский анализа нарушения реваскуля-ризации на шкале логарифмов шансов: прямой мета-анализ ПАС и МСБП, СЕС по сравнению с МСБП, и ПАС по сравнению c САС, соответствие отдельных непрямых сравнений, сравнение из сетевого мета-анализа и WinBUGS код и база данных.
На рис. 1 приведены данные из исследования по сравнению ПАС и СЕС, изучение специфичного отношения шансов ПАС по сравнению c СЕС (из Байесовского анализа) и пять оценок из общего отношения рисков: традиционные редкие эффекты попарно (используя метод ДерСимониан-Лайнд), Байесовский прямой, непрямой и сетевой метод (рис. 3, приложении
doi: 10.1016/j.jva1.2011.01.01 показано соотношение рисков ПАС по сравнению с СЕС). Для упрощения сравнения в табл. 3 представлены оценки. Обычные оценки постоянных и случайных эффектов и их доверительный интервал (95%) отличаются незначительно: 1,39 (1,17—1,66) и 1,38 (1,16—1,65). Интервал для редких эффектов не широкий, т. к. установлена небольшая неоднородность (I2 = 0,74%).
Для проведения надежной косвенной оценки соотношение рисков для ПАС по сравнению с СЕС, с использованием прямых оценок для ПАС по сравнению с МСБП и СЕС по сравнению с МСБП необходимо провести 3-целевое исследование или осуществить более сложное вычисление, которое подтвердит вклад этих исследований для прямых оценок. В табл. 3 в колонках справа приведены оценки без 3-целевого исследования. Постоянные и редкие эффекты косвенного сравнения аналогичные, 1,74 (1,28—2,36) и 1,70 (1,09—2,65) и однородность выше по сравнению с прямыми сравнениями. Доверительный
Таблица 3
Оценки (доверительный интервал 95 %) соотношения рисков для ПАС по сравнению с СЕС при нарушении реваскуляризации в течение года, с использованием данных о включении и исключении из трехцелевого исследования
Метод Все исследования Исключая трехцелевое исследование
Постоянные эффекты по- 1,39 1,45
парно (Mantel-Haenszel) (1,17—1,66) (1,21 — 1,74)
Редкие эффекты попар- 1,38 1,43
но (DerSimonian Laird) (1,16—1,65) (1,19—1,73)
Баейсоновский прямой 1,55 1,51
(1,17—2,05) (1,16—1,97)
Баейсоновский 1,60 1,80
косвенный (0,98—2,47) (1,14—2,73)
Баейсоновский сетевой 1,55 1,57
мета-анализ (1,22—1,96) (1,26—1,96)
Косвенный надежный — 1,74
постоянных эффектов (1,28—2,36)
— — 0,40
(1,32—0,49)
— — 0,23
(0,18—1,28)
— — 1,70
(1,09—2,65)
— — 0,39
(0,28—0,54)
— — 0,23
(0,17—0,31)
Comparison
PES vs. SEC
BASKET (25/281:25/264) Ctuvinka (2/33:1/37) CORPAL (25/321:22/321) Han (11/196:9/202) ISAR-SMART 3(29/180:16/180) ISAR-DESIRE (22/100:14/100) ISAR-DIABETES (15/125:9/125) Long DES II (18/250:6/250) Petronio 2007 (1/43:1/42) PROSIT (9/115:3/116) REALITY (43/669:44/684) SIRTAX (54/509:30/503) SORT OUT (46/1033:40/1065) TAXi (2/100:4/102) Zhang 2006 (16/187:14/225) FE Pairwise
RE Pairwise (Q:14,1 P:0,44 T2:0,74) Bay esian Direct Meta-Analy sis Bay esian Indirect Meta-Analy sis Bay esian Network Meta-Analy sis
Mean (95 % Cl)
0,93 (0,52 to 1,67) 2,32 (0,20 to 26,86)
1.19 (0,65 to 2,15) 1,28 (0,52 to 3,15) 1,97 (1,03 to 3,77) 1,73 (0,83 to 3,62) 1,76 ( 0,74 to 4,18) 3,16 (1,23 to 8,09) 0,98 (0,06 to 16,13)
3.20 (0,84 to 12,13) 1,00 (0,65 to 1,54) 1,87 (1,18 to 2,98) 1,19 (0,77 to 1,84) 0,50 (0,09 to 2,79) 1,41 (0,67 to 2,97) 1,39 (1,17 to 1,66) 1,38 (1,16 to 1,65) 1,55 (1,17 to 2,05) 1,60 (0,98 to 2,47) 1,55 (1,22 to 1,96)
T-1-1-1-1-Г
0,05 0,20 0,50 2,00 5,00 20,00 TLR (Odds Ratio (log scale))
Биржевая диаграмма для сравнения ПАС и СЕС против SES, иллюстрирующая данные отдельных исследований, и коэффициенты-соотношения масштаба, с фиксированными эффектами попарно (Mantel-Haenszel) и случайных эффектов попарно (DerSimonian-Laird) оценки и результаты байесовской сети мета-анализ прямые, косвенные и комбинированные доказательств
интервал косвенной оценки редких эффектов значительно шире, чем интервал оценки постоянных эффектов, оба они значительно выше, чем показатели прямой оценки. Все доверительные интервалы достаточно широкие, чтобы в дальнейшем анализе оценивать однородность между прямыми и непрямыми оценками.
Три Байесовские оценки: 1,55 (1,17—2,05), 1,60 (0,98—2,47) и 1,55 (1,22—1,96) аналогичны и, в некоторой степени, выше, чем традиционные оценки постоянных и редких эффектов. Непрямая оценка имеет широчайший доверительный интервал. И, что имеет большее значение, оценка, полученная в результате Бейсонов-ского сетевого мета-анализа имеет в некоторой степени более узкий доверительный интервал, чем Байесовское прямое сравнение, как следствие учета всех доказательств в сети. Мы сообщаем, что эта оценка составляет 1,55 (1,22—1,96 как соотношение рисков ПАС и CEC.
Чтобы предоставить более яркую иллюстрацию некоторых аспектов сетевого мета-анализа (например, корреляцию между оценками и вероятностью, что эта технология является наилучшей) в приложении (doi: 10.1016/j.jval.2011.01.011 ) также проанализированы данные сети, состоящие из 112 РКИ, в которых сравниваются (в совокупности) приемлемость 12 антидепрессантов нового поколения для лечения острой фазы униполярной депрессии [34].
Программное обеспечение
Мы использовали WinBUGS для проведения Байесовских анализов в этом примере [35]. Другое программное обеспечение для Байесовского анализа включало OpenBUGS [36]. Версия 9.2 SAS [37] включает процедуру для Марковской модели Монте-Карло, но примеры в документации, как представляется, не включают применения в мета-анализе. Частотный метод был разработан Lamley [18] в R с использование линейной смешанной модели и также возможно применение в SAS с использованием PROC NLMIXED [38].
Области для последующих исследований
Исследователи разработали существенное количество методов для сетевого мета-анализа, но число тем будет развиваться в зависимости от последующих исследований. В этом разделе об-
суждается 8 из них, приблизительно в порядке приоритетности.
Корректировки по повышению
сходства испытаний и эмпирической оценки их пользы
Исследования с участием пациентов в различных исследованиях могут сравниваться. Если разница между исследованиями заключается в модификаторах эффектов МТ, то ITC не является объективным [39]. Также в сетевом мета-анализе различные типы сравнения могут быть неоднородными [12]. Ввиду того что число исследований, как правило, ограничено, регулировка путем включения ко-вариантов с помощью обычных мета-регрессионных подходов может быть неудовлетворительной [38—40]. Ограничения или недопущения ко-вариантов на уровне исследования (или эффектов для возможных модификаторов эффекта) усложняют анализ. Последующие исследования должны изучать как ценность существующих методов, так и уровень однородности предоставляемых на уровне исследования ко-вариантов.
Структура и свойства сети
Изучение геометрии сети технологий для четырех или большего количества вмешательств Salavanti et al. [2] используют два измерения из экологической литературы: разнообразие и совместное появление. Разнообразие характеризуется числом вмешательств и для сетей с одинаковым количеством вмешательств, частотой распространения вмешательств. Совместно возникающие единицы измерения — проявление специфических парных комбинаций вмешательств. Эти меры позволяют 1) сравнивать сети различных размеров с сетью особой формы и 2) информировать о наличии потенциальных отклонений в оценке или докладах о конкретных сравнениях.
Не известно, являются ли лучшими мерами для характеристики свойств сетей оценки их корреляции с оценками эффектов гетерогенности, сходства или однородности.
Методы проверки предположений об однородности
Как уже обсуждалось выше, большое число подходов, включая графический, были разрабо-
таны, чтобы достичь однородности в сетевом мета-анализе. Salanti et al. [16] и Dias et al. [30] обсудили сильные и слабые стороны этих подходов. Необходимы последующие исследования, чтобы улучшить понимание этих методов и поддержать их применение. Как отметил Salanti et al. [16], мера для оценки неоднородности аналогичная I2 будет желательным дополнением.
Множественные результаты
В мета-анализах, целью которых является рассмотрение нескольких результатов, это обычно выполняется в отдельных анализах. Однако интуитивно, т. к. множественные «конечные точки обычно коррелируют, в рассмотрение также следует взять эффективность и точность» [41]. Хотя этот подход был удостоен большого внимания в последние годы [42—44], он еще не был использован для сетевого мета-анализа, в котором анализируются несколько конечных точек [45].
Lu et al. [33] продемонстрировали, как объединять данные, записанные в разные моменты времени, эти методы могут быть распространены с целью оценки эффектов терапии в отдельные моменты времени и корреляции нескольких наблюдений. Это будет предпочтительно для модели «затраты—эффективность», где вероятность перехода меняется с течением времени.
Исторически мета-анализ объединял исследования на основании общей суммарной меры (например, среднее отклонение от основной линии) и исключал исследования, в которых была представлена та же единица измерения, но каким-то иным способом (например, среднее отклонение). Метод объединения альтернативных суммарных измерений недавно был предложен с целью минимизации потенциального выбора или сообщения об отклонениях: Welton et al. [46] представили метод объединения среднего отличия от базовой линии и среднего отклонения в различных исследованиях. Woods et al. [47] представили метод для объединения двойных данных о смертности с данными об отношении рисков различных исследований в одном мета-анализе.
Такой подход охватывает больше исследований, чем отдельный анализ для каждого суммарного измерения и максимизирует подключение к сети. Структуры по оценке медицинских технологий, такие как Национальный институт качественной клинической практики (NICE), мо-
гут рассмотреть возможность использования одного суммарного метода (тем самым, исключая отдельные исследования) как средство потенциального отбора смещений и настаивать на включении различных суммарных значений тех же конечных точек в пределах одного и того же анализа, если это доступно [46—48]. Дальнейшая исследовательская работа необходима, чтобы объединить различные суммарные измерения одних и тех же конечных точек.
Как решить проблему неоднородности в случае небольшого количества исследований для конкретной технологии
Многие сетевые мета-анализы включают в себя слишком малое количество исследований, чтобы их применять, или случайные эффекты [8], или мета-регрессию [12]. Результирующая над-спецификация (число параметров, подлежащих оценке, превышает количество исследований) может заставить аналитика использовать модели постоянных эффектов в случае наличия неоднородности Cooper et al. [12].
Размер сети: пространство доказательств против пространства решения
Практикующий специалист может спросить «Есть ли прямой путь решения относительно размера сети? Какой размер считать удовлетворительным?» Понятие о размере включает в себя как число исследований, так и количество МТ. Если исследований слишком мало, в анализе не могут быть использованы случайные эффекты или мета-регрессия. Однако включение слишком большого количества исследований увеличивает уровень неоднородности, что потенциально может обусловить появление вмешивающихся факторов. С одной стороны, утвержденная МТ может входить во множество исследований. Размер сети зависит от МТ и контраста технологии [33], сравниваемых технологий (компараторах), неточностей, размере выборки, гомогенности, качестве информации и точной популяции пациентов [33]. Также возможно, что размер сети должен зависеть от точного уровня вмешивающихся факторов. Хотя метод может объяснять несоответствия и надежность результатов, полученных в конкретной сети, может быть оценена с помощью анализа чувствительности, много вопросов относительно того, какую сеть считать наилуч-
шей и какого она должна быть размера остаются открытыми. В том числе, как сбалансировать все существующие данные с целью минимизации непоследовательности и неоднородности среди исследований и в популяции. Улучшение транспарентности в развитии сети и использования сетевого мета-анализа поможет неспециалистам (например, лицам, принимающим решения в системе здравоохранения) понять процесс исследования, методологию и результаты [39,49]. Sutton et al. [49] предположили, что руководство по развитию надежной сети может основываться на мнении клинических экспертов или статистическом/экономическом рассмотрении эффективности или показателе «затраты-эффек-тивность» в отношении доходов от расширения сети. Эти вопросы требуют дальнейшей разработки и, возможно, набора стандартизированных критериев.
Индивидуальные данные пациентов
в сетевом мета-анализе
Мета-анализ индивидуальных данных пациентов (ИДП) считается «золотым стандартом», т. к. он предоставляет возможность изучать различия эффектов в подгруппах [50,51]. Также и сетевой мета-анализ, основанный на ИДП, можно считать наилучшим вариантом. Когда ИДП доступны, мета-регрессионные модели обычно имеют достаточную силу для оценки гетерогенности и повышения однородности. Помимо потенциально сомнительно соответствующих, корректировка на основе совокупного уровня ко-вариантов может привести к экологическому (естественному) смещению. Эту проблему можно устранить путем использования ИДП или минимизировать за счет использования ИДП для подпунктов исследования [53]. Следует оценить добавленную ценность использования ИДП в сетевом мета-анализе, чтобы разработать рекомендации по обоснованности и целесообразности их использования.
Последующее развитие частотных методов
Для сетевого мета-анализа в некоторых более сложных сетях доказательств, особенно в которые включены многоцелевые исследования, частотные методы не достаточно хорошо развиты и доступны по сравнению с Байесовскими мето-
дами. Их последующее развитие будет полезно пользователям, которые предпочитают применять частотные методы. Потенциальные подходы должны включать точное распределение и оценку на основе доверительного интервала [54,55]. Также некоторые широко используемые методы мета-анализа основываются на приближении или предположении. Например, оценка постоянных и случайных эффектов МТ (взвешенное среднее) предполагает, что взвешенное основывается на приблизительной дисперсии эффекта на уровне исследования и достаточно близко к взвешенному показателю истинной дисперсии и предполагаемые отклонения не коррелируют с предполагаемым эффектом. Методы постоянных и случайных эффектов, как правило, неудовлетворительны, особенно когда размеры выборки отдельных исследований небольшие [56—59]. Необходим тщательный анализ эмпирических доказательств.
ЗАКЛЮЧЕНИЕ
В настоящей статье, являющейся 2-й частью отчета Рабочей группы, изложены лучшие практические рекомендации для специалистов, заинтересованных в проведении сетевого мета-анализа. Представлены основные статистические методы, которые подкреплены примерами, предлагающими способы представления результатов непрофильным аудиториям. Эти методы не всегда применимы и могут быть предметом обсуждения и ограничения, что также представлено в отчете. Неудачные предположения о сходстве и однородности могут привести к получению сомнительных результатов. В случае если метод может быть применен, необходима осторожность и применение транспарентности, мы также рекомендуем соблюдение контрольного списка. Стандартизация методов позволит в целом повысить достоверность и применяемость методов косвенного сравнения и сетевого мета-анализа. И, наконец, проводимые исследования в разных областях должны привести к регулярному пересмотру рекомендаций.
ЛИТЕРАТУРА
1. Jansen J.P., Fleurence R., Devine B. et al. Interpreting indirect treatment comparisons & network meta-analysis for health care decision-making: Report of the ISPOR Task
Force on Indirect Treatment Comparisons Good Research Practices—part 1. Value. Health 2011; 14: XX—XX.
2. Salanti G., Kavvoura F.K., Ioannidis J.P. Exploring the geometry of treatment networks // Ann Intern Med 2008. V. 148. P. 544—53.
3. Sutton A.J., Abrams K.R., Jones D.R. et al. Methods for Meta-Analysis in Medical Research. Chichester, UK: John Wiley & Sons, Ltd., 2000.
4. Higgins J.P.T., Green S. Cochrane Handbook for Systematic Reviews of Interventions. Chichester, UK: John Wiley & Sons, Ltd., 2008.
5. Borenstein M., Hedges L.V., Higgins J.P.T., Rothstein H.R. Introduction to Meta-Analysis. Chichester, UK: John Wiley & Sons, Ltd., 2009.
6. Moher D., Liberati A., Tetzlaff J., Altman D.G. Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement // Ann Intern Med. 2009. V. 151. P. 264—9.
7. Hawkins N., Scott D.A., Woods B. How far do you go? Efficient searching for indirect evidence // Med Decis Making. 2009. V. 29. P. 273—81.
8. Hawkins N., Scott D.A., Woods B.S., Thatcher N. No study left behind: a network meta-analysis in non-small-cell lung cancer demonstrating the importance of considering all relevant data // Value Health. 2009. V. 12. P. 996—1003.
9. Fu R., Gartlehner G., Grant M. et al. Conducting quantitative synthesis when comparing medical interventions: AHRQ and the Effective Health Care Program. [posted October 2010]. Available from: http://effectivehealthcare. ahrq.gov/. [Accessed November 20, 2010].
10. Song F., Loke Y.K., Walsh T. et al. Methodological problems in the use of indirect comparisons for evaluating healthcare interventions: survey of published systematic reviews // BMJ. 2009. V. 338 P. 1147.
11. Lu G., Ades A.E. Combination of direct and indirect evidence in mixed treatment comparisons // Stat Med. 2004. V. 23. P. 3105—24.
12. Cooper N.J., Sutton A.J., Morris D. et.al. Addressing be-tween-study heterogeneity and inconsistency in mixed treatment comparisons: application to stroke prevention treatments in individuals with nonrheumatic atrial fibrillation // Stat Med. 2009. V. 28. P. 1861—81.
13. Lu G., Ades A.E. Assessing evidence inconsistency in mixed treatment comparisons // J Am Stat Assoc 2006. V. 101. P. 447—59.
14. Thompson S.G., Smith T.C., Sharp S.J. Investigating underlying risk as a source of heterogeneity in meta-anal-ysis // Stat Med. 1997. V. 16. P. 2741—58.
15. Wells G.A., Sultan S.A., Chen L. et al. Indirect Evidence: Indirect Treatment Comparisons in Meta-Analysis. Ottawa, Canada: Canadian Agency for Drugs and Technologies in Health, 2009.
16. Salanti G., Higgins J.P., Ades A.E., Ioannidis J.P. Evaluation of networks of randomized trials // Stat Methods Med Res. 2008. V. 17. P. 279—301.
17. Sutton A.J., Abrams K.R. Bayesian methods in meta-anal-ysis and evidence synthesis // Stat Methods Med Res. 2001. V. 10. P. 277—303.
18. Lumley T. Network meta-analysis for indirect treatment comparisons // Stat Med. 2002. V. 21. P. 2313—24.
19. Valk R., Webers C.A., Lumley T. et al. A network meta-analysis combined direct and indirect comparisons between glaucoma drugs to rank effectiveness in lowering intraocular pressure // J. Clin. Epidemiol. 2009. V. 62. P. 1279—83.
20. Elliott W.J., Meyer P.M. Incident diabetes in clinical trials of antihypertensive drugs: a network meta-analysis // Lancet. 2007. V. 369. P. 201—7.
21. Psaty B.M., Lumley T., Furberg C.D. et al. Health outcomes associated with various antihypertensive therapies used as first-line agents: a network meta-analysis // JAMA. 2003. V. 289. P. 2534—44.
22. Lambert P.C., Sutton A.J., Burton P.R. et al. How vague is vague? A simulation study of the impact of the use of vague prior distributions in MCMC using WinBUGS // Stat Med. 2005. V. 24. P. 2401—28.
23. Borenstein M., Hedges L.V., Higgins J.P.T., Rothstein H.R. A basic introduction to fixed-effect and random-effects models for metaanalysis // Res Synthesis Methods. 2010. V. 1. P. 97—111.
24. Higgins J.P., Thompson S.G. Quantifying heterogeneity in a metaanalysis // Stat Med. 2002. 21. P. 1539—58.
25. Deeks J.J., Higgins J.P.T., Altman D.G. Analysing data and undertaking meta-analyses. In: Higgins JPT, Green S., eds., Cochrane Handbook for Systematic Reviews of Interventions. Chichester, UK: John Wiley & Sons, Ltd., 2008.
26. Rucker G., Schwarzer G., Carpenter J.R., Schumacher M. Undue reliance on I2 in assessing heterogeneity may mislead // BMC Med Res Methodol. 2008. V. 8. P. 79.
27. Kulinskaya E., Dollinger M.B., Bj0rkest0 L.K. Testing for homogeneity in meta-analysis I. The one-parameter case: standardized mean difference. Biometrics 2011. V. 67. P. 203—12.
28. Bucher H.C., Guyatt G.H., Griffith L.E., Walter S.D. The results of direct and indirect treatment comparisons in me-ta-analysis of randomized controlled trials // J Clin Epidemiol. 1997. V. 50. P. 683—91.
29. Lam S.K.H., Owen A. Combined resynchronisation and implantable defibrillator therapy in left ventricular dysfunction: Bayesian network meta-analysis of randomised controlled trials // BMJ. 2007. V. 335. P. 925.
30. Dias S., Welton N.J., Caldwell D.M., Ades A.E. Checking consistency in mixed treatment comparison meta-analysis // Stat Med. 2010. V. 29. P. 932—44.
31. Spiegelhalter D.J., Best N.G., Carlin B.P. Bayesian measures of model complexity and fit // J R Stat Soc Series B Stat Methodol. 2002. V. 64. P. 583—616.
32. Stettler C., Wandel S., Allemann S. et al. Outcomes associated with drug-eluting and bare-metal stents: a collaborative network metaanalysis // Lancet. 2007. V. 370. P. 937—48.
33. Lu G., Ades A.E., Sutton A.J. et al. Meta-analysis of mixed treatment comparisons at multiple follow-up times // Stat Med. 2007. V. 26. P. 3681—99.
34. Cipriani A., Furukawa T.A., Salanti G. et al. Comparative efficacy and acceptability of 12 new-generation antidepressants: a multipletreatments meta-analysis // Lancet. 2009. V. 373. P. 746—58.
35. Spiegelhalter D.J., Thomas A., Best N.G., Lunn D. Win-BUGS User Manual, Version 1.4. Cambridge, UK: MRC Biostatistics Unit, 2002.
36. OpenBUGS. Available from: www.openbugs.info. [Accessed December 6, 2010].
37. SAS Institute Inc. SAS/STAT User's Guide, version 9.2. Cary, NC: SAS Institute Inc., 2008.
38. Glenny A.M., Altman D.G., Song F., et al. Indirect comparisons of competing interventions // Health Technol. Assess. 2005. V. 9 (26).
39. Jansen J.P., Crawford B., Bergman G., Stam W. Baye-sian meta-analysis of multiple treatment comparisons: an introduction to mixed treatment comparisons // Value Health. 2008. V. 11. P. 956—64.
40. Berlin J.A., Santanna J., Schmid C.H. et al. Individual patient- versus group-level data meta-regressions for the investigation of treatment effect modifiers: ecological bias rears its ugly head // Stat Med. 2002. V. 21. P. 371—87.
41. Berkey C.S., Hoaglin D.C., Mosteller F., Colditz G.A. A random-effects regression model for meta-analysis // Stat Med. 1995. V. 14. P. 395—411.
42. Houwelingen H.C., Arends L.R., Stijnen T. Advanced methods in meta-analysis: multivariate approach and me-ta-regression // Stat Med. 2002. V. 21. P. 589—624.
43. Nam I.S., Mengersen K., Garthwaite P. Multivariate meta-analysis // Stat Med 2003. V. 22. P. 2309—33.
44. Riley R.D., Abrams K.R., Lambert P.C. et al. An evaluation of bivariate random-effects meta-analysis for the joint synthesis of two correlated outcomes // Stat Med. 2007. V. 26. P. 78—97.
45. Welton N.J., Caldwell D.M., Adamopoulos E., Vedhara K. Mixed treatment comparison meta-analysis of complex interventions: psychological interventions in coronary heart disease // Am J. Epidemiol. 2009. V. 169. P. 1158—65.
46. Welton N.J., Cooper N.J., Ades A.E. et al. Mixed treatment comparison with multiple outcomes reported inconsistently across trials: evaluation of antivirals for treatment of influenza A and B // Stat Med. 2008. V. 27. P. 5620—39.
47. Woods B.S., Hawkins N., Scott D.A. Network meta-anal-ysis on the loghazard scale, combining count and hazard ratio statistics accounting for multi-arm trials: a tutorial // BMC Med Res Methodol. 2010. V. 10. P. 54.
48. Burch J., Paulden M., Conti S. et al. Antiviral drugs for the treatment of influenza: a systematic review and economic evaluation // Health Technol Assess. 2009. V. 13 (58).
49. Sutton A., Ades A.E., Cooper N., Abrams K. Use of indirect and mixed treatment comparisons for technology assessment // Pharmacoeconomics. 2008. V. 26. P. 753—67.
50. Stewart L.A., Clarke M.J. Practical methodology of me-ta-analyses (overviews) using updated individual patient data // Stat. Med. 1995. V. 14. P. 2057—79.
51. Sutton A.J., Higgins J.P.T. Recent developments in metaanalysis // Stat Med 2008. V. 27. P. 625—50.
52. Greenland S., Morgenstern H. Ecological bias, confounding, and effect modification // Int. J. Epidemiol. 1989. V. 18. P. 269—74.
53. Lambert P.C., Sutton A.J., Abrams K.R., Jones D.R. A comparison of summary patient-level covariates in metaregression with individual patient data meta-analysis // J. Clin. Epidemiol. 2002. V. 55. P. 86—94.
54. Xie M., Singh K., Strawderman W.E. Confidence distributions and a unifying framework for meta-analysis // J. Am. Stat. Assoc. 2011. V. 106. P. 320—33.
55. Agresti A. Score and pseudo-score confidence intervals for categorical data analysis. Stat Biopharm Res In press.
56. Brockwell S.E., Gordon I.R. A comparison of statistical methods for meta-analysis // Stat Med. 2001. V. 20. P. 825—40.
57. Sánchez-Meca J., Márin-Martínez F. Confidence intervals for the overall effect size in random-effects meta-analysis // Psychol Methods. 2008. V. 13. P. 31—48.
58. Jackson D. The significance level of the standard test for a treatment effect in meta-analysis // Stat. Biopharm. Res. 2009. V. 1. P. 92—100.
59. Shuster J.J. Empirical vs natural weighting in random effects metaanalysis // Stat Med. 2010. V. 29. P. 1259—65; commentary and reply. P. 1266—81.