<
со
о
(Г)
со S
с; <
X <
ск
<
CQ О CZ
ш ^
и и
24
Методология
Роль и место статистического анализа в современных медицинских исследованиях
О. Ю. Реброва
М00 «Общество специалистов доказательной медицины», Москва
РЕФЕРАТ: Применение методов статистики не должно ограничиваться анализом накопленных в ходе исследования данных. Статистическое сопровождение медицинских исследований должно осуществляться на всем его протяжении: на этапе планирования (определение задач, дизайна исследования, объемов выборок, разработка протокола, графика, формирование групп), на этапах сбора данных, их анализа, представления результатов исследования в публикациях.
КЛЮЧЕВЫЕ СЛОВА: статистический анализ, медицинские исследования, клинические исследования, статистическое сопровождение
CL
О ш -Q Ш
О
О с; О х X ш
О X
а
ш
До настоящего времени распространенным является мнение о том, что применение методов статистического анализа должно ограничиваться анализом накопленных в ходе исследования данных. Однако с современных позиций такие представления могут считаться устаревшими.
Следование концепции доказательной медицины, получившей свое развитие и признание в последние 20 лет, заключается в стремлении врача использовать в своей практике научно обоснованные методы профилактики, диагностики и лечения. Научная же обоснованность того или иного медицинского вмешательства может быть получена в ходе правильно организованного и проведенного исследования, его эффективности и безопасности. Что же подразумевается под правильной организацией и проведением исследования? Прежде всего это адекватность методологии исследования (дизайна и методов) его задачам. Однако соответствие дизайна исследования задачам является абсолютно необходимым, но недостаточным условием правильности исследования. Не менее важную роль играет статистическое сопровождение исследования на всех его этапах.
По-видимому, ни у кого не вызывает сомнения, что методы статистического анализа не менее просты, чем методы иммунохимии или томографии, и должны применяться специалистами в данной области. К сожалению, в России число таких специалистов в настоящее время крайне невелико, что не способствует качеству проводимых исследований и надежности их результатов. Об этом свидетельствуют исследования публикаций ведущих российских медицинских журналов в аспекте корректности выполнения статистического анализа авторами [1, 2], а также постоянно обновляющиеся материалы раздела «Кунсткамера» сайта www.bio-
metrika.tomsk.ru. Такая ситуация связана с тем, что даже в аспирантуре медикам по-прежнему не преподается статистический анализ данных. Конечно, в серьезных клинических исследованиях медицинских вмешательств такая ситуация является неприемлемой, поскольку делает выводы об эффектах, не обоснованными научно. Более того, может возникать обеспокоенность по поводу этичности проводимых исследований. В настоящее время за рубежом считается общепризнанным, что неправильно проведенное исследование является неэтичным по крайней мере по следующим причинам:
1) участники (как люди, так и животные) в ходе такого исследования подвергаются неоправданному риску;
2) неэффективно используются финансовые ресурсы, время исследователей и т.п., которые могли бы быть потрачены на решение других проблем;
3) после публикации неверных результатов дальнейшие исследования направляются в неправильное русло;
4) применение неверных результатов исследования в медицинской практике может нанести вред больным.
В отношении клинических испытаний наиболее общие требования по применению статистики были установлены рекомендациями стандарта надлежащей клинической практики (good clinical practice, GCP) в 1996 г. (International Conference on Harmonization of Technical Requirements for Registration of Pharmaceuticals for Human Use (ICH) E6). Многие вопросы, связанные со статистическими принципами и методологией, затрагиваются и в других многочисленных рекомендациях ICH. Наиболее важным документом являются принятые в 1998 г. рекомендации «Статистические принципы
для клинических испытаний» («Statistical Principles for Clinical Trials», ICH E9).
Рассмотрим вопросы статистического сопровождения на различных этапах исследований.
1. Планирование исследования и разработка протокола
Этап планирования исследования является оптимальным для начала совместной работы со статистиком.
Определение цели и задач
Прежде всего авторам исследования нужно ответить на вопрос, направлено ли данное исследование на проверку научных гипотез (например, об эффективности медицинского вмешательства), либо на выдвижение научных гипотез (т.е. обнаружение новых, ранее неизвестных закономерностей). Конечно, в одном исследовании могут сочетаться обе эти цели, однако авторы должны четко разделять два этих компонента работы.
Исследования эффективности медицинских вмешательств (диагностических, лечебных, профилактических) относятся к первому типу. На данном этапе исследования нужно определить, какие именно из возможных гипотез будут проверяться: гипотезы преимуществ, эквивалентности или не уступающей эффективности, дозозависимости эффекта вмешательств. В каждом из этих вариантов исследований применяются свои статистические подходы.
При исследовании эффекта вмешательства необходимо определить основной (надежный, валиди-зированный) критерий оценки эффекта и величину ожидаемого эффекта, которая являлась бы клинически значимой, т.е. меняющей клиническую практику. При исследовании безопасности и переносимости вмешательства обычно определяется набор клинических признаков, лабораторных и инструментальных тестов, побочных эффектов, который затем анализируется в комплексе с преимущественным учетом ошибки 2-го рода.
В зависимости от целей и задач работы определяются целевая популяция, факторы, обеспечивающие репрезентативность выборки, правильное соотношение критериев включения и исключения.
Разработка дизайна исследования
В зависимости от поставленных задач необходимо определить, будет ли исследование одномоментным, либо динамическим, пассивным или активным, проспективным или ретроспективным.
Современные клинические испытания относятся к классу проспективных исследований с группой контроля, рандомизацией, маскированием вмешательства («ослеплением»). Они могут быть организованы разными способами, среди которых — параллельная, перекрестная, парная, последовательная, адаптивная структуры, факторный протокол и
др. Все перечисленные способы планирования исследования (кроме первого) достаточно сложны. Для планирования испытаний с такими типами структуры требуется участие статистика.
При разработке дизайна исследования стоит задача минимизировать возможные смещения (систематические ошибки), которые могут привести к неверной оценке эффекта.
Определение необходимых объемов выборок
В современных клинических исследованиях стоимость включения в исследование каждого больного велика, поэтому перед организаторами работы встает вопрос: какое минимально необходимое количество больных необходимо включить в исследование, чтобы этого было достаточно для доказательства существования эффекта вмешательства определенной (обычно клинически значимой) величины? Для ответа на это вопрос необходим расчет объема выборок, который может быть сделан на основе учета:
1) величины ожидаемого эффекта, который являлся бы клинически значимым;
2) установленного допустимого уровня статистической значимости (ошибки переоценки эффекта);
3) мощности исследования (зависящей от допустимой вероятности недооценки эффекта).
Разработка протокола и графика
Протокол, который должен быть разработан до начала исследования, а в ряде случаев и зарегистрирован уполномоченными организациями, должен отражать основные статистические аспекты исследования. Требуется заранее определить и конкретных специалистов-статистиков, о чем часто отечественные организаторы исследований забывают. Важно, чтобы протокол был согласован со статистиками, что помогает избежать ошибок, которые на более поздних этапах исследования уже исправить невозможно. Также важно, чтобы в графике проведения исследования было предусмотрено определенное время для анализа данных, обычно не менее 2 недель.
Всегда, когда это возможно, в протоколах надо предусматривать использование объективных методов измерения и стандартного представления данных: все измеряемые признаки должны быть измерены стандартными объективными методами, клинические признаки должны оцениваться с помощью принятых международных шкал и т.д.
Формирование несмещенных групп
Включение объекта в исследование осуществляется на основе применения критериев включения и исключения в исследование. Следующим этапом является определение, в которую из двух (или более) групп следует включить данный объект исследования. Двумя основными методами форми-
25
<
со
u
(Г)
со S
с; <
X <
к
<
CQ О с! ш
о о
26
CL
О ш -Q Ш
О
О с; О х X ш
О X
а
ш
рования несмещенных групп являются случайное распределение по группам и маскирование вмешательства.
Смысл случайного (т.е. непредсказуемого заранее) распределения по группам состоит в случайном распределении по группам таких признаков объектов наблюдения, которые потенциально могут влиять на величину эффекта, причем как заранее известных (таких, например, как возраст и пол), так и неизвестных.
Случайное распределение осуществляется применением рандомизации, которая является в настоящее время стандартной процедурой для контролируемых исследований медицинских вмешательств. Она проводится с использованием функции генератора случайных чисел, обычно реализованного в программных пакетах статистического анализа данных. Рандомизация обеспечивает случайное распределение объектов исследования по группам исследования, однако не гарантирует эквивалентности (сопоставимости) групп в случае их относительно небольшого объема. В таких ситуациях предпочтительно использовать различные модификации рандомизации - стратификационную, блоковую, кластерную и т.д.
Для распределения по группам (особенно в случае их небольшого объема) также может применяться процедура так называемой минимизации, обеспечивающая сопоставимость групп по нескольким прогностическим признакам (факторам), предположительно влияющим на исход. Минимизация основана на принципе снижения дисбаланса групп.
Правильное проведение процедур рандомизации и минимизации должно обеспечиваться специалистами в области статистики, поскольку технически бывают достаточно сложны.
Для оценки сопоставимости групп чаще всего проводится сравнение их основных исходных характеристик с помощью статистических критериев или тестов. Отсутствие исходных различий групп позволяет предполагать, что преимущество в эффективности испытываемого нового вмешательства или диагностического метода объясняется именно им, а не какими-либо различиями (несопоставимостью) исследуемых групп.
Маскирование вмешательства («ослепление») — это способ сведения к минимуму субъективности и тенденциозности в ходе проведения испытаний. Искажения могут возникать как от объектов, так и от субъектов исследования. Выделяют следующие степени маскирования: простое (больной не знает о применяемом к нему вмешательстве), двойное (не знают ни больной, ни врач) и тройное (не знают ни больной, ни врач, ни статистик). Примененная в исследовании степень маскирования пропорциональна степени объективности его результатов.
2. Сбор данных
Сбор данных в современных мультицентровых клинических исследованиях обычно проводится с использованием удаленного доступа к базе данных, разработанной организаторами исследования. При этом с помощью определенных технических средств обеспечивается конфиденциальность передаваемых персональных данных.
Важной проблемой является мониторинг собираемой информации. Здесь важно контролировать различные обстоятельства, среди которых — различные нарушения протокола, отклонения данных от заданных допустимых диапазонов их значений, несоответствие данных заданным форматам, пропуски данных, «выбросы» (сильно отклоняющиеся значения) данных, выбывание больных из динамического исследования.
Если объем выборки не был заранее спланирован в связи с недостатком информации об ожидаемой величине эффекта, то в процессе выполнения исследования может проводиться промежуточный анализ уже включенных наблюдений. В этом случае может быть обеспечена минимизация числа больных путем набора необходимого, но при этом достаточного числа больных для выявления необходимой величины эффекта. Возможно также регулирование критериев включения и исключения по ходу исследования, если возникают трудности с набором больных.
В длительных динамических исследованиях существенна проблема выбывания больных из-под наблюдения по разным причинам, приводящего, в частности, к возникновению дисбаланса исходно сопоставимых групп. Оценка существенности выбывания также должна выполняться с помощью статистического анализа данных.
3. Анализ данных
Данный этап работы является наиболее типичным периодом привлечения статистиков к выполнению исследования. Безусловно, это неверный подход, поскольку ошибки в планировании исследования и сборе данных первичны. Если структура исследования неадекватна задачам исследования и чревата систематическими ошибками, то даже самый совершенный статистический анализ не обеспечит научно обоснованных результатов. Существует английская поговорка: «garbage in, garbage out», т.е. «из мусора конфетку не сделаешь». Существует и другая опасность: статистический анализ может придавать исследованию наукообразность, т.е. «обманчивую внешность», вводящую в заблуждение читателя. Поэтому профессиональные специалисты-статистики не берутся за обработку заведомо некачественных исходных данных.
Столь же драматична ситуация, когда исследование спланировано правильно, но статистический
анализ проведен плохо. Ошибки в статистическом анализе ведут к неверным выводам.
Анализ данных состоит из следующих основных этапов:
• проверка данных (логический и формальный контроль);
• выполнение предварительных расчетов и преобразований данных (вычисление коэффициентов и функций, кодирование градаций, логарифмирование данных и др.);
• определение подходов к анализу данных в клинических испытаниях (по назначенному либо фактически полученному лечению);
• выбор адекватных задачам исследования статистических тестов для анализа данных с учетом типов данных, свойств выборок, априорных предположений;
• описательная статистика;
• расчет доверительных интервалов;
• проверка статистических гипотез (первичный анализ данных);
• анализ в подгруппах, анализ ковариат (вторичный анализ данных).
Каждый из перечисленных этапов содержит свои трудности и, безусловно, должен выполняться с полным пониманием существа работы, что требует привлечения специалистов в области статистического анализа данных. Особую сложность обычно представляют корректные интерпретация результатов статистического анализа и формулировка выводов. При этом должны приниматься во внимание обобщаемость и достоверность исследования.
4. Представление результатов в публикациях и отчетах
Описание процедуры и результатов статистического анализа данных в статьях, отчетах, диссертациях должно соответствовать установившимся в мировой медицинской научной литературе канонам. Так, для исследований нового диагностического метода рекомендуется использовать описание в соответствии с соглашением БТАКЭ — «Стандартом отчета об исследованиях диагности-
ческой точности» (www.stard-statement.org). При подготовке отчетов о рандомизированных клинических испытаниях следует ориентироваться на соглашение CONSORT — «Консолидированные стандарты отчета о клинических испытаниях» (www.consort-statement.org) и рекомендации ICH E3 «Структура и содержание отчетов о клинических испытаниях». Первые два упомянутых документа носят рамочный характер и включают лишь основные требования к представлению результатов статистического анализа, включая подготовку рисунков и таблиц. Существуют и другие многочисленные рекомендации и руководства по описанию процедуры и результатов статистического анализа. Следует подчеркнуть, что весьма важным является представление результатов в форме, пригодной для их последующего включения в количественные метаанализы.
Таким образом, статистическое сопровождение медицинских исследований должно осуществляться на всем его протяжении, начиная от этапа планирования и заканчивая подготовкой публикаций и отчетов, за которые статистик несет ответственность наравне с другими авторами исследования.
ЛИТЕРАТУРА
1. Зорин Н. А., Немцов А. В. Формализованная экспертная оценка качества исследовательских публикаций в психиатрии. Ж. неврологии и психиатрии им. С. С. Корсакова 2001;3:64-68.
2. Реброва О. Ю. Динамика качества представления результатов статистического анализа в оригинальных статьях журнала «Проблемы эндокринологии» за 1999-2006 гг. Проблемы эндокринологии 2007;53(5):31 -33.
Сведения об авторе:
Реброва Ольга Юрьевна
председатель Московского отделения М00 «Общество специалистов доказательной медицины», д-р мед. наук
Адрес для переписки:
125367 Москва, Волоколамское шоссе, д. 80 Телефон: +7 (495) 490-2036. E-mail: [email protected]
27
RESEARCH. ANALYSIS. EXAMINATION
Methodology
The role and place of statistical analysis in modern medical research
O. Yu. Rebrova
Application of statistical methods should not be limited to the analysis of data gathered in the research. Statistical support for medical research should be carried out over it's whole period: in the stage of planning (problem definition and research design, sample size, protocol development, scheduling, and group enrolment), in the data collection phase, in the stage of data processing and analysis, and presentation of the results in publications.
Keywords: statistical analysis, medical research, clinical trial, statistical support.