Научная статья на тему 'Критерии достоверности диагностических и скрининговых технологий в биомедицине'

Критерии достоверности диагностических и скрининговых технологий в биомедицине Текст научной статьи по специальности «Математика»

CC BY
549
230
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
диагностическая технология / биомедицина / ЧУВСТВИТЕЛЬНОСТЬ / СПЕЦИФИЧНОСТЬ / прогностическая ценность

Аннотация научной статьи по математике, автор научной работы — Недугов Г. В.

В статье приведен критический анализ используемых в медицине критериев достоверности диагностических и скрининговых технологий. Показана зависимость показателей прогностической ценности положительного и отрицательного результатов от популяционной распространенности диагностируемого состояния. Предложены модифицированные критерии прогностической ценности, толерантные к колебаниям популяционных частот идентифицируемых состояний. Выведены формулы апостериорных вероятностей ложноположительной и ложноотрицательной диагностики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Критерии достоверности диагностических и скрининговых технологий в биомедицине»

© Г.В. Недугов, 2009 УДК 61:001.8

Г.В. Недугов

КРИТЕРИИ ДОСТОВЕРНОСТИ ДИАГНОСТИЧЕСКИХ И СКРИНИНГОВЫХ ТЕХНОЛОГИЙ В БИОМЕДИЦИНЕ

ГУЗ «Самарское областное бюро судебно-медицинской экспертизы (начальник - проф. А.П. Ардашкин)

В статье приведен критический анализ используемых в медицине критериев достоверности диагностических и скрининговых технологий. Показана зависимость показателей прогностической ценности положительного и отрицательного результатов от популяционной распространенности диагностируемого состояния. Предложены модифицированные критерии прогностической ценности, толерантные к колебаниям популяционных частот идентифицируемых состояний. Выведены формулы апостериорных вероятностей ложноположительной и ложноотрицательной диагностики.

Ключевые слова: диагностическая технология, биомедицина, чувствительность, специфичность, прогностическая ценность.

CONFIDENCE CRITERIA OF DIAGNOSTIC AND SCREENING BIOMEDICAL TESTS

G.V. Nedugov

In article criticism been used in the medicine of confidence criteria of diagnostic and screening tests is led. The dependence of the indicators of predictive positive and negative value from population rate of identifiable state is showed. The modified criteria of predictive value, tolerance to the movement of population frequencies of identifiable state are proposed. Out the formulae of after-the-event probability of false-positive and false-negative diagnostic tests are carried.

Key words: diagnostic test, biomedicine, sensitivity, specificity, predictive value.

Понятие достоверности диагностических и скрининговых технологий (ДСТ) в биомедицине является многозначным и включает в себя комплекс различных критериев. К числу основных компонентов данного комплекса относятся следующие характеристики: чувствительность, специфичность, прогностическая ценность положительного (ПЦПР) и отрицательного (ПЦОР) результатов, индекс точности (ИТ) и отношение правдоподобия положительного результата (ОППР) [1, 2, 6, 7]. Каждый из указанных критериев представляет собой определенный вероятностный показатель, определяемый статистически.

Основная идея статистического оценивания достоверности ДСТ заключается в том, что при идентификации какого-либо состояния С в тестовой выборке объектов с заранее известной принадлежностью каждого из них к одному из двух взаимно исключающих классов с наличием или отсутствием С возможны 4 типа результатов: истинно положительные, ложноположительные, ложноотрицательные и истинно отрицательные [1, 2]. С учетом этого показатели достоверности ДСТ можно охарактеризовать следующим образом.

Пусть а, Ь, с, й - количество истинно положительных, ложноположительных, ложноотрицательных и истинно отрицательных результатов диагностики состояния С у объектов тестовой выборки (см. табл.). Тогда ключевые критерии достоверности ДСТ определяются формулами: чувствительность - а/(а+с), специфичность - й/(Ь+й), ПЦПР - а/(а+Ь), ПЦОР - й/(с+й), ИТ - (а+й)/(а+Ь+с+й) и ОППР - (аЬ+ай)/(аЬ+Ьс). При этом чувствительность, специфичность и ОППР отражают достоверность диагностической технологии в целом, ничего не говоря об интерпретации результатов диагностики состояний С или в отношении отдельного объекта [2].

Возможные результаты тестирования достоверности ДСТ

Результат ДСТ Наличие диагностируемого состояния С

С: а + с С : Ъ + d *

Положительный а + b а + - р Истинно положительный а і - р Ложноположительный b а

Отрицательный с + d Р + - а Ложноотрицательный с в Истинно отрицательный d і - а

наличия или отсутствия состояния С у объекта, при исследовании которого зарегистрирован положительный или отрицательный результат диагностики соответственно.

Однако существенным недостатком показателей ПЦПР и ПЦОР, а также ИТ является их зависимость от распространенности диагностируемого состояния С в популяции. Наличие данной зависимости объясняется тем, что в определяющие тождества указанных критериев достоверности ДСТ входят частотные показатели обоих идентифицируемых состояний С и С одновременно. В отличие от данных критериев, подобное вхождение не имеет места в тождествах, определяющих чувствительность и специфичность ДСТ, вследствие чего последние не зависят от популяционной распространенности состояния С.

Вследствие указанной зависимости любое смещение соотношения априорных частот состояний С и С от величины, использованной разработчиками ДСТ при оценивании их достоверности, всегда сопровождается отклонением показателей ПЦПР, ПЦОР и ИТ от их расчетных значений (рис. 1). Поэтому многие практические врачи с недоверием относятся к характеристикам ДСТ, заявленным их разработчиками [2].

Поэтому для практики более значимыми являются показатели ПЦПР и ПЦОР, характеризующие вероятности

Рис. 1. Зависимость показателей достоверности ДСТ от распространенности диагностируемого состояния

По оси абсцисс - популяционная распространенность диагностируемого состояния С; по оси ординат - достоверность ДСТ. Сплошной жирной линией показана ПЦПР, сплошной тонкой - ПЦОР, пунктирной - ИТ. Чувствительность, специфичность и ОППР диагностики фиксированы и равны 0,206; 0,951 и 4,2 соответственно.

Изложенное позволило нам предложить альтернативные критерии достоверности ДСТ, учитывающие

популяционную распространенность диагностируемого состояния.

Перед рассмотрением указанных критериев введем понятия априорных вероятностей ложноположительной и ложноотрицательной идентификации состояния С. По сложившейся в математической статистике традиции обозначим указанные вероятности буквами а и в'-

Ъ с

а =-----, р =----

Ъ + (1 а + с .

Обозначим также буквами Г и А общепринятые в биомедицине ПЦПР и ПЦОР диагностики С:

Ь . , (I с

Г = 1-

Д = 1-

а + Ъ а + Ъ с + d с + d .

Благодаря указанным понятиям и обозначениям можно формализовать названия общепринятых критериев достоверности ДСТ: чувствительность - 1 - в, специфичность - 1 - а, ПЦПР - 1 - Г, ПЦОР - 1 - А.

Альтернативные критерии достоверности ДСТ представляют собой апостериорные вероятности ложноположительной и ложноотрицательной диагностики, обозначенные нами буквами у и 8:

Р

(1)

д--

у.

а +1 - р Ь + (і

- +1 --

2 Ь + (і -

с(Ъ + сі)

Ь + (і а + с а + с

Учитывая (1), у = Г, если выполняется равенство

Ъ Ъ

2 Ь + <!■

с(Ъ + d) а + Ъ

а + с . (2)

Из выражения (2) путем ряда несложных преобразований получаем

а + с — Ъ + d. (3)

Таким образом, (2) выполняется, если выполняется

(3).

Найдем теперь условие эквивалентности 8 = А. По определению

вс 1 с

о = -

' +1 - а а + с с Ъ Ъ(а + с)

■ ------+ 1---------2 с + а---------------

а + с Ъ + ¡3 Ъ + (1

Ввиду (1) 8 = А, если выполняется равенство

с с

2 с + а -

Ъ(а + с) с + d

от распространенности состояния С в популяции. Тем не менее, для интерпретации результатов ДСТ в отношении отдельного объекта на практике необходимы иные критерии, учитывающие априорную распространенность С.

Пусть Р(С) - априорная вероятность (распространенность) состояния С, а Р(С) - априорная вероятность отсутствия С. В этом случае полная группа возможных результатов ДСТ определения С формализуется записью

Р(С) • а + Р(С) • (1 - а) + Р(С) ■ р + Р(С) ■ (1 - р) = 1.

Тогда апостериорные вероятности ложноположительной (е) и ложноотрицательной (0 диагностики, учитывающие популяционную распространенность С, определяются по формулам:

_ Р(С ) ■ а _ а ■ (1 - Р(С))

Р(С) ■ а + Р(С) ■ (1 - Р) а -(1 - Р(С)) + Р(С) ■ (1 - Р);

С = -

Р(С) • р

Р(С) ■ р

а + 1 - р Р + 1 - а .

Связь показателей у и 8 с общепринятыми показателями Г и А характеризует следующая теорема достоверности идентификации:

При оценивании достоверности любых ДСТ апостериорные вероятности у и 8 ложноположительной и ложноотрицательной идентификации состояния С эквивалентны прогностическим вероятностям Г и А указанных ошибок тогда и только тогда, когда количество объектов с наличием С в тестовой выборке равно количеству объектов с отсутствием данного состояния.

Приведем доказательство данного утверждения.

По определению

а Ъ 1 Ь

Ъ + d , (4)

из которого получаем (3). Таким образом, равенство (4) выполняется, если выполняется условие (3). Теорема доказана.

С помощью предложенных понятий показатели ПЦПР и ПЦОР формульно характеризуются как 1 - у и 1-8. Указанные характеристики постоянны и не зависят

Р(С) ■ Р + Р(С) • (1 - а) Р(С) • Р + (1 - Р(С))-(1 - а) .

В свою очередь, модификации показателей ПЦОР и ПЦПР, учитывающие популяционную распространенность С, следует вычислять как 1-е и 1-£ Множества значений 1-е и 1-С на отрезке возможных значений Р(С) при фиксированных показателях чувствительности и специфичности ДСТ будут иметь вид кривых, подобных приведенным на рисунке 1.

Легко доказать, что при равенстве априорных вероятностей идентифицируемого состояния С и противоположного ему состояния апостериорные вероятности ложноположительной и ложноотрицательной диагностики у и 8 эквивалентны вероятностным ошибкам е и £

Доказанные утверждения имеют важное значение как для медицинского научного, так и практического познания. В рамках первого гносеологического компонента приведенные данные прямо определяют следующий методологический дизайн тестирования достоверности ДСТ:

1) число объектов с наличием диагностируемого состояния С в тестовой выборке должно равняться числу объектов с отсутствием данного состояния;

2) ошибки диагностики должны быть представлены оценками а, в, У и 8, а критерии достоверности - оценками 1-а, 1-в, 1-у и 1-8;

3) после вычисления оценок у и 8 должны быть разработаны номограммы определения ошибок е и ( и соответствующих значений 1-е и 1-£ для континуума значений Р(С) на отрезке при фиксированных значениях 1-а и 1-в.

Для практической медицинской деятельности доказанные утверждения означают, что интерпретация конкретного результата применения ДСТ должна осуществляться с учетом априорной вероятности диагностируемого состояния Р(С) по соответствующим номограммам, подобным приведенной на рисунке 1. В случае отсутствия указанных номограмм в пакете услуг, предоставляемых разработчиком ДСТ, первые могут быть созданы практикующим врачом самостоятельно, исходя из данных о чувствительности, специфичности и апостериорных ошибках диагностики. Отсутствие информации об указанных оценках, равно как и незнание или недостаточность теоретических предположений относительно популяционной распространенности диагностируемого состояния является противопоказанием к практическому использованию данной ДСТ.

Важно также отметить, что ввиду невозможности исследования разработчиками ДСТ генеральных совокупностей объектов все перечисленные критерии достоверности определяются с использованием тестовых

выборок ограниченного объема. Поэтому простое определение точечных оценок указанных показателей дает лишь ориентировочное представление о достоверности ДСТ. В этой связи для обоснованного суждения о достоверности ДСТ необходимо также вычисление интервальных оценок каждого критерия последней. Данная рекомендация согласуется с общей тенденцией к расширению показаний к применению доверительных интервалов в биомедицинских исследованиях вплоть до замены ими обычных статистических критериев [2].

Доверительные интервалы для показателей чувствительности и специфичности ДСТ могут быть определены различными способами [4, 5]. Одним из наиболее простых и строгих из них является вычисление точных доверительных границ биномиально распределенной генеральной совокупности [3]. К сожалению, определение интервальных оценок для наиболее значимого в практическом отношении критерия достоверности ДСТ - ПЦПР является затруднительным. Это объясняется тем, что простое вычисление доверительных границ для указанного критерия, принимая за выборочную относительную величину долю истинно положительных результатов в совокупности всех положительных результатов диагностики, не имеет смысла, поскольку как уже было показано, сама точечная оценка сильно зависит от популяционной распространенности диагностируемого состояния С. Аналогично дело обстоит и с другими критериями достоверности ДСТ, зависящими от априорной распространенности диагностируемого состояния С.

В этой связи не менее актуальной является также проблема определения доверительных границ для критериев достоверности у, 8, е и С Трудность поставленной задачи определяется тем, что в определяющие тождества данных критериев входят точечные оценки сразу двух параметров одновременно: а и в-

Изложенное позволило нам предложить метод определения доверительных границ для каждого из указанных критериев достоверности ДСТ, суть которого сводится к следующему:

1. При выбранном уровне значимости вычисляют интервальные оценки показателей а и в.

2. Определяют доверительные границы для критериев у, 8, е и С при удвоенном уровне значимости, используя вместо точечных все возможные комбинации интервальных оценок а и в.

3. Из четырех возможных комбинаций выбирают оценки с наименьшими нижними и наибольшими верхними доверительными границами.

Выведем на основе предложенного метода формулы доверительных границ для показателей у и е.

Пусть доверительные границы для а и в, входящих в определяющее тождество у, при уровне значимости а составляют

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

® _ тт > ®тах ] и Р ~ тт > ^тах ].

Тогда интервальные оценки у можно определить 4 способами, являющимися различными комбинациями наибольших и наименьших доверительных границ а и в. Количество анализируемых комбинаций можно со-

7 min =-

кратить, рассматривая пределы

при различных

стремлениях а и в.

Упорядочивая полученные пределы, получаем, что наименьшей нижняя доверительная граница для у будет при комбинации {а тЬ, р тЬ}, а наибольшей - при комбинации {« Р тах}.

Отсюда интервальные оценки для у с надежностью не менее 1-2а определяются как у = [утт, Ута1 ],где

а min + 1 _ ßn

Интервальные оценки у легко модифицировать в соответствующие оценки е при уровне надежности не менее 1-2а: £ = [еmln, £max ],где

е = _ Р(С) • «min £ = _ Р(С) • «max

£min Р(С) • «min + Р(С) ■ (1 - ßmm ) ’ ^ Р(С) • «max + Р(С) • (1 - /«max ) .

Рассмотрим теперь вывод формул доверительных границ для 8 и Z

По аналогии с у интервальные оценки 8 также можно определить 4 способами, являющимися различными комбинациями наибольших и наименьших доверительных границ а и ß при уровне значимости а. Рассматривая только наименьший и наибольший пределы

Нттт^т— = 0 и — = 1

а^О р + 1 _ О. а^1 р + 1 — а ,

ß^O ß^\

интервальные оценки для 8 с надежностью не менее 1-2а определяются как 3 = [<5min; ¿max ]>где

^min ? ß max

Öm -

? _____

^min _ q , ' max q ,

Pmrn 1 ^ min Pmax ^ 1 ^ max .

В свою очередь, интервальные оценки Z с надежностью не менее 1-2а принадлежат промежутку С = [С min; С max ],где

Р(С) ■ Amin Pi® ■ Amax

min

ПС) ■ Amin + P(C ) ■ (1 - 0 P(C) ■ Amax + P(C ) * (1 - «max).

Используя интервальные оценки у, 8, е и Z, с надеж-

ностью не менее 1-2а легко определяются доверительные границы значений прогностической ценности результатов применения ДСТ:

1 У ~ С1 - У max ;1 У min ] ’ 1 ^ ~ С1 - ^ max ;1 ^ min ] ’

1 ^ ~ С1 - ^max ;1 ^min ]’ 1 ^ ~ С1 - ^max ;1 ^min ] *

При необходимости интервальные оценки прогностической ценности результатов ДСТ могут быть вычислены и с учетом популяционной распространенности идентифицируемого состояния С. Ввиду непрерывности множества указанных оценок результаты их вычисления целесообразно представлять в форме номограмм (рис. 2).

Рис. 2. Номограмма определения точечных и 95% интервальных оценок ПЦПР при различной популяционной распространенности диагностируемого состояния

По оси абсцисс - распространенность состояния С; по оси ординат - ПЦПР. Сплошной линией показаны точечные, пунктирными линиями - 95% двусторонние интервальные оценки. Чувствительность, специфичность и ОППР диагностики фиксированы и равны 0,206; 0,951 и 4,2 соответственно.

Таким образом, на современном этапе развития биомедицины разработка любых ДСТ должна включать обязательное точечное и интервальное оценивание

комплекса критериев достоверности, включающего чувствительность, специфичность, ПЦПР, ПЦОР, а также апостериорные вероятности ложноположительной и ложноотрицательной диагностики при фиксированных показателях чувствительности и специфичности. При этом показатели ПЦПР и ПЦОР должны определяться при условии равенства количеств объектов с наличием и отсутствием диагностируемого состояния в тестовой выборке, а множества значений апостериорных вероятностей ложноположительной и ложноотрицательной диагностики должны представляться в формате номограмм, включающих весь промежуток Р(С)=[0;1].

Наличие подобного тестирования является необходимым условием для внедрения новой ДСТ в медицинскую практику. В этой связи в медицине помимо создания новых ДСТ актуальными также представляются исследования достоверности диагностических методик и признаков, ставших известными до распространения принципов доказательной медицины и уже укоренившихся в практической медицинской деятельности. Изложенные принципы подразумевают также внесение соответствующих дополнений в систему подготовки практических врачей.

Литература:

1. Грачев С.В., Городнова Е.А., Алферьев А.М. Научные исследования в биомедицине [Текст]. - М.: Медицинское информационное агентство, 2005. - 270, [2] с. : ил. - ISBN 5-89481-343-3.

2. Гринхальх Т. Основы доказательной медицины [Текст] = How to read a paper : учеб. пособие для студентов медицинских вузов и системы послевузовского профессионального образования. -М.: ГЭОТАР - МЕД, 2004. - 239 [1] с. : ил. - (Серия «Доказательная медицина»), - ISBN 5-9231-0278-1 (ГЭОТАР-МЕД). -ISBN0-7279-1578-9 (BMJBooks).

3. Закс Л. Статистическое оценивание [Текст] = Statistische Auswertungsmethoden / пер. с нем. В.Н. Варыгина; науч. редактирование и предисловие Ю.П. Адлера и В.Г. Горского. - М.: Статистика, 1976. - 597, [3] с. : ил. - (Серия «Зарубежные статистические исследования (теория и методы)».

4. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников [Текст]. - М.: ФИЗМАТЛИТ, 2006. - 813, [3] с. : ил. -ISBN5-9221-0707-0.

5. Blyth C.R. Approximate binomial confidence limits [Text] // Journal of the American Statistical Association. - 1986. - Vol. 81. - P. 843855.

6. Jaenschke R., Guyatt G., Sackett D.L. User’s guides to the medical literature. III. How to use an article about a diagnostic test. B. What were the results and will they help me in caringfor mypatients? [Text], - Ibid., 1994. - P. 703-707.

7. Read M.C., Lachs M.S., Feinstein A.R. Use of methodological standards in diagnostic test research: getting better but still not good [Text], -JAMA, 1995. - Vol. 274. -P. 645-651.

© Ю.С. Степанян, 2009 УДК 340.6

Ю.С. Степанян

СТРУКТУРНЫЕ ОСНОВЫ ПРОЦЕССОВ АДАПТАЦИИ ПРИ ГИПОТЕРМИИ

ГУЗОТ «Пермское краевое бюро судебно-медицинской экспертизы (начальник - В.И. Перминов)

В работе рассматривается сущность понятия «адаптационных» реакций организма в изменяющихся условиях окружающей среды.

Ключевые слова: гипотермия, приспособление.

STRUCTURAL BASES OF PROCESSES OF ADAPTATION AT HYPOTHERMIA

Y. S. Stepanyan

The essence of concept of “adaptable” reactions of an organism in changing conditions of environment is considered. Key words: hypothermia, the adaptation.

Одной из важнейших в современной медицине является проблема адаптации организма к постоянно изменяющимся условиям внешней среды [6].

Воздействие сильных раздражающих и повреждающих агентов вызывает в организме реактивные изменения, направленные на сохранение важнейших физиологических процессов и структур в изменившихся условиях существования. В ответ на воздействие происходит усиление деятельности важнейших регулирующих систем нервной и эндокринной. Если даже при наличии повреждения наступает уравновешивание главных жизненных функций - организм адаптировался к воздействовавшему неблагоприятному фактору.

Для обозначения способности организма поддерживать постоянство внутренней среды в условиях непрерывно меняющихся воздействий используют термины «адаптация», «приспособление» и «компенсация» [2, 3]. Первые два из них по существу идентичны и по существу употребляются в тех случаях, когда речь идёт о таких воздействиях на организм, которые не сопровождаются грубой деструкцией тканей и потому нейтрализуются напряжением функций [1, 2, 3, 4].

До настоящего времени само понятие «адаптация» является достаточно дискуссионным, хотя большинство

исследователей считают адаптацию приспособлением к окружающей среде. Определения термина «адаптация» многообразны. В энциклопедическом словаре медицинских терминов «адаптация» определяется как процесс приспособления организма, популяции или другой биологической системы к изменившимся условиям существования (функционирования); в основе адаптации человека лежит выработанная в процессе его эволюционного развития совокупность морфофизиологических изменений, направленных на сохранение относительного постоянства его внутренней среды - гомеостаза [5].

Если же воздействия на организм выражаются в возникновении тяжёлых дистрофических и некротических изменений какого-либо органа и возникает необходимость в том, чтобы другие, не затронутые патологическим процессом органы (функционально родственные) или сохранившаяся часть, своей усиленной работой восполнили ущерб нанесённые организму в целом, то говорят о «компенсации нарушенных функций» [3, 4].

Поэтому термины «адаптация» и «приспособление» используются применительно к повседневным реакциям организма на тот или иной раздражитель, а термин «компенсаторные реакции» - когда действие фактора внешней среды сопровождается повреждением органа [1, 4].

i Надоели баннеры? Вы всегда можете отключить рекламу.