Научная статья на тему 'О СТАТИСТИЧЕСКИХ КРИТЕРИЯХ И ИХ ИСПОЛЬЗОВАНИИ ПРИ ГИГИЕНИЧЕСКОМ КОНТРОЛЕ'

О СТАТИСТИЧЕСКИХ КРИТЕРИЯХ И ИХ ИСПОЛЬЗОВАНИИ ПРИ ГИГИЕНИЧЕСКОМ КОНТРОЛЕ Текст научной статьи по специальности «Математика»

CC BY
21
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Гигиена и санитария
Scopus
ВАК
CAS
RSCI
PubMed
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О СТАТИСТИЧЕСКИХ КРИТЕРИЯХ И ИХ ИСПОЛЬЗОВАНИИ ПРИ ГИГИЕНИЧЕСКОМ КОНТРОЛЕ»

Номограмма для определения скорости переработки зрительной информации.

По осям абсцисс — верхней — время Т (от 90 до 900 с), нижней — скорость переработки зрительной информации Б (от 0,21 до 3.99 бит/с). Выделенная часть номограммы с параметрами: Т= 140—270 с, л=0—40 ошибок представлена в увеличенном масштабе в таблице; по оси ординат — число ошибок п (от 0

до 60).

бранных в различных контингентах учащейся молодежи, позволил установить следующие величины уровня работоспособности (в бит/с): у мальчиков 11 —12 лет (923 человека) — 1,32 (пределы колебаний 0,50—2,25), у девочек 11 — 12 лет (844 человека) — 1,29 (от 0,50 до 2,46), у юношей 14—15 лет (869 человека) — 1,36 (от 0,55 до 2,48), у девушек 14—15 лет

(864 человека) — 1,40 (от 0,56 до 2,35), у юношей 15—17 лет (651 человек) — 1,46 (от 0,50 до 2,30).

В ходе исследований установлено также, что время просмотра корректурной таблицы у 90,1 % обследуемых составляло от 140 до 270 с, а число ошибок от 0 до 40 наблюдалось у 93,2 % лиц. Полученные результаты показывают необходимость более точного расчета скорости переработки зрительной информации в указанных интервалах величин, поскольку использование номограммы в отдельных случаях приводит к погрешности определения порядка ±0,1 бит/с (±7 %).

В этой связи в диапазоне указанных величин (Т=140— 270 с; я=0—40 ошибок) проведен расчет величин скорости переработки зрительной информации в увеличенном по сравнению с номограммой масштабе (Т=5 с), что позволяет значительно (до ±0,01 бит/с) повысить точность определения умственной работоспособности (см. таблицу).

Таким образом, предложенный нами модифицированный вариант номограммы позволяет экономить время, исключая дополнительные трудоемкие расчеты, повышать точность определения и унифицировать процесс обработки результатов исследования умственной работоспособности корректурной пробой с кольцами Ландольта.

Литература

1. Оценка эффективности профилактической витаминизации учащихся средних школ: Метод, рекомендации / Сост. Кондратьева И. И. и др.— М., 1987.

2. Спиричев В. Б. // Питание: здоровье и болезнь,— М., 1990,— С. 198—199.

Поступила 25.12.90

© И. Д. ТАШКЕР, 1991

УДК 613.1/.8-07 + 614.3/.7-07|:519.22/.25

И. Д. Ташкер

О СТАТИСТИЧЕСКИХ КРИТЕРИЯХ И ИХ ИСПОЛЬЗОВАНИИ ПРИ ГИГИЕНИЧЕСКОМ

КОНТРОЛЕ

Киевский НИИ гигиены труда и профзаболеваний

Для успешного применения статистических методов необходимо, чтобы определяемые случайные величины обладали статистической устойчивостью и соответствовали предпосылкам, положенным в основу применяемого метода анализа [2, 9].

Статистическую гипотезу формулируют таким образом, что она может быть истинной либо ложной. Одновременно с основной, или нулевой, гипотезой (Я0) желательно рассматривать одну или несколько альтернативных (#А). В процессе проверки гипотез по имеющимся данным вычисляют величину критерия, для которого известно распределение вероятностей появления различных значений при справедливости проверяемой гипотезы. В зависимости от результата основную гипотезу отклоняют, если полученное значение критерия оказалось маловероятным, и ссответственно принимают альтернативную гипотезу или не отклоняют и обычно принимают ее как правдоподобное, не отвергнутое, хотя и не подтвержденное исследованием положение.

Решение будет правильным, если отклонена ложная и принята истинная гипотеза. Отклонение истинной Я0 (и принятие ложной ЯА) называют ошибкой I рода, а решение не отклонять ■ложную Но (и отклонить истинную Яд) — ошибкой И рода. Вероятность ошибки I рода называют уровнем значимости критерия и обозначают буквой а. Вероятность ошибки II рода обозначают буквой (3, а величину 1—р, т. е. вероятность отклонения Но в случае истинности Яд, называют мощностью критерия. Иногда при использовании двустороннего критерия принятие ложной Я о связывают с ошибками II и III рода и их вероятностями р и v [4]. Критические уровни а и ¡3, при которых отклоняются соответственно Я0 или Яд, обычно устанавливают на стадии планирования исследований.

Процедура статистической проверки направлена на отклонение, а не доказательство проверяемой гипотезы. Традиционно в качестве основной рассматривают гипотезу об отсутствии предполагаемого влияния фактора и критический уровень а принимают равным 5 % (0,05), реже 1 или 10 %. Эта традиция позволяет унифицировать правила проверки гипотез и представить контрольные величины критерия в виде компактных таблиц. Однако указанная формулировка Я0 и нижние уровни вероятности ее ошибочного отклонения не универсальны. Они предложены для ситуаций, в которых последствия проведения мероприятий по использованию или ослаблению влияния, ошибочно признанного существенным (допустимая вероятность этой ошибки равна а), серьезнее последствий ошибочного решения игнорировать реальное влияние изучаемого фактора. Но последствия решений, выносимых на разных этапах исследования, могут быть различными, что оправдывает применение нескольких, в том числе и нетрадиционных, уровней значимости [9).

Основные типы статистических гипотез и правила их проверки систематизированы [1, 3]. В гигиенических исследованиях, как правило, ограничиваются проверкой одной гипотезы и потому учитывают только ошибку I рода. Наиболее часто применяют /-критерий Стьюдента, определяя эмпирическое значение критерия по формуле вида 5, где и <?э — эмпириче-

ски найденные по анализируемым данным величины /-критерия и параметра <3, характеризующего изучаемое явление, ^ — характеристика случайной вариабельности величины параметра С).

Параметром <3 может быть Ду — разность между средними значениями показателя у в опытной и контрольной группах,

Ьху — коэффициент регрессии показателя у по фактору х, или г — коэффициент линейной корреляции. Величину /э сравнивают по таблицам /-распределения с величиной (а — критический уровень значимости, к — зависящее от объема выборки число степеней свободы варьирования величины параметра С?). При а=5 % и 30 величину / для одностороннего критерия (когда важны только положительные или только отрицательные значения ф) округленно принимают равной 1,7, а для двустороннего критерия (когда важны как положительные, так и отрицательные значения (?) — 2. При 1э>1аь делают вывод, что реализовано событие, вероятность которого (при справедливости Но) ниже а. На основании этого вывода Я0 отклоняют как маловероятную, а влияние изучаемого фактора признают существенным, или значимым, на уровне а.

Традиционная формулировка Я0 эквивалентна предположению, что истинное значение параметра <3 равно нулю (Я0: <5=0), а обнаруженное исследователем отклонение от нуля случайно. В общем же случае постулируемая /-ой гипотезой величина параметра может быть представлена на числовой оси любой точкой <?, (Я,-: <?=<?,), что позволяет провести проверку гипотез методом доверительных интервалов (ДИ).

ДИ строится на числовой оси путем откладывания по одну или обе стороны (соответственно для одностороннего или двустороннего критериев) эт точки <?,- отрезка длиной /ц/,^. Если проверяемая гипотеза верна, то эмпирическая оценка С}э, полученная по выборке с А-степенями свободы, может оказаться внутри ДИ с вероятностью 1—а, или 100—а %.

Гипотезу Я,- о том, что анализируемая выборка принадлежит к совокупности, характеризуемой величиной <2,, отвергают, если эмпирическая оценка параметра С?э не попадает в ДИ, построенный вокруг точки (¡¡, т. е. когда вероятность справедливости проверяемой гипстезы Hi будет ниже критического уровня а. Такая же вероятность ошибки I рода выявится, если ДИ строить вокруг точки <2Э, а не <2,-, и отклонять гипс-тезу Я,, когда постулируемое ею значение (?, не попадет в ДИ.

Помимо описанной ситуации проверки гипотез (ПГ), построение ДИ вокруг эмпирического значения <3Э проводят и при оценке параметров (ОП) изучаемой совокупности. Используя индекс I для первого и /' для второго случая, можно констатировать: 1) в ситуации ПГ величина параметра (2, известна, поскольку задается гипотезой Я(; 2) в ситуации ОП точная величина параметра С}^ характеризующего изучаемую /-ую совокупность, неизвестна и оценивается с помощью точечной и интервальной оценок по выборке, специально взятой из этой совокупности. Именно с интервальным оцениванием параметров связано понятие доверительной вероятности: при соблюдении ряда условий неизвестное значение С}, с доверительной вероятностью 1—а окажется внутри ДИ, построенного вокруг точечной оценки С}ь. Чем выше доверительная верояткость 1—а, тем шире ДИ и тем меньше вероятность того, что истинное значение Сокажется за пределами ДИ и, следовательно, полученная интервальная оценка окажется ошибочной.

Но при проверке гипотез использование термина «доверительная вероятность» или его синонимов неправомерно, поскольку вероятность 1—а не может служить показателем достоверности проверяемой гипотезы, если последняя не отклонена. Ведь анализируемые данные могут соответствовать не только проверяемой, но и другим возможным гипотезам, число которых будет возрастать с увеличением вероятности 1—а и, следовательно, с увеличением ширины ДИ.

Неправомерная интерпретация вероятности 1—а как меры доверия к неотклоненной гипотезе приводит, например, к необоснованному выводу, будто различия между опытной и контрольной группами данных следует считать случайными с доверительной вероятностью 99%, тогда как полученные результаты позволяют признать эти различия значимыми на уровне (т. е. с вероятностью ошибки а) 2—5 %. Именно такое заключение дано, к сожалению, в статье [6], рассматривающей данные о более высокой активности сточных вод в зоне захоронения радиоактивных отходов по сравнению с контрольными наблюдениями. Средние значения логнормальных выборок указывали, что в зоне захоронения отходов активность увеличена в среднем на 36 %, поскольку ехр (1,6—1,29) = 1,36. Эмпирическое значение /-критерия равнялось 2,1 и позволяло отклонить Но об отсутствии различий между 2 группами проб

на уровне значимости 5 % при использовании двустороннего или 2,5 % при использовании одностороннего критерия. Так как в зоне захоронения возможно только загрязнение, а не очищение окружающей среды, предпочтителен односторонний критерий. Но авторы статьи выбрали критический уровень а=1 % с /00|=2,62 и, поскольку 2,1<2,62, заключили, что «можно с надежностью 99 % считать расхождение незначимым и нет необходимости проводить дополнительный контроль с • целью выяснения причин увеличения активности стоков». Объективно этот вывод равносилен рекомендации обеспокоиться загрязнением окружающей среды лишь тогда, когда вероятность необоснованной тревоги будет ниже 1 %. Учитывая задачи санитарного контроля, такую рекомендацию трудно признать приемлемой и обоснованной.

Приведенное заключение статьи [6] можно объяснить выбором очень высокого уровня доверительной вероятности, по-видимому, в результате формального следования рекомендациям, которые справедливы для интервального оценивания в особо ответственных исследованиях. Такие рекомендации даны и в популярных руководствах Н. А. Плохинского. Но примечательно, что в последнем из них [8] были специально подчеркнуты различия выбора уровней доверительной вероятности при сравнении эмпирических оценок или эмпирической и теоретической характеристик.

При гигиеническом контроле исследователь сталкивается со второй ситуацией, так как решает вопрос соответствия результатов замера действующим нормативам, сравнивает выявленную разность показателей чистой и подозреваемой в загрязнении зон с ее теоретическим (равным нулю) значением. Чем больше ответственность, тем оправданнее риск допустить ошибку I рода и признать нарушение норматива там, где его, воз- г можно, не было, а сказались случайные помехи, тем, следовательно, меньшей должна быть доверительная вероятность 1—а справедливости предположения о соблюдении норматива и тем выше критический уровень а вероятности, с которой это предположение может неоправданно отклоняться.

Выбор критического уровня должен учитывать не только статистические аспекты, но и особенности возможных решений, такие, как доступность и эффективность мероприятий по профилактике или ликвидации загрязнения окружающей среды, соотношение последствий опережающего или запоздалого проведения их. Представляется оправданным усилить защитные мероприятия, например, прекратить захоронение опасных , отходов, когда величина /-критерия превышает 1. При этом уровень а, т. е. вероятность того, что в действительности загрязнения не происходит и принимаемые меры излишни, не будет превышать 15 %.

Вероятность 1—а может быть неправильно истолкована и при отклонении Я0, когда интерпретируется как показатель прогностической надежности однократно полученной эмпириче- 4 ской оценки параметра. Ошибочность такого подхода демонстрирует приведенный ниже случай оценивания коэффициента корреляции.

Как известно, величина коэффициента линейной корреляции переменных х и у (гху) принимает значение от —1 до 1 и ее квадрат (г2) показывает, какая доля вариабельности переменной У может быть обусловлена линейной зависимостью от фактора х. Признание корреляции, существенной на уровне значимости 5 %, означает, что с вероятностью ошибки не более 5 % абсолютную величину г в анализируемой совокупности можно признать отличной от нуля. Для такого вывода необходимо, чтобы эмпирическая оценка абсолютной величины г была, например, не меньше 0,22 при 80, 0,36 при 30 и 0,62 при 10 парах наблюдений х и у.

Аналогом коэффициента линейной корреляции г в случае зависимости от нескольких факторов или криволинейной зависимости от одного фактора служат коэффициент множественной корреляции 11 и корреляционное отношение г). Квадраты этих показателей /?2 и '1 характеризуют максимальную долю вариабельности величины у, которая может быть описана ^ примененным уравнением регрессии. Адекватность уравнений регрессии проверяют по ^-критерию Фишера. Однако признание адекватности с доверительной вероятностью 95 % еще не позволяет утверждать, как, например, в статье [7], что «с помощью использования уравнений регрессии можно с вероят-

ностью Р=95 % по данным психофизиологического обследования кандидатов прогнозировать успешность их производственной деятельности». В цитируемой работе «коэффициент множественной корреляции между значениями физиологических показателей... и успешностью в работе составил 0,73—0,83», следовательно вариабельность успешности, обусловленная изменчивостью этих показателей, не могла быть выше 53— 69 %. А чтобы регрессия была не только значимой, но и полезной для прогноза, эмпирическая величина ^ должна в несколько раз превосходить значение, принятое критическим при проверке гипотезы об адекватности [5].

Итак, необходимо различать ситуации, в которых статистические критерии служат определению вероятности а совершить ошибку при отклонении справедливой гипотезы или доверительной вероятности 1—а того, что полученная по выборочным данным интервальная оценка включает точное значение параметра изучаемой совокупности или математической модели.

Вероятность 1—а не является мерой ни достоверности неот-клоненной гипотезы, ни прогностической надежности точечной оценки параметра. При гигиеническом контроле проверяют гипотезу об отсутствии отклонения исследуемых показателей от нормативных или контрольных величин, и для повышения безопасности может быть оправданным увеличение риска прежде-

временного отказа от этой гипотезы (например, до 15 % вместо

традиционного для многих прикладных задач уровня а=5 %).

Литература

1. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Основы моделирования и первичная обработка данных.— М., 1983.

2. Вентцель Е. С. // Математики о математике.— М., 1982.— С. 37—55.

3. Головач А. В., Ерина А. М., Трофимов В. П. Критерии математической статистики в экономических исследованиях.— М„ 1973.

4. Двойрин В. В., Клименков А. А. Методика контролируемых клинических испытаний.— М., 1985.

5. Дрейпер Н., Смит Г. Прикладной регрессионный анализ: Пер. с англ.—Кн. 1,—М., 1986.

6. Зарх В. Г., Остроглядов С. В. // Гиг. и сан.— 1986.— № 5,— С. 51—53.

7. Пархоменко Г. М., Копаев В. В., Кузнецова Ж■ Я• // Гиг. труда,— 1987,- № 3.— С. 7-10.

8. Плохинский Н. А. Алгоритмы биометрии.— М., 1980.

9. Тутубалин В. Н. Теория вероятностей.— М., 1972.

Поступила 01.08.90

Дискуссии и отклики читателей

© М. Ю. АНТОМОНОВ. Л. т. РУСАКОВА, 1991 УДК 614.7-074

М. Ю. Антомонов, Л. Т. Русакова

МЕТОДИКА ОБРАБОТКИ РЕЗУЛЬТАТОВ НАТУРНЫХ ИССЛЕДОВАНИЙ С ЦЕЛЬЮ РАСЧЕТА ПОРОГОВЫХ И ПОДПОРОГОВЫХ УРОВНЕЙ ФАКТОРОВ ОКРУЖАЮЩЕЙ СРЕДЫ

Республиканский научный гигиенический центр Минздрава УССР, Киев

Одним из наиболее актуальных направлений современной гигиены является разработка методов описания многофакторного влияния окружающей среды на состояние биосистем различного уровня иерархии. Экспериментальное исследсвание сочетанного или комбинированного действия сколь-нибудь # значительного количества факторов даже при надлежащем математическом планировании не возможно по целому ряду объективных и очевидных причин. Между тем результаты натурных исследований хотя и весьма ориентировочно, но позволяют получить и описать такую зависимость. Рассмотрим алгоритм математической обработки данных, позволяющий выявить значимо действующие факторы, построить математическую модель их влияния, рассчитать подпороговые и пороговые функции при их изолированном и совместном (сочетанном) действии.

Изменение состояния биосистемы характеризуется множеством показателей под действием множества факторов | )1 и в общем случае выражается многомерной функцией ( //,• }=/("{ х,}).

Выполнить ее математическое описание тем проще, чем меньше размерность векторов {д^}^!) и 1- Поэтому

на 1-м этапе обработки информативность показателей и значение влияния на них внешних факторов анализируются с помощью методов дисперсионного, факторного, дискрими-тр нантного, корреляционного (путем вычисления парной к множественной корреляции) анализа. С помощью традиционных методов сначала определяют достоверность попарной связи каждого из 1щ с каждым из х-г затем — с линейными полиномами из них [4]. Достоверность оценивают по известным статистическим критериям, в частности по критерию Стьюден-та.

На следующем этапе обработки данных после сокращения размерности векторов до т<=М и п<=Ы происходит либо сворачивание векторов в скаляры х и у, характеризующие «интегральную среду» и «интегральное здоровье», либо, если размерность среды удается понизить до таких значений, что соблюдаются критерии устойчивости, построение множественных (линейных и нелинейных) регрессионных моделей.

Конструирование интегральных оценок может быть выполнено либо последовательным сравнением отдельных признаков с эталонными и их объединением, либо путем непосредственного формирования меры различия многомерных факторов — опытного и эталонного. В 1-м случае рекомендуется придерживаться следующей последовательности операций: выбор базиса (эталона, нормы), расчет безразмерного эквивалента [9], нормировка, получение собственно интегральных оценок [2]. Во 2-м с помошью дискриминантного анализа рассчитывают значение статистического критерия различия, например Фишера [7] или используют функционалы расстояния Евклида, Колмогорова или Махаланобиса [1]. В любом случае математическая модель из многомерной вырождается з двумерную—доза (уровень среды) — время — эффект: ¡/=/(х, I), которая может быть достаточно легко построена методами регрессионного анализа. Как правило, для описания влияния интегральной среды на состояние здоровья популяции достаточно использование простых линейных моделей типа: у=а(1) +Ь (/)*• Это возможно по 2 причинам: во-первых, точность исходных данных не позволяет использовать более сложные описания, а во-вторых, при достаточно малых условиях воздействия факторов окружающей среды изменение функции здоровья, сколь бы сложным оно в принципе не

i Надоели баннеры? Вы всегда можете отключить рекламу.