Научная статья на тему 'К МЕТОДИКЕ ЭЛЕМЕНТАРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА РЯДОВ РАСПРЕДЕЛЕНИЯ ДАННЫХ МЕДИКО-ГИГИЕНИЧЕСКИХ ИССЛЕДОВАНИЙ'

К МЕТОДИКЕ ЭЛЕМЕНТАРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА РЯДОВ РАСПРЕДЕЛЕНИЯ ДАННЫХ МЕДИКО-ГИГИЕНИЧЕСКИХ ИССЛЕДОВАНИЙ Текст научной статьи по специальности «Клиническая медицина»

CC BY
14
4
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Гигиена и санитария
Scopus
ВАК
CAS
RSCI
PubMed
Область наук
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «К МЕТОДИКЕ ЭЛЕМЕНТАРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА РЯДОВ РАСПРЕДЕЛЕНИЯ ДАННЫХ МЕДИКО-ГИГИЕНИЧЕСКИХ ИССЛЕДОВАНИЙ»

мы поворачивали на 90° против часовой стрелки и слева от угла нижнего края пластинки на расстоянии 1,5 см в точку Г наносили стандартные растворы актеллика и кельтана,затем проводили повторное хроматографирование. Для этого в камеру непосредственно перед хроматографиро-ванием наливали подвижную фазу бензол—гек-сан (1:1). После подъема подвижной фазы на высоту 10 см и испарения растворителей хрома-тограмму разрезали по горизонтали на две равные части — 3 и За. Часть 3 для обнаружения актеллика обрабатывали 0,05 % раствором 2,6-дибром-!Ч-оксихинонимином в гексане с последующим нагреванием в течение 10 мин при температуре 110°С. Актеллик проявлялся в виде розовых пятен на светлом фоне.

Фрагмент За для проявления кельтана обрабатывали 0,05 % раствором азотнокислого серебра с последующим облучением УФ-светом в течение 15 мин. На светлом фоне при наличии кельтана появлялись темные пятна.

Предел обнаружения в анализируемом объеме фосфамида и карбофоса 0,5 мкг, цинеба 3 мкг, актеллика 1 мкг и кельтана 0,5 мкг. В среднем ошибка определения указанных пестицидов составляет 0,8—3,1 %•

Для определения концентрации пестицидов, входящих в состав смесей, применяли стбор проб воздуха с концентрированием. Исследуемый воз-у дух аспирировали через активированный уголь марки СКТ (около 5 г) со скоростью 5 л/мин в течение 10 мин. После отбора пробы сорбент обрабатывали смесью хлороформа и диэтилового эфира в соотношении 2: 1 дважды по 8—10 мл смеси. Объединенные экстракты сушили над безводным сернокислым натрием и отгоняли при помощи ротационного испарителя при температуре 50 °С до объема 0,2—0,5 мл, затем проводили анализ по описанной выше схеме.

Литература

1. Буркацкая Е. Н. Гигиена труда при использовании ядохимикатов и минеральных удобрений в сельском хозяйстве.— Киев, 1977.

2. Буркацкая Е. Н.. Великий В. И., Оськина В. Н. // Гиг. труда.— Киев, 1981, —Вып. 17. —С. 57—61.

3. Клисенко М. А. //Гигиена применения, токсикология пестицидов и клиника отравлений. — Киев. 1969. — С. 519—528.

4. Модифицированные кремнеземы в сорбции, катализе нк. хроматографии / Под ред. Г. В. Лисичкина. — М., ^вб-З'

Поступила 11.04.88

УДК 614.7-07:519.24

Р. М. Хвастунов

К МЕТОДИКЕ ЭЛЕМЕНТАРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА РЯДОВ РАСПРЕДЕЛЕНИЯ ДАННЫХ МЕДИКО-ГИГИЕНИЧЕСКИХ

ИССЛЕДОВАНИЙ

Московский НИИ гигиены им. Ф. Ф. Эрисмана

Значительное число задач статистического анализа данных медико-гигиенических исследований состоит в сопоставлении друг с другом рядов распределения значений отдельных показателей в двух совокупностях (например, показателей состояния животных в контрольной и опытной группах, показателей загрязнения воды в различные годы и т.п.). При статистической обработке рядов распределения данных исследований (далее — для краткости — «распределений»), как правило, используют следующий набор элементарных средств: вычисляют среднее арифметическое х, среднеквадратическое отклонение а, ошибку среднего арифметического гп = о/}1п. Различие сравниваемых рядов определяют только в отношении их средних по показателю t Стьюдента. Однако эти средства не в полной мере учитывают специфику постановки задачи о сопоставлении рядов и характер исходного материала медико-гигиенических исследований, и это во многих случаях приводит к потере существенной информации об исследуемом явлении, а следовательно, и к ошибочным выводам.

Цель настоящей работы заключается в изложении некоторых элементарных средств статистического анализа исходного материала, позволяющих получить дополнительные данные о распределениях показателей и полнее описать исследуемое явление. Некоторые из этих средств использовались в опубликованных работах ме-^ дико-гигиенического характера, но их обобщение отсутствует как в научно-методической, так и в учебной литературе.

В ходе статистического анализа рядов распределений должны быть рассмотрены следующие вопросы: 1) исследованы особенности ряда распределения каждого показателя по отдельности, а именно: а) выяснено, не распадается ли ряд распределения на 2 или более группы (т. е. не является ли распределение полимодальным); б) выявлены случаи аномально большого отклонения (выпадающие); 2) исследованы различия двух сравниваемых распределений по одному и тому же показателю, а именно: а) выявлены «хвосты» распределений, т.е. такие группы данных, встречающихся в одном распределении, которые численно больше (или мень-

^ше) всех значений того же показателя в другом распределении. Например, если в одном распределении имеются значения, превосходящие некоторую границу Хо, а в другом таких значений нет, то говорят о наличии «хвоста» у первого распределения; б) выявлены диапазоны шкалы показателя с резко различающимися частотами встречаемости значений признака (особенно такие, где частота встречаемости в одном из сравниваемых распределений равна нулю); в) если происходит сравнение распределений показателя, замеренного на одной и той же совокупности объектов в динамике (через некоторый промежуток времени), то должны быть выявлены подгруппы объектов, в которых характер изменений показателя был идентичным, и, если они есть, отдельные объекты с аномальными изменениями показателя. Каковы же средства решения этих вопросов? 1. Исследование особенностей ряда распределения каэ/сдого отдельного показателя ■х Для решения вопроса о распаде значений по-"•Цозателя на группы (т. е. о бимодальности) принято использовать показатель эксцесса [4]:

Х-^-З.

(1)

При этом положительные значения эксцесса е>0 свидетельствуют об унимодальности и заостренности распределения по сравнению с нормальным; е = 0 соответствует нормальному распределению, е = —1,2 — равномерному распределению, а при меньших значениях е распределение считают бимодальным.

Однако использование е не дает надежных результатов. В тех случаях, когда распределение распадается на две группы, значительно различающиеся по численности (с соотношением численностей 1:5 и менее), значения е могут быть близки к нулю и даже быть более нуля (в зависимости от расстояния между мордами).

^ Кроме того, даже если по результатам вычисления эксцесса обнаружено наличие нескольких вершин у распределения, то остается нерешенным вопрос о положении границы между группами, на которые распадается распределение. Но для дальнейшего анализа существенно именно положение этой границы, а не просто знание о том, что распределение полимодально.

Предложены и другие, кроме эксцесса, параметрические критерии бимодальности [3, 5], но они также не обеспечивают надежных результатов.

Поэтому практически наиболее эффективный способ решения вопроса о полимодальности и одновременно о назначении границ градаций — построение и визуальный анализ графика распределения (при большом числе данных желательно использовать для этой цели ЭВМ). Для добства выделения и дальнейшего анализа

индивидуальных случаев целесообразно при построении графиков вместо обобщающих символов (кружки, крестики и т. п.) проставлять номера соответствующих случаев.

После того как несколько групп в распределении выделено визуально и установлены границы между ними, т. е. границы градаций, для доказательства статистической достоверности различия средних можно применить /-критерий Стыодента или ^-критерий Вилкоксона. Однако эта проверка не необходима — практически всегда достоверность различия средних в образованных группах будет подтверждена.

Наилучшее обоснование правильности и, главное, целесообразности произведенного выделения групп состоит в том, что для объектов, отнесенных к разным группам, будут обнаружены различия в значениях каких-либо других показателей или различные по характеру связи между показателями. Если же для объектов, относящихся к различным выделенным предварительно группам, не обнаруживается указанных различий, то эти объекты следует объединить в одну группу, характеризуемую общим средним, дисперсией и т. д.

Для выявления выпадающих случаев после построения графика распределения можно визуально наметить случаи, подозреваемые на выпадение. Иногда это бывают просто ошибочные замеры, иногда аномальные отклонения обусловлены индивидуальными особенностями объекта, выделяющими его из общей совокупности.

Достоверность аномального отклонения можно проверить по таблицам [1]. Однако, как и при исследовании полимодальности распределений, результаты этой проверки практически предрешены. Более важно провести тщательный медико-гигиенический анализ причин отклонения. Следует рассмотреть всю совокупность данных по объекту, в котором обнаружено аномальное отклонение одного показателя. Если при этом будут выявлены другие показатели с существенно (не обязательно аномально) отклоняющимися значениями, то это свидетельствует о наличии особенности состояния объекта, индивидуально присущей ему и выделяющей его из общей совокупности. Если по всем прочим показателям объект ординарен, то, вероятно, аномальное значение обусловлено ошибкой регистрации данного показателя.

2. Исследование различий распределений в сравниваемых группах

Помимо определения достоверности различия средних в сравниваемых группах, не менее важно сравнить частоты отклонений за пределы определенного диапазона, а также охарактеризовать различие частот встречаемости признака в определенном диапазоне (в пределах одной градации или нескольких градаций). Особенно полезно выявить такие диапазоны, где частота

68 67 61 52 47 44 6037 62 5431 55 4541 11 50 51

69

бе

63

64 ...... ____

43 59 65 3530 20 46 25 3658 53 57 26 27 56 33 32 24 15 39 >4 17 43 22 38 ¡в 49

2 42 9 2$7Р 1 34 /640 4 10 8 19 3 5 11 6 13 11 23 7 29

ЗО

40

50

60

70

во

90

ЮО

Рис. 1. Распределение значений уровня Са^ у 70 больных. ^

И —исходный уровень: Б — уровень нспосредст*

венно после проведенного лечения. По оси абсцисс — концентрация Са (в ед.). Здесь и на рнс. 2 цифры в поле диаграммы — номера обследованных больных.

° 66

62 52

68 47 48 50 53 61 65 32 4644 39 49 59 55 4517 36 75 ЗО 63 41 33 54 56 34 £7 5! 35 Ю ТО21 24 38 605822 5729 23 43406970 27 42 _31 15 6 8 1214 5 37 13 19 11 7 4 3 18 26 16 64 1 28 2_

ЗО 40 50 60 70 во 90 ЮО

встречаемости признака в одном из распределений равна нулю.

Достоверность различия частот появления признака, превосходящих некоторую границу Хо, т.е. значений х1>х0 (или, напротив, яг"<*о)> а также и различия частот градаций проще всего проверить по критерию х2- При этом следует рационально выбрать «теоретическое» распределение. Если, например, происходит сравнение опытной группы объектов с «контролем», не подвергавшимся вредному воздействию, то теоретическим может быть принято распределение контрольной группы. Если обе сравниваемые группы подвергались каким-то (различным) воздействиям, то в качестве теоретического целесообразно выбрать некоторое усредненное распределение.

В тех случаях, когда сравниваются два распределения одного показателя, регистрируемого на одной и той же группе объектов через некоторый промежуток времени (например, до и после проведения оздоровительных мероприятий), нельзя ограничиваться вычислением разницы средних. Необходимо определить характер изменений показателя в каждом отдельном случае и выявить группы случаев со сходными изменениями.

В случаях, когда показатель имеет условно выделенный диапазон «нормы» (как, например, артериальное давление, биохимические показатели состояния организма и т. п.), информативна частота выхода за пределы этого диапазона, а изменения, не выходящие за пределы «нормы», вообще не следует учитывать.

Для иллюстрации эффективности рекомендуемых средств статистического анализа рассмотрим следующий пример.

Имеются распределения показателя уровня Са в крови у 70 больных непосредственно до и после проведенного лечения (рис. 1). Требуется дать заключение о характере изменений уровня Са по итогам лечения.

Проведем сначала анализ с использованием

традиционных средств: определим основные параметры распределений (х, ст, т, е) и для проверки достоверности отличия распределений друг от друга вычислим значения статистиче-ских показателей / Стьюдента и и Вилкоксона: -

Распределение Срок определения X а т е

А Б До лечения После лечения 63,7 66,6 12,4 18,0 1,5 2,1 —0,13 —0,78

Р(и) = -0,30; [Р(и)м = - 1,64].

Как видно из сравнения вычисленных и табличных (критических) значений, по обоим критериям различие недостоверно. Критерий и Вилкоксона, как считают некоторые авторы [2], характеризует не только различие средних, но и различие формы распределений. Поэтому отсутствие достоверных различий одновременно по /- и (/-критериям, казалось бы, гозорит об отсутствии существенных изменений среднего 4{ уровня Са под влиянием лечения.

Значения эксцесса е, находящиеся между 0 и —1,2, показывают, что оба распределения занимают промежуточное положение между нормальным и равномерным, т. е. во всяком случае унимодальны. Поэтому применение критерия / Стьюдента правомерно.

Однако эти выводы неверны. Проведем более подробный анализ с применением указанных выше средств.

Рассматривая графики распределений (см. рис. 1), можно заметить резкое различие их формы и предположить, что распределение Б бимодально.

Докажем достоверность различия формы распределений. Для этого разделим диапазон изменений показателя на 8 градаций и запишем число наблюдений, вошедших в каждую градацию:

Градации уровня кальция

Распределение о СО а» ■ч* О ю О о о> t— о> 00 О о о <о

1 о 1 о 1 1 о 1 о 1 о 1 о 2 о О CJ

СО ■ч- ю о ОО а> — R

А 4 6 10 30 14 6

Б 11 22 7 10 10 7 3

Теоретическое 2,0 8,5 16,0 18,5 12,0 8,0 3,5 1,5

Примем нуль-гипотезу о том, что распределения не отличаются друг от друга. Тогда в качестве теоретического распределения естественно принять средние числа по каждой градации: пТ1 =0,Ь-(пА1 +пш). (2)

Расчет х2 для одного из распределений по отношению к теоретическому дает %2 = 17,97 (Х95 = = 14,1)*.

Итак, распределения различны по форме с вероятностью более 95 %.

Обнаруживаются также «хвосты» распределений.

В распределении А встречаются значения л,-,-<40, чего нет в распределении Б. Напротив, в распределении Б имеются значения х,->90, отсутствующие в распределении А. Проверим достоверность наличия обоих «хвостов» по %2. Для этого составим две 4-польные таблицы следующим образом:

Для значений х. <40 Для значений х;>90

Число наблюдений Число наблюдений

Распре- распре-

деление в деление прочих в

«хвосте» прочих «хвосте»

А 4(2) 66 (68) А 70 (66) 0(4)

Б 0(2) 70 (68) Б 62 (66) 8(4)

В скобках приведены значения теоретического распределения, найденные по формуле:

+ -(¿а+ £¿2) N

QM —'

(3)

100 90

во

70 бО 50 40 ЗО

42 Э

/

5S 134 27

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I

■70-64

16

26 43

/-

4058 I

4 33 I

/

54

/

J8

23 —

65

I

58 13

66

62 И 14,2548 I 20461236

108,3247,69-^-/7-

35,45s, | 6

/

/ S3 I 23,43

5J7 -It.22--

38,63-

15,5551 67 -31-

/

/I

где Ец — числа наблюдений в соответствующих ячейках таблицы.

Проведя расчеты значений %2, получаем:

X? = 4,12; х! = 8,48 (Х925 = 3.84).

Таким образом, наличие обоих хвостов достоверно с вероятностью более 95%. Следовательно, в ходе терапии, безусловно, повышается уровень Са по крайней мере у тех больных, у которых он был ниже 40 ед. Кроме того, у некоторых больных уровень Са принимает весьма высокие значения — более 90 ед.

Граница между группами, на которые распалось распределение Б, находится на уровне

* Для точного определения вида распределения (например, по критерию Колмогорова—Смирнова) количество данных должно быть увеличено до 100—150.

ЗО 40 50 60 70 вО 90 ЮО

Рис. 2. Диаграмма сдвига уровня Са. По оси абсцисс — исходная концентрация Са (в ед.); по осн ординат— концентрация Са после проведенного лечения (в ед.).

65 ед., как раз там, где имеется максимум распределения А. Факт наличия этих двух групп говорит о возможной разнонаправленности изменений уровня Са у разных больных. Что же получается? С одной стороны, уровень Са, по-видимому, растет, а с другой — в части случаев, возможно, падает. Для того чтобы раскрыть действительный характер изменений уровня Са, построим так называемую «диаграмму сдвига» (рис.2).

На этой диаграмме по горизонтальной оси отложены значения концентрации Са до лечения, а по вертикальной — после него. Поэтому если точка, соответствующая наблюдению, находится под диагональю, то в этом наблюдении имело место снижение уровня Са (на величину, равную расстоянию по вертикали от данной точки до диагонали). Если же уровень Са у больного повышался, то точка находится над диагональю.

Диаграмма сдвига позволяет раскрыть характер и величину изменений уровня рассматриваемого показателя в каждом наблюдении по отдельности и выделить типичные группы изменений. Как видно из рис. 2, реакция у больных действительно бывает разнонаправленной. У большей части больных (45 человек) произошло небольшое (на 5—25 ед.) снижение уровня Са. При этом все эти больные до лечения имели уровень Са 55 ед. и более. У меньшей части больных (21 человек) имело место повышение уровня Са, но, как правило, на значительную величину (30—70 ед.). Диаграмма дает возможность заметить, что повышение уровня Са происходило главным образом у тех больных, ко-

торые имели низкий уровень Са до проведенного лечения.

Достоверность этого эффекта наиболее просто можно проверить по критерию х2- При этом нуль-гипотезой будет являться предположение о том, что характер изменения уровня Са у больных не связан с его начальным уровнем. Преобразуем диаграмму сдвига в 4-польную таблицу, разделив ее на 4 поля, отграниченных друг от друга главной диагональю и вертикальной чертой, соответствующей уровню Са до начала лечения, равному 55 ед. Соответствующая 4-польная таблица имеет вид:

Изменение после Уровень до лечения

лечення < 55 >55

Повышение Снижение 14 (4,45) 0(9,54) 7(16,5) 45 (35,5)

В скобках приведены ожидаемые (теоретические) значения, найденные по формуле (3). После вычислений получаем х2 = 48,0 (хэз = 3,84). Таким образом, отмеченный эффект достоверен, т.е. направление изменения концентрации Са зависит от его исходного уровня. Причем при низком исходном уровне после лечения концентрация Са резко повышается, а при высоком, как правило, происходит некоторое снижение концентрации.

Эта разнонаправленность реакции у разных больных служит причиной того, что среднее арифметическое, вычисленное в целом по всей совокупности наблюдений, практически не изменилось, хотя сдвиги уровня Са у отдельных больных были значительными.

Понятно, что обнаруженная разнотипность реакций может иметь существенное значение для выбора дальнейших лечебных мероприятий, различных по отношению к разным группам больных. Может оказаться, что и некоторые другие показатели у больных этих групп резко различны, и, следовательно, дальнейшая статистическая обработка данных должна проводиться по каждой группе отдельно.

Теперь рассмотрим наблюдения, попавшие в «хвосты» распределений. В распределении А это наблюдения № 2, 9, 28, 42. В распределении^ Б —наблюдения № 1, 2, 9, 27, 28, 34, 42. Из рис. 2 видно, что именно в этих наблюдениях имело место наибольшее повышение уровня Са — на 50—70 ед., тогда как в остальных случаях оно составляло лишь 5—30 ед. Возможно, что здесь мы видим отклонения, обусловленные какими-то индивидуальными особенностями указанных больных, которые требуют особых лечебных мероприятий.

Приведенный пример показывает, что более подробный анализ рядов распределения, направленный на решение сформулированных в начале статьи вопросов и осуществленный указанными способами, может привести к совершенно иным выводам, чем анализ с применением лишь традиционных средств.

Таким образом, традиционных средств обработки рядов распределений недостаточно для ответа на ряд вопросов, имеющих существенное значение при анализе материалов медико-гигие-нических исследований. Использование только^ этих средств может привести к затушеванию действительной картины и искажению результатов. Необходимо применение дополнительных средств, позволяющих более подробно изучить структуру распределения, вскрыть индивидуальные особенности состояния и изменения состояния отдельных объектов.

Литература

1. Лшмарин И. П., Васильев 11. И., Абросов В. А. Быстрые методы статистической обработки и планирование экспериментов.— Л., 1971.

2. Ван-дер-Варден Б. Л. Математическая статистика: Пер. с нем. — М„ 1960.

3. Венецкий И. Г, Венецкая В. И. Основные математико-статистические понятия и формулы в экономическом анализе: Справочник, — М., 1979.

4. Статистический словарь.— М., 1965.

5. Фрумкина Р. М., Васияевич А. П. Получение оценок вероятностей слов психометрическими методами: Вероятностное прогнозирование в речи.— М., 1971.

Поступила 23.04.87

i Надоели баннеры? Вы всегда можете отключить рекламу.