Научная статья на тему 'О ВЫБОРОЧНОЙ ОЦЕНКЕ СРЕДНЕГО ЗНАЧЕНИЯ ПРИ ЛОГНОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ'

О ВЫБОРОЧНОЙ ОЦЕНКЕ СРЕДНЕГО ЗНАЧЕНИЯ ПРИ ЛОГНОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
68
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Л.П. Пащенко

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О ВЫБОРОЧНОЙ ОЦЕНКЕ СРЕДНЕГО ЗНАЧЕНИЯ ПРИ ЛОГНОРМАЛЬНОМ РАСПРЕДЕЛЕНИИ»

© Л. П. ПАЩЕНКО. 1993 УДК 614.7-074

Л. П. Пащенко

О ВЫБОРОЧНОЙ ОЦЕНКЕ СРЕДНЕГО ЗНАЧЕНИЯ ПРИ ЛОГНОРМАЛЬНОМ

РАСПРЕДЕЛЕНИИ

НИИ гигиены морского транспорта, Санкт-Петербург

Логарифмически нормальный закон распределения находит широкое применение для статистического описания данных в самых разных областях исследований - экономике (распределение доходов населения), технике (распределение по размерам аэрозольных частиц, гранулометрический состав помола образцов горных пород или цементного клинкера), биологии и социологии [3, 4, 7]. Часто этот закон используется также при аппроксимации эмпирических распределений в гигиенических исследованиях. Объемное содержание радиоактивных веществ в воздухе и воде, количество примесей химических загрязнений в атмосфере, радиоактивное загрязнение поверхностей, индивидуальные дозы облучения персонала и населения — все эти очень разные показатели тех или иных процессов или явлений могут, как правило, удовлетворительно описываться одним статистическим законом — логнормальным распределением |1, 2, 6).

Поскольку ни одно исследование (или выполняемый в чисто практических целях контроль) не может базироваться на неограниченно большом объеме измерений, возникает необходимость оценивать интересующие числовые характеристики изучаемой величины, пользуясь выборочными данными. Такие данные всегда отягощены ошибкой, размер которой зависит от объема измерений и характеристик распределения — его формы и дисперсии. Типичной задачей, возникающей при этом, является определение погрешности и соответствующей ей доверительной вероятности оценки среднего значения, полученного по результатам измерений. Часто стоит и другая задача: определить минимальный объем измерений, достаточный для оценки среднего значения с заданной точностью. Решение этих задач в случае нормального закона не вызывает трудностей: наличие обширного справочного материала, составленного для такого распределения, позволяет легко определять требуемый объем измерений, при котором с заданной доверительной вероятностью оценка среднего отличается от его истинного значения не более чем наперед заданное значение погрешности. Легко определяется также погрешность оценки среднего по результатам выполненных измерений. В случае лсгнормального закона распределения такие справочные материалы отсутствуют, что в значительной мере затрудняет его применение. Особенно остро ощущается необходимость в справочных данных по распределению выборочных средних при неизвестном значении среднеквадратичного отклонения, поскольку в подавляющем большинстве практических случаев значение этой характеристики распределения приходится оценивать наряду со средним значением по результатам измерений. Отсутствие справочных данных делает невозможной строгую интерпретацию результатов измерений, поскольку невозможно оцепить их погрешность и связанную с ней доверительную вероятность.

Настоящая работа направлена на устранение этого недостатка. В ней рассчитаны функции распределения выборочных средних при логнормальном законе для разных значений эмпирической оценки среднеквадратичного отклонения и разных значений объема выборки. Полученный при этом справочный материал может быть использован для определения погрешности оценки среднего значения по результатам измерений, а также для определения требуемого объема измерений, обеспечивающего непревышение заданной погрешности оценки среднего. Ниже излагается методика расчета и приводятся полученные результаты.

Пусть имеем случайную величину X, распределенную по логнормальному закону. Это означает, что другая случайная величина 1п X — распределена нормально. Как и всякое нормальное распределение, оно полностью определяется двумя параметрами — математическим ожиданием (истинным средним значением) ц и среднеквадратичным отклонением а. Эмпирические оценки этих параметров — А и 5, выполненные по N реализациям (измерениям) случайной величины, вычисляются по формулам:

N

2 1п дг,

(1)

5=~

(2 (Iп^-Д)2

Ы-I

Как известно |4), истинное среднее значение х при логнормальном распределении вычисляется следующим образом:

- |Л + Т

* = е . (3)

На практике чаще всего значения ц и о неизвестны. Поэтому оценка среднего значения х, вычисленная по формуле (3) путем замены ц и а их эмпирическими оценками (1) и (2), приводит к некоторой погрешности, тем большей, чем меньше объем выполненных измерений и чем больше значение дисперсии распределения. В [5] показано, что для снижения ^ этой погрешности необходимо вычислять х, пользуясь следующей зависимостью:

Л-еК^!*), (4)

где ( -тр 52) функция Финни, зависящая от объема измерений N и значения 5.

Функция Чг(-^-52) определена из принципа максимального

правдоподобия, что обеспечивает наименьшую дисперсию разности между х и истинным средним х. Поэтому на практике, если стремятся снизить погрешность, пользуются зависимостью (4), а не (3).

Хотя зависимость (4) дает лучшее приближение к истинному среднему дг, доверительная вероятность для возможных ошибок такой оценки неизвестна. Это, конечно, в значительной мере снижает ценность самой оценки. Попытаемся найти функцию распределения отношения оценки х, вычисленной по (4), к истинному значению х. Для этого будем рассматривать отношение х/х как случайную величину и выразим ее у через другие случайные величины, распределении которых известны.

Не уменьшая общности рассмотрения, можем считать, что случайная величина X, распределенная логнормальпо, имеет среднее значение логарифма, равное нулю (т е. ц = 0). Тогда при N реализациях в качестве ц будем иметь случайную величину, распределенную нормально, со среднеквадратичным отклонением а/-\/Л/:

(5)

где £ — нормально распределенная случайная величина со средним значением, равным нулю, и среднеквадратичным отклонением, равным единице. Наилучшая оценка х, вычисленная на формуле (4), будет соответственно

а истинное среднее значение х

дг = е

(6)

(7)

Следовательно, отношение оценки среднего к его истинному значению

с4~''

2 у (1 Я2).

V * А '

(8)

Доверительные вероятности отклонения выборочных средних при логнормальном распределении

От- Вероят- Эмпирическая оценка среднеквадратичного отклонения (5); 2

ненне, О ность отклонения 0,10 0,20 0,30 0.40 0,50 0.60 0.70 0,80 1.00 1,20 1,50 2.00

0,1

0,3

0,5

1.0

0,1

0,3

0,5

1,0

0,1

0,3

0,5

1,0

Р—

Р+ Р

Р— р

р— р+ р р— р+ р р— р р— р+ р р— р+ р р— р+ р р— р+ р р— р+ р р— р+ р р— р+ р

0,314 0,290 0,604 0,456 0,392 0,847 0,496 0,411 0,907 0,574 0,422 0,996 0,401 0,371 0,772 0,512 0,452 0,964 0,527 0,460 0,987 0,537 0,462 1,000 0,471 0,439 0,910 0,520 0,477 0,997 0,522 0,478 1,000 0,522 0,478 1,000

0,201 0,183 0,384 0,391 0,318 0,709 0,464 0,353 0,817 0,617 0,374 0,991 0,269 0,246 0,515 0,478 0,395 0,873 0,529 0,420 0,949 0,569 0,430 0,998 0,349 0,319 0,668 0,523 0,447 0,970 0,539 0,455 0,995 0,543 0,457 1,000

0,141 0,129 0,270 0,331 0,261 0,592 0,425 0,307 0,732 0,649 0,338 0,986 0,192 0,175 0,367 0,424 0,338 0,763 0,512 0,381 0,893 0,595 0,401 0,996 0,257 0,234 0,492 0,498 0,407 0,905 0,547 0,432 0,979 0,563 0,437 1,000

0,107 0,097 0,204 0,280 0,217 0,497 0,386 0,268 0,654 0,674 0,307 0,982 0,146 0,133 0,279 0,369 0,288 0,657 0,483 0,344 0,827 0,618 0,375 0,993 0,198 0,180 0,378 0,455 0,362 0,817 0,542 0,405 0,947 0,581 0,419 0,999

0,085 0,077 0,162 0,238 0,183 0,421 0,349 0,236 0,585 0,695 0,282 0,977 0,116 0,105 0,221 0,318 0,246 0,564 0,448 0,309 0,757 0,638 0,351 0,989 0,159 0,144 0,302 0,407 0,318 0,724 0,525 0,377 0,902 0,597 0,401 0,998

0,070 0,063 0,133 0,204 0,156 0,361 0,314 0,209 0,523 0,713 0,259 0,972 0,095 0,086 0,182 0,276 0,211 0,487 0,411 0,277 0,688 0,655 0,328 0,984 0,130 0.118 0,249 0,360 0,278 0,638 0,499 0,347 0,846 0,612 0,384 0,996

0,059 0,053 0,112 0,177 0,135 0,313 0,283 0,186 0,469 0,728 0,239 0,967 0,080 0,073 0,152 0,240 0,183 0,423 0,375 0,248 0,623 0,671 0,307 0,978 0,110 0,100 0,209 0,318 0,243 0,562 0,468 0,317 0,785 0,626 0,366 0,992

0,050 0,046 0,096 0,155 0,118 0,273 0,256 0,166 0,422 0,742 0,221 0,962 0,068 0,062 0,130 0,211 0,160 0,370 0,342 0,222 0,564 0,685 0,287 0,972 0,094 0,085 0,179 0.282 0,214 0,496 0,435 0,288 0,724 0,639 0,349 0,987

0,038 0,035 0,073 0,122 0,092 0,214 0,211 0,134 0,344 0,764 0,189 0,953 0,052 0,047 0,099 0,166 0,124 0,290 0,284 0,179 0,463 0,709 0,249 0,958 0,071 0,064 0,135 0,224 0,168 0,391 0,371 0,237 0,608 0,662 0,312 0,974

0,030 0,028 0,058 0,099 0,074 0,173 0,176 0,109 0,285 0,783 0,162 0,945 0,041 0,037 0,078 0,133 0,099 0,233 0,237 0,146 0,383 0,731 0,214 0,945 0,056 0,051 0,106 0,181 0,134 0,315 0,314 0,195 0,509 0,684 0,275 0,958

0,023 0,020 0,043 0,075 0,056 0,130 0,137 0,083 0,220 0,806 0,129 0,936 0,030 0,027 0,057 0,100 0,074 0,174 0,184 0,110 0,294 0,759 0,171 0,929 0,041 0,037 0,078 0,135 0,099 0,234 0,246 0,147 0,393 0,713 0,222 0,935

0,015 0,014 0.029 0,051 0,037 0,088 0,095 0,056 0.152 0,838 0,091 0,929 0,020 0,018 0,038 0,067 0,048 0,115 0,126 0,073 0,199 0,798 0,118 0,916 0,026 0,024 0,050 0,089 0,064 0,153 0,169 0,096 0,265 0,758 0,153 0,911

Поскольку отношение 52/а'2 имеет распределение Х\-|/(/у-|) 13]. то, заменяя в формуле (8) значение а его

^ выражением через выборочную 5 и случайную величину и, распределенную по 1. получим:

Е сч/^-' 1

~ги V ы Т 2 / | \

(9)

Таким образом, отношение х/х выражается через две случайные величины, одна из которых распределена по закону XV-1- а Другая — по нормальному закону. К сожалению, функция распределения этого отношения не выражается через элементарные функции, поэтому необходимо проводить численный анализ.

Расчет функции распределения отношения х/х проводился методом Монте-Карло. Для этого на ЭВМ генерировались две серии случайных чисел, одна из которых распределена нор мально, а другая — по Х\-|- По каждой паре случайных чисел вычислялось отношение х/х, а затем строилась гистограмма распределения полученных значений. Число рассмот-^ ренных «историй» было таким, что обеспечивалось снижение статистической погрешности оценки накопленной вероятности до значения, не превышающего двух единиц в третьем разряде после запятой.

В таблице в качестве примера приводится некоторая часть результатов расчета (к сожалению, ограниченный объем статьи не позволяет привести весь полученный в данной работе материал). Входными параметрами в этой таблице являются 4 объем выборки N и эмпирическая оценка среднеквадратичного отклонения 5. Для каждого сочетания .V и 5 в таблице представлены значения накопленных вероятностей, соответствующих разным относительным отклонениям О эмпириче-

ской оценки х, вычисленной по формуле (4), от истинного значения х:

А —

Г— х

0=^. (10) X

Значения О изменяются от 0,1 до 1,0. При этом рассчитаны вероятности отклонений оценки Л как в большую (/=4-), так и в меньшую (Р-) сторону от истинной средней х, что позволяет определять вероятности ошибки выборочной средней как в ту, так и в другую сторону. В таблице приводятся также суммарные вероятности ошибки /=■= .).

Применение данных, представленных в таблице, может быть двояким. Во-первых, с их помощью можно по эмпирическому среднеквадратичному отклонению 5 и объему измерений N определить при заданной доверительной вероятности ошибку, которой соответствует оценка среднего значения при выполненном объеме измерений. Во-вторых, можно оценить объем измерений, который необходимо выполнить, чтобы обеспечить оценку среднего значения с требуемой точностью на заданном доверительном уровне. При этом наличие в таблице вероятностей ошибок в большую и меньшую сторону от истинного среднего позволяет определять степень уверенности в том, что полученная оценка превышает (или не превышает) его.

Отметим еще раз, что приведенные в таблице значения вероятностен определяются по эмпирической оценке среднеквадратичного отклонения, а не по его истинному значению, которое в подавляющем большинстве практических случаев неизвестно.

В представленной таблице доверительные вероятности приводятся только для нескольких значений N. Б и О. Весь объем выполненной работы включает 44 различных значений N. изменяющихся в диапазоне от 2 до 200; 30 значений 5 (от 0,1 до 2,0) и 10 значений О (от 0,1 до 1,0). Широкий набор фиксированных значений этих переменных позволяет без больших

погрешностей производить интерполирование данных с целью 3. оценки доверительных вероятностей для промежуточных значений Л', 5 и О. Кроме того, нами разработана подробная 4. таблица значений функции Финни [5], поскольку публикации, в которых содержатся табуляции этой функции, в настоя- 5. шее время малодоступны.

6.

Литература

1. Бадьин В. М.. Маргулис У. Я., Хрущ В. Т. Ц Дозиметрический и радиометрический контроль / Под ред. В. И. Гришма- 7 новского,—М., 1980.—Т. 1,—С. 186—194.

2. Источники и действие ионизирующей радиации: Доклад НК ООН по действию атомной радиации за 1977 г.— М„ 1978.— Т. 2,- С. 10—15.

Крамер Г. Математические методы статистики: Пер. с англ.—М„ 1975,—С. 417—418; 245—246. Aitchison J.. Brown J. А. С. The Lognormal Distribution.— Cambridge, 1957.

Finney D. 1. ¡I J. roy. statist. Soc.— 1941.— N 7, Suppl.— P. 151.

Hounam R. F. An Application of the Log-Normal Distribu- , tion to the Some Air Sampling Results and Resommendations on the Interpretations of Air Sampling Data (AERE—M * 1469).— Harwell, 1965.

KotmogoroU A. N. // C. R. Acad. Sci. URSS.— 1941,— N 31,- S. 99.

Поступила 25.06.92

© КОЛЛЕКТИВ АВТОРОВ. 19ЭЗ УДК 613.632:в78.в|-07

В. Н. Чекаль, Н. Д. Семенюк, В. И. Сватков, А. М. Голиченков

НОВЫЕ МЕТОДИЧЕСКИЕ ПОДХОДЫ К ОЦЕНКЕ И ГИГИЕНИЧЕСКОЙ РЕГЛАМЕНТАЦИИ ПОЛИМЕРНЫХ МАТЕРИАЛОВ

Республиканский научный гигиенический центр Минздрава Украины, Киев

Широкое внедрение продукции химической промышленности в различных областях народного хозяйства выдвигает задачу рационального распределения ее между отраслями потребления и гигиенического обоснования безопасных условий использования. В то же время определение структуры потребления, гигиеническая регламентация применения продукции химической промышленности, особенно синтетических полимерных материалов, все еще остаются трудоемкими, а методические подходы в отдельных случаях несовершенными. Одной из причин несовершенства подходов является их несистемность.

Под новым полимерным материалом (НПМ) будем понимать такой, в котором отразилось любое изменение в технологии его изготовления или потребления. Так, важнейшим свойством полимерного материала служит его горючесть. Ряд авторов дымообразование при горении полимерных материалов рассматривают совместно с токсичностью продуктов пиролиза [2], поэтому их гигиеническое нормирование в окружающей среде проводят по токсичности, устанавливая предельно допустимую нагрузку (ПДН) материала на единицу объема помещения и т. п. Ведутся разработки по созданию полимерных материалов с пониженной горючестью и малой дымообразующей способностью [3, 8], и в этой области уже имеются определенные достижения [9]. Поэтому каждый полимерный материал, менее горючий по сравнению с предшествующими, является новым, требующим новой токсиколого-гигиенической оценки с последующим установлением для него гигиенического норматива (в данном случае ПДН).

В настоящее время разрабатываются методические подходы к определению потребности в полимерных материалах [7]: одним из критериев при распределении ограниченных ресурсов полимерных материалов являются нормативы их потребления на единицу продукции различных отраслей народного хозяйства. Нам представляется, что при гигиеническом нормировании каждого нового полимерного материала можно было бы учитывать его место среди прочих - ранее допущенных к использованию полимерных материалов. Однако, предлагая модель структуры потребления, авторы [6| имеют в виду только техническую и экономическую эффективность; гигиеническая обоснованность отсутствует. Задача настоящего исследования разработать такие подходы к гигиеническому нормированию полимерных материалов, которые учитывали бы не только их токсичность [5|, но и структуру потребления.

Источники информации о структуре потребления можно условно разделить на две категории: 1) народнохозяйственная статистика республик, ведомств и регионов, отражающая такие структуры потребления, «которые в процессе естественного отбора доказали свою жизнеспособность» |6]; 2) существующие в отдельных ведомствах и отраслях нормативные документы и их совокупность. В задачу данного исследования не входит обсуждение тех различих между этими источниками, которые могут наложить отпечаток на величину выведенного из них гигиенического норматива (ПДН). Рассмотрим лишь

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

общие особенности использования статистической структуры потреблении для гигиенического нормирования.

Имея готовые статистические структуры потребления (или нормативно-статистические - соответственно категории источника информации), назовем их реальными генеральными совокупностями (РГС) и охарактеризуем общей массой (М) полимерных материалов в данном изделии. Подберем среди допущенных материалов данной РГС аналог нового материала, подвергнутого токсикологическому исследованию, и его массу выразим через Ма||ал. Тогда отношение этих двух величин даст нам величину, которую назовем предельно допустимой вероятностной мерой (ПДВМ):

ПДВМ=Ма1|ял/МрГС. (1)

Эта величина отражает интеграл вероятностей токсического воздействия НПМ на уровне, допустим, ПДН. Величина ПДН становится функцией величины ПДВМ. Это служит необходимым, но еще недостаточным условием структурного подхода к гигиеническому нормированию НПМ. На фоне условия (1) становится достаточным одновременное наличие экспериментально установленной величины, названной нами обобщенной вероятностной мерой (ОВМ) изменения состояния * организма (СО) при комбинированном, сочетанном или комплексном действии (КСКД) на него НПМ, т. е. ОВМ(СОкск™/н1Ш)). ПДН становится уже функцией двух величин - ПДВМ и ОВМ(СО).

Общий смысл величины ОВМ (СО) раскроем на кратком примере. При гигиенической оценке одного из новых материалов на животных исследовали 23 показателя состояния организма, а на добровольцах — 13 [4|. Пользуясь методом ОВМ, мы могли бы произвести обобщение всех исследованных показателей до единого статистического параметра, которым характеризовали бы реакцию организма в целом по совокупности его исследованных показателей.

Чтобы найти связь между обеими величинами (ОВМ и ПДВМ) и прийти к ПДН, положим, как это принято в токсикологии, что обе величины имеют нормальное распределение, а зависимость доза — эффект полулогарифмическая. Если токсический эффект выразить через I (нормальное стандартизованное отклонение), то

К3=< [максОВМ(СОкскд,нпм))) /I (ПДВМ),

ПДН=10|вуЭН/Ц %

максОВМ (СОкскд(ипм)) >ПДВМ,

где КЗ коэффициент запаса, т. е. кратность уменьшения величины ^ УЭН (удельной экспериментальной навески НПМ) до уровня 1§ ПДН. максОВМ(СОКСКД(НПМ)) — максимальное значение величины ОВМ (СОкскд(Ш1М)).

В результате гигиенический норматив ПДН становится совмещенным, сопряженным со своей ПДВМ:

Гигиенический норматив=

i Надоели баннеры? Вы всегда можете отключить рекламу.