Научная статья на тему 'Инновационная методика анализа выборочного наблюдения'

Инновационная методика анализа выборочного наблюдения Текст научной статьи по специальности «Экономика и бизнес»

CC BY
172
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Наука и техника
Область наук
Ключевые слова
ИННОВАЦИОННАЯ МЕТОДИКА / АНАЛИЗ / ВЫБОРОЧНЫЕ НАБЛЮДЕНИЯ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Шило А. Ф.

Предложена теоретическая методика всестороннего анализа генеральной совокупности по результатам выборки. Она дает возможность с высокой степенью надежности оценить неизвестный размах признака генеральной совокупности, а также количество ее единиц, обладающих определенным значением признака.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Innovative Methodology for Analysis of Selective Observation

The paper proposes a theoretical methodology of all-round sampled population analysis. The methodology permits to evaluate unknown symptom scope of universe general population with high level of reliability and also evaluate a number of its units having a defined value of the symptom.

Текст научной работы на тему «Инновационная методика анализа выборочного наблюдения»

М А Т Е М А Т И К А

УДК 311.43

ИННОВАЦИОННАЯ МЕТОДИКА АНАЛИЗА ВЫБОРОЧНОГО НАБЛЮДЕНИЯ

Канд. техн. наук, доц. ШИЛО А. Ф.

Белорусский национальный технический университет

Выборочное наблюдение - несплошное наблюдение, при котором отбор производится в случайном порядке части единиц всей совокупности (генеральной) с целью последующего распространения полученных данных выборки на всю генеральную совокупность.

Расхождения между значениями показателей, полученных по выборке, и соответствующими показателями генеральной совокупности порождаются ошибками (случайными и систематическими) репрезентативности выборки. Величина случайной ошибки репрезентативности зависит от объема выборки, степени вариации изучаемого признака и принятого способа формирования выборки. Различают среднюю и предельную ошибки. Предельная ошибка рассчитывается по средней при заданной вероятности ее появления.

Теория математической статистики устанавливает, что только среднее арифметическое х, полученное по выборке, является несмещенной, эффективной и состоятельной характеристикой генеральной средней хг, т. е. х = хг. Поэтому с учетом предельной ошибки А доверительный интервал, в котором следует ожидать генеральную среднюю при заданной доверительной вероятности у, определяется неравенством

х -А< хг < х + А.

Исходя из него в некоторых источниках по статистике применяется так называемый способ прямого пересчета, по которому другие показатели генеральной совокупности рассчитываются путем его почленного умножения на объем генеральной совокупности N по формуле

( х -А) N < хЫ <( х + А) N.

При этом наблюдается различное толкование величины хЫ: в одних - среднее генеральной совокупности, в других - суммарное количество признака и т. д. Так, в [1] при анализе выборки двадцати предприятий на предмет производительности труда по результатам расчетов х = 21,51 и А = 3,62 (как ниже будет показано, А определено с грубыми ошибками) приводится неравенство 17,88 < х < 25,14. Далее делается заключение: «Пределы, в которых можно ожидать суммарную производительность труда, для ста предприятий составят 17,88-100 < хЫ < 25,14-100; 1788 < хЫ < 2514».

Возникает вопрос: какую суммарную производительность отражает последнее неравенство - среднюю или общую? Очевидно, применяемый способ прямого пересчета не является бесспорным, так как не задействован такой важный показатель, как дисперсия; к тому же никак не аргументирован. Как следует из приведенного примера, значимость результатов практически равна нулю.

Между тем очень важно грамотно оценить пределы изменения не только средней генеральной совокупности хг, но и всех ее возможных значений Хг (размах признака) при наличии или отсутствии гипотетического объема генеральной совокупности N. Такого рода исследований не обнаруживается.

Автором делается попытка восполнения указанного пробела. В результате математических исследований, подтвержденных расчетами на примерах, получены следующие результаты.

1. Интервал возможных значений признака генеральной совокупности по выборочной

Наука итехника, № 5, 2012

средней х и предельной ошибке А оценивается правилом трех дельта

х - ЗА < х < x + ЗА.

(1)

Если распределение симметричное или близко к таковому, то интервалом (1) будут охвачены все возможные значения генеральной совокупности.

При значительной левосторонней асимметрии (х больше середины размаха выборки) правый конец расчетного интервала может несколько выходить за рамки возможных значений признака генеральной совокупности, в то время как часть значений может оказаться вне левого конца. Аналогично при правосторонней асимметрии. Однако число возможных значений признака генеральной совокупности, остающихся (если это имеет место) вне расчетного интервала по приведенной формуле, мало; их вероятность в пределах (1 - у).

2. При заданном объеме генеральной совокупности N можно оценить количество ее единиц, обладающих значением признака Хк, по формуле

m

N(xK) = m N, n

(2)

где тк - частота значения Хк; п - объем выборки.

Погрешность найденного Щхк) составляет

ЗА | 1 --I, %.

(3)

Очевидно, погрешность с увеличением объема выборки должна уменьшаться, что имеет место в (3). В самом деле, с возрастанием

п(п ^ N сомножитель ^ 1уменьшается, а следовательно, убывает значение (3). При

п = N разность ^ 1 обращается в нуль,

т. е. погрешность равна нулю, что тоже соответствует действительности, ибо в этом случае выборка перестает быть таковой - берется вся генеральная совокупность.

В случае задания признака непрерывной величиной (ряд распределения - интервальный)

в формулах (1) и (2) Хк - середины интервалов, на которые разбивается размах признака. Следовательно, Щхк) выражает количество единиц генеральной совокупности интервала, содержащего Хк.

Таким образом, в вышеприведенном примере среднее значение производительности труда генеральной совокупности любого предприятия оценивается интервалом хг = х ±А = 21,51 ±

±3,62 = (17,89; 25,13),а ее возможные значения по формуле (1) - интервалом хг = х ± ЗА = = 21,51 ± 10,86 = (10,65; 32,37).

Как и должно быть, интервал средних значений производительности труда генеральной совокупности предприятий меньше интервала возможных значений и является симметричным подмножеством множества ее вариации.

При наличии интервального ряда (в [1] он отсутствует), по которому получены х и А, можно было бы оценить по формуле (2) количество предприятий из ста заявленных, обладающих определенным уровнем производительности труда.

Проиллюстрируем применение разработанной методики распространения результатов выборки на генеральную совокупность примером успеваемости студентов, где итоги можно сопоставить с реальными.

Из 500 студентов, сдавших экзаменационную сессию, произведена случайная повторная выборка объема п = 25, представленная дискретным вариационным рядом:

Оценка Хк 2 3 4 5 6 7 8 9 10

Количество

студентов тк 1 1 5 4 4 3 3 2 2

Требуется:

1. Оценить интервалы средней и возможных оценок экзаменовавшихся (в том числе 500) с доверительной вероятностью у = 0,99.

2. Оценить количество студентов из 500, получивших соответствующую оценку.

Находим среднее арифметическое х и дисперсию выборки В по формулам:

х = -

хш 152 ' к к 152 = 6,08; ш„

25

■■ Наука итехника, № 5, 2012

D =

Z(хк - x )Ч _ 113,83

m„

25

= 4,55.

Определяем среднюю ошибку по формуле повторной случайной выборки

- I D _ /4,55 * У n-1 У ~24~

= 0,435.

При доверительной вероятности у = 0,99 и объеме выборки п = 25 коэффициент t(n; у) будет t(25; 0,99) = 2,8.

Следует отметить, что в большинстве приведенных источников низкий уровень математической культуры, весьма вольное обращение с формулами. Так, в [1-3] при расчетах ц знаменатель (n - 1) заменяется на п. Это допустимо, если объем выборки п > 30, а расчеты ведутся до десятых долей [4, 5].

Также не учитывается объем выборки при определении коэффициента t по доверительной вероятности, что приводит к грубым ошибкам. Так, в том же примере с производительностью труда при бесповторном случайном отборе с п = 20 (20 < 30) и заданном объеме генеральной совокупности N = 100 средняя ошибка должна определяться по формуле ц =

Id ( n^

= I- 1--и составит ц = 1,86 вместо

\п -1 ^ N )

приведенной ц = 1,81. Значение параметра t при объеме выборки п = 20 и у = 0,954 должно быть t = 2,18 [6] вместо приведенного t = 2,00. Так что предельная ошибка равна А = 1,86 • 2,18 = 4,05 вместо А = 3,62, т. е. погрешность ее определения составляет 4,05 - 3,62 = 0,43 (11 %).

В нашем примере предельная ошибка составит А = ^ = 0,435 • 2,8 = 1,22. Следовательно, средняя генеральная оценок в интервале X = 6,08 ± 1,22 = (4,9; 7,3), а их вариация в интервале x = 6,08 ± 3 • 1,22 = (2,4; 9,7).

Таким образом, с вероятностью 0,99 (99 случаев из 100; 495 случаев из 500) можно утверждать, что средняя оценка генеральной совокупности (в том числе 500) будет в интервале (4,9; 7,3), а интервал вариации оценок составит (2,4; 9,7), т. е. расчетный интервал возможных значений оценок генеральной совокупности в данном случае после округления до целых совпадает с интервалом выборки (2; 10).

Наука

итехника, № 5, 2012_

Если доверительную вероятность взять у = = 0,999 (999 случаев из 1000), то предельная ошибка составит А = 0,435 • 3,74 = 1,62, а интервалы будут хг = 6,08 ± 1,62 = (4,5; 7,7); хг =

= 6,08 ± 3 • 1,62 = (1,2; 10,9). Расчетный интервал оценок с округлением до целых составит (1; 11), т. е. правый конец содержит невозможную оценку 11, а «за бортом» левого оказалась маловероятная оценка 0, что обусловлено значительной левосторонней асимметрией выборки (х = 6,08 больше середины выборки 10 - 2

2

■ = 4 на 2 единицы).

Оценим количество студентов из 500 получивших соответствующую оценку. Расчеты по формуле (2) представлены третьей строкой расчетной табл. 1, а их абсолютная погрешность по формуле (3) 3,66 • 0,95 % = 3,48 % -четвертой строкой.

Таблица 1

Расчетная таблица

Оценка хк 2 3 4 5 6 7 8 9 10 Сумма

Частота тк 1 1 5 4 4 3 3 2 2 25

Количество студентов 20 20 100 80 80 60 60 40 40 500

Абсолютная погрешность 0,7 0,7 3,5 2,8 2,8 2,1 2,1 1,4 1,4 18,0

Итак, например, оценку 5 баллов из 500 получат 80 студентов с погрешностью 3 (округление до целых), т. е. их число от 77 до 83; 8 баллов - от 58 до 62 и т. д. Следует отметить, что только у 18 студентов из 500 по приведенным расчетам оценка может быть иной (она возможна из вошедших в выборку, а также 0 и 1, не попавших в нее).

Как показали расчеты на других примерах, предложенная методика дает возможность объективного и всестороннего анализа любого признака генеральной совокупности по результатам выборки. Она проста в применении и обеспечивает достаточно высокую точность результатов.

С целью удобства и грамотных расчетов в табл. 2 в диапазоне применяемых на практике приводятся значения ¿(и; у).

Таблица 2

Таблица значений Цп\ у)

и/у 0,90 0,95 0,99 0,999

5 1,99 2,78 4,60 8,61

6 1,96 2,57 4,03 6,86

7 1,93 2,45 3,71 5,96

8 1,90 2,37 3,50 5,41

9 1,88 2,31 3,36 5,04

10 1,86 2,26 3,25 4,78

12 1,84 2,20 3,11 4,44

14 1,82 2,16 3,01 4,22

16 1,80 2,13 2,95 4,07

18 1,78 2,11 2,90 3,97

20 1,76 2,09 2,86 3,88

25 1,74 2,06 2,80 3,74

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

30 1,72 2,04 2,76 3,66

35 1,70 2,03 2,72 3,60

40 1,69 2,02 2,71 3,56

50 1,68 2,01 2,68 3,50

60 1,67 2,00 2,66 3,46

70 1,67 1,99 2,65 3,44

80 1,66 1,99 2,64 3,42

90 1,66 1,98 2,63 3,40

100 1,65 1,98 2,63 3,39

120 1,65 1,97 2,62 3,38

В Ы В О Д Ы

Разработана простая и удобная в применении методика распространения данных выборки на генеральную совокупность. Она позволяет всесторонне проанализировать генеральную совокупность с достаточно высокой степенью надежности:

1) оценить интервал вариации признака генеральной совокупности формулой (правило трех дельта) х - ЗА < хг < х + ЗА;

2) оценить объем генеральной совокупности N обладающий значением признака Хк, формулой N (хк ) = —^ N с точностью

3А|1 — | %.

Л И Т Е Р А Т У Р А

1. Статистика / И. И. Колесникова [и др.]. - М., 2007.

2. Захаренков, С. Н. Статистика / С. Н. Захаренков. -Минск: БГУ, 2010.

3. Общая теория статистики / под ред. Л. И. Карпенко. - Минск: БГЭУ, 2007.

4. Статистика автомобильного транспорта / И. М. Алексеева [и др.]. - М., 2005.

5. Статистика / под ред. И. М. Елисеевой. - М., 2009.

6. Гмурман, В. Е. Теория вероятностей и математическая статистика / В. Е. Гмурман. - М., 2002.

Поступила 30.03.2012

УДК 517.956

ПРИБЛИЖЕННОЕ РЕШЕНИЕ ОДНОГО УРАВНЕНИЯ ТЕОРИИ КРЫЛА МЕТОДОМ АСИМПТОТИЧЕСКИХ ПОЛИНОМОВ

Канд. физ.-мат. наук, доц. ГРИБКОВА В. П., канд. техн. наук, доц. КОЗЛОВ С. М.

Белорусский национальный технический университет

В [1] подробно анализируется один из приближенных методов решения уравнения теории крыла конечного размаха, которое описывается сингулярным интегро-дифференциальным уравнением

Г(х)/В(х) - Г'(0/0 - х)й1 = /(х),

хе[-1, 1], (1)

где /(х) и В(х) - известные функции (функция В(х) нигде не обращается в нуль, за исключе-

Наука итехника, № 5, 2012

i Надоели баннеры? Вы всегда можете отключить рекламу.