Тараканова В.В.,
кандидат педагогических наук, доцент МГГУ им. М. А. Шолохова Наумкин Б.И., кандидат медицинских наук, Заслуженный учитель России, директор Егорьевского медицинского училища им. Героя Советского Союза 3. Самсоновой
Формирование выборочной совокупности
В любом исследовании генеральная совокупность представляет собой группу потенциальных участников, на которую исследователь хочет распространить результаты своего исследования. Примерами генеральной совокупности могут служить:
• все педагогические работники конкретной организации;
• все школьники конкретного населенного пункта, находившиеся на обучении в период с 1 января 2001 г. по настоящее время;
• администрация всех образовательных учреждений, организаций города и т.д.
Если генеральная совокупность невелика, речь может идти о ее полном охвате. Как правило, в ходе проведения научного исследования собирающий информацию имеет
дело с большими генеральными совокупностями, полное исследование которых дорого и требует длительного времени. Поэтому при проведении исследования после определения генеральной совокупности всегдарешается вопрос о составлении выборочной совокупности, что значительно снижает затраты на проведение самого исследования.
Выборочная совокупность должна быть сформирована насколько возможно репрезентативно для генеральной совокупности, давать как бы ее уменьшенную картину, чтобы по выборочным значениям можно было судить о значениях генеральной совокупности.
Под репрезентативностью в данном случае понимается соответствие характеристик, получаемых в результате выборочного наблюдения, показателям, характеризующим всю генеральную совокупность.
Существуют различные методы формирования выборочной совокупности, что зависит, в первую очередь, от целей исследования. Условно эти методы можно объединить в две группы: случайная выборка и неслучайная выборка.
Случайная выборка основана на концепции случайного отбора элементов из генеральной совокупности. Существуют четыре наиболее распространенных метода формирования случайной выборки: простая случайная выборка, расслоенная случайная выборка, выборка путем разбиения на группы, систематическая выборка (табл. 1).
Таблица 1
Характеристика методов формирования случайной выборки
Название метода Описание метода Достоинства и недостатки Примеры
Простая случайная выборка Регистрируются все элементы генеральной совокупности, затем случайным образом происходит отбор выборочной совокупности. Любой элемент генеральной совокупности имеет равный и независимый шанс быть выбранным в качестве части выборочной совокупности Низкий риск систематической ошибки. Требуется много времени для получения выборки Отбор по первой букве фамилии
Расслоенная случайная выборка Отбор участников случайным образом из двух или более групп, на которые предварительно была разделена генеральная совокупность Высокая репрезентативность. Низкий риск систематической ошибки. Требуется много времени для получения выборки. Необходимо знание основной структуры генеральной совокупности Педагогические работники всех образовательных учреждений: администрация, учителя, а затем отбирается случайным образом (по первой букве фамилии)
Выборка путем разбиения на группы Многоэтапный процесс взятия выборки, при котором сначала отбираются большие группы, затем следует отбор все более мелких единиц выборки Эффективный способ получения большой выборки, если нельзя использовать единицы генеральной совокупности. Риск ошибки высокий Деление генеральной совокупности учителей определенного населенного пункта по месту работы, далее по стажу работы, квалификационной категории и т.д.
Систематическая выборка Отбор каждого п-ого элемента из генеральной совокупности Создание специального листа отбора в выборочную совокупность Для отбора 100 элементов из генеральной совокупности размером в 1000 элементов исследователь сначала выбирает случайное число в промежутке от 1 до 10. Элемент с этим номером плюс каждый десятый из последующих элементов включается в случайную выборку.
Таблица 2
Методы исследования
Название метода Описание метода Достоинства и недостатки Примеры
Метод удобной (доступной) выборки Участники отобраны потому, что оказались в нужном месте в нужное время Легкодоступный. Высокий риск систематической ошибки. Репрезентативность сомнительна Школьники определенной школы, студенты какого-то факультета
Включение участников на основе определенных характеристик Имеется систематическая ошибка При изучении индивидуального различия в мыслительной деятельности дошкольников и младших школьников
Метод целевой выборки Отбор элементов из генеральной совокупности производится на основе личного мнения исследователя о репрезентативности Легкодоступный. Может иметь место высокий риск систематической ошибки. Ограниченная возможность для обобщения результатов Исследователь отбирает уникальные случаи, являющиеся наиболее информативными. Формирование готовности детей к обучению в школе, изучение детей с задержкой развития, одаренные дети.
Неслучайное взятие выборки предполагает отбор выборочной совокупности с помощью следующих методов: удобной (доступной) выборки, пропорциональной выборки, целевой выборки (таблица 2).
При ограниченной возможности обобщения результатов исследователь отбирает уникальные случаи, являющиеся наиболее информативными.
В качественных исследованиях почти всегда используются неслучайные выборки. Это объясняется тем, что по сравнению с количественными исследованиями в них меньше внимания уделяется репрезентативности выборки. Цель большинства качественных исследований - найти значение и вскрыть многочисленные реальные факты, поэтому возможность обобщения не является ведущим критерием.
Для определения объема выборки в качественных исследованиях не существует особых критериев или норм. Объем выборки должен устанавливаться на основе потребности в информации. Процесс взятия выборки продолжается до достижения насыщения данными, т.е. до того момента, когда уже невозможно добавить никакой новой информации.
Объем выборки в количественных исследованиях должен быть, как правило, большим, особенно если генеральная совокупность разнородна с точки зрения интересующих исследователя переменных.
Принято считать, что размер выборки зависит от вида планируемого анализа данных, от решения исследователя, насколько точной должна быть выборка, чтобы соответствовать целям исследования, а также от характеристик генеральной совокупности. Большой размер выборки сам но себе не гарантирует репрезентативности. Крупная выборка без применения метода случайного выбора или при использовании плохой основы выборки является менее репрезентативной, чем менее крупная выборка, составленная по методу случайного выбора, основы которой безупречны.
Вопрос о размере выборки может быть рассмотрен с двух сторон. С одной стороны, целесообразно сделать допущение относительно совокупности и приме-
нить статистические равенства в отношении процесса случайного выбора. Исследователь должен сделать допущения относительно приемлемой степени соответствия (или количества ошибок), а также уровня вариации совокупности.
Второй более часто используемый метод - правило большого пальца - условное или общепринятое количество. Исследователи используют его, так как они редко обладают информацией, которой требует статистический метод, а также потому, что таким образом размер выборки приближается к размеру, требующемуся для статистического метода. Правило большого пальца не является случайным, оно основано на существующем опыте, и полученные на его основании выборки соответствуют требованиям статистического метода.
Один из принципов определения размера выборки гласит, что чем меньше совокупность, тем выше должно быть выборочное отношение для получения точной выборки (т.е. выборки с высокой вероятностью получения тех же результатов, что и при исследовании всей совокупности). В случае крупных совокупностей допустимо более низкое выборочное отношение для получения таких же точных выборок. С увеличением размера совокупности снижается точность выборки.
Для небольшой совокупности (менее 1 ООО) исследователь должен применять высокое выборочное отношение (около 30%). Например, для обеспечения высокой степени точности требуется размер выборки в 300 элементов. Для относительно большой совокупности (10 ООО) чтобы обеспечить такую же степень точности, требуется меньшее выборочное отношение (около 10%) или размер выборки около 1 000 элементов. Для крупной совокупности (свыше 150 000) допустимо небольшое выборочное отношение (1%), и выборки, состоящие из 1 500 элементов, могут быть очень точными. Для получения выборки из очень крупной совокупности (свыше 10 миллионов) точность может быть обеспечена путем использования очень маленького выборочного отношения (0,025%) или выборки в размере около 2500 элементов.
В отношении небольших выборок некоторое увеличение размера дает значительное увеличение точности. Равноценное увеличение размера выборки больше увеличивает точность для небольших выборок, чем для больших. Например, увеличение размера выборки с 50 до 100 снижает ошибки с 7,1 до 2,1 %, однако увеличение с 1 ООО до 2 ООО снижает ошибки только с 1,6 до 1,1%.
Для каждого метода при проведении социологических исследований имеются свои правила установления минимального объема выборки. Объем случайной выборки может быть рассчитан по формуле :о п = (Ч2а21чГ) / (А2К + Х2о2), где п - объем выборки;
а - дисперсия, или мера рассеивания исследуемого признака, характеризующая величину отклонения от средних величин в генеральной совокупности;
X - коэффициент доверия (критерий достоверности); А - предельная ошибка выборки;
N - численность генеральной совокупности. Данная формула применяется для определения величины выборки при заранее заданном размере генеральной совокупности (КГ).
При достаточно больших значениях N произведением X2 а2 можно пренебречь и вести расчет выборочной совокупности по следующей формуле: п = (г2 а2) : А2.
Дисперсия (а), или мера рассеивания исследуемого признака, может быть рассчитана как произведение доли лиц, обладающих определенным качественным признаком (р), и доли лиц, не имеющих его (3*): а2 = р.ё = р.(1-р).
Максимальная дисперсия наблюдается при р = g, что составляет
а2 = 0,5 *0,5 = 0,25.
Максимальное значение дисперсии (0,25) можно использовать при расчете необходимой численности случайной выборки без пилотного исследования.
Предельная ошибка выборки (А) и коэффициент доверия (1) устанавливаются исследователем в зависимости от требуемой точности и надежности проводимого исследования. Например, наиболее употреби-мыми значениями при проведении социологических исследований в отечественном здравоохранении являются: А = 0,05 и X = 2, что обеспечивает достоверность результатов в 95 случаях из 100 с предельной ошибкой ± 5%.
Таким образом, решение исследователя относительно наилучшего размера выборки зависит от трех факторов:
1) степени требуемой точности;
2) степени изменяемости или рассредоточения совокупности;
3) количества различных переменных, параллельно анализируемых в исследовании.
При прочих равных условиях более крупная выборка необходима для достижения более высокой степени точности, если совокупность обладает высоким уровнем изменяемости или гетерогенности либо если исследователь на основании полученных данных стремится параллельно анализировать множество переменных. Небольшой размер выборки является достаточным, когда приемлема меньшая степень точности, когда совокупность гомогенна или когда в одно и то же время анализируется небольшое число переменных.
Для исследования применяют выборочное и сплошное исследование.
Сплошным исследованием пользуются тогда, когда изучают все единицы, входящие в объект наблюдения. Примером сплошного наблюдения может служить перепись школьников всех общеобразовательных учреждений населенного пункта, регистрация заболеваний среди школьников и т. п. При сплошном наблюдении стараются охватить и зарегистрировать абсолютно все случаи изучаемого явления. Однако это не всегда удается.
С очень большой степенью вероятности, практически равной уверенности, можно предполагать, что результаты, полученные при исследовании достаточно большого числа случаев, будут подтверждены и при исследовании всех остальных - ненаблюдаемых случаев. Выборочное исследование в сравнении со сплошным дешевле. Оно может быть проведено при меньшем количестве персонала и с меньшими материальными затратами.
Выборочное исследование дает и более точные результаты.
При проведении образовательных, а также всех других научных исследований допускается известная ошибка, называемая ошибкой регистрации. Она объясняется неверными ответами опрашиваемых, техническими ошибками лиц, ведущих исследование, неточностями в инструментарии, лабораторными ошибками и т.п. Наряду с этими ошибками при выборочном исследовании допускается и другой вид ошибок, так называемые ошибки несплошного наблюдения. Подобные ошибки не встречаются при сплошных исследованиях. Но при сплошных исследованиях обычно допускается большее количество ошибок регистрации, так как при них регистрация проводится более многочисленным и из-за этого менее квалифицированным персоналом. При выборочных исследованиях общий размер ошибок значительно меньше, чем при сплошных, за счет уменьшения ошибок регистрации. Именно из-за этого считается, что выборочные исследования точнее сплошных.
Важным обстоятельством при этом является и то, что математическая статистика в настоящее время имеет подробные схемы применения различных видов выборочного наблюдения, формулы для определения необходимого числа наблюдений, формулы определения размеров ошибки выборки и для оценки и сравнения результатов, полученных при различных выборочных исследованиях, и пр.
В настоящее время выборочные (репрезентативные) исследования используются почти во всех отраслях педагогических наук.
В связи с широким применением выборочных исследований в педагогике следует иметь в виду некоторые их особенности. Подготовка и организация выборочных наблюдений связаны с учетом ряда условий, выполнение которых обеспечивает так называемую представительность (репрезентативность). Пренебрегать этими условиями нельзя, так как пренебрежение ими приводит к получению неверных результатов. Кроме того, для проведения репрезентативного наблюдения требуется более квалифицированный персонал, а статистическая обработка и толкование полученных результатов труднее и связаны с более сложной вычислительной работой.
Однако необходимо помнить, что в большинстве случаев репрезентативное наблюдение является единственно возможной формой научного исследования, так как сплошное исследование большой, так называемой генеральной, совокупности практически не осуществимо.
Репрезентативное (выборочное) наблюдение может быть проведено как стохастическое (случайное) или типологическое. В первом случае объекты, подвергнутые наблюдению, подбирают случайно, не преднамеренно, во втором - их отбирают сознательно, учитывая их типичность и принадлежность к отдельным подразделениям изучаемого явления.
Определение объема выборки. Нередко в практической и научной работе учителя возникает вопрос о числе наблюдений, необходимых для обоснования достоверности выводов (средних и относительных величин).
Разрешение этой задачи нужно тогда, когда необходимо сузить границы случайных колебаний, т.е. уменьшить величину средней ошибки (увеличить точность и надежность).
Увеличивая произвольно объем выборки (образца), можно уменьшить ошибку выборочного наблюдения (образца) до любых пределов. В связи с этим разрешается и обратная задача, т. е. выясняется, какое потребуется число наблюдений, чтобы гарантировать результат выборки с заданной надежностью и точностью.
Формула средней ошибки соответствует
12<52
Ш2 =-----
п
0, — степень точности); откуда
12<52
п = ~п~
при I = 1,0 лишь в 68 случаях из 100 ошибка не должна превышать заданной.
Например, перед нами поставлена задача в порядке случайной выборки определить необходимое число лиц для обследования детей с задержкой развития, при этом ошибка средней в 68 случаях из 100 не долж-
на превышать 0,80; среднее квадратическое отклонение равняется 12,5. Подставляя соответствующие значения в приведенную выше формулу п, найдем:
п= «244 (при 1=1).
0,802
Для получения искомой выборки необходимо подвергнуть изучению примерно 244 человека.
Если надежность выводов исследователь хочет довести до 95% (р=0,95), то точность будет составлять Х= 2,0. В этом случае п будет равно:
0,802
Допустим, что при обследовании детей с задержкой развития доля неудачных будет составлять 10%; следует выяснить, сколько объектов необходимо подвергнуть обследованию в порядке случайной выборки, если средняя ошибка будет составлять 4,0%;
10 (100-10) -900 ~56 42 16
Для постановки опыта в данных конкретных условиях потребуется подвергнуть обследованию в порядке случайной выборки 56 единиц.
Приведем в заключение следующий пример.
При определении детей с задержкой развития среднее квадратическое отклонение разности между средними составляло 11,85 , средняя ошибка разности -4,0; каково должно быть число наблюдений при обследовании в порядке случайной выборки, чтобы надежность выводов соответствовала 95% (I = 2,0). По той же формуле находим: п= 22—х 11.85- = 561.69 = 35 42 16
При намеченных условиях число детей с задержкой развития должно составлять 35 человек.
Подчеркнем, что производство выборки должно осуществляться с соблюдением всех указанных выше правил и полной объективности (беспристрастности) при отборе единиц, включаемых в выборку. В тех случаях, когда не известна величина среднего квадратического отклонения, необходимо получить ее либо из данных пробного («пристрелочного») наблюдения, либо на основе литературных данных. В процессе дальнейших исследований величина а будет уточняться.
Список литературы
1. Грабарь М.И., Краснянская К.А. Применение математической статистики в педагогических исследованиях. Непараметрические методы. - М.: Педагогика, 1977. -325 с.
2. Кыеерялг А.А. Методы исследования в профессиональной педагогике. - Таллинн: Валтус, 1980. - 334 с.
3. Маслак А.К. Основы планирования и анализ сравнительного эксперимента в педагогике и психологии. -Курск: РОСИ, 2001. - 283 с.