Научная статья на тему 'Теория проверки статистических гипотез при математико-статистическом исследовании педагогических проблем'

Теория проверки статистических гипотез при математико-статистическом исследовании педагогических проблем Текст научной статьи по специальности «Математика»

CC BY
1007
53
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИКО-СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ / СТАТИСТИЧЕСКАЯ ГИПОТЕЗА / ПАРАМЕТРЫ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ / НУЛЕВАЯ И АЛЬТЕРНАТИВНАЯ ГИПОТЕЗЫ / СТАТИСТИЧЕСКИЙ КРИТЕРИЙ / ОСНОВНОЙ ПРИНЦИП ПРОВЕРКИ СТАТИСТИЧЕСКОЙ ГИПОТЕЗЫ / MATHEMATICAL-STATISTICAL RESEARCH / STATISTICAL HYPOTHESIS / POPULATION PARAMETERS / ZERO AND ALTERNATIVE HYPOTHESES / STATISTICAL CRITERION / BASIC PRINCIPLE OF CHECK OF A STATISTICAL HYPOTHESIS

Аннотация научной статьи по математике, автор научной работы — Большакова Людмила Валентиновна, Яковлева Наталья Александровна

В статье рассмотрен один из этапов математико-статистического исследования, связанный с проверкой статистических гипотез. Кратко даны общие понятия теории проверки статистических гипотез, приведена классификация гипотез, а также представлена общая схема проверки любой статистической гипотезы. Более подробно рассмотрены гипотезы о параметрах генеральной совокупности: их описание, схема проверки и примеры применения в психолого-педагогических исследованиях.Статья предназначена в первую очередь для адъюнктов, курсантов и слушателей СанктПетербургского университета МВД России, занимающихся проведением научных исследований, в которых появляется необходимость проверить правильность того или иного утверждения на основе статистического материала.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Большакова Людмила Валентиновна, Яковлева Наталья Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The theory of statistical hypothesis testing with the mathematical-statistical study of educational problems

The article deals with one of the stages of mathematical and statistical research related to the verification of statistical hypotheses. A brief description of the general concepts of the theory of statistical hypothesis testing, hypothesis shows classification, as wellas the general scheme of any statistical hypothesis test. More detail the hypothesis about the parameters of the population: their description, verification and application examples of the scheme in the psychological and pedagogical research.

Текст научной работы на тему «Теория проверки статистических гипотез при математико-статистическом исследовании педагогических проблем»

3. Иванов, И. В. Формирование у курсантов ИКТ-компетенций средствами междисциплинарных связей автоматизированных комплексов : дис. ... канд. пед. наук. - Санкт-Петербург, 2015. - 160 с.

4. Иванов, И. В. Формирование ИКТ-компетенций в специализированном военном вузе : учебно-методическое пособие. - Пермь: Издательство Пермского ВИ ВВ МВД России, 2016. - 100 с.

5. Каракозов, С. Д., Куликова, Л. Г. Инновационные процессы в поликультурной образовательной среде вуза: социокоммуникативный компонент // Мир науки, культуры, образования. - 2012. - № 4. - С. 236-239.

6. Кочин, А. А., Горелов, С. А., Михайлов, О. Г. Актуальность внедрения инновационных технологий в образовательный процесс по дисциплине «Тактико-специальная подготовка» в образовательных организациях МВД России // Вестник Санкт-Петербургского университета МВД России. - 2015. - № 3. - С. 145-149.

7. Лурье, Л. И. Педагогика призвана распознавать суть событий и явлений, чтобы осмыслить будущее новых поколений // Сибирский педагогический журнал. - 2014. - № 3. - С. 191-196.

8. Семеновских, Т. В. «Клиповое мышление» - феномен современности. [Электронный ресурс] // Сайт «Оптимальные коммуникации». - 2013. - 18 фев. - Режим доступа: http://Jarki.ru/ wpress/2013/02/18/3208/ (дата обращения: 10.10.2016).

9. Темербекова, А. А., Байгонакова, Г. А. Проектирование коммуникативной деятельности студентов в условиях производственной практики // Мир науки, культуры, образования. - 2012. - № 2. - С. 164-167.

10. Шемякинский, В. М. Культура. Философия. Наука / Уральская академия государственной службы. - Пермь: Издательство «От и до», 2008. - 160 с.

УДК 519.237.3

Л.В. Большакова*, Н.А. Яковлева**

Теория проверки статистических гипотез

при математико-статистическом исследовании педагогических проблем

В статье рассмотрен один из этапов математико-статистического исследования, связанный с проверкой статистических гипотез. Кратко даны общие понятия теории проверки статистических гипотез, приведена классификация гипотез, а также представлена общая схема проверки любой статистической гипотезы. Более подробно рассмотрены гипотезы о параметрах генеральной совокупности: их описание, схема проверки и примеры применения в психолого-педагогических исследованиях.

Статья предназначена в первую очередь для адъюнктов, курсантов и слушателей Санкт-Петербургского университета МВД России, занимающихся проведением научных исследований, в которых появляется необходимость проверить правильность того или иного утверждения на основе статистического материала.

Ключевые слова: математико-статистическое исследование, статистическая гипотеза, параметры генеральной совокупности, нулевая и альтернативная гипотезы, статистический критерий, основной принцип проверки статистической гипотезы.

L.V. Bolshakova*, N.A. Yakovleva**. The theory of statistical hypothesis testing with the mathematical-statistical study of educational problems. The article deals with one of the stages of mathematical and statistical research related to the verification of statistical hypotheses. A brief description of the general concepts of the theory of statistical hypothesis testing, hypothesis shows classification, as well

* Большакова, Людмила Валентиновна, кандидат физико-математических наук, доцент, профессор кафедры математики и информатики Санкт-Петербургского университета МВД России. Адрес: Россия, 198206, Санкт-Петербург, ул. Летчика Пилютова, д. 1. Тел. 8-(812)-744-48-22; 8-921-984-49-05. E-mail: [email protected].

** Яковлева, Наталья Александровна, кандидат психологических наук, начальник кафедры математики и информатики Санкт-Петербургского университета МВД России. Адрес: Россия, 198206, Санкт-Петербург, ул. Летчика Пилютова, д. 1. Тел. 8-(812)-744-48-22; 8-921-415-22-33. E-mail: [email protected].

* Bolshakova, Lyudmila Valentinovna, candidate of physical and mathematical sciences, the senior lecturer, professor of chair of mathematics and informatics of Saint-Petersburg university of Ministry of Internal Affairs of Russia. Address: Russia, 198206, Saint-Petersburg, Lyotchika Pilyutova str., 1. Ph. 8-(812)-744-48-22; 8-921-984-49-05. E-mail: [email protected].

** Yakovleva, Natalia Alexandrovna, candidate of psychological sciences, chief of chair of mathematics and informatics of the Ministry of Internal Affairs St. Petersburg university of Russia. Address: Russia, 198206, St. Petersburg, Lyotchika Pilyutova str., 1. Ph. 8-(812)-744-48-22; 8-921-415-22-33. E-mail: [email protected].

© Большакова Л.В., Яковлева Н.А., 2016

as the general scheme of any statistical hypothesis test. More detail the hypothesis about the parameters of the population: their description, verification and application examples of the scheme in the psychological and pedagogical research.

Keywords: mathematical-statistical research, statistical hypothesis, population parameters, zero and alternative hypotheses, statistical criterion, basic principle of check of a statistical hypothesis.

Для исследования и дальнейшего решения различных психолого-педагогических проблем часто используют разнообразный статистический материал, однако собрать всю статистику по рассматриваемой проблематике не всегда возможно. Неполный сбор информации может быть связан, например, с нехваткой времени или средств, а также с наличием определенных свойств исследуемых явлений или процессов, включающих случайности разного рода. Решение проблем на основе неполной информации составляет основное содержание выборочного математико-статистического исследования.

Для получения результатов, адекватных действительности, необходимо должным образом применять основные методы этого исследования, в частности, не только правильно формировать выборку и применять соответствующие методы анализа, но и корректно делать выводы и прогнозы на их основе, т.е. в строгом соответствии с теоретическими положениями математико-статистического анализа.

Исследование какой-либо проблемы, в т.ч. проблемы в области педагогики и психологии, с помощью математико-статистического анализа можно разделить на следующие условные этапы:

1) постановка задачи;

2) получение, представление и обработка выборочной информации;

3) получение оценок параметров генеральной совокупности;

4) проверка статистических гипотез;

5) исследование однородности генеральной совокупности;

6) исследование взаимосвязи признаков.

На первом этапе формулируются цели и задачи исследования, определяются конкретные признаки, типы данных, шкалы измерения и, при необходимости, ряд условий и характеристик, влияющих на результаты исследования.

Второй этап связан со сбором статистической информации и дальнейшей её обработкой. На этом этапе решаются три главные задачи. Первая заключается в правильном выборе статистических данных, т.е. в необходимости сформировать, в зависимости от постановки задачи, одну или несколько репрезентативных выборок из одной или нескольких генеральных совокупностей. Задача определения объёма и состава выборочной совокупности достаточно подробно рассмотрена, например, в работе [1]. Однако необходимо отметить, что при анализе некоторых психолого-педагогических проблем могут появиться качественные признаки или признаки, значения которых можно определить только с помощью мнений и суждений специалистов-экспертов. В этом случае для формирования выборки и дальнейшего её анализа может быть применен метод экспертных оценок [2].

После получения выборочной совокупности возникает вторая задача рассматриваемого этапа - задача представления выборочных данных в виде, удобном для дальнейшего исследования. Аналитическое представление данных в виде дискретных и интервальных рядов распределения (матриц распределения), а также графическое - в виде полигона, кумуляты, гистограммы и т.д. -рассмотрено во многих учебных пособиях по математической статистике, например, в [3-5].

В этих же работах приведено решение третьей задачи данного этапа, а именно, обработка полученной выборочной информации. Обработка заключается в нахождении определённых числовых характеристик выборки, называемых статистиками распределения. К основным статистикам распределения, имеющим очень важное значение для решения ряда практических задач, относятся средняя выборочная, мода, медиана, дисперсия, среднеквадратическое отклонение, коэффициенты асимметрии и эксцесса. При исследовании вопроса взаимосвязи выборочных совокупностей, а в дальнейшем и генеральных, к основным статистикам относят также коэффициент корреляции (парный, частный и множественный), коэффициент конкордации и другие коэффициенты, определяющие существование и тесноту различных зависимостей между двумя или несколькими признаками или совокупностями.

Третий и четвертый этапы связаны с распространением на всю генеральную совокупность результатов и выводов, полученных на основе анализа выборочных данных.

На третьем этапе по выборочным данным (статистикам распределения) решаются задачи нахождения приближённых значений (оценок) неизвестных параметров генеральной совокупности:

математического ожидания (генеральной средней), дисперсии, среднеквадратического отклонения и др. Методы нахождения оценок параметров, исследование свойств оценок составляют основное содержание одного из разделов математической статистики - теории оценивания [4]. Кроме приближенных значений параметров, т.е. точечных оценок, в теории оценивания находят так называемые интервальные оценки, которые используются при проверке статистических гипотез.

На четвертом этапе проводится проверка определённых предположений (статистических гипотез), связанных с параметрами и свойствами генеральной совокупности [3-6].

Пятый этап посвящен исследованию генеральной совокупности. На данном этапе решаются следующие задачи: проверка однородности статистической совокупности; разделение статистической совокупности на однородные группы (кластеры) в случае её неоднородности; определение правила присоединения нового элемента совокупности к одной из образовавшихся групп. Методы решения перечисленных задач составляют основное содержание кластерного и дискриминантного анализов [7].

Основными задачами шестого этапа являются: выявление существования и силы зависимости между значениями признаков многомерной выборки или между различными признаками нескольких генеральных совокупностей; получение приближенного уравнения зависимости одного признака (фактора) от одного или нескольких других; выявление наиболее важных признаков (факторов), влияющих на рассматриваемый процесс или явление. Методы, применяемые при решении этих задач, относятся к методам парного и многомерного математико-статистического анализа: корреляционного, регрессионного, факторного и т.д. [4].

Основное содержание предлагаемой работы составляют общие положения пятого этапа математико-статистического исследования и более подробное описание проверки и применения статистических гипотез, связанных с параметрами генеральной совокупности.

Обращение именно к этому этапу связано с тем, что, с одной стороны, возможности теории проверки статистических гипотез достаточно велики, с её помощью могут быть решены весьма серьёзные проблемы. С другой стороны, положения и методы этой теории применяются крайне редко и, к сожалению, не всегда правильно.

Теория проверки статистических гипотез - это раздел математической статистики, который содержит правила и методы проверки каких-либо утверждений о параметрах и свойствах всей рассматриваемой генеральной совокупности по статистическим данным выборочной совокупности. Выборочные данные составляют лишь часть статистических данных всей генеральной совокупности, поэтому выдвигаемые для проверки утверждения называют предположениями или гипотезами.

Необходимо отметить, что в теории проверки статистических гипотез проверяются только те гипотезы, которые базируются и непосредственно связаны со статистическим материалом. Статистический материал должен быть представлен в виде репрезентативной выборки, т.е. выборки, наиболее полно отражающей основные свойства генеральной совокупности.

При исследовании педагогических проблем проверка гипотез может быть применена для подтверждения или опровержения эффективности новой методики преподавания. Предположим, что некий учёный-педагог изобрёл новую методику изучения какого-либо предмета или его части и выдвинул предположение о том, что его методика значительно эффективнее старой. Для проверки этой гипотезы отбираются обучающиеся, которые разбиваются на две группы. Первая группа в течение какого-то времени занимается по старой методике, вторая - по новой. Затем происходит сравнение результатов обучения в этих группах, например, с помощью тестирования. Если результаты второй группы оказались чуть лучше, то теория проверки статистических гипотез позволит дать научно обоснованный ответ, является ли это различие значимым, т.е. действительно ли новая методика дает лучшие результаты, или это различие случайно, и новая методика не лучше старой.

Задачей теории проверки статистических гипотез является проверка на основе выборочных данных выдвинутой гипотезы Н0, или, иначе, - противоречит ли выборочным данным или согласуется с ними гипотеза Н0, называемая основной или нулевой.

Проверка основной гипотезы производится с помощью различных статистических критериев. Необходимо подчеркнуть, что если в результате проверки основная гипотеза не отвергается, то это не означает её полного подтверждения. Последнее свидетельствует лишь о совместимости с выборочными данными, т.е. основная гипотеза напоминает принцип «презумпции невиновности» в юриспруденции: обвиняемый считается невиновным до тех пор, пока его вина не доказана. Поэтому часто в качестве основной гипотезы выбирают утверждение, доказательство которого нежелательно для исследователя, а опровержение гипотезы дает возможность подтвердить полученные результаты.

Например, автор новой методики обучения может в качестве основной предложить гипотезу о равенстве средних баллов, т.е.

H : m = m 11 о- '"я '"с

где mН - средний балл, полученный в результате тестирования обучающихся по новой методике;

mC - средний балл, полученный в результате тестирования обучающихся по старой методике.

Если в результате проверки нулевая гипотеза будет опровергнута, то можно сделать вывод о различии рассматриваемых методик. Очевидно, что различие методик не подтверждает того, что новая методика является лучше. Такое подтверждение возможно при определенном выборе так называемой альтернативной гипотезы.

Альтернативной, или конкурирующей, гипотезой называют гипотезу Н которая противоречит

основной. Если основная гипотеза говорит о равенстве каких-то параметров, то в альтернативной

гипотезе указывается либо неравенство этих параметров, либо более строгое утверждение, что один

параметр строго больше или строго меньше другого. Так в примере с представлением новой методики

обучения в качестве альтернативной рекомендуется взять следующую гипотезу

Н ■ m > m 11 о- '"и '"с

Как было отмечено ранее, проверка статистической гипотезы, т.е. вывод о её справедливости делается на основе выборочных данных. Поскольку выборка - это лишь часть генеральной совокупности, существует риск принять ложное решение, т.е. совершить ошибку, которая может по смысловому содержанию принадлежать к одному из двух видов. Если гипотеза верна в действительности, а по результатам проверки её необходимо отвергнуть, то при этом совершается ошибка первого рода. Если, наоборот, гипотеза является ложной, а в результате проверки не получено противоречия с выборочными данными, т.е. теория предлагает считать гипотезу справедливой, то совершается ошибка второго рода.

Особое значение имеет вероятность а совершения ошибки первого рода, которую задает исследователь при проверке. Эта вероятность называется уровнем значимости.

По своей сути уровень значимости определяет вероятность того, что будут считаться существенными различиями между статистическими данными выборки и данными генеральной совокупности, хотя в действительности эти различия случайны и незначимы.

Последствия ошибок первого и второго рода неравнозначны, при этом считается, что одна из ошибок (первого рода) ведет к более консервативному или более осторожному решению, а вторая (второго рода), наоборот, ведет к риску, иногда неоправданному.

При выборочном исследовании полное исключение ошибок невозможно, однако возникает вопрос об уменьшении вероятности их появления. Одновременное уменьшение этих вероятностей возможно только при увеличении, иногда очень существенном, объёма выборки, что, конечно, не всегда возможно. При неизменном фиксированном объёме выборки уменьшение вероятности появления ошибки одного вида неизменно ведет к увеличению значения вероятности появления ошибки другого вида. Какая ошибка является более значимой, зависит от постановки задачи и цели исследования. В общей схеме проверки статистической гипотезы, которая будет приведена ниже, всегда задаётся вероятность совершения ошибки первого рода, т.е. уровень значимости. При этом считается, что исследователь, как правило, выдвигает «достаточно правдоподобную» гипотезу, для опровержения которой требуются весомые аргументы. Следовательно, уровень значимости выбирается достаточно малым - чаще всего, а = 0,05; реже а = 0,01; или даже а = 0,005.

Проверка гипотезы по своей сути представляет собой выявление попадания некой наблюдаемой величины, вычисленной по выборочным данным, в промежуток, определяемый значениями конкретной случайной величины, теоретически определенной для рассматриваемой гипотезы и называемой критерием К проверки основной гипотезы Н Необходимо отметить, что закон распределения критерия должен быть всегда известен.

Основными и наиболее часто применяемыми критериями являются:

- случайная величина, распределённая по нормальному закону и обозначаемая через V;

- случайная величина, распределённая по закону Стьюдента и обозначаемая через Т;

- случайная величина, распределённая по закону «хи-квадрат» и обозначаемая через х2;

- случайная величина, распределённая по закону Фишера и обозначаемая через Б.

Само понятие критерия в некоторых работах трактуется по-другому, а именно, критерием считают правило, по которому проверяется справедливость той или иной гипотезы. Авторы настоящей статьи считают такую трактовку не совсем правильной, исходя из следующего. Правило проверки (оно будет приведено ниже) остаётся одним и тем же для любой статистической гипотезы, а используемая для проверки случайная величина всегда меняется и является конкретной, теоретически обоснованной именно для рассматриваемой гипотезы. Однако необходимо отметить, что случайная величина, которая используется для проверки гипотезы, и само правило проверки достаточно тесно связаны друг с другом, поэтому критерием можно называть и то, и другое.

В соответствии с выбранным критерием по фиксированной формуле, используя выборочные данные, находят наблюдаемое или выборочное значение критерия К, которое называют статистикой критерия.

Для получения вывода о верности или ложности рассматриваемой гипотезы необходимо проверить попадание статистики критерия в так называемую критическую область, определяемую также с помощью критерия, используя приведённые ниже соображения.

Из определения критерия ясно, что критерий является одномерной случайной величиной, следовательно, его значения расположены на вещественной прямой. Всё множество значений критерия можно разделить на два непересекающихся подмножества:

V - область принятия гипотезы, т.е. множество значений критерия, для которых гипотеза НО не отвергается;

V - критическая область, т.е. множество значений критерия, для которых гипотеза НО отвергается.

Точки £■ которые разделяют эти две области, называются критическими и находятся по таблице распределения выбранного критерия.

Теоретически доказано, что критическая область может быть односторонней (левосторонней или правосторонней) или двусторонней. Правосторонняя и левосторонняя области определяются неравенствами К > k и К < k соответственно, двусторонняя - двумя неравенствами: К < к1 и К > ^кр. При этом двусторонняя область может быть симметричной, если ^кр = - №. Тогда она будет определяться неравенством |£| > £■.

Основное правило или основной принцип проверки любой статистической гипотезы формулируется следующим образом.

Основная гипотеза отвергается, если выборочное значение критерия попадает в критическую область, основная гипотеза не отвергается, если выборочное значение критерия не попадает в критическую область.

Нетрудно понять, что критическая область определяется видом и значениями критических точек. Вид критической области для некоторых гипотез задаётся в общей схеме, приведённой ниже, или находится по альтернативной гипотезе, которую выбирает исследователь. Значения критических точек, как было отмечено ранее, находят по таблице распределения заданного критерия. Необходимо отметить, не приводя строго доказательства, что критическая область обладает следующим свойством: если основная гипотеза справедлива, то вероятность попадания в критическую область значения критерия равна уровню значимости.

Общая схема проверки статистической гипотезы включает в себя следующие пункты.

1. Формулировка основной гипотезы Н0 и при необходимости альтернативной Н1.

2. Выбор уровня значимости а.

3. Подбор критерия К для проверки справедливости основной гипотезы.

4. Нахождение выборочного значения критерия Кв по статистическим данным выборки с использованием соответствующей формулы.

5. Определение вида критической области по виду альтернативной гипотезы и критических точек по соответствующей таблице распределения выбранного критерия.

6. Принятие статистического решения в соответствии с основным принципом проверки статистических гипотез:

Н0 отвергается, если Кв € V т.к. она противоречит результатам выборки;

Н0 не отвергается, если Кв ^ V т.к. она не противоречит результатам выборки.

Статистические гипотезы можно условно объединить в группы.

Группа I включает в себя гипотезы, в которых предполагается возможное значение одного из основных параметров генеральной совокупности, при этом закон распределения самой генеральной совокупности должен быть известен.

Группа II включает в себя гипотезы, в которых предполагается равенство двух или нескольких значений параметров или признаков генеральных совокупностей.

Группа III включает в себя гипотезы, в которых предполагается конкретный вид закона распределения рассматриваемой генеральной совокупности, если он неизвестен.

Группа IV включает в себя гипотезы, в которых предполагается исследовать значимость некоторых коэффициентов, характеризующих возможную зависимость между двумя или несколькими признаками рассматриваемой генеральной совокупности.

В данной работе будут рассмотрены статистические гипотезы первого вида.

Предположим, что генеральная совокупность имеет нормальный закон распределения. Основными параметрами нормального закона являются генеральная средняя (математическое ожидание) и генеральная дисперсия (или генеральное среднеквадратическое отклонение). Отсюда ясно, что в этом случае основными гипотезами первого вида будут статистические гипотезы о возможных значениях генеральной средней и генеральной дисперсии [5; 6].

Опишем более подробно общие схемы проверок для данных гипотез.

Необходимость проверки статистической гипотезы о генеральной средней появляется тогда, когда требуется подтвердить, опровергнуть или уточнить значение какого-то среднего норматива либо какого-то среднего показателя или средней характеристики.

В основной гипотезе о генеральной средней содержится предположение о возможном значении этой средней, т.е. о равенстве генеральной средней ^некоторому определённому числу а(). Таким образом, основная гипотеза имеет вид Я0: хг = а().

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выбор критерия проверки данной гипотезы зависит от того, известно или нет среднеквадратическое отклонение генеральной совокупности.

Значение среднеквадратического отклонения оГ в некоторых задачах может быть найдено теоретически либо может быть вычислено по выборкам достаточно большого объёма, которые были ранее получены при рассмотрении аналогичной задачи. В этом случае в качестве критерия выбирается нормально распределённая случайная величина. Если значение оГ неизвестно, то применяют критерий Стьюдента.

Приведем общие схемы проверки гипотезы о генеральной средней для двух отмеченных выше случаев.

I. оГ - известно.

1. Формулировка основной гипотезы // : Х[- = а№ в качестве альтернативной выбирается одна из следующих трёх:

Я0: хг ф а0 или Я0: хг > а0 или Я0: хг < а().

2. Выбор уровня значимости а (чаще всего 0,05).

3. В качестве критерия выбирается случайная величина V, имеющая нормальный закон распределения.

4. Для нахождения выборочного значения критерия используют формулу — "" л/п. где п - объём выборки.

5. Вид критической области определяется по альтернативной гипотезе Н1 по следующему правилу:

- если Я0: х^ Ф о, - то критическая область У] - двусторонняя и симметричная;

- если Я0: х? > а(), то критическая область 1/Г} - правосторонняя;

- если // : X? < а№ то критическая область У} - левосторонняя.

Критические точки г;кр находятся по таблице значений функции Лапласа Ф(х) по следующим формулам:

- для двусторонней и симметричной области Ф^р) = (1 - а) / 2;

- для правосторонней области Ф^р) = (1 - 2а) / 2;

- для левосторонней области Ф^н^) = (1 - 2а) / 2.

6. Принятие статистического решения в соответствии с общим принципом проверки гипотез.

Пример 1. Исследовался вопрос, связанный с изучением дисциплины «Математика»

иностранными слушателями. После проверки остаточных знаний иностранных слушателей нескольких групп разных годов поступления было установлено, что средний балл, набранный по тестам, для всех групп приблизительно равный и составляет 32,5 при максимально возможном 60. Разброс значений, т.е. среднеквадратическое отклонение, также оказалось практически одинаковым, равным 15,4. Поэтому эти величины было предложено взять в качестве генеральной средней и генерального среднеквадратического отклонения соответственно. Для улучшения качества обучения была предложена новая методика изучения данной дисциплины, которая учитывала особенности обучающихся - иностранных слушателей. После изучения дисциплины по предложенной методике в результате тестирования 36 человек из экспериментальной группы был получен средний балл, равный 37,8. После сравнения средних показателей было выдвинуто предположение о том, что изучение дисциплины по новой методике позволит значимо улучшить качество обучения, в результате чего можно повысить значение генеральной средней. Подтвердим или опровергнем данное предположение, проверив гипотезу о генеральной средней при уровне значимости а = 0,05.

Решение. Проведем проверку гипотезы по предложенной выше схеме. По условию задачи

а() = 32,5, хв= 37,8; л = 36 и ог= 15,4.

1. Я0: хг = 32,5 и Нг : хг>32,5.

2. а = 0,05.

3. Критерий - нормально распределенная случайная величина V.

4. Выборочное значение критерия ив = (37,8 - 32,5) / (15,4 ) ^36 = 2,06.

5. Альтернативная гипотезаЯ1: .Гр > 32,5 определяет правостороннюю критическую область.

Критические точки нкр находим по таблице значений функции Лапласа

Ф(х) : Ф(ик ) = (1 - 2 • 0,05) / 2 = 0,45, следовательно, икр. = 1,65.

6. ив = 2,06р > икр = 1,65, т.е. ив € У1, следовательно, есть основания отвергнуть основную гипотезу и считать, что значение генеральной средней баллов, полученных от слушателей, обучающихся по новой методике, может быть повышено, что подтверждает предположение о том, что качество новой методики изучения дисциплины выше.

II. о_Г - неизвестно.

1. Формулировка основной гипотезы Н(): = а0; в качестве альтернативной выбирается одна из следующих трёх:

#!: хг ф а0 или Н1:5сГ> а0 или Нх: хг < а(Г

2. Выбор уровня значимости а (чаще всего 0,05).

3. В качестве критерия выбирается случайная величина Т, распределённая по закону Стьюдента с числом степеней свободы V = п - 1.

4. Для нахождения выборочного значения критерия используют формулу 7[> = - — \[п1 где п - объём выборки, а это исправленное среднеквадратическое отклонение.

5. Вид критической области определяется по альтернативной гипотезе Н1 по следующему правилу:

- если Н} : х? Ф а,то критическая область У] - двусторонняя и симметричная;

- если Нг : хг > а№ то критическая область V - правосторонняя;

- если Н} : Хр < а0, то критическая область V^ - левосторонняя.

Критические точки /( |) находятся по таблице критических точек распределения Стьюдента по следующему правилу:

- для двусторонней и симметричной области величина а выбирается в верхней строке таблицы;

- для правосторонней и для левосторонней области величина а выбирается в нижней строке таблицы, при этом в случае левосторонней области критическая точка должна иметь отрицательное значение.

6. Статистическое решение принимается на основе общего правила.

Пример 2. Руководство некоего города заявило в печати, что преступность находится на среднем региональном уровне, который составляет 384,72 преступления на 100 тыс. жителей. За последние 20 лет средний уровень преступности в городе составил 389,50 преступления на 100 тыс. жителей с исправленным выборочным среднеквадратическим отклонением 7,83. Требуется проверить справедливость утверждения руководства города на уровне значимости а = 0,05.

Решение. Проведем проверку гипотезы по предложенной выше схеме. По условию задачи

а0 = 384,72, хв= 389,50, п = 20 и 5 = 7,83.

1 , Я0: хГ = 384,72 и Нх: хг ф 384,72.

2. а = 0,05.

3. Критерий - случайная величина Т, распределенная по закону Стьюдента с числом степеней свободы V = 19.

4. Выборочное значение критерия Тв= (389,50 - 384,72 ) / (7,83 ) ^20 = 2,73.

5. Альтернативная гипотеза Н} : х.? Ф 384,72 определяет симметричную двухстороннюю критическую область.

Критические точки ^ находим по таблице критических точек распределения Стьюдента: ^ (0,05; 19) = 2,09. ^ кр.

6. Тв = 2,73 > ^ = 2,09, т.е. Тв € У1, следовательно, есть основания отвергнуть основную гипотезу, т.е. не согласиться с утверждением руководства города о том, что уровень преступности в городе находится на среднем региональном уровне.

Необходимость проверки статистической гипотезы о генеральной дисперсии появляется тогда, когда требуется проверить, насколько точным является какой-то прибор, инструмент, метод исследования и т.д.

В основной гипотезе о генеральной дисперсии содержится предположение о возможном значении этой дисперсии, т.е. о равенстве генеральной дисперсии Ог некоторому определённому ^ Таким образом, основная гипотеза имеет вид Н0 : Ог = ^

Приведем общую схему проверки рассматриваемой гипотезы.

1. Формулировка основной гипотезы Н0 : Ог = 00; в качестве альтернативной выбирается одна из следующих трёх:

Н : В ф Вп или Н : ° > Я или Н : О < .

1^0 1 г0 1 г0

2. Выбор уровня значимости а (чаще всего 0,05).

3. В качестве критерия выбирается случайная величина %2, распределённая по закону «хи-квадрат» с числом степеней свободы V = п - 1.

4. Для нахождения выборочного значения критерия используют формулу

Хв2 = (п-1) / (О0) S2, где п - объём выборки, а - это исправленное среднеквадратическое отклонение.

5. Вид критической области определяется по альтернативной гипотезе Н1 по следующему правилу:

- если Н1 ■ Ог Ф О0 , то критическая область V - двусторонняя, но несимметричная;

- если Н1 ■ Ог > О то критическая область V - правосторонняя;

- если Н1 ■ Ог < О то критическая область V - левосторонняя.

Критические точки %2кр находятся по таблице значений критических точек распределения «хи-квадрат» по следующим формулам:

- для двусторонней области хпр.кр2 (а / 2; V); хлевкр.2 (1 - а/2; V);

- для правосторонней области хк 2 (а; V);

- для левосторонней области хкр2> (1 - а; V).

6. Принятие статистического решения в соответствии с общим принципом проверки гипотез.

Пример 3. В условиях примера 1 была рассмотрена задача, связанная с оценкой качества новой

методики изучения дисциплины «Математика» для иностранных слушателей. Улучшенное качество новой методики было подтверждено проверкой гипотезы о генеральной средней, которая показала, что средний балл обучающихся по новой методике оказался значимо выше. Проверка гипотезы проводилась при предположении, что генеральное среднеквадратическое отклонение известно оГ = 15,4, т.е. оно предполагалось равным среднему значению выборочных среднеквадратических отклонений, найденных за прошлые годы. Для подтверждения правильности этого предположения и тем самым подтверждения статистического вывода примера 1 о качестве методики, можно проверить гипотезу о возможном значении среднеквадратического отклонения или, что то же самое, возможном значении дисперсии Ог = (15,4)2 = 237,16 генеральной совокупности. По выборке из 36 слушателей было найдено выборочное значение исправленной дисперсии S2 = 240,23.

Решение. Применим общую схему.

1. Н0 ■ Ог = 237,16 и, очевидно, что Н1 ■ Ог > 237,16.

2. а = 0,05. г

3. Критерий - случайная величина %2, распределенная по закону «хи-квадрат» с числом степеней свободы V = 36 - 1= 35.

4. Выборочное значение хв2 = 35 / (240,23) 237,16 ~ 34,55.

5. По альтернативной гипотезе Н1 ■ Ог > 237,16 определяем, что V - правосторонняя критическая область. Критические точки %2 определяем по таблице критических точек распределения «хи-квадрат» х2кр(0,05; 35) = 43,8. 41

6. хв2 = 34,55 < ^р2 = 43,8, т.е. х/ ^ следовательно, гипотеза Н0 не отвергается, т.е. утверждение о том, что генеральная дисперсия равна 237,16, не противоречит выборочным данным.

Результаты примера 3 могут быть интерпретированы и по-другому. Улучшенное качество новой методики было подтверждено проверкой гипотезы о генеральной средней, которая показала, что средний балл обучающихся по новой методике оказался значимо выше. Однако повышение среднего балла могло произойти за счёт более успешного прохождения тестирования лишь у немногих курсантов, а общий уровень усвоения дисциплины в экспериментальной группе остался тем же или даже понизился. Для подтверждения или опровержения этого утверждения рекомендуется проверить гипотезу о среднем разбросе баллов, который характеризуется дисперсией. Если окажется, что в соответствии с новой методикой значение генеральной дисперсии осталось неизменным (не увеличилось), то можно считать, что улучшение усвоения материала дисциплины произошло не только у отдельных слушателей, а в среднем у всех обучающихся. Увеличение значения дисперсии показывает, что существует достаточно большое число слушателей, для которых применение новой методики не приводит к более качественному усвоению дисциплины.

Кроме двух вышеописанных, к гипотезам первого вида может быть отнесена статистическая гипотеза о значении вероятности появления некоторого случайного события.

Пусть производится достаточно большое число п независимых испытаний, в каждом из которых с вероятностью р может появиться некоторое случайное событие. Вероятность р неизвестна, но одинакова для всех испытаний. По произведенной выборке найдена относительная частота появления события т / п. Имеются веские основания предполагать, что значение неизвестной вероятности может быть равно числур Требуется при уровне значимости а проверить гипотезу о равенстве неизвестной вероятности гипотетической вероятности р

Поскольку вероятность можно оценить по относительной частоте, то предлагаемую задачу можно сформулировать и по-другому, а именно; необходимо установить, значимо или незначимо различаются наблюдаемая относительная частота и генеральная вероятность. 156

Обратимся к общей схеме и конкретизируем каждый её пункт для рассматриваемой гипотезы.

1. Основная гипотеза H0 : p = p0; одна из альтернативных H1 : p Фp0 или H1 : p >p0 или H1 : p <p0.

2. Уровень значимости а.

3. Критерием является нормально распределенная случайная величина U.

4. Выборочное значение критерия определяется по формуле:

где п - объём выборки.

5. Критическая область определяется по альтернативной гипотезе Н1, а критические точки икр по таблице значений функции Лапласа Ф(х) с использованием следующих правил и формул:

- для И1 : р Ф р0 критическая область V - двусторонняя, симметричная, и Ф(ик ) = (1 - а) / 2;

- для Н1: р >р0 критическая область У1 - правосторонняя, и Ф(икр) = (1 - 2а) / 2;

- для И1 : р < р_0. критическая область У1 - левосторонняя, и ф(-и ) = (1 - 2а) / 2.

6. Статистическое решение принимается на основе общего правила.

Пример 4. Известно, что примерно 35 % курсантов университета защищают диплом на отличную оценку. На основе наблюдений этого года было выяснено, что из 100 случайно отобранных дипломников получили отличную оценку 30 курсантов. Можно ли с 95-процентным уровнем доверия сказать, что наблюдения этого года не противоречат ранее сделанному статистическому выводу, и тем самым подготовка дипломников в этом году существенно не отличается от подготовки в остальные годы?

Решение. Проведем проверку гипотезы по предложенной выше схеме. По условию задачи р0 = 0,35, т = 30; п = 100 и а = 1 - 0,95 = 0,05.

1. И0 : р = 0,35 и И : р Ф 0,35.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. а = 0,05.

3. Критерий - нормально распределенная случайная величина V.

4. Выборочное значение критерия

(—-0,35)^100

и _ Кщ = -1,05.

у0.3 5-(1-0,35)

5. Альтернативная гипотеза И1 : р Ф 0,35 определяет двухстороннюю симметричную критическую область.

Критические точки икр находим по таблице значений функции Лапласа Ф(х) : Ф(икр) = (1 - 2 • 0,05) / 2 = 0,45, следовательно, икр = 1,65.

6. ив = |-1,05| = 1,05 < икр = 1,65, т.е. ив ^ У1, следовательно, нет оснований отвергнуть основную гипотезу и можно считать, что доля курсантов, получивших отличную оценку за диплом в этом году, значимо не отличается от соответствующей доли за прошлые годы.

Список литературы

1. Васильева, Э. К., Юзбашев, М. М. Выборочный метод в социально-экономической статистике : учебное пособие. - М.: Финансы и статистика, Инфра-М, 2010. - 256 с.

2. Большакова, Л. В., Примакин, А. И. Метод экспертных оценок в решении задач обеспечения экономической безопасности хозяйствующего субъекта // Вестник Санкт-Петербургского университета МВД России. - 2012. - № 1 (53). - С. 191-200.

3. Большакова, Л. В. Элементы математической статистики : учебное пособие. - СПб.: Изд-во СПб ун-та МВД России, 2008. - 96 с.

4. Гмурман, В. Е. Теория вероятностей и математическая статистика. - М., Высшая школа, 2009. - 478 с.

5. Большакова, Л. В., Примакин, А. И., Яковлева, Н. А. Математико-статистические методы обработки экспериментальных данных при проведении научных исследований : методические рекомендации : в 3 ч. - Ч. 1. - СПб.: Изд-во СПб ун-та МВД России, 2014. - 92 с.

6. Большакова, Л. В., Примакин, А. И., ЯковлеваН. А. Методы проверки статистических гипотез в процессе обработки и интерпретации статистических данных при обеспечении экономической и информационной безопасности хозяйствующего субъекта // Вестник Санкт-Петербургского университета МВД России. - 2014. - № 3 (63). - С. 111-120.

7. Большакова, Л. В., Примакин, А. И., Яковлева, Н. А. Применение кластерного и дискриминантного анализов в процессе обработки и интерпретации статистических данных при обеспечении экономической и информационной безопасности хозяйствующего субъекта // Вестник Санкт-Петербургского университета МВД России. - 2014. - № 2 (62). - С. 148-156.

i Надоели баннеры? Вы всегда можете отключить рекламу.