Научная статья на тему 'К ВОПРОСУ О СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ В ШКОЛЬНОМ КУРСЕ МАТЕМАТИКИ'

К ВОПРОСУ О СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ В ШКОЛЬНОМ КУРСЕ МАТЕМАТИКИ Текст научной статьи по специальности «Математика»

CC BY
585
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛУЧАЙНАЯ ВЕЛИЧИНА / МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / ПРОВЕРКА ГИПОТЕЗ / КРИТИЧЕСКОЕ ЗНАЧЕНИЕ / РЕШАЮЩЕЕ ПРАВИЛО / РАСПРЕДЕЛЕНИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ / МЕТОД МОНТЕ КАРЛО

Аннотация научной статьи по математике, автор научной работы — Энтина Софья Борисовна, Юдовин Марк Эльявич

Элементы теории вероятностей и статистики были включены в школьный курс математики общеобразовательной школы сравнительно недавно. В настоящий момент все еще нет устоявшихся учебников и четких представлений, что и в каком объеме должно входить в этот раздел. В результате изложение курса оказывается незаконченным, не доведенным до логического конца. В работе рассматриваются возможные добавления к предлагаемому в учебных пособиях курсу математической статистики, которые позволят школьникам получить определенное представление об использовании полученных знаний. Приводятся примеры заданий, в которых методы математической статистики применяются к изучению законов распределения случайных величин, а также при решении некоторых геометрических задач и задач на экстремум.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Энтина Софья Борисовна, Юдовин Марк Эльявич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON THE QUESTION OF STATISTICAL RESEARCH IN THE SCHOOL COURSE OF MATHEMATICS

Some elements of probability theory and statistics have been only recently included in high school curriculum. However, there so far have been no well-established textbooks and no clear consensus on the depth and breadth of the topics to be taught. As a result, the course gives students an incomplete picture of the subject. The article discusses some possible additions to the existing curriculum. The article also provides examples of assignments where mathematical statistics methods are used to study distribution laws and to solve geometry and extremum problems.

Текст научной работы на тему «К ВОПРОСУ О СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ В ШКОЛЬНОМ КУРСЕ МАТЕМАТИКИ»

Компьютерные инструменты в образовании, 2020 № 3:100-128

УДК: 37.026.9::519.1::004.023 http://cte.eltech.ru

doi:10.32603/2071-2340-2020-3-100-128

К ВОПРОСУ О СТАТИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ В ШКОЛЬНОМ КУРСЕ МАТЕМАТИКИ*

Энтина С. Б.1, кандидат технических наук, доцент, И vkjatm@gmail.com Юдовин М. Э.1, кандидат физико-математических наук, доцент, И markyud@gmail.com

1 Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В. И. Ульянова (Ленина), ул. Профессора Попова, 5, корп. 3,197376, Санкт-Петербург, Россия

Аннотация

Элементы теории вероятностей и статистики были включены в школьный курс математики общеобразовательной школы сравнительно недавно. В настоящий момент все еще нет устоявшихся учебников и четких представлений, что и в каком объеме должно входить в этот раздел. В результате изложение курса оказывается незаконченным, не доведенным до логического конца. В работе рассматриваются возможные добавления к предлагаемому в учебных пособиях курсу математической статистики, которые позволят школьникам получить определенное представление об использовании полученных знаний. Приводятся примеры заданий, в которых методы математической статистики применяются к изучению законов распределения случайных величин, а также при решении некоторых геометрических задач и задач на экстремум.

Ключевые слова: случайная величина, математическая статистика, проверка гипотез, критическое значение, решающее правило, распределение случайной величины, метод Монте Карло.

Цитирование: Энтина С. Б., Юдовин М. Э. К вопросу о статистических исследованиях в школьном курсе математики // Компьютерные инструменты в образовании. 2020. № 3. С. 100-128. doi: 10.32603/2071-2340-2020-3-100-128

Попытки понять, как устроен мир, представляют собой самую суровую проверку умственных способностей человека. Она подразумевает и некоторое трюкачество, хождение по канату логики — нужно пройти и не сделать ошибку в предсказании того, что будет.

Ричард Фейнман

1. ВВЕДЕНИЕ

В начале двухтысячных годов в школьный курс математики общеобразовательной школы было решено включить элементы теории вероятностей и статистики, которые

"Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 19-29-14141: изучение взаимосвязи концептуальных математических понятий, их цифровых представлений и смыслов как основы трансформации школьного математического образования.

к этому времени уже присутствовали в том или ином виде в школьных учебниках. Но в материалы по подготовке к ЕГЭ и в самих ЕГЭ задачи по этим разделам не включались, и, естественно, учителя также старались их обходить и не включать в свои учебные планы. У учителей не было опыта преподавания этих разделов математики, отсутствовали учебники, учебные пособия, задачники и другие методические материалы. В настоящее время появились учебные пособия с большим числом упражнений и даже с электронной поддержкой (см., например, сетевой программный комплекс Бунимовича Е. А. и Булычева В. А. «Вероятность и статистика в школьном курсе математики» [1], сетевой продукт учебное пособие тех же авторов «Теория вероятностей и статистика для 10-11 классов» [2], другие учебно-методические пособия для учителей), много материалов посвящено этой тематике в научно-теоретическом и методическом журнале «Математика в школе», проводятся олимпиады по теории вероятностей и статистике и т. п. Обратим внимание, что даже самые методически продуманные учебные материалы называются учебными пособиями [2, 3] и даже экспериментальными учебными пособиями [4, 5]. Хотя учебное пособие [3] адресовано школьникам 5-11 классов, содержание учебника, скорее, соответствует программе основной школы (кроме, может быть, главы 14). Довольно интересные и разнообразные примеры, приведенные в [3, глава 15], ограничиваются построением гистограмм, нахождением абсолютных и относительных частот, средних значений и других характеристик выборки. Все это вполне доступно школьникам основной школы. О законах распределения случайных величин в этом учебном пособии речь не идет. В [4] рассматриваются законы распределения как дискретных случайных величин, так и непрерывных. Эти разделы до сих пор еще не обросли достаточным количеством хорошо структурированного, логичного в изложении учебного материала, который бы хорошо согласовывался с привычным традиционным курсом математики.

Проблема состоит в том, что, с одной стороны, есть понимание, что без знакомства школьников с базовыми понятиями теории вероятностей и математической статистики школьный курс математики будет не полон, а с другой стороны, невозможно вводить новые понятия и утверждения на том уровне строгости, которые приняты в школьных курсах алгебры и геометрии.

Достаточно ли тех знаний, которые они получают в школьном курсе теории вероятностей и статистики, для того чтобы правильно воспринимать статистическую информацию? В своей диссертации У. Виленский [6] приводит диалоги с выпускниками школ и студентами университетов США, успешно прослушавшими курс теории вероятностей и статистики и выполнивших все задания, предлагавшиеся к каждой части курса. Оказалось, что они затрудняются ответить на вопрос, как они понимают конкретные статистические данные, имеющиеся в средствах массовой информации. Руководитель У. Виленского Симур Паперт [7] считал, что основная причина возникновения таких проблем в том, что ученики должны получать знания, выполняя проекты: «проекты первичны, проблемы возникают в ходе проектов, а иногда «решаются», а иногда «растворяются». ("The principle is called the power principle or "what comes first, using it or getting it"? The natural mode of acquiring most knowledge is through use leading to progressively deepening understanding." — Этот принцип называется «принцип первичности» или «с чего начинать, с использования или с понимания?» Естественное приобретение знаний чаще всего происходит через использование, которое ведёт к постепенному углублению понимания.) В школьном курсе математики, по мнению С. Паперта, этот принцип инвертируется.

Изучение теории вероятностей и статистики в школе рекомендуется начинать с описательной статистики, что не должно вызывать затруднений у учеников, так как основано

на личном опыте учащихся. Изменчивость величин они легко воспринимают на примерах биометрических данных, экономической статистики, демографических сведений, сведений об успеваемости учащихся по конкретному предмету и т. п. К моменту обучения в старшей школе они уже знакомы с основными понятиями теории вероятностей и статистики, такими как среднее арифметическое, медиана, отклонение от среднего, дисперсия и т. д. Учащиеся старших классов знакомятся со случайными величинами, различными их распределениями, не только дискретными (биномиальное, геометрическое), но и непрерывными (равномерное, нормальное, показательное), с понятиями математического ожидания и дисперсии. Все необходимые сведения очень компактно, доступно и без лишних экскурсов в стоящую за всеми вероятностно-статистическими понятиями серьезную математику изложены в [4]. Распределения случайных величин вводятся заданием их плотности распределения, знакомством с их характеристиками. Задачи, которые предлагаются после изучения каждой главы, посвящены в основном вычислению вероятности попадания случайной величины в заданный интервал, то есть ученик может не особенно вникать в рассматриваемое статистическое исследование, а, пользуясь таблицами, приведенными в учебном пособии, по заданному алгоритму вычислять эти вероятности. Здесь можно повторить вопрос С. Паперта, заданный учителям по поводу введения понятия вероятности события на основе бросания кости и других физических предметов (с чем он абсолютно не согласен): "I ask: what can these children do with this new knowledge besides talk or deal with teacher-initiated problems?" — Я спрашиваю: что эти дети могут делать с этими новыми знаниями, кроме разговоров или решения задач, поставленных учителями? [7].

Как можно использовать эти знания, чтобы ученик был в этом лично заинтересован?

Вызвать интерес, а вместе с этим и понимание, как на основании статистических исследований и наблюдений вырабатываются те или иные решения, могут различные проекты (задачи, сюжеты), в которых, используя полученные знания, необходимо такие исследования провести.

Приведем для иллюстрации два примера, в которых действительно приходится принимать решения на основе статистических исследований:

Пример 1. На крупном химическом предприятии, имеющем дело с производством ядовитых химикатов, введена в действие специальная система безопасности. Необходимые затраты для поддержания безопасности зависят от того, насколько реальной представляется угроза аварии с опасными последствиями. Такая ситуация является неопределенной. Поэтому необходима правильная оценка вероятности аварии на предприятии.

Пример 2. В фирме принимается решение о том, следует ли выводить на потребительский рынок новую модель производимой ранее продукции. Неопределённость существует вследствие ряда причин. Как скажется конкуренция? Будут ли поставщики своевременно предоставлять качественные компоненты? Фирме необходимо принять решение на основе обработки доступной информации.

Естественно, решать такие задачи в полном объеме школьники не могут. Для их решения во всей полноте необходимо обладать специальными знаниями в тех областях, откуда эти сюжеты взяты, а также необходимо глубокое знание статистики и вероятностных методов.

Преподавание элементов математической статистики в средней школе обычно сталкивается с проблемой недостаточной математической подготовки учащихся для знакомства с методами исследований различных реальных случайных ситуаций. Но, возможно, имеет смысл принять компромиссное решение. А именно, предложить сюжеты (естественно,

их придется сильно упрощать), справочные материалы, в которых скрыта та математика, которой пока не хватает ученикам, и показать, как на основе получения статистических материалов принимаются те или иные решения. «Основная цель — дать читателю средства для разумного и сознательного отношения к случайности» [4].

Круг задач и проектов существенно расширится, если включить в курс математической статистики проверку гипотез, использование метода Монте Карло [8] для решения геометрических и экстремальных задач, рассмотреть примеры, в которых статистические наблюдения приводят к новым неожиданным результатам [9]. Если отказаться от строгих доказательств, которые требуют знаний, выходящих за пределы школьной программы1, то можно решать задачи, в которых требуется определять и / или проверять законы распределения случайных величин, например тех, которые в изобилии приведены в [3], а не только оценивать их параметры.

Изучение реальных процессов окружающего мира методами математической статистики требует владения определенными информационными технологиями, необходимость быть грамотными пользователями программных продуктов.

В недавнем прошлом, когда компьютеры каждому школьнику были недоступны и отсутствовали необходимые программы для моделирования случайных величин, рассмотрение статистических задач в школе было невозможно.

В данной работе приведены варианты проектов (сюжеты), которые можно предлагать старшим школьникам. Предлагаемые варианты проектов можно варьировать.

Для выполнения заданий от учащихся требуется:

— знакомство с некоторыми базовыми понятиями теории вероятностей и статистики, такими как вероятность, частота, случайная величина, распределение случайной величины, математическое ожидание, дисперсия, случайная выборка, гистограмма;

— умение на самом элементарном уровне использовать программу Excel;

— умение моделировать случайные числа для имитации различных моделей.

2. ОСНОВНЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Основными задачами математической статистики являются:

1. Сбор и группировка результатов того или иного эксперимента. Такие результаты принято называть наблюдениями. В качестве эксперимента можно взять опрос людей, измерение некоторой величины, математическое моделирование случайного события и т. п. При многократном повторении эксперимента генерируется случайная выборка — исходный материал для последующей обработки.

2. Нахождение приближенного закона распределения наблюдаемой случайной величины по данным эксперимента.

3. Оценивание числовых характеристик или параметров распределения наблюдаемой случайной величины по данным эксперимента.

4. Проверка статистических гипотез о свойствах изучаемого случайного явления.

5. Определение эмпирической зависимости между переменными, описывающими случайное явление, на основе экспериментальных данных.

6. Прогнозирование.

1 В старшей школе в курсе математики нестрогие доказательства и правдоподобные рассуждения используются неоднократно, например, при нахождении предела, определении интеграла, суммы бесконечно убывающей геометрической прогрессии. Не приводятся полные доказательства многих теорем и в учебном пособии [4].

Для решения последних двух задач даже в самом упрощенном гаде школьных знаний недостаточно, поэтому все предлагаемые примеры заданий будут связаны с остальными задачами.

Случайную выборку можно получить двумя путями. Очевидный путь — повторить испытание нужное число раз. Этот путь не всегда возможен чисто технически. Даже такой простой опыт с бросанием монеты довольно утомительно повторять 100 или более раз. Другой путь заключается в имитации требуемого вероятностного закона на компьютере. Для этой цели существуют генераторы случайных чисел, встроенные во многие программы, которые по заданному закону распределения генерируют случайную выборку заданного объема. К таким программам относятся Excel, Matlab, Octave и многие другие.

3. ПРОЕКТЫ, СВЯЗАННЫЕ С ПРОВЕРКОЙ ГИПОТЕЗ

В описываемых в этом разделе проектах нужно принять или отвергнуть некоторые гипотезы о свойствах случайных величин, для которых уже получены оценки числовых характеристик, а закон их распределения либо установлен, либо требует определения. При проверке любой статистической гипотезы важно понимать, что вывод, основанный на данных, содержащих случайные ошибки, сам может оказаться ошибочным. Когда мы проверяем какую-нибудь гипотезу, мы применяем определенное решающее правило (примеры таких правил будут приведены далее). Возможна ситуация, когда согласно этому правилу мы должны отвергнуть гипотезу, хотя на самом деле она верна. Такая ошибка называется ошибкой первого рода, а вероятность такой ошибки называется уровнем значимости. Уровень значимости — конкретное число, задаваемое на основе выработанной практики исследования случайных процессов. Если обозначить уровень значимости через а, то число 1 - а называется коэффициентом доверия. В качестве уровня значимости часто принимается значение а = 0,05, но могут быть и другие значения. Также возможна ситуация, когда согласно этому же решающему правилу, мы должны будем принять гипотезу, хотя она на самом деле неверна, при этом мы совершим ошибку второго рода.

Возникает естественное желание уменьшить уровень значимости и тем самым уменьшить вероятность отвергнуть верную гипотезу, но при этом мы увеличиваем возможность принять гипотезу, которая на самом деле была неверной, то есть увеличиваем вероятность ошибки второго рода. Поэтому при выборе значения а учитываются последствия ошибок обоих типов. Таким образом, вступает в силу так называемый «человеческий фактор», который влияет на наше решение. Мы, исходя из ситуации, должны понять, к каким последствиям могут привести ошибки обоих типов.

Например, нужно проверить эффективность лекарства2. Возможны две гипотезы: H0 — лекарство бесполезно, H1 — лекарство эффективно. Рассмотрим два варианта.

Пусть гипотеза H0 верна, но мы ее отвергли (как мы увидим далее, такое возможно). Значит, мы должны принять альтернативную гипотезу H1, то есть одобрить бесполезное лекарство.

Пусть гипотеза H0 неверна, но мы ее приняли (как мы увидим далее, и такое возможно). Тем самым мы отвергли альтернативную гипотезу H1, то есть забраковали полезное лекарство.

В обоих случаях вред от ошибок примерно одинаковый.

2 Сейчас в связи с работами над созданием безопасных и эффективных вакцин против коронавируса такие исследования особенно актуальны.

А вот другой пример. Проверяется качество авиационных двигателей. Гипотеза Н0 — вероятность серьезного дефекта в двигателе не превышает 0,001 %. Если гипотеза Н0 верна, а мы ее отвергли, то забраковали нормальный двигатель. Если же Н0 неверна, а мы ее приняли, то подвергли опасности экипаж и пассажиров самолета. Ясно, что в этом случае важней ошибка второго рода.

Кроме уровня значимости, для проверки статистической гипотезы нам потребуется задание К-критерия. К-критерий — это функция, зависящая от элементов выборки. Выбирается эта функция в зависимости от предположения о законе распределения исследуемой случайной величины. Существуют К-критерии, которые не зависят от конкретного распределения случайной величины, поэтому их можно использовать тогда, когда нет никаких предварительных предположений. Естественно, что в этом случае легче сделать ошибочный вывод о предполагаемой гипотезе. От специалиста требуется понять, о каком законе распределения в каждом конкретном случае может идти речь, и выбрать наиболее подходящий для данной задачи К-критерий. Если уровень значимости а задан и закон распределения функции К считается известным, то по ним можно рассчитать критическое значение критерия, то есть число Ккрит, для которого с вероятностью (1 - а) выполняется К < Ккрит. Для этого существуют специальные программы, о которых речь пойдет ниже.

Теперь, когда а и Ккрит заданы, применяем

Решающее правило: Пусть Ь — значение К-критерия, рассчитанное по данной выборке. Тогда:

Если Ь ^ Ккрит, то гипотеза принимается.

Если Ь > Ккрит, то гипотеза отвергается, то есть принимается альтернативная гипотеза.

Строгое обоснование этого правила содержится в курсе математической статистики. Рассмотрим несколько конкретных сюжетов, относящиеся к проверке гипотез.

3.1. Биномиальный закон распределения и критерий Пирсона проверки гипотез

Пусть рассматривается эксперимент с двумя исходами А и В, имеющими вероятности соответственно р и q. Назовем один из исходов успехом, а другой — неуспехом. Таким образом, вероятность успеха в отдельном испытании равна р, а неуспеха — д = 1 - р. Пусть испытание повторяется п раз и т — число успехов в этой серии испытаний. Число успехов, как правило, меняется от одной серии испытаний к другой. Другими словами, т — случайная величина с биномиальным распределением. Р(т, п) вероятность того, что в серии из п испытаний число успехов равно т. Справедлива формула

п!

Р (т, п) = Стртдп т, где Ст =--число сочетаний из п п о т.н. риведем при-

т!( п — т)!

меры нескольких ситуаций, которые укладываются в описанную выше схему.

1. Игра с участием двух игроков. Вероятность выигрыша в отдельной игре для 1-го игрока равна р, для 2-го — д, ничьи исключаются, т — число выигрышей для 1-го игрока в партиях.

2. В большой партии однотипных изделий процент бракованных изделий равен к. Пусть т — число бракованных изделий среди выбранных наугад п изделий. Очевидно, т имеет биномиальное распределение с параметром р = к/100.

3. Электрическая схема содержит блок, состоящий из п параллельно соединенных элементов. Вероятность отказа отдельного элемента равна р, а т — число отказавших элементов.

4. Стрелок производит п выстрелов по мишени. Учитывается только попадание или промах. Пусть р — вероятность попадания при отдельном выстреле, т — число попаданий.

Рассмотрим популярный пример — бросание монеты. Этот эксперимент очень часто используется при имитации многих изучаемых процессов. Пусть монета брошена п раз. Это испытание с двумя равноправными исходами: орел, решка. В зависимости от исхода будем записывать 0 или 1. Тогда результатом п испытаний будет последовательность нулей и единиц. Число нулей в этой последовательности — случайная величина, принимающая значения от 0 до п. При повторении серии из п испытаний получим другую последовательность нулей и единиц, но при достаточно большом п доля нулей в обеих последовательностях будет близка к 0,5 (конечно, если монета правильная, без дефектов). На языке теории вероятностей это означает, что вероятности каждого из двух исходов равны 0,5.

Пусть теперь одновременно п раз бросается х монет. Зададим следующие вопросы:

1. Можно ли считать, что это то же самое, что ш раз бросается одна монета?

2. А если бросается одна монета, как убедиться, что она правильная?

3. А если бросается несколько монет, как убедиться, что они бросаются независимо друг от друга (хорошо перемешиваются) или среди них нет неправильной монеты?

В [10] Г. И. Фалин рассказывает об истории опытов с бросанием монеты, который проводился английским математиком У. С. Джевонсом. В опыте Джевонса проводились две серии экспериментов, в каждой серии комплект из 10 монет бросался 1024 раза. Случайная величина Ак — количество орлов, выпавших при одном бросании, подчиняется биномиальному распределению: Р(Ак) = ^тоС^. Если рассматривать случайную величину — количество выпавших орлов при 1024 бросаниях, то математическое ожидание такой случайной величины равно 5120. Заметим, что точно такое же математическое ожидание случайной величины мы получим, если будем одну монету бросать 10240 раз. В эксперименте Джевонса количество выпавших орлов в первой серии равнялось 5130, а во второй серии — 5222. Частота выпадения орла в первой серии равна примерно 0,501, а во второй серии — 0, 510. Обе частоты близки к 0,5. Можно ли считать эксперимент Джевонса эквивалентным эксперименту, в котором одна монета бросается 10240 раз? Если предположить, что монеты абсолютно идентичны и не перемешиваются при бросании, то эти эксперименты должны быть эквивалентны. В статье Г. И. Фалина показано, что проверка этой гипотезы показывает ошибочность такого предположения в условиях эксперимента Джевонса. Остается предположить, что монеты отличались друг от друга, либо плохо перемешивались, то есть мы не можем считать, что выпадение орла у каждой из 10 монет не зависело от других монет.

В другой статье [11] Фалин рассматривает два эксперимента, описанные де Морганом, в каждом из которых производится 2048 серий бросания монеты, причем в каждой серии монета бросается до выпадения орла. Таким образом, в каждом эксперименте выпадает 2048 орлов и какое-то количество решек. В первом случае 1992 решки, то есть всего было 4040 бросаний монеты, во втором эксперименте, соответственно, 2044 решки и 4092 бросания. Если просто одну монету бросать, например, 4092 раза, то математическое ожидание числа выпадения орлов равно 2046. Различие всего на 2 орла. Возникает тот же вопрос: эквивалентны ли бросания монеты в экспериментах Моргана с бросанием одной

монеты соответствующее число раз? Проверка гипотезы об эквивалентности показывает, что однозначно ответить на этот вопрос непросто. Вероятность, что эксперименты равносильны, хотя и не велика (всего 0,0623), но и не совсем мала.

В некоторых учебниках эти эксперименты так и рассматриваются как бросание одной монеты, что на самом деле, как мы видим, неправомерно.

Школьникам можно предложить проект, в котором требуется провести похожее исследование. Пример такого проекта предлагается в сюжетах 1.1-1.2.

Проверка гипотезы (Критерий Пирсона)

Пусть получена случайная выборка из предположительно биномиального распределения. Можно поставить следующие вопросы:

1. Если заранее известно, что распределение действительно биномиальное, то как оценить значение параметра p?

2. Действительно ли наблюдаемые значения частоты соответствуют биномиальному распределению?

Сюжет 1.1

Рассмотрим ситуацию, описанную выше в примере 4. Допустим, стрелок попал в цель 45 раз из 50 выстрелов. Относительная частота попаданий равна 45/50 = 0,9. Можно предположить, что для данного стрелка вероятность попадания при одном выстреле приближенно равна 0,9. С помощью методов математической статистики можно оценить точность этого приближения, но мы применим эмпирический подход. Будем последовательно увеличивать число испытаний и проследим, как при этом меняется относительная частота попаданий. Согласно закону больших чисел относительная частота события стремится к его вероятности при стремлении к бесконечности числа испытаний. Доведем число испытаний до 120. Первый график (рис. 1) показывает зависимость частоты от числа испытаний, а второй (рис. 2) — зависимость средней частоты от числа испытаний (данные графики получены с использованием программы Octave, находящейся в открытом доступе). Из первого графика видно, что частота попаданий совершает заметные колебания. В целом эти колебания несколько уменьшаются, но время от времени их амплитуда увеличивается. Также видно, что вероятность попадания ближе к 0,8, чем к первоначальной оценке 0,9. Более точную оценку из этого графика получить нельзя.

Рис. 1

Второй график показывает текущее значение средней частоты в зависимости от числа испытаний. Видно, что средняя частота довольно быстро приближается к постоянному значению 0,8. Таким образом, с практически приемлемой точностью можно утверждать, что для данного стрелка вероятность попадания при одном выстреле равна 0,8, а не 0,9. Эти графики построены по данным, сгенерированным на компьютере, число испытаний равно 120. Для этих данных средняя относительная частота равна 0,797, что подтверждает наш вывод. Таким образом, мы ответили на первый вопрос.

1

0,95 0,9 0,85 0,8 0,75

0 20 40 60 80 100 120

Рис.2

Перейдем к вопросу, поставленному в пункте 2. Этот вопрос может представлять интерес, например, если нужно выяснить, насколько стабильны результаты спортсмена. Состояние спортсмена могло меняться в течение этих 120 выстрелов. Например, первую половину выстрелов он стрелял лучше, чем обычно, а затем — по каким-то причинам хуже, чем обычно. При этом рассчитанная средняя частота могла остаться такой или почти такой, как и раньше. Ясно, что распределение числа попаданий в этом случае не может быть биномиальным. Рассмотренные выше графики не позволяют выяснить, какому закону подчиняется распределение числа попаданий. Для решения этой задачи можно применить так называемый критерий Пирсона хи-квадрат (X2), причем для этого потребуется гораздо больше испытаний, чем для первой задачи. (Вообще для применения критерия хи-квадрат требуется, чтобы число испытаний было не менее 30, а ожидаемая абсолютная частота была не менее 5). Критерий хи-квадрат зависит от числа степеней свободы r = m-1 (m — количество значений наблюдаемой случайной величины, которые сравнивают с теоретическими значениями). Для расчета были сгенерированы результаты 400 испытаний. Первым шагом является выбор математической модели.

В основе дальнейших рассуждений лежит допущение, что каждый результат — случайное число успехов в биномиальном распределении c параметрами n = 10, p = 0,85 для первых 200 испытаний и n = 10, p = 0,75 — для остальных.

Как и раньше, средняя частота равна 0,79 , то есть близка к p = 0,8.

Гипотеза H0 состоит в том, что случайная величина — количество попаданий стрелка в цель — подчиняется биномиальному распределению с вероятностью успеха p = 0,8.

В таблице 1 приведены наблюдаемые абсолютные частоты и абсолютные частоты, ожидаемые в предположении, что p = 0,8. Чтобы решить, значима ли разница между наблюдаемыми и ожидаемыми частотами, применим критерий хи-квадрат. Так как

должно выполняться условие, что ожидаемая абсолютная частота пк 5 5, то сложим все частоты, в которых это условие не выполняется (если и после этого условие будет не выполнено, добавим полученную сумму к ближайшей по значению частоте). Таблица 2 содержит преобразованные таким образом частоты. Вычислим разности наблюдаемых и ожидаемых абсолютных частот и составим выражение пк - Пк{, г = 1,2,..., т. Критерий хи-квадрат вычисляется по формуле

X2 = У (пк - пк)2. к=1 пк

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(1)

В этой формуле используются частоты из таблицы 2, т = 6 (число столбцов в таблице), число степеней свободы г = т - 1.

Мы не обсуждаем здесь обоснование этого критерия и используем его как справочный материал для проверки гипотезы в предположении о биномиальном распределении случайной величины.

Таблица 1

Число успехов, к 0 1 2 3 4 5 6 7 8 9 10

Наблюдаемые частоты, пк 0 0 0 1 4 20 41 79 99 107 49

Ожидаемые частоты, Пк 0 0 0 0.3 2.2 10.6 35.2 80.5 120.8 107.4 42.9

Ожидаемые частоты при к = 0,1,2 очень малы, поэтому в соответствующих клетках стоят нули.

Таблица 2

Наблюдаемые частоты, пк 20 41 49 79 107 99

Ожидаемые частоты, пк 13.1 35.2 42.9 80.5 107.4 120.8

Задаем уровень значимости а = 0,01, и по уровню значимости и по числу степеней свободы г = т - 1 находим критическое значение Ккрит для распределения хи-квадрат.

Решающее правило:

Если Х2 ^ Ккрит, то гипотеза о биномиальном распределении принимается.

Если Х2 > Ккрит, то гипотеза о биномиальном распределении отвергается.

Как получить Кфит?

Критическое значение можно получить из нескольких источников. Самый доступный способ — с помощью программы Ехе1.

После запуска программы производится следующая последовательность переходов:

Формулы ^ Другие функции ^ Статистическме ^ ХИ2.ОБР

На экране появляется форма с двумя окнами для ввода чисел. В верхнее окно, называемое Вероятность, вводится число 1 - а, а в нижнее, называемое Степени свободы, — число г = т - 1 .

В нашем случае при а = 0,01 и т = 6 рассчитанный критерий X2 по формуле (1) равен 16,5, критическое значение хи-квадрат Ккрит с г = 5 степенями свободы и уровнем значимости а = 0,01 равно 15,09. Так как Х2 > Кфит, то гипотезу о биномиальном распределении следует отвергнуть, то есть можно предположить, что произошли какие то изменения в состоянии стрелка.

Зшмечание. Такой же сюжет можно использовать для проверки изменения качества продукции, усталости электрической цепи и в аналогичных задачах.

Приведем еще один сюжет. Его можно предложить школьникам, причем при решении задачи вместо заданной таблицы они могут использовать свои наблюдения.

Сюжет 1.2

В почтовую программу встроен фильтр, который отправляет часть корреспонденции в спам. Фильтр может совершать ошибки двух типов — незаслуженно отправить какое-то письмо в спам или пропустить письмо, которое на самом деле нужно послать в спам. Анализ корреспонденции, например, за 1-2 месяца позволил бы приближенно оценить вероятности этих ошибок и при необходимости внести изменения в фильтр. Заметим, что фильтр действует по заложенному в нем жесткому алгоритму, поэтому, на первый взгляд, тут нет места для случайных ошибок. На самом деле такой алгоритм не может учесть всего разнообразия поступающей корреспонденции.

Итак, некоторый человек ежедневно получает до 10 писем. Количество сообщений, которые попадают в спам, заметно меняется от одного дня к другому. Он решил выяснить, можно ли рассматривать количество сообщений за день, незаслуженно попавших в спам, как значения некоторой случайной величины и по возможности найти ее закон распределения. Для этого он записывал в течение 60 дней, сколько нужных писем попадает в спам. В таблице 3 приведены эти данные.

Таблица 3

3 3 1 1 2 1 3 2 3 2 3 4 2 2 1 2 2 2 4 2

1 2 1 2 1 1 4 2 1 1 2 1 1 2 1 3 2 2 4 3

1 0 2 1 1 2 2 1 1 0 2 2 4 0 4 2 2 2 0 2

Обозначим эти числа через х(г), г = 1,2,3, ...60. Глядя на таблицу, трудно уловить

какую-либо закономерность. Тогда он вычислил текущие средние значения (2):

1 к

х(к) = -У х (г), к = 1,2,...,60. (2)

к =

Таблица 4

3,0 3,0 2,3 2,0 2,0 1,8 2,0 2,0 2,1 2,1 2,2 2,3 2,3 2,3 2,2 2,2 2,2 2,2 2,3 2,3

2,2 2,2 2,1 2,1 2,1 2,0 2,1 2,1 2,1 2,0 2,0 2,0 2,0 2,0 1,9 2,0 2,0 2,0 2,0 2,0

2,0 2,0 2,0 2,0 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9 1,9

Таблица 4 содержит текущие средние. Из нее видно, что средние значения за большой период времени стабилизируются и становятся практически равными 2. Если предположить, что числа х(г) представляют выборку объема N = 60 биномиального распределения с параметром п = 10, математическим ожиданием пр = 10р = 2, то получаем значение параметра р = 0,2.

Чтобы проверить, действительно ли имеет место биномиальное распределение, нужно подсчитать частоты т наблюдаемых значений и сравнить их с теоретическими Пг, вычисленными в предположении биномиального распределения с параметрами п = 10, р = 0,2. Эти частоты вычисляются по формулам щ = Npi, pi = С10р1ц10-г.

т = Np 1, р1 = С10ргй10-г.

Наблюдаемые и вычисленные частоты случайной величины х помещены в таблицу 5.

Таблица 5

Возможные значения 0 1 2 3 4 5 6 7 8 9 10

Наблюдаемые частоты щ 4 18 25 7 6 0 0 0 0 0 0

Теоретические частоты пг 6.44 16.11 18.12 12.08 5.28 1.59 0.33 0.05 0 0 0

Гипотеза: предположим, что числа х(г) представляют выборку объема N=60 биномиального распределения с математическим ожиданием пр = 2.

Для применимости критерия хи-квадрат требуется условие Пг & 5. Объединим столбцы, в которых нарушено это условие. Получим таблицу 6 с 5 столбцами и применим критерий хи-квадрат.

Таблица 6

Возможные значения 0 1 2 3 >3

Наблюдаемые частоты пг 4 18 25 7 6

Теоретические частоты Пг 6.44 16.11 18.12 12.08 7.25

1Щ - Щ | 2.44 1.89 6.88 5.08 1.25

Рассчитанное значение хи-квадрат Х2 = 6.11

Критическое значение Ккрит = 9.49 при а = 0,05

Так как Х2 < Кфит, то гипотеза о биномиальном распределении случайной величины (количества попадающих в спам нужных писем) подтверждается.

Однако может получиться, что при другой выборке среднее тоже равно 2, но случайная величина не подчиняется биномиальному закону распределения.

Пусть, например, выборка при тех же условиях будет такой, как в таблице 7.

Таблица 7

1 0 4 0 3 0 1 0 6 0 1 1 4 1 3 0 6 1 3 0

2 1 1 0 6 0 4 0 2 0 4 1 3 0 4 1 5 0 6 2

1 0 4 0 4 1 5 0 2 0 1 0 2 0 2 0 3 0 3 0

График текущих средних показан на рис. 3. На графике видно, что текущие средние колеблются вокруг значения 2.

10 15 20 25 30 35 40 45 50 55 60

Рис. 3

Проделав те же вычисления, получим, что X2 >> Ккрит, откуда следует, что гипотеза о биномиальном распределении случайной величины отвергается.

Замечание. При использовании собственных наблюдений может оказаться, что при составлении таблицы 4 стабилизации текущей средней частоты не происходит, тогда гипотеза о биномиальном распределении отвергается3.

3 Для изучения этой ситуации нужны более сложные математические модели.

3.2. Проверка гипотезы при нормальном распределении случайной величины (критерий Стьюдента)

С более сложными испытаниями связаны более сложные закономерности. При изучении реальных явлений в окружающей жизни часто сталкиваются со случайными величинами, для которых верен один и тот же закон распределения, называемый нормальным. Например, рост и вес человека, случайные ошибки измерений различных физических величин и т. д. Такое распределение встречается, когда значение случайной величины формируется в результате сложения большого числа независимых факторов, причем вклад отдельного фактора мал по сравнению с суммой остальных. Нормальное распределение определяется двумя параметрами — математическим ожиданием и дисперсией.

Примером связанного с нормальным распределением проекта может служить следующий сюжет.

Сюжет 2.1. Проверка эффективности лекарства

Изучается влияние некоторого лекарства на один из показателей состояния здоровья. Для проверки отобрана группа пациентов, у которых этот показатель ниже нормы. Пусть х1,х2,х3,...,хп и у1,у2,у3,...,уп — результаты обследования пациентов до лечения и после лечения.

Вычислим средние значения:

1 п 1 п п = п =

Предположим, что оказалось

у > х (3)

Вопрос: следует ли отсюда, что лекарство привело к улучшению показателя?

Если у значительно больше, чем х, то эффект очевиден. В этом случае дальнейшее исследование, возможно, и не нужно. Если же превышение у над х небольшое, то можно заподозрить, что причина превышения — не действие лекарства, а случайные ошибки эксперимента. Только неясно, какое превышение считать большим (в статистике принято называть его значимым), а какое — малым. Ведь может оказаться, что неравенство (3) получилось в результате сочетания случайных факторов и при повторении испытаний результат будет противоположный. Повторение испытаний требует затрат времени и средств, что обычно невозможно. Поэтому нужен метод, который, если не совсем исключил бы ошибку, то, по крайней мере, позволил бы контролировать вероятность такой ошибки.

Как и в первом сюжете, первым шагом является выбор математической модели. Вычислим разности Zi = у1 - х[, г = 1,2,..., п. Числа можно рассматривать как показатели эффективности лекарства для каждого из пациентов. Представим их в виде Zi = в + ег, где в — некоторая неизвестная константа (средний показатель эффективности лекарства, иначе говоря, математическое ожидание случайной величины z), а ег — неизвестные отклонения от среднего для г -го пациента. Отклонения являются случайными величинами, их распределение, вообще говоря, неизвестно.

В основе дальнейших рассуждений лежит допущение, что при каждом г распределение нормальное с нулевым математическим ожиданием и одинаковой дисперсией.

Гипотеза Н0 о том, что лекарство неэффективно, означает для выбранной нами модели в = 0.

Для проверки гипотезы применяем следующий метод. 1. Вычисляем среднее значение

1 n

z = -£ zi. n 1

2. Вычисляем выборочную дисперсию

т!> -11

1n

s2 = ^У> - z)2.

n-

^ - vn

3. В качестве критерия выбирается ^фжгаие t = z--.

s

Если гипотеза в = 0 верна, то распределение величины t известно и хорошо изучено. Оно так и называется t-распределением или распределением Стьюдента. Выбор именно функции Z = в качестве критерия нуждается в обосновании, которое в рамках школьного курса невозможно. Тем не менее, можно привести следующие доводы в пользу такого выбора.

Из математической статистики известно, что z стремится к своему математическому ожиданию при n ^ то есть к в = 0. Поэтому малые отклонения Z от нуля говорят в пользу гипотезы H0, а большие — против. Однако Z — случайная величина, значения которой, как правило, отклоняются от математического ожидания. Мерой этого отклонения является среднее квадратичное отклонение, sz = s / \fñ — оценка этой меры. Поэтому, получив большое значение z, мы не можем понять, чем оно вызвано, не учитывая величины sz. Ведь z может оказаться большим просто из-за большого рассеяния значений, а не из-за того, что в > 0. Разделив z на sz, уменьшаем влияние рассеяния.

Итак, задаем уровень значимости а = 0,05 и по уровню значимости и по числу степеней свободы r = n - 1 находим критическое значение Ккрит для t-распределения.

Решающее правило:

Если t ^ Ккрит, то гипотеза о неэффективности лекарства принимается.

Если t > Ккрит, то гипотеза о неэффективности лекарства отвергается, то есть принимается альтернативная гипотеза: в > 0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Как получить Ккрит?

Критическое значение можно получить из нескольких источников.

А) Как и в сюжете 1.1, самый доступный способ — с помощью программы Exel.

После запуска программы производится следующая последовательность переходов:

Формулы ^ Другие функции ^ Статистические ^ СТЬЮДЕНТ.ОБР

На экране появляется форма с двумя окнами для ввода чисел. В верхнее окно, называемое Вероятность, вводится число 1 - а, а в нижнее, называемое Степени свободы, — число r = n - 1 .

Б) Второй способ удобен, если на компьютере установлена какая-либо другая программа со статистическими функциями, например бесплатная программа Octave. Тогда после запуска Octave в командное окно вводится команда T = tinv(1 - а, m).

Пример. Для проверки случайным образом отбирается группа из 25 пациентов. Здесь стоит отметить важность метода отбора пациентов в группу. Отбор производится так, чтобы избежать присутствия в группе людей с какими-то особенностями, которые могут сильно исказить результат. Например, у половины пациентов плохая переносимость данного лекарства. Эффективность лекарства оценивается по разнице между значениями

некоторого показателя перед началом приема лекарства и после курса лечения. Очевидно, значения показателя эффективности для разных пациентов будут разными. Предположим, перед началом лечения среднее по группе значение контролируемого показателя было равно 9,92, а после лечения — 10,47. Разница равна 0,55. Похоже, что небольшой эффект имеет место, но возникает вопрос — не является ли он случайным?

Применим описанный выше метод проверки статистической гипотезы с помощью ¿-критерия. Получаем при п = 25 и х = 1,49.

0,55 ■ У25 г = --= 1,84.

1,49

Из таблицы г-распределения при а = 0,05 и числе степеней свободы т = п-1 = 24 находим критическое значение Ккрит = 1,71 г > Кфщ..

Вывод: гипотеза в = 0 отвергается, а альтернативная гипотеза в > 0 (лекарство эффективно) принимается, то есть на уровне значимости 0,05 эффект лекарства присутствует, или с вероятностью 0,95 лекарство эффективно.

Замечания. Полезно продемонстрировать, как влияют на наш вывод значения исходных параметров.

1) Если вместо 0,05 выбрать а = 0,03, то получим Ккрит = 1,97, г = 1,48 . Тогда г < Ккрит, значит, гипотезу следует принять, то есть средняя эффективность лекарства равна 0.

2) Также имеет значение число пациентов, то есть объем выборки п. Если, например, п = 16, то при а = 0,05 получим Ккрит = 1,75, г = 1,48. И в этом случае гипотеза в = 0 принимается, так как г < Ккрит.

3) Приведенные примеры показывают, что, анализируя одну и ту же выборку, можно получить противоположные выводы. Причина такой ситуации не в том, что плох сам метод анализа, а в недостаточности исходных данных, например, в количестве числа пациентов.

Школьникам в качестве проектов с использованием критерия Стьюдента можно предложить следующие сюжеты.

Сюжет 2.2. Интервал между автобусами

Ведется наблюдение в течение одного- двух месяцев за временным интервалом между автобусами одного маршрута в течение одного и того же промежутка времени (например с 16 до 18 часов в будние дни). Требуется:

1. Получить выборку объемом 150-200 интервалов.

2. Построить гистограмму.

3. Оценить математическое ожидание и стандартное отклонение.

4. Проверить гипотезу о нормальном распределении интервала с помощью критерия хи-квадрат.

Сюжет 2.3. Время, затраченное на выполнение домашних заданий

В течение двух месяцев, например, с 1 октября по 30 ноября записывается время в минутах, затраченное конкретным школьником на выполнение домашних заданий (исключаются выходные дни и каникулы). Обработка наблюдений производится по той же схеме, что и в сюжете 2.2.

Замечание. Случайные выборки для аналогичных исследований можно найти в большом количестве в [3, главы 14,15].

3.3. Равномерное распределение

Сюжет 3.1. Проверка игральной кости на правильность

Во многих статистических ситуациях эксперимент имитируется бросанием игральной кости. Перед тем как использовать игральную кость, ее нужно проверить на правильность (она должна быть правильной формы и с несмещенным центром тяжести).

Пусть проверяется гипотеза H0: кость правильная. Тогда при большом числе бросаний ни одно из шести чисел не должно выпадать заметно чаще остальных.

Уточним задачу. Пусть кость брошена n раз, а числа 1,2,3,4,5,6 выпали соответственно ni раз, i = 1,2,3,4,5,6. Величина hi = ni/n называется относительной частотой выпадения числа i. Из теории вероятностей известно, что hi ^ pi при n ^ где pi — вероятность выпадения числа i в отдельном бросании. Если кость правильная, то все грани равноправны, поэтому p 1 = p2 = ... = p6 = 1/6. Отсюда следует, что при большом n выполняется приближенное равенство hi = pi или ni = n • pi = n/6, то есть, если кость правильная, то частоты не должны сильно отличаться от величины n/6.

Прежде чем применять строгий статистический критерий, полезно представить результаты испытаний в виде гистограммы. Иногда достаточно гистограммы, чтобы принять или отвергнуть гипотезу. Однако вывод, сделанный на основе вида гистограммы, является субъективным, поэтому ненадежным.

В основе дальнейших рассуждений лежит допущение, что дискретная величина N, принимающая значения 1, 2, 3, 4, 5, 6 (число выпадающих очков), имеет равномерное распределение, то есть вероятности появления любого количества очков из данного набора чисел, равны.

В этом случае ^-критерием для проверки гипотезы может, как и в сюжете 1, служить критерий хи-квадрат:

X 2 = £

(ni - щ)2

ni

(4)

Рассмотрим два примера.

1. Пусть п = 96 и результаты испытаний показаны в таблице 8 и на соответствующей гистограмме (рис. 4).

Таблица 8

1 2 3 4 5 6

15 16 10 25 16 14

Из гистограммы и таблицы видно, что частота числа 4 равна 25, и это заметно больше остальных частот. Можно ли отсюда сделать вывод о том, что кость неправильная? Имеем npi = 96/6 = 16. Вычислим величину X2. Получаем X2 = 7,63. Вид гистограммы вызывает сомнение в справедливости нашей гипотезы. Выберем уровень значимости а = 0,05, в нашем случае число степеней свободы r равно 5. Как и в сюжете 1, с помощью программы Excel распределения хи-квадрат находим для r = 5 и уровня значимости а = 0,05 критическое значение Кфщ. = 11,07. Итак, X2 < Ккрит. Значит, при имеющихся данных и уровне значимости а = 0,05 нет оснований считать кость неправильной.

Рис. 4

2. Увеличим в два раза число испытаний и построим новую таблиц 9 и новую гистограмму (рис. 5).

Таблица 9

1 2 3 4 5 6

30 24 25 48 35 30

Рис. 5

Теперь пр = 192/в = 32, X2 = 12,06, £крит = 11,07, откуда видно, что Х2 > Ккрит.

Вывод: кость неправильная.

Замечание. В обоих случаях гистограммы вызывают сомнение в правильности гипотезы, однако лишь во втором случае с увеличением числа испытаний метод хи-квадрат подтверждает это сомнение.

Вывод о том, что кость неправильная подтверждается критерием хи-квадрат, но теперь можно поставить вопрос, в чем заключается эта неправильность. Из гистограммы видно, что число 4 выпадает заметно чаще, чем остальные числа. Это позволяет предположить, что центр тяжести смещен в сторону грани, противоположной четверке. Чем больше это смещение, тем больше вероятность выпадения четверки и тем меньше вероятность выпадения остальных чисел. Установить точную зависимость этой вероятности от смещения весьма сложно, но можно попробовать оценить эту вероятность.

Итак, отказываемся от гипотезы о равномерном распределении вероятности.

Теперь в основе дальнейших рассуждений лежит допущение, что вероятность четверки примерно в полтора раза больше остальных вероятностей, а остальные вероятности равны друг другу, то есть новая гипотеза такова: вероятности выпадения чисел i = 1,2,..., 6 равны: p4 = 3/13, pi = p2 = Рз = Р5 = Рб = 2/13; ft i = n • pi.

Вычисленное по формуле (4) значение критерия хи-квадрат будет равно 3,07, что значительно меньше критического значения 11,07.

Вывод: центр тяжести кости заметно смещен в сторону грани, противоположной четверке.

Школьникам можно предложить рассмотреть аналогичную задачу, в которой вместо игральной кости используется тетраэдр.

Сюжет 3.2. День рождения

Исходные данные — даты рождения людей из некоторой достаточно большой однородной группы. Например, рассматриваются все пятиклассники данной школы.

Цель исследования — установить, как распределяется число рождений по дням недели — равномерно или действует другая закономерность.

Пусть имеются даты рождения N учеников. Для дальнейшей обработки будем распределять даты по дням недели. Для этого придется по дате рождения (год, день, месяц) определить, на какой день недели приходится день рождения.

Математической моделью данного исследования является утверждение, что дискретная случайная величина М, принимающая значения 1,2,3,4,5,6,7 (номер дня недели) имеет равномерное распределение, то есть все дни недели равновероятны.

1. Определяем, на какой день недели приходится день рождения каждого человека (например, программа moydenrozdeniya.ru)

2. Определяем частоты попадания даты рождения на тот или иной день недели. Получаем 7 частот n = [n1, n2,..., n7], N = £ 7 fi.

3. Строим гистограмму, например, в Excel или командой bar(n) в Octave. Вид гистограммы обычно подсказывает, какая из гипотез относительно распределения частот наиболее правдоподобна.

4. Для проверки гипотезы можно использовать тот же критерий хи-квадрат, что и в сюжете с игральной костью.

5. Вычисляем pi — вероятности попадания дня рождения на i-й день. Исходя из равномерности распределения числа рождений, получаем

pt = 1У7 = 0,1429, i = 1,2,..., 7.

6. Вычисляем теоретические частоты n = N • pi.

Если распределение дат рождения по дням недели равномерное, то наблюдаемые частоты ni не должны сильно отличаться от пц. ^-критерием служит величина

X2 = f(ni - ni)2. i n i

Пример 1. Предположим, получены частоты дат рождений для группы из 100 человек. Эти частоты, а также теоретические частоты представлены в таблице 10 и на гистограмме (рис. 6).

Таблица 10

1 2 3 4 5 6 7

16 22 15 14 12 10 13

14,29 14,29 14,29 14,29 14,29 14,29 14,29

Рис. 6

Гистограмма, как кажется, противоречит гипотезе равномерности. Проверим эту гипотезу по критерию хи-квадрат.

Вычисляем X2 = 11,86. При а = 0,05 и числе степеней свободы m = 7 - 1 = 6 находим Ккрит = 6,18. Имеем X2 > Ккрит. Значит, гипотеза о равномерности отвергается.

На гистограмме видно, что один из дней, вторник, заметно превосходит остальные дни по числу рождений, что также выглядит как довод против гипотезы равномерности.

Пример 2. Пусть, например, таблица частот и соответствующая гистограмма имеют следующий вид (табл. 11, рис. 7).

Таблица 11

i 1 2 3 4 5 6 7

ni 16 20 15 14 12 10 13

14,29 14,29 14,29 14,29 14,29 14,29 14,29

1 2 3 4 5 6 7 Рис.7

На первый взгляд может показаться, что диаграмма на рис. 7 также противоречит равномерному распределению, но значение Х2 для этих данных равно 4,30, что заметно меньше Кфщ. = 6. Поэтому при таких исходных данных гипотеза о равномерном распределении числа рождений на каждый день недели принимается. Это говорит о том, что при проверке статистических гипотез не стоит полагаться только на гистограмму.

Школьникам можно предложить проверить гипотезу о равномерности распределения дней рождения среди выбранных 120 человек по месяцам таблица 12.

Таблица 12

1 2 3 4 5 6 7 8 9 10 11 12

10 9 11 13 14 10 9 8 11 9 10 6

4. МЕТОД МОНТЕ-КАРЛО И ЭКСТРЕМА1ЬНЫЕ З^АЧИ

Известный в статистике метод Монте Карло позволяет, например, статистическими методами получать приближенно площадь фигур в том случае, когда аналитическими методами это сделать трудно или невозможно.

Пример. Пусть дана область Б «неправильной» формы. Требуется вычислить ее площадь.

Обычно задача сводится к вычислению одного или нескольких определенных интегралов. Этот способ неудобен, если граница области имеет сложную форму и задается неявными уравнениями. Например, Б — пересечение двух областей Б1, Б2, то есть Б = Б1 п Б2, где Б1, Б2 определяются неравенствами (5):

М(Х'^ « 0 (5)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1/2(х, У) ^ 0.

Идея метода состоит в следующем.

Пусть имеется множество точек (хг-,уг), г = 1,2,..., п, равномерно распределенных в прямоугольнике Р, содержащим данную область Б. Равномерное распределение точек понимается в статистическом смысле, то есть для любых частей прямоугольника одинаковой площади вероятность попадания точки в них одинакова.

Математической моделью данного исследования является утверждение, что отношение числа точек (хг-, у[) е Б к числу всех точек (хг-, у[) е Р примерно равно отношению площади Б к площади прямоугольника, при этом распределение точек равномерное.

Генератор случайных чисел, равномерно распределенных в заданном диапазоне, имеется во всех математических пакетах. Предлагается следующий алгоритм вычисления площади:

1. Определяем прямоугольник Р, заведомо содержащий область Б. При этом не обязательно знать в точности, как выглядит сама область.

2. С помощью генератора случайных чисел создается массив точек (хг-, у[), г = 1,2,..., п, равномерно распределенных в прямоугольнике.

3. Проверяем каждую точку (хг-, у[) на принадлежность области Б, для чего подставляем ее координаты в каждое из неравенств (5). Точка принадлежит области Б тогда и только тогда, когда она удовлетворяет системе неравенств (5).

4. Пусть т — число точек, попавших область Б. Естественно предположить, что число т/п, то есть доля точек, попавших в область Б, по отношению к общему числу

точек примерно равна отношению площади области Б к площади прямоугольника, содержащего Б. Здесь мы используем равномерность распределения точек.

Значит, Бб

Бр п'

(6)

где SD — площадь области D. Функция SD = SPm которая получается из (6), дает приближенное значение площади области D. Погрешность в этом приближенном равенстве зависит от п. В математической статистике доказано, что погрешность стремится к нулю при п ^

Таким способом можно вычислить площадь фигуры с любой точностью.

Пусть, например, D = Di n D2, где Di, D2 определяются неравенствами

Í9x2 + 4y2 ^ 36,

|(x-2,5)2 + (y-2,5)2 ^4.

Область Di — эллипс, область D2 — круг, а область D — их пересечение (рис. 8). Вычисление площади такой фигуры с помощью нескольких определенных интегралов, хотя и возможно, но крайне громоздко. Метод Монте-Карло берет на себя все вычисления, освобождая пользователя от рутинной работы. Некоторую трудность представляет то, что для реализации метода необходимо иметь на компьютере какой-нибудь пакет, содержащий генератор случайных чисел. Существует несколько бесплатных пакетов, например, Octave, Scilab и все тот же Excel.

Ниже приведен пример вычисления площади фигуры, изображенной на рис. 8, с помощью простой программы в системе Octave.

Число случайных точек задаем и, например, при п = 40000 получаем S = 1,65, а при п > 40000 значение S меняется не более, чем на 0,01. Это дает основание утверждать, что площадь равна 1,65 с точностью до 0,01. Заметим, что в методе Монте Карло число случайных точек должно быть достаточно велико, но для современного компьютера это не является проблемой. Например, решение задачи в данном примере заняло не более одной секунды компьютерного времени.

Рис. 8

Вот маленькая программа на языке ОЛауе(МайаЬ), вычисляющая площадь области Б.

function s=MCarlo3(n)

% генерирование случайных точек в прямоугольнике

x=rand(1,n)*3;

y=rand(1,n)*2;

% подсчет числа точек, принадлежащих D. j=0;

for i=1:n

if f1(x(i),y(i))<=0 \&\& f2(x(i),y(i))<=0 j=j+i; end end

% вычисление площади s=6*j/n; end

% функции, задающие границы областей function z=f1(x,y)

z=4*x.A2+9*y.A2-36; end

function z=f2(x,y)

z=(x-2.5).A2+(y-2.5).A2-4; end

Перед рассмотрением следующего сюжета в качестве упражнения можно предложить найти методом Монте Карло площадь фигуры, состоящей из точек Х , y i), удовлетворяющих системе неравенств

' y í sin х , y > 0, 2(x - 1), t y > -0,3(x - 1).

Сюжет 4

Дана фигура, ограниченная параболой y = cx2 и прямой y = kx + m.

Прямая пересекает параболу в точках C(a; ca2) и D(b; cb2). Выбираем на параболе две произвольные точки A(xi;yi) и B(x2;y2), xi í x2.

Вопрос: при каком положении точек A и B четырехугольник ABCD имеет наибольшую площадь? Доказательство существования такого четырехугольника мы опускаем.

Очевидно, что точки C и D являются точками пересечения прямой и параболы.

План исследования:

1. Генерируем n пар случайных чисел x1(i), x2(i), i = 1,2,...,n, равномерно распределенных па отрезке [a; b]. Получаем n пар точек на параболе Ai = [x1(i);y1(í)), Bi = ((x2(i);y2(i)), y1 (í) = cx\(i), y2(i) = cx|(í).

Точки D(х4;y4) и C(x3;y3) фиксированы (концы хорды), поэтому задача сводится к выбору точек A и B.

2. Для каждой пары A¿, B¿ вычисляем площадь S¿ четырехугольника ABCD как сумму площадей двух треугольников, S = Sabc + Sacd• Для вычисления площадей треугольников удобно пользоваться известной формулой.

1

Sabc = ^ 1(х2 - Х1)(уз - y1) - (y2 - у1)(хз - Х1)|, 1

Sacd = ^ 1(хз - Х1)(у4 - У1) - (уз - У1)(х4 - Х1)|.

Итак, имеем массив S¡, i = 1,2,..., n.

3. Находим наибольший элемент массива, а также его номер в массиве (номер нужен для определения координат точек A и B, при которых достигается наибольшая площадь).

Найденная площадь является наибольшей только для п построенных четырехугольников, а не для всех возможных вписанных четырехугольников. Обозначим эту площадь через S„, а через Smax — площадь искомого четырехугольника. Идея решения основана на предположении, что

Su ^ Smax при п ^

Действительно, точки Ai, Bi на параболе строились так, что их абсциссы распределены равномерно на отрезке [a; b], а ординаты вычислялись из уравнения параболы. Поэтому их положение зависит только от x1(i) и x2(i). Значит, и площадь вписанного i-го четырехугольника зависит только от x1(i) и x2(i). Выбор пар точек A¡ и B¡ можно представить следующим образом. Рассмотрим систему координат (x^ x2) на плоскости. На горизонтальной оси будем откладывать x1(i), а на вертикальной — x2(i). Тогда любой паре Ai, Bi будет соответствовать на плоскости (x^x2) точка Pi = (x1(i);x2(i)). Все такие точки равномерно распределены в квадрате a í x1; x2 í b.

Пусть M(хь- x2) — точка, при которой достигается наибольшая площадь, а Л, B — соответствующие ей точки на параболе. В любой малой окрестности точки M при достаточно большом п будет находиться хотя бы одна точка Pi. Из близости Pi к M следует близость S„ к Smax. Это означает,

что Sn ^ Smax•

4. Очевидно, что оптимальные точки A, B не могут находиться близко к C и D. Пусть, например, c = 1, a = -1, b = 2, п = 4000. Тогда k = 1, m = 2. Результаты вычислений: Площадь параболического сегмента равна 4.5.

Наибольшая площадь вписанного в сегмент четырехугольника равна 4.00. Координаты вершин A(0.01;0.00),B(1.01; 1.01), C(2.00;4.00),D(-1.00; 1.00) (рис. 9).

Листинг программы на языке Matlab или Octave.

function [segm ms mi]=MCarlo2(a,b,c,n) aa=c*aA2; bb=c*bA2;

segm=0.5*(aa+bb)*(b-a)-(bA3-aA3)/3; % площадь сегмента

kab=(bb-aa)/(b-a);% угловой коэффициент прямой CD

% генерируем n пар абсцисс точек на параболе

x1=rand(1,n)*(b-a)+a;

x2=rand(1,n)*(b-a)+a;

% ординаты точек

y1=c*x1.A2;

y2=c*x2.A2;

% Точка A должна быть левее B, если не так, то переставляем их for i=1:n

if x2(i)<x1(i) t=x1(i); x1(i)=x2(i); x2(i)=t;

y1(i)=c*x1(i)A2; y2(i)=c*x2(i)A2; end end

% Координаты концов хорды - точек C и D

x3=b;

y3=bb;

x4=a;

y4=aa;

S=area(x1,y1,x2,y2,x3,y3,x4,y4);% площади n четырехугольников [ms mi]=max(s); % наибольшая из площадей и ее номер % Вывод результатов на экран

fprintf('maxs=%-6.2f\n',ms); % ms - наибольшая площадь % координаты вершин оптимального четырехугольника

fprintf('A=(%-4.2f; %-4.2f) B=(%-4.2f; %-4.2f)\n', x1(mi),y1(mi),x2(mi),y2(mi)); fprintf('C=(%-4.2f; %-4.2f) D=(%-4.2f; %-4.2f)\n', x3,y3,x4,y4); % картинка

pic(x1(mi),y1(mi),x2(mi),y2(mi),x3,y3,x4,y4,a,b,c);

% Вычисление площади четырехугольника по заданным координатам вершин function [y]=area(x1,y1,x2,y2,x3,y3,x4,y4) a13=x1-x3; b13=y1-y3; a12=x1-x2; b12=y1-y2; a14=x1-x4; b14=y1-y4;

s123=abs(a13.*b12-a12.*b13); s134=abs(a14.*b13-a13.*b14); y=(s123+s134)*0.5;

% графическое представление результата function pic(x1,y1,x2,y2,x3,y3,x4,y4,a,b,c) k12=(y2-y1)/(x2-x1) k23=(y3-y2)/(x3-x2); k14=(y4-y1)/(x4-x1); k34=(y4-y3)/(x4-x3) x=a:0.05:b; y=k34*(x-a)+c*aA2; plot(x,y); hold on y=c*x.A2; plot(x,y); hold on

y=k12*(x-x1)+y1; plot(x,y); hold on

y=k23*(x-x2)+y2; plot(x,y); hold on

y=k14*(x-x1)+y1; plot(x,y);

end

end

end

4

3

2

0

-1

-2

-3

-4

-5

-1 -0,5 0 0,5

1,5 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 9

Глядя на рисунок 9, можно предположить, что из всех четырехугольников (мы имеем в гаду часть плоскости, ограниченной четырехугольником), вписанных в параболический сегмент, наибольшую площадь имеет трапеция. Заранее это утверждение не очевидно.

Конечно, рисунок не заменяет доказательства, но он может подсказать, что нужно доказывать.

В этом исследовании демонстрируется метод, применимый и в более сложном случае.

1. Например, если параболу заменить произвольной кривой, то аналитическое решение может стать невозможным. Применив, например, такое же исследование к области, определяемой неравенствами

Г i

y í sin x, 0 í x í — ,

3

У " x'

5n

6

получим тот же результат: максимальную площадь имеет фигура, ограниченная трапецией. Заметим, что доказательство здесь, геометрическое или аналитическое, не очень простое.

2. Можно поставить аналогичную задачу: найти четырехугольник наибольшего периметра.

3. Можно рассматривать другие многоугольники

4. Не исключено, что можно увидеть и другие зависимости формы многоугольников от условий задачи и на этом пути получить новые интересные результаты..

5. РАСПРЕДЕЛЕНИЕ ЦИФР В ИЗВЕСТНЫХ МАТЕМАТИЧЕСКИХ КОНСТАНТАХ

В этом разделе мы применим статистический подход к исследованию величины, не являющейся случайной. Здесь нет случайной выборки, мы только можем изменять «эксперимент» за счет увеличения числа цифр после запятой.

Сюжет 5

Всем известно число п. Еще в древности оно было вычислено с довольно большой точностью п = 3,14. А в XIX веке было доказано, что число п иррациональное, и, значит, его нельзя представить в виде конечной или периодической десятичной дроби. Еще раньше были найдены способы, позволяющие вычислить п с любой заданной точностью. Следовательно, стало возможным получить приближенное значение п, содержащее после запятой любое (ограниченное только мощностью компьютера) число знаков. В Японии было получено несколько миллионов знаков. Это, в свою очередь, вызвало вопрос: нет ли какой-то закономерности в появлении цифр в этой бесконечной дроби. Если закономерность не обнаруживается, то можно рассматривать последовательность цифр как случайную выборку из равномерного распределения, в котором все цифры от 0 до 9 равновероятны. Примем это в качестве гипотезы. Для ее проверки используем уже применявшийся в других задачах критерий хи-квадрат.

Рассмотрим приближенное значение числа п с 152 знаками после запятой (взято из Википе-дии):

3,141592653589793238462643383279502884197169399375105820974944592307816406286208 99862803482534211706798214808651328230664709384460955058223172535940812848...

Таблица частот (табл. 13) показывает, сколько раз каждая из 10 цифр присутствует в этой дроби.

Таблица 13

I 0 1 2 3 4 5 6 7 8 9

ni 14 12 19 16 16 14 13 10 21 17

Если наша гипотеза верна, то все цифры равновероятны, значит, р1 = 0,1 и теоретическая частота равна П[ = 152 ■ 0,1 = 15,2. Отсюда при а = 0,05, к = 10 - 1 = 9 получаем

•Д (П; - П;)2

X2 = £ _ = 6,42, Кфит = 16,92.

г=0 п1

Критическое значение намного превышает вычисленное значение Х2. Таким образом, дробную часть числа п можно рассматривать как генератор выборки из равномерно распределенной случайной величины, которая принимает 10 значений.

В качестве аналогичных заданий можно применить эту же схему

1) к числу е = 2,71828, приводим приближенное значение е с 120 знаками после запятой: 2,71828182845904523536028747135266249775724709369995957496696762772407663035354759457138 2178525166427427466391932003059921...

2) к постоянной Эйлера С = 1 + 1 + 1т + ... + 1 - 1п п,

Приводим 360 знаков после запятой (взято из Википедии):

0,57721566490153286060651209008240243104215933593992359880576723488486772677766467 036947 063291746749514631447249807082480960504014486542836224173997644923536253500333742937337 7376739427925952582470949160087352039481656708532331517766115286211995015079847937450857 057400299213547861466940296043254215190587755352673313992540129674205137541395 4911168510 2807984234. . .

6. О «ЖЕСТКИХ» И «МЯГКИХ» МАТЕМАТИЧЕСКИХ МОДЕЛЯХ В. И. АРНОЛЬДА [9]

Еще один пример применения статистических методов к не случайной ситуации.

Если рассмотреть последовательность первых цифр в числах 2П, п = 1,2,3,...: 1, 2, 4, 8,1, 3, 6,1, 2, 5,1,..., то мы видим, что чаще всего встречаются единицы. Можно продолжить вычисления, например, вычислить последовательность первых цифр в 2П, п = 1,2, ...,20,... и т. д. и убедиться, что примерно 30 % будут составлять единицы. Более того, оказывается, что доля единиц примерно в 6 раз больше доли девяток. Такое же распределение имеют первые цифры членов геометрической прогрессии 3П и других. В. И. Арнольд ссылается на работы других авторов, обнаруживших, что и первые цифры населения стран мира подчиняются такому же распределению, и, более того, площади стран мира также подчиняются такому же распределению. Оказалось, что такое же распределение устанавливается в большом числе других моделей, в частности, в моделях передела мира. То есть наблюдения и статистические расчеты выявили такие закономерности. Более того, В. И. Арнольд предположил, что численность капиталов компаний и численность их работников также подчиняется аналогичным закономерностям. Но это «мягкие» модели, полученные или прогнозируемые на основании эксперимента. «Жесткие» модели, то есть доказанные математические связи, представляют собой трудные математические задачи и требуют усилий специалистов.

Эксперимент с первыми цифрами геометрической прогрессии 2П нашел свое подтверждение в теореме Г. Вейля, которая состоит в том, что если рассмотреть точку, прыгающую по единичной окружности шагами, несоизмеримыми с ее длиной, то доля времени, проводимого точкой в каждой дуге, пропорциональна длине дуги (и не зависит от расположения дуги). Если применить теорему Вейля к \^2п = п 1§2, то она превращается в теорему о равномерном распределении дробной части точек \%2п на отрезке [0; 1]. Следовательно, доля чисел 2П, имеющих первой цифрой г, составляет длину отрезка р1 = ^(г + 1) -г. В процентах получаем следующую таблицу для первых цифр (см. табл. 14).

Таблица 14

; 1 2 3 4 5 6 7 8 9

100pi 30 17 12 10 8 7 6 5 5

Доля единиц равна р; = 1§2 -1§1 = 1§2 а 0,30103, то есть примерно в 6 раз больше числа 9. Тот же вывод можно сделать для любой геометрической прогрессии тП, т > 1,

ш ф 10. Может показаться, что при измерении каких-либо параметров у других множеств получится то же самое. В. И. Арнольд попробовал сравнить число страниц в книгах на полке в своей библиотеке, длины рек, высоты гор, но ничего похожего не получилось.

В. И. Арнольд предположил, что все дело в том, что «книги, горы и реки не растут в геометрической прогрессии», но наблюдения за площадями стран, которые также подчиняются такому распределению первых цифр, тем не менее, показательного роста не показывают:

Таблица 15

i 1 2 3 4 5 6 7 8 9

Щ 29 21 10 11 6 6 8 3 6

Здесь уже требуется другое объяснение такого распределения.

Школьникам можно предложить следующий сюжет для исследования.

Сюжет 6

Выписать наугад из Википедии длины 80-ти или больше рек, подсчитать частоты первой цифры для каждой из девяти цифр (0 не может стоять на первом месте) и построить гистограмму.

Изучение статистики и применение статистических методов лишний раз иллюстрирует, что математика, как и физика, химия, биология и другие естественные науки, является наукой экспериментальной, в которой, по терминологии В. И. Арнольда, «жесткие модели», описываемые формулами, должны подтверждаться «мягкими моделями» в виде экспериментов.

7. ЗАКЛЮЧЕНИЕ

В работе в качестве предлагаемого дополнения к изучению основных понятий математической статистики рассматриваются две важные задачи: проверка статистических гипотез и решение геометрических задач методом Монте Карло. Вместо строгого обоснования методов проверки гипотез, которое выходит за рамки школьной математики, приводятся правдоподобные рассуждения. Метод Монте Карло используется при решении экстремальных геометрических задач, которые обычными геометрическими способами решить или затруднительно или невозможно. Приведены примеры заданий, которые могут быть предложены старшим школьникам. Эти задания могут легко варьироваться. Исходные данные (случайные выборки) могут быть взяты из разных источников (например, как уже упоминалось, их много в учебном пособии [3, главы 14, 15]) или составлены по собственным наблюдениям.

Применение метода Монте Карло к решению задачи нахождения четырехугольника наибольшей площади в конкретном случае позволяет получить большое количество новых задач, связанных с другими областями и другими многоугольниками с вершинами на границе области. Вместо наибольшей площади можно рассматривать многоугольники наибольшего периметра. Возникают и другие вопросы, требующие дополнительного исследования. Приведены также примеры применения статистических методов к задачам, которые не являются случайными величинами (распределение цифр в известных константах). В последней части приводится обсуждение доклада В. И. Арнольда с интересными и неожиданными примерами применения статистических методов.

Список литературы

1. Бунимович Е. А., Булычев В. А. Вероятность и статистика в школьном курсе математики, 7-9

класс. URL: http://school-collection.edu.ru (дата обращения: 25.09.2020).

2. Бунимович Е. А., Булычев В. А. Вероятность и статистика в школьном курсе математики, 1011 класс. URL: http://school-collection.edu.ru (дата обращения: 25.09.2020).

3. Бунимович Е. А., Булычев В. А. Основы статистики и вероятность. 5-11 классы: учебное пособие.

М.: Дрофа, 2008.

4. Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И. В. Теория вероятностей и статистика. М.: МЦНМО, 2014.

5. Тюрин Ю. Н., Макаров А. А., Высоцкий И. Р., Ященко И. В. Теория вероятностей и статистика: Методическое пособие для учителя. 4-е изд. М: МЦНМО: МИОО, 2014.

6. Wilensky U. Connected Mathematics: Building Concrete Relationships with Mathematical Knowledge. Doctoral dissertation. Cambridge, MA: MIT Media Laboratory, 1993.

7. Papert S. An Exploration in the Space of Mathematics Educations // International Journal of Computers for Mathematical Learning. 1996. Vol. 1, № 1. P. 95-123.

8. Соболь И. М. Метод Монте Карло. Серия «Популярные лекции по математике», Вып. 46. М.: Наука, 1968. 64 с.

9. Арнольд В. И. «Жесткие» и «мягкие» математические модели. Всероссийская конференция « Математика и общество. Математическое образование на рубеже веков». МЦНМО, 2000.

10. Фалин Г. И. История опытов с бросанием монеты (часть 3) // Математика в школе. 2015. № 1. C. 52-58.

11. Фалин Г. И. История опытов с бросанием монеты. Часть 2. Опыт де Моргана // Математика в школе. 2014. № 10. C. 52-57.

Поступила в редакцию 25.04.2020, окончательный вариант — 25.05.2020.

Энтина Софья Борисовна, кандидат технических наук, доцент кафедры алгоритмической математики СПбГЭТУ «ЛЭТИ» им. В. И. Ульянова (Ленина), Blvkjatm@gmail.com

Юдовин Марк Эльявич, кандидат физико-математических наук, доцент кафедры алгоритмической математики СПбГЭТУ «ЛЭТИ» им. В. И. Ульянова (Ленина), Н markyud@gmail.com

Computer tools in education, 2020 № 3:100-128 http://cte.eltech.ru

doi:10.32603/2071-2340-2020-3-100-128

On the Question of Statistical Research in the School Course of

Mathematics

Entina S. B.1, PhD, Associate Professor, El vkjatm@gmail.com Yudovin M. E.1, PhD, Associate Professor, El markyud@gmail.com

1 Saint Petersburg Electrotechnical University, 5, building 3, st. Professora Popova, 197376, Saint Petersburg, Russia

Abstract

Some elements of probability theory and statistics have been only recently included in high school curriculum. However, there so far have been no well-established textbooks and no clear consensus on the depth and breadth of the topics to be taught. As a result, the course gives students an incomplete picture of the subject. The article discusses some possible additions to the existing curriculum. The article also provides examples of assignments where mathematical statistics methods are used to study distribution laws and to solve geometry and extremum problems.

Keywords: random variable, mathematical statistics, hypothesis testing, critical value, decision rule, random variable distribution, Monte Carlo method.

Citation: S. B. Entina and M. E. Yudovin, "On the Question of Statistical Research in the School Mathematics Course," Computer tools in education, no. 3, pp. 100-128, 2020 (in Russian); doi:10.32603/2071-2340-2020-3-100-128

References

1. E. A. Bunimovich and V. A. Bulychev, Veroyatnost' i statistika v shkol'nom kurse matematiki. 7-9 klass [Probability and Statistics in School Mathematics. 7-9 class], Moscow, Kaluga, Russia, 2008 (in Russian). [Online]. Available: http://school-collection.edu.ru

2. E. A. Bunimovich and V. A. Bulychev, Veroyatnost' i statistika v shkol'nom kurse matematiki. 10-11 klass [Probability and Statistics in School Mathematics. 7-9 class], Moscow, Kaluga, Russia, 2008 (in Russian). [Online]. Available: http://school-collection.edu.ru

3. E. A. Bunimovich and V. A. Bulychev, Osnovy statistiki i veroyatnost'. 5-11 class [Basics of statistics and probability 5-11 class], Moscow, Russia: Drofa, 2008 (in Russian).

4. Yu. N. Tyurin, A. A. Makarov, I. R. Vysotskii, and I. V. Yashchenko, Teoriya veroyatnostei i statistika [Probability theory and statistics], Moscow, Russia: MCCME, 2014 (in Russian).

5. Yu. N. Tyurin, A. A. Makarov, I. R. Vysotskii, and I. V. Yashchenko, Teoriya veroyatnostei i statistika: Metodicheskoe posobie dlya uchitelya [Probability theory and statistics: Handbook for teachers], Moscow, Russia: MCCME, 2014 (in Russian).

6. U. Wilensky, Connected Mathematics: Building Concrete Relationships with Mathematical Knowledge, PhD dissertation, Massachusetts Institute of Technology, Program in Media Arts & Sciences, MA, USA, 1993.

7. S. Papert, "An Exploration in the Space of Mathematics Educations," International Journal of Computers for Mathematical Learning, vol. 1, pp. 95-123,1996; doi: 10.1007/BF00191473

8. I. M. Sobol', Metod Monte Karlo, Moscow, Russia: Nauka, 1968 (in Russian).

9. V. I. Arnol'd, «Zhestkie» i «myagkie» matematicheskie modeli. Doklad na Vserossiiskoi konferentsii «Matematika i obshchestvo. Matematicheskoe obrazovanie na rubezhe vekov» ["Hard"and "Soft"mathematical models], Moscow, Russia: MCCME, 2000 (in Russian).

10. G.I. Falin, "History of experiences with throwing of a coin. Part 3. Dzhevons's experience," Matematika v shkole, no. 1, pp. 52-58, 2015 (in Russian).

11. G. I. Falin, "History of experiences with throwing of a coin. Part 2. De Morgan's experience," Matematika v shkole, no. 10, pp. 52-57, 2014 (in Russian).

Received25.04.2020, the final version — 25.05.2020.

Sofiya Entina, PhD, associate professor of Algorithmic Mathematics Department, Saint Petersburg Electrotechnical University, E3vkjatm@gmail.com

Mark Yudodin, PhD, associate professor of Algorithmic Mathematics Department, Saint Petersburg Electrotechnical University, markyud@gmail.com

i Надоели баннеры? Вы всегда можете отключить рекламу.