УДК 519. 2, 372.851
ТИПОЛОГИЯ ОШИБОК И ЗАБЛУЖДЕНИЙ, СВЯЗАННЫХ С ЗАДАЧАМИ КУРСА ТЕОРИИ ВЕРОЯТНОСТЕЙ. ЧАСТЬ 2: ЗАКОНЫ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНЫХ ВЕЛИЧИН
© Г.Д. Гефан1, О.В. Кузьмин2
1Иркутский государственный университет путей сообщения, 6640074, Россия, г. Иркутск, ул. Чернышевского, 15. 2Иркутский государственный университет, 6640003, Россия, г. Иркутск, ул. К. Маркса, 1.
Проведён анализ и предложена типологическая структура ошибок, совершаемых студентами при изучении таких важных разделов теории вероятностей, как законы распределения случайных величин, закон больших чисел и предельные теоремы. Даны методические рекомендации по совершенствованию учебного процесса. Статья адресована преподавателям математики и специалистам, которым приходится иметь дело с вероятностно-статистическими методами. Библиогр. 10 назв.
Ключевые слова: случайные величины; законы распределения; закон больших чисел; предельные теоремы теории вероятностей.
TYPOLOGY OF ERRORS AND DELUSIONS ASSOCIATED WITH PROBABILITY THEORY COURSE PROBLEMS. PART 2: RANDOM VARIABLES DISTRIBUTION LAWS G.D. Gefan, O.V. Kuzmin
Irkutsk State University of Railway Engineering, 15 Chernyshevsky St., Irkutsk, Russia, 664074. Irkutsk State University, 1 Karl Marx St., Irkutsk, Russia, 664003.
Having conducted the analysis the authors present a typological structure of the errors made by students when studying the important sections of the theory of probability including random variables distribution laws, the law of large numbers and limit theorems. Methodological recommendations on improving the educational process are given. The article is addressed to the teachers of mathematics and specialists dealing with probabilistic and statistical methods. 10 sources.
Key words: random variables; distribution laws; law of large numbers; limit theorems of probability theory.
Цель данного исследования - анализ и построение типологической структуры методологических ошибок и заблуждений, связанных с изучением курса теории вероятностей, опирающейся на личный преподавательский опыт авторов и на известные работы [1, 410], в которых вероятность рассматривается через призму парадоксов, а также с позиций непосредственного практического смысла. Статья продолжает работу [3], в которой речь шла о преподавании первого блока информации в теории вероятностей, - разделы, связанные с понятием случайного события: классическое определение вероятности, основные теоремы о вероятности, последовательность однородных независимых испытаний. Следующий (второй по счёту) блок информации в теории вероятностей, как известно, связан с понятием случайной величины и с анализом различных распределений случайных величин.
1. Идентификация законов распределения дискретных случайных величин. Среди законов рас-
пределения дискретных случайных величин классическими считаются следующие: биномиальный, пуассо-новский, геометрический, гипергеометрический. Между ними наличествуют определённые различия, но существуют и достаточно сложные, не вполне очевидные связи. Поэтому студенты не только должны усвоить соответствующие формулы, но и понять сущность и взаимосвязь перечисленных распределений.
Биномиальный и пуассоновский законы описывают распределение числа наступлений некоторого события в серии п однородных независимых испытаний (вероятность р наступления события в одном испытании известна). Биномиальному закону соответствует формула Бернулли, а пуассоновскому - формула Пуассона, речь о которых шла в первой части данной работы [3]. Там же говорилось о том, что формула Пуассона применяется лишь при определённых условиях (вероятность р мала, число испытаний п велико), поскольку она выведена из формулы Бернулли
1 Гефан Григорий Давыдович, кандидат физико-математических наук, доцент кафедры математики, тел.: 89086615484, 638354, e-mail: grigef@rambler.ru
Gefan Grigory, Candidate of Physical and Mathematical sciences, Associate Professor of the Department of Mathematics, tel.: 89086615484, 638354, e-mail: grigef@rambler.ru
2Кузьмин Олег Викторович, доктор физико-математических наук, профессор, заведующий кафедрой теории вероятностей и дискретной математики, тел.: 89025604133, e-mail: quzminov@mail.ru
Kuzmin Oleg, Doctor of Physical and Mathematical sciences, Professor, Head of the Department of the Theory of Probability and Discrete Mathematics, tel.: 89025604133, e-mail: quzminov@mail.ru
путём предельного перехода при р ^ 0, п ^да, Я = рп < да .
Геометрический закон описывает распределение случайной величины X - числа однородных, независимых испытаний до первого наступления события:
Р(Х = к) = (1 -р)к-1р , к = 1,2,..., где р - вероятность наступления события в отдельном испытании. Хотя природа случайных величин, подчинённых биномиальному и геометрическому законам, совершенно различна (в первом случае это число наступлений события в ограниченной серии, во втором - число испытаний до первого наступления события, теоретически не ограниченное), в некоторых задачах могут быть успешно использованы как биномиальное, так и геометрическое распределения.
Рассмотрим следующую задачу. Вероятность попадания в цель при одном выстреле равна р . Чему равна вероятность того, что при п выстрелах будет хотя бы одно попадание?
Число попаданий в цель в серии выстрелов - случайная величина, подчиняющаяся биномиальному закону распределения. Задача решается через противоположное событие:
Р( х = 0)=с0ро(1 - р)п = (1 - р)п,
Р(X > 1) = 1 - (1 - р)п.
С другой стороны, событие, заключающееся в том, что при п выстрелах будет хотя бы одно попадание, есть сумма несовместных событий, состоящих в том, что число выстрелов до первого попадания будет равно 1, будет равно 2, ..., будет равно п . Следовательно, искомая вероятность (согласно геометрическому закону распределения и формуле для суммы п членов геометрической прогрессии) равна
± (1 - р)к - р==1 - (1 - Р)-.
к=1 1 -1+р
Таким образом, данная задача может быть решена с помощью как биномиального, так и геометрического законов распределения.
Гипергеометрическое распределение возникает как решение следующей задачи. Пусть имеется совокупность N объектов, К из которых считаются особыми. Наугад отбирается (без возвращения) п объектов. Найти распределение случайной величины X - числа особых объектов среди отобранных. Используя классическое определение вероятности, нетрудно получить
- к
Р(X = к) = -К ,
СМ
где к может принимать значения от 0 до меньшего из двух чисел: К или п. Это и есть гипергеометрическое распределение.
Например, пусть среди 8 лотерейных билетов 3 выигрышных. Случайным образом выбирается 4 билета. Найти вероятность того, что среди них окажется
3 выигрышных. Правильное решение этой задачи таково:
P( X = 3) =
1
3 5 = 0.071. 14
С
Типичная ошибка заключается в том, что вместо гипергеометрического распределения используют биномиальное с р = 3/8 :
3^ 5 135
P(X = 3) = С3 -I - =
0.132.
ч8) 8 1024 Считать вероятность выигрыша постоянной для всех четырёх вытянутых билетов - явное заблуждение, поскольку каждая удача снижает шансы на выигрыш других билетов. Однако отбрасывать напрочь данное решение не стоит, оно могло бы оказаться почти точным. Немного изменим условие задачи: пусть среди 80 билетов имеется 30 выигрышных. Тогда правильное решение
1 0.128,
С3 С1
P( x = 3) = С30С50
С
80
14
а «ошибочное» решение, основанное на биномиальном законе, остаётся неизменным и его результат почти совпадает с правильным (при том что технически оно значительно проще). Это неудивительно, поскольку если выбор делается из очень большого числа объектов так, что N >> п и К >> к, то факт невозвращения отобранных объектов не играет существенной роли. В этом случае, очевидно, гипергеометрическое распределение должно приближаться к биномиальному. Можно предложить студентам доказать это аналитически. Приводим это доказательство.
СКСN-К _
С
N
K!(N - K)!n!(N - n)!
k!( K - k )!(n - k)![ N - K - (n - k)]! N!
Если N >> n и K >> k, то N!
! = (N -n +1) •... • N » Nn,
K!
(N -n)!
(N - K)!
[N - K - (n - k)]!
(K - k)!
(N - K)n-k.
>Kk
Следовательно,
P( X = k):
Kk (N - K)
2-k
n!
Nn
K
k!(n - k)!
n-k
=C ÜJ11 - Nj ,
что и даёт биномиальный закон распределения с p = K/N.
Таким образом, студенты должны правильно идентифицировать классические законы распределения дискретных случайных величин, но также не вы-
n
пускать из виду, что эти законы существенным образом связаны друг с другом.
2. Задачи, связанные с характеристиками показательного распределения. Показательным называется распределение непрерывной случайной величины с плотностью распределения вероятности
I (X) =
\Ле
I 0,
-ЛЛ
х > 0, х < 0.
К сожалению, очень часто в лекциях по теории вероятностей вид этой функции ничем не обосновывается, числовые характеристики определяются формально, природа случайных величин, имеющих такое распределение, не проясняется. В результате студенты не получают представления о широких научно-технических приложениях этого раздела теории вероятностей, а к изучению таких наук, как теория надёжности, теория случайных процессов и массового обслуживания, оказываются плохо подготовленными.
Представляется необходимым в первую очередь выяснить, в задачах какого рода может возникать показательное распределение. Можно рассмотреть задачу об отказах некоторого устройства и продемонстрировать, что показательное распределение, по сути дела, представляет собой предельную форму геометрического распределения (случайная величина - число безотказно отработанных единичных временных интервалов) при переходе от дискретного времени к непрерывному [2]. Стоит также рассмотреть задачу о простейшем (пуассоновском) потоке событий. Если среднее число событий в единицу времени (интенсивность потока) обозначить через Л, то вероятность того, что в течение промежутка времени (0, Г)
произойдёт ровно к событий, определится законом Пуассона:
Р (к) =
(Л )ке к!
к „-Л
В частности, вероятность того, что не наступит ни одного события за время t, равна р(0) = е~Л.
Функция распределения случайной величины Т -времени между наступлениями двух случайных событий в потоке - может быть найдена как вероятность того, что на промежутке времени (0, t) наступило хотя бы одно событие:
^(0 = Р(Т < ^ = 1 - р (0) = 1 - е~Л
(при t > 0). Тогда плотность распределения вероятностей равна
I ^) = ^ '(0 = Ле~Л (при t > 0). Итак, получен показательный закон распределения времени между случайными событиями в простейшем потоке.
Чтобы не совершить ошибку при описании некоторого случайного процесса, необходимо ясно представлять себе условия, при которых может идти речь о показательном распределении и простейшем потоке событий. Пусть имеется некоторое устройство, кото-
рое время от времени случайным образом может выходить из строя. Тогда, если поток отказов устройства простейший (пуассоновский) с интенсивностью Л, то вероятность безотказной работы в течение времени t, равна е~Л. Эта вероятность не зависит от того, с какого момента идёт отсчёт времени, т.е. неважно, сколько времени устройство уже отработало! Следовательно, речь идёт об устройствах «безвозрастных». Ясно, что, например, человек таким «безвозрастным устройством» не является и поэтому для него подобная теория неприменима.
Однако и в технике, и в природе, и в обществе есть немало объектов, которые можно считать безвозрастными. Таким свойством обладают, например, радиоактивные атомы. Другими словами, продолжительность существования радиоактивных атомов починяется показательному закону распределения. Как узнать среднее время жизни радиоактивного атома? Для этого надо найти математическое ожидание распределения:
М ( X ) = \Лхе'
ЛхСХ = -, Л
где величина Л есть некоторая постоянная распада (для данного вида атомов). Какова доля радиоактивных атомов, доживающих до среднего времени жизни? Обычно студенты довольно уверенно отвечают, что таких атомов будет ровно половина. Это ошибка, связанная со смешением понятий математического ожидания и медианы. Именно медиана Ме(Х) определяется условием
1= 1/
Р[X < Ме(X)] = Р[X > Ме(X)] = ^
и поэтому, учитывая формулу для вероятности попадания случайной величины в интервал,
Ме( X )
|1 (х)Сх
- -
2.
В случае показательного распределения Ме( X) = 1п2/ Л, так что медиана несколько меньше математического ожидания (время полураспада меньше среднего времени жизни). Вероятность же, что атом не распадётся до достижения среднего времени жизни, равна е-1 « 0,37 , т.е. до этого момента доживает примерно 37% атомов.
Разумеется, не надо путать понятия математического ожидания и медианы не только в случае показательного распределения, но и в других случаях (впрочем, для нормального распределения значения М^) и Ме(X) совпадают, но это лишь исключение). Например, давно известен тот факт, что средняя продолжительность жизни отличается от вероятной продолжительности жизни, т.е. возраста, до которого доживает половина населения. Согласно первым таблицам смертности, составленным в конце XVII века для нужд страховых компаний, средняя продолжительность жизни составляла 26 лет, а медиана про-
0
да
должительности жизни - всего 8 лет (за счёт высокой детской смертности) [8].
3. Поведение среднего арифметического, закон больших чисел и предельные теоремы теории вероятностей. Среднее арифметическое, если оно определяется не по генеральной совокупности, а по выборке объёма п, является случайной величиной:
— 1 п
х =1 ^ X,
- г=1
где X - одинаково распределённые случайные величины. Поскольку это чрезвычайно важная характеристика, применяемая во всех без исключения областях знания, необходимо хорошо представлять себе её свойства.
Для этого студентам может быть предложена следующая задача. Каждый из участников игры имеет право бросить одновременно любое количество игральных костей. Результатом игрока является среднее арифметическое чисел, выпавших на брошенных им (участником) костях. Весь банк забирает один игрок, чей результат окажется самым лучшим. Сколько костей выгоднее бросать, чтобы иметь больше шансов на выигрыш?
Вопрос, как правило, оказывается для аудитории сложным. Ответы даются разнообразные, в том числе «безразлично» и «чем больше, тем лучше». Лишь самые проницательные считают, что выгоднее бросать 1 кость, но и они затрудняются обосновать это математически. Для этого следует найти числовые характеристики среднего арифметического числа выпавших очков. Учитывая, что для числа очков X на /-ой кости
М (X ) = 7/2, Д X ) = 35/12 , получаем
_ 1 п 1
М (X) = - М (£ X ) = -пМ (X) =
п
г=1
п
7 _ 1 п
= М (X ) = -; П(Х) = — X ) =
2 " г=1
= Л т. X)=^Х) = М1!
п п п
Итак, математическое ожидание результата любого игрока одинаково и не зависит от числа брошенных им костей. Дисперсия же оказалась обратно пропорциональной числу п. Следовательно, среднее квадра-
тическое отклонение ст(Х) с ростом п падает как
1/л/П. Это означает, что игрок, решивший бросить много костей, скорее всего, получит результат, близкий к математическому ожиданию. Поэтому его шансы на выигрыш невелики. Тот же, кто сочтёт выгодным бросить только одну кость, будет иметь результат, который с равной (и относительно большой) вероятностью может оказаться и самым лучшим, и самым худшим. Поскольку никакое место, кроме 1 -го, не даёт выигрыша, это и будет правильной тактикой.
На практике такое поведение среднего арифмети-
ческого означает, что если измерения некоторой величины сопряжены со случайными ошибками, то нужно провести целую серию измерений (чем больше, тем лучше), а затем усреднить их результаты. Случайная ошибка уменьшится в 4п раз.
Анализ поведения среднего арифметического вплотную подводит нас к простейшей форме закона больших чисел - теореме Бернулли. При неограниченном возрастании числа однородных независимых испытаний с практической достоверностью (т.е. с вероятностью, близкой к 1) можно утверждать, что относительная частота события ™ будет сколь угодно близка к вероятности р этого события в отдельном испытании. С этим законом также связаны некоторые заблуждения, точнее говоря, превратное понимание.
Во-первых, стремление относительной частоты к вероятности события при п ^да не нужно понимать в смысле обычного предела. В этом случае относительная частота п, войдя в некоторую е -окрестность значения р , уже не могла бы из этой окрестности выйти с ростом п , что, конечно, не так. Речь идёт о так называемой сходимости по вероятности:
(Уе > 0), (У 5 > 0), (Зи > 0): Р(|п - р| <е) > 1 -5 ,
или
->Р(А), п ^да.
Во-вторых, часто понимают смысл теоремы Бернулли примерно следующим образом: при увеличении, скажем, числа подбрасываний монеты разность между числом выпавших гербов и числом выпавших решек приближается к нулю. На самом деле, даже эмпирически легко убедиться, что это не соответствует истине. К нулю будет приближаться разность логарифмов этих чисел, что соответствует приближению относительной частоты появления гербов к 1/2.
Наконец, ещё одно неверное толкование закона больших чисел состоит в утверждении, что с увеличением числа подбрасываний монеты вероятность появления равного количества гербов и решек также будет возрастать. На самом деле, эта вероятность не только убывает, но и стремится к нулю. При подбрасывании 2п монет эта вероятность будет равна С"п / 22", что для больших п в соответствии с формулой Стирлинга п!«л/2лп(п/е)" примерно равно 1/4лп .
Этот результат впервые получил Муавр, доказав свою знаменитую локальную теорему: если последовательность однородных независимых испытаний, в каждом из которых событие наступает с вероятностью р , достаточно длинна (п ^да, реально п должно составлять несколько десятков), то биномиальное распределение (формула Бернулли) хорошо аппроксимируется формулами
Р- (к )<
Ф(*)
к - рп - р)п - р)п
1 = -
Ф( 7) =
1
42л
1
2
Вышеприведённый результат для оценки вероятности равного количества гербов и решек при подбрасывании 2п монет будет получен, если в последних формулах вместо п принять 2п и задать р = —2, к = п. В отличие от формулы Пуассона, которая, например, к задаче о монете неприменима, локальная теорема Муавра-Лапласа не требует малого значения вероятности р (напротив, нежелательно, чтобы р было близким к 0 или к 1).
Часто курс теории вероятностей выстроен так, что локальная теорема Муавра-Лапласа воспринимается студентами просто как замена формулы Бернулли при большом числе испытаний. Между тем, здесь заключён куда более важный смысл. Согласно центральной предельной теореме, случайная величина, являющаяся суммой достаточно большого числа взаимно независимых случайных величин, каждая из которых мало влияет на всю сумму, имеет распределение, близкое к нормальному. Число выпавших гербов при подбрасывании п монет удовлетворяет условиям центральной предельной теоремы, поскольку эта случайная вели-
п
чина может быть представлена в виде X = ^X ,
г=1
где каждая случайная величина X - число появлений герба при бросании /'-ой монеты (0 или 1) - имеет биномиальное распределение. Центральная предельная теорема объясняет тот поразительный факт, что огромное количество явлений, в особенности природных, описывается нормальным распределением.
Предельный характер нормального распределения проявляется и в интегральной теореме Муавра-Лапласа, определяющей вероятность того, что число наступлений события в серии испытаний попадёт на некоторый интервал. Таким образом, теоремы Муав-ра-Лапласа являются, в каком-то смысле, следствиями центральной предельной теоремы и могут быть выведены непосредственно из неё [2].
Закон больших чисел и предельные теоремы служат тем очевидным «мостиком», который соединяет теорию вероятностей с математической статистикой. Хотя теория вероятностей просто «пропитана духом» статистического опыта, преподаётся она, как правило, не вместе с математической статистикой, а до неё. В такой последовательности, конечно, есть своя логика, но отрицательный эффект тоже достаточно заметен - отрыв теории вероятностей от практики и даже превращение её в абстрактную науку.
Другая проблема состоит в слабом использовании на занятиях по теории вероятностей и математической статистике современных вычислительных средств. Изучать эти науки в высшей школе только с помощью бумаги, ручки и примитивного калькулятора - несовременно, неэффективно, да и попросту неинтересно. Не отрицая необходимости традиционных форм занятий - лекций и семинаров, мы считаем нужным активно использовать для обучения компьютер и
информационные технологии. Первая причина буквально лежит на поверхности и очевидна для всех: даже общедоступный табличный процессор Excel позволяет провести необходимые статистические вычисления в доли секунды, практически независимо от объема имеющихся данных. Также компьютер способен облегчить и решение многих задач по теории вероятностей, например, с применением формул Бернулли, Пуассона, теорем Лапласа и т.д. С помощью графических средств можно ярко иллюстрировать законы распределения случайных величин. Но ещё эффективнее и интереснее выглядит применение компьютера для моделирования случайных событий, величин, процессов методом статистических испытаний (методом Монте-Карло). Например, с помощью компьютера можно показывать, каким образом относительная частота сближается с вероятностью при увеличении числа экспериментов. Еще не посвятив студентов в тонкости и точные формулировки закона больших чисел, преподаватель при правильном применении компьютерного моделирования может сформировать у аудитории верное представление о том, что относительная частота события при большом числе экспериментов, скорее всего, близка к вероятности. Таким образом, довольно абстрактное понятие вероятности события получает наглядное содержание, отрыв теории вероятностей от статистики преодолевается на первых же занятиях.
Выводы. В данной работе, как и в предшествующей статье [3], мы не ставили своей целью дать исчерпывающую классификацию ошибок, совершаемых студентами при решении задач теории вероятностей, но хотели выделить и проанализировать те «тонкие места», которые, на наш взгляд, создают почву для непонимания или заблуждений. Можно помочь студентам понять теорию вероятностей и избежать многих ошибок, если при изучении случайных величин и законов их распределения уделить больше внимания:
1) уяснению не только существенных различий, но и сложных, не вполне очевидных связей между законами распределения дискретных случайных величин;
2) пониманию природы показательного и нормального распределений, их важного практического значения и глубокой связи с реальными процессами и явлениями;
3) не только формальному вычислению, но и сущностному анализу числовых характеристик случайных величин;
4) иллюстрированию закона больших чисел в его простейших формах и предельных теорем теории вероятностей простыми и понятными примерами;
5) уяснению важной роли центральной предельной теоремы;
6) использованию при изучении теории вероятностей компьютерных технологий, в частности, моделированию случайных событий, величин, процессов методом статистических испытаний (методом Монте-Карло).
Библиографический список
1. Вентцель Е.С., Овчаров Л.А. Теория вероятностей и её инженерные приложения. М.: Наука, 1988. 480 с.
2. Гефан Г.Д. Лекции по теории вероятностей для нематематиков. Иркутск: Изд-во ИрГТУ, 1999. 80 с.
3. Гефан Г.Д., Кузьмин О.В. Типология ошибок и заблуждений, связанных с задачами курса теории вероятностей. Случайные события // Вестник ИрГТУ. 2011. №12 (71). С.187-194.
4. Гильдерман Ю.И. Закон и случай. Новосибирск: Наука, 1991. 200 с.
5. Гнеденко Б.В. Курс теории вероятностей. М.: Наука,
1988. 448 с.
6. Гнеденко Б.В., Хинчин А.Я. Элементарное введение в теорию вероятностей. М.: Наука, 1976. 168 с.
7. Колмогоров А.Н., Журбенко И.Г., Прохоров А.В. Введение в теорию вероятностей. М.: Наука, 1982. 160 с.
8. Секей Г. Парадоксы в теории вероятностей и математической статистике / пер. с англ. М.: Мир, 1990. 240 с.
9. Стоянов Й. Контрпримеры в теории вероятностей. М.: Факториал, 1999. 288 с.
10. Чубарев А.М., Холодный В.С. Невероятная вероятность. М.: Знание, 1976. 128 с.