КОНЦЕПТ
научно-методический электронный журнал ART 14268 УДК 378.147:519.86
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
Эл № ФС 77-49965. - ISSN 2304-120X.
Жукова Галина Николаевна,
кандидат физико-математических наук, доцент кафедры прикладной математики и моделирования систем ФГБОУ ВПО «Московский государственный университет печати имени Ивана Федорова», г. Москва gnzh@mail.ru
Дискретные и непрерывные распределения: антиподы или родственники?
Аннотация. Предложена методика преподавания студентам экономических специальностей раздела теории вероятностей, касающегося распределений случайных величин. На основе потока телефонных звонков построены частные модели, приводящие соответственно к дискретному и абсолютно непрерывному распределениям, а также общая модель случайного процесса. На примере пуассоновского и экспоненциального распределений показано, как можно использовать сопоставление распределений разных типов для того, чтобы добиться лучшего понимания и запоминания особенностей каждого из них. Предлагаемая методика ориентирована на обучение практическому применению теории вероятностей в экономике. Ключевые слова: теория вероятностей, дискретные распределения, непрерывные распределения, распределение Пуассона, экспоненциальное распределение, простейший поток.
Раздел: (01) педагогика; история педагогики и образования; теория и методика обучения и воспитания (по предметным областям).
Введение. Путаница с —
При изучении теории вероятностей студенты (например, экономисты) традиционно знакомятся вначале с дискретными случайными величинами, потом с абсолютно непрерывными. Эти два типа случайных величин представляются какими-то антиподами, обитающими в непересекающихся мирах. При таком подходе сходство параметров распределения Пуассона (дискретного) и экспоненциального распределения (абсолютно непрерывного) вызывает путаницу.
В самом деле, сравним
/к
P(X = к) = е-А —, к = 0,1,2,... EX = — , DX = л. к!
—е
—
f (x)
0,
x > 0,
EX = -, DX
x < 0. —
—
—2 .
Изучение этих родственных распределений разделяется во времени, по крайней мере, равномерным и нормальным распределением. Добравшись до экспоненциального распределения, студенты уже основательно забывают о пуассоновском, и параметры — в приведенных формулах кажутся не имеющими отношения друг к другу.
На самом же деле оба распределения получаются, например, при исследовании одной и той же модели системы массового обслуживания, они подобны изображениям одного предмета под разными углами. Поэтому для лучшего усвоения теоретического материала, его эффективного применения при решении практических задач, а также для введения в более сложную теорию случайных процессов представляется целесообразным рассказывать о пуассоновском и экспоненциальном
r\j Л r\j
КОНЦЕПТ
научно-методический электронный журнал ART 14268 УДК 378.147:519.86
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
Эл № ФС 77-49965. - ISSN 2304-120X.
распределениях (и изучать их) параллельно, постоянно обращая внимание слуша-
телей на их взаимосвязь.
Связующим звеном может служить прикладная задача, решая которую получим оба распределения, а затем, оттолкнувшись от них, построим случайный процесс.
У меня зазвонил телефон...
Построим модель системы массового обслуживания, представляющей собой простейший поток телефонных звонков. Процесс моделирования представляется очень важным для использования теории в решении задач, поэтому опишем его подробно.
Постановка задачи. Фирма ремонтирует бытовую технику, заказы принимаются по телефону, поток заявок простейший, т. е. стационарный, ординарный и без последействия.
При построении модели нужно осознавать, что модель, составленная в учебнике, не есть истина в последней инстанции, а всего лишь разумное приближение реального положения. В нашем случае, когда мы считаем поток заявок стационарным, предполагается, что в течение любого промежутка длиной 1 час с одинаковыми вероятностями поступит k заказов. Подумайте, действительно ли с 8:00 до 9:00 и с 14:00 до 15:00 одинаково часто поступает 0, 1, 2, ... , 100 заявок? Чтобы предположение о стационарности не казалось совсем бессмысленным, будем учитывать только рабочее время (можем даже лишь какую-то непрерывную часть этого времени). При анализе полученных результатов надо обязательно иметь в виду, насколько соответствовало реальности допущение о стационарности потока.
Ординарность потока означает, что вероятность того, что за очень короткий интервал времени произойдет более одного события, пренебрежимо мала по сравнению с вероятностью наступления ровно одного события. Если почти одновременно два и более заказа поступают редко (так ли это - субъективно), можно принять такое предположение. Пусть на 1000 звонков приходится в среднем 3 случая, когда одновременно позвонили два или более заказчика. Если мы считаем 3 пренебрежимо малым по сравнению с 1000, то будем предполагать ординарность потока.
Отсутствие последействия состоит в том, что число наступлений события (поступления звонка) в течение интервала времени [Е, ,t2 ] не зависит от того, сколько событий наступило в интервале [t3,t4], если эти интервалы не пересекаются. Это
предположение можно принять, например, если фирма рекламируется в большом городе и количество звонков в течение дня пренебрежимо мало по сравнению с числом потенциальных заказчиков, а последние звонят, не сговариваясь друг с другом.
Применительно к телефонным звонкам отсутствие последействия означает, в частности, что вероятность получить 5 заказов в течение часа (например, с 13:00 до 14:00) одна и та же в день, когда с 9:00 до 10:00 поступило 3 заказа, и в день, когда вообще не было заказов в это же время.
Простейшим (стационарным пуассоновским) потоком называется ординарный стационарный поток без последействия. Будем считать поток заказов по телефону простейшим, имея в виду, что это лишь довольно грубое приближение.
Наши телефонные звонки характеризуются интенсивностью потока Я - это среднее число звонков в единицу времени, ввиду стационарности Я не зависит от t. Именно такой смысл у параметра Я и в пуассоновском, и в экспоненциальном распределениях.
IV О rw
КОНЦЕПТ
научно-методический электронный журнал ART 14268 УДК 378.147:519.86
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
Эл № ФС 77-49965. - ISSN 2304-120X.
Два лица Януса
Рассматривая поступление заказов по телефону как проведение случайных
экспериментов, можно построить по меньшей мере две модели - дискретную и непрерывную (два лица мифического двуликого Януса).
Подсчитаем вероятность получить k заказов в единицу времени. Будем предполагать, что интенсивность потока постоянна в течение всего рабочего дня, тогда
лk
P(х = k) = е~Л —, k = 0,1,2,... EX = Л, DX = Л. (1)
k!
Число заказов в единицу времени распределено по закону Пуассона, формула (1) определяет ряд распределения дискретной случайной величины, значениями которой являются целые неотрицательные числа.
Теперь исследуем длину интервалов т между последовательными телефонными звонками; это тоже случайная величина, но уже непрерывная, она может принимать любые значения из интервала [0;+да). Как и всякая абсолютно непрерывная случайная величина, длина интервала между звонками принимает любое свое возможное значение с вероятностью 0.
Плотность вероятности случайной величины т имеет вид
Ле
f (x)
0,
x > 0, x < 0. ’
где Л по-прежнему означает интенсивность потока звонков. Естественно предположить, что средняя длина интервала между звонками будет равна 1/ Л, ведь в среднем в единицу времени поступает Л звонков и поток их ординарен, т. е. звонки идут по одному, а не группами. И действительно, математическое ожидание т равно в точности 1/ Л.
Лицо дискретное
Теперь подробно рассмотрим дискретное распределение числа телефонных звонков в единицу времени. Коротко опишем, как оно получается из биномиального распределения, проясним при этом вопрос недостаточности конечной схемы Бернулли.
Будем рассматривать схемы Бернулли (серии из n последовательных однородных независимых испытаний с двумя исходами).
Разобьем единичный интервал времени [a, b] точками a = ^ < t2 <... < tn+1 = b на n частей и будем считать, что в k -м испытании успех, если за промежуток времени [t ,t ] был звонок, неуспех - звонков не было. Также предполагаем, что звонки поступают независимо друг от друга и что интервалы времени [t ,t ] достаточно малы, чтобы можно было пренебрегать возможностью поступления двух и более звонков за этот промежуток.
Пусть в первой серии n испытаний и вероятность того, что в течение промежутка [tk, tk+1] был звонок, равна рп для любого k = 1,2,..., n. Тогда вероятность принять k
звонков в единицу времени равна P(X = k) = C^p^-, qn = 1 - p, k = 0,1,2,..., n .
Для биномиального распределения математическое ожидание количества успехов (принятых звонков) равно np , таким будет среднее число телефонных звонков, принятых в единицу времени, т. е. интенсивность потока Л .
Будем увеличивать количество испытаний в схеме Бернулли, увеличивая число точек разбиения единичного интервала времени, например, в два раза. Тогда в се-
IV 3 ^
КОНТ TF.TTT
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
научно-методический электронный журнал Эл № ФС 77-49965. - ISSN 2304-120X.
ART 14268 УДК 378.147:519.86
рии будет 2п испытаний, но вероятность успеха р2п в каждом испытании будет меньше, а интенсивность потока 2 останется прежней. Последняя равна матожида-нию числа успехов, во второй серии 2 = 2пр2п, поэтому
А = А
2п 2 .
Устремляя теперь п к бесконечности и уменьшая рп так, чтобы прп = 2, получим из биномиального распределения пуассоновское
Р2п =
2к
lim P(X = k) = lim ОкпркпЦПп —к = e ~2, k = 0,1,2,...
п^ад п^ад,прП=2 k!
(2)
Обратим внимание на то, что «пределом» последовательности дискретных случайных величин с конечным набором значений оказалась случайная величина со счетным числом значений (строгое с точки зрения математики обсуждение см. [1-3]).
Кстати, прежде чем счесть предел в (2) законом распределения некоторой дискретной случайной величины, необходимо удостовериться в том, что
ад лк
У e-2 —= 1.
У к!
(3)
Справедливость (3) сразу следует из разложения в ряд Тейлора функции f (x) = ex:
ад к
поэтому
ex = У—,
у к! ’
ад лк ад лк
У e-2 — = e-2У— = e-2e2 = e0 = 1. у к! У к!
Удостоверимся в том, что математическое ожидание у «предельной» случайной величины равно 2:
ад лк ад /» лк ад лк
EX = Уke 22 = e 2У — = e-2У- 2
4—( к! 4—1 /'I 4_j ■
к=0
к=0
к!
=1(к —1)!
2к
здесь отброшено первое слагаемое к— при к = 0, равное нулю, поэтому суммиро-
к!
. Л ~ к2к
вание ведется уже начиная с к = 1 и дробь-сокращена на к .
к!
Далее представляем 2к = 22к 1, затем 2 выносим за знак суммы, получаем
ад лк—1 ад лт
—2 =2e-2T— = 2e-2e2 = 2,
к=1 (к — 1)! У0 т!
e-22У-
попутно проведена замена индекса суммирования т = к — 1, учтено, что при к = 1 будет т = 0.
Итак, «дискретное лицо» нашей телефонной системы есть случайная величина,
распределенная по закону Пуассона: P (X = к) = e
А
к!
к = 0,1,2,... EX = 2, DX = 2.
к
2
IV ^ rw
КОНЦЕПТ
научно-методический электронный журнал ART 14268 УДК 378.147:519.86
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
Эл № ФС 77-49965. - ISSN 2304-120X.
Лицо непрерывное
Пусть теперь длительность интересующего нас интервала времени равна t, то-
гда за это время в среднем будет поступать At звонков, а вероятность поступления k звонков будет такой же, как и за единицу времени, но при интенсивности At, т. е.
P (X,
k) = e
-At
(At)k k!
k = 0,1,2,... EXt
At, DX== At.
Для дальнейшего исследования понадобится вероятность отсутствия звонков за время t
P(X = 0) = e~zt AjL = e-zt (4)
и вероятность поступления хотя бы одного звонка, т. е. события, противоположного
отсутствию звонков,
P(X > 0) = 1 - P(X = 0) = 1 - e~M, t > 0. (5)
Исследуем распределение непрерывной случайной величины т - длительности промежутка времени между последовательными звонками.
Воспользуемся формулой (5) для составления функции распределения т :
F(t) = P(t< t) = P(X > 0) = 1-e~A, t > 0. (6)
Действительно, событие т < t означает, что до следующего звонка прошло менее t единиц времени, что другими словами можно описать так: за промежуток времени длины t произошло хотя бы одно событие, т. е. Xt > 0, где Xt - случайная
величина, равная числу звонков за время t .
Функция распределения выражается через экспоненту g(x) = ex, где x = -At, отсюда и название распределения - экспоненциальное. Вероятность того, что между последовательными звонками пройдет t единиц времени, очень быстро убывает с ростом длительности промежутка времени, и тем быстрее, чем больше интенсивность потока A, что вполне согласуется с обыденными представлениями.
Замечательно то, что функция распределения - дифференцируемая на всей области определения функция (при t < 0 считаем F(t) = 0), так что можно вычислить
плотность распределения:
f (t) = F(t)
0,
t > 0, t < 0,
(7)
а также математическое ожидание и дисперсию
Ю Ю Л
EX = Jtf(t)dt =Jte Adt =1,
EX2 = J12f(t)dt =Jt2e Atdt =2,
A
DX = EX2 - (EX)2 = -
2
A2
f 1
u
1
A2
Отметим одно замечательное свойство экспоненциального распределения, выражающее отсутствие последействия. Оказывается, независимо от того, как долго не было звонков, распределение длительности интервала времени до очередного
Ю
Ю
0
Ю
2
(V С rw
КОНЦЕПТ
научно-методический электронный журнал ART 14268 УДК 378.147:519.86
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
Эл № ФС 77-49965. - ISSN 2304-120X.
звонка одно и то же. Попросту говоря, вероятность того, что позвонят в течение ближайших 15 минут, при условии, что не звонили в течение последних 5 минут, та-
кая же, как и в случае, когда последний раз позвонили секунду назад.
Убедимся в этом, вычислив условную вероятность PA(B), где A обозначает
условие «не звонили до ^ », B - событие «позвонят до момента Т, +t2 »:
P (AB)
Pa (B) =
P(A)
(8)
Событие AB, т. е. одновременное наступление A и B, заключается в том, что в течение [0, ^ ] не звонили, а в интервале t^ +12 ] позвонили. Сразу договоримся не различать открытые и замкнутые интервалы, поскольку вероятность принять любое отдельное значение для абсолютно непрерывной случайной величины равна нулю.
Событие AB можно представить в виде AB = A \ B, где B - отрицание B , означающее «позвонили до ^ », тогда вероятность можно вычислить с помощью функции
распределения так:
P (AB) = P(t, <т< U +12) = P(t< U +12) - P(*< U) = = F(t, +12) - F(t,) = 1 - eA+t2) - (1 - e) =
= -e ^(ti+t2) + e At' = e At' (1 - e )
Вероятность события A равна
P(A) = P(t> t,) = 1- P(t< t,) = 1- (1- e-At1) = e -At'. Подставляя найденные вероятности в (8), получим:
e At'(1 - e
Pa (B) =
-At,
e
-At,
1 = 1 - eA = F(t2) = P(t< t2) = P(B).
Вероятность события B оказалась равной обычной его вероятности, что и доказывает независимость A и B .
А вот и Янус!
Как уже было показано, распределение Пуассона и экспоненциальное получаются при исследовании одной системы массового обслуживания с разных точек зрения. Одна и та же реальная ситуация приближенно описывается двумя разными (но родственными) математическими моделями. Это наводит на мысль о построении общей математической модели, для которой наши распределения будут своеобразными проекциями. Мы познакомились с двумя представлениями системы массового обслуживания, подобными двум лицам мифического двуликого Януса; что же будет моделью «самого Януса»?
Математической моделью потока событий является случайный процесс, это особое семейство случайных величин {Xt}, где t принимает неотрицательные вещественные значения. {Xt} можно рассматривать как функцию X(t,o) двух переменных t и со, значениями второй переменной являются множества, соответствующие случайным событиям. При каждом фиксированном t случайный процесс является случайной величиной, а если зафиксировать о , получится ступенчатая функция.
На нашем примере с телефонными звонками случайный процесс - количество поступивших звонков к моменту t. Если зафиксируем момент времени, например 6
r>j
6 ~
КОНЦЕПТ
научно-методический электронный журнал ART 14268 УДК 378.147:519.86
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
Эл № ФС 77-49965. - ISSN 2304-120X.
10:00, то количество поступивших к этому моменту звонков будет отличаться в разные дни, оно будет случайной величиной. Если же зафиксируем а, т. е. выберем конкретный уже прошедший день, то получим неслучайную функцию, например та-
кую, как на рисунке, она называется траекторией случайного процесса.
Таким образом, пуассоновское и экспоненциальное распределения представляются двумя «лицами» случайного процесса, называемого пуассоновским потоком. Пуассоновское распределение получается как «сечение» пуассоновского процесса при фиксированной координате (t), а экспоненциальное распределение представляет собой более замысловатый «срез», в котором нас интересуют длительности промежутков времени между последовательными звонками.
Продолжение и приложение
Обычно наиболее употребительные распределения (в частности, пуассоновское и экспоненциальное) рассматриваются в начале или середине курса теории вероятностей. Для повторения и закрепления желательно обращаться к нашим распределениям на протяжении всего курса, а также в математической статистике при изучении интервальных оценок, критериев согласия и т. п.
В рамках рассмотренной модели пуассоновского потока телефонных звонков предлагается по мере изучения методов построения точечных и интервальных оценок решить следующие задачи.
Задача 1. По данным о поступлении заказов за 10 рабочих дней построить оценку среднего числа заказов с надежностью 0,95.
Задача 2. По данным задачи 1 построить оценку средней продолжительности интервала между заказами с надежностью 0,9.
Задача 3. По данным задачи 1 проверить гипотезу о том, что распределение числа поступивших звонков пуассоновское, а длительности интервала между звонками - экспоненциальное.
Обратим внимание на то, что в жизни начинать исследование случайного потока событий (звонков, заказов, отказов приборов и т. п.) нужно с формулировки и проверки гипотезы о типе распределения, и лишь потом строить интервальные оценки.
В заключение...
В условиях отсутствия у студентов интереса к абстрактным идеям, слабой математической подготовки, нехватки аудиторных занятий и прочих проблем такого рода разумным выходом представляется такая переработка базовых курсов математики (в частности, теории вероятности), когда упор делается на конкретизацию и
(V Т rw
Жукова Г. Н. Дискретные и непрерывные распределения: антиподы или родственники?// Концепт. -2014. - № 10 (октябрь). - ART 14268. - 0,4 п. л. - URL: http://e-koncept.ru/2014/14268.htm. - Гос. рег.
Эл № ФС 77-49965. - ISSN 2304-120X.
ART 14268 УДК 378.147:519.86
визуализацию математических объектов. Это позволяет добиться понимания идей хотя бы «на пальцах», дает возможность научить решать хотя бы типовые задачи, подобные тем, что встретятся в жизни.
Хочется затронуть еще одну типичную проблему - быстрое забывание полученных знаний. Запоминается только то, что постоянно используется, поэтому очень хорошо так строить изложение, чтобы все накопленные знания постоянно применялись. Так, при построении интервальных оценок уместно построить их для всех пройденных распределений.
Для удержания информации в памяти полезно устанавливать как можно больше связей между изученными понятиями, именно для этого предлагается, в частности, пуассоновское и экспоненциальное распределения изучать одновременно.
Можно и искусственно связать далекие друг от друга темы путем применения их в исследовании одной экономической модели. Так, поступление заказов на ремонт позволило связать дискретные и непрерывные распределения, точечные и интервальные оценки, критерии согласия и случайные процессы. Математическая сторона взаимосвязи этих разделов теории вероятностей, как правило, не очень-то интересует студентов-нематематиков, так что установка связей с помощью практических задач кажется более привлекательной.
Ссылки на источники
1. Лоэв М. Теория вероятностей. - М.: Изд-во иностранной литературы, 1962. - С. 22.
2. Ширяев А. Н. Вероятность. - М.: Наука, 1989. - С. 75.
3. Кремер Н. Ш. Теория вероятностей и математическая статистика. - М.: ЮНИТИ, 2001. - С. 71. Galina Zhukova,
Candidate of Physico-Mathematical Sciences, Associate Professor at the chair of applied mathematics and system modeling, Moscow State University of Printing Arts, Moscow gnzh@mail.ru
Dscrete and continuous distributions: antipodes or related objects?
Abstract. The author proposes the method of teaching students dealing with the economy with the part of the probability theory concerning the discrete and continuous distributions. Particular model of the stream of telephone calls lead to the discrete and continuous distributions. With the example of Poisson and exponential distribution we can see how one can use the comparison of different types of distribution to achieve the best understanding and remember their features.
The method proposed is adapted to a practical use of the probability theory in economics.
Key words: probability theory, discrete distribution, continuous distribution, Piosson distribution, exponential distribution, Poisson process.
References
1. Lojev, M. (1962) Teorija verojatnostej, lzd-vo inostrannoj literatury, Moscow, p. 22 (in Russian).
2. Shirjaev, A. N. (1989) Verojatnost', Nauka, Moscow, p. 75 (in Russian).
3. Kremer, N. Sh. (2001) Teorija verojatnosteji matematicheskaja statistika, JuNITI, Moscow, p. 71 (in Russian). Рекомендовано к публикации:
Горевым П. М., кандидатом педагогических наук, главным редактором журнала «Концепт»
КОНТ Т ЕП Т
научно-методический электронный журнал
~ 8