Научная статья на тему 'О выборе математических моделей распределений ограниченных случайных последовательностей'

О выборе математических моделей распределений ограниченных случайных последовательностей Текст научной статьи по специальности «Математика»

CC BY
172
55
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / УСЕЧЕННОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ С ОГРАНИЧЕННОЙ ОБЛАСТЬЮ РАССЕЯНИЯ / NORMAL DISTRIBUTION / TRUNCATED NORMAL DISTRIBUTION / NORMAL RANDOM VARIABLE WITH LIMITED RANGE OF SCATTERING

Аннотация научной статьи по математике, автор научной работы — Поршнев Сергей Владимирович, Копосов Александр Сергеевич

В работе обоснована целесообразность использования в задаче построения математических моделей распределений ограниченных случайных последовательностей решений уравнения Фоккера-Планка, описывающих одномерное броуновское блуждание в ограниченной области

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Поршнев Сергей Владимирович, Копосов Александр Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ABOUT MAKING DECISIONS IN MATHEMATICAL MODELS OF DISTRIBUTIONS OF BOUNDED RANDOM SEQUENCES

In this article we found out the usage reasonability of the solution of the Fokker-Planck equation for the problem of building of mathematical models of distributions of bounded random sequences

Текст научной работы на тему «О выборе математических моделей распределений ограниченных случайных последовательностей»

УДК 004.942

UDC 004.942

О ВЫБОРЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ РАСПРЕДЕЛЕНИЙ ОГРАНИЧЕННЫХ СЛУЧАЙНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

Поршнев Сергей Владимирович д.т.н., профессор

Копосов Александр Сергеевич аспирант

Уральский федеральный университет имени первого Президента России Б.Н. Ельцина, Екатеринбург, Россия

В работе обоснована целесообразность использования в задаче построения математических моделей распределений ограниченных случайных последовательностей решений уравнения Фоккера-Планка, описывающих одномерное броуновское блуждание в ограниченной области

Ключевые слова: НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ, УСЕЧЕННОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ, НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ С ОГРАНИЧЕННОЙ ОБЛАСТЬЮ РАССЕЯНИЯ

ABOUT MAKING DECISIONS IN MATHEMATICAL MODELS OF DISTRIBUTIONS OF BOUNDED RANDOM

SEQUENCES

Porshnev Sergey Vladimirovich Dr.Sci.Tech., professor

Koposov Alexander Sergeevich postgraduate student

Ural Federal University named after the first President of Russia B.N. Yeltsin, Ekaterinburg, Russia

In this article we found out the usage reasonability of the solution of the Fokker-Planck equation for the problem of building of mathematical models of distributions of bounded random sequences

Keywords: NORMAL DISTRIBUTION, TRUNCATED NORMAL DISTRIBUTION, NORMAL RANDOM VARIABLE WITH LIMITED RANGE OF SCATTERING

1. Введение

Нормальное распределение случайной величины имеет неограниченную область рассеяния. В тоже время область значений случайных величин, анализ которых приходится проводить в естествознании, технике и экономике, оказывается конечной. Как следствие, распределения данных случайных величин отличаются от идеализированной модели с неограниченной областью рассеяния.

Наиболее очевидной физической моделью случайного процесса с ограниченной областью рассеяния служат песочные часы, в которых песок из «точечного» источника высыпается на горизонтальную плоскость, ограниченную непроницаемыми абсолютно упругими вертикальными стенками. При достаточном удалении стенок от источника они не будут оказывать влияния на формирование кучи песка, поэтому ее форма будет

симметричной. В противоположном случае песчинки будут отражаться от стенок, что приведет к отличию формы кучи от «нормальной».

В качестве примеров физических характеристик с ограниченной областью рассеяния можно привести плотность углей, изменяющейся в диапазоне от рш;п до некоторого максимального значения ртах, время безотказной работы группы однотипных приборов, изменяющегося в диапазоне от некоторого минимального значения Tm^n до некоторого максимального и т.д.

Следует отметить, что существует два альтернативных подхода к построению математических моделей обсуждаемых случайных величин. Первый подход основан на описании распределения случайной величины с помощью усеченных функций распределения [1,2]. Во втором подходе, базирующемся на работах А. Эйнштейна и М. Смолуховского по теории броуновского движения [3], модель статистического распределения случайной последовательности строится как распределение конечного состояния некоторого случайного процесса без последействия с ограниченной областью рассеяния [4]. Следует отметить, что сегодня в подавляющем большинстве учебников по теории надежности технических систем используется первый подход, как правило, без каких-либо обоснований подобного выбора [1,2]. В этой связи разработка сравнение обоих подходов к построению математических моделей распределений случайных последовательностей и выбор из них наилучшего является актуальной.

2. Классическая модель нормального закона

Эквивалентность решения уравнения Фоккера-Планка, описывающего процесс диффузии,

(1)

где /(?, x) - плотность распределения частиц f x) = —P(t,x), Р ^, x) -

дx

вероятность нахождения частицы в момент времени t в точке x; В -коэффициент диффузии; для неограниченной области рассеивания броуновских частиц было найдено А. Эйнштейном [5]

/ X ) = -

л/4лВ Л ’ (2)

здесь п - нормировочный коэффициент, выбираемый из условия

| / (t, x)^ = 1. Действительно, трактуя величину 2Dt как дисперсию

случайного процесса для конечного времени t, получаем математическую модель нормального закона распределения

2

1

/^)=- 1 ^-2

л/2ла (3)

Отметим, что аналогичный результат можно получить, рассмотрев броуновское движение точечной частицы на бесконечной прямой под действием случайных толчков [6], вызывающих с вероятностью р смещение в одну сторону, и с вероятностью д смещение в другую сторону. Вероятность Рп (т) того, что после п случайных толчков частица окажется в т-ой точке рассчитывается по формуле

! т+п п-т

Рп (т )=ґ п^ р 2 д2

' п + т ),[ п - т '

где п + т, п - т - число толчков и, следовательно, элементарных смещений (шагов) вправо и влево, соответственно. При р = # =1

X

п е АВг

п+т / л \2

Р (т ) = С~^ I-I .

Л ) п 12) (5)

Формула (5) с физической точки зрения может быть истолкована следующим образом [6]. Предположим, что в начальный момент времени в точке x = 0 имелось большое количество частиц. Далее частицы начинают перемещаться под действием случайных толчков независимо друг от друга. Тогда (5) дает долю частиц, оказавшихся на расстоянии т от начала отсчета.

При больших п для расчета вероятности Рп (т), как следует из теоремы Муавра-Лапласа, можно использовать асимптотическую формулу

Рп ( т )=]~е 1 2п ^ (6)

V рп (6)

Можно показать [7, С. 78], используя следующее порождающее уравнение

Р (, )= Рп+1 (‘ + 1) + Рп-1 (-' - 1)

Рп (1)= 2 + 2 ’ (7)

и полагая в нем t = т, x = 1а и Рп (/) = аР ^, x), где х - время между шагами, а - величина единичного шага, что в непрерывном пределе х ® 0, а ®0 при конечном В = а2/х получается уравнение Фоккера-Планка (1).

3. Распределение случайного броуновского движения с ограниченной областью рассеяния

На практике встречается целый ряд задач, в которых область изменения случайной величины оказывается ограниченной. Подобные ситуации возникают, например, в задачах: анализа случайных блужданий броуновской частицы в ограниченной области [5]; анализа содержания химических элементов в углях; анализа прочностных характеристик углей [4]. Функцию плотности вероятности случайной величины в данном случае

т

можно получить, проведя аналогию между рассматриваемой случайной величиной и одномерным броуновским движением частицы в ограниченной области. Особенности статистических свойств данного движения были изучены М. Смолуховским [5].

Наиболее наглядное решение обсуждаемой задачи для области рассеяния, ограниченной с правой стороны отражающей стенкой, расположенной в точке xmax, изложено в [6, с. 103-106]. Искомая вероятность нахождения броуновской частицы в точке с координатой т в рассматриваемом случае вычисляется по формуле

Из (8) видно, что вероятность нахождения броуновской частицы в произвольной точке т, может быть интерпретирована, как сложение действий двух источников (действительного и фиктивного), расположенных в точках ^ = 0, x2 = 2xmax -т, соответственно.

Рассуждая аналогично, можно показать, что для броуновского движения с ограниченной областью рассеяния слева в точке xmin вероятность нахождения броуновской частицы в точке с координатой т в данном случае вычисляется по формуле

Из (9) видно, что вероятность нахождения броуновской частицы в произвольной точке т, может быть интерпретирована, как сложение действий двух источников (действительного и фиктивного),

расположенных в точках ^ = 0, x2 = т-2xmin, соответственно.

(8)

(9)

В связи с тем, что при практическом использовании модели броуновского движения в ограниченной области одним из основных оказывается вопрос о вычислении координат точек расположения фиктивных источников, рассмотрим его более подробно. Выберем систему координат с началом в середине отрезка области рассеяния (рис. 1).

q2- ч

9 9 • 9 !?

1 1 ►

-41 + х0 -21 -х0 -1 0 х0 I 21 — х0 4/ + х0

Рис. 1 - К вычислению координат фиктивных источников

Из рис. 1 видно, что наличие двух отражающих поверхностей порождает бесконечную систему фиктивных источников. Действительно, фиктивный источник qлn, полученный отражением относительно плоскости x = +1 и находящийся справа от нее, в свою очередь отражается относительно плоскости x = -1, формируя фиктивный источник qn+1 = . И наоборот, фиктивный источник ч-, расположенный слева от левой плоскости x = -1, отражается относительно правой обкладки в фиктивный источник ч++1 = ч-. Дополним эти соотношения правилами преобразования координат фиктивных источников ц±,:

ч++1 = ч-, xn++l-1 = -(^-1),

qn-+l = , x;+l+1 = -(xn++1). (10)

Принимая во внимание «начальные условия» q+ = q-= q, x+ = x- = x0, получаем из (10) следующие простые формулы:

4, =±4п1 + x0, x2±n+1 =±(4п + 2)1 - x0, (11)

где п = 0,1,...., по которым можно вычислить координаты любого из мнимых источников.

Таким образом, используя раздельно суммирование по четным и нечетным индексам, можно записать следующее выражение для плотности вероятности:

fLAD ( x0,s,l) A

j(x;Xo,a,I) + X jl (x;x0,s,l) + Z (x;xo,S’l)

(12)

где А - нормировочный коэффициент, определяемый из условия

b

j flAD (Х XoSl ) dX = 1,

(13)

j(x;x0,s,l) = exp -(x-x0)2/2s

jl (x; Xo, s, l)=exp - (x - x2«+1)V2s (x;x^°,l)=exp -(x-x2n )V2s

здесь x±n+1, x±n вычисляются в соответствие с (11).

Соответственно, функция распределения вычисляется по формуле

x

FlAD ( x; l ) = j flAD (X ^, l) dX.

(14)

Отметим, что, формально, распределение (14), является трех параметрическим (оно зависит от следующих параметров: х0 - положение центра рассеяния, о - СКО при отсутствии ограничения, I - размаха области рассеяния). Однако, на самом деле, если принять во внимание, что I = Ь - а, где а,Ь - координаты, левой и правой границ области рассеяния, знание значений которых оказывается весьма важным в практических приложениях, распределение (14) следует отнести к классу 4-х параметрических распределений.

4. Усеченное нормальное распределение и его свойства

Усеченное нормальное распределение (УНР) традиционно используется в задачах оценки надежности технических систем [1] и точности производства [2]. Напомним, что УНР N'(т,о) имеет случайная

n=0

n=1

a

a

подпоследовательность {х'}, извлеченная из случайной

последовательности {х}, имеющей нормальное распределение N(т,о), каждый элемент которой удовлетворяет следующим условиям:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Хтп £ х 'к £ Хтах ,

где Хт^п, Хтах - точки усечения.

Основные характеристики УНР представлены в таблице

Таблица - Характеристики усеченного нормального распределения [2]

Название характеристики Формула или числовое значение характеристики

Обозначение N '(M,0, Ъ Xmin , Xmax )

Параметры M,0, Xmin , Xmax

Плотность распределения ■ jfX"mJ > t \ 1 і о J jN (a-,a2 ) = о F. ^ F і r_m _mJ. где j( x) - плотность стандартного нормального распределения ■ x -X2 N (0,1), F (x) = ,— I е 2 dX - функция Лапласа, ц,о - V2p-L параметры исходного нормального распределения, xmln < xmln - точки усечения

Функция распределения x FN ( x; M, ^ Xmin , Xmax ) = jV ( X ^ 0, Xmin , Xmax ) dX = a1 ^Л I jj—]dX = о F j Xmax -М) F і Xmin -Mj { і о J F і vJ - F (v) F |7 Xmax F |7 Xmln ~

Среднее значение м[ x]=m-(i2 -1) о, где 1= j(X) 1= j(X) Xm--M 1 F (X2)-F (X) ’ 1 F (X)-F (X) о ’ ~ x - m £ max T2 о

Дисперсия D[ x]=(- + 1X 12X2 +(1+12 ) )о2

Из таблицы видно, что усеченное нормальное распределение N' (т,о, #, а1, а2) также относится к классу четырех параметрических распределений.

5. Сравнение плотностей и функций распределения броуновского процесса с ограниченной областью рассеяния и усеченного нормального распределения

Из изложенного в предыдущих разделах понятно, что для случайных последовательностей, область значений которых из физических соображений является конечной, следует использовать, соответственно, модели (12) и (14). (Для нахождения их численного значения может быть, например, использован метод максимального правдоподобия, приводящий к поиску решения сложной системы нелинейных уравнений.)

Однако при нахождении параметров распределений (12) и (14) для реальных случайных последовательностей с неизбежностью приходится использовать не бесконечное, но некоторое конечное число мнимых источников, т.е. модели (12), (14), фактически, являются не четырех, а пяти параметрическими. Следовательно, с вычислительной точки зрения 4-х параметрическая модель усеченного нормального распределения является более предпочтительной. В этой связи представляется целесообразным сравнить плотности и функции распределения броуновского процесса с ограниченной областью рассеяния (количество источников N = 200) и усеченного нормального распределения, представленных на рис. 2-4.

Рис. 2а - Вверху: плотность распределения, описываемая моделью (12); в середине: плотность усеченного нормального распределения; внизу: разность плотностей распределения (параметры функций: хт;п = -10,

Хтах = 10, т = -9, 1 -о = 2;2-о = 7;3-о = 12;4-о = 17)

Рис. 2б - Вверху: распределение, описываемое моделью (14); в середине: усеченное нормальное распределение; внизу: разность распределений (параметры функций: лт, =-10, хтах = 10, т = -9,

1 -0 = 2;2 -о = 7;3 -о = 12;4-о = 17)

Рис. 3 а - Вверху: плотность распределения, описываемая моделью (12); в середине: плотность усеченного нормального распределения; внизу: разность плотностей распределения (параметры функций: хт;п = -10,

*тах = 10, т = -3, 1 -о = 2;2-о = 7;3-о = 12;4-о = 17)

Рис. 3б - Вверху: распределение, описываемое моделью (14); в середине: усеченное нормальное распределение; внизу: разность распределений (параметры функций: хтП = -10, хтах = 10, т = -3,

1 - о = 2;2 - о = 7;3 -о = 12;4-о = 17)

Рис. 4а - Вверху: плотность распределения, описываемая моделью (12); в середине: плотность усеченного нормального распределения; внизу: разность плотностей распределения (параметры функций: х^п =-10, хтах = 10, т = 0, 1 -а = 2;2-а = 7;3-а = 12;4-а = 17)

Рис. 4б - Вверху: распределение, описываемое моделью (13); в середине: усеченное нормальное распределение; внизу: разность распределений (параметры функций: хтЬ = -10, хтах = 10, т = 0,

1 -а = 2;2-а = 7;3 -а = 12;4-а = 17)

Из рис. 2-4 видно, что наименьшие отличия между функциями оказываются при расположении точечного источника в точке х = 0, соответственно, т = 0. При этом увеличение значения а приводит к увеличению данных отличий, максимальные значения которых могут достигать 1,8% и 4.8% для плотности распределения и функции распределения, соответственно. Смещение положения источника от центра области рассеяния приводит к увеличению отличий между анализируемыми зависимостями: максимальные значения разностей между

плотностью распределения и функцией распределения для случая а = 2, т = -9 составляют 10% и 9.8%, соответственно; для случая а = 2,т = -3 - 3% и 7.5%, соответственно. Таким образом, в связи с тем, что при анализе случайной последовательности, у которой априори неизвестны положение источника и параметр а , использование

усеченного нормального закона может приводить к возникновению значимых погрешностей при оценке плотностей и функций распределения.

6. Заключение

Проведенное сравнение двух возможных подходов к построению математических моделей плотностей распределений и функций распределений ограниченных случайных последовательностей позволяет сделать вывод о том, что использование модели броуновского движения в ограниченной области для величин, область значений которых ограничена с физикой точки зрения, является более обоснованным, чем ограниченное нормальное распределение.

В тоже время размерность пространства параметров модели броуновского движения в ограниченной области оказывается на единицу больше, чем аналогичная величина ограниченного нормального распределения. Данное обстоятельство увеличивает вычислительную сложность нахождения параметров распределения реальных последовательностей и определяет целесообразность исследования возможности использования в рассматриваемой задаче современных алгоритмов поиска экстремумов функций многих переменных, например, генетических алгоритмов [8].

Следует также отметить, что представляет самостоятельный интерес математическое моделирование движения броуновской частицы в ограниченной области, а также анализ возможности использования для

описания функций распределения и плотностей распределения аппроксимации Парзена-Розенблатта [9-10].

Список литературы

1. Матвиевский В.Р. Надежность технических систем [Текст]: учебное пособие/ В.Р. Матвиевский// —М: Московский государственный институт электроники и математики, 2002. 113 с.

2. Бородачев Н.А. Точность производства в машиностроении и приборостроении [Текст]/ Н.А. Бородачев, Р.М. Абрашитов, И.М. Веселова// М.: Машиностроение, 1973. —567 с.

3. Эйнштейн А., Смолуховский М. Броуновское движение [Текст]: сб. статей. -Ленинград: ОНТИ - Главная редакция общетехнической литературы, 1936. -606 с.

4. Поршнев С.В. Теория и алгоритмы аппроксимации эмпирических зависимостей и распределений [Текст]/ С.В. Поршнев, Е.В. Овечкина, В.Е. Каплан// -Екатеринбург: УрО РАН, 2006. -166 с.

5. Эйнштейн А. О движении взвешенных в покоящейся жидкости частиц, требуемом молекулярно-кинетической теории теплоты [Текст]// -Ленинград: ОНТИ - Главная редакция общетехнической литературы, 1936. -С. 13-25.

6. Гнеденко Б.В. Курс теории вероятностей. -М.: Физматгиз, 1988. -407 с.

7. Тобочник Я., Гулд Х. Компьютерное моделирование в физике. Ч. 2. -М.: Мир, 1990. -399 С.

8. Гладков Л. А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы [Текст]/Л.А. Гладков, В.В. Курейчик, В.М. Курейчик//-М.: Физматлит, 2004. -407 с.

9. Parzen, E. (1962). On estimation of a probability density function and mode. Annals of Mathematical Statistics 33, 1065-1076.

10. Rosenblatt, M. (1956). Remarks on some nonparametric estimates of a density function. Annals of Mathematical Statistics 27, 832-837.

i Надоели баннеры? Вы всегда можете отключить рекламу.