УДК 519.214
Предельные теоремы для числа плотных серий с заданными параметрами в выходной последовательности генератора Пола
© Н.М. Меженная
МГТУ им. Н.Э. Баумана, Москва, 105005, Россия
Работа посвящена изучению случайных величин, связанных с плотными сериями в выходной последовательности генератора Пола. С помощью метода Чена — Стейна получены оценки расстояния по вариации между распределением числа плотных серий заданных длины и веса в выходной последовательности генератора Пола с двумя регистрами и сопровождающим пуассоновским распределением. На основании этих оценок выведены предельные теоремы Пуассона для указанных случайных величин и, как следствие, центральная предельная теорема (в смысле сближения с распределением Пуассона с растущим параметром).
Ключевые слова: плотные серии, генератор Пола, метод Чена — Стейна, предельная теорема Пуассона, центральная предельная теорема, расстояние по вариации.
Введение. В настоящей работе рассмотрен генератор Пола, или мультициклический генератор [1], с двумя регистрами взаимно простых длин т и п над кольцом вычетов по модулю М (М ^ 2). Пусть (Х0, ..., Хт-1) и (У0, ..., Yn-i) — случайные заполнения регистров длин т и п соответственно, состоящие из независимых равномерно распределенных на множестве {0,1, ..., М — 1} случайных величин. Тогда выходная последовательность генератора Пола образуется в соответствии с правилом
Zt = xt mod т + Yt mod n mod M, t = 0, 1, 2,... (1)
Последовательность, полученная согласно формуле (1), имеет гарантированный период длины т.п. Основные свойства выходной последовательности генератора Пола описаны в работе [1].
Многие статистические процедуры проверки свойств случайных последовательностей основаны на свойствах серий. В докладе [2] приведена предельная теорема Пуассона для числа цепочек без самоналожения (и, как следствие, для обычных серий) в выходной последовательности генератора Пола.
Настоящая работа посвящена изучению свойств числа плотных серий в выходной последовательности такого генератора.
Предельные теоремы. Напомним, что отрезок последовательности {х\, ..., Хк} образует плотную а-цепочку, если а Е {%i,%i+i},
г = 1, ..., к — 1. Плотная а-цепочка называется плотной а-серией, если ее нельзя продлить в обе стороны с сохранением этого свойства (место появления первого знака а будем называть ее началом). Длина плотной а-серии — число знаков в отрезке последовательности, содержащем все ее знаки а, а вес плотной а-серии — число входящих в нее знаков а. Свойства плотных серий в последовательности независимых случайных величин рассмотрены в работах [3, 4].
Пусть — число плотных а-серий длины в и веса т в выходной последовательности генератора Пола (1), которые начались до момента Т ^ тп. Будем считать, что выполнено естественное требование т ^ 1, т ^ 5 ^ 2'ш — 1. Если ^ + 4 < шах{т, п}, то среднее число плотных серий веса 5 и длины т
= Е^ = Т ^ — , ра,„ = СЖ ^ — ¿У™ (2)
Эта формула получена в работе [4]. Требование 5 + 4 < шах{т,п} означает, что плотная а-серия в выходной последовательности Zt образована независимыми равномерно распределенными случайными величинами из заполнений регистров (Х0, ..., Хт_^ и (У0, ..., Уп-1).
Обозначим через р(и,У) расстояние по вариации между распределениями случайных величин и и V. Для случайных величин, распределенных на множестве неотрицательных целых чисел,
те
г(и,У ) = 1Е 1р{^ = к} — р{у = к}1.
к=0
Теорема 1. Пусть т,п ^ 1, Т ^ тп, т ^ 1, т ^ 5 ^ 2'ш — 1, а случайные величины Х0,..., Хт_ 1,У0,..., Уп-1 независимы и равномерно распределены на множестве Ам = {0,1, ..., М — 1}. Тогда
, ) ^ 2(т + п)(2в + 7)р.%ш,
где жз, т — случайная величина, распределенная в соответствии с законом Пуассона с параметром 1.
Следствие 1. Пусть случайные величины Х0, ..., Хт_ ]_,У0, ..., Уп-1 независимы и равномерно распределены на множестве Ам, т,п,1и ^ то, Т ^ тп, так что
. . 1п т 1п п
К ш ^ 1 е (0, то) и--1---> 0.
п т
Тогда закон распределения случайной величины ™ сходится к закону Пуассона распределения случайной величины с параметром 1.
Следствие 2. Пусть случайные величины Х0, ..., Хт_ 1,У0, ..., Уп-1 независимы и равномерно распределены на множестве Ам, т,п,т ^ то,
Т ^ тп, так что
К3 ш —У ж и 3--1--— 0.
\ п т )
Тогда закон распределения случайной величины —
сходится к стандартному нормальному закону распределения.
Обозначим
2ад—1 "ад ^ ^ "в, т
число плотных а-серий веса т в выходной последовательности генератора Пола (1), которые начались до момента Т ^ тп.
Из выражения (2) следует, что среднее число плотных а-серий веса т (и любой длины)
К = = У^ К,™ = Т У] I 1 — —
2'ш— 1 2ш— 1 1 / 1 \
Е"ш = ^ = СI— —I 1 — — )
(' — ¿)
1 \4 1 ( 1х 1
= 41 — м)^, = 2 —-
Последняя формула получена в работе [3].
Теорема 2. Пусть т,п ^ 1, Т ^ тп, т ^ 1, а случайные величины Х0, ..., Хт_ 1, ..., Уп_ 1 независимы и равномерно распределены на множестве Ам. Тогда
р("ш, ) ^ 2(т + п)(4ы + Ъ)ргш,
где — случайная величина, распределенная в соответствии с законом Пуассона с параметром .
Следствие 3. Пусть случайные величины Х0, ..., Хт_ 1,У0, ..., Уп_ 1 независимы и равномерно распределены на множестве Ам, т,п,1и — ж, Т ^ тп, так что
. . 1п т 1пп
— 1 е (0, ж) и--1---> 0.
п т
Тогда закон распределения случайной величины сходится к закону Пуассона распределения случайной величины с параметром Л.
Замечание 1. В условиях следствия 1 и 3 вес т = 0(1пТ). Следствие 4. Пусть случайные величины Х0, ..., Хт_ 1,УЪ, ..., 1 независимы и равномерно распределены на множестве Ам, т,п,т — ж, Т ^ тп, так что
I , \ „
— ж и W--1--— 0.
\ п т )
Тогда закон распределения случайной величины (С™ — )сходится к стандартному нормальному закону распределения.
Замечание 2. Можно показать, что условия следствия 4 выполнены, если Т = тп, т > п, п —> оо,
w =
ln тп — ln ln тп
ln Р
-1
^ 1 / 1 \ ln т lnln т р = тт 2--,--> 0.
м v мГ п
Доказательство теоремы 1. Отметим, что распределение последовательности
Zt = а — Xt mod m + Yt mod n mod M, t = 0,1, 2,..., (3)
совпадает с распределением последовательности (1), так как в условиях теоремы распределения наборов
(Хо, ..., Xm-1) и (а — Xo, ..., а — Xm-1)
совпадают. Знак минус означает вычитание по модулю M. Формула (3) удобнее тем, что
{^t {^t mod m Yt mod n}.
Пусть W— событие, состоящее в том, что в момент t в последовательности Z0,Z1, ... началась плотная а-серия длины s и веса w, i = t mod m, j = t mod n (такая серия начинается со знаков Xi и Yj). Обозначим UT = {(t mod m, t mod n): t = 0,1,... ,T — 1}, при
(i, j) £Ut
Uitj = U и U, U = №', f) eUT : | i' — il ^ s + 3}, U = /) eUT: \j' —H ^ S + 3}.
Тогда
< U + lUl = (2(s + 3) + l)(rn + n). (4)
Согласно методу Чена — Стейна [5],
1 _ g —
p(Zs,w, ps,w) ^ -(Si + S2), (5)
^s, w
где
Si = ^ £ p{w::w}p{ws'W,},
(i, j)euT (i', j')eUi,
S2 = £ £ P{wis,iwwis,w}. (6)
(i, j)euT (i', j')eUij
Оценим сумму й1. В условиях теоремы 1
4
} = } = (1 — Ра>т < р.
поэтому из (4) имеем
й = Е Е }р{щу} <
(г, иТ (г', Г
< Е — ^ (1 — (2з + 7)(т + п)р2,ш =
(г, ])еит V / V /
= (2з + 7) (т + п)р.%т. (7)
Теперь оценим сумму й2 с использованием следующей леммы.
Лемма 1. Если (г',/) е \ {(г,])}, то
( 1 V / 1 / 1 у-ад+242
„2 /1___ I = I Г™-™ 1___ 1
V м) м)
РЩТТУЖ}^р2,41 — ±)=(с'т:1 — -¿Г^). (8)
С помощью формулы (8) оценим правую часть выражения (6):
1 V
52 = Е Е }< Е 1 — <
(г, ])еит (г',(г, ])&т 1 ^
^ — м)Т (23 + 7) (т + п)р2^ = ^ (23 + 7) (т + п)р*,п. (9)
Подставляя (7) и (9) в формулу (5), получаем
1 _
р("з,ш, ) ^ 2—--,ш (2з + 7) (т + п)р3,ш <
Ля
^Я, 'Ш
■>8, ад •
< 2(2 з + 7) (т + п)р3
Теорема 1 доказана. □
Доказательство теоремы 2. Доказательство теоремы 2 проведем аналогично доказательству теоремы 1. Так как при весе т максимальная длина серии з = 2т — 1, окрестности определяются формулами
иг,3 = иг и и3,
иг = №',/) е иТ : |г' — г\ ^ 2^ + 2},
из = {(г',/) еит : \/ — Ц ^ 2^ + 2}.
Из формулы (4) получаем
Щ, з\ < \Щ + \из \ = (2(2ш + 2) + 1)(т + п) = (^ + 5) (т + п).
Далее все рассуждения полностью повторяют рассуждения при доказательстве теоремы 1, в которых окрестности Ui,j заменены на Ui, j, а вероятности ps,w на pw. Имеем
,4
Е I ^>w( 1
Si < >: 1иг,шi — ) ^
(i, з)^ит
1
М
,4
^ - -M^j Т (4w + 5) (т + n)p2w = 1w (4w + 5) (т + п)рь
S2 < Е I(Ui,jIp2w( 1 - ■—) < 1w (4w + 5) (т + n)Pw,
М
значит, расстояние по вариации , ) ^ (4ш + 5) (т + п)рт.
Теорема 2 доказана. □
Доказательство леммы 1. Отметим, если 1 ^ |г- г= Ц -^ 5 , то } = 0. Например, при 1 ^ 1-1' = ] - ]' ^ в одна
из серий начинается со знаков Х- и Yj и Х--2 = 1--2, Х—1 = У--1, но знаки Х--2, У--2, Х—1, У--1 образуют плотную серию совпадений знаков, начинающихся со знаков Ху и У у.
Пусть — событие, состоящее в том, что в момент Ь в последовательности Z0, Z1, ... началась плотная а-цепочка длины э и веса ш. Очевидно, что
р{^т} {ж-:;™ }( 1 - ^ )2,
р^ж^} ^ }( 1 -
Если 5 + 1 ^ |г - г'| = Ц - ^ 5 + 3, то
(10)
P\w:fws:w} ^ } (1 - ММ) ^
< рmw}pmw } ( 1 - -1
-1
М
Таким образом, формула (8) для случая 1 ^ |г- г= Ц -^ 5 + 3 доказана. Далее будем считать, что |г - г= Ц -
Зафиксируем конфигурации С1 и С2 совпадающих и несовпадающих знаков отдельно на отрезках (Х-,..., Х-+8-1) и ^,..., -1) и на отрезках (Х^ ,...,Х#+8-1) и (У^,... 8-1) соответственно. Предположим, что обе конфигурации совпадений могут осуществиться вместе (в противном случае вероятность их совместного появления равна 0 и лемма доказана). Число таких различных конфигураций для
каждой пары отрезков равно С^—. Поэтому общее число конфигураций совпадений С = С1 П С2, которые могут осуществиться вместе, не превосходит ( С'^—) .
Обозначим через Щ™С1 и Щ^>,С2 события и Щ'™, при фиксированных конфигурациях С1 и С2. Тогда
Щ,г = ищ^, Щ^ = и^;;,с2. (Ц)
Сх С2
Рассмотрим граф Г = ( С,У), в котором множество вершин С = /и 3, I = {%, ..., ъ + з — 1} и {%', ..., г' + з — 1}, 3 = {], ...,] + з — 1}и{/, ..., / + з — 1}.
Множество ребер построим следующим образом. Пусть и,у е С. Если при конфигурации совпадений С знаки Хи и Хь связаны отношением равенства или неравенства, то вершины и и будут связаны ребром первого или второго типа соответственно. При таком построении каждой вершине инцидентны не более двух ребер. Таким образом, множество ребер Е имеет вид
Е = {(г+к, э+к), к = 0,1,..., з— 1}и{(г'+к,/+к), к = 0,1,..., з—1}.
Ребрам первого типа припишем метку р = {Х1 = У1} = 1/М, а ребрам второго типа — метку 1 — р =1 — 1/М.
Приведем следующие важные для нас свойства графа Г:
1) граф Г является двудольным с долями I и 3;
2) каждой вершине инциденты не более двух ребер;
3) граф Г не имеет циклов и параллельных ребер;
4) граф Г состоит из одной или нескольких цепей ребер.
Из этих свойств графа Г и независимости всех случайных величин {Х0, ..., Хт_ 1} и \у0,...,Уп_ 1} следует, что вероятность } равна произведению меток всех ребер графа Г, поэтому
} = р2т (1 — 'р)2(3 ~т). (12)
Из выражений (10)-(12) следует формула (8).
Лемма 1 доказана. □
Заключение. С помощью известного метода Чена — Стейна установлена скорость сближения распределения числа плотных серий заданных длины и веса в выходной последовательности генератора Пола с двумя регистрами с их сопровождающими пуассоновскими распределениями. Это позволяет получить пуассоновскую и нормальную предельные теоремы для указанных случайных величин при определенном изменении параметров схемы и указать скорость сходимости в них. Эти результаты дополняют полученные ранее в работах [2-4].
Автор выражает признательность ведущему научному сотруднику Математического института им. В. А. Стеклова РАН В. Г. Михайлову за идею доказательства леммы 1 и ряд полезных замечаний.
Работа выполнена при финансовой поддержке Российского фонда фундаментальных исследований (проект 11-01-00139-а).
ЛИТЕРАТУРА
[1] Pohl P. Description of MCV, a Pseudo-random Number Generator. Scand. Actuarial J., 1976, no. 1, pp. 1-14.
[2] Меженная Н.М., Михайлов В.Г. Вероятностные свойства выходной последовательности генератора Пола. Семинар отдела дискретной математики МИАН. URL: http://www.mathnet.ru/php/seminars.phtml ?option_lang=rus&presentid=6239 (дата обращения 10.05.2013).
[3] Меженная Н.М. Предельные теоремы для числа плотных серий в случайной последовательности. Дискретная математика, 2009, т. 21, вып. 1, с. 105-116.
[4] Меженная Н.М. Предельная теорема Пуассона для числа плотных серий заданной длины и веса. Вестник МГТУ им. Н.Э. Баумана. Сер. Естественные науки, 2011, спец. вып. Прикладная математика, с. 75-82.
[5] Barbour A.D., Holst L., Janson S. Poisson Approximation. Oxford, Oxford University Press, 1992, 277 p.
Статья поступила в редакцию 15.05.2013
Ссылку на эту статью просим оформлять следующим образом:
Меженная Н.М. Предельные теоремы для числа плотных серий с заданными параметрами в выходной последовательности генератора Пола. Инженерный журнал: наука и инновации, 2013, вып. 4. URL: http://engjournal.ru/catalog/fundamentals/math/661.html
Меженная Наталья Михайловна — канд. физ.-мат. наук, доц. кафедры «Прикладная математика» МГТУ им. Н. Э. Баумана. e-mail: [email protected]