ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
УДК 519.214.5
doi: 10.18101/2304-5728-2017-3-78-88
О РАСПРЕДЕЛЕНИИ ЧИСЕЛ ПАР И ТРОЕК ОДИНАКОВЫХ
ЗНАКОВ НА ЦИКЛЕ ДВОИЧНОЙ МУЛЬТИЦИКЛИЧЕСКОЙ
ПОСЛЕДОВАТЕЛЬНОСТИ
© Меженная Наталья Михайловна
кандидат физико-математических наук, доцент,
Московский государственный технический университет им. Н. Э. Баумана
Россия, 105005, г. Москва, ул. 2-я Бауманская, 5, стр. 1
E-mail: [email protected]
В работе рассмотрено предельное распределение чисел пар и троек одинаковых знаков на цикле двоичной мультициклической случайной последовательности с г регистрами, заполненными независимыми в совокупности двоичными случайными величинами с равномерными распределениями, в двух случаях: 1) когда число регистров г остается фиксированным, а их длины стремятся к бесконечности; 2) когда г также стремится к бесконечности. В первом случае с помощью неравенства Берри — Эссеена получены равномерные оценки скорости сходимости.
Ключевые слова: мультициклическая последовательность; нормальная предельная теорема; число пар одинаковых знаков; число троек одинаковых знаков; неравенство Берри — Эссеена.
Введение
Пусть Х; = (А','/"..... А'.;",) — независимые между собой наборы по я( случайных величин, j = 1,...,г. Мультициклический генератор (см. [1]) вырабатывает псевдослучайную последовательность по правилу
( г \
Z =
Е*™ mod2, t = 0,1,.... (1)
Величину Т = п1...пг принято называть длиной цикла (1).
Мультициклический генератор позволяет получить псевдослучайную последовательность с гарантированно длинным периодом Т при наличии достаточно большого числа регистров с нетождественными заполнениями. С появлением программных средств генерации псевдослучайных чисел интерес к нему существенно снизился. Но недавно выяснилось, что удается эффективно использовать современные методы теории вероятностей для исследования статистических свойств на всем цикле выходной последовательности мультициклического генератора. Это свойство выгодно отличает его от большинства других генераторов и обусловлено его специфической структурой. Свойства двоичной мультициклической слу-
чайной последовательности изучались в работах [2], [3], [4]. В [2] получено распределение числа единиц Ъ>г на цикле мультициклической последовательности вида (1) при независимых в совокупности и равномерно распределенных знаках в регистрах. Получены условия сходимости распределения Ъ>г к распределению произведения независимых стандартных нормальных случайных величин, когда число регистров г фиксировано, а их длины п1,...,пг —»со. Также получены условия сходимости распределения Ъ>г к логнормальному закону, когда г—>оо и я,..... пг —> х. В обоих случаях найдены оценки скорости сходимости. В работах [3] и [4] проведено исследование устойчивости предельных распределений, полученных в [2], при нарушении предположений о распределении знаков в регистрах генератора: в [3] рассмотрено распределение знаков, отличное от равномерного, а в [4] — зависимые заполнения внутри регистров.
Пусть
ти= X = (2)
0</1</2< (к<Т-\
число наборов по к > 2 одинаковых знаков на цикле мультициклической последовательности вида (1).
Задача о распределении г\к связана с задачей повторениях знаков или цепочек в последовательности независимых испытаний (см. [5], [6], [7]). В частности, в [5] получена пуассоновская аппроксимация числа пар совпавших цепочек в последовательности независимых случайных величин с полиномиальным распределением, а в [6] — обобщение этих результатов для кратных совпадений цепочек. В [7] изучено также число серий кратных повторений и момента первого появления кратного повторения цепочек. Свойства аналогичных статистик в цепи Маркова изучены в работах [8], [9], [10].
Предельное распределение числа пар и троек одинаковых знаков
Свойства распределений случайных величин \\к могут быть получены
из описанных выше результатов работы [2]. Если обозначить через с,,. — число единиц в 20,..., 2Тл, то из (2)
%= I Щч=2ч=... = 2ч= 1} +
0<>1<12<^<7,-1
+ X = = (3)
0<\<12<(к<Т
Сформулируем следующие условия:
А) число регистров г >2, длины регистров /?,..... /? нечетны и взаимно просты;
Б) X, = (Х|;"... ..Х^", )./ = 1...../'. — независимые между собой случайные векторы длин nj, образованные независимыми (в совокупности) двоичными случайными величинами с равномерным распределением, т. е.
Р{Х^=1} = 1-Р{Х^=0}Л, к = 0,...,и -1, 7=1,..„г.
2
Заметим, что при выполнении условия Б распределения случайных величин и Т - 2,, . а значит и С* и С '.'' , , совпадают. Двумерный закон
распределения С* и С'.'' , сосредоточен на линии
{(Х,7):Х = С\7 = С^И,Й = 0,1,...,Г-1}.
Утверждение 1. Пусть выполнены условия А и Б. Тогда
Щк=2-к+1СкТ,к = 2,Ъ, (4)
( г \
ТЦ (3пз - 2) + (8Г - 6Т2 + Тъ - 4)
V м
Еп4= —
4 192
(5)
1
(г Л if Т7^
Dri2 = —Т 2 16
Drl3=i(r-2)2Drl2=-^r(r-2)2
3 т
<—, (6) 16
<—. (7) 64
[ (3rij -2)-Т
(г rji4
Ц(Зп,-2)-Т
Kj=1
Замечание 1. Формулу для дисперсии гц не приводим ввиду ее громоздкости, однако ее несложно получить через центральные моменты биномиального закона.
Замечание 2. Из формул (4) и (5) видно, что свойства случайных величин г|2,г|з принципиально отличаются от свойств случайных величин г|4,г|5,... Например, средние значения Ц2,Ц3 зависят только от длины цикла Т, а Егц уже зависит от длин отдельных регистров.
Обозначим через d(F, G) — расстояние в равномерной метрике между функциями распределения F и G на действительной прямой К :
d (F, G) = sup I F{x) - G(x) |.
xeR
Определим случайные величины r\2 =T~l(Ar\2 -T2 + 2T) и 2ц T - 4
ru =-5---, а также введем обозначения Ф„ для функции рас-
3 Г(Г-2) 12
пределения произведения г независимых стандартных нормальных случайных величин, Ч^ для функции распределения произведения г независимых случайных величин, распределенных по закону ( 1 ). Для краткости будем писать Ф1 = Ф, Tj = Т.
Замечание 3. Случайные величины ц2 и г|3 равны между собой. Это будет видно из доказательства утверждения 2.
Утверждение 2. Пусть выполнены условия А и Б. Тогда при к = 2,3
с!(Б~1,Ч>г)<2СВЕ±п;т. (8)
1=1
Здесь СВЕ < 0,48 — константа из неравенства Берри — Эссеена для распределения суммы независимых одинаково распределенных случайных величин {см. [11]).
Замечание 4. Из формулы (8) следует, что если число г > 2 фиксировано, а ,.. ,,пг —» оо, то ^ (х) (х) при всех хеМ.
Замечание 5. Плотность для функции распределения Ч^ (х) получена в работе [12] (формула (33)) и имеет вид
где Сса1 — С-функция Мейера (см., например, [13], раздел 5.3, с. 203).
Замечание 6. Утверждение 2 можно переформулировать следующим образом: формула (8) эквивалентна тому, что при к = 2,3
с1(БЬ1-1,Бг)<2СВЕ±п:т, (9)
1=1
где Бг — это функция распределения суммы г независимых случайных
величин, имеющих плотность распределения /(х) = —}=ех'2е~е 12, хеМ.
л/2тг
Действительно, пусть <; имеет распределение (1). Тогда плотность распределения 1п<; равна
^]2жу
1 х/2 -еж/2
е е
л/2тт
Отсюда получаем (9).
Замечание 7. Функция распределения Бг может быть представлена как функция распределения суммы вида 2(| | +...+1 уг |) , в которой случайные величины независимы и одинаково распределены по стандартному нормальному закону. Такой функции распределения соответствует характеристическая функция вида
1
(2кУ
Г ^ /2!^
(10)
где через Erf(z) обозначена стандартная функция ошибок:
2 Г _ 2
lirfiz) = I е dy. Как нетрудно убедиться, характеристическая функ-
V7I о
1
* ( (и W
\
It
. Отсюда сра-
ция одного слагаемого I V I равна-—е 2
' (2%)
зу получаем характеристическую функцию (10).
Теперь перейдем к случаю, когда число регистров г также стремится к бесконечности. Здесь мы применим тот же подход, что и при доказательстве теоремы 4 работы [2]. Введем обозначения
[?"+00 1 а = . — 11пхе-х2/Ух = —(у+ 1п2) « -0,635,
' л о ^
с2 = | (1п х - а)2 '2dx = у « 1,234
(у «0.577 — константа Эйлера). Параметры а и с2 — это математическое ожидание и дисперсия логарифма модуля стандартной нормальной случайной величины.
Рассмотрим центрированную и нормированную случайную величину в = 1пЩ)Ь213
2 сл/г
Утверждение 3. Пусть г,п1,...,пг —>сю, выполнены условия А и Б. Тогда при всех хеМ
ад-хвд. (п)
Замечание 8. Если г,п1,...,пг —»со, выполнены условия А и Б и
1 г\пп
—¡=2.-—» 0, то Е1п г\2 =аг + о(г ). Значит, распределение случайной
л/г м п}
(, 1пг|2 — 2 га
величины & совпадает с распределением 9' =-=—— и (11) можно
2 сл/г
переписать в виде —> Ф(х).
Замечание 9. В силу связи нормального и логарифмически нормального законов, (11) эквивалентна тому, что при к = 2,3 и всех у > 0
\2п о
(в правой части стоит функция распределения логарифмически нормального закона с параметрами 0 и 1).
Доказательства утверждений
Доказательство утверждения 1. В работе [2] (формулы (4) и (5)) показано, что
Т Т ( Т 1 1 г
^-г Щ'-2)
(12)
}=1
Для вычисления математических ожиданий г\к, к = 2,3,4, преобразуем формулу (3):
Пз = <&г - Шг -2) + (Т-£» )(т - Ъ - Ш - Ьг - 2)) =
= 1(Г-2)
_т]2
2 ) + 12 3
(14)
= (%г - Шг - Шг -3) + (Т -%г){Т -%г- 1)(Г -%г- 2){Т-%г- 3)) =
12 ^ 2) 24{ 2. Следовательно, из (12) - (15) получаем, что
Т(Т - 2){Т - 4){Т - 6) 192
• (15)
Т 2 Т Т Т2 т Т,Т_Ъ
ЪЧ2=ЩГ+ —-- = - + —~-= , ■
1
т 2 т
Щъ=-{Т-2) Щг+--- = —(Т - 2)
12 3)2
2 4
1
ч4+Т2_Зу
Т(Т - 1)(Г - 2) 24
Е„, = ии - ^ Т (22 - 18Г + ЗГ') + Г(Г - 2)(Г - 4)(Г - 6)
12 Г 2) 24 ' 192
^-ГП(3„ - 2) + ^-Г(22 -!8Г + ЗГ') + Г(Г - 2)(Г - 4)(Г -
192 3 96 у > 192
= —7ТТ (3п - 2) +—(8Г - 6Т2 +Т3 -4).
.7=1
Таким образом, формулы (4) и (5) доказаны. Аналогично, можно вычислить дисперсии г|2 и г|3 (см. (6) и (7))
БГ|2 = Е
ГТ1 /тт2 ГТ1 ГТ1 2 ГТ1 ^
+-—=Е
2)4 2 4
(
? л2
р .1) -Г
^г2) 4
V 4 у /
1б"
г У т
2) 2
Т2 1
16
м
8 16 16
и=1
зт2 16
г.
Бг1з =Е
— (Г - 2) 2
^г~2
Т(Т - 1)(Г - 2) 24
V
1
(
= — (Т - 2)2Е 4
_Т)2 Т2 Т Т(Т-\)Л 2) + 12 3 12
V 4
(
= —(Г-2)2Е 4
9 \2 р -Л -I
2 4
Vх у /
= ±(Г- 2)2Вц2.
Утверждение 1 доказано.
Доказательство утверждения 2. В теореме 2 работы [2] было показано, что при выполнении условий А и Б расстояние в равномерной метрике между функцией распределения ^ случайной величины
\г = Т 1 :(2с(. -Т) и функцией распределения Ф( оценивается сверху выражением
-1/2
(16)
Из формулы (16) следует, что если число г >2 фиксировано, а г\,..,,пг —»оо, то ^ (х) Фг(х) при всех хе1.
Далее воспользуемся этим результатом и формулами (13) и (14), из которых следует, что
1
Т Т
Ц2=-¥ГТ + ----,
2 4 г 4 2
1
(
Т2 Т
г|, = —(Т - 2) 11Т +---
13 2 7 12 3
\ у
Значит, случайные величины г|2 и г|3 равны между собой и имеют такой же закон распределения, как и . Так как при х > О (х) = /•; (4~х) - /■; (-лЯ) = 2/-; (^ -1,
4>г (х) = ФГ (7^) - ФГ (-^/х) = 2ФГ -1 (в силу симметричности распределений случайной величины \г и стандартного нормального), то
¿(К2,^)<8 ир
К2(х)-Ч>Дх)
= вир
х>0
2К (л/х) - 2Фг (л/х)
<2ад,Фг)<2СжХ
«71/2.
¿=1
-2
Так как распределения пар случайных величин \г и rj2. и rj3 совпадают, то из последней оценки получаем (8). Утверждение 2 доказано.
Доказательство утверждения 3. Заметим, что
э = Infi, -Elnfu = 2In | \r | -2Eln | j | = In | j | -Ein | f r |
V4Dlnlll VDlnlll
Обозначим 5. —число единиц в у'-м регистре, 7 = 1,...,г. Из леммы 1 работы [2] имеем
g2 _ (пх - 2Ц)2.. ,(пг - 2Sr f _ ^ (и, - 2Sj)2 (i8)
т У "
Тогда
Ь||г|=Ь?1+... + Ь?г5 (19)
где = n-m | -2Sj |, / = 1...../'. Центрируя и нормируя обе части формулы (19), получаем, что
ln|i|-Eln|j| f^j-^j (20)
^^ I г
VDlnii
.>
2Х
V ¿=1
Так как случайная величина 5 распределена по биномиальному закону с параметрами п и 1 / 2, то моменты случайных величин $ определяются формулами
Е1пЧ,=—У С' 1п*
^ л», ¿—I /
л
21 - rij
2
1=0
V v J /
£ = 1,2,
Если числа nj нечетны, то величины Е1пА<^ конечны при всех Кро-
ме того, из сходимости распределения случайной величины п-т (2Л'; - ) к стандартному нормальному закону при п. —» оо следует,
-А _ _________ .. I2 Г 1„* „„-*2/2.
что Ein q . сходится к J— | In хс? dx, который конечен. Значит,
Е1па<^ равномерно ограничены по /. То же самое относится и к центральным моментам. В частности, Од сходится к ст2 равномерно по /. Значит,
01п | |=гст2(1 + о(1)). (21)
К распределению суммы (20) можно применить неравенство Берри-Эссеена для суммы независимых неодинаково распределенных слагаемых, которое будет иметь вид (см. [14])
Из формул (17), (21) и (22) получаем, что при г —>со имеет место утверждение 3. Утверждение 3 доказано.
Согласно неравенству (8) для аппроксимации функции распределения случайной величины г|2 функцией распределения Ч^ с точностью до 0,05 необходимо, чтобы длины регистров удовлетворяли условию А и имели значения порядка 1000 (Напомним, что г|2 =т|3). Нами был проведено вычисление точного распределения случайной величины г|2. Результаты опытов показали, что фактически данная точность аппроксимации имеет место, когда длины регистров на порядок меньше.
Рассмотрим случай г = 2. Начнем с небольших длин регистров: у\= 19, «2 = 27. В этом случае оказывается, что 0,159 < ¿/(^ ,Т2) < 0,160. Установлено, что наибольшие отклонения
и имеют место для значений случайной величины г\2, близких к 0. Для остальных значений качество аппроксимации уже является удовлетворительным .
Дальнейшее численное моделирование показало, что точность аппроксимации примерно в 0,05 достигается для длин регистров порядка 100. Здесь мы не будем приводить все значения найденных отклонений, а рассмотрим только небольшой иллюстрирующий пример. При г\ =49,«2 =55 и при г\ =101,«2 =113 величины расстояния в равномерной метрике оказались равными 0,0983 < ¿/(^ ,Ч^2) < 0,0984 и 0,0604 < 0,0604 соответственно.
Отметим также, что вычисление точного распределения случайной величины г|2 при длинах регистров порядка нескольких сотен не представляет собой значительную вычислительную трудность в силу формулы (18). Однако для больших длин регистров вычисления становятся затруднительными. В то же время становится возможным использование функции распределения ЧЛ .
Теперь обратимся к случаю, когда число регистров велико. Ограничимся одним примером. Пусть г = 5 и г\ = 21, «2 = 23,«з = 25,и4 = 29,и5 = 31. В этом случае оказывается, что
(22)
О точности аппроксимации в утверждениях 2 и 3
0,0870 < 0,0871,, и точность аппроксимации является удовле-
творительной.
Заключение
В работе изучены свойства распределения числа пар и троек одинаковых знаков в равновероятной мультициклической случайной последовательности, порожденной г > 2 регистрами взаимно простых длин п1,...,пг. Получены предельные распределения указанных случайных величин в двух случаях: при фиксированном г и ni,...,nr —> со и при г —> со и нечетных ni,...,nr —>сс. В первом случае получена оценка скорости сходимости к предельному распределению в равномерной метрике. Полученные асимптотические распределения существенно отличаются от распределений аналогичных статистик, построенных по последовательности независимых случайных величин.
Литература
1. Pohl P. Description of MCV, a pseudo-random number generator // Scand. Actuar. J. 1976. Vol. 1. P. 1-14.
2. Меженная H. M., Михайлов В. Г. О распределении числа единиц в выходной последовательности генератора Пола над полем GF(2) // Матем. вопр. криптогр. 2013. Т. 4, № 4. С. 95-107.
3. Меженная H. М. О распределении числа единиц в двоичной мультициклической последовательности//ПДМ. 2015. Т. 1 (27). С. 69-77.
4. Mezhennaya N. M. Convergence rate estimators for the number of ones in outcome sequence of MCV generator with m-dependent registers items // Sib. Electron. Math. Reports. 2014. Vol. 11. P. 18-25.
5. Зубков A. M., Михайлов В. Г. Предельные распределения случайных величин, связанных с длинными повторениями в последовательности независимых испытаний // Теория вероятн. и примен. 1974. Т. 19, № 1. С. 173-181.
6. Михайлов В. Г. Предельные распределения случайных величин, связанных с многократными длинными повторениями в последовательности независимых испытаний // Теория вероятн. и примен. 1974. Т. 19, № 1. С. 182-187.
7. Зубков А. М., Михайлов В. Г. О повторениях s-цепочек в последовательности независимых величин // Теория вероятн. и примен. 1979. Т. 24, № 2. С. 267-279.
8. Михайлов В. Г., Шойтов А. М. О длинных повторениях цепочек в цепи Маркова // Дискрет, матем. 2014. Т. 26, № 3. С. 79-89.
9. Михайлов В. Г. Оценки точности пуассоновской аппроксимации для распределения числа серий повторений длинных цепочек в цепи Маркова // Дискрет, матем. 2015. Т. 27, № 4. С. 67-78.
10. Михайлов В. Г., Шойтов А. М. Многократные повторения длинных цепочек в конечной цепи Маркова // Матем. вопр. криптогр. 2015. Т. 6, № 3. С. 117-133.
11. Тюрин И. С. Уточнения остаточного члена в теореме Ляпунова // Теория вероятн. и примен. 2011. Т. 56, вып. 3. С. 808-811.
12. Springer М. D., Thompson W. Е. The Distribution of Products of Beta, Gamma and Gaussian Random Variables // SIAM J. Appl. Math. 1970. Vol. 18, №4. P. 721-737.
13. Бейтмен Г., Эрдейи А. Высшие трансцендентные функции. 2-е изд. М.: Наука, 1973. Т. 1. 296 с.
14. Королев В. Ю., Шевцова И. Г. О верхней оценке абсолютной постоянной в неравенстве Берри — Эссеена // Теория вероятн. и ее примен. 2009. Т. 54, №4. С. 671-695.
ABOUT THE DISTRIBUTION OF THE NUMBERS OF PAIRS AND TRIPLES OF EQUAL SIGNS IN A CYCLE OF BINARY MULTICYCLIC SEQUENCE
Natalya M. Mezhennaya
Cand. Sci. (Phys. and Math.), A/Prof.,
Bauman Moscow State Technical University
5/1 2nd Baumanskaya St., Moscow 105005, Russia
E-mail: [email protected]
The article presents the limit distribution of the numbers of pairs and triples of equal signs in a cycle of binary multicyclic random sequence with r registers filled with uniform distributed mutually independent binary random variables in two cases: 1) when the number of registers r is fixed and their lengths tend to infinity; 2) when r also tends to infinity. In the first case using the Berry-Esseen inequality we have derived the uniform estimates of the degree of convergence.
Keywords: multicyclic sequence; normal limit theorem; number of pairs of equal signs; number of triples of equal signs; Berry — Esseen inequality.