УДК 519.119
Н. М. Меженная
ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ ЧИСЛА (а, d)-СЕРИЙ ЗАДАННОГО ВЕСА В ПОСЛЕДОВАТЕЛЬНОСТИ НЕЗАВИСИМЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
В работе получены пуассоновская и нормальная предельные теоремы для числа (a, d)-серий заданного веса в последовательности независимых одинаково распределенных случайных величин со значениями в конечном алфавите с оценками скорости сближения с сопровождающими распределениями.
E-mail: [email protected]
Ключевые слова: плотные серии, пуассоновская аппроксимация, центральная предельная теорема, метод Чена-Стейна, оценки скорости в предельных теоремах.
Согласно [1] отрезок последовательности {x1, x2,..., xk} плотно заполнен знаком а, если a £ {x^x^+i}, i = 1, 2,..., k — 1. Плотно заполненный знаком а отрезок называется плотной а-серией, если он не содержится ни в каком плотно заполненном знаком а отрезке большей длины. Весом плотной а-серии будем называть число входящих в нее знаков а. В работе [1] была поставлена задача об изучении вероятностных свойств статистик, связанных с числом плотных серий в последовательности независимых одинаково распределенных случайных величин над конечным алфавитом. Известно (см. [2, 3]), что такие статистики могут использоваться для оценки качества датчиков случайных чисел специального вида.
В работе [1] получена многомерная предельная теорема Пуассона для числа плотных серий заданного веса без оценки скорости сходимости в этой теореме, а также исследовано предельное поведение числа плотных серий заданной длины. В работе [4] получена оценка расстояния по вариации между распределением чисел плотных серий заданной длины и веса и многомерным пуассоновским сопровождающим распределением.
В настоящей работе рассматривается естественное обобщение этой задачи на случай, когда знаки а, образующие плотную серию, могут быть разделены более чем одним знаком, отличным от а.
Будем говорить, что отрезок последовательности {x1, x2,..., xk} заполнен знаком а с допуском d, если а £ {xi,xi+1 ,...,xi+d}, i = = 1, 2,..., k—2. (Далее такие отрезки будем называть (а, d)-цепочками.) (а, d)-цепочку будем называть (а, d)-серией, если она не вкладывается в (а, d)-цепочку большей длины. Длиной (а^)-серии будем называть число знаков в наименьшем отрезке последовательности, содержащем
все знаки а (а, <)-серии. Число знаков а в (а, <)-серии будем называть ее весом. Началом (а,<)-серии будем называть место появления первого входящего в нее знака а.
Настоящая работа посвящена выводу пуассоновской и центральной предельных теорем для числа (а,<)-серий заданного веса.
Заметим, что если изучать свойства (а, <£)-серий в последовательности независимых одинаково распределенных случайных величин над конечным алфавитом, то вместо этой последовательности можно рассматривать последовательность Бернулли, заменив все знаки, отличные от а, на а. Поэтому далее будем рассматривать только последовательности Бернулли.
Пусть {..., Х^ Х2,..., Хт,...} — последовательность Бернулли с вероятностью успеха р € (0,1). Зафиксируем натуральные числа < и ы. Пусть Е4 — случайное событие, состоящее в том, что в момент £ началась (1,<)-серия веса ы. Определим случайную величину
т
= £ ВД}, (1)
4=1
равную числу (1,<)-серий веса ы, которые начинаются со знаков, лежащих в отрезке последовательности Х1,Х2,...,Хт (здесь через 1{В} обозначен индикатор события В).
Определим числа равенством
Е!{Ег} = Е1 {Е1} = (1 - р)2(^+1)рад, ы = 1, 2,.... (2)
Согласно формуле (2) величина рш — это вероятность того, что со знака Х1 в последовательности {..., Х1, Х2,..., Хт,...} начинается (1, <)-цепочка веса ы, в которой первый и последний знак — единицы.
Лемма 1. При любом натуральном числе ы
( * V-1
р»= рш (Е(1 - р)М = р (1 - (1 - р^+Т-1. (3) ,к=0
Отметим, что при р € (0,1) величина р ^^(1 -р)к € (0,1), поэтому
к=0
с ростом ы вероятность р,и, убывает как геометрическая прогрессия.
Лемма 2. При любых натуральных числах ы и <
= Е^ = (1 - р)2('+1)Трад, (4)
Б^ > (1 - 2рад(1 - р)2((Ш)(ы + 1)(< + 1)) . (5)
Можно показать, что величина в правой части (5) при всех натуральных ы и < не меньше, чем (1 - 2/е)Аад. Кроме того, из доказательства леммы 1 нетрудно получить оценку для дисперсии сверху,
например,
< (1 + 2рш(1 - + 1)) .
Обозначим через р(Х, У) расстояние по вариации между распределениями случайных величин X и У.
Теорема 1. При любых натуральных числах d и
р(6ш) < 2(т + 2)(d + 1)рад, (6)
где — случайная величина, распределенная по закону Пуассона с параметром .
Распределение случайной величины далее будем называть сопровождающим пуассоновским распределением для случайной величины .
Далее везде в наших рассуждениях будем считать, что параметр d фиксирован.
Замечание. Правая часть (6) стремится к нулю, если w ^ то (Т ^ то). Это позволяет вывести из оценки теоремы 1 не только предельную теорему Пуассона, но и центральную предельную теорему (как результат сближения в смысле сходимости к нулю расстояния по вариации до пуассоновского распределения с растущим параметром).
Следствие 1. Пусть при Т ^ то параметры схемы меняются так, что w ^ то и Хи) ^ Л € [0, то). Тогда закон распределения случайной величины ^ является асимптотически пуассоновским с параметром Л.
Скорость сближения с сопровождающим пуассоновским распределением в условиях следствия 1 имеет порядок 0(ыТ-1) в метрике расстояния по вариации.
Замечание. Можно показать, что условия следствия 1 выполнены, если, например, параметр w выбран равным
ln T
w = —
1п I р (1—р)
\ к=0
бедствие 2. Пусть при Т ^ то параметры схемы меняются так, что w ^ то и ^ то. Тогда закон распределения случайной величины = ^— Л>" совпадает в пределе со стандартным нормальным
законом распределения.
Скорость сближения с сопровождающим пуассоновским распреде-
0 (wЛw\ лением в условиях следствия 2 имеет порядок О I I в метрике
расстояния по вариации.
Замечание. В условиях следствия 2 также имеет место сходимость
к нормальному распределению в равномерной метрике, однако ее ско-
„ п (
рость имеет порядок, отличный от О „ . Она зависит от скорости
Г * П' А№
сближения распределения величины п' = -- со стандартным
V Аад
нормальным законом. Обозначим через Ф(-) функцию распределения стандартного нормального закона, а через ^^ (•) и (•) — функции распределения случайных величин и п^ соответственно. Неравенство Берри-Эссеена позволяет показать, что
sup|Fnw(x) - Ф(х)| = O(A-1/2).
жек
Поэтому
sup^*(x) - Ф(х)| = oi^W + А-1/2) . (7)
Следствия 1 и 2 не описывают такого изменения параметров, при котором w остается фиксированным при T ^ то. В этом случае для случайной величины также имеет место центральная предельная теорема, которая может быть выведена из следующего утверждения.
Теорема 2. При любых натуральных числах d и w
sup (х) - Ф(х)| <
<_128(1 + V6)(w + 1)2(d +1)2_ (8)
< VTpW/2(1 - p)3(d+i) (1 - Pw (1 - p)2(d+i)(w + 1)(d+1))3/2.
Следствие 3. Пусть при T ^ то параметр w остается фиксированным. Тогда закон распределения случайной величины £W = W
v/DëW
совпадает в пределе со стандартным нормальным законом распределения, причем скорость сходимости к нему имеет порядок О(Т-1/2) в равномерной метрике.
Теорема 2 также позволяет получить оценки скорости сходимости в
условиях следствия 2 с дополнительным условием —-—> 0(Т ^ то), а именно
8ир|^. (х) - Ф(х)| = . (9)
жек ЧРадУ А'/
Перейдем к сравнению оценок (7) и (9). Так как
w2
= Ol —-= I, то достаточно ограничиться сравнением первого слага-
емого в правой части (7) и (9). Рассмотрим отношение правых частей (7) и (9)
wAw Pw ^AW _ wTpw Vw\/Tpw _ y7TpW T w2 T w2 w
Если последнее отношение стремится к нулю (при T _ o(wpW)), то wAw ¡ w2 \
- _ o --:= и оценка (7) лучше. В противном случае стоит
T \Pw vAw/
предпочесть оценку (9).
Доказательства. Доказательство леммы 1. Очевидно, что p1 _ p. Далее выразим вероятность pw через pw-i. Для этого заметим, что если в последовательности начиная со знака X1 появилась (1, ^)-цепочка веса (w — 1), то для ее продолжения до веса w необходимо, чтобы любой из (d +1) знаков, стоящих за ней в последовательности, был равен единице, а именно при w ^ 2
Pw _ PPw-1 + p(1 — P)Pw-1 + p(1 — P)2Pw-1 + ... + p(1 — P)dPw-1 _ p (1 — p)M Pw-1 _ [ p (1 — p)4 Pw-2 _ ... _
k=0 / V k=0 /
/ d \ 'w-1 / d ^ w-1 _ p ^(1 — p)M P1 _ pw ^(1—p)k k=0 k=0
Остается заметить, что при w _ 1 последняя формула остается верной. Лемма 1 доказана.
Доказательство теоремы 1. Воспользуемся известным методом Чена-Стейна (см. [5]). Для каждого t £ {1,...,T} выберем такое множество O(t), чтобы событие Et и набор событий {Es, s £ O(t)} были независимы. Если последовательность {..., X1, X2,..., XT,...} состоит из независимых случайных величин, то в O(t) нужно отнести все такие события Es, что Et и Es зависят хотя бы от одного общего члена последовательности {..., X1, X2,..., XT,...}. Заметим, что (1, d)-серия веса w может иметь длину от w до (w — 1)(d + 1) + 1 + + 2(d +1), так как между двумя единицами в ней стоит не более d нулей, а по краям стоят по (d +1) нулю. Поэтому определим O(t) как
O(t) _ {s £ {1,...,T}: |s — t| < (w — 1)(d + 1) + 1 + 2d + 1 _
_(w + 1)(d + 1)}. (10)
Согласно теореме 1 работы [5], имеет место оценка для расстояния по вариации
1 _ e-
P(£w ,nw ) ^ - (S + S2), (11)
Aw
где
т т
< ЕЕ ЕВД}Е1{£5}, < Е Е ЕВД}1{£5}.
4=1 в€0(4) 4=1
Перейдем к оценке приведенных сумм. В силу однородности последовательности {..., Х1, Х2,..., Хт,...} Е1{Е4} = Е1{Е1}. Из (2) имеем
< Е Е (! - Р)4(<Ш)^ = Т(1 - р)4^1^|0(*)| =
4=1 веО(4)
= 2Т(ад +1)(^ +1)(1 - р)4(^+1)Р; <
< 2Т(ад + 1)(^ + 1)(1 -р)2(<ш)р;. (12)
Теперь перейдем к оцениванию суммы $2. События Е и 8 € 0(£), совместны, если соответствующие событиям серии пересекаются только по ограничивающим их нулям или при £ = 8. Пусть длина (1,^)-серии веса ад, которая начинается со знака равна г4, длина (1, ^)-серии веса ад, которая начинается со знака равна гв, и 8 > Тогда события Е и 8 € 0(£), совместны, если 8 - d - 1 = £ + + г4,..., £ + + d, то есть 8 = £ + + d + 1,..., £ + + 2d +1. При этом если 8 = £ + + d + к + 1, то
ЕВД}1{£5} = (1 - р р^ (1 - Р)4('+1), к = 0,1,...,d. (13)
Аналогичное равенство можно доказать в случае 8 < £. Так как выражение в правой части (13) не зависит от величин и гв, то
seö(i)\{i}
EljEtlljEs} =
= 2 I — + ... + ,) pW(1 - P)4(d+1) <
1 - р (1 -
< 2(d + 1)р£(1 - р)2(^+1). Таким образом, из последней формулы и определения $2 получаем
^2 < 2Т(d + 1)р£(1 -р)2(<ш). (14)
Подставляя выражения (4), (12) и (14) в (11), имеем
Р(6Ш^) ^ Трад(1 - р)2(^+1) Х
X 2Т(1 - р)2(^+1)р;; ((ад + 1)(d + 1) + d + 1) = 2(ад + 2)(d + 1)рад. Теорема 1 доказана.
Доказательство леммы 2. Согласно определению (1) D&, = D (£ I{Et}
„t=i
T TT
= £ DI{Et} + 2£ J] Cov(I{Et}, I{Es}) =
t=1 t=1 s=t+1
T T
Aw (1 - Pw(1 - p)2(d+1}) +2 £ £ Cov(I{Et}, I{Es}). (15)
t=1 s=t+1
Далее воспользуемся определением (10) множеств из доказательства теоремы 1. Если 8 £ 0(£), то Со-у(1{Е}, 1{Е}) = 0. Значит,
Т Т т
£ £ 1{Е5}) = £ £ 1{Ев}).
t=1 s=t+1 t=1 sea(t),
s't+l
Так как при 8 £ Ф(£)
Сси(1{Е}, 1{£Л) = ЕВД}1{£5} - р^(1 - р)4(<Ш),
то для вычисления ЕЦЕ^ЦЕ^} проведем те же рассуждения, что и для суммы $2 при доказательстве теоремы 1. С учетом несовместности событий и формулы (13) получим
Т
£ £ !{£Л) =
t=1 seO(t), s't+l
£ £ (EI{Et}I{Es} - pW(1 - p)4(d+1))
t=1 sea(t),
s't + l
T t+(w+1)(d+1)
£ £ (EI{Et}I{Es}- pW(1 - p)4(d+1)) >
t=1 s=t+1
1
1 - p 1 1 (1 - p)d
>T (r-p + ••• + (Т=Ы pW - p)4(d+1)-
- T(w + 1)(d +1)pW(1 - p)4(d+1) =
= tpW(1-p)4(d+1^+ ... + l^r) - (w + 1)(d + 10 =
= AwPW(1-p)2(d+1^+ ... + (^n) - (w + 1)(d + П)) .
(Знак ^ во второй строке появляется за счет того, что в 0(£) есть такие точки 8, что ЕЦЕ^ЩЕз} = р^, но в вычислении суммы мы вместо этого считаем, что Е1{Ег}1{Ев} = 0.)
Подставляя последнее выражение в формулу (15), получаем оценку
> (1 - М1- р)2('+1)) +
+2Л^а-р)2^ (+ ... + - (" + ^ + ц).
Так как у-р + ... + (^¿¿+1 > ^ + 1, то
> (1 - (1 - р)2('+1)) +
+ 2Лад(1 - р)2(^+1) (^ +1 - (ад + 1)(^ + 1)) = = (1 - (1 - р)2('+1) (1 + 2ад(^ +1))) >
> (1 - 2рад(1 -р)2('+1)(1 + ад)(^ + 1)) .
Лемма 2 доказана.
Доказательство теоремы 2. Воспользуемся оценкой, полученной в работе [6]. Пусть {^п,п € V} — система случайных величин с графом зависимостей С. Определение и свойства графа зависимостей приведены в работе [7]. Обозначим через V максимальную степень вершины в С. Пусть существует число В > 0, для которого Р{|^п - ^ В} = 1 для любого п € V. Тогда для случайной
величины Ш = ^ имеет место оценка пеУ
2 п3
0 W - EW Р < —, < х > - Ф(х) 1 v/DW '
< 32(1 + л/6)| V|D2B3/(DW)3/2. (16)
Применим оценку (16) к набору случайных индикаторов {1{Е^}, £ = 1,..., Т}. В этом случае можно взять В = 1. Граф зависимостей системы {1{Е^},£ = 1,..., Т} обладает тем свойством, что вершина с номером £ и набор вершин {1,...,Т}\0(£) не связаны ни одним ребром (см. (10)). Значит, V < 2(ад + 1)(^ + 1). Подставим полученные оценки в(16)
(х) - Ф(х)| < 128(1 + Уб)Т(ад + 1)2(^ + 1)2/(Б^)3/2. Далее воспользуемся оценкой (5) для дисперсии
^(х) - Ф(х)^ 128(1 + ^ + 1)2(^ +1)2 -
AW/2 (1 - Pw(1 - p)2(d+1)(w + 1)(d + 1))3/2 _128(1 + У6)(ад + 2)2(d +1)2_
VTpW/2(1 - p)3(d+1) (1 - Pw(1 - p)2(d+1)(w + 1)(d + 1))3/2'
Теорема 2 доказана.
Автор благодарен В.Г. Михайлову за ряд полезных замечаний при подготовке рукописи.
Работа выполнена при поддержке РФФИ (проект 11-01-00139).
СПИСОК ЛИТЕРАТУРЫ
1. Меженная Н. М. Предельные теоремы для числа плотных серий в случайной последовательности // Дискретная математика. - 2009. - Т. 21, № 1. -С. 105-116.
2. G o l i c J. Dj. Constrained embedding probability for two binary strings // SIAM Journal on Discrete Mathematics. - 1996. - V. 9, No. 3. - P. 360-364.
3. Михайлов В. Г., Меженная Н. М. Оценки для вероятности плотного вложения одной дискретной последовательности в другую // Дискретная математика. - 2005. - Т. 17, № 3. - С. 19-27.
4. М е ж е н н а я Н. М. Предельная теорема Пуассона для числа плотных серий заданной длины и веса // Вестник МГТУ им. Н.Э. Баумана. Серия "Естественные науки". Специальный выпуск "Прикладная математика". - 2011. - С. 75-82.
5. ArratiaR., Goldstein L., Gordon L. Two Moments Suffice for Poisson Approximations: The Chen-Stein Method // Annals of Probability. - 1989. - V. 17, No. 1. - P. 9-25.
6. BaldiP., Rinott Y. On Normal Approximations of Distributions in Terms of Dependency Graph // Annals of Probability. - 1989. - V. 17, No. 4. - P. 1646-1650.
7. МихайловВ.Г. Явные оценки в предельных теоремах для сумм случайных индикаторов // Обозрение прикладной и промышленной математики. - 1994. -Т. 1,№4.-С. 580-584.
Статья поступила в редакцию 27.07.2012