МАТЕМАТИКА
J
УДК 519.119
Н. М. Меженная, В. Г. Михайлов
НИЖНИЕ ОЦЕНКИ ДЛЯ ВЕРОЯТНОСТИ ВЛОЖЕНИЯ С ПРОИЗВОЛЬНЫМ ДОПУСКОМ
Дано обобщение понятия плотного вложения, введенного Дж. Голичем. Выведены оценки снизу для математического ожидания вероятности вложения с заданным допуском отрезка последовательности независимых одинаково распределенных случайных величин над алфавитом из N элементов в начало последовательности независимых случайных величин, имеющих равномерное распределение на том же алфавите. Эти оценки уточняют известные оценки для вероятности вложения с заданным допуском и, в частности, для вероятности плотного вложения.
E-mail: [email protected]; [email protected]
Ключевые слова: вложение с допуском, последовательность над конечным алфавитом, нижние оценки.
В работе [1] Дж. Голич ввел следующее понятие плотного вложения последовательности над некоторым алфавитом в начало другой последовательности над тем же алфавитом. Отрезок последовательности xn = [x\,..., xn] плотно вкладывается в отрезок последовательности ym = [y1,... ,ym], если n ^ m и найдутся такие натуральные числа
1 = j 1 < j2 < ... <jn < m, jk+1 - jk e {1, 2}, k = 1,... ,n - 1, (1)
что xk = y,Jk, k = 1,... ,n. Здесь и далее будет использоваться запись [z1, z2,..., zm] для обозначения отрезка из первых m элементов последовательности z1, z2,....
В работе [1] получена верхняя граница значений вероятности плотного вложения отрезка заданной двоичной последовательности xn в начало равновероятной последовательности Бернулли и показано, что эта граница достигается на альтернирующих двоичных последовательностях. В работе [2] эта оценка была обобщена на случай последовательностей над произвольным конечным множеством. При этом оказалось, что верхняя граница вероятности плотного вложения отрезка заданной последовательности в начало равновероятной последовательности достигается на последовательностях, в которых нет совпадений соседних букв. Там же получена нижняя граница для этой вероятности, она достигается на последовательностях, составленных из одинаковых знаков.
Понятие вложения отрезка одной последовательности в начало другой последовательности естественно обобщить и рассмотреть вложение по правилу (1), в котором условие 3к+1 — 3к € {1, 2} заменяется условием 3к+1 — 3к € {1, 2,..., ^ +1}, где d — заданное натуральное число. Такое вложение впервые было рассмотрено в работе [3] и названо вложением с допуском d.
Обобщить оценку Голича на вложения с допуском d ^ 2 не удалось. Но в [3] была выведена нижняя граница для вероятности вложения с допуском d заданной последовательности над конечным алфавитом в равновероятную последовательность, обобщающая соответствующую оценку работы [2]. Ниже будет приведен этот результат в удобной форме.
Изменим использованное в [3] определение, отказавшись от требования вложения первого знака в самое начало последовательности, а именно будем считать, что отрезок последовательности хп вкладывается с допуском d ^ 1 в отрезок последовательности ут = [у^т^, если п ^ т и при 30 = 0 найдутся такие натуральные числа
31 <32 < ... <3п < т, зь+1 — 3к € {1, 2,...^ + 1}, к = 0,1,...,п — 1,
(2)
что хк = уу^к ,к = 1,..., п. Изменения в ограничениях на 31 не меняют смысл введенного понятия, но позволяют упростить вид приводимых ниже результатов.
Для обозначения случайных последовательностей и их элементов условимся использовать прописные буквы. Пусть рт(хп) — вероятность того, что фиксированный отрезок последовательности хп может быть вложен с произвольным натуральным допуском d в отрезок последовательности Ут из независимых случайных величин, равномерно распределенных на множестве АN = {0,1,..., N — 1}.
Теорема 1. Пусть случайные величины У1,У2,..., Утраспределены на множестве AN независимо и равномерно, Ут = [У1, У2,..., Ут]. Тогда для любого т ^ п
1 п! / N 1 \ к1 +2к2+...+^
р* (хП) > V _п_ Г^—1)
Рт (Х ) " ^ 2+к ко! ...кД N ) ,
0^к1+2к2+...+йк^ ^т-п
(3)
причем знак равенства достигается для отрезков последовательностей хп, состоящих из одинаковых знаков.
Из (3) следует, что при т ^ ^ + 1)п
*(*") > Nnkfe-1)0 = (i - (N-i)
d+Г
n
В случае плотного вложения (для него известна верхняя оценка) функции, представляющие верхнюю и нижнюю границы для вероятностей, убывают при условии п ^ ж экспоненциально быстро, а множители в показателях экспонент для них заметно различаются. Естественно полагать, что так же обстоит дело и для вложения с допуском й ^ 2. Поэтому особый интерес представляет изучение скорости убывания вероятности Р^(хп) в среднем по всем отрезкам хп.
В настоящей работе излагается подход, позволяющий получить оценки снизу для математического ожидания (по любому заданному распределению для знаков отрезка случайной последовательности Xп = [Х1,..., Хп]) вероятности вложения с допуском й отрезка последовательности Xп в случайную равновероятную последовательность.
Теорема 2. Пусть Х1 ,Х2,... ,Хп — независимые случайные величины, каждая из которых имеет распределение Рх на множестве
= {0,..., N-1}. Пусть Xп = Х,.. .,Хп]. Пусть У = [Уь У2,...] — последовательность независимых случайных величин, равномерно распределенных на AN, не зависящая от Хп. Тогда для любых к натуральных чисел г1,... ,гк, таких что г1 + ... + гк = п,
к
Ерх Р(1+1)п(Хп) >Ц Е Рх Ртг (й+1) (Хтг). (4)
г=1
Оценка (4) используется в работе для получения оценок снизу для средней вероятности плотного вложения и вложения с допуском два отрезка двоичной последовательности длины п из диапазона 10 ^ п ^ 30 в начало равновероятной последовательности Бернулли. Для плотного вложения значения наших нижних оценок оказались в 2-6 раз больше значений, вытекающих из оценок для минимальной вероятности вложения. При этом указанное отношение возрастает с увеличением параметра п. В то же время значения наших нижних оценок оказались в 2-6 раз меньше значений, полученных из оценок для максимальной вероятности вложения, в этом случае указанное отношение также возрастает с увеличением параметра п. Похожая картина наблюдается и для вложения с допуском два. Однако здесь нет возможности сравнить полученные оценки для средней вероятности вложения с верхними оценками по причине отсутствия последних.
Доказательство теоремы 1. Наряду с основным (описанным выше) способом вложения отрезка последовательности хп в отрезок последовательности ут рассмотрим также вспомогательный способ. При вспомогательном способе делаем следующее. Сравниваем знаки х1 и у1,...,уа. Если при некотором ] € {1,...,й} х1 = у^, то считается, что знак х1 "вставляется" на ]-е место отрезка ут (если знак х1
совпадает с несколькими из знаков у1,..., у*, то х1 вставляется на самую левую возможную позицию). В противном случае считаем, что отрезок последовательности хп не может быть вложен вспомогательным способом в ут Далее рассуждаем рекурсивно. Пусть знак х»-1 "вставлен" в ут на (3 — 1)-м месте. Если х» = у^, то "вставляем" знак х» на 3-м месте отрезка ут. Если х» = у^, х» = у^+1, то "вставляем" х» на (3 + 1)-м месте. Если х» = у^, х» = у^+1,х» = у^+2, то "вставляем" х» на (3 + 2)-м месте и так далее до знака Если же х» = у^, х» = у^+1,..., х» = у^+й, то будем считать, что отрезок последовательности хп не может быть вложен вспомогательным способом в ут.
Ясно, что если отрезок хп может быть вложен в отрезок последовательности ут вспомогательным способом, то он может быть вложен в него и основным способом. Поэтому вероятность Рт (хп) вложения отрезка хп в отрезок случайной последовательности Ут вспомогательным способом меньше или равна вероятности Рт(хп) вложения с допуском d основным способом.
Лемма 1. Если отрезок последовательности хп состоит из п одинаковых знаков, то вероятности вложения хп в отрезок случайной равновероятной последовательности Ут основным и вспомогательным способами совпадают.
Поэтому нижняя оценка вероятности Р^(хп) достигается для таких хп.
Доказательство леммы 1. Рассмотрим отрезок хп = [а,..., а], который может быть вложен в отрезок последовательности Ут основным способом. В этом случае множество {1 ^ г ^ т: У = а} состоит не менее, чем из п элементов, причем первые п из них удовлетворяют условию (2). Следовательно, знаки отрезка хп могут быть "вставлены" именно на эти первые места. Это означает, что хп вкладывается в отрезок последовательности Ут вспомогательным способом.
Как мы уже отмечали, если отрезок хп может быть вложен в отрезок последовательности Ут вспомогательным способом, то он может быть вложен в него и основным способом. Таким образом, вероятности вложить хп указанного вида в отрезок последовательности Ут обоими способами совпадают. Лемма 1 доказана.
Вычислим вероятность вложения отрезка последовательности хп в Ут вспомогательным способом. Обозначим через (хп) число детерминированных отрезков последовательностей ут = [у»]т=1, в которые данный отрезок хп может быть вложен вспомогательным способом.
Лемма 2. Для любого n ^ 1 и m ^ n выполнено соотношение
n! ( N — 1 \ kl+2k2 + ...+dkd
ko! 777^! V ~N
ко+...+к'=",
(5)
Доказательство леммы 2. Для любых т" и Ym существует не более одного варианта вложения отрезка xn в отрезок последовательности Ym вспомогательным способом. Это свойство позволяет найти число (xn) следующим образом. Выберем числа 0 ^ к ^ п, i = 0,... к0 +... + к,], = п, и будем считать, что из п знаков отрезка последовательности xn некоторые к0 знаков "вставлены" вспомогательным способом сразу за предшествующим "вставленным" знаком отрезка xn, некоторые kl из оставшихся знаков "вставлены" с предварительным пропуском одного знака, некоторые k2 из оставшихся знаков "вставлены" с предварительным пропуском двух знаков и так далее. Наконец, оставшиеся kd знаков "вставлены" с предварительным пропуском d знаков (при этом считаем, что знак xl "вставлен" с предварительным пропуском l знаков, если ]1 = l — 1). Число отрезков Ym длины п + kl + 2k2 + ... + dkd, в которые данный отрезок последовательности xn может быть вложен вспомогательным образом, равно
Cko C к'1 C к'2 Ск' (N _ 1)к1+2к2+...+йк^
П П—ко П—ко — к1 /
Последние m — п — kl — 2k2 — ... — dkd символов отрезка Yт могут быть выбраны произвольно, т.е. Nm—n—kl—2k2—...—dkd способами. В итоге, суммируя по к1 + 2к2 + ... + dkd в диапазоне от 0 до m — п, получаем
п! ( N — 1 \ к1+2к2 + ...+^'
ko+...+kd=n, 10! - - '
0^kl+2k2+...+dkd^m—n
Лемма 2 доказана.
Согласно неравенству Р'т(х") ^ Р^(х") и лемме 2 в качестве нижней оценки для вероятности Р^ (х") можно взять вероятность
D' (т") Р' (т") = D т(Т ) =
1 т(Т ) Nт
1 П! (N — 1 \ к1+2к2+...+<1к'
Nn ^ к0!... kd.!\ N
ко+...+к' =", 0^kl+2k2+...+dkd^ т—"
Эта оценка не зависит от т" и согласно лемме 1 достигается на отрезках из одинаковых знаков. Таким образом, теорема 1 доказана.
Доказательство теоремы 2. Рассмотрим еще один (третий) способ вложения, обобщающий рассмотренный ранее вспомогательный способ. Он состоит в следующем.
1. Разбиваем отрезок хп на отрезки хГг = [хГг_1+1,..., хГг ], г = 1,...
..., к, г0 = 0.
2. Если отрезок хГ1 может быть вложен с допуском d в начало последовательности у, то выбираем из всех возможных способов тот, в котором знак хГ1 "вставлен" наиболее близко к началу последовательности у. Если отрезок хГ1 не может быть вложен с допуском d в начало последовательности у, то считаем, что последовательность хп не вкладывается третьим способом в у.
3. Далее используем рекурсию. Пусть отрезок [х1,... ..., хГ1+...+г^], 3 ^ 1, уже вложен третьим способом в начало последовательности у, причем знак хГ1+...+г^ "вставлен" в последовательность у на + +г -м месте. Если отрезок хГ;+1 может быть вложен с допуском d в начало последовательности [у+ +1,у* +2,...], то выбираем из всех возможных способов тот, в котором знак хГ1+..+.,• +г^+1 "вставляется" наиболее близко к началу последовательности
+1,у*хп+2,...]. Присоединим результат вложения отрезка хг^+1 к результату вложения по третьему способу отрезка [х1,..., хГ1+...+г^ ] и получим вложение по третьему способу отрезка ^^ . . . , хп+...+г^-+1 ].
Если отрезок хг^+1 не может быть вложен с допуском d в начало последовательности [у+ +1,у* +2,...], то считаем, что
1 +... + Гу ' и ХТ1 + ... + Т^ 1 ' А
отрезок последовательности хп не вкладывается третьим способом в начало последовательности у.
Отметим несколько важных свойств третьего способа вложения.
1. Если отрезок последовательности хп вкладывается в начало последовательности у с допуском d вспомогательным третьим способом, то он вкладывается в ее начало и основным способом вложения с допуском d.
2. Если вкладываемый отрезок хп = [а,..., а] состоит из одинаковых знаков и вкладывается в начало последовательности у с допуском d, то он вкладывается в ее начало и третьим способом. Действительно, множество {1 ^ г ^ (d + 1)п : у» = а} состоит не менее, чем из п элементов, причем первые п из них удовлетворяют условию вложения с допуском d. Следовательно, отрезок хп может быть вставлен именно на эти первые места. Это означает, что хп вкладывается в у третьим способом.
3. При вложении третьим способом в равновероятную последовательность У распределение последовательности +1,
Г1 + ...+Г2
Угх + + +2,...] не зависит от конкретного варианта вложения отрезков хг1,..., ХГ] и совпадает с распределением последовательности У. Это следует из того, что по третьему способу знак хГ1+.+Г: "вставляется" наиболее близко к началу последовательности У. Поэтому
случайное событие + +г ^ зависит только от случайных величин У1,... и не зависит от величин Уг+1, Уг+2,.....Значит, случайная величина + +г является марковским моментом. Поэтому из независимости и одинаковой распределенности случайных величин, образующих последовательность У, вытекает требуемое свойство.
Обозначим через р^[1'...'Гк (хп) вероятность вложения третьим вспомогательным способом отрезка последовательности хп в случайную равновероятную последовательность из независимых случайных величин У. В силу свойств 1 и 3
к
РП{+1)(хп) > рг/-гк(хп) = П ). (6)
г=1
Пусть теперь отрезок Хп случаен и состоит из независимых случайных величин, имеющих одинаковое распределение Рх на множестве Лх. Тогда
к
ВРх Рг/'...'гк (Хп) = П Ерх Р^Х).
г=1
Так как Ерхр1({Л+Х)(Хп) = ЕрхРгг((1+1)(Хп), то, подставив в (6) хп = Хп и применив оператор математического ожидания, получим (4). Теорема 2 доказана.
В случае небольших значений параметра п средняя вероятность вложения с допуском может быть вычислена при помощи ЭВМ. Используя результаты этого вычисления и теорему 2, удается получить нижние оценки для средней вероятности плотного вложения и вложения с допуском два отрезка двоичной последовательности длины п из диапазона 10 ^ п ^ 30 в начало равновероятной последовательности Бернулли. Приведем результаты двух таких экспериментов.
Пусть п = кЯ + I, 1 ^ I ^ Я — 1. Вычисления показывают, что оценка средней вероятности с использованием теоремы 2 будет наиболее точной, если при заданном числе сомножителей к в правой части ее параметры выбраны так, что г1 = ... = гк = Я, тк+1 = I.
В табл. 1 и 2 приведены оценки для средней вероятности плотного вложения (^ = 1) и вложения с допуском d =2 для различных значений параметров п и Я.
Таблица 1
Оценки средней вероятности плотного вложения
n Нижняя оценка R = 3 R = 4 R = 5 R = 6 Верхняя оценка
10 0,0563 0,0812 0,0888 0,0999 0,1004 0,1752
11 0,0422 0,0643 0,0713 0,0749 0,0821 0,1495
12 0,0317 0,0516 0,0578 0,0593 0,0674 0,1276
13 0,0238 0,0387 0,0434 0,0476 0,0506 0,1090
14 0,0178 0,0306 0,0343 0,0386 0,0400 0,0930
15 0,0134 0,0246 0,0276 0,0316 0,0321 0,0794
16 0,0100 0,0184 0,0224 0,0237 0,0261 0,0678
17 0,0075 0,0146 0,0168 0,0187 0,0213 0,0578
18 0,0056 0,0117 0,0133 0,0150 0,0175 0,0494
19 0,0042 0,0088 0,0107 0,0122 0,0131 0,0421
20 0,0032 0,0070 0,0086 0,0100 0,0104 0,0360
21 0,0024 0,0056 0,0065 0,0075 0,0083 0,0307
22 0,0018 0,0042 0,0051 0,0059 0,0068 0,0262
23 0,0013 0,0033 0,0041 0,0048 0,0055 0,0224
24 0,0010 0,0027 0,0033 0,0039 0,0045 0,0191
25 0,0008 0,0020 0,0025 0,0032 0,0034 0,0163
26 0,0006 0,0016 0,0020 0,0024 0,0027 0,0139
27 0,0004 0,0013 0,0016 0,0019 0,0022 0,0119
28 0,0003 0,0010 0,0013 0,0015 0,0018 0,0101
29 0,0002 0,0008 0,0010 0,0012 0,0014 0,0086
30 0,0002 0,0006 0,0008 0,0010 0,0012 0,0074
Таблица 2
Оценки средней вероятности вложения с допуском два
n Нижняя оценка (универсальная) R = 3 R = 4 R = 5 R = 6
10 0,2631 0,3479 0,3743 0,4140 0,4162
11 0,2302 0,3169 0,3454 0,3622 0,3907
12 0,2014 0,2924 0,3219 0,3299 0,3687
13 0,1762 0,2559 0,2817 0,3044 0,3226
14 0,1542 0,2330 0,2565 0,2837 0,2938
15 0,1349 0,2150 0,2367 0,2664 0,2711
16 0,1181 0,1881 0,2206 0,2331 0,2527
17 0,1033 0,1713 0,1931 0,2123 0,2372
18 0,0904 0,1581 0,1758 0,1959 0,2239
19 0,0791 0,1383 0,1622 0,1826 0,1959
20 0,0692 0,1260 0,1512 0,1714 0,1784
21 0,0606 0,1163 0,1323 0,1500 0,1646
22 0,0530 0,1017 0,1205 0,1366 0,1534
23 0,0464 0,0927 0,1112 0,1260 0,1440
24 0,0406 0,0855 0,1036 0,1175 0,1359
25 0,0355 0,0748 0,0907 0,1103 0,1189
26 0,0311 0,0681 0,0826 0,0965 0,1083
27 0,0272 0,0629 0,0762 0,0879 0,1000
28 0,0238 0,0550 0,0710 0,0811 0,0932
29 0,0208 0,0501 0,0622 0,0756 0,0875
30 0,0182 0,0462 0,0566 0,0710 0,0825
Результаты, приведенные в табл. 1 и 2, показывают, что средняя вероятность плотного вложения по крайней мере в 2-6 раз больше значений нижних оценок, вытекающих из оценок теоремы 1 для минимальной вероятности вложения (причем это отношение возрастает с увеличением параметра n). Полученные нижние оценки оказались в 2-6 раз меньше верхних оценок средней вероятности, вытекающих из оценок работы [1] для максимальной вероятности вложения, это отношение также возрастает с увеличением параметра n (см. табл. 1). Похожая картина наблюдается и для вложения с допуском два (см. табл. 2). Однако в этом случае нет возможности сравнить нижние оценки для средней вероятности вложения с верхними оценками.
Авторы выражают признательность рецензенту за замечания, полезные для подготовки рукописи.
Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект 11.01.00139).
СПИСОК ЛИТЕРАТУРЫ
1. G o l i c J. D j. Constrained embedding probability for two binary strings // SIAM J. Discrete Math. - 1996. - Vol. 9, no. 3. - P. 360-364.
2. Михайлов В. Г.,Меженная Н. М. Оценки для вероятности плотного вложения одной дискретной последовательности в другую // Дискретная математика. - 2005. - T. 17. - Вып. 3. - С. 19-27.
3. Меженная Н. М. Предельные теоремы в задачах о плотном вложении и плотных сериях в дискретных случайных последовательностях. Дисс.... канд. физ.-мат. наук. - М.: МГИЭМ, 2009.
4. Прохоров Ю. В., Розанов Ю. А. Теория вероятностей. - М.: Наука, 1972.
Статья поступила в редакцию 26.09.2012
Наталья Михайловна Меженная родилась в 1983 г., окончила в 2006 г. Московский государственный институт электроники и математики (МИЭМ)). Канд. физ.-мат. наук, доцент кафедры "Прикладная математика" МГТУ им. Н.Э. Баумана. Автор семи научных работ в области дискретных задач теории вероятностей, предельных теорем и их применения в математической статистике.
N.M. Mezhennaya (b. 1983) graduated from the Moscow State Institute of Electronics and Mathematics in 2006. Ph. D. (Eng.), assoc. professor of "Applied Mathematics" department of the Bauman Moscow State Technical University. Author of 7 publications in the field of discrete problems of probability theory, limit theorems and their application in mathematical statstics.
Владимир Гаврилович Михайлов родился в 1945 г. окончил МГУ им. М.В. Ломоносова в 1968 г. Д-р физ.-мат. наук, ведущий научный сотрудник Математического института им. В.А. Стеклова РАН. Автор более 50 научных работ в области приложения теории вероятностей в задачах дискретной математики.
V.G. Mikhailov (b. 1945) graduated from the Lomonosov Moscow State University in 1968. D. Sc. (Phys.-Math.), leading researcher of the Steklov Mathematical Institute of RAS. Author of more than 50 publications in the field of probability theory applications in problems of discrete mathematics.