4. Caranti A., Volta F., and Sala M. An application of the O'Nan-Scott theorem to the group generated by the round functions of an AES-like cipher // Des. Codes Cryptogr. 2009. V. 52. P. 293-301.
5. Caranti A., Volta F., and Sala M. On some block ciphers and imprimitive groups // Appl. Algebra Eng. Commun. Comput. 2009. V.20. P. 339-350.
6. Leander G, Abdelraheem M. A., AlKhzaimi H., and Zenner E. A cryptanalysis of PRINTcipher: The invariant subspace attack // LNCS. 2011. V.6841. P. 206-221.
7. Трифонов Д. И., Фомин Д. Б. Об инвариантных подпространствах в XSL-шифрах // Прикладная дискретная математика. 2021. №54. C 58-76.
8. Todo Y., Leander G., and Sasaki Y. Nonlinear invariant attack: practical attack on full SCREAM, iSCREAM, and Midori64 // ASIACRYPT 2016. LNCS. 2016. V. 10032. P. 3-33.
9. Буров Д. А. О существовании нелинейных инвариантов специального вида для раун-довых преобразований XSL-алгоритмов // Дискретная математика. 2021. Т. 33. №2. C. 31-45.
10. Mattarei S. Inverse-closed additive subgroups of fields // Israel J. Math. 2007. V. 159. P. 343-347.
11. Goldstein D., Guralnick R., Small L., and Zelmanov E. Inversion-invariant additive subgroups of division rings // Pacific J. Math. 2006. V.227. P. 287-294.
12. Nyberg K. Differentially uniform mappings for cryptography // LNCS. 1994. V. 765. P. 55-64.
13. Carlet С. Open questions on nonlinearity and on APN Functions // LNCS. 2015. V. 9061. P. 83-107.
14. Hua L.-K. Some properties of a sfield // Proc. NAS USA. 1949. V. 35. P. 533-537.
УДК 519.214 Б01 10.17223/2226308Х/15/2
ОБ АСИМПТОТИЧЕСКОЙ НОРМАЛЬНОСТИ ЧИСЛА КРАТНЫХ СОВПАДЕНИЙ ЦЕПОЧЕК В ПОЛНЫХ д-ИЧНЫХ ДЕРЕВЬЯХ И ЛЕСАХ СО СЛУЧАЙНЫМИ МЕТКАМИ
В. Г. Михайлов, В. И. Круглов
Рассматриваются полные д-ичные корневые деревья высоты Н, каждой вершине которых независимо от остальных вершин присвоена случайная метка, выбираемая из множества {1, 2,..., N}. Исследуются случайные величины, равные числу наборов из г ^ 2 путей одинаковой длины в, у которых совпадают соответствующие в-цепочки меток вершин. Представлена теорема о достаточных условиях асимптотической нормальности рассматриваемых случайных величин при неограниченном увеличении высоты дерева. При исследовании повторений цепочек в лесе деревьев предполагается, что имеется г деревьев, которые могут иметь разные высоты Н\,..., Нг и вершинам которых аналогичным образом поставлены в соответствие независимые в совокупности случайные метки. Изучается число наборов из г путей длины в, в которые входит по одному пути с каждого дерева, для которых совпадают соответствующие цепочки меток вершин, для этой случайной величины также получены достаточные условия асимптотической нормальности.
Ключевые слова: деревья с метками, цепочки меток на дереве, повторения цепочек, условия асимптотической нормальности.
Введение
Повторения событий могут свидетельствовать о наличии закономерностей, при анализе которых возникают задачи о вычислении или оценке значений вероятностей повторений событий в наборах независимых случайных величин. В исследованиях по этой тематике первоначально рассматривались задачи о повторениях цепочек случайных символов [1-4], естественным продолжением этих исследований стали работы, связанные с повторениями паттернов в деревьях со случайно помеченными вершинами. Распределения числа вхождений заданного поддерева в случайное дерево рассматривались в [5, 6], задачи такого рода возникают в компьютерных науках [7, 8] при анализе алгоритмов или, например, в связи с древовидной структурой ХМЬ-документов, которые используются, в частности, на портале Госуслуг. Подобные задачи также могут возникать в связи с построением статистических критериев и анализом генетических последовательностей.
Предельные пуассоновские теоремы для числа совпадений меток цепочек в двоичном или п-ичном дереве, метки вершин которого независимы и имеют равновероятное распределение на конечном алфавите, получены в [9, 10], предельная пуассоновская теорема для числа совпадений паттернов в п-ичном дереве с равновероятными метками вершин доказана в [4].
В настоящей работе рассматриваются полные д-ичные корневые деревья и леса, составленные из таких корневых деревьев. Некорневым вершинам деревьев присвоены случайные метки, выбранные независимо из множества {1, 2,...,N} в соответствии с некоторым вероятностным распределением.
Изучается число наборов по г ^ 2 путей длины в на одном или нескольких деревьях, для которых совпадают соответствующие цепочки меток вершин. Получены достаточные условия асимптотической нормальности этой случайной величины при неограниченном увеличении высоты деревьев.
1. Повторения цепочек на дереве
Пусть Тг(Н) —полное д-ичное корневое дерево высоты Н и вершинам этого дерева присвоены незавимые в совокупности случайные метки, выбираемые из конечного множества {1, 2,..., N} в соответствии с положительными вероятностями р1,... ,рм, где р1 + ... + рм = 1.
Пусть в < Н. Через Ш(Н, в) будем обозначать множество цепочек длины в в дереве Тг(Н), начало которых имеет высоту, не превосходящую Н-в. Нетрудно показать [11], что
пН--+1 _ 1 пн+1 _ п-
|Ш №в)| = V-1«' = -пт-г- ■
Определим случайную величину (Н, в), которая равна числу всех таких наборов из г различных путей длины в в дереве Тг(Н), для которых совпадают соответствующие в-цепочки меток вершин, составляющих эти пути. Для этого занумеруем элементы множества Ш(Н, в) числами от 1 до |Ш(Н, в)|, путь с номером и, где 1 ^ и ^ |Ш(Н, в)|, будем обозначать а цепочку меток вершин на этом пути — У (шад). Тогда
& (Н,в)= £ I {У (^ ) = ... = У (ш„г)}.
К«1<...<мг (Я,-)|
Теорема 1. Пусть H ^ ж и параметры s = s(H) и q = q(H) изменяются так, что s/H ^ 0. Пусть существуют такие числа C > 0 и е Е (0,1], что при всех достаточно
больших Н выполнено неравенство
пн+1 - п3 \ 2(г-1)+£
Б£г (Н,в) ^ С( П п _1 П ^ . (1)
Тогда функции распределения и моменты случайной величины
(Н,в) _ Е£г (Н,в)
& (Н,в)
л/БСг (Н,в)
сходятся к функции распределения и моментам стандартного нормального распределения.
Доказательство теоремы 1 для случая г = 2 опубликовано в [11]. Можно отметить, что при в = 1 величина (Н, 1) совпадает по распределению с числом наборов по г одинаковых исходов в последовательности из (Н, 1)| _ 1 независимых случайных величин X, принимающих значения на множестве {1,... , N}
N
с вероятностями Р[Х» = к] = рк > 0, к = 1,... , N, £ рк = 1. Свойства распределения
к=1
величины известны: для неё условие (1) выполняется для любых неравновероятных распределений величин Х^ и не выполняется, если р1 = ... = pN = 1/N.
2. Повторения цепочек в лесах
Рассмотрим набор из г полных п-ичных корневых деревьев Тг1(Н1),... , Тгг(Нг) высот Н1,... , Нг соответственно, и пусть вершинам этих деревьев присвоены независимые в совокупности случайные метки, выбираемые из множества {1, 2,... , N} в соответствии с положительными вероятностями р1, р2,... , pN, где р1 + р2 + ... + pN = 1.
Пусть случайная величина £(г) (Н1,... , Нг; в) равна числу таких наборов из г путей длины в, что в эти наборы входит по одному пути из каждого из деревьев Тг1(Н1),... ,Тгг(Нг) и для этих путей совпадают соответствующие в-цепочки меток вершин. Тогда
£(Г)(НЬ...,НГ; в)= £ ... £ I {У (^ ) = ... = У (^)}.
шп1 еж (Н1,з) шпг еж (Нг ,з)
Минимальную высоту деревьев Тг1 (Н1),...,Тгг(Нг) будем обозначать через Нт1п = шт{Нь... ,НГ}.
N
Для любого I Е N определим величину р = £ рк, которая равна вероятности
к=1
того, что I различных вершин, лежащих в одном или нескольких деревьях, имеют одинаковые метки.
Теорема 2. Пусть Н1,... , Нг ^ то и параметры в = в(Н1,... , Нг) и п = п(Н1, ... , Нг) изменяются так, что в/Нт;п ^ 0. Пусть существуют такие числа С > 0 и £ Е (0,1], что при всех достаточно больших Нт;п выполнено неравенство
Б£(Г)(НЬ ... , Нг; в) ^ Сп2(Н1+-+Нг)-(2-£)Нт;п.
Тогда функции распределения и моменты случайной величины
Г пН + 1 _ пв
_ С(г)(Н1,...,Нг; в) _ П п п _ 1 п
¿Г)(Н1 ,...,Нг; в) = --к=1
^Б^) (Н1,...,НГ; в)
сходятся к функции распределения и моментам стандартного нормального распределения.
Доказательства теорем 1 и 2 основаны на модификации метода Янсона [12], предложенной в работе В. Г. Михайлова [13].
ЛИТЕРАТУРА
1. Guibas L. J. and OdlyzkoA.M. Long repetitive patterns in random sequences // Z. Wahrscheinlichkeitstheorie verw. Geb. 1980. No. 1. P. 241-262.
2. Зубков А. М., Михайлов В. Г. Предельные распределения случайных величин, связанных с длинными повторениями в последовательности независимых испытаний // Теория ве-роятн. и ее примен. 1974. Т. 19. №1. С. 173-181.
3. Михайлов В. Г. Оценка точности сложной пуассоновской аппроксимации для распределения числа совпадающих цепочек // Теория вероятн. и ее примен. 2001. Т. 46. №4. С. 713-723.
4. Kruglov V. and Zubkov A. Number of pairs of template matchings in q-ary tree with randomly marked vertices // LNCS. 2017. V. 10684. P. 336-346.
5. Hoffmann C. M. and O'Donnell M. J. Pattern matching in trees // J. ACM. 1982. V. 29. No. 1. P. 68-95.
6. Steyaert J.-M. and Flajolet P. Patterns and pattern-matching in trees: an analysis // Inf. & Control. 1983. V. 58. No. 1. P. 19-58.
7. Singh G., Smolka S. A., and Ramakrishnan I. V. Distributed algorithms for tree pattern matching // LNCS. 1988. V.312. P. 92-107.
8. Tahraoui M. A., Pinel-Sauvagnat K., Laitang C., et al. A survey on tree matching and XML retrieval // Computer Science Rev. 2013. No. 8. P. 1-23.
9. Зубков А. М., Круглов В. И. Повторения цепочек на бинарном дереве со случайными метками вершин // Дискретная математика. 2015. Т. 27. №4. С. 38-48.
10. Kruglov V. I. On coincidences of tuples in a q-ary tree with random labels of vertices // Discr. Math. Appl. 2018. V.28. No. 5. P. 293-307.
11. Михайлов В. Г., Круглов В. И. Об асимптотической нормальности в задаче о повторениях цепочек в помеченном полном дереве // Матем. вопр. криптогр. 2021. Т. 12. №4. С. 59-64.
12. Janson S. Normal convergence by higher semiinvariants with applications to sums of dependent random variables and random graphs // Ann. Probab. 1988. V. 16. No. 1. P. 306-312.
13. Михайлов В. Г. Об одной теореме Янсона // Теория вероятн. и ее примен. 1991. Т. 36. №1. С. 168-170.
УДК 519.214 Б01 10.17223/2226308Х/15/3
О ТОЧНОСТИ НОРМАЛЬНОЙ АППРОКСИМАЦИИ ДЛЯ РАСПРЕДЕЛЕНИЯ ЧИСЛА КРАТНЫХ ПОВТОРЕНИЙ ЗНАКОВ В СТАЦИОНАРНОЙ СЛУЧАЙНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
В. Г. Михайлов, Н. М. Меженная
Изучается задача об асимптотической нормальности числа г-кратных повторений знаков в отрезке длины п стационарной в узком смысле случайной последовательности со значениями в конечном множестве, удовлетворяющей условию равномерно сильного перемешивания. Показано, что если существует такое число а > 0, что коэффициент равномерно сильного перемешивания убывает