Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2012, № 4 (1), с. 217-224
УДК 519.713
О ВЕРОЯТНОСТЯХ ПРОДОЛЖЕНИЯ ДЕРЕВЬЕВ ВЫВОДА В РАЗЛОЖИМЫХ СТОХАСТИЧЕСКИХ КС-ГРАММАТИКАХ. ДОКРИТИЧЕСКИЙ СЛУЧАЙ
© 2012 г. Л.П. Жильцова
Нижегородский госуниверситет им. Н.И. Лобачевского [email protected]
Птступола в редакцию 13.05.2012
Рассматривается стохастическая контекстно-свободная грамматика с произвольным числом классов нетерминальных символов без ограничений на порядок следования классов. Соответствующая ей матрица А первых моментов является разложимой. В случае, когда перронов корень матрицы А строго меньше единицы, получена асимптотика для вероятностей продолжения деревьев вывода слов контекстносвободного языка, высота которых больше X, при t ^ да.
Ключевтк слтва: контекстно-свободный язык, стохастическая КС-грамматика, случайный процесс, вероятность, дерево вывода, матрица первых моментов, перронов корень.
Введение
Автором в [3, 4] рассматривались вопросы, связанные с кодированием сообщений, являющихся словами стохастического контекстносвободного языка (стохастического КС-языка), при условии, что матрица первых моментов грамматики неразложима, непериодична и ее максимальный по модулю собственный корень (перронов корень) строго меньше единицы (докритический случай). При неразложимой матрице первых моментов нетерминальные символы грамматики образуют один класс.
В настоящей работе рассматриваются стохастические КС-грамматики с произвольным числом классов нетерминальных символов.
При исследовании возможностей экономного кодирования слов, структурные и вероятностные свойства которых моделируются стохастической КС-грамматикой, в качестве меры эффективности кодирования рассматривается стоимость кодирования, которая определяется на множестве «длинных» слов. В качестве множества таких слов удобно рассматривать множество слов КС-языка, имеющих деревья вывода фиксированной высоты t, при X ^ да. При этом возникает необходимость в вычислении вероятности деревьев вывода, высота которых больше X. Процесс порождения слова в стохастической КС-грамматике можно рассматривать как случайный ветвящийся процесс. По аналогии с теорией ветвящихся процессов вероятность множества деревьев вывода, высота которых больше X, называется вероятностью продолжения.
1. Основные определения и предварительные сведения
Для изложения результатов о контекстносвободных языках будем использовать определения КС-языка и стохастического КС-языка из
[1, 7].
Стохастической КС-грамматикой называется система G = (ут,Ум,R,^, где Ут и Ум - конечные множества терминальных и нетерминальных символов (терминалов и нетерминалов) соответственно; 5 е Ум - аксиома, R - множество правил. Множество R можно представить в k
виде Я = и Я1, где k - мощность алфавита Ум и
,=1
= (г-!,...,г }. Каждое правило Гу из Ri имеет
вид Гу : А ——-^у, ] = ъ..П, где А, е ум,
в у е (Ут и Ум) и ру - вероятность применения правила Гу (вероятность правила ггД которая удовлетворяет следующим условиям: 0 < Ру < 1
п,
^ Ру = 1, символом « » обозначается операция
у=1
итерации, т.е. множество всех слоев в рассматриваемом алфавите.
Для слов а и в из (Ут и Ум) слово в непосредственно выводимо из а (а ^ в), если а = = а^Аа2, в = а^а для некоторых а1,а2 е е (Ут и Ум ) и в грамматике G имеется правило А1 ——^ву. Обозначим через рефлексив-
ное транзитивное замыкание отношения ^. КС-язык, порождаемый грамматикой G, определяется как множество слов LG = (а : 5 а,
о,еУт*}. В работе рассматриваются бесконечные языки.
Каждому слову а КС-языка соответствует последовательность правил грамматики (вывод), с помощью которой а выводится из аксиомы 5. Вероятность вывода определяется как произведение вероятностей правил, образующих вывод. Вероятность слова а определяется как сумма вероятностей всех различных левых выводов для а (при левом выводе очередное правило применяется к самому левому нетерминалу в слове).
Грамматика G называется согласованной,
Пусть а' =
др< (sl,•••, эк)
дs1
. Квадрат-
'Еа
р(а) = 1 (здесь |х| - длина
маЕ_Ъ,|а|<И1
слова х). В работе рассматриваются согласованные КС-грамматики. Согласованная КС-грам-матика G индуцирует распределение вероятностей на множестве слов порождаемого КС-языка L и определяет стохастический КС-язык.
Важное значение имеет понятие дерева вывода. Дерево вывода строится по левому выводу слова следующим образом. Корень дерева помечается аксиомой 5. Пусть при выводе слова а на очередном шаге в процессе левого вывода
применяется правило г.: А1 —-—>Ъ1,Ъ ,...,Ъ1 ,
где Ъ„ е(Уи и Ут), I = 1,...,т. Тогда из самой
левой вершины-листа дерева, помеченной символом А, (при обходе листьев дерева слева направо), проводится т дуг в вершины следующего яруса, которые помечаются слева направо символами Ъ ,Ъ ,...,Ъ. соответственно. После Ау верно А, ^ Ау. В противном случае °на назы-
ная матрица А порядка k, образованная элементами а\, называется матрицей первых мтмен-
ттв грамматики G. Так как матрица А неотрицательна, существует максимальный по модулю действительный неотрицательный собственный корень (перронов корень) [2]. Обозначим этот корень через г.
Известно необходимое и достаточное условие согласованности стохастической КС-грамматики [7]: стохастическая КС-грамматика при отсутствии бесполезных нетерминальных символов (т.е. не участвующих в порождении слов языка) является согласованной тогда и только тогда, когда г < 1. В работе рассматривается случай, когда г < 1. По аналогии с теорией ветвящихся процессов будем называть его докри-тическим. Основные результаты относятся к стохастическим КС-грамматикам с разложимой матрицей [2] первых моментов.
Введем некоторые обозначения. Будем говорить, что нетерминал Ау непосредственно следует за нетерминалом А, (и обозначать А, ^ АД если в грамматике существует правило вида
гу : А1 ——^а1 Ауа2, где а1,а2 е (Ут и Ум) . Рефлексивное транзитивное замыкание отношения ^ обозначим ^*.
Грамматика называется неразложимой, если для любых двух различных нетерминалов А, и
построения дуг и вершин для всех правил грамматики в выводе слова языка все листья дерева помечены терминальными символами (или символом пустого слова X, если лист получен в
результате применения правила гу : А, ———> X)
и само слово получается при обходе листьев дерева слева направо. Высотой дерева называется максимальная длина пути от корня к листу.
Рассмотрим многомерные производящие функции Fi(s'!,s'2,...,5к),, = 1,...,k, где переменная
5, соответствует нетерминальному символу А,. Функция Fi(5!,52,.,5k) строится по множеству правил Я с одинаковой левой частью А, следующим образом. Для каждого правила
—> в„
Гу : Аі
выписывается слагаемое q¡: =
Г1! С12
= Ру-511522 . 5^ , где 1т - число вхождений нетерминального символа Ат в правую часть пра-
вила
(т = !,_,к). Тогда ¥іs2,...,Як) = ЕЦу .
І=1
вается разложимой. Классом нетерминалов назовем максимальное по включению подмножество К с Ум, такое, что А, А у для любых
А, А е к .
Для различных классов К1 и К2 будем говорить, что класс К2 непосредственно следует за классом К1 (и обозначать К1 ^ К 2), если существуют А1 е К1 и А2 е К2, такие, что А1 ^ А2. Рефлексивное транзитивное замыкание отношения ^ обозначим через ^» и назовем отношением следования. Отношение ^ устанавливает на множестве классов нетерминалов частичный порядок. Будем полагать, что классы нетерминалов перенумерованы таким образом, что К1 < Ку тогда и только тогда, когда , <у.
Соответствующая разложимой грамматике матрица первых моментов А имеет следующий вид:
Я =Я
1 °2
Л11 ^12 Л1т-1 A1m
0 А22 A2m-1 A2m
0 0 . А m-1m-1 А m 1- m
V 0 0 . 0 А mm J
(1)
Один класс нетерминалов в матрице первых моментов представлен множеством подряд идущих строк и соответствующим множеством столбцов с теми же номерами.
Для класса K квадратная подматрица, образованная соответствующими строками и столбцами, обозначается через Ац. Блоки, расположенные ниже главной диагонали, - нулевые в силу упорядоченности классов. Подматрица Aj является нулевой, если K не предшествует Kj.
Для каждого класса K матрица Ац неразложима. Без ограничения общности будем считать, что она строго положительна и непериодична. Этого всегда можно добиться, применяя метод укрупнения правил грамматики, описанный в [3]. Метод укрупнения правил позволяет также преобразовать матрицу первых моментов к виду, в котором подматрица Aj > 0 для всех i и j таких, что Ki < * к.. Поэтому в дальнейшем
будем считать, что матрица А обладает перечисленными выше свойствами.
Обозначим v* перронов корень матрицы Aii. Для неразложимой матрицы перронов корень является действительным и простым [2]. В силу структуры матрицы первых моментов V = = тахг{гг} и V > 0.
Пусть J - множество всех номеров i классов, для которых vi = V. Назовем J определяющим множеством. Зафиксируем пару l, h, где l, h е е{1,2,..., m}, и рассмотрим всевозможные последовательности классов Ki < Ki K, ,
*1 i2 ls 7
где i1 = l, is = h. Среди всех таких последовательностей выберем ту, которая содержит наибольшее число классов с номерами из J. Это число обозначим slh.
Дополнительно переупорядочим классы по неубыванию величины s1h, причем при одинаковых значениях s1h сначала поставим классы с номерами из множества J.
Разобьем последовательность классов на группы классов MbM2,... ,MW, при этом класс Kh отнесем к группе M1 при s1h < 1 и к группе Mj при s1h = j (j > 1). Для групп M* и Mj определим s*. как max {slh}. Положим s* = 1.
к, eMi, Kh ем j
Среди последовательностей Kk <Kh Kt ,
где i1 = l и is принимает всевозможные значения, выберем ту, которая содержит наибольшее число классов с номерами из J. Это число обозначим через ql.
Отметим, что для любого Ki є М j при qi > 0 найдется такой класс Kl є М +1, что Kt < * Kl. Для группы Mj через q* обозначим max {q,-}.
K, єМj
Матрицу первых моментов будем также представлять в виде
ГBii Bi2 ... Biw)
B
0
B
(2)
V 0 0 ••• Bww j
где Blh - подматрица на пересечении строк для классов из группы Ml и столбцов для классов из Mh. Очевидно, каждая матрица Bll имеет перронов корень г. Запись Bі) будем применять для обозначения соответствующей подматрицы матрицы At.
Теорема 1 [5]. При t ^ да
Bh >= H,/lh V (1 + 0(1)), где Hlh - матрица, не зависящая от t.
Рассмотрим более подробно некоторые необходимые в дальнейшем свойства матриц Blh и
B^l) при t ^ да.
Группу M1 разобьем на три подгруппы. К первой подгруппе M11 отнесем классы нетерминалов с s11 = 0, ко второй подгруппе M12 - классы с номерами из множества J, к третьей подгруппе M13 - все остальные классы. Подгруппа M11 может быть пустой в том случае, если для кл асса K1 матрица А11 имеет перронов корень г. Каждая следующая группа Mh в силу упорядоченности классов начинается с класса с номером из J. Поэтому Mh при h > 1 разобьем на две подгруппы Mh2 и Mh3, где Mh2 содержит классы с номерами из J, и Mh3 - все остальные классы. Для единообразия для Mh будем рассматривать пустую подгруппу Mh1.
В соответствии с этим разбиением Bll представим в виде
Г с ^ 11 C 12 с Л ^13
Btt = 0 C 22 C23
V 0 0 C33 J
(3)
где Су - подматрица со строками для классов из Мц и столбцами для классов из М^.
Каждому классу К из Ми или из М13 соответствует перронов корень Г < г, поэтому для С'п и С33 справедливы оценки С'п = о(Г) и С3з = о(г').
Пусть М12 содержит ]2 классов. Любому классу К из М12 соответствует неразложимая подматрица Ац в представлении (1), и классы из М12 попарно несравнимы. Поэтому в силу
свойств неразложимых матриц [6] матрица С22 имеет вид
(и V
и л+г л+1 0
0
ил +2^71+2
0
и .V. .
и1 + л2 и1 +и2 У
(4)
(и V
+У л +1
0 и1+іУн+Л2 у
, где
«=Л+1
ВЦ
0 У"2 и(11 ^(21) V'
¿—Н=Л1+1 ' ' ¿—н
0 У"2 и(21 V(21 ) У" и(21 V(31)
/—4= и +1 і і /—ч= и +1 і '
'л и (11 V (31) «="1+1 і «
0
0
0
соответствующие классам KJ е М12, пропорциональны компонентам левого собственного вектора V/21 ^ = 0 .
Рассмотрим случай I < h. Матрицу В^ пред-
ставим в виде
х г‘ (1 + 0(1)),
где и, и V, - правый и левый собственные положительные векторы матрицы, соответствующие Г, при нормировке Уи = 1, , = ]\ + 1,.. .,/1 + /2. Обозначим матрицу
0 ... 0 0 ^
0 иА+УА+2 ... 0 0
Вл =
V А1
(7)
32
0 0
V
через Б. Очевидно, Б можно представить в виде
У ир V(21)
> =(0,...,0, и,,0,...,0)т ,
У(21 }=(0,...,0,У ,0,...,0), (5)
и и, и V, расположены на местах, соответствующих классу К,. Заметим, что и,11) и V'¡-11) являются соответственно правым и левым собственными векторами матрицы С22 для корня г.
Кроме того, каждому классу К1 е М12 соответствуют правый и левый собственные векторы всей матрицы Вц для перронова корня г.
Компоненты правого собственного вектора можно представить в виде и()= (и,11),и\11),
и,3‘))т , где Ц-]/) соответствует М/, / = 1,2,3. В [5] установлено, что и,31) = 0 и и,-1) = (гЕ - С11 )-1 х х С12и,21). Компоненты левого собственного вектора матрицы Вц для перронова корня г представим в виде ) = (V-11)У^11),у(31)). В [5] также показано, что У^11) = 0 и ) = ^С23 х
х (гЕ - С33 )-1.
Используя описанные векторы, уточним вид матрицы В‘ [5]:
где разбиение по строкам сделано в соответствии с подгруппами Ми, М12 и М13, а по столбцам - в соответствии с подгруппами Мк2 и Мк3. Так как к > 1, подгруппа Мм пустая и не представлена в матрице Вік.
В [5] доказано следующее асимптотическое равенство:
^и,(11)V(2к) У и1(11 )V.(3к^
и и -и ¿-‘и и «
^и,(21) V(2к) У и1(21 ) V(3к)
и л л и л л
0 0
В,
(').
ґік—У,
где и'^1 =-т1-У(р^21)Б21 +^31 Ь&ГЩ*, 5 = 1,2.
З/ь —1 ,■
2. Вероятности продолжения
Через Ql(t) обозначим вероятность множества деревьев вывода, высота которых больше t и корень помечен нетерминалом А1. Эту вероятность назовем вероятностью продолжения по аналогии с теорией ветвящихся процессов. Пусть (А/+1, А/+2,...,А/+к ) - последовательность
нетерминалов, образующих группу М,, где к, -число нетерминалов в М, и / + 1 - номер первого по порядку нетерминала в М,.
Через Q(г)(t) обозначим вектор вероятностей пр°д°лжения (t) = (Q/.+1 (t), Q/+2 (а),., / (t)).
При , = 1 представим Q(г)(t) в виде <2(,) (V) = = ®1(‘)(t), Q2')(t), Qз(')(t))т , а при , > 1 - в виде Q(,)^) = (Q2')(t), Q3(')(t))т , где Ql,)(t) соответст-
г' . (6)
Отметим, что строки матрицы В^ , соответствующие классам К1 е М12, т.е. классам, для которых , е 3 , пропорциональных компонентам правого собственного вектора и,21 ^, а столбцы,
вует подгруппе М,1, I = 1,2,3.
Теорема 2. При V ^ да
и^ V (1 + о(1))
и) tq:-1rt (1 + 0(1))
о(^: -1rt)
Для доказательства теоремы предварительно приведем несколько лемм.
Лемма 1 [6]. Пусть А - неотрицательная неразложимая матрица, г - ее перронов корень, г < 1, и Аа — последовательность матриц, для которых
Г ОН)(' Г
Оі)(') =
V О)(' )у
0<^'<^и^'^0 при '
да. Пусть
0
X
A* =(А - At )(A - At-1 )...(A - A1). Тогда для любого вектора x > 0 выполняется равенство
,• A* x й
lim —— = u , где и и v — соответственно правый
vAt x
и левый собственные положительные векторы, соответствующие г, при нормировке vu = 1.
Пусть F(t,s) = (Fi(t,s),... ,Fk(t,s)) - (векторная) производящая функция, которая определяется как t-я итерация производящей функции F(s) соотношениями:
F (0, s )= s,
F (l, s ) = F (s ), (8)
F (t +1, s ) = F (F (t, s))
Здесь k - общее число нетерминалов в грамматике.
Очевидно, что F(t,1) = 1 для всех t. Известно [6], что Q(t) = I _где Q(t) = (Ö1(t),-,Qt(t)/. Пусть R(t,s) = 1 - F(t,s), в частности, R (t,0 = Q (t)).
Лемма 2. Для стохастической КС-грамма-тики с матрицей первых моментов A вида (2) справедливо равенство
1 - F (s ) = (A - E(s ))(1 - s), (9)
где 0 < E(s) < A, причем элементы матрицы E(s) при 0 < s < 1 удовлетворяют условиям
Ej (s ) = i У Sj, (s )(1 - st),
где
- 5 2 F (s)
лой b =-------------^-L
ds'j dsl
.)
1 - F (s ) = У5?М ,w 4^ 5s,.
(1 - sj), где 0 < 0' < 1
5F.
< a\. Раскладывая —L
j 5s.
s=0' j
аналогичным образом, получаем
^ = aj - -11 Sj, (sX1 - s, H- E„ (s),
где
0 < Sj, (s)<
52 F (s)
5s. 5s,
0 < 5^)< Ь/ (10)
и Е(5) имеет блочный вид (2) при любом s,
0 < s < Т.
(В (10) константы Ь/ определяются форму-
Доказательство. Используя разложение производящей функции Fi(s) в ряд Тейлора в окрестности 1 , можно записать:
Поскольку производящие функции Fi(s) -многочлены с положительными коэффициентами, все их производные являются многочленами с неотрицательными коэффициентами и, следовательно, 0 < —
05,.
5s
Отсюда следуют равенства (9) и (10). Из неотрицательности и монотонности по 5 всех производных производящей функции Fi(s) следует, что 0 < Е(я) < А при любом 0 < 5 < 1 , и матрица Е(5) имеет блочный вид (2). Лемма доказана.
Подставляя в соотношение (10) в качестве 5 вектор F(t,s) и используя равенство (9), получаем
1 - F (а +1,5) = (А - Е^ (а, 5)))(1 - F (а , 5)). (11)
Обозначим E(F(t,s)) через Е,(5), а Е,(0) - через Е, и применим формулу (11) рекурсивно. Тогда
,-1
R(t, 5) = 1 - F (а, 5) = П (А - Е, (5 )^(п, 5) =
1=и (12)
= П (А - Е,(5 ))(1 - 5).
,=1
Здесь и далее будем применять запись
п
П(А - Е (*)) для выражения (А - Еп(5))(А -
1=т
-Еп-1(5)).(А - Ет(5)).
Из (11) и (12) при 5 = 0 следует, что Q(t)=(А - Е- )Q(t -1) =
,-1 ,-1 (13)
= П (А - Е )Q(n) =1^1 (А - Е, )1.
,=п ,=1
Кроме того, из формулы (12) следует, что при любом 5, 0 < 5 < 1 ,
R(t, 5 )= 1 - F (а, 5 )< АА-1 (1 - 5). (14)
Из теоремы 1 следует, что Аа ^ 0 при А ^ да, поэтому F (А, 5 ) ^ 1 и Ит,^» Е,(5) = 0 (поэлементно).
Лемма 3. Для любого 5, 0 < 5 < 1 , справедлива оценка Е, (5). = 0(А5“-Г) при > 1, где I и
h — номера классов, которым принадлежат нетерминалы А, и А/ соответственно.
Доказательство. Из доказательства леммы 2
следует, что Е. (5)<1 у Ь/ (1 - я,). Подставляя
2 ,
в качестве 5 значение F(t,s), получаем неравенство
Е, (5)/ < 2 У Ь‘, (1 - Fl (А, 5)) = 2 у Ь/Д, (А, 5).
2 , 2 ,
Из (14) следует оценка Е{(5). < 0(,"ш-Г).
Лемма доказана.
Доказательство теоремы 2. Доказательство проведем методом математической индукции по числу групп w. Пусть w = 1. Применим представление (12) для Q(t):
s=1
s=1
s=0
Q(t + 1) = П(А - ЕЖп). (15)
=п
Выберем такие г' и п, что г < г' < 1 и Е( <
< (г')пА при А > п. Тогда (1 -(г')п),-п+1А,-п+‘ <
< П (А - Е1) < А,-п+'. Поэтому справедливо
,=п
неравенство А - П (А - Е) (1 - (1 - (г 7),),
=п
где , = А - п + 1.
Оценим разность 1 - (1 - (г')п) :
1 - (1 - (Г 7 У = (г 7 У>7 У <,(г 7.
,=0
Следовательно, при , < п справедливо равен-
ство
П (А — Е ) = А1 (1 + 0(г'')п)
где г” удовлетворяет условию Г < г” < 1.
Уравнение (15) можно переписать в следующем виде:
Q(t + 1) = А (1 + о((г")ф(п) , (16)
и Q1 (, +1) = В1,1 (1 + о((г ")п ))б‘ (п) для w = 1.
Представим Q1(t) в виде б‘(,) = (£>,(1)(,),£(1)(,), Q31) (А))т, где QÍ1* (А) соответствует подгруппе Мп (, = 1,2,3). Из (14) следует, что Q(1)(п) <
< ВЦ-11 = 0(гп). Поэтому, с учетом представления (3) для Вц, справедлива оценка Q31) (А) < С3-1 • 1.
Известно следующее представление для степени произвольной матрицы С [2]:
С' =У (^ + (х', ^ 2 + ... + (х', )(”1—1) 2^),
Через Q[Kг■](t) обозначим вектор вероятностей продолжения для класса нетерминалов К,. Рассмотрим К, е М12. Для него из (18) следует уравнение
Q[K, ](, +1) = (А,, - Е, )2[К, ](,) + 0(,т (г')А), где Е, - подматрица матрицы Е', соответствующая подстрокам для класса К,.
Умножим слева обе части уравнения на вектор V, - левый собственный вектор матрицы А,,, соответствующий перронову корню г. Тогда с учетом оценок при w = 1 для Е, и Q[Kг■ ](,) получим следующее уравнение:
^-К, ](, +1) = гУД[К , ](,)+0(г2А)+0(,т (г 'У).
Введем обозначение х, = У‘^-К' ](а) . Тогда
А гА
предыдущее уравнение перепишется таким образом:
( ( '
х,+, = х, + о(гА)+ О^ ,т ^ г ^
Просуммировав уравнение от 1 до А, получим хг = XI + с + о(1), где константа с получается в результате суммирования сходящихся рядов
( V ^
У 0(7) и У 0
и=1
и=1
и >7
при
(17)
где X, - корни минимального многочлена у(/) матрицы С, , = 1,.,5, 5 < к, т, - кратность корня
1 А, )(п)
X, для минимального многочлена, ^Х ,) - п-я производная по X, от X,, матрицы Zlj вполне определяются заданием матрицы С и не зависят от А.
Применяя это представление для С3'3, получим, что Q31)(А) < О(,т(г')‘), где г' - перронов корень для С33 и т - его кратность. Отметим, что г' < г.
Используя оценку для Qз(1)(t), запишем уравнение для Q21) (А):
Q2l)(t +1) = (С22 -Е,'^(,)+ о(,т(г). (18)
Здесь Е' - подматрица матрицы Е,, соответствующая С22.
А ^ да. Отсюда ](,) = с,(1)гА (1 + о(1)),
где С1 = х1 + с .
Поскольку матрица А,, неразложима, то учитывая оценку для Е, из леммы 3 и применяя лемму 2, найдем, что Q[K,. ](,) = с,(1)и/ (1 + 0(1)), где и - правый собственный вектор матрицы А,,, соответствующий г.
Таким образом, учитывая, что подгруппу М12 составляют несравнимые классы с перроно-вым корнем г, формулу для Q^1) (А) можно записать в виде Q21) (А) = и "(1)гА (1 + 0(1)), где
и
"(1) _
(О/тМ
=У - ?и
і
Используя (16), запишем уравнение для
О(1) ('):
О(1)(' +1) =
= (^«(п)+С12 )о21)(и)+с1зО31)(п)Х1+0(1))
После подстановки значений для О21) (п),
С111, С2), С13) и оценок для О11) (п) и О31) (п)
получим: О1(1)(') = У с(1и(11)г' (1 + о(1)). Здесь
і
мы учли тот факт, что V21^и"(1) = V¡^и«21) = 1.
гда
Введем обозначение и'(1) = у с^и^ . То- Просу™мировав обе части уравнения по А от 1
, до А, получим х,+1 = х + с,(1А + О(1), где с^Ь -
Ql(1)(t) = и,(1) г(1 + о(1)). Таким обрaзом, ' У(21)(с23и,(2)+Б21и"(2))
сумма ряда У —— --------------------------. Поэтому
ы г
(19) V;(21)Q21)(t +1)= с,(1)Аг,+1(1 + о(1)). (22)
Используя первое уравнение системы (20),
(Q(1)(')\ ( U•(') v‘ (1 і 0(1)\
'ßil)(t) ö21)(t) ö31)(t)
U,(1) г' (1 + 0(1))' U,,(1) Г (1 + o(1)) o(r')
и утверждение теоремы при w = 1 справедливо. запишем УРавнение для ° (А) :
Пусть теперь w = 2. Используя (16), запишем Q^1)(t + l) = (c2-nQ^1)(n) + С^^п)О‘1(п) + D2Т-n1Q22l(n))х
систему для Q(t + 1): , , «
Jö(1)(t+1)=BnQ1)(n)+^1(2-n)Q(2)(n})(1+о(Ип)) (20) _ x(1+o(1))(1+O(r':))'
j Q(2)(t + 1) = (вд(2)(п)](1 + O((rt)).
t+1)=(Bt^BQ(2)(n))(1+ö((r")B)). (20) ПРименим оценки для С2Г, с2з-в) и D2'rn) ,
(2) (2) ,л(2Ь следующие из теоРемы 1, и оЦенки для Q31) (n)
Представим Q '(t) в виде Q ’(t) = (Q2 (t),
и Q22) (n):
Q21)(t+1) =
Q3(2) (А))т , где О/2) (А) соответствует подгруппе М2, (, = 2,3). Применяя доказательство теоремы для w = 1 ко второму уравнению, получим, что ( л. . ..
ГО22)(,)^ Ги"(2) г,(1 + 0(1))^ = I У о((,-п)гА) 1(1 + о((г")п)).
Q (2)(t ) =
Подставляя оценку (22) для F^21Q21)(«),
где U"(2) = у cf U(22) и c(2) - константа, соот- также учитывая, что t - n = [logt], получим, что
' Q21)(t) = y CpUf^tr1(1 + 0(1)). Отсюда следует,
ветствующая классу нетерминалов Kt є М22.
Перейдем к оценке компонент вектора что для класса Kt є М12 вектор Q[K](t) пропор-
Q(1)(t). Применяя равенство (13), запишем урав- Гт(21)
^ ^ „(IV ч v -'і' ционален правому собственному вектору U. '
нение для Q \t):
Q (1)(t +1) = Bq (1)(t) + B12 Q (2)(t))(1 + o(t"12 1 r')).
)(1)
матрицы A...
Наконец, запишем уравнение для Q1(1)(t +1), что Q(1) (t) можно рассматривать и используя систему (20): в качестве Q12) (t), поэтому отсюда следует Q[11) (t + 1) = (Си01(п) + 02п',0Ц',(п) +
оценка 0з(1)(t) = U,(21) г' (1 + о(1)). + С13-п)031)(п) + ^1-п022)(n) + (n))(1 + о((г")п)).
Применяя представления (3) и (7) для Вц и Подставляя в уравнение полученные ранее
В^ а также учитывая оценки для Q(1)(t) и Q^X'X оценки для Q<1)(n), ö31)(n), ö22)(п) и Q3(2) (п), а следующие из (14), запишем уравнение для ,
() также применяя теорему 1 для входящих в
Q21) (t): уравнение матриц и учитывая, что t - п = [logt],
ö21)(t+1)=c22q21)(')+c23ö31)(t)+ад22)(0 + получим, что
+ о(г' )+O^r2t) = QQ^t) + C23U,(2) г' + (21) Q1(1)(t) = У c(1)u.(11)tr'(1 + o(1)) = U ,(11) tr‘(1 + o(1)).
+ D21U"(2) г' + о(г')+ o(ts12-1rъ). Таким образом, доказана справедливость
Умножим обе части уравнения на левый теоремы для w = 2.
„ т,(21) „ Предположим, что теорема 2 справедлива
собственный вектор V. ' матрицы C22, соответ- , ^
^ ‘ * ’ для w - 1 групп. Докажем, что тогда она спра-
ствующий r. что ведлива и для w групп.
V (21Q«(t +1) = rK(21)ö21)(t)+ Запишем уравнение для Q(1)(t):
+ V(21)(c23U ,(2)+D21U "(2))г' + о(г' )+ o(ts12-1r2). Q(1)(t +1)= (BhQ (1)(t)+ B12Q(2)(t)+ (23)
Как и в случае w =1, введем обозначение + B13Q(3)(t)+... + B1wQ(w)(t))(1 + o(tqr‘)).
V (21)Q 21)(t) Для последовательности групп M2,M3,...,Mw
x- =~----:----. Тогда предыдущее уравнение утверждение теоремы справедливо по предположению индукции. Подставим значения
Q1(1)(t), I = 2,.,w в (23). Так как q* имеет наибольшее значение для I = 2, определяющим будет слагаемое B12Q1(2)(t). Поэтому уравнение (23) можно записать в следующем виде:
перепишется таким образом:
V (21)(C23U1(2)+D2p "(2))( ())
Х'+1 = х, + ■ v 23----------^(1 + 0(1)) +
r
-0(ts12-1 г' ).
а
О (1)(, +1) = (впо(1)(0+вх&(2)(а ))(1 + 0(1“/)).
Это уравнение аналогично уравнению для w= = 2. Повторяя рассуждения для w = 2, при этом
учитывая, что О(2) (А) = 0(,“2 V), и рассматри-
V (21)о (1)(,)
вая в качестве х, значение ——, , , получим
-у
утверждение теоремы для w групп нетерминалов. Теорема доказана.
Через Р(Щ) обозначим вероятность деревьев вывода высоты А, корень которых помечен нетерминалом А,. Очевидно, РЩ) = О(А-1) - (А).
Из теоремы 2 вытекает Следствие. Пусть нетерминал А1 е М,1, либо А1 е М,2. Тогда
р(Щ )= ё,К-У-1 (1 - г )(1 + 0(1)), где ё, - компонента вектора и либо вектора и”, соответствующая нетерминалу А,.
Заметим, что в случае, когда А1 е М,3, для
нахождения О,(А) и р(щ‘) следует присоединить М,3 к следующей группе в качестве М,+1>1.
Список литературы
1. Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. Том 1. М.: Мир, 1978.
2. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1967.
3. Жильцова Л.П. Закономерности применения правил грамматики в выводах слов стохастического контекстно-свободного языка // Математические вопросы кибернетики. М.: Наука. 2000. Вып.9. С. 101126.
4. Жильцова Л.П. О нижней оценке стоимости кодирования и асимптотически оптимальном кодировании стохастического контекстно-свободного языка // Дискретный анализ и исследование операций. 2001. Серия 1. Т. 8. № 3. Новосибирск: Издательство Института математики СО РАН. С. 26-45.
5. Жильцова Л.П. О матрице первых моментов разложимой стохастической КС-грамматики // Ученые записки Казанского государственного университета. Физико-математические науки. 2009. Том 151. Книга 2. С. 80-89.
6. Севастьянов В.А. Ветвящиеся процессы. М.: Наука, 1971.
7. Фу К. Структурные методы в распознавании образов. М.: Мир, 1977.
ON CONTINUATION PROBABILITIES OF DERIVATION TREES IN DECOMPOSABLE STOCHASTIC CONTEXT-FREE GRAMMARS. A SUBCRITICAL CASE
L.P. Zhiltsova
A stochastic context-free grammar is considered which contains an arbitrary number of classes of nonterminal symbols without any restrictions on the order of the classes. The corresponding matrix A of the first moments is decomposable. In the case when the Perron root of matrix A is strictly less than 1, an asymptotics has been derived for continuation probabilities of derivation trees of context-free language words having a height more than t, at t ^ <».
Keywords: context-free language, stochastic context-free grammar, stochastic process, probability, derivation tree, matrix of first moments, Perron root.