Научная статья на тему 'О вероятностях продолжения деревьев вывода в разложимых стохастических КС-грамматиках. Докритический случай'

О вероятностях продолжения деревьев вывода в разложимых стохастических КС-грамматиках. Докритический случай Текст научной статьи по специальности «Математика»

CC BY
261
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНТЕКСТНО-СВОБОДНЫЙ ЯЗЫК / СТОХАСТИЧЕСКАЯ КС-ГРАММАТИКА / СЛУЧАЙНЫЙ ПРОЦЕСС / ВЕРОЯТНОСТЬ / ДЕРЕВО ВЫВОДА / МАТРИЦА ПЕРВЫХ МОМЕНТОВ / ПЕРРОНОВ КОРЕНЬ / CONTEXT-FREE LANGUAGE / STOCHASTIC CONTEXT-FREE GRAMMAR / STOCHASTIC PROCESS / PROBABILITY / DERIVATION TREE / MATRIX OF FIRST MOMENTS / PERRON ROOT

Аннотация научной статьи по математике, автор научной работы — Жильцова Лариса Павловна

Рассматривается стохастическая контекстно-свободная грамматика с произвольным числом классов нетерминальных символов без ограничений на порядок следования классов. Соответствующая ей матрица A первых моментов является разложимой. В случае, когда перронов корень матрицы A строго меньше единицы, получена асимптотика для вероятностей продолжения деревьев вывода слов контекстно-свободного языка, высота которых больше t, при t → ∞.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON CONTINUATION PROBABILITIES OF DERIVATION TREES IN DECOMPOSABLE STOCHASTIC CONTEXT-FREE GRAMMARS. A SUBCRITICAL CASE

A stochastic context-free grammar is considered which contains an arbitrary number of classes of nonterminal symbols without any restrictions on the order of the classes. The corresponding matrix A of the first moments is decomposable. In the case when the Perron root of matrix A is strictly less than 1, an asymptotics has been derived for continuation probabilities of derivation trees of context-free language words having a height more than t, at t → ∞.

Текст научной работы на тему «О вероятностях продолжения деревьев вывода в разложимых стохастических КС-грамматиках. Докритический случай»

Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2012, № 4 (1), с. 217-224

УДК 519.713

О ВЕРОЯТНОСТЯХ ПРОДОЛЖЕНИЯ ДЕРЕВЬЕВ ВЫВОДА В РАЗЛОЖИМЫХ СТОХАСТИЧЕСКИХ КС-ГРАММАТИКАХ. ДОКРИТИЧЕСКИЙ СЛУЧАЙ

© 2012 г. Л.П. Жильцова

Нижегородский госуниверситет им. Н.И. Лобачевского larzhil@rambler.ru

Птступола в редакцию 13.05.2012

Рассматривается стохастическая контекстно-свободная грамматика с произвольным числом классов нетерминальных символов без ограничений на порядок следования классов. Соответствующая ей матрица А первых моментов является разложимой. В случае, когда перронов корень матрицы А строго меньше единицы, получена асимптотика для вероятностей продолжения деревьев вывода слов контекстносвободного языка, высота которых больше X, при t ^ да.

Ключевтк слтва: контекстно-свободный язык, стохастическая КС-грамматика, случайный процесс, вероятность, дерево вывода, матрица первых моментов, перронов корень.

Введение

Автором в [3, 4] рассматривались вопросы, связанные с кодированием сообщений, являющихся словами стохастического контекстносвободного языка (стохастического КС-языка), при условии, что матрица первых моментов грамматики неразложима, непериодична и ее максимальный по модулю собственный корень (перронов корень) строго меньше единицы (докритический случай). При неразложимой матрице первых моментов нетерминальные символы грамматики образуют один класс.

В настоящей работе рассматриваются стохастические КС-грамматики с произвольным числом классов нетерминальных символов.

При исследовании возможностей экономного кодирования слов, структурные и вероятностные свойства которых моделируются стохастической КС-грамматикой, в качестве меры эффективности кодирования рассматривается стоимость кодирования, которая определяется на множестве «длинных» слов. В качестве множества таких слов удобно рассматривать множество слов КС-языка, имеющих деревья вывода фиксированной высоты t, при X ^ да. При этом возникает необходимость в вычислении вероятности деревьев вывода, высота которых больше X. Процесс порождения слова в стохастической КС-грамматике можно рассматривать как случайный ветвящийся процесс. По аналогии с теорией ветвящихся процессов вероятность множества деревьев вывода, высота которых больше X, называется вероятностью продолжения.

1. Основные определения и предварительные сведения

Для изложения результатов о контекстносвободных языках будем использовать определения КС-языка и стохастического КС-языка из

[1, 7].

Стохастической КС-грамматикой называется система G = (ут,Ум,R,^, где Ут и Ум - конечные множества терминальных и нетерминальных символов (терминалов и нетерминалов) соответственно; 5 е Ум - аксиома, R - множество правил. Множество R можно представить в k

виде Я = и Я1, где k - мощность алфавита Ум и

,=1

= (г-!,...,г }. Каждое правило Гу из Ri имеет

вид Гу : А ——-^у, ] = ъ..П, где А, е ум,

в у е (Ут и Ум) и ру - вероятность применения правила Гу (вероятность правила ггД которая удовлетворяет следующим условиям: 0 < Ру < 1

п,

^ Ру = 1, символом « » обозначается операция

у=1

итерации, т.е. множество всех слоев в рассматриваемом алфавите.

Для слов а и в из (Ут и Ум) слово в непосредственно выводимо из а (а ^ в), если а = = а^Аа2, в = а^а для некоторых а1,а2 е е (Ут и Ум ) и в грамматике G имеется правило А1 ——^ву. Обозначим через рефлексив-

ное транзитивное замыкание отношения ^. КС-язык, порождаемый грамматикой G, определяется как множество слов LG = (а : 5 а,

о,еУт*}. В работе рассматриваются бесконечные языки.

Каждому слову а КС-языка соответствует последовательность правил грамматики (вывод), с помощью которой а выводится из аксиомы 5. Вероятность вывода определяется как произведение вероятностей правил, образующих вывод. Вероятность слова а определяется как сумма вероятностей всех различных левых выводов для а (при левом выводе очередное правило применяется к самому левому нетерминалу в слове).

Грамматика G называется согласованной,

Пусть а' =

др< (sl,•••, эк)

дs1

. Квадрат-

'Еа

р(а) = 1 (здесь |х| - длина

маЕ_Ъ,|а|<И1

слова х). В работе рассматриваются согласованные КС-грамматики. Согласованная КС-грам-матика G индуцирует распределение вероятностей на множестве слов порождаемого КС-языка L и определяет стохастический КС-язык.

Важное значение имеет понятие дерева вывода. Дерево вывода строится по левому выводу слова следующим образом. Корень дерева помечается аксиомой 5. Пусть при выводе слова а на очередном шаге в процессе левого вывода

применяется правило г.: А1 —-—>Ъ1,Ъ ,...,Ъ1 ,

где Ъ„ е(Уи и Ут), I = 1,...,т. Тогда из самой

левой вершины-листа дерева, помеченной символом А, (при обходе листьев дерева слева направо), проводится т дуг в вершины следующего яруса, которые помечаются слева направо символами Ъ ,Ъ ,...,Ъ. соответственно. После Ау верно А, ^ Ау. В противном случае °на назы-

ная матрица А порядка k, образованная элементами а\, называется матрицей первых мтмен-

ттв грамматики G. Так как матрица А неотрицательна, существует максимальный по модулю действительный неотрицательный собственный корень (перронов корень) [2]. Обозначим этот корень через г.

Известно необходимое и достаточное условие согласованности стохастической КС-грамматики [7]: стохастическая КС-грамматика при отсутствии бесполезных нетерминальных символов (т.е. не участвующих в порождении слов языка) является согласованной тогда и только тогда, когда г < 1. В работе рассматривается случай, когда г < 1. По аналогии с теорией ветвящихся процессов будем называть его докри-тическим. Основные результаты относятся к стохастическим КС-грамматикам с разложимой матрицей [2] первых моментов.

Введем некоторые обозначения. Будем говорить, что нетерминал Ау непосредственно следует за нетерминалом А, (и обозначать А, ^ АД если в грамматике существует правило вида

гу : А1 ——^а1 Ауа2, где а1,а2 е (Ут и Ум) . Рефлексивное транзитивное замыкание отношения ^ обозначим ^*.

Грамматика называется неразложимой, если для любых двух различных нетерминалов А, и

построения дуг и вершин для всех правил грамматики в выводе слова языка все листья дерева помечены терминальными символами (или символом пустого слова X, если лист получен в

результате применения правила гу : А, ———> X)

и само слово получается при обходе листьев дерева слева направо. Высотой дерева называется максимальная длина пути от корня к листу.

Рассмотрим многомерные производящие функции Fi(s'!,s'2,...,5к),, = 1,...,k, где переменная

5, соответствует нетерминальному символу А,. Функция Fi(5!,52,.,5k) строится по множеству правил Я с одинаковой левой частью А, следующим образом. Для каждого правила

—> в„

Гу : Аі

выписывается слагаемое q¡: =

Г1! С12

= Ру-511522 . 5^ , где 1т - число вхождений нетерминального символа Ат в правую часть пра-

вила

(т = !,_,к). Тогда ¥іs2,...,Як) = ЕЦу .

І=1

вается разложимой. Классом нетерминалов назовем максимальное по включению подмножество К с Ум, такое, что А, А у для любых

А, А е к .

Для различных классов К1 и К2 будем говорить, что класс К2 непосредственно следует за классом К1 (и обозначать К1 ^ К 2), если существуют А1 е К1 и А2 е К2, такие, что А1 ^ А2. Рефлексивное транзитивное замыкание отношения ^ обозначим через ^» и назовем отношением следования. Отношение ^ устанавливает на множестве классов нетерминалов частичный порядок. Будем полагать, что классы нетерминалов перенумерованы таким образом, что К1 < Ку тогда и только тогда, когда , <у.

Соответствующая разложимой грамматике матрица первых моментов А имеет следующий вид:

Я =Я

1 °2

Л11 ^12 Л1т-1 A1m

0 А22 A2m-1 A2m

0 0 . А m-1m-1 А m 1- m

V 0 0 . 0 А mm J

(1)

Один класс нетерминалов в матрице первых моментов представлен множеством подряд идущих строк и соответствующим множеством столбцов с теми же номерами.

Для класса K квадратная подматрица, образованная соответствующими строками и столбцами, обозначается через Ац. Блоки, расположенные ниже главной диагонали, - нулевые в силу упорядоченности классов. Подматрица Aj является нулевой, если K не предшествует Kj.

Для каждого класса K матрица Ац неразложима. Без ограничения общности будем считать, что она строго положительна и непериодична. Этого всегда можно добиться, применяя метод укрупнения правил грамматики, описанный в [3]. Метод укрупнения правил позволяет также преобразовать матрицу первых моментов к виду, в котором подматрица Aj > 0 для всех i и j таких, что Ki < * к.. Поэтому в дальнейшем

будем считать, что матрица А обладает перечисленными выше свойствами.

Обозначим v* перронов корень матрицы Aii. Для неразложимой матрицы перронов корень является действительным и простым [2]. В силу структуры матрицы первых моментов V = = тахг{гг} и V > 0.

Пусть J - множество всех номеров i классов, для которых vi = V. Назовем J определяющим множеством. Зафиксируем пару l, h, где l, h е е{1,2,..., m}, и рассмотрим всевозможные последовательности классов Ki < Ki K, ,

*1 i2 ls 7

где i1 = l, is = h. Среди всех таких последовательностей выберем ту, которая содержит наибольшее число классов с номерами из J. Это число обозначим slh.

Дополнительно переупорядочим классы по неубыванию величины s1h, причем при одинаковых значениях s1h сначала поставим классы с номерами из множества J.

Разобьем последовательность классов на группы классов MbM2,... ,MW, при этом класс Kh отнесем к группе M1 при s1h < 1 и к группе Mj при s1h = j (j > 1). Для групп M* и Mj определим s*. как max {slh}. Положим s* = 1.

к, eMi, Kh ем j

Среди последовательностей Kk <Kh Kt ,

где i1 = l и is принимает всевозможные значения, выберем ту, которая содержит наибольшее число классов с номерами из J. Это число обозначим через ql.

Отметим, что для любого Ki є М j при qi > 0 найдется такой класс Kl є М +1, что Kt < * Kl. Для группы Mj через q* обозначим max {q,-}.

K, єМj

Матрицу первых моментов будем также представлять в виде

ГBii Bi2 ... Biw)

B

0

B

(2)

V 0 0 ••• Bww j

где Blh - подматрица на пересечении строк для классов из группы Ml и столбцов для классов из Mh. Очевидно, каждая матрица Bll имеет перронов корень г. Запись Bі) будем применять для обозначения соответствующей подматрицы матрицы At.

Теорема 1 [5]. При t ^ да

Bh >= H,/lh V (1 + 0(1)), где Hlh - матрица, не зависящая от t.

Рассмотрим более подробно некоторые необходимые в дальнейшем свойства матриц Blh и

B^l) при t ^ да.

Группу M1 разобьем на три подгруппы. К первой подгруппе M11 отнесем классы нетерминалов с s11 = 0, ко второй подгруппе M12 - классы с номерами из множества J, к третьей подгруппе M13 - все остальные классы. Подгруппа M11 может быть пустой в том случае, если для кл асса K1 матрица А11 имеет перронов корень г. Каждая следующая группа Mh в силу упорядоченности классов начинается с класса с номером из J. Поэтому Mh при h > 1 разобьем на две подгруппы Mh2 и Mh3, где Mh2 содержит классы с номерами из J, и Mh3 - все остальные классы. Для единообразия для Mh будем рассматривать пустую подгруппу Mh1.

В соответствии с этим разбиением Bll представим в виде

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Г с ^ 11 C 12 с Л ^13

Btt = 0 C 22 C23

V 0 0 C33 J

(3)

где Су - подматрица со строками для классов из Мц и столбцами для классов из М^.

Каждому классу К из Ми или из М13 соответствует перронов корень Г < г, поэтому для С'п и С33 справедливы оценки С'п = о(Г) и С3з = о(г').

Пусть М12 содержит ]2 классов. Любому классу К из М12 соответствует неразложимая подматрица Ац в представлении (1), и классы из М12 попарно несравнимы. Поэтому в силу

свойств неразложимых матриц [6] матрица С22 имеет вид

(и V

и л+г л+1 0

0

ил +2^71+2

0

и .V. .

и1 + л2 и1 +и2 У

(4)

(и V

+У л +1

0 и1+іУн+Л2 у

, где

«=Л+1

ВЦ

0 У"2 и(11 ^(21) V'

¿—Н=Л1+1 ' ' ¿—н

0 У"2 и(21 V(21 ) У" и(21 V(31)

/—4= и +1 і і /—ч= и +1 і '

'л и (11 V (31) «="1+1 і «

0

0

0

соответствующие классам KJ е М12, пропорциональны компонентам левого собственного вектора V/21 ^ = 0 .

Рассмотрим случай I < h. Матрицу В^ пред-

ставим в виде

х г‘ (1 + 0(1)),

где и, и V, - правый и левый собственные положительные векторы матрицы, соответствующие Г, при нормировке Уи = 1, , = ]\ + 1,.. .,/1 + /2. Обозначим матрицу

0 ... 0 0 ^

0 иА+УА+2 ... 0 0

Вл =

V А1

(7)

32

0 0

V

через Б. Очевидно, Б можно представить в виде

У ир V(21)

> =(0,...,0, и,,0,...,0)т ,

У(21 }=(0,...,0,У ,0,...,0), (5)

и и, и V, расположены на местах, соответствующих классу К,. Заметим, что и,11) и V'¡-11) являются соответственно правым и левым собственными векторами матрицы С22 для корня г.

Кроме того, каждому классу К1 е М12 соответствуют правый и левый собственные векторы всей матрицы Вц для перронова корня г.

Компоненты правого собственного вектора можно представить в виде и()= (и,11),и\11),

и,3‘))т , где Ц-]/) соответствует М/, / = 1,2,3. В [5] установлено, что и,31) = 0 и и,-1) = (гЕ - С11 )-1 х х С12и,21). Компоненты левого собственного вектора матрицы Вц для перронова корня г представим в виде ) = (V-11)У^11),у(31)). В [5] также показано, что У^11) = 0 и ) = ^С23 х

х (гЕ - С33 )-1.

Используя описанные векторы, уточним вид матрицы В‘ [5]:

где разбиение по строкам сделано в соответствии с подгруппами Ми, М12 и М13, а по столбцам - в соответствии с подгруппами Мк2 и Мк3. Так как к > 1, подгруппа Мм пустая и не представлена в матрице Вік.

В [5] доказано следующее асимптотическое равенство:

^и,(11)V(2к) У и1(11 )V.(3к^

и и -и ¿-‘и и «

^и,(21) V(2к) У и1(21 ) V(3к)

и л л и л л

0 0

В,

(').

ґік—У,

где и'^1 =-т1-У(р^21)Б21 +^31 Ь&ГЩ*, 5 = 1,2.

З/ь —1 ,■

2. Вероятности продолжения

Через Ql(t) обозначим вероятность множества деревьев вывода, высота которых больше t и корень помечен нетерминалом А1. Эту вероятность назовем вероятностью продолжения по аналогии с теорией ветвящихся процессов. Пусть (А/+1, А/+2,...,А/+к ) - последовательность

нетерминалов, образующих группу М,, где к, -число нетерминалов в М, и / + 1 - номер первого по порядку нетерминала в М,.

Через Q(г)(t) обозначим вектор вероятностей пр°д°лжения (t) = (Q/.+1 (t), Q/+2 (а),., / (t)).

При , = 1 представим Q(г)(t) в виде <2(,) (V) = = ®1(‘)(t), Q2')(t), Qз(')(t))т , а при , > 1 - в виде Q(,)^) = (Q2')(t), Q3(')(t))т , где Ql,)(t) соответст-

г' . (6)

Отметим, что строки матрицы В^ , соответствующие классам К1 е М12, т.е. классам, для которых , е 3 , пропорциональных компонентам правого собственного вектора и,21 ^, а столбцы,

вует подгруппе М,1, I = 1,2,3.

Теорема 2. При V ^ да

и^ V (1 + о(1))

и) tq:-1rt (1 + 0(1))

о(^: -1rt)

Для доказательства теоремы предварительно приведем несколько лемм.

Лемма 1 [6]. Пусть А - неотрицательная неразложимая матрица, г - ее перронов корень, г < 1, и Аа — последовательность матриц, для которых

Г ОН)(' Г

Оі)(') =

V О)(' )у

0<^'<^и^'^0 при '

да. Пусть

0

X

A* =(А - At )(A - At-1 )...(A - A1). Тогда для любого вектора x > 0 выполняется равенство

,• A* x й

lim —— = u , где и и v — соответственно правый

vAt x

и левый собственные положительные векторы, соответствующие г, при нормировке vu = 1.

Пусть F(t,s) = (Fi(t,s),... ,Fk(t,s)) - (векторная) производящая функция, которая определяется как t-я итерация производящей функции F(s) соотношениями:

F (0, s )= s,

F (l, s ) = F (s ), (8)

F (t +1, s ) = F (F (t, s))

Здесь k - общее число нетерминалов в грамматике.

Очевидно, что F(t,1) = 1 для всех t. Известно [6], что Q(t) = I _где Q(t) = (Ö1(t),-,Qt(t)/. Пусть R(t,s) = 1 - F(t,s), в частности, R (t,0 = Q (t)).

Лемма 2. Для стохастической КС-грамма-тики с матрицей первых моментов A вида (2) справедливо равенство

1 - F (s ) = (A - E(s ))(1 - s), (9)

где 0 < E(s) < A, причем элементы матрицы E(s) при 0 < s < 1 удовлетворяют условиям

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ej (s ) = i У Sj, (s )(1 - st),

где

- 5 2 F (s)

лой b =-------------^-L

ds'j dsl

.)

1 - F (s ) = У5?М ,w 4^ 5s,.

(1 - sj), где 0 < 0' < 1

5F.

< a\. Раскладывая —L

j 5s.

s=0' j

аналогичным образом, получаем

^ = aj - -11 Sj, (sX1 - s, H- E„ (s),

где

0 < Sj, (s)<

52 F (s)

5s. 5s,

0 < 5^)< Ь/ (10)

и Е(5) имеет блочный вид (2) при любом s,

0 < s < Т.

(В (10) константы Ь/ определяются форму-

Доказательство. Используя разложение производящей функции Fi(s) в ряд Тейлора в окрестности 1 , можно записать:

Поскольку производящие функции Fi(s) -многочлены с положительными коэффициентами, все их производные являются многочленами с неотрицательными коэффициентами и, следовательно, 0 < —

05,.

5s

Отсюда следуют равенства (9) и (10). Из неотрицательности и монотонности по 5 всех производных производящей функции Fi(s) следует, что 0 < Е(я) < А при любом 0 < 5 < 1 , и матрица Е(5) имеет блочный вид (2). Лемма доказана.

Подставляя в соотношение (10) в качестве 5 вектор F(t,s) и используя равенство (9), получаем

1 - F (а +1,5) = (А - Е^ (а, 5)))(1 - F (а , 5)). (11)

Обозначим E(F(t,s)) через Е,(5), а Е,(0) - через Е, и применим формулу (11) рекурсивно. Тогда

,-1

R(t, 5) = 1 - F (а, 5) = П (А - Е, (5 )^(п, 5) =

1=и (12)

= П (А - Е,(5 ))(1 - 5).

,=1

Здесь и далее будем применять запись

п

П(А - Е (*)) для выражения (А - Еп(5))(А -

1=т

-Еп-1(5)).(А - Ет(5)).

Из (11) и (12) при 5 = 0 следует, что Q(t)=(А - Е- )Q(t -1) =

,-1 ,-1 (13)

= П (А - Е )Q(n) =1^1 (А - Е, )1.

,=п ,=1

Кроме того, из формулы (12) следует, что при любом 5, 0 < 5 < 1 ,

R(t, 5 )= 1 - F (а, 5 )< АА-1 (1 - 5). (14)

Из теоремы 1 следует, что Аа ^ 0 при А ^ да, поэтому F (А, 5 ) ^ 1 и Ит,^» Е,(5) = 0 (поэлементно).

Лемма 3. Для любого 5, 0 < 5 < 1 , справедлива оценка Е, (5). = 0(А5“-Г) при > 1, где I и

h — номера классов, которым принадлежат нетерминалы А, и А/ соответственно.

Доказательство. Из доказательства леммы 2

следует, что Е. (5)<1 у Ь/ (1 - я,). Подставляя

2 ,

в качестве 5 значение F(t,s), получаем неравенство

Е, (5)/ < 2 У Ь‘, (1 - Fl (А, 5)) = 2 у Ь/Д, (А, 5).

2 , 2 ,

Из (14) следует оценка Е{(5). < 0(,"ш-Г).

Лемма доказана.

Доказательство теоремы 2. Доказательство проведем методом математической индукции по числу групп w. Пусть w = 1. Применим представление (12) для Q(t):

s=1

s=1

s=0

Q(t + 1) = П(А - ЕЖп). (15)

=п

Выберем такие г' и п, что г < г' < 1 и Е( <

< (г')пА при А > п. Тогда (1 -(г')п),-п+1А,-п+‘ <

< П (А - Е1) < А,-п+'. Поэтому справедливо

,=п

неравенство А - П (А - Е) (1 - (1 - (г 7),),

=п

где , = А - п + 1.

Оценим разность 1 - (1 - (г')п) :

1 - (1 - (Г 7 У = (г 7 У>7 У <,(г 7.

,=0

Следовательно, при , < п справедливо равен-

ство

П (А — Е ) = А1 (1 + 0(г'')п)

где г” удовлетворяет условию Г < г” < 1.

Уравнение (15) можно переписать в следующем виде:

Q(t + 1) = А (1 + о((г")ф(п) , (16)

и Q1 (, +1) = В1,1 (1 + о((г ")п ))б‘ (п) для w = 1.

Представим Q1(t) в виде б‘(,) = (£>,(1)(,),£(1)(,), Q31) (А))т, где QÍ1* (А) соответствует подгруппе Мп (, = 1,2,3). Из (14) следует, что Q(1)(п) <

< ВЦ-11 = 0(гп). Поэтому, с учетом представления (3) для Вц, справедлива оценка Q31) (А) < С3-1 • 1.

Известно следующее представление для степени произвольной матрицы С [2]:

С' =У (^ + (х', ^ 2 + ... + (х', )(”1—1) 2^),

Через Q[Kг■](t) обозначим вектор вероятностей продолжения для класса нетерминалов К,. Рассмотрим К, е М12. Для него из (18) следует уравнение

Q[K, ](, +1) = (А,, - Е, )2[К, ](,) + 0(,т (г')А), где Е, - подматрица матрицы Е', соответствующая подстрокам для класса К,.

Умножим слева обе части уравнения на вектор V, - левый собственный вектор матрицы А,,, соответствующий перронову корню г. Тогда с учетом оценок при w = 1 для Е, и Q[Kг■ ](,) получим следующее уравнение:

^-К, ](, +1) = гУД[К , ](,)+0(г2А)+0(,т (г 'У).

Введем обозначение х, = У‘^-К' ](а) . Тогда

А гА

предыдущее уравнение перепишется таким образом:

( ( '

х,+, = х, + о(гА)+ О^ ,т ^ г ^

Просуммировав уравнение от 1 до А, получим хг = XI + с + о(1), где константа с получается в результате суммирования сходящихся рядов

( V ^

У 0(7) и У 0

и=1

и=1

и >7

при

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(17)

где X, - корни минимального многочлена у(/) матрицы С, , = 1,.,5, 5 < к, т, - кратность корня

1 А, )(п)

X, для минимального многочлена, ^Х ,) - п-я производная по X, от X,, матрицы Zlj вполне определяются заданием матрицы С и не зависят от А.

Применяя это представление для С3'3, получим, что Q31)(А) < О(,т(г')‘), где г' - перронов корень для С33 и т - его кратность. Отметим, что г' < г.

Используя оценку для Qз(1)(t), запишем уравнение для Q21) (А):

Q2l)(t +1) = (С22 -Е,'^(,)+ о(,т(г). (18)

Здесь Е' - подматрица матрицы Е,, соответствующая С22.

А ^ да. Отсюда ](,) = с,(1)гА (1 + о(1)),

где С1 = х1 + с .

Поскольку матрица А,, неразложима, то учитывая оценку для Е, из леммы 3 и применяя лемму 2, найдем, что Q[K,. ](,) = с,(1)и/ (1 + 0(1)), где и - правый собственный вектор матрицы А,,, соответствующий г.

Таким образом, учитывая, что подгруппу М12 составляют несравнимые классы с перроно-вым корнем г, формулу для Q^1) (А) можно записать в виде Q21) (А) = и "(1)гА (1 + 0(1)), где

и

"(1) _

(О/тМ

=У - ?и

і

Используя (16), запишем уравнение для

О(1) ('):

О(1)(' +1) =

= (^«(п)+С12 )о21)(и)+с1зО31)(п)Х1+0(1))

После подстановки значений для О21) (п),

С111, С2), С13) и оценок для О11) (п) и О31) (п)

получим: О1(1)(') = У с(1и(11)г' (1 + о(1)). Здесь

і

мы учли тот факт, что V21^и"(1) = V¡^и«21) = 1.

гда

Введем обозначение и'(1) = у с^и^ . То- Просу™мировав обе части уравнения по А от 1

, до А, получим х,+1 = х + с,(1А + О(1), где с^Ь -

Ql(1)(t) = и,(1) г(1 + о(1)). Таким обрaзом, ' У(21)(с23и,(2)+Б21и"(2))

сумма ряда У —— --------------------------. Поэтому

ы г

(19) V;(21)Q21)(t +1)= с,(1)Аг,+1(1 + о(1)). (22)

Используя первое уравнение системы (20),

(Q(1)(')\ ( U•(') v‘ (1 і 0(1)\

'ßil)(t) ö21)(t) ö31)(t)

U,(1) г' (1 + 0(1))' U,,(1) Г (1 + o(1)) o(r')

и утверждение теоремы при w = 1 справедливо. запишем УРавнение для ° (А) :

Пусть теперь w = 2. Используя (16), запишем Q^1)(t + l) = (c2-nQ^1)(n) + С^^п)О‘1(п) + D2Т-n1Q22l(n))х

систему для Q(t + 1): , , «

Jö(1)(t+1)=BnQ1)(n)+^1(2-n)Q(2)(n})(1+о(Ип)) (20) _ x(1+o(1))(1+O(r':))'

j Q(2)(t + 1) = (вд(2)(п)](1 + O((rt)).

t+1)=(Bt^BQ(2)(n))(1+ö((r")B)). (20) ПРименим оценки для С2Г, с2з-в) и D2'rn) ,

(2) (2) ,л(2Ь следующие из теоРемы 1, и оЦенки для Q31) (n)

Представим Q '(t) в виде Q ’(t) = (Q2 (t),

и Q22) (n):

Q21)(t+1) =

Q3(2) (А))т , где О/2) (А) соответствует подгруппе М2, (, = 2,3). Применяя доказательство теоремы для w = 1 ко второму уравнению, получим, что ( л. . ..

ГО22)(,)^ Ги"(2) г,(1 + 0(1))^ = I У о((,-п)гА) 1(1 + о((г")п)).

Q (2)(t ) =

Подставляя оценку (22) для F^21Q21)(«),

где U"(2) = у cf U(22) и c(2) - константа, соот- также учитывая, что t - n = [logt], получим, что

' Q21)(t) = y CpUf^tr1(1 + 0(1)). Отсюда следует,

ветствующая классу нетерминалов Kt є М22.

Перейдем к оценке компонент вектора что для класса Kt є М12 вектор Q[K](t) пропор-

Q(1)(t). Применяя равенство (13), запишем урав- Гт(21)

^ ^ „(IV ч v -'і' ционален правому собственному вектору U. '

нение для Q \t):

Q (1)(t +1) = Bq (1)(t) + B12 Q (2)(t))(1 + o(t"12 1 r')).

)(1)

матрицы A...

Наконец, запишем уравнение для Q1(1)(t +1), что Q(1) (t) можно рассматривать и используя систему (20): в качестве Q12) (t), поэтому отсюда следует Q[11) (t + 1) = (Си01(п) + 02п',0Ц',(п) +

оценка 0з(1)(t) = U,(21) г' (1 + о(1)). + С13-п)031)(п) + ^1-п022)(n) + (n))(1 + о((г")п)).

Применяя представления (3) и (7) для Вц и Подставляя в уравнение полученные ранее

В^ а также учитывая оценки для Q(1)(t) и Q^X'X оценки для Q<1)(n), ö31)(n), ö22)(п) и Q3(2) (п), а следующие из (14), запишем уравнение для ,

() также применяя теорему 1 для входящих в

Q21) (t): уравнение матриц и учитывая, что t - п = [logt],

ö21)(t+1)=c22q21)(')+c23ö31)(t)+ад22)(0 + получим, что

+ о(г' )+O^r2t) = QQ^t) + C23U,(2) г' + (21) Q1(1)(t) = У c(1)u.(11)tr'(1 + o(1)) = U ,(11) tr‘(1 + o(1)).

+ D21U"(2) г' + о(г')+ o(ts12-1rъ). Таким образом, доказана справедливость

Умножим обе части уравнения на левый теоремы для w = 2.

„ т,(21) „ Предположим, что теорема 2 справедлива

собственный вектор V. ' матрицы C22, соответ- , ^

^ ‘ * ’ для w - 1 групп. Докажем, что тогда она спра-

ствующий r. что ведлива и для w групп.

V (21Q«(t +1) = rK(21)ö21)(t)+ Запишем уравнение для Q(1)(t):

+ V(21)(c23U ,(2)+D21U "(2))г' + о(г' )+ o(ts12-1r2). Q(1)(t +1)= (BhQ (1)(t)+ B12Q(2)(t)+ (23)

Как и в случае w =1, введем обозначение + B13Q(3)(t)+... + B1wQ(w)(t))(1 + o(tqr‘)).

V (21)Q 21)(t) Для последовательности групп M2,M3,...,Mw

x- =~----:----. Тогда предыдущее уравнение утверждение теоремы справедливо по предположению индукции. Подставим значения

Q1(1)(t), I = 2,.,w в (23). Так как q* имеет наибольшее значение для I = 2, определяющим будет слагаемое B12Q1(2)(t). Поэтому уравнение (23) можно записать в следующем виде:

перепишется таким образом:

V (21)(C23U1(2)+D2p "(2))( ())

Х'+1 = х, + ■ v 23----------^(1 + 0(1)) +

r

-0(ts12-1 г' ).

а

О (1)(, +1) = (впо(1)(0+вх&(2)(а ))(1 + 0(1“/)).

Это уравнение аналогично уравнению для w= = 2. Повторяя рассуждения для w = 2, при этом

учитывая, что О(2) (А) = 0(,“2 V), и рассматри-

V (21)о (1)(,)

вая в качестве х, значение ——, , , получим

утверждение теоремы для w групп нетерминалов. Теорема доказана.

Через Р(Щ) обозначим вероятность деревьев вывода высоты А, корень которых помечен нетерминалом А,. Очевидно, РЩ) = О(А-1) - (А).

Из теоремы 2 вытекает Следствие. Пусть нетерминал А1 е М,1, либо А1 е М,2. Тогда

р(Щ )= ё,К-У-1 (1 - г )(1 + 0(1)), где ё, - компонента вектора и либо вектора и”, соответствующая нетерминалу А,.

Заметим, что в случае, когда А1 е М,3, для

нахождения О,(А) и р(щ‘) следует присоединить М,3 к следующей группе в качестве М,+1>1.

Список литературы

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. Том 1. М.: Мир, 1978.

2. Гантмахер Ф.Р. Теория матриц. М.: Наука, 1967.

3. Жильцова Л.П. Закономерности применения правил грамматики в выводах слов стохастического контекстно-свободного языка // Математические вопросы кибернетики. М.: Наука. 2000. Вып.9. С. 101126.

4. Жильцова Л.П. О нижней оценке стоимости кодирования и асимптотически оптимальном кодировании стохастического контекстно-свободного языка // Дискретный анализ и исследование операций. 2001. Серия 1. Т. 8. № 3. Новосибирск: Издательство Института математики СО РАН. С. 26-45.

5. Жильцова Л.П. О матрице первых моментов разложимой стохастической КС-грамматики // Ученые записки Казанского государственного университета. Физико-математические науки. 2009. Том 151. Книга 2. С. 80-89.

6. Севастьянов В.А. Ветвящиеся процессы. М.: Наука, 1971.

7. Фу К. Структурные методы в распознавании образов. М.: Мир, 1977.

ON CONTINUATION PROBABILITIES OF DERIVATION TREES IN DECOMPOSABLE STOCHASTIC CONTEXT-FREE GRAMMARS. A SUBCRITICAL CASE

L.P. Zhiltsova

A stochastic context-free grammar is considered which contains an arbitrary number of classes of nonterminal symbols without any restrictions on the order of the classes. The corresponding matrix A of the first moments is decomposable. In the case when the Perron root of matrix A is strictly less than 1, an asymptotics has been derived for continuation probabilities of derivation trees of context-free language words having a height more than t, at t ^ <».

Keywords: context-free language, stochastic context-free grammar, stochastic process, probability, derivation tree, matrix of first moments, Perron root.

i Надоели баннеры? Вы всегда можете отключить рекламу.