Научная статья на тему 'Минимизация синтаксических диаграмм с многовходовыми компонентами'

Минимизация синтаксических диаграмм с многовходовыми компонентами Текст научной статьи по специальности «Математика»

CC BY
74
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
ФОРМАЛЬНЫЙ ЯЗЫК / СИНТАКСИЧЕСКАЯ ДИАГРАММА / ОТНОШЕНИЕ ЭКВИВАЛЕНТНОСТИ / МИНИМИЗАЦИЯ / FORMAL LANGUAGE / SYNTAX DIAGRAM / EQUIVALENCE RELATION / MINIMIZATION

Аннотация научной статьи по математике, автор научной работы — Рязанов Юрий Дмитриевич

Рассмотрена задача минимизации синтаксических диаграмм. Для её решения диаграммы Вирта (ДВ) преобразуются в синтаксические диаграммы с многовходо-выми компонентами (СД), которые по структуре совпадают с ДВ, но отличаются тем, что нетерминалы в нетерминальных вершинах заменяются начальными узлами соответствующих компонент. На множестве узлов СД вводится отношение, обладающее свойством эквивалентности, которое разбивает множество узлов на классы эквивалентности. Доказано, что «стягивание» класса эквивалентности в один узел является эквивалентным преобразованием. Если классу эквивалентности принадлежат узлы различных компонент, то в результате «стягивания» происходит соединение компонент в одну, которая имеет несколько входов. Предложены алгоритмы разбиения множества узлов на классы эквивалентности и построения СД. Приводится пример, показывающий, что построенная по предложенным алгоритмам СД значительно меньше эквивалентной ей ДВ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Minimization of syntax diagrams with multiport components

The minimization problem for syntax diagrams is considered. For this purpose, we transform the Wirth diagrams (WD) into syntax diagrams with multiport components (SD), which are similar to WD in their structure, but differ in the fact that the non-terminals in nonterminal nodes are replaced with the starting nodes of the corresponding components. On the set of SD nodes, we introduce a relation which possesses the equivalence property, dividing the set of nodes into equivalence classes. We prove that uniting an equivalence class into one node is an equivalence transformation. If an equivalence class includes the nodes of various components, then, as a result of uniting the class into one node, the components are united into one component, which has several inputs. The algorithms for dividing the set of nodes into equivalence classes and plotting a SD are suggested. The algorithm for dividing the set of nodes into equivalence classes is based on a serial partitioning of the set of nodes into subsets so that non-equivalent nodes fall into different subsets. After partitioning the set of nodes into equivalence classes, an SD is constructed. In the SD construction algorithm, for each equivalence class, the following actions are executed: only one node from the class is left in the SD, the remaining nodes of the class are deleted, and if some arc in the source diagram is going to the deleted node, then it is redirected to one of remaining nodes. We give an example which demonstrates that a SD plotted by the suggested algorithms is considerably smaller than the equivalent WD. The resulting SD, after minimization process, can be used to construct memory efficient programs for formal languages processing.

Текст научной работы на тему «Минимизация синтаксических диаграмм с многовходовыми компонентами»

2018 Математические основы информатики и программирования №41

МАТЕМАТИЧЕСКИЕ ОСНОВЫ ИНФОРМАТИКИ И ПРОГРАММИРОВАНИЯ

УДК 519.766.2

МИНИМИЗАЦИЯ СИНТАКСИЧЕСКИХ ДИАГРАММ С МНОГОВХОДОВЫМИ КОМПОНЕНТАМИ1

Ю. Д. Рязанов

Белгородский государственный технологический университет им. В. Г. Шухова,

г. Белгород, Россия

Рассмотрена задача минимизации синтаксических диаграмм. Для её решения диаграммы Вирта (ДВ) преобразуются в синтаксические диаграммы с многовходо-выми компонентами (СД), которые по структуре совпадают с ДВ, но отличаются тем, что нетерминалы в нетерминальных вершинах заменяются начальными узлами соответствующих компонент. На множестве узлов СД вводится отношение, обладающее свойством эквивалентности, которое разбивает множество узлов на классы эквивалентности. Доказано, что «стягивание» класса эквивалентности в один узел является эквивалентным преобразованием. Если классу эквивалентности принадлежат узлы различных компонент, то в результате «стягивания» происходит соединение компонент в одну, которая имеет несколько входов. Предложены алгоритмы разбиения множества узлов на классы эквивалентности и построения СД. Приводится пример, показывающий, что построенная по предложенным алгоритмам СД значительно меньше эквивалентной ей ДВ.

Ключевые слова: формальный язык, синтаксическая диаграмма, отношение эквивалентности, минимизация.

DOI 10.17223/20710410/41/9

MINIMIZATION OF SYNTAX DIAGRAMS WITH MULTIPORT COMPONENTS

Yu. D. Ryazanov

Belgorod State Technological University named after V. G. Shukhov, Belgorod, Russia

E-mail: razanov.yd@bstu.ru

The minimization problem for syntax diagrams is considered. For this purpose, we transform the Wirth diagrams (WD) into syntax diagrams with multiport components (SD), which are similar to WD in their structure, but differ in the fact that the non-terminals in nonterminal nodes are replaced with the starting nodes of the corresponding components. On the set of SD nodes, we introduce a relation which possesses the equivalence property, dividing the set of nodes into equivalence classes. We prove that uniting an equivalence class into one node is an equivalence transformation. If an equivalence class includes the nodes of various components, then,

1 Работа поддержана грантом РФФИ № 16-07-00487.

as a result of uniting the class into one node, the components are united into one component, which has several inputs. The algorithms for dividing the set of nodes into equivalence classes and plotting a SD are suggested. The algorithm for dividing the set of nodes into equivalence classes is based on a serial partitioning of the set of nodes into subsets so that non-equivalent nodes fall into different subsets. After partitioning the set of nodes into equivalence classes, an SD is constructed. In the SD construction algorithm, for each equivalence class, the following actions are executed: only one node from the class is left in the SD, the remaining nodes of the class are deleted, and if some arc in the source diagram is going to the deleted node, then it is redirected to one of remaining nodes. We give an example which demonstrates that a SD plotted by the suggested algorithms is considerably smaller than the equivalent WD. The resulting SD, after minimization process, can be used to construct memory efficient programs for formal languages processing.

Keywords: formal language, syntax diagram, equivalence relation, minimization.

Введение

Синтаксические диаграммы Вирта представляют собой наглядный, интуитивно понятный графический способ задания синтаксиса языка, они используются для документирования языков программирования [1, 2] и в проектировании трансляторов [37]. Для построения трансляторов линейной сложности применяются детерминированные синтаксические диаграммы [8, 9], при этом размер транслятора зависит от размера синтаксической диаграммы. Поэтому с целью уменьшения размера транслятора целесообразно использовать «компактные» синтаксические диаграммы.

Характерной особенностью классических синтаксических диаграмм Вирта является то, что каждая компонента имеет ровно один вход и один выход. Эти ограничения позволяют легко строить наглядные и понятные диаграммы для задания контекстно-свободных языков.

В работе рассматриваются синтаксические диаграммы, в которых снято ограничение на количество входов в компонентах. Это позволяет сократить количество компонент и узлов диаграммы. Для сокращения количества компонент и узлов вводится отношение на множестве узлов, обладающее свойством эквивалентности, и предлагается алгоритм, позволяющий разбить множество узлов на классы эквивалентности и на основе этого преобразовать исходную диаграмму в более компактную.

Платой за компактность представления языка в виде синтаксической диаграммы с многовходовыми компонентами является некоторое снижение наглядности по сравнению с классическими диаграммами. Снижение наглядности представления языка в данном случае не является существенным, так как все преобразования могут быть выполнены автоматически по описанным алгоритмам.

В первой части работы поясняются понятия, связанные с диаграммами Вирта (ДВ), необходимые для дальнейшего изложения. Во второй части даётся определение синтаксической диаграммы с многовходовыми компонентами (СД) и способ преобразования ДВ в эквивалентную ей «вырожденную» СД. Далее определяются отношение на множестве узлов СД, названное отношением сильной эквивалентности; преобразование СД, сохраняющее сильную эквивалентность; алгоритм разбиения множества узлов на классы эквивалентности и сокращения СД. Все алгоритмы сопровождаются примерами их применения.

1. Синтаксические диаграммы Вирта

На рис. 1 представлен пример синтаксической диаграммы Вирта. Эта ДВ состоит

>( а )->Ф->

10 -►

У16

Н ъ --►

в

и

—►

А

б

12

а

17

"И Ъ

1

13

-М ь

М С

в

и

8

В

14

18

■М Ь

9

В

15

Рис. 1. Синтаксическая диаграмма Вирта

из трёх компонент, соответствующих нетерминалам Б, А и В (Б — начальный нетерминал). Прямоугольниками изображены нетерминальные вершины, в которые вписаны нетерминалы, кружками — терминальные вершины, в которые вписаны терминалы, жирными точками — узлы, обозначенные натуральными числами. Множество дуг разбивается на четыре подмножества:

1) входящие дуги, которые входят в узлы из одной точки входа;

2) выходящие дуги, которые выходят из узлов и входят в одну точку выхода;

3) внутренние дуги, которые связывают либо узлы с терминальными или нетерминальными вершинами, либо терминальные или нетерминальные вершины с узлами;

4) е-дуги, связывающие между собой узлы (в примере на рис. 1 таких дуг нет). Точки входа и выхода на диаграмме не показываются. Узлы, в которые входят

входящие дуги, называются начальными (в примере на рис. 1 начальными являются узлы 1, 2 и 3), а узлы, из которых выходят выходящие дуги,—заключительными (в примере на рис. 1 заключительными являются узлы 16, 17 и 18).

С помощью ДВ можно получить (вывести) любую цепочку языка, заданного этой ДВ. Рассмотрим подробно способы получения цепочки языка.

Пусть ДВ G состоит из компонент G1,G2,... , G\n|, где |N| —мощность множества нетерминалов. Рассмотрим некоторой путь в компоненте Gi от узла u до какого-либо заключительного узла в этой компоненте. Пройдём по нему и в процессе прохождения будем добавлять в изначально пустую цепочку а символы, записанные в терминальных и нетерминальных вершинах. Цепочку а будем называть цепочкой, связывающей узел u с заключительным узлом компоненты Gi. Множество всех цепочек, связывающих узел u с каким-либо заключительным узлом, образует язык L(u). Очевидно, что язык L(Gi) равен объединению всех L(uj), где uj —начальный узел компоненты Gi. Вывод цепочки языка, заданного ДВ, можно выполнить по следующему правилу:

1. Записать цепочку, принадлежащую языку L(Gi), где компонента Gi соответствует начальному нетерминалу.

2. Если цепочка содержит некоторый нетерминал Ni, то заменить его цепочкой языка L(Gi) и выполнить п. 2, иначе — вывод закончить.

Ниже представлен вывод цепочки в ДВ, изображенной на рис. 1:

S ^ aAa ^ abBba ^ abcba.

Процесс вывода терминальной цепочки в ДВ можно представить и по-другому — как «движение» по дугам от точки входа начальной компоненты к точке выхода. При этом если дуга идёт в терминальную вершину, то вписанный в неё символ добавляем в терминальную цепочку; если в нетерминальную, то переходим в соответствующую компоненту и движемся по ней аналогичным образом до точки выхода, после чего возвращаемся в предыдущую компоненту и продолжаем движение. После прохождения выходной дуги начальной компоненты в терминальную цепочку добавляем концевой маркер (Ч) и вывод заканчивается.

Символ x, который может быть добавлен в терминальную цепочку непосредственно после прохождения дуги e, принадлежит множеству выбора дуги e (x Е ВЫБОР(е)).

В множестве ДВ можно выделить класс детерминированных ДВ. В детерминированной ДВ каждая компонента имеет только один начальный узел, не содержит е-дуг и каждый её узел детерминированный. Узел является детерминированным, если множества выбора любых двух дуг, выходящих из него, не пересекаются. Детерминированные ДВ являются основой для построения программ-распознавателей линейной сложности [8, 9], поэтому в дальнейшем будем рассматривать только детерминированные ДВ.

2. Синтаксические диаграммы с многовходовыми компонентами

Синтаксическую диаграмму с многовходовыми компонентами (СД) определим восьмеркой R = (T, U,U' ,U'',u0,G, FT ,FV), где

— T — конечное множество терминалов;

— U — конечное множество узлов;

— U' — конечное множество начальных узлов, U' С U;

— U'' — конечное множество заключительных узлов, U'' С U;

— u0 — стартовый узел, u0 Е U';

— G = (V,E) —ориентированный граф, V = VT U VN U U, VT — множество терминальных вершин, VN —множество нетерминальных вершин; E = E1 U E2, E1 С С U х (Vt U Vn) — множество дуг, выходящих из узлов и входящих в терминальные или нетерминальные вершины; E2 С (Vt U Vn) х U — множество дуг, выходящих из терминальных или нетерминальных вершин и входящих в узлы;

— Ft : VT ^ T — отображение множества терминальных вершин в множество терминалов;

— Fjj : VN ^ U' — отображение множества нетерминальных вершин в множество

начальных узлов.

Терминальная вершина изображается на диаграмме кружком, в который вписан терминал в соответствии с отображением Ft. Нетерминальная вершина изображается прямоугольником, в который вписан узел из множества начальных узлов в соответствии с отображением Fj. Узел изображается жирной точкой, которая отмечается соответствующим номером. Начальные узлы отмечаются входящей стрелочкой, стартовый узел — жирной входящей стрелочкой, заключительные — выходящей стрелочкой. Дуга может выходить из терминальной или нетерминальной вершины и входить в узел, или выходить из узла и входить в терминальную или нетерминальную вершину. В каждую терминальную и нетерминальную вершину входит только одна дуга; из них выходит только одна дуга. На количество дуг, входящих в узлы и выходящих из узлов, ограничений нет.

Определим способ получения цепочки языка, заданного СД.

Будем говорить, что цепочка а, состоящая из терминалов и/или начальных узлов, связывает узел u СД с заключительным узлом Uk, если её можно получить, «двигаясь» в СД от узла u к узлу Uk и выписывая из вершин по пути символы (терминалы или начальные узлы) в изначально пустую цепочку. Множество всех цепочек, связывающих узел u с заключительными узлами, обозначим L(u). Чтобы получить цепочку языка, заданного СД со стартовым узлом u0, возьмём цепочку, принадлежащую L(u0). Если она содержит некоторый начальный узел u^, заменим его на цепочку из множества L(ui). Если новая цепочка содержит начальный узел, то аналогичные действия повторяем. Полученная таким образом цепочка, не содержащая начальных узлов, принадлежит языку, заданному СД.

ДВ можно преобразовать в эквивалентную ей СД, заменив записанный в каждой нетерминальной вершине нетерминал на его начальный узел и определив начальный узел начальной компоненты (соответствующей начальному нетерминалу) стартовым. На рис. 2 представлена СД, полученная из ДВ (рис. 1).

Сравнивая способы получения цепочек языка по ДВ и СД, можно сделать вывод, что язык, заданный ДВ, равен языку, заданному СД, полученной из ДВ описанным способом.

Процесс получения одной из цепочек языка, заданного СД на рис. 2, можно представить следующим образом:

1 ^ а2а ^ ab3ba ^ abcba.

Такой способ преобразования позволяет получить «вырожденную» СД, в которой каждая компонента имеет один вход. Преобразования, описанные далее, позволят получить СД с многовходовыми компонентами и меньшим количеством компонент.

Для СД точно так же, как для ДВ, определяются понятия множество выбора дуги и детерминированность. В дальнейшем будем рассматривать СД, полученные из детерминированных ДВ, следовательно, СД тоже будут детерминированными.

-и «

-И Ъ

4

5

10

11

-И а

¥-

-и «

■М Ъ

б

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7

12

13

-И а

л

17

М Ъ

8

9

■м с

14

15

-И ь

18

Рис. 2. Синтаксическая диаграмма с многовходовыми компонентами

3. Отношение сильной эквивалентности

Для определения отношения сильной эквивалентности на множестве узлов введём следующие обозначения:

1) (иг,1,и]) —указывает на то, что в СД существует путь длины два из узла щ в узел щ, дуга из узла щ идёт в вершину с терминалом ¿, а из неё идёт дуга в узел щ;

2) (иг, М, ик, и]) — указывает на то, что в СД существует путь длины два из узла щ в узел и], дуга из узла щ с множеством выбора М идёт в вершину с узлом ик, а из неё идёт дуга в узел и].

Пара узлов (иг,Щ) принадлежит отношению Е°, если выполнены следующие условия:

1) путь (иг,Ь, и]) существует тогда и только тогда, когда существует путь (и'г,Ь, и]) и (иг, и]) Е Е°, где Ь принадлежит множеству терминалов;

2) путь (щ,М,ик,и]) существует тогда и только тогда, когда существует путь (и'г,М,и'к,и]), (и],и]) Е Е° и (ик,ик) Е Е°, где ик и и'к принадлежат множеству начальных узлов;

3) иг Е и" тогда и только тогда, когда Щ Е и".

Из определения отношения Е° следует, что цепочка а связывает узел иг с заключительным узлом тогда и только тогда, когда цепочка а' связывает узел Щ с заключительным узлом, где а и а' — цепочки одинаковой длины и г-й символ цепочки а либо равен г-му символу цепочки а' (аг = а^), либо пара начальных узлов (аг ,а[) принадлежит отношению Е°. Цепочки а и а' назовём сильно эквивалентными, а отношение Е° — отношением сильной эквивалентности.

На множествах цепочек введём следующие операции сравнения:

1) Ь1 С° Ь2 — истина, если для каждой цепочки множества Ь1 существует сильно эквивалентная цепочка из множества Ь2, иначе — ложь;

2) Ь1 =° Ь2 тогда и только тогда, когда Ь1 С° Ь2 и Ь2 С° Ь\.

Операции =° и С° будем называть соответственно равенством и включением. Отношение Е° можно теперь определить так:

Е° = {(иг,Щг): Ь(щ) =° Ь(п'г)}.

Очевидно, что

1) если Ь1 = Ь2, то Ь1 =° Ь2;

2) если Ь1 С Ь2, то Ь1 С° Ь2;

3) Ь1 и Ь2 С° Ь3 тогда и только тогда, когда Ь1 С° Ь3 и Ь2 С° Ь3.

Для множеств ¿1, Ь2, Ь3 и Ь4, таких, что Ь1 =° Ь3 и Ь2 =° Ь4, верно:

1) Ь1 и Ь2 =° ¿3 и Ь4;

2) Ь1Ь2 =° Ь3Ь4;

3) Ь1 =° Ь*3.

Рассмотрим две СД К = (Т, и1, и'1, и''1,п10, С1,Е^, Е£) и К = (Т, и2, и'2, и''2, и2, С2, Е^, Еи), такие, что (и0,и€ Е°. Докажем, что Ь(К1) = Ь(К2), т. е. эти СД определяют один и тот же язык.

Пусть на первом шаге вывода в СД К1 получена промежуточная цепочка а, принадлежащая языку Ь(и0). Из Ь(и0) =° Ь(и2) следует, что на первом шаге вывода в СД К2 можно получить промежуточную цепочку а', сильно эквивалентную цепочке а. Далее на каждом шаге вывода в СД К1 и К2 будем получать сильно эквивалентные цепочки вплоть до терминальной цепочки. Терминальные сильно эквивалентные цепочки равны.

Пусть на первом шаге вывода в СД К2 получена промежуточная цепочка а, принадлежащая языку Ь(и0). Из Ь(и0) =° Ь(и2) следует, что на первом шаге вывода в СД К1 можно получить промежуточную цепочку а', сильно эквивалентную цепочке а. Далее на каждом шаге вывода в СД К1 и К2 будем получать сильно эквивалентные цепочки вплоть до терминальной цепочки. Терминальные сильно эквивалентные цепочки равны.

В любом случае терминальные цепочки, которые можно получить при выводе в одной СД, можно получить и в другой СД.

4. Преобразование, сохраняющее сильную эквивалентность

Допустим, что над СД К1 = (Т,и1 ,и'1 ,и''1 ,и\,С1, Е^, Е^) выполнено преобразование и в результате получена СД К2 = (Т,и2,и'2,и''2,и^,С2,ЕТ2,Ец), такая, что (и0,и1) € Е°. В этом случае будем говорить, что над СД К1 выполнено преобразование, сохраняющее сильную эквивалентность. Результат преобразования — СД К2, которая эквивалентна СД К1. Рассмотрим преобразование СД, сохраняющее сильную эквивалентность.

Пусть в СД Кг = (Т,и,и'1,и",и0,С1Ет ,Ец): и'1 = {и0,Щ,...щ ,...,ип} — множество начальных узлов; (иг, Щ) Е Е°; узлы щ и Щ не являются начальными. Преобразование заключается в том, что все дуги, входящие в узел иг, перенаправляются в узел и'г. В результате преобразования получается СД К2 = (Т, и, и'2, и'', и0,С2,Ет,Ец).

Докажем, что это преобразование сохраняет сильную эквивалентность. Из множества начальных узлов и11 выбираем произвольно узел и^. Введём следующие обозначения:

1) L1(uf ,щ) —множество цепочек, связывающих начальный узел Uf с узлом иг в исходной СД;

2) Ьг(иг,и") —множество цепочек, связывающих узел щ с заключительными узлами и'' в СД Кг;

3) L1(uf, иг, и'') —множество цепочек, связывающих начальный узел Uf с заключительными узлами и'', соответствующих путям, проходящим через узел иг в СД Кг; L1(uf,иг,и") = L1(uf,иг)Ьг(иг,и'') —множество L1(uf,иг,и'') равно конкатенации множеств L1(uf ,щ) и L1(ui, и'');

4) L1(uf, щ, и'') —множество цепочек, связывающих начальный узел Uf с заключительными узлами и'', соответствующих путям, не проходящим через узел иг в СД Кг;

5) L1(uf, и'') —множество цепочек, связывающих начальный узел Uf с заключительными узлами и'' в СД Кг; L1(uf,и") = L1(uf,иг,и'') и L1(uf,щг,и'') =

= Ll(uf,щ^1(щ,и") и Ll(uf,Щ, и'');

6) L2(uf,Щ) —множество цепочек, связывающих начальный узел Uf с узлом Щ в СД К2; L2(uf ,Щ) = Ll(uf ,Щ) и Ll(uf ,щ);

7) L2(uf, и'г, и'') —множество цепочек, связывающих начальный узел Uf с заключительными узлами и'', соответствующих путям, проходящим через узел Щ в СД К2;

L2(uf,Щг,и") = L2(uf,и'') = ,и'г) и Ll(uf,и'') =

= Ll(uf ,и^г(и[,и") и Ll(uf ,щ^(и[,и'');

8) L2(uf, и'') —множество цепочек, связывающих начальный узел Uf с заключительными и'' в СД К2;

L2(uf ,и'') = L2(uf ,иг,и'') и Ll(uf ,Щ, и'') = = Ll(uf ,и'^1(иг,и") и Ll(uf ,иг^1(иг,и") и Ll(uf ,Щ, и'').

Для доказательства того, что рассматриваемое преобразование сохраняет сильную эквивалентность, необходимо доказать, что L1(uf, и'') =° L2(uf, и''), т. е.

Ll(uf ,иц^1(иг, и'') и Ll(uf,щ, и'') =° =° Ll(uf ,и^1(и^,и'') и Ll(uf ,и'') и Ll(uf ,Щ, и'').

В свою очередь, L1(uf, и'') =° L2(uf, и''), если имеют место включения 1) L1(uf, и'') С

С °L2(uf,и'') и 2) L2(uf,и'') С °Ll(uf,и'').

1. Ll(uf,и'') С° L2(uf,и''), если

Ll(uf и'') С° L2(uf, и'') и L1(uf ,Щ, и'') С °L2(uf, и'').

Истинность первого условия следует из того, что L1(uf ,ui)L1(u'i, и'') С° L2(uf, и'') по определению и L1(ui, и'') =° L1(uli, и''), так как (иг,и'г) Е Е°.

Истинность второго условия следует из того, что любая цепочка из множества Ь1(и/,й1,и") включена либо в Ь1(и/,и'г)Ь1(и'г,и''), либо в Ь1(и/,и,и''), т.е. она соответствует либо пути, проходящему через узел иг, либо пути, не проходящему через узел и'.

2. Ь2(и/,и'') С° ¿1(и/,и''), если

Ь1(и/ ,и'г )Ь1(и'г ,и'') С° Ь1 (и/ ,и''), Ь1(и/,иг)Ь1(иг,и'') С° Ь^и/, и'') и ¿1(и/,и,и'') с° ь1 (и/,и'').

Истинность первого условия следует из того, что любая цепочка из множества Ь1(и/,и'г)Ь1(и'г,и'') включена либо в Ь1 (и/,иг)Ь1 (иг,и''), либо в Ь1(и/,щ, и''), т.е. она соответствует либо пути, проходящему через узел и , либо пути, не проходящему через узел и .

Истинность второго условия следует из того, что Ь1(и/,иг)Ь1(иг,и'') С Ь1(и/,и'') по определению и Ь1(иг, и'') =° Ь1(и'г, и''), так как (иг,и'г) € Е°.

Истинность третьего условия следует из того, что любая цепочка из множества Ь1(и/,й~г,и") включена либо в Ь1(и/,иг)Ь1(иг,и''), либо в Ь1(и/,й~г,и"), т.е. она соответствует либо пути, проходящему через узел и , либо пути, не проходящему через узел и .

Таким образом, Ь1(и/, и'') =° Ь2(и/, и''), следовательно, рассматриваемое преобразование сохраняет сильную эквивалентность.

После выполнения преобразования в узел иг не будет входить ни одна дуга. Он станет недостижимым из начальных узлов, поэтому его нужно удалить вместе с выходящими дугами, вершинами (терминальными и нетерминальными), в которые входят эти дуги, и дугами, выходящими из удаляемых терминальных и нетерминальных вершин. В результате выполнения описанных действий может получиться СД с узлами, в которые не входят дуги. Исключение недостижимых узлов, дуг, терминальных и нетерминальных вершин необходимо повторять, пока это возможно.

Если узел иг начальный или стартовый, то узел и' нужно сделать соответственно начальным или стартовым. Узел иг будет недостижимым, и его нужно удалить по описанным выше правилам. После этого некоторые нетерминальные вершины будут содержать несуществующий узел иг. В таких вершинах его нужно заменить на и'.

Рассмотренное преобразование можно назвать «стягиванием» сильно эквивалентных узлов в один узел. Очевидно, что таким образом можно «стянуть» в один узел класс сильно эквивалентных узлов, что уменьшит размер СД. Если при этом «стягиваемые» узлы принадлежат различным компонентам, то происходит соединение компонент в одну, в которой начальными узлами будут начальные узлы соединяемых компонент. Таким образом появляются компоненты со многими входами.

5. Разбиение множества узлов на классы эквивалентности по отношению сильной эквивалентности

Отношение сильной эквивалентности определяет разбиение множества узлов СД на классы эквивалентности. Применим метод последовательного разбиения.

Сначала разобьём узлы СД на подмножества так, чтобы заключительные узлы попали в одно подмножество, а все остальные — в другое. Для СД на рис.2 это будут подмножества ^ = {1, 2, 3, 4, 5,6, 7, 8, 9,10,11,12,13,14,1б} и д2 = {16,17,18}, которые образуют разбиение К =

Узлы, принадлежащие различным подмножествам, явно неэквивалентны (для них нарушено третье условие сильной эквивалентности); два узла из одного подмножества

могут быть неэквивалентными, так как при разбиении мы не учитывали первое и второе условия принадлежности пары узлов отношению сильной эквивалентности.

Для учёта этих условий построим таблицу Т, в которой столбцы соответствуют узлам СД, а строки — терминалам. Клетку таблицы в строке Ь и столбце и будем обозначать Т[Ь,и].

Пути (иг,Ь,и^) соответствует клетка Т[¿,иг]. Если и^ € Qr, то в клетку Т[Ь,иг] запишем г. Пути (иг,М,иь,и2) соответствуют клетки Т[Ь,иг], такие, что Ь € М. Если иу € Qr и иь € Qs, то в клетку Т[Ь,иг] запишем (г, в). Если узлы иг и и\ принадлежат одному подмножеству и Т[¿,иг] = Т\Ь,и'г\, то это говорит о том, что пара узлов иг и и'г не принадлежит отношению сильной эквивалентности и узлы иг и и'г нужно включить в разные подмножества нового разбиения Я'.

Анализируя таблицу Т, формируем новое разбиение Я'. Подмножество Q'k разбиения Я' формируется из элементов некоторого подмножества Qk разбиения Я: Q'k является максимальным по мощности подмножеством множества Qk, таким, что для каждой пары узлов иг и и'г, принадлежащих подмножеству Q'k, для всех строк Ь таблицы верно, что Т[Ь,щ] = Т[¿, и^]. Если Я' = Я, то полагаем Я = Я', заново строим таблицу Т по описанным правилам и формируем новое разбиение. Если Я' = Я, то Я' — множество классов эквивалентности.

Первая таблица Т для СД на рис. 2 представлена в табл. 1.

Таблица 1

Терминалы 31 32

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

а 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2

Ь 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2

с 2 2 1 1 1 1 1 1 1 1 1 1 1 1

По табл.1 видно, что подмножество Ql разбивается на подмножества {1}, {2, 3}, {4, 5,6, 7, 8, 9}, {10,12,14}, {11,13,15}, а подмножество Q2 не разбивается. В результате получаем разбиение {{1}, {2, 3}, {4, 5, 6, 7, 8,9}, {10,12,14}, {11,13,15}, {16,17,18}}. По нему строим новую таблицу Т (табл. 2).

Таблица 2

Терминалы З1 З2 Зз 3А 35 Зе

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

а 3 3 3 4 5 4 5 4 5 6 6 6

2 2 2 2 2 2

Ь 3 3 3 4 5 4 5 4 5 6 6 6

2 2 2 2 2 2

с 6 6 4 5 4 5 4 5

2 2 2 2 2 2

По табл. 2 видно, что подмножество Q3 = {4, 5, 6, 7, 8, 9} разбивается на подмножества {4, 6, 8} и {5, 7, 9}, а остальные подмножества не разбиваются. В результате получаем разбиение {{1}, {2, 3}, {4,6, 8}, {5, 7,9}, {10,12,14}, {11,13,15}, {16,17,18}}. По нему строим табл. 3.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Таблица 3

Терминалы Яз Я4 Я5 Яб Яг

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

а 3 3 3 5 5 5 6 6 6 7 7 7

2 2 2 2 2 2

Ь 4 4 4 5 5 5 6 6 6 7 7 7

2 2 2 2 2 2

с 7 7 5 5 5 6 6 6

2 2 2 2 2 2

В табл. 3 нет различных столбцов, соответствующих узлам, принадлежащим одному подмножеству. Поэтому полученное разбиение является разбиением на классы эквивалентности.

6. Минимизация синтаксической диаграммы с многовходовыми компонентами на основе отношения сильной эквивалентности

Используя отношение сильной эквивалентности на множестве узлов СД Кг, можно построить СД К2, эквивалентную Кг, которая будет иметь не больше узлов и компонент, чем Кг, а компоненты К2 могут иметь большее количество входов, чем компоненты Кг. Сокращение количества узлов достигается за счёт «стягивания» всех узлов, принадлежащих одному классу сильной эквивалентности, в один узел.

Для преобразования СД К1 в СД К2 удобно К1 представить в виде таблицы и преобразовать её в таблицу К2 (СД К2 будем называть сокращённой). Столбцы таблицы соответствуют узлам СД, а строки — терминалам и начальным узлам, которые встречаются в нетерминальных вершинах. Пути (щ,х,и^) соответствует клетка Т[х,и,\, в которой записан узел Uj. Начальные узлы отметим стрелкой, стартовый узел — жирной стрелкой, а заключительные — символом «1». Таблица СД (рис.2) представлена в табл. 4.

Таблица 4

Таблица синтаксической диаграммы с многовходовыми компонентами

Терминалы

и начальные 1 1 1 1 1 1

узлы

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

а 4 6 8 16 17 18

Ь 5 7 9 16 17 18

с 17 18

2 10 12

3 11 13 14 15

Отношение сильной эквивалентности определяет разбиение множества узлов на классы {{1}, {2, 3}, {4, 6,8}, {5, 7, 9}, {10,12,14}, {11,13,15}, {16,17,18}}. Возьмём по одному узлу из каждого класса и получим множество узлов {1, 2, 4, 5,10,11,16} сокращённой СД. В таблице СД (табл. 4) оставим только те столбцы, которые соответствуют узлам сокращённой СД. Если строка таблицы отмечена узлом, не принадлежащим множеству узлов сокращённой СД, то отметим её сильно эквивалентным ему узлом сокращённой СД. Строки, отмеченные одинаковыми узлами, объединим в одну. Если в клетке полученной таблицы встретится узел, который не принадлежит множеству узлов сокращённой СД, то его нужно заменить на сильно эквивалентный ему

узел сокращённой СД. Если узел сокращённой СД сильно эквивалентен начальному (стартовому) узлу исходной СД, то нужно сделать его начальным (стартовым).

Таблица сокращённой СД, эквивалентной СД на рис. 2, приведена в табл. 5, её графическое представление изображено на рис. 3. Эта СД содержит значительно меньше узлов, чем исходная (рис. 2), и одну компоненту с двумя входами.

Таблица 5 Таблица сокращённой СД

Терминалы

и начальные 1 1 1

узлы

1 2 4 5 10 11 16

a 4 4 16

b 5 5 16

c 16

2 10 11

Заключение

Предложенный метод минимизации позволяет преобразовать диаграмму Вирта в более компактную синтаксическую диаграмму с многовходовыми компонентами. Такая диаграмма может быть использована для построения эффективных по памяти программ-распознавателей линейной сложности.

ЛИТЕРАТУРА

1. Jensen K. and Wirth N. Pascal User Manual and Report. N.Y.: Springer Verlag, 1975. 167p.

2. Jensen K. and Wirth N. Pascal User Manual and Report. Berlin, Heidelberg: Springer Verlag, 1974. 170 p.

3. ЛегаловА.И., Швец Д. А., Легалов И. А. Формальные языки и трансляторы. Красноярск: Сибирский федеральный университет, 2007. 213 с.

4. Карпов Ю. Г. Теория и технология программирования. Основы построения трансляторов. СПб.: БХВ-Петербург, 2005. 272с.

5. Овердлов С. З. Методы трансляции. Вологда: ВоГУ, 2016. 235 с.

6. Овердлов С. З. Конструирование компиляторов. Saarbruken: Lap Lambert, 2015. 571с.

7. Мартыненко Б. К. Синтаксические диаграммы Н. Вирта и граф-схемы в Syntax-техноло-гии // Компьютерные инструменты в образовании. 2014. №2. С. 3-19.

8. Рязанов Ю. Д., Севальнева М. Н. Анализ синтаксических диаграмм и синтез программ-распознавателей линейной сложности // Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика. 2013. №8. С. 128-136.

9. Поляков В. М., Рязанов Ю. Д. Алгоритм построения нерекурсивных программ-распознавателей линейной сложности по детерминированным синтаксическим диаграммам // Вестник БГТУ им. В. Г. Шухова. 2013. №6. С. 194-199.

REFERENCES

1. Jensen K. and Wirth N. Pascal User Manual and Report. New York, Springer Verlag, 1975. 167 p.

2. Jensen K. and Wirth N. Pascal User Manual and Report. Berlin, Heidelberg, Springer Verlag, 1974. 170 p.

3. LegalovA.I., Shvets D. A. and LegalovI.A. Formal'nyye yazyki i translyatory [Formal Languages and Translators]. Siberian Federal University, Krasnoyarsk, 2007. 213 p. (in Russian)

4. Karpov Yu. G. Teoriya i tekhnologiya programmirovaniya. Osnovy postroyeniya translyatorov [The Theory and Technology of Programming. Fundamentals of Translators]. Saint-Petersburg, BHV-Petersburg Publ., 2005. 272 p. (in Russian)

5. Sverdlov S. Z. Metody translyatsii [Methods of Translation]. Vologda, VSU Publ., 2016. 235 p. (in Russian)

6. Sverdlov S. Z. Konstruirovaniye kompilyatorov [Compiler Design]. Saarbruken, Lap Lambert, 2015. 571 p. (in Russian)

7. Martynenko B. K. Sintaksicheskie diagrammy N. Virta i graf-shemy v syntax-tehnologii [Syntactic charts and graph-schemes in the SYNTAX-Technology]. Computer Tools in Education, 2014, no. 2, pp. 3-19. (in Russian)

8. Ryazanov Yu. D. and Seval'neva M. N. Analiz sintaksicheskih diagramm i sintez programm-raspoznavatelej linejnoj slozhnosti [The analysis of syntax diagrams and automatic generation of linear-time programs recognizer]. Belgorod State University Scientific Bulletin. History. Political science. Economics. Information technologies, 2013, no. 8, pp. 128-136. (in Russian)

9. Polyakov V. M. and Ryazanov Yu. D. Algoritm postroeniya nerekursivnyh programm-raspoznavatelej linejnoj slozhnosti po determinirovannym sintaksicheskim diagrammam [Algorithm for not recursive linear-time programs recognizer design from deterministic syntax diagrams]. Bulletin of BSTU named after V. G. Shukhov, 2013, no. 6, pp. 194-199. (in Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.