Научная статья на тему 'Динамические DOM-объекты в ситуационно-ориентированных базах данных: лингвистическое и алгоритмическое обеспечение источников данных'

Динамические DOM-объекты в ситуационно-ориентированных базах данных: лингвистическое и алгоритмическое обеспечение источников данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
274
63
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕБ-ПРИЛОЖЕНИЕ / БАЗА ДАННЫХ / ДИНАМИЧЕСКАЯ МОДЕЛЬ / NOSQL / XML / DOM / PHP / WEB APPLICATION / DATABASE / DYNAMIC MODEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гусаренко Артем Сергеевич, Миронов Валерий Викторович

В рамках ранее разработанной концепции динамических DOM-объектов в составе динамической модели ситуационно-ориентированной базы данных предлагаетсялингвистическое обеспечение, предусматривающее графические и текстовые средства спецификации источников данных для DOM-объектов. Описывается рекурсивный алгоритм интерпретации, учитывающий DOM-элементы, ассоциированные с состояниями динамической модели, который обеспечивает заполнение DOM-объекта XML-koнтентом из специфицированных источников, когда родительское состояние становится текущим. Рассматривается реализация предложенных лингвистических и алгоритмических средств на платформе РНР.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гусаренко Артем Сергеевич, Миронов Валерий Викторович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Dynamic DOMobjects in situationally-orienteddatabases: lingware and knoware of data sources

Under the previously developed concept of dynamic DOM-objects in the dynamic model situation-oriented database is proposed lingware support, providing graphic and text means for the specification data sources DOMobjects. Recursive algorithm interpretation is described, taking into account the DOM-elements associated with the states of the dynamic model, which provides a DOM-filling object XML-based content of the specified sources when the parent state is current. The realization of the proposed lingware and knoware for the platform PHP.

Текст научной работы на тему «Динамические DOM-объекты в ситуационно-ориентированных базах данных: лингвистическое и алгоритмическое обеспечение источников данных»

ЯЛГЙОяО/

Уфа : УГАТУ. 2012____________________________________________________________Т. 16, № 6 (51). С. 167-176

МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ВЫЧИСЛИТЕЛЬНЫХ МАШИН...

УДК 004.65

А. С. Гусаренко, В. В. Миронов

ДИНАМИЧЕСКИЕ DOM-ОБЪЕКТЫ В СИТУАЦИОННО-ОРИЕНТИРОВАННЫХ БАЗАХ ДАННЫХ: ЛИНГВИСТИЧЕСКОЕ И АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИСТОЧНИКОВ ДАННЫХ

В рамках ранее разработанной концепции динамических DOM-объектов в составе динамической модели ситуационно-ориен-тированной базы данных предлагаетсялингвистическое обеспечение, предусматривающее графические и текстовые средства спецификации источников данных для DOM-объектов. Описывается рекурсивный алгоритм интерпретации, учитывающий DOM-элементы, ассоциированные с состояниями динамической модели, который обеспечивает заполнение DOM-объекта XML-koh-тентом из специфицированных источников, когда родительское состояние становится текущим. Рассматривается реализация предложенных лингвистических и алгоритмических средств на платформе РНР. Веб-приложение; база данных; динамическая модель: NoSQL; XML; DOM; РНР

Современные веб-приложения, предоставляющие пользователям динамический контент на основе информации, хранящейся на вебсерверах, обусловливают необходимость поиска новых подходов к организации баз данных. Как альтернатива традиционным (реляционным) базам данных активно развиваются XML-ориен-тированные базы данных, в том числе в рамках движения NoSQL [1].

В работах [2-6] была предложена и получила развитие концепция ситуационно-ориентиро-ванных баз данных (СОБД), предназначенных для использования в динамических веб-прило-жениях. В СОБД данные в формате XML [7] ассоциированы с состояниями встроенной динамической модели. Для динамической модели отслеживаются ее текущие состояния, а данные обрабатываются в контексте состояний.

В данной статье рассматриваются вопросы автоматического формирования XML-данных, ассоциированных с состояниями динамической модели, в лингвистическом и алгоритмическом планах.

ВВОДНЫЕ ЗАМЕЧАНИЯ

Данная статья является продолжением работы [8], в которой была разработана концепция динамических DOM-объектов, автоматически создаваемых и заполняемых XML-контентом в процессе интерпретации динамической модели СОБД. В соответствии с этой концепцией DOM-объекты привязываются к состояниям динамической модели; DOM-объекты создаются, загружаются, используются для обработки

Контактная информация: +7 (347)272-89-81. Работа поддержана грантом РФФИ 10-07-00167-а.

XML-содержимого, когда соответствующие состояния динамической модели становятся текущими. В отличие от известного подхода, где эта функциональность достигается за счет программирования соответствующих функций в подпрограммах-акциях, ассоциированных с состояниями динамической модели, здесь:

• у элементов-состояний динамической модели в качестве дочерних предусматриваются DOM -элементы, у которых, в свою очередь, дочерние элементы-источники задают загружаемые XML-данные, а дочерние элементы-прием-ники - сохраняемое XML-содержимое;

• в ходе интерпретации динамической модели интерпретатором выполняется автоматическое создание DOM-объектов для текущих состояний модели и загрузка XML-данных с возможным преобразованием, а также автоматическое удаление DOM-объектов при смене текущих состояний.

В целом концепция направлена на то, чтобы при разработке динамической модели позволять в декларативной форме гибко специфицировать XML-данные, требуемые в тех или иных ситуациях, и способы их получения из различных источников, избавляя от программирования соответствующей функциональности. В данной статье рассматриваются вопросы реализации этой концепции.

Ключевые идеи. На рис. 1 иллюстрируется процесс формирования XML-содержимого DOM-объекта на основе информации из источников данных. Каждый элемент-источник ссылается на определенный XML-документ, документ нсточннка, хранящийся в памяти ассоциированных данных (ADM).

(xml) Родительский документ Ч<орень

--(xml) Результат источника ^Корень

(xml) Документ источника

Извлечение

■Фильтрация

Очистка

Родительский документ для вложенных источников

Рис. 1. Формирование ХМЬ-содержимого БОМ-объекта на основе информации из источников данных

Он используется источником как основа для формирования XML-данных - результата источника, предназначенного для загрузки в DOM-объект. Результат источника помещается в родительский документ, соответствующий XML-содержимому элемента, родительского по отношению к элементу-источнику.

Источники могут быть вложенными друг в друга. Если элемент-источник непосредственно вложен в DOM-элемент, то его родительским документом является XML-содержимое DOM-объекта, а если элемент-источник сам вложен в другой элемент-источник, то его родительским документом является результат родительского источника.

В простейшем случае результат источника может представлять собой XML-содержимое документа источника. В более сложных ситуациях может потребоваться извлекать из документа источника только определенные, искомые XML-элементы (wanted), отфильтровать их в соответствии с заданными условиями (cond), очистить их внутреннее содержимое от игнорируемых элементов (ignory). В результате искомые XML-элементы могут представлять XML-фрагмент, не имеющий корневого элемента, что может потребовать заключить их внутрьXML-элемента - корня (root).

В простейшем случае результат источника помещается в корневой элемент родительского документа в качестве дочернего элемента. В более сложной ситуации может потребоваться отыскать в родительском документе множество целевых элементов (targs) и продублировать результат источника внутри каждого из них.

XML-технологии предусматривают два основных подхода к обработке документов:

• потоковая обработка - XML-документ обрабатывается потоком по мере чтения его узлов из файла. Документ при этом размещается в оперативной памяти не целиком, а частями. Это позволяет обрабатывать очень большие объемы данных в однонаправленном режиме.

Инструменты потоковой обработки: XMLReader и XMLWriter;

• кэшированная обработка - перед обработкой XML-документ целиком загружается в структурированном виде (в виде дерева) в оперативную память компьютера. Это дает возможность гибкой обработки документов ограниченного объема. Инструменты кэшированной обработки - технология DOM.

Оба этих подхода могут применяться при обработке узлов в документе источника данных.

Дальнейшее изложение. В процессе реализации динамических DOM-объектов прорабатывалось лингвистическое обеспечение, обсуждаемое ниже и включающее языковые средства спецификации источников данных для загрузки, создаваемых DOM-объектов. Такие средства предусматривают возможность задания источников данных как на диаграмме динамической модели, в графическом виде, ориентированном на восприятие человеком, так и в текстовом виде, предназначенном для восприятия интерпретатором.

Исходя из того, что рутина подготовки и загрузки динамических DOM-объектов возлагается на интерпретатор, разработано соответствующее алгоритмическое обеспечение, обсуждаемое ниже и включающее алгоритмы обработки тех элементов динамической модели, которые специфицируют DOM-объекты и источники данных для них. Учитывалось, что необходимые DOM-объекты в модели задаются с помощью DOM-элементов, а элементы -источники данных могут быть вложенными (образовывать иерархию), это обусловило рекурсивный характер алгоритмов.

Проверка работоспособности алгоритмического обеспечения осуществлена путем программирования разработанных алгоритмов на базе языка серверных сценариев РНР с последующим тестированием на примерах.

СРЕДСТВА СПЕЦИФИКАЦИИ ИСТОЧНИКОВ ДАННЫХ

Динамическая модель СОБД задается с помощью формального языка HSM (Hierarchical Situational Models) [7] в виде графической диаграммы, имеющей эквивалентное XML-пред-ставление. Динамические DOM-объекты задаются в составе модели с помощью DOM-элементов и вложенных в них элементов -источников и приемников данных. Синтаксис этих элементов поясняется с помощью синтаксических диаграмм, на которых используются следующие обозначения: метасимвол » означает «по определению»; метасимвол OR - выбор варианта (должен быть выбран один из вариантов); выносные линии, прикрепленные к элементу снизу - атрибуты элемента или его дочерние элементы; темный кружок на выносной линии - обязательный однозначный атрибут; светлый кружок - необязательный однозначный атрибут; светлая стрелка-треугольник -необязательный многозначный атрибут или множественный дочерний элемент; курсивом обозначены значения подстановки.

DOM -элемент. На рис. 2 приведена синтаксическая диаграмма DOM-элемента. По определению этот элемент на графической диаграмме представляется символом, содержащим метку «dom», с атрибутами и вложенными элементами.

DOM-элемент

'■■» -<ЩЩ> Имя_ООМ-элемента

о doc = "Имя_с1ос-элемента" о path = "Полное_имя_хт1-файла"

—> Элемент_источника_данных —[> Элемент_приемника_данных

Рис. 2. Синтаксическая диаграмма DOM-элемента

DOM -элемент может содержать следующие необязательные атрибуты, указывающие исходный XML-документ для загрузки в порождаемый DOM-объект:

• doc - задает XML-документ в виде ссылки на doc-элемент (в динамической модели должен быть задан doc-элемент с соответствующим именем, содержащий информацию о нахождении нужного XML-файла);

• path - задает XML-документ путем явного указания пути к XML-файлу.

Если атрибуты отсутствуют, то после порождения DOM-объекта вместо загрузки исходного XML-документа создается корневой XML-элемент с именем DOM-элемента.

DOM -элемент может содержать несколько дочерних элементов - источников и приемников данных:

• элемент источника данных задает XML-результат, который будет помещен в порожденный DOM-объект (в корневой элемент или в указанные элементы предварительно загруженного исходного XML-документа) в качестве дочернего элемента (рассматривается ниже);

• элемент приемника данных задает XML-результат, который будет помещен в документ ADM или в поток выходных данных в качестве ответа на запрос (в данной статье не рассматривается).

Элемент источника данных представляет собой элемент динамической модели, размещаемый в DOM-элементе в качестве потомка (вложенного элемента). Он включает набор атрибутов, задающих свойства источника, имо-жет, в свою очередь, содержать дочерние элементы-источники (рекурсивное определение).

Синтаксическая диаграмма элемента-ис-точника приведена на рис. 3. Элемент-источник задается символом с меткой «src», справа от которого указывается имя источника.

Элемент_источника_д энных ч..............

■» -Г77Т Имя_источника

—о targs = BbipaoKeHiie_xpath Документ_источника

OR

doc = "Имя_с1ос-эпемента" dom = "Имя_с1от-эпемента" path = "Полное_имя_хт1-файла"

"Имя XML-тега"

—о root

Ч> wanted -> ignory Ч> cond

"Имя_хт!-эпемент а" "Имя_хт1-элемент а" = "Терм==Терм"

-OR----J-4--OR’-

■ att: Имя_xml- атрибут а

■ ele: Имя_хт1-элемента

■ xpath: BbipaoKeHiie_xpath

■ var: Имя_переменной

■ ф\Имя_переменной

■ pst: Имя_переменной

■ ses: Имя_переменной

—о instrument = "XMLReader"

—[> Элемент_источника_данных -

Рис. 3. Синтаксическая диаграмма элемента-источника

Атрибуты элемента-источника:

• 1а^э - необязательный атрибут, указывающий в родительском X М Ь-документе множество це ле вы хХ М Ь-элс ме нтов. к каждому

из которых будет прикреплен в качестве дочернего элемента XML-результат источника. При отсутствии атрибута XML-результат прикрепляется к корневому элементу родительского документа;

• Документ источника - обязательная конструкция, задающая документ, из которого берется XML-содержимое. Эта конструкция представляет собой один из трех атрибутов:

- path - задает документ источника путем явного указания пути к XML-файлу;

- doc - задает документ источника в виде ссылки на doc-элемент (в динамической модели должен быть задан doc-элемент с соответствующим именем, содержащий информацию о нахождении нужного XML-файла);

- dom - задает в качестве документа XML-содержимое DOM-объекта, который порожден DOM -элементом с указанным именем;

• root - необязательный атрибут, предписывающий дополнительно заключить XML-результат источника в теги с заданным именем (может быть удобен, когда из документа источника извлекается XML-фрагмент, не имеющий корневого элемента);

• wanted - необязательный многозначный атрибут, задающий список имен XML-элементов, отыскиваемых в документе источника для формирования результата (список значений, разделенных пробелами, как принято в XML). При отсутствии атрибута результат формируется из корневого XML-элемента документа источника;

• ignory - необязательный многозначный атрибут, задающий список имен XML-элементов в документе источника, которые следует игнорировать при формировании результата;

• cond - необязательный многозначный атрибут, задающий список условий, которым должен удовлетворять искомый XML-элемент документа источника (из списка в атрибуте wanted), чтобы попасть в результат. При отсутствии атрибута в результат попадают все найденные XML-элементы из списка wanted. Синтаксис задания условий обсуждается ниже;

• instrument - необязательный атрибут, предписывающий использовать для чтения документа источника XMLReader метод потокового (некэшируемого) доступа. При отсутствии атрибута по умолчанию применяется метод кэшируемого доступа, при котором документ источника целиком помещается в буферный DOM-объект.

Условия фильтрации. Для управления процессом фильтрации ХМЬ-элементов источника данных алгоритм предусмотрен многозначный атрибут соМ. Он содержит список разделенных пробелами условий в виде

терм == терм,

где левый терм задает проверяемое значение в искомом ХМЬ-элементе источника, а правый - в целевом ХМЬ-элементе родительского документа. Каждый терм содержит префикс и основу, разделенные двоеточием. Префикс указывает интерпретатору, каким способом отбирать значения при проверке соответствующего условия. Предусмотрены следующие префиксы:

• ай: - проверяется значение атрибута ХМЬ-элемента, основа задает имя атрибута;

• е1е: - проверяется значение дочернего ХМЬ-элемента, основа задает имя элемента;

• храШ: - проверяется значение, адресованное ХРаШ-выражением, основа задает выражение;

• уаг: - проверяется значение переменной динамической модели, значение которой хранится в памяти текущего состояния (С8М), основа задает имя переменной;

• §1Ъ: - проверяется значение глобальной переменной среды интерпретации, основа задает имя глобальной переменной;

• р81;: - проверяется значение Ро81;-пере-менной из клиентского запроса, основа задает имя Ро81>переменной;

• 8е8: - проверяется значение сессионной (сеансовой) переменной среды интерпретации, основа задает имя сессионной переменной.

Вложенные источники данных. Каждый элемент-источник, в свою очередь, может содержать один или несколько внутренних элементов-источников, формирующих дочерние ХМЬ-элементы в составе результата источника. Глубина вложенности не ограничена.

Текстовая форма задания БОМ-объекта. Графическое представление динамической модели (и в частности, БОМ-объектов) в виде диаграммы используется как средство наглядного проектирования. Для использования в информационной системе на основе диаграммы строится эквивалентное текстовое представление в виде ХМЬ-кода.

Фрагмент динамической модели, содержащий БОМ-элемент, в текстовом виде имеет следующую структуру:

<dom:Имя_DOM-элемента

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

doc="Имя_doc-элемента">

^гс:Имя_источника

doc="Имя_doc-элемента" ... >

^гс:Имя_источника

doc="Имя_doc-элемента" ... >

<Дгс:Имя_источника>

<Дгс:Имя_источника>

</dom:Имя_DOM-элемента>, где элементы и атрибуты записываются в соответствии с XML-синтаксисом.

АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ

Под алгоритмическим обеспечением здесь понимается совокупность алгоритмов, в соответствии с которыми интерпретатор выполняет обработку фрагмента динамической модели, содержащего DOM-элемент. DOM-элементы располагаются в динамической модели как дочерние элементы элементов-состояний, поэтому их обработка выполняется в контексте обработки соответствующих родительских состояний.

Головной алгоритм интерпретации DOM-элемента

Блок-схема головного алгоритма обработки (интерпретации) DOM-элемента - DOMProc -приведена на рис. 41.

Вызванный алгоритм начинается (блок 1) с получения имени обрабатываемого DOM-элемента (блок 2) и проверки существования DOM-объекта с таким именем (блок 3). При отсутствии DOM-объект создается с корневым элементом (блок 4). Затем проверяется (блок 5) наличие у DOM-элемента атрибута doc или pathи в этом случае выполняется начальная загрузка в DOM-объект соответствующего документа (блок б). Для DOM-объекта создается указатель на его корневой элемент (блок 7). Далее в цикле обрабатываются (блок S) все дочерние элементы DOM-элемента (источники и приемники данных). Для каждого дочернего эле-

1Используемый здесь и далее «иерархический» способ представления блок-схемы имеет отличия от традиционного. Вход в очередной блок того же уровня вложенности происходит по соединительной линии сверху или справа; выход всегда снизу; вход в первый дочерний (внутренний) блок из данного блока - справа; если внутренний блок последний в цепочке (не имеет соединительной линии снизу), то по его завершении происходит возврат в родительский блок.

мента проверяется, является ли он источником (блок 9), и в этом случае для него вызывается алгоритм обработки источника данных (блок 10), является ли он приемником (блок 11), и в этом случае для него вызывается алгоритм обработки приемника данных (блок 12). При вызове алгоритма обработки источника или приемника передаются указатели на корневой элемент DOM-объекта и на обрабатываемый элемент (источник / приемник). По окончании цикла (блок 8) алгоритм завершается и выполняет возврат в точку вызова (блок 13).

Рис. 4. Г оловной алгоритм интерпретации DOM-элементов

Алгоритм интерпретации элемента-источника

Блок-схема алгоритма обработки элемента-источника приведена на рис. 5.

Рис. 5.Алгоритм интерпретации элемента-источника

Алгоритм (блок 1) начинает с проверки наличия атрибута 1а^у обрабатываемого элемента-источника (блок 2), чтобы определить способ формирования массива целевых элементов родительского документа. При наличии атрибута

массив целевых элементов формируется в результате поиска в родительском документе множества элементов с именами, заданными в атрибуте targs (блок З). В противном случае множество целевых элементов включает единственный корневой элемент родительского документа (блок 4).

После этого выполняется циклическая обработка по каждому целевому элементу (блок З). Проверяется наличие атрибута root у обрабатываемого элемента-источника (блок б) и в этом случае формируется дочерний элемент у обрабатываемого целевого элемента, который далее будет использоваться вместо целевого элемента (блок 7). Проверяется наличие атрибута instrument = "XMLReader" (блок S), задающий способ обработки узлов документа источника. В зависимости от этого вызывается алгоритм потоковой обработки - SrcReaderProc (блок 9) или кэшированной обработки - SrcDOMProc (блок 10).

По окончании цикла (блок З) алгоритм завершается и выполняет возврат в вызывающий алгоритм (блок 11).

Алгоритм потоковой обработки

элементов документа источника

Блок-схема алгоритма потоковой обработки элементов документа источника приведена на рис. б.

Алгоритм (блок 1) начинает работу с инициализации инструмента потокового ввода XMLReader (блок 2), что обеспечивает открытие потока ввода для последовательного считывания тегов документа источника. Далее в цикле (блок З) выполняется потоковое чтение узла за узлом из документа источника до тех пор, пока документ не закончатся. Для обработки отбираются узлы, являющиеся XML-элементами (блок 4). Проверяется, присутствует ли в элементе-источнике атрибут wanted (блок З), и в этом случае проверяется, является ли обрабатываемый узел искомым XML-элементом документа источника (блоки б-11).

Проверка начинается со сброса флага совпадения (блок б). После этого в цикле (блок 7) перебираются имена из списка, заданного в атрибуте wanted, сравниваются с именем обрабатываемого узла (блок S) и в случае совпадения устанавливается флаг (блок 9). По завершении цикла (блок 7) проверяется установка флага совпадения (блок 10) и, если флаг не установлен (совпадение не зафиксировано), принудительно завершается обработка данного узла (блок 11)

и выполняется переход к обработке следующего (в блоке З).

/^"SrcReader^

^ Ргос )

п-2-

$w

^No-^~ Break ^

Рис. 6. Алгоритм потоковой обработки элементов документа источника

Если обрабатываемый узел признан искомым, он проверяется на выполнение условий фильтрации, которые заданы в атрибуте со^ в виде условий на атрибуты обрабатываемого узла (блоки 12-14). Такие условия могут быть проверены непосредственно, без считывания следующих узлов документа из потока ввода. Для этого в цикле из атрибута соМ извлекаются условия этого рода (блок 12) и проверяются для обрабатываемого узла (блок 13). При обнаружении невыполненного условия обработка данного узла принудительно завершается (блок 14) и выполняется переход к обработке следующего (в блоке 3).

Если обрабатываемый узел удовлетворяет условиям на атрибуты, он проверяется на выполнение других условий фильтрации, задан-

ных в атрибуте cond (блоки 15-1S). Такие условия требуют обращения к другим узлам документа из потока ввода. Для этого обрабатываемый элемент (вместе со своим внутренним содержимым) извлекается в кэш (блок 15). Далее в цикле из атрибута cond извлекаются условия этого рода (блок 1б) и проверяются для обрабатываемого узла, находящегося в кэше (блок 17). При обнаружении невыполненного условия обработка данного узла принудительно завершается (блок 1S) и выполняется переход

к обработке следующего (в блоке 3).

Если обрабатываемый узел успешно прошел все проверки, он присоединяется в качестве дочернего элемента к обрабатываемому целевому элементу родительского документа (блок 19).

Далее выполняется очистка присоединенного дочернего элемента от внутренних элементов, имена которых заданы в атрибуте ignory (блоки 20-22). Для этого имена из списка ignory просматриваются в цикле (блок 20) и для каждого из них выполняется циклический поиск внутренних элементов (блок 21) с удалением (блок 22).

После того как обрабатываемый узел документа источника проверен, присоединен к целевому элементу и очищен, для него рекурсивно обрабатываются внутренние источники данных (блоки 23, 24). Для этого выполняется цикл по элементам-источникам, дочерним по отношению к обрабатываемому (блок 2З). Для каждого внутреннего источника рекурсивно вызывается алгоритм его обработки (блок 24, см. рис. 5), причем в качестве целевого элемента передается обрабатываемый узел.

На последнем шаге обработки узла вновь проверяется наличие атрибута wanted (блок 25) и в случае его отсутствия выполняется (блок 24) принудительное завершение цикла обработки документа. Это делается, чтобы в данной ситуации ограничиться обработкой корневого элемента документа источника.

По окончании основного цикла (блок 3) алгоритм завершается и выполняет возврат в вызывающий алгоритм (блок 27).

Алгоритм кэшированной обработки элементов документа источника

Блок-схема алгоритма кэшированной обработки элементов документа источника приведена на рис. 7. В целом она близка к блок-схеме потоковой обработки, хотя несколько проще ввиду больших возможностей кэшированной обработки XML-документов.

Алгоритм (блок 1) начинает работу с подготовки кэша в виде DOM-объекта с загруженным в него XML-документом источника (блок 2). При этом, если DOM-объект, на который ссылается элемент-источник, уже существует, он используется в качестве кэша; в противном случае создается новый DOM-объект, в который загружается документ источника.

Далее формируется массив ссылок (блок З) на искомые элементы документа источника, имена которых заданы в атрибуте wanted элемента-источника (при отсутствии у элемента-источника атрибута wanted в массив заносится единственная ссылка на корневой элемент документа источника). Далее путем цикла по массиву ссылок (блок 4) проверяется каждый искомый элемент (блоки 5-13).

For each For each

( ignored V$K ignored V$m-

\ tagname / \ ($z, $i) /

19 I 13_________________

Src ($z, $s)

Рис. 7. Алгоритм кэшированной обработки элементов документа источника

Прежде всего проверяется выполнение условий фильтрации, которые заданы в атрибуте соМ (блоки 5-7). Для этого условия в цикле извлекаются из атрибута соМ (блок 5) и проверяются для обрабатываемого элемента (блок 6). При обнаружении невыполненного условия обработка элемента принудительно завершается (блок 7) и выполняется переход к обработке следующего (в блоке 4).

For each internal )— $s-src ($x)

Remove child ($z, $m)

Если обрабатываемый узел успешно прошел проверки, он присоединяется в качестве дочернего элемента к обрабатываемому целевому элементу родительского документа (блок 8).

Далее выполняется очистка присоединенного дочернего элемента от внутренних элементов, имена которых заданы в атрибуте ignory (блоки 9-11). Для этого имена из списка ignory просматриваются в цикле (блок 9) и для каждого из них выполняется циклический поиск внутренних элементов (блок 10) с удалением (блок 11).

После того как обрабатываемый узел документа источника проверен, присоединен к целевому элементу и очищен, для него рекурсивно обрабатываются внутренние источники данных (блоки 12, 13). Для этого выполняется цикл по элементам-источникам, дочерним по отношению к обрабатываемому (блок 12). Для каждого внутреннего источника рекурсивно вызывается алгоритм его обработки (блок 13, см. рис. 5), причем в качестве целевого элемента передается обрабатываемый узел.

По окончании основного цикла (блок 4) алгоритм завершается и выполняет возврат в вызывающий алгоритм (блок 14).

РЕАЛИЗАЦИЯ НА ПЛАТФОРМЕ РНР

Реализация разработанного алгоритмического обеспечения проводилась в составе интерпретатора динамических моделей СОБД на платформе РНР. Разработана РНР-версия алгоритмов интерпретации DOM-элементов, элементов-источников и элементов-приемников в виде функций РНР, вызываемых друг из друга, а также из других функций интерпретатора. Использовались стандартные возможности потоковой и кэшированной ХМЕ-обработки, предоставляемые в РНР 5 (библиотеки ііЬхші

иІІЬхзІЇ, поддерживающие расширенияDOM, ХМЕЯеаёег, XMЕWriter).

Модульная структура программного обеспечения в плане функций динамических БОМ-объектов поясняется на рис. 8.

Представленный ниже листинг иллюстрирует код динамических моделей, использовавшихся при тестировании разработанного программного обеспечения. Динамическая модель составлена в соответствии с диаграммой, использовавшейся на этапе разработки концепции динамических БОМ-объектов [8, с. 168, рис. 2.12]. Она обслуживает веб-приложение, отображающее пользователю сведения о студентах и изучаемых ими предметах, и включает три уровня иерархии, 3 субмодели, 5 состояний. Для формирования выходных страниц используется 4 БОМ-объекта (в листинге выделены жирным шрифтом), ХМЬ-контент которых динамически формируется из 3 исходных документов в зависимости от текущей ситуации.

|—НБМI------------------------------

Интерпретатор динамической модели

Рис. 8. Модульная структура программного обеспечения динамических DOM-объектов

Листинг. Тестовая динамическая модель с DOM-элементами и элементами-источниками <?xml versюn-,1.0,,encodmg-,UTF-8,,?>

^а:Студенты-Предметы xmlns:sta = 'HSM' xmlns:jmp = 'HSM' xmlns:sub = 'HSM' xmlns:act = 'HSM' xmlns:mnu = 'HSM' xmlns:dom = 'HSM' xmlns:btn = 'HSM' xmlns:use = 'HSM' xmlns:inp = 'HSM' xmlns:div = 'HSM' xmlns:var = 'HSM' xmlns:txt = 'HSM' xmlns:sec = 'HSM' xmlns:src = 'HSM' xmlns:rcv = 'HSM' xmlns:doc = 'HSM' xmlns:att = 'HSM'>

<doc:СписокСтудентов path-,XML^tud.xmГ, /> <!-- Используемые XML-документы-->

^ос:СписокПредметов path="XML/predm.xmГ, />

^ос:Успеваемость path="XML/sdacha.xml" />

^ос:СписСтудентов path="XSL/stud.xsl" />

^ос:УспеваемостьСтудента path="XSL/uspevstud.xsl" />

^ос:СписПредметов path="XSL/predm.xsl" />

<doc:УспеваемостьПоПредмету path="XSL/uspevpredm.xsl" />

^м:Студенты-Предметы section = "sec:СтудентыПредметы"/> <!-- Погружение в субмодель Студенты-Предметы-->

«ес:Студенты П редметы >

«иЬ:Студенты-Предметы>

<sta:Студенты>

<ас^Студенты pass="2">

<rcv:echomethod="label" value=',Студенты', /> </аС::Студенты>

<тр:Предметы>

<Ы:п:Предметы caption="K предметам" /> </тр:Предметы>

<div:Студенты section = Чес:СтудентыПредметы''/> </sta:Студенты>

<sta:Предметы>

«^Предметы pass="2">

<rcv:echomethod="label" value=',Предметы', /> </act:Предметы>

<тр:Студенты>

<Ы:п:Студенты caption="K студентам" /> </тр:Студенты>

^^:Предметы section = Чес:СтудентыПредметы''/> </sta:Предметы>

</sub:Студенты- П редметы>

<sub:Студенты>

<!-- Субмодель Студенты-Предметы -->

<!-- Состояние Студенты -->

<!-- Акция -->

<!-- Переход по нажатию кнопки -->

<!-- Погружение в субмодель Студенты-->

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

<!-- Состояние Предметы -->

<!-- Акция -- >

<!-- Переход по нажатию кнопки -- >

<!-- Погружение в субмодель Предметы-- >

<sta:СписокСтудентов>

^от:СписокСтудентов>

«гс:СписокСтудентов doc="CnMCOKO^eHTOB" instrument="XMLReader"/> <rcv:echopass="2" method="xslt" styleSheet="doc:СписСтудентов"/> </dom:СписокСтудентов>

<тр:ВыбранСтудент targs=',ВыбранСтудент',>

<Ы:п:ВыбратьСтудента caption="Выбрать студента" /> </тр:ВыбранСтудент>

</sta:СписокСтудентов>

<!-- Субмодель Студенты -->

<!-- Состояние СписокСтудентов -- >

<!-- DOM-элемент СписокСтудентов -->

<!-- Переход по нажатию кнопки -->

<sta:ВыбранСтудент>

<var:кодСтcash="global">

<src:кодСт method="post"/> </var:кодСт>

^от:УспеваемостьСтудента>

<!-- Состояние ВыбранСтудент -->

<!-- Переменная в памяти текущего состояния-->

<!-- DOM-элемент УспеваемостьСтудента --> <src:ВыбранныйСтудент doc="СписокСтудентов" wantedElem="студент" со^="аИ:код==уаг:кодСт" instrument="XMLReader"> <src:СдачиСтудента doc="Успеваемость" wantedElem="сдача" cond="att:кодСт==att:код" instrument="XMLReader"> «гс:СданныйПредмет doc="СписокПредметов" wantedElem="предмет" cond="att:код==att:кодПр"/> </src:СдачиСтудента>

</src:ВыбранныйСтудент>

<гсу:е^о method="xslt" styleSheet="doc:УспеваемосrьСrудента" />

</dom :УспеваемостьСтудента >

<тр:СписокСтудентов :а^-'СписокСтудентов''> <!-- Переход по нажатию кнопки -->

<Ы:п:КСпискуСтудентов сар:юп="К списку студентов"/>

</тр:СписокСтудентов>

</sta:ВыбранСтудент>

</sub:Студенты>

«иЬ:Предметы>

<sta: СписокПредметов>

^от:СписокПредметов>

<$гс:СписокПредметов doc="СписокПредметов" ignory="цикл спец"/> <rcv:echo method="xslt" styleSheet="doc:СписПредметов" /> <^от:СписокПредметов>

<|’тр:ВыбранПредмет targs=',ВыбранПредмет',>

<Ы:п:ВыбратьПредмет captюn=',Выбрать предмет" /> </тр:ВыбранПредмет>

</sta:СписокПредметов>

<!-- Субмодель Предметы -->

<!-- Состояние СписокПредметов -- >

<!-- DOM-элемент СписокПредметов -->

<!-- Переход по нажатию кнопки -- >

<sta:ВыбранПредмет>

<var:кодПр>

<src:кодПр method="post" />

<^г:кодПр>

^от:УспеваемостьПоПредмету>

<src:ВыбранныйПредметdoc="СписокПредметов" wantedElem="предмет" cond="att:код==var:кодПр"> <$гс:СдачиПоПредметуйос="Успеваемость" wantedElem="сдача" cond="att:кодПр==xpath:@код"> <src:СдавшийСтудентdoc="СписокСтудентов" wantedElem="студент" cond="att:код==att:кодСт"/> <^гс:СдачиПоПредмету>

<!-- Состояние ВыбранПредмет -->

<!-- Переменная в памяти текущего состояния-- >

<!-- DOM-элемент УспеваемостьПоПредмету -->

<^гс:ВыбранныйПредмет>

<rcv:echomethod="xslt" styleSheet="doc:УспеваемостьПоПредмету" />

</dom :УспеваемостьПоПредмету>

<jmp:СписокПpедметов targs="СписокПpедметов"> <!-- Пеpеxод по нажатию кнопки -->

<btn:КСпискуПpедметов caption="К списку пpедметов"/>

</jmp:СписокПpедметов>

</sta:ВыбpанПpедмет>

</sub:Пpедметы>

</sec:СтудентыПpедметы>

</sta:Студенты-Пpедметы>

ЗАКЛЮЧЕНИЕ

В данной статье представлены результаты разработки лингвистического и алгоритмического обеспечения источников данных в составе динамических DOM-объектов, задаваемых в динамических моделях ситуационно-ориентированных баз данных.

Разработанное лингвистическое обеспечение в форме синтаксических диаграмм DOM-элементов и вложенных элементов-источников в составе элементов-состояний динамической модели отличается наличием атрибутов для задания условий отбора и фильтрации элементов документа-источника, присоединяемых к элементам родительского документа в ходе загрузки в DOM-объект.

Разработанное алгоритмическое обеспечение в форме блок-схем алгоритмов интерпретации DOM-элементов и элементов-источников отличается тем, что в зависимости от спецификации динамической модели предусматривается два режима обработки узлов документов источников данных - потоковый и кэшированный.

Алгоритмическое обеспечение реализовано в виде PHP-модулей в составе интерпретатора динамических моделей ситуационно-ориентированной базы данных. Тестовые примеры динамических моделей для веб-приложения продемонстрировали работоспособность предлагаемого подхода к организации динамических DOM-объектов.

Дальнейшие исследования предполагается продолжить в направлении исследования показателей производительности, прежде всего, времени заполнения динамических DOM-объектов XML-контентом источников данных.

СПИСОК ЛИТЕРАТУРЫ

1. Strauch C., KrihaW. NoSQL databases. URL: http://www.christof-strauch.de/nosqldbs.pdf (дата обращения 07.11.2012).

2. Миронов В. В., Юсупова Н. И., Шакирова Г. Р. Ситуационно-ориентированные базы данных: концепция, архитектура, XML-реализация // Вестпик УГАТУ. 2011. Т. 14, № 2 (37). С. 233-244.

3. Миронов В. В., Юсупова Н. И., Шакирова Г. Р. Ситуационно-ориентированные базы дап-ных: внешние представления на основе XSL // Там же. 2011 Т. 14, № 4 (39). С. 200-209.

4. Миронов В. В., Маликова К. Э. Иптерпет-приложения на основе встроенных динамических моделей: идея, концепция, безопасность // Там же. 2009 Т. 13, № 2 (ЗЗ). С. 1б7-179.

З. Миронов В. В., Маликова К. Э. Иптерпет-приложения на основе встроенных динамических моделей: архитектура, структура данных, интерпретация // Там же. 2010. Т. 14, № 1 (Зб). С. 154-1бЗ.

6. Миронов В. В., Маликова К. Э. Иптерпет-приложения на основе встроенных динамических моделей: элементы управления пользовательского иптерфейса // Там же. 2011. Т. 14, № З (40). С. 170-17З.

7. Миронов В. В., Юсупова Н. И., Шакирова Г. Р. Иерархические модели данных: концепции и реализация на основе XML. М.: Машиностроение, 2011. 4ЗЗ с.

5. Миронов В. В., ГусаренкоА. С. Ситуационно-ориентированные базы данных: концепция управлепия XML-данными па основе динамических DOM-объектов // Вестпик УГАТУ. 2012. Т. 1б, № 3 (4S). С. 1З9-172.

ОБ АВТОРАХ

Миронов Валерий Викторович, проф. каф. автома-тизир. систем упр-я. Дипл. радиофизик (Воронежск. гос. ун-т, 1975). Д-р техн. наук по упр. в техн. системах (УГАТУ, 1995). Иссл. в обл. иерархических моделей и ситуационного управления.

Гусаренко Артем Сергеевич, аспирант той же каф. Дипл. информатик-экономист (УГАТУ, 2010). Готовит дисс. о динамических DOM-объектах в ситуационно-ориентированных базах данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.