Проблемы разработки ИЕВ-ресурсов и пути их разрешения
УДК 681.3.06
Ф.А. Попов, А.В. Максимов, Н.Ю. Ануфриева, О.Н. Мелехова
Проблемы разработки WEB-pecypcoв и пути их разрешения
В Алтайском государственном университете и Бийсксм технологическом институте разработка ИЕВ-ресурсов ведется в течение ряда лет, при этом количество наработок, обьемы накопленной информации, необходимость оперативной модернизации сайтов потребовали в настоящее время и более комплексного, системного подхода к решению данной проблемы. Широкое использование в вузах ИЕВ-интерфейсов для работы с электронными коллекциями документов (в частности, в рамках библиотечных информационных систем, систем дистанционного обучения, информационно-аналитических систем вузов в целом ) требует, в свою очередь, разрешения данной проблемы в кратчайшие сроки, следует также отметить, что данное направление работ в целом привлекает все более пристальное внимание исследователей всего мира, о чем свидетельствуют многочисленные публикации на затронутую тему (см. [1-3] и др.).
Для пояснения этой проблемы укажем на те задачи, которые должен решать разработчик ИЕВ-ресур-сов: выбор информационного содержания сайта; проектирование структуры сайта; проектирование графического представления сайта; разработка компонентов сайта; сборка и верификация структуры (проверка соответствия ограничениям целостности) сайта; обеспечение идентификации сайта.
При этом создание новой разработки может начинаться либо с нуля, либо путем реструктуризации уже имеющихся сайтов, выполняющих в этом случае роль сайтов-прототипов. При отсутствии соответствующих инструментов и подходов решение перечисленных выше задач является крайне затруднительным, требует значительных затрат времени!, не позволяет вести согласованные работы коллективам специалистов и фактически исключает возможность эффективной оперативной разработки и модернизации сайтов.
При этом ясно, что все задачи являются взаимоувязанными и могут быть в той или иной мере решены с применением концепций баз данных к ИИИ, а также с помощью построения и исследований моделей ИЕВ, представляющих собой ориентированные графы, узлы которых являются страницами, а дуги - связями между страницами ИЕВ. Эти страницы могут находиться на множестве сайтов или на единственном сайте, что должно найти отражение в графовой модели. Это может быть осуществлено с помощью меток на дугах графа
(граф является нагруженным), содержащих набор данных, определяющих особенности перехода: ссылка, ее местоположение, тип ссылки (на документ, на графический образ), другие необходимые сведения (в т.ч. и семантические). с целью применения технологий баз данных для создания ИЕВ-сай-тов могут быть использованы методы явного декларативного представления их структуры. Это позволяет просто создавать сайты, предназначенные для различных групп пользователей, поддерживать их эволюцию, формулировать и налагать на сайт ограничения целостности, осуществлять обновления сайта.
Важно отметить, что все перечисленные задачи решаются сравнительно просто (при наличии изложенного выше системного подхода) для статических структур. Дело значительно усложняется при необходимости работы с динамическими страницами, определяемыми введенными пользователем данными. Тенденции же развития ИЕВ показывают [1], что количество таких страниц неуклонно растет, в связи с чем насущными являются проблемы идентификации таких сайтов, автоматизации процессов их создания. Особое место при этом занимает проблема идентификации данных в Интранете, одним из перспективных методов решения которой является использование хранилищ данных. Проблемы интеллектуализации пользовательских интерфейсов, использование естественных языков при формулировке запросов на поиск информации в Интернете / Интранете, оценка результатов поиска также естественным образом связаны с задачами разработки сайтов и основанных на них информационных систем и требуют разрешения [4] . При этом необходимо отметить, что сконструированный и реализованный в рамках ИЕВ универсальный способ построения сетевых информационных систем по своим возможностям в значительной мере приближается к современным экспертным системам: имеет место база знаний, реализуемая в вище гипертекста; присутствует развитый интерфейс с пользователем, позволяющий общаться с системой на языке, близком к естественному (браузер - в качестве диалогового монитора, сценарии диалога - на уровне ИТМЬ-документов) [4; 5]; возможно наличие средств автоматизированного пополнения и модификации гипертекстовых структур. Единствен-
ИНФОРМАТИКА
ное несоответствие - носителем правил вывода является специалист, работающий с системой. Но это действительно при непосредственном общении пользователя с сайтом. Если же иметь в виду, что есть и другой уровень общения - через посредство информационно-поисковык систем, при котором указанное несоответствие может бытть исключено, то список перечисленных выше задач может быть конкретизирован задачей построения экспертных систем Интранет / Интернет.
В настоящее время наряду с развитием возможностей языка форматной разметки документов HTML [5], используемого в основном при создании WEB-сайтов, интенсивно развиваются технологии, основанные на Extensible Markup Language (XML) [6-10], языке, спецификации которого недавно приобрели статус стандарта W3C (World Wide Web Consortium) [7] . При этом нужно отметить, что использование XML-технологий открывает радикально новые перспективы в части автоматизации проектирования сайтов, что связано с возможностью не только представлять, но и хранить информацию в структурированном виде. Декларации Document Type Definition (DTD) в языке XML позволяют описывать структурные свойства XML-документов. При этом структура документа определяется как последовательность элементов и/или иерархий элементов определяемых в документе типов. Более развитые средства описания структуры и других свойств XML-документов обеспечивают разрабатываемые W3C спецификации языка определения схемы для XML-документов [8, 9] .
С использованием этих метаданных легко контролировать целостность структуры XML-документов, отображать ее в одной из существующих моделей данных (реляционная, объектная), работать со слабоструктурированной информацией с при-
менением методов баз данных.
При создании сайта в среде XML для формирования его структуры могут использоваться структурообразующие средства самого языка XML (спецификации DTD), а также гиперссылки и указатели!, связывающие между собой XML-документы и/или фрагменты документов. Для декларации гиперссылок и указателей предусматривается использование разрабатываемых в настоящее время W3C языков XLink и XPo inter [1Q] .
Отсюда очевидно, что разработка в настоящее время средств автоматизации построения сайтов на основе использования HTML-документов не может способствовать комплексному решению рассматриваемой проблемы, попытки же [2] распространить результаты, полученные при работе с HTML-документами, на XML-структуры могут носить лишь частный, ограниченный характер. И, наоборот, создание методов и инструментов для работы с более общими XML-документами, с учетом возможностей их развития, позволит решать и задачи автоматизации построения сайтов с использованием форматных языков. В соответствии с этим положением авторами в настоящее время разрабатываются методы решения сформулированных задач, проектируются необходимые структуры данных и программные средства, создаются информационно-логические модели процессов создания Web-сайтов, рассматриваются вопросы применения XML-структур для создания и поддержания неоднородных слабоструктурированных информационных ресурсов.
В заключение необходимо отметить, что в представленном материале намечены направления актуальных исследований в области WWW, обоснованы их практическая ценность, целесообразность, сформулированы основные задачи и намечены пути их решения.
Литература
1. ФлорескуД., Леви А., Мендельсон А. Технологии баз данных для World-Wide Web: обзор // СУБД. 1998. №4-5 .
2. Когаловский М.Р., Ефимова Е.Н., Рыбина Т.А., Бра-хин В.Б. Формальные методы верификации целостности макроструктуры Web-сайтов // Программирование. 2000. №4.
3. Осипов М. А., Мачуль ский О. Л. , Калиниченко Л. А. Отображение модели данных XML в объектную модель языка СИНТЕЗ // Программирование. 2000. №4.
4. Попов Ф.А., Овечкин Б.П., Максимов А.В., Ануфриева Н.Ю. Проблемы и принципы построения пользовательских интерфейсов информационных систем // Известия АГУ. Сер. Математика. Информатика. Физика. 2000. N1 (15) .
5. Храмцов П. Лабиринт Internet: Практическое руководство. M., 1996.
6. Extensible Markup Language (XML) 1.0. W3C // Recommendation lO.1998. February (http://www. w3.org/TR/1998/REC-xml-19980210).
7. Булах Е., Кузина И, Храмцов П. Развитие стека спецификаций W3C или гносеология XML // Открытые системы. 1999. №5-6.
8. XML Schema Part 1: Structures // W3C Working Draft 5. 1999. November (http://www.w3.org/ TR/ 1999/WD-xmlschema-l-19991105).
9. XML Schema Part 2: Datatypes // W3C Working Draft 5. 1999. November (http://www.w3.org/ TR/ 1999/WD-xmlschema-2-19991105).
10. Питтс Н. XML за рекордное время: Пер. с англ. М., 2000.