Научная статья на тему 'Принципы автоматизации доступа к данным при использовании Веб сервисных решений'

Принципы автоматизации доступа к данным при использовании Веб сервисных решений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
267
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВЕБ-СЕРВИСЫ / СКРЫТЫЙ ВЕБ / АВТОМАТИЗАЦИЯ ДОСТУПА / СЕРВИС-ОРИЕНТИРОВАННАЯ АРХИТЕКТУРА. / XML / SOAP / WSDL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Корабельников Д. М.

Современные темпы информатизации всех сторон человеческой деятельности предъявляют растущие требования по организации доступа к информации различного характера. Инфокоммуникационные технологии должны обеспечивать не только предоставление доступа к данным, как таковым, но и предусматривать возможности по обеспечению автоматизированного доступа к сложноструктурированной информации для ее последующей обработки и интерпретации в целях проведения различных исследований, предоставления комплексных услуг. В этих условиях возникает потребность в решениях, обеспечивающих возможности регламентированного стандартами доступа и предусматривающих высокую степень автоматизации процессов получения информации и связанных с ней метаданных, описывающих внутреннюю структуру данных и их взаимосвязь с другими данными источника информации, базовую семантику предоставляемых данных, правила и права доступа и работы с ними. В докладе анализируются технологические предпосылки и рассматриваются соответствующие им практические решения по автоматизации различных сторон межсистемного взаимодействия при предоставлении доступа к данным посредством веб сервисных решений. В ходе анализа проведено исследование вопросов стандартизации метаданных и их автоматизированной интерпретации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Принципы автоматизации доступа к данным при использовании Веб сервисных решений»

Принципы автоматизации доступа к данным при использовании веб-сервисных решений

Современные темпы информатизации всех сторон человеческой деятельности предъявляют растущие требования по организации доступа к информации различного характера. Инфокоммуникационные технологии должны обеспечивать не только предоставление доступа к данным, как таковым, но и предусматривать возможности по обеспечению автоматизированного доступа к сложноструктурированной информации для ее последующей обработки и интерпретации в целях проведения различных исследований, предоставления комплексных услуг. В этих условиях возникает потребность в решениях, обеспечивающих возможности регламентированного стандартами доступа и предусматривающих высокую степень автоматизации процессов получения информации и связанных с ней метаданных, описывающих внутреннюю структуру данных и их взаимосвязь с другими данными источника информации, базовую семантику предоставляемых данных, правила и права доступа и работы с ними. Ключевые слова: веб-серм^, в докладе анализируются технологические предпосылки и рассматриваются соответствующие

скрытыйвеб, автомапизация доступа, им практические решения по автоматизации различных сторон межсистемного взаимодействия

XML, SOAP, WSDL, сервис- r ^ v ,, -в

при предоставлении доступа к данным посредством веб-сервисных решений. В ходе анализа

ориентированная архитектура. г г г г

проведено исследование вопросов стандартизации метаданных и их автоматизированной интерпретации.

Корабельников Д.М.,

ФГУП ЦНИИС, [email protected]

В статье рассматриваются вопросы, связанные с организацией автоматизированного доступа какой-либо информационной системы (далее - запрашивающая система) к данным другой информационной системы (далее - предоставляющая система). Предполагается, что предоставляющая система включает специализированные интерфейсы, функциональность которых запрашивающая система использует при получении данных. В данной статье под интерфейсами будут пониматься, прежде всего, веб-сервисы (web-service), применимость и целесообразность использования которых рассмотрена в статьях [1-2].

На момент написания статьи в открытых источниках отсутствовали упоминания о законченных решениях по организации автоматизированного доступа к данным неизвестной структуры. В определенной степени родственные задачи решаются программными пакетами объектно-реляционного отображения (Object-Relational Mapping, ORM), в задачи которых входит обеспечение перехода от работы с объектом, представляющим собой некий связный набор данных в программном обеспечении - к данным, находящимся в базе данных. С использованием пакетов ORM обеспечивается более высокая, по сравнению с системами управления базами данных (СУБД) степень абстракции уровня хранения данных многозвенной информационной системы. Однако, на настоящий момент программные продукты ORM не обеспечивают унифицированных форм взаимодействия с базами данных. Напротив, каждое из предлагаемых решений может обладать собственными особенностями, определяемыми конкретной реализацией. Таким образом не может быть гарантировано единообразное взаи-

модействие, вне зависимости от применяемых средств. Также продукты ORM ориентированы на взаимодействие с базой данных напрямую, а не при посредстве какой-либо иной информационной системы, гребуют предварительного формирования модели данных пользователем, что представляет собой недостаточную, в рамках рассматриваемой задачи, степень автоматизации. Кроме того, пакеты ORM, как правило, тесно связаны с используемой средой разработки и не предоставляют платформонезависимых интерфейсов.

В условиях отсутствия полноценных решений, для организации автоматизированного доступа к данным целесообразно применять решения и практики более общего характера, осуществляя при этом при этом их адаптацию. При этом рассматриваемая задача разлагается на следующие:

1) Обнаружение предоставляющей системы, а именно интерфейсов доступа к данным.

2) Получение информации о хранимых (предоставляемых) данных, их структуре, семантических ограничениях.

3) Получение информации о правилах, условиях и ограничениях предоставления данных.

4) Запрос и получение данных.

5) Корректная интерпретация полученных данных.

Первоочередное значение при автоматизации доступа к данным в условиях, когда запрашивающая система изначально не обладает знанием о том, какие именно данные, какой структуры и в каком объеме будут запрошены в будущем, является использование обеими сторонами общепринятого и регламентированного формата описания данных, т.е. формата представления метаданных.

Описанный сценарий может осуществляться, например, в следующих случаях:

- обращение поисковой системы к какому-либо источнику информации, представленному во всемирной паутине (World Wide Web) с целью индексации информационного наполнения системы, что позволит предоставлять более релевантные результаты в ответ на поль-

О-

О-

СЬ=

Сь

—►/

t

Со $1с

Предоставляющая система

Запрашивающая система (зд поисковая система)

Рис. 1. Взаимодействие поисковых систем и систем-источников данных

зовательские запросы и повысить доступность информации, хранящейся в предоставляющей системе. Данный вариант представлен на рис. 1;

- автоматическое объединение веб-сервисов, разработанных в различное время и выполняющих различные единичные задачи, для выполнения актуальных на данный момент задач, как однократно, так и, впоследствии, регулярно. Такой пример может быть характерен для корпоративной среды, где актуальна задача гибкого и в максимальной степени автоматизированного повторного использования уже созданных программных решений для решения возникающих задач. Данный вариант представлен на рис.2.

Метаданные описывают собственно хранимые данные, могут включать их связь с объектами реального мира, то, каким образом данные организованы, на каких условиях и каким образом предоставляются и пр. Таким образом, метаданные тем или иным образом задействованы в четырех из пяти вышеперечисленных подзадач организации автоматизированного доступа. Необходимо отметить, что точный состав информации, включаемой в метаданные в каждом конкретном случае, может варьироваться в зависимости от конкретной реа- " лизации, сферы применения и специфики выполняемых задач.

Использование общепринятого стандарта метаданных позволит выполнять в автоматическом режиме, как запрос определенной выборки данных, в зависимости от текущих потребностей, так и оптимизировать обработку данных, их преобразование по получению для применения в запрашивающей системе, их интеграцию с собственными данными запрашивающей системы.

Были выделены следующие стандарты метаданных, которые могут быть привлечены для решения описанной задачи и представляют собой различные стороны формирования таковых стандартов:

- Web Services Metadata Exchange [3];

- Resource Description Framework (RDF) [4];

- Web Services Metadata for the JavaIM Platform [5].

При рассмотрении стандартов метаданных будут учитываться следующие их характеристики:

- платформонезависимость;

- совместимость с данными высокой сложности;

- полнота описания метаданных;

- гибкость решения;

- расширяемость при сохранении совместимости;

- средства управления доступом.

В соответствии с наименованием, стандарт обмена метаданными веб-сервисов (Web Services Metadata Exchange) входит в комплекс разработанных консорциумом W3C стандартов, которые определяют функционирование и использование веб-сервисов. Стандартом определены метаданные, которые могут быть предоставлены запрашивающей стороне.

Рис. 2. Объединение веб-сервисов для построения комплексного веб-сервиса

Согласно стандарту, метаданные, описываются при помощи расширяемого языка разметки (Extensible Markup Language, XML) и выделяются в составе сообщения SOAP парой тегов <mex:Metadata>, </mex:Metadata>. При этом определены следующие подтипы метаданных, соответствующие следующим:

- xs:schema - соответствует стандарту XMI-Schema и регламентирует структуру и содержание сообщений, передаваемых при взаимодействии с веб-сервисом;

— wsdldefinitions — соответствует стандарту языка описания веб-сервисов (Web Services Description Language, WSDL) и описывает принципы взаимодействия с вебсервисом, включая допустимые типы сообщений, сетевые протоколы, конечные адреса, используемые вебсервисами;

- wsp:Policy -соответствует стандарту WS-Policy и описывает возможности, общие характеристики и требования со стороны веб-сервиса;

- - неопределенное значение для будущих или собственных типов метаданных пользователей.

В качестве положительных сторон стандарта можно указать постоянное развитие комплекса стандартов вебсервисов в целом при участии крупных игроков рынка, поддержку веб-сервисов во многих средах разработки и других программных продуктах, платформонезависи-мость как следствие такового подхода для веб-серсвисов в целом. При этом, допустимая сложность описания данных определяется возможностями языка WSDL, который в некоторых случаях сложной организации данных (например, рекурсивная ссылочность классов), может не отражать данные во всей полноте.

Также существующая структура предполагает возможность добавления новых типов метаданных при сохранении обратной совместимости, однако в данном случае задачи корректной интеграции полученных от разных источников данных будет возложена на запрашивающую систему.

Первоначально разрабатываемая в качестве стандарта метаданных, счрукнура описания ресурсов (Resource Description Framework, RDF) приняла более общий вид и в настоящее время представляет собой регламентированную методику концептуального описания или по-строениия модели информации, представленной в ресурсах всемирной паутины и не имеет, таким образом, полностью интерпретируемого набора атрибутов метаданных. Стандарт RDF не привязан к конкретному языку, его реализующему, но стандартом W3C была определена как формальная семантика, так и ее реализация на языке XML. Стандарт опирается на формирование утверждений, описывающих рассматриваемые ресурсы. Стандарт является платформонезависимым и, учитывая подход к организации данных в RDF, позволяет описывать данные, существенно различающиеся по степени сложности. Использование RDF также позволяет обеспечить обратную совместимость описаний метаданных. Свое применение стандарт RDF находит в т.н. семантической паутине (semantic web), и, хотя ряд его более узких реализаций (OWL, SKOS) был разработан специально с тем, чтобы обеспечить более полную автомати-зируемость работы с метаданными. Эти реализации также в большей степени относятся к построению онтологии знаний. Программные средства, реализующие полные версии данных стандартов в настоящее время являются нереализуемыми в связи со сложностью при-

менения существующих средств компьютерной обработки данных для интерпретации семантической информации. Это также ограничивает их применение. С другой стороны, в настоящее время существуют решения, позволяющие в ограниченной степени отражать основанные на RDF-онтологии в документы языка WSDL, что позволяет дополнять семантической информацией метаданные стандарта Web Services Metadata Exchange.

Стандарт JSR-181 Web Services Metadata for the JavaTM Platform регламентирует представление метаданных для веб-сервисов, построенных на базе платформы Java. Веб-сервисы платформы Java также опираются на многие стандарты W3C, включая WSDL, но предлагают осуществлять построение описания программных составляющих на языке Java, которые затем транслируются в WSDL. В том числе предопределенные метаданные включают:

- name - наименование веб-сервиса или, в данном случае, имя класса или интерфейса Java;

- targetNaniespace - пространство имен документа WSDL, сгенерированного на базе текущего веб-сервиса Java;

- serviceName - наименование сервиса, ставится в соответствие wsdl:service для WSDL версии 1.1;

- wsdlLocation — размещение предопределенного документа WSDL, который описывает сервис;

- endPointlnterface - полное наименование интерфейса одной из конечных точек сервиса, выполняющей ту или иную логику.

Как можно видеть, метаданные в рамках платформы Java нацелены, прежде всего, на обеспечение генерации документов WSDL автоматизированным образом и не выделяют специальным образом правила взаимодействия с веб-сервисом, несмотря на то, что платформа Java обладает собственной реализацией WS-Policy. Также очевидно, что решение является платформозависимым и, таким образом, ограничено в применении.

По результатам исследования, на сегодняшний момент не представлено каких-либо стандартов, определяющих метаданные веб-сервисов и при этом существенно отличающихся от вышеперечисленных. Наиболее характерным является применение стандартов W3C, наиболее полно соответствующих задаче автоматической обработки данных. Именно эти стандарты являются наиболее поддерживаемыми и имплементируемыми не только отдельными разработчиками частных решений, но и крупными компаниями, которые внедряют поддержку и автоматическую генерацию соответствующих документов в средства разработки, что также подтверждается примером платформы Java.

При этом на рынке присутствуют решения частных производителей, декларирующих совместимость со стандартами W3C в целом, и чьи предложения, тем не менее, связаны с определенными ограничениями по применению. Использование таких решений может быть оправдано в корпоративной среде, где спектр применяемых средств может быть определен политикой компании и ее потребностями. Необходимость в обеспечении платформонезависимости средств автоматизированного доступа к данном в замкнутой среде как правило, ограничена. А применение проприетарной платформы может быть обосновано как устоявшейся практикой компании, эксплуатирующей широкий спектр готовых решений, так и рыночной спецификой.

Стандарты метаданных, не в полной мере применимые на настоящий момент, могут рассматриваться как перспективное направление развития. Существующие стандарты, таким образом, не останавливаются в своем развитии, а продолжают дополняться в соответствии с потребностями среды их применения. Так как стандарты, связанные с построением онтологий и семантической паутиной, не являются в полной мере интерпретируемыми автоматически, наиболее целесообразным представляется использование RDF-онтологий в качестве дополнительного, менее интерпретируемого (в связи с необходимостью выравнивания онтологий), по сравнению с формальным описанием Web Services Metadata Exchange, источника данных о предоставляющей системе при организации автоматизированного доступа. Это может представлять особенную ценность в случае, когда в роли запрашивающей системы выступает поисковая система, в связи с тем, что, как было показано в [2], одной из проблем, связанных с автоматической индексацией веб-сервисов, является недостаток текстовой, наиболее применимой с точки зрения поисковой системы, информации. При обработке документов

RDF с позиций поисковой системы, существенным преимуществом является описанная структура документа, при этом необходимость семантической интерпретации предоставленных данных может быть смягчена за счет уже используемых приемов автоматической обработки текстовых источников.

Литература

1. Корабелышков Д. Текущее состояние проблемы скрытого веба и подходы к ее решению // T-Comm: Телекоммуникации и транспорт. - М.: 2009. -№S2. - С. 183-184.

2. Корабелышков Д. Подходы и технологии автоматизированного обнаружения веб-сервисов // Четвертая отраслевая научная конференция-форум “Технологии информационного общества” / М.: ИД Медиа Паблишер, 2010 - С.4.

3. W3C Recommendation, Web Services Metadata Exchange (WS-MetadataExchange). -2011.

4. W3C Recommendation, Resource Description Framework (RDF): Concepts and Abstract Syntax. - 2004.

5. BEA Systems, JSR-181 Web Services Metadata for the JavaTM Platform. - 2005.

Principles for automating web-stored data access through the means of web-servces Korabelnikov D.M., FSUE ZNIIS, [email protected].

Abstract: Modern rates of informatization for personal, business and governmental communications provide new requirements lor access provisioning while allotting different kinds of information. Infocommunication technologies aren't just to provide means for transmitting data between parties involved, but also to provide means for automated access to information of complex nature, that can be used for different kinds of studies or complex services provisioning.

Therefore the need arises for solutions, that would prov'de standard-defined access capabilities, as well as highly automated retrieval processes for information and related metadata, that defines information structure, its relationship to other records of stored data, basic semantics for the data retrieved, its access rules anB restrictions. The article deals with technological premises and relevant practical methods for different aspects of intersystem communications while accessing data through the means of web-services. State of standardization of relevant metadata and its automated interpretation principles are also explored.

Keywords: web-service, invisible web, access automation, XML, SOAP, WSDL, service-oriented architechture.

i Надоели баннеры? Вы всегда можете отключить рекламу.