Научная статья на тему 'ВИЗНАЧЕННЯ СТРУКТУРИ і ЗМіСТУ ВХіДНИХ іНФОРМАЦіЙНИХ РЕСУРСіВ ДЛЯ РОБОТИ МЕШАП-СИСТЕМИ'

ВИЗНАЧЕННЯ СТРУКТУРИ і ЗМіСТУ ВХіДНИХ іНФОРМАЦіЙНИХ РЕСУРСіВ ДЛЯ РОБОТИ МЕШАП-СИСТЕМИ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
230
164
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕШАП-СИСТЕМА / іНФОРМАЦіЙНИЙ РЕСУРС / СТАНИ ДіЯЛЬНОСТі МЕШАП-СИСТЕМИ / ОНТОЛОГії / ФОРМАЛіЗМ ОБМЕЖЕНЬ / МЭШАП-СИСТЕМА / ИНФОРМАЦИОННЫЙ РЕСУРС / СОСТОЯНИЯ ДЕЯТЕЛЬНОСТИ МЭШАП-СИСТЕМЫ / ОНТОЛОГИИ / ФОРМАЛИЗМ ОГРАНИЧЕНИЙ / MASH-UP SYSTEM / INPUT INFORMATION RESOURCE / STATES OF ACTIVITY MASH-UP SYSTEM / ONTOLOGY / FORMALISM OF OBJECT-ORIENTED NETWORKS OF RESTRICTIONS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Кушнірецька І. І., Кушнірецька О. І., Берко А. Ю.

В статье представлена характеристика основных шагов определения структуры и содержания входных информационных ресурсов для работы Мэшап-системы. Приведена общая схема деятельности Мэшап-системы и описано каждое состояние деятельности системы. Предложены возможные решения задач, поставленных соответственно выделенных шагов определения структуры и содержания входных информационных ресурсов для работы Мэшап-системы.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Determination of the structure and content of input information resources for Mash-up system work

In this paper the research of application of new approaches to overcome of semantic mazes of input information, one of which is the improvement of stage of defining the structure and content of incoming information resources for Mash-up system work has been presented. The general UML-diagram of Mash-up system activity has been constructed and its work, according to the selected state activity has been described. The most important states in the work of Mash-up system such as: finding of need information, extracting of found information and storing it as a service have been shown. Based on the selected states of activity of Mash-up system, the steps of defining of structure and content of incoming information resources have been developed. The detailed analysis and description of each of developed steps for defining of structure and content of incoming information resources has been displayed. The possible solutions to problems posed by selected steps for defining of structure and content of incoming information resources for Mash-up system have been offered. The concept of knowledge presenting in local ontology, which are used the formalism of object-oriented network restrictions proposed by A. Smirnov has been consided. The basic operations of creating of local ontology have been shown.

Текст научной работы на тему «ВИЗНАЧЕННЯ СТРУКТУРИ і ЗМіСТУ ВХіДНИХ іНФОРМАЦіЙНИХ РЕСУРСіВ ДЛЯ РОБОТИ МЕШАП-СИСТЕМИ»

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ УПРАВЛЕНИЯ

УДК 004.652

Б01: 10.15587/2312-8372.2014.31412

ВИЗНАЧЕННЯ СТРУКТУРИ I ЗМ1СТУ ВХ1ДНИХ 1НФОРМАЦ1ЙНИХ РЕСУРС1В ДЛЯ РОБОТИ МЕШАП-СИСТЕМИ

У статтг представлено характеристику основних крокгв визначення структури I змгсту вхгдних гнформацшнихресурсгв дляроботи Мешап-системи. Наведено загальну схему дгяльнос-т1 Мешап-системи г описано кожен стан дгяльностг системи. Запропоновано можливг ршення завдань, поставлених зггдно видглених крокгв визначення структури г змгсту вхгдних тформацшних ресурсгв для роботи Мешап-системи.

Клпчов1 слова: Мешап-система, тформацшний ресурс, стани дгяльностг Мешап-системи, онтологп, формалгзм обмежень.

Кушшрецька I. I., Кушшрецька О. I., Берко А. Ю.

1. Вступ

На сьогодт у Всесвинш мережевш павутин метиться величезна кшьюсть шформацп pi3HOMaHiTHoro характеру i змiсту, яка до того ж невпинно зростае. Ситуащя рiзкого зростання обсягiв iнформацiйних по-токiв породила ряд проблем: непропорцшне зростання iнформацiйного шуму через слабку структуровашсть iнформацii; багаторазове дублювання шформацп; поява паразитшл iнформацii та ш. Тому потреба швидкого i яюсного отримання потрiбних даних стае все бшьш актуальною. Охоплення, узагальнення великих динамiч-них iнформацiйних масивiв, що безперервно генерують-ся в Мережу вимагае якiсних нових пiдходiв. Одним з ршень даноi проблеми е розробка систем штеграцп даних, що працюють використовуючи технологiю ме-шап (англ. Mash-Up). Мешап — це такий шдхщ для розробки додатюв, який дозволяе користувачам об'ед-нувати даш з декiлькох джерел в один штегрований iнструмент [1].

Сьогодш Мешап-системи вiдкривають новi i широ-кi можливостi використання iнформацiйних ресурав. Тим не менш, незмiнним залишаеться той факт, що для розроблення Мешап-системи потрiбно володiти до-статньо великим запасом знань методiв та технологш, щоб створити справдi корисну i якiсну систему I одним з найперших завдань на шляху побудови Мешапу е визначення структури i змкту вхiдних iнформацiйних ресурсiв.

2. Анал1з лгсературних даних i постановка проблеми

Дослщження показують, що iснуе високий рiвень iнтересу в рамках роботи Мешап-систем [1-5]. А при стрiмкому розвитковi IТ-технологiй особливоi актуаль-ност набувають потреби в динамiчнiй штеграцп рiзно-рiдних даних у web-серидовищi.

Архiтектура Мешап-системи завжди складаеться з трьох частин [1]:

1. Провайдер вмкту — це джерело даних. Даш до-ступнi через API i рiзнi веб-протоколи, таю як RSS, REST i веб-сервши.

Провайдер BMicTy е однieю з найбшьш важливих частин системи, адже саме вш визначае, як i яким чином будуть виходити даш з стороншх сервiсiв. Вважаеться, що Мешапи повиннi використовувати тiльки ri сервiси, якi надають для цього спещальш API.

2. Мешап-сайт ^вень процесiв) — це веб-додаток, що пропонуе новий сервк, який використовуе джерела даних, що йому не належать.

3. Браузер ктента (презентацшний рiвень) — влас-не користувацький штерфейс Мешапу. У веб-додатках вмкт може бути «замешаплено» клiентським браузером з використанням кментсько1 мови програмування, на-приклад JavaScript.

При створенш Мешапу найбiльш хвилюючими проблемами можуть бути наступнк

— чи це не надто складно?

— чи буде ефективно?

— чи варто?

Обираючи шструменти для Мешапу потрiбно врахо-вувати штегращю на рiвнi даних (семантична штегращя) i на сервiсномy рiвнi. При виборi Мешап-iнстрyментiв мотивацiею е:

— штеграцшш iнстрyменти для досягнення кращо1

ефективностi;

— наявним шструментам для побудови колажiв даних не вистачае функщональность

Джерела даних можуть володгги рiзними власти-востями, штотними для вибору методiв штеграцп даних — вони можуть тдтримувати представлення даних в термшах пе1 чи iншоi моделi даних, можуть бути ста-тичними або динамiчними i т. п. Безлiч джерел iнтеграцii даних можуть бути однорщними або неоднорiдними щодо характеристик, ввдповвдних використовуваному рiвню iнтеграцii [5]. Для використання Мешапом кожне джерело даних повинне бути найперше проаналiзоване i змодельоване для того, щоб виконати необхвдш дп пошуку та попередньоi обробки [5].

На даний час вже розроблено юлька методiв та за-собiв для виршення проблеми визначення структури i змшту вхiдних iнформацiйних ресyрсiв та автоматичного вилучення стрyктyрованоi iнформацii з веб-сайпв i додаткiв, якi, в силу специфжи характеру HTML мови, як правило, надають неструктуровану шформащю.

4 ТЕХНОЛОГИЧЕСКИЙ АУДИТ И РЕЗЕРВЫ ПРОИЗВОДСТВА — № 6/3(20], 2014, © Кушшрецька I. I., Кушшрецька О. I.,

Берко А. Ю.

Цi методи, як правило, розробленi на 0CH0Bi певних правил видобутку даних, яю можуть бути менш або бiльш витонченими, i визначаються або в натвавтоматичному режимi за допомогою демонстрацii, або автоматично за допомогою машино-навчальних алгоритмiв або iнших методiв штучного штелекту. Огляд декiлькох засобiв видобування веб-даних представлено в робот [5].

Хоча щ пiдходи iстотно вирiшують проблему от-римання даних з веб-додатюв для цiлей автоматичноi i iнтегрованоi навiгацii по веб-сторiнках або для мкрацп в напрямку Semantic Web, iншi автори представляють свiй досввд того, щоб семантика вхiдних даних була виражена i збережена разом з цими даними. Щ ршення пропонують вирiшувати за допомогою онтологш [6].

Онтологiчнi системи будують на основi таких прин-ципiв [6]:

— формалiзацii, тобто опису об'ективних елементiв реальностi iз застосуванням единих, суворо визна-чених зразкiв (термшв, моделей тощо);

— використання обмеженоi кiлькостi базових тер-мiнiв (сутностей), на основi яких конструюють вс iншi поняття;

— внутрiшньоi повноти;

— логiчноi несуперечностi.

Для ефективного використання онтологш необхщна наявнiсть шструменпв, що дозволяють:

— створювати i модифiкувати онтологii;

— iмпортувати онтологп з iнших джерел;

— об'еднувати онтологп рiзного походження;

— автоматично створювати онтологп для джерела даних з використанням метаданих цього джерела;

— здшснювати рiзнi iншi операцii над онтолопями;

— пiдтримувати анотування онтологп;

— тдтримувати сумiснiсть версiй;

— пов'язувати концепти онтологп з рiзними типами даних;

— забезпечувати багатомовну тдтримку.

У загальному випадку формальне зображення онтологп даних подають наступним чином:

O = {X, R, F), (1)

де X — скшченна множина понять (клаав, концептiв) предметноi областi з '¿х властивостями (атрибутами); R — скшченна множина ввдношень (зв'язюв, вщповщно-стей) мiж поняттями; F — скiнченна множина функцш iнтерпретацii (обмежень, аксiом) [7].

Зпдно з вимогами стандарту IDEF5 [7], концепти подшяють на класи та значення клаив. Зв'язки мiж концептами подшяють на класифiкацiйнi — мiж кла-сами i пiдкласами i структурнi, якi описують взаемо-дш класiв.

Зазначимо, також, що використання онтологш не тшьки дозволяе створювати моделi даних, адекватнi реальному свиу, а й вiдповiдае загальному напрямку роби у галузi стандартизацii World Wide Web в рамках проекту семантичного Web, що дозволяе розглядати проблеми штеграцп даних та iнтелектуалiзацii WWW з единоi точки зору. Розроблеш для цих цiлей ушфшо-вана модель даних RDF (Resource Decription Framework) i мова веб-онтологш OWL (Web Ontology Language) надають багат можливостi семантичного опису розпо-дшених 1нтернет ресурсiв.

Отже, для того, щоб штегращя даних у Мешап-системi вiдбувалася динамiчно та при цьому можна було б зберегти семантику даних потрiбно, насамперед, зрозумгги основш принципи роботи самого Мешапу та, безсумнiвно, його роботу iз вхiдними потоками шформа-цп. Звщси виникае проблема, що полягае у визначенш структури i змiсту вхщних iнформацiйних ресурсiв для '¿х подальшого використання.

3. Мета та задач1 дослщження

Мета роботи полягае у дослщженш застосування якiсно нових пiдходiв подолання семантичних лабiринтiв вхiдноi шформацп, одним з яких може бути вдоско-налення етапу визначення структури i змiсту вхiдних iнформацiйних ресурав для роботи Мешап-системи.

Для досягнення поставленоi мети вирiшувалися на-ступш задачi:

— дослiдження та загальна формалiзацiя роботи Мешап-систем;

— на основi видiлення станiв дiяльностi Мешап-системи формулювання основних кроюв та завдань для визначення структури i змшту вхiдних шфор-мацiйних ресурсiв;

— надання можливих ршень для виршення завдань, поставлених згiдно сформульованим крокам визначення структури i змшту вхiдних iнформацiйних ресурсiв для роботи Мешап-системи.

4. Матер1али та методи дослщжень загально! роботи Мешап-систем та розроблення принципш визначення структури i зм1сту вх1дних 1нформац1йних ресурс1в

Для того, щоб зрозум^и основну суть роботи Мешапу i яким чином дана система працюе з вхвдни-ми та вихщними даними, корисним буде використання об'ектно-орiентованоi технологii моделювання загальноi роботи системи, такоi як UML-дiаграма дiяльностi.

Дiаграма дiяльностi (Activity diagram) — дiаграма, на якш показане розкладання деякоi дiяльностi на ii складовi частини. Пiд дiяльнiстю (activity) розумiеться специфiкацiя поводження, що виконуеться, у виглядi координованого послвдовного й паралельного виконан-ня тдлеглих елементiв — вкладених видiв дiяльностi й окремих дiй (action), з'еднаних мiж собою потоками, якi йдуть вщ виходiв одного вузла до входiв iншого [8].

Саме дiаграми дiяльностi дозволяють реалiзувати в UML особливосп процедурного i синхронного управ-лiння, обумовленого завершенням внутрiшнiх дiяльнос-тей i дiй. Метамодель UML надае для цього необхвдш термши та семантику. Основним напрямком використання дiаграм дiяльностi е вiзуалiзацiя особливостей реалiзацii операцiй класiв, коли необхщно представити алгоритми '¿х виконання. При цьому кожний стан може бути виконанням операцп деякого класу або ii частини, дозволяючи використовувати дiаграми дiяльностi для опису реакцш на внутршт подГ' системи [9].

У контексп мови UML дiяльнiсть (activity) являе собою деяку сукуптсть окремих обчислень, виконуваних автоматом. При цьому окремi елементарнi обчислення можуть приводити до деякого результату або дп (action).

На дiаграмi дiяльностi вщображаеться логiка або посль довнiсть переходу вщ однiei дiяльностi до шшо1, при цьому увага фiксуeться на результат дiяльностi. Сам же результат може призвести до змши стану системи або поверненню деякого значення [9].

Очевидно, що при використант гетерогенних даних, якi до того ж мають рiзну структуру або взагалi неструк-турованi, якi часто описують одну й ту ж проблемну область з використанням рiзних термшв i понять, для успiшного виршення завдання визначення структури i змшту отриманих вхiдних iнформацiйних ресурсiв iх семантика повинна бути явним чином виражена i збережена разом з цими даними. У зв'язку з цим актуально при виршенш даноi проблеми скористатися семантично орieнтованими технологиями, такими як онтологп i дескриптова логiка [10].

Онтологiя даних — це засiб рiзнобiчноi i детальноi формаль зацii знань про данi за допомо-гою концептуальноi схеми. Як правило, до складу та^ схеми входить опис структури даних, що мiстить визначення в«х релевантних класiв об'eктiв, '¿хш взаемозв'язки та правила (теореми, обмеження), задам у предметнш област набору даних [10]. Онтологii даних можна описувати рiзними за-собами, i сьогоднi поширенi ба-гато мов опису онтологiй. Проте, з огляду на те, що в будь-якш онтологп визначають термiни i задаються логiчнi зв'язки мiж ними, точна семантика опису термiнiв i зв'язкiв в рiзних мо-вах буде однаковою.

5. Результати дослщжень даяльносп Мешап-систем та формування принцитв визначення структури I зм1сту вхщних шформацмних ресурыв для роботи Мешап-системи

Визначимо основш стани дiяльностi Мешап-систем за до-помогою використання UML-дiаграми дiяльностi (рис. 1).

Аналiзуючи дiяльнiсть Ме-шап-систем можна видшити на-ступнi стани дiяльностi.

Перший стан — реестра-цiя. Якщо реестрацiя пройшла успiшно, переходимо до другого

стану, якщо ж ш — повертаемося знову до початку реестрацп.

Другий стан — авторизащя, якщо все пройшло успiшно, рухаемося дал^ якщо нi — повертаемося до початку авторизацп.

Третш стан — формування завдання. Якщо завдання сформовано ввдповщно до правил системи, рухаемося дал^ якщо ш — повертаемося до початку третього стану.

Четвертий стан — формування джерел для Мешапу.

П'ятий стан — пошук потрiбноi шформацп у вь дiбраних джерелах. Якщо результати пошуку задо-вiльнi — йдемо дал^ якщо нi — повертаемося назад до пошуку.

Рис. 1. UML-дааграма д1яльнаст1 Мешап-системи

Шостий стан — витягнення тдходящо1 шформацп i перехiд до наступного стану

Сьомий стан — зберкання отримано! iнформацii у виглядi сервiсy

Восьмий стан — вiзуальне представления готового Мешапу.

Отже, визначено 8 основних сташв, якi, зазви-чай, наявнi у будь-якiй Мешап-системь Розгляда-ючи четвертий стан мае мшце вирiшення проблеми iдентифiкацii шформацшних ресурсiв або деякого iнформацiйного об'екту (далi — об'екту), яка може включати в себе кiлька етатв, серед яких можна ви-дшити основнi:

— завдання умови видшення деякого об'екту серед всiеi сукупност об'ектiв (визначення пошукового образу);

— процес розтзнавання об'екту — перевiрка задо-волення умовами пошукового образу характеристик об'екту сканування.

Найважливiшими станами при робот Мешап-си-стеми е пошук потрiбноi iнформацii (п'ятий стан), витягнення знайденоi iнформацii (шостий стан) та и зберiгання у виглядi сервiсу (сьомий стан). При роботi з шформацшними ресурсами на цих станах досить часто може виникнути ряд проблем, яю можуть вплинути ненайкращим чином на результати роботи системи. Ввд коректноi роботи системи на даних трьох станах залежить безпосередньо юнцевий результат системи. Звичайно, що кожен наступний стан залежить ввд попереднього, зввдси — якщо на п'ятому ста-нi знайдено потрiбну iнформацiю, на шостому станi и витягнуто з джерел, на сьомому сташ ми повиннi зберегти отриману шформащю. I тут виникае потреба, що полягае у визначенш структури i змiсту отриманоi вхiдноi шформацп.

Отже, розглянемо детальшше ту роботу на сьомому сташ, що стосуеться визначення структури та змшту отриманоi вхщно! iнформацii. I для цього сформуемо основш кроки для визначення структури i змiсту вхiдних iнформацiйних ресурсiв та опишемо завдання, якi потрiбно вирiшити на кожному з них:

Перший крок. Визначення форми представлення вхвдних даних: структуроваш, слабоструктуроваш чи неструктурованi данi.

Другий крок. Класифжащя вхiдноi iнформацii вщпо-вщно до предметноi областi iз видшенням i збереженням семантики даних.

Третш крок. Видшення у вхiдному iнформацiйному ресурсi набору ре^зипв (атрибутiв), що вщобража-ють його основнi характеристики i аспекти зазначеноi предметноi областi.

Четвертий крок. Встановлення чггких границь та задоволення основних обмежень, що стосуються вхщ-ного потоку web-iнформацii.

П'ятий крок. Формування моделi вхiдного шформа-цшного ресурсу загальноi структури, визначеноi предметною областю.

Отже, автори даноi статтi описали роботу Мешап-системи на сьомому сташ дiяльностi, що вiдповiдае за визначення структури i змiсту отриманоi вхiдноi iнформацii. Для цього ними було сформовано 5 основних кроюв для визначення структури i змшту вхiдних ш-формацiйних ресурсiв.

6. Обговорення результат1в дослщжень формування принцитв визначення структури I зм1сту вхщних шформацшних ресурыв для роботи Мешап-системи

Проаналiзуемо детально кожен iз сформованих основних крокiв визначення структури i змiсту вхiдних шформацшних ресурав для роботи Мешап-системи.

Зпдно першого кроку — першочерговим завдан-ням роботи Мешап-системи для визначення структури i змiсту вхiдних iнформацiйних ресурсiв е визначення форми представлення вхщних даних: структурованi, слабоструктурованi чи неструктуроваш данi.

Вiдповiдно до другого кроку потрiбно використо-вувати таю методи i технологii класифiкацii вхвдно! iнформацii вiдповiдно до предметноi области щоб можна було видшити i зберегти семантику даних. Ввдпо-вiдно до даного принципу пропонуемо скористатися семантично орiентованими технологiями, такими як онтологп.

Аналiзуючи третiй крок — видшення у вхiдному шформацшному ресурсi набору реквiзитiв (атрибутiв), що ввдображають його основнi характеристики i аспекти зазначеноi предметноi областi, пропонуемо здшснювати за допомогою онтологiй.

Щодо четвертого кроку — встановлення чиких гра-ниць та задоволення основних обмежень, що стосуються вхiдного потоку web-iнформацii, пропонуемо визначення такого набору значень змшних вхщного iнформацiйного ресурсу у прикладнш онтологп, який повнiстю вщповь дае ршенню задачi задоволення обмежень, вщповщно до формалiзму об'ектно-орiентованих мереж обмежень, запропонованого А. В. Смирновим [11].

Знання проблемноi област описуються в прикладнш онтологп. Дана онтолопя створюеться експертами. Вона об'еднуе в собi двi складовi: концептуальнi знання та знання про завдання, що виршуються в проблемнш областi. Тому розглянемо концепщю подання знань у прикладнш онтологп, де використовуеться формалiзм об'ектно-орiентованих мереж обмежень, запропонований А. В. Смирновим [11]. Вщповщно до даного формалiзму знання описуються як множина клаав, атрибутiв класiв, доменiв атрибупв i обмежень. Сумiснiсть з завданням задоволення обмежень — знання, представлеш за допомогою цього формалiзму, можуть бути штерпретоваш як завдання задоволення обмежень.

Об'ектно-орiентована множина обмежень мае на-ступний вигляд:

А = (О,Й,ДС), (2)

де О — множина клаав об'ектiв («класи»); Ц — множина атрибутiв класiв («атрибути»); Б — множина доменiв — областей допустимих значень атрибупв («домени»); С — множина обмежень (приналежшсть атрибутiв Ц класам О i доменiв Б атрибутам Ц, приналежшсть вхщних (вихiдних) аргументiв Ц методам О i доме-нiв Б аргументам Ц):

С = {ОД, Б. (3)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

TaKCOHOMi4He i iepapxi4He ввдношення, використо-вуваш для моделювання таксономп та iepapxiï класiв, виглядають наступним чином:

С11 = (ObO2,l), (4)

де С11 — таксономiя клаав (клас O2 е пiдкласом класу O1). С11 = (Oi,O2,0, (5)

де С11 — iерархiя класiв (клас O2 е частиною класу O1).

Обмеження на сyмiснiсть (True) (несумкшсть (False)) класiв O1 i O2, що використовуеться для моделювання ситуацп, коли два або бшьше примiрника класiв не можуть бути частинами одного i того ж класу:

С111 = (O1,O2,True/ False). (6)

Асоцiативнi вiдношення мiж класами O1 i O2:

СIV = {OO). (7)

Потyжнiсть множини значень атрибyтiв (кардиналь-нiсть клаав), що використовуеться для завдання кшькосп значень, що може приймати даний атрибут, Nmax — максимально можлива юльюсть пiдкласiв класу O:

СV = (O1,O2, N max). (8)

Функщональш обмеження (атрибути Q1 i Q2 пов'я-занi функщональним вiдношенням):

СVI = ((O1,O2 ),(O1,O2 )). (9)

Визначивши можливий ряд обмежень системи, сформуемо задачу задоволення даних обмежень. Задачу задоволення обмежень (Satisfaction Constraint Task) будемо розглядати як тршку множин: множину змшних, множину ввдповвдних областей змшних (до-мени змiнних) i множину обмежень на змшш. Ршен-ням задачi задоволення обмежень називаеться набiр значень змiнних, що задовольняють в«м обмеженням на змiннi:

SŒ = (УзсгЯзсг,Сзст), (10)

де Vsœ — множина змiнних, DSc:r — множина домешв змiнних, С5СТ — множина обмежень на змшш.

Видшимо основнi операцп створення прикладноï онтологiï:

1. Формування множини ключових слiв.

2. Переклад термшологп:

— переклад ключових ^в на мови, використовyванi

в початкових онтолопях.

3. Пошук:

— виявлення онтологш, в яких представленi ключовi

слова;

— маркування елементiв вихщних онтологiй, iMeHa яких збiгаються з ключовими словами.

4. Вибiрка:

— маркування елеменпв вихiдних онтологiй, пов'я-заних в логiчному висновку з ключовими словами.

5. Добування:

— побудова зрiзiв початкових онтологш на основi маркованих елеменпв.

6. Переклад термшологп:

— переклад словниюв зрiзiв в словник прикладно! онтологп.

7. Перетворення представлень:

— перетворення формапв представлення зрiзiв в фор-малiзм системи.

8. Iнтеграцiя:

— об'еднання зрiзiв в едину онтологiю.

9. Доопрацювання експертами:

— встановлення вщсутшх обмежень, визначених у формалiзмi системи;

— включення в прикладну онтолопю онтологп за-вдань i методiв.

Вiдповiдно до п'ятого кроку завершальним етапом ро-боти Мешап-системи для визначення структури i змiсту вхщних шформацшних ресурсiв е формування моделi вхiдного iнформацiйного ресурсу загально! структури, визначено! предметною областю. Для виршення дано! задачi хочеться зазначити, що Мешапи працюють, вико-ристовуючи API додатюв для iнтеграцii мiж юлькома додатками, дозволяючи вилучення даних i обмiн дани-ми мiж додатками. API допомагають отримати доступ i використовувати ресурси, не зосереджуючись на сво!й внутршнш органiзацii. Оскiльки у всiх ресурав API е унiкальнi URI з HTTP-доступом, створювати мате-матичну модель шформацшного ресурсу потрiбно iз фпуруванням URI ресурсу [12].

7. Висновки

У результатi проведених дослiджень:

1. Дослщжено та формалiзовано роботу Мешап-си-стеми, через побудову загально! UML-дiаграми дiяль-ностi Мешап-системи та опису !! роботи, вiдповiдно до видшених станiв дiяльностi.

2. Наведено та охарактеризовано 5 основних кроюв для визначення структури i змiсту вхщних шформацшних ресурав у робот Мешап-системи.

3. Розглянуто онтологiчний тдхщ до моделювання та концепцiю подання знань у прикладнш онтологп, де використовуеться формалiзм об'ектно-орiентованих мереж обмежень, запропонований А. В. Смирновим, як одш з можливих ршень завдань, наведених у принципах щодо побудови Мешап-системи.

Литература

1. Kushniretska, I. I. Application of MashUp Technology for Dynamic Integration of Semi-Structured Data [Text] / I. I. Kushniretska, A. Y. Berko // Матер1али VI Мiжнародно'i конференци молодих вчених CSE-2013. — Л^в: Видавництво НУ «Льв1в-ська пол^ехшка», 2013. — P. 220-221.

2. Altinel, M. Damia — A Data Mashup Fabric for Intranet Applications [Text] / M. Altinel, P. Brown, S. Cline, R. Kartha, E. Louie, V. Markl, L. Mau, Y.-H. Ng, D. Simmen, A. Singh // VLDB'07, September 23-28, 2007, Vienna, Austria. — VLDB Endowment, 2007. — P. 1370-1373.

3. Ennals, R. J. Mashmaker: mashups for the masses [Text] / R. J. Ennals, M. N. Garofalakis // Proceedings of the 2007 ACM SIGMOD international conference on Management of data — SIGM0D'07. — ACM Press, 2007. — P. 1116-1118. doi:10.1145/1247480.1247626

4. Huynh, D. F. Potluck: Data Mash-Up Tool for Casual Users [Text] / D. F. Huynh, R. C. Miller, D. R. Karger // The Semantic Web. — Springer Science + Business Media, 2007. — P. 239-252. doi:10.1007/978-3-540-76298-0_18

5. Wong, J. Marmite: Towards End-User Programming for the Web [Text] / J. Wong // IEEE Symposium on Visual Languages and Human-Centric Computing (VL/HCC 2007). — IEEE, 2007. — P. 1541-1546. doi:10.1109/vlhcc.2007.40

6. Baader, F. The Description Logic Handbook: Theory, Implementation and Applications [Text] / F. Baader, D. Calvanese, D. McGuinness, D. Nardi, P. F. Patel-Schneider. — Cambridge University Press, 2003. — P. 132-136.

7. Lenzerini, M. Data Integration: A Theoretical Perspective [Text] / M. Lenzerini // Proceedings of the twenty-first ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems — P0DS'02. — ACM Press, 2002. — P. 233-246. doi:10.1145/543613.543644

8. Bock, C. UML 2 Composition Model [Text] / Conrad Bock // Journal of Object Technology. — November — December 2004. — Vol. 3, No. 10. — P. 47-73. — Available at: \www/ URL: http://www.jot.fm/issues/issue_2004_11/column5

9. Леоненков, О. Самовчитель UML [Електронний ресурс] / О. Леоненков. — Ктв, 2007. — Режим доступу: \www/URL: http://kniga.scienceontheweb.net/samouchitel-uml-2.html.

10. Бездушный, А. А. Математическая модель интеграции данных на основе дескриптивной логики [Текст]: автореф. дис. канд. физ.-мат. наук / А. А. Бездушный. — М., 2008. — С. 21.

11. Смирнов, А. В. Подход к построению распределенной системы интеллектуальной поддержки принятия решений в открытой информационной среде [Text] / А. В. Смирнов, М. П. Пашкин, Н. Г. Шилов, Т. В. Левашова; Санкт-Петербургский институт информатики и автоматизации РАН. — Санкт-Петербург: СПИИРАН, 2007. — С. 145-153.

12. Кушшрецька, I. I. Методика «чорно'1 скриньки» та агентно-о-р1ентованого шдходу для забезпечення Mash-Up штеграцп шформацшних ресурав [Text] / I. I. Кушшрецька, А. Ю. Бер-ко // Матер1али 3-i М1жнародно'1 науково'! конференцп «Лн-формащя, комушкащя, сусшльство 2014» (ICS-2014). — Льв1в — Славське: Видавництво НУ «Льв1вська пол1техш-ка», 2014. — С. 62-63.

ОПРЕДЕЛЕНИЕ СТРУКТУРЫ И СОДЕРЖАНИЯ ВХОДНЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ ДЛЯ РАБОТЫ МЕШАП-СИСТЕМЫ

В статье представлена характеристика основных шагов определения структуры и содержания входных информационных ресурсов для работы Мэшап-системы. Приведена общая схема деятельности Мэшап-системы и описано каждое состояние деятельности системы. Предложены возможные решения задач, поставленных соответственно выделенных шагов определения структуры и содержания входных информационных ресурсов для работы Мэшап-системы.

Ключевые слова: Мэшап-система, информационный ресурс, состояния деятельности Мэшап-системы, онтологии, формализм ограничений.

Куштрецька 1рина hopisHa, астрант, кафедра тформащй-них систем та мереж, Нащональний утверситет «Львiвська полтехтка», Украта, е-mail: presty@i.ua. Куштрецька Оксана hopisHa, астрант, кафедра тформащй-них систем та мереж, Нащональний утверситет «Львiвська полтехтка», Украта, е-mail: presstail@i.ua. Берко Андрт KMiaHosuH, доктор техшчних наук, професор, завгдувач кафедри загальног екологп та екотформащйних систем, Нащональний утверситет «Львiвська полтехнжа», Украта, e-mail: berkoandriy@yandex.ua.

Кушнирецка Ирина Игоревна, аспирант, кафедра информационных систем и сетей, Национальный университет «Львовская политехника», Украина.

Кушнирецка Оксана Игоревна, аспирант, кафедра информационных систем и сетей, Национальный университет «Львовская политехника», Украина.

Берко Андрей Юлианович, доктор технических наук, профессор, заведующий кафедрой общей экологии и экоинформационных систем, Национальный университет «Львовская политехника», Украина.

Kushniretska Irina, Lviv Polytechnic National University, Ukraine, e-mail: presty@i.ua.

Kushniretska Oksana, Lviv Polytechnic National University, Ukraine, e-mail: presstail@i.ua.

Berko Andriy, Lviv Polytechnic National University, Ukraine, e-mail: berkoandriy@yandex.ua

УДК 651.2:004.89 001: 10.15587/2312-8372.2014.29990

Осщач А. О. РОЗРОБЛЕННЯ АРХ1ТЕКТУРИ СИСТЕМИ

КОРПОРАТИВНОГО ДОКУМЕНТООБ1ГУ

На основг проведеного дослгдження ключових вимог, характеристик, ¡снуючих проблем систем документообиу, аналгзу ринку загалом та конкретних програмних ршень запропоновано архтектурну модель системи електронного корпоративного документообиу. Особлива увага звертаеться на модультсть системи та головнг функцюнальт вузли архтектури. Описана архтектура вгдргзняеться вгд ¡снуючихршень наявнгстю ¡нтелектуальног складовог — аналг-затора виконання документгв, формування його життевого циклу та системи кластеризацп.

Ключов1 слова: корпоративний документооби, ттелектуальна система, електронний документ, система кластеризацп, аналгзатор виконання.

1. Вступ

Автоматизащя документообиу — ключовий процес, що сприяе тдвищенню ефективносл управлшня. Це

досягаеться шляхом скорочення часу, необхщного для обробки докуменпв, ïx класифжацп, збертння, тд-вищення швидкосп, простоти пошуку та одержання шформацп. Основними щлями впровадження системи

i Надоели баннеры? Вы всегда можете отключить рекламу.