Научная статья на тему 'Управление жизненным циклом корпоративных информационных ресурсов'

Управление жизненным циклом корпоративных информационных ресурсов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
666
90
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зыков С. В.

Изложены основные элементы интегрированного подхода к управлению жизненным циклом информационных ресурсов, позволяющего поддерживать динамическую целостность объектов данных и метаданных в гетерогенной Интернет-среде. Рассмотрены прикладные программные средства и результаты внедрения системы управления контентом в крупной многопрофильной группе компаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LIFECYCLE MANAGEMENT OF CORPORATE INFORMATION RESOURCES

The paper outlines basic elements of an integrated approach to lifecycle management of information resources. The approach supports dynamic integrity of data and metadata objects in the heterogeneous Internet environment. Applied software tools and implementation results of a content management system in a large diversified group of companies are presented.

Текст научной работы на тему «Управление жизненным циклом корпоративных информационных ресурсов»

УДК 658.012

УПРАВЛЕНИЕ ЖИЗНЕННЫМ ЦИКЛОМ КОРПОРАТИВНЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ

С. В. Зыков

Московский инженерно-физический институт (государственный университет)

Изложены основные элементы интегрированного подхода к управлению жизненным циклом информационных ресурсов, позволяющего поддерживать динамическую целостность объектов данных и метаданных в гетерогенной Интернет-среде. Рассмотрены прикладные программные средства и результаты внедрения системы управления контентом в крупной многопрофильной группе компаний.

ВВЕДЕНИЕ

Быстрое развитие информационных технологий привело к накоплению и ускоренному росту объемов корпоративных данных, размеры которых в ряде случаев достигают порядка 1015 байт. Манипулирование такими внушительными хранилищами данных представляется проблематичным, поскольку они гетерогенны, а зачастую и слабо структурированы.

Проникновение информационных технологий во все сферы бизнеса уже привело к появлению различных, иногда взаимоисключающих подходов к построению сложных программных комплексов, объединяющих гетерогенные источники данных.

Исследования путей совершенствования глобальной информационной инфраструктуры поддержаны целевыми федеральными и международными программами — «Электронная Россия» (РФ), «Networking and IT R&D Initiative» (США), GIPI (ООН), «Информация для всех» (ЮНЕСКО) и др. При этом только ежегодные расходы на НИОКР исчисляются миллиардами долларов.

Характерно, что даже ведущим компаниям-разработ-чикам программного обеспечения (ПО) — «Microsoft», IBM, «Oracle», SAP, BEA и др. — не удалось создать комплексной технологии, унифицирующей управление гетерогенными информационными ресурсами. Появлению такого подхода препятствует сосуществование разнородных моделей, методов, а также языковых и программных средств проектирования ПО. Неоднородности увеличиваются из-за необходимости унификации предметно-ориентированных интерфейсов управления пользователя объектами (мета)данных СУБД и информационных систем (ИС) на всех этапах их жизненного цикла.

Неадекватная поддержка математическими моделями таких стандартов построения ПО, как XML, OMG, MDC, WfMC, ISO/IEC и др., приводит к методологиче-

ским разрывам и трудно формализуемой семантике вычислений. Подходы, призванные обеспечить интеграцию информационных ресурсов (IBM, «Microsoft», «Ariba», OASIS, OGC, W3C и др.) пока зачастую слишком сложны для практического применения [1].

Отсутствие согласованных стандартов описания и управления метаданными приводит к неэффективному применению современных XML-технологий для интеграции информационных ресурсов с разной степенью структурированности (как, например, баз данных (БД), Web-сайтов и мультимедийных хранилищ).

Основная задача настоящей работы заключается в изложении методологии, унифицирующей управление гетерогенными информационными ресурсами в среде корпоративных Интернет-вычислений. Данная методология оперирует семейством моделей для предметной области [2] и среды вычислений [3], поддержанным инструментальными средствами проектирования ПО [3, 4]. Она обеспечивает непрерывное управление проектированием ПО с возможностью восстановления модели данных по схеме ИС (т. е. реинжиниринга). При этом поддерживается адаптивная детализация, непротиворечивость и целостность информации на всем протяжении жизненного цикла.

1. КОМПЛЕКС МОДЕЛЕЙ ДАННЫХ

В модели данных для предметной области используются переменные домены, а для среды вычислений — абстрактные машины. Такой комплексный подход в более полной мере, чем традиционные (как, например, ЕЯ-модель [5]), учитывает особенности управления динамическими гетерогенными слабоструктурированными средами вычислений.

Специфика предметной области требует многоуровневого профилированного управления доступом к гетерогенным распределенным базам данных и метаданных, которое можно обеспечить с помощью унифицирован-

8

CDNTRDL SCIENCES № З • 2DDB

Рис. 1. Жизненный цикл корпоративных информационных ресурсов

ных Интернет-протоколов и веб-сервисов. В интерфейсной части ИС этим требованиям должны отвечать динамическое представление контента, гибкое управление правами доступа к нему с учетом персонализации, а также непрерывная поддержка целостности данных (под контентом будем понимать слабо- или неструктурированную информацию вне контуров управления основных программных систем, используемую в стратегических бизнес-проектах). Открытая архитектура ИС должна обеспечивать расширяемость, гибкую адаптацию к состоянию предметной области, явное разделение на архитектуры front-end и back-end, а также возможность оперативной коррекции объектов данных с учетом персональных предпочтений, т. е. в зависимости от состояния среды вычислений.

Методология непрерывного, «сквозного» управления жизненным циклом интегрированных программных комплексов (рис. 1) обеспечивает покомпонентное построение открытых и расширяемых Интернет-ИС. В процессе проектирования спецификация ИС трансформируется от понятий предметной области к сущностям модели. Далее, с помощью CASE-инструментария, она преобразуется к системе фреймов и схеме объектно-реляционных хранилищ контента и покомпонентному описанию целевой ИС.

Модели данных, основанные на понятии состояния, обеспечивают событийно-ориентированное управление разнородными объектами предметной области и среды вычислений. При этом спектр возможных семейств объектов расширяется до практически произвольных хранилищ данных, поддерживающих как современные, ориентированные на пользователя глобально распределенные архитектуры front-end и back-end, так и промежуточные и устаревшие системы. Динамика объектов данных моделируется с помощью переменных доменов; для управления этими объектами применяются абстрактные машины. Среди преимуществ рассматриваемых

моделей отметим возможность совместного управления объектами данных и метаданных (т. е. контентом) в гетерогенной интероперабельной Интернет-среде.

Вычислительная модель данных представляет собой исчисление объектов, синтезирующее основы перечисленных выше формальных систем и использующее принцип свертывания, иначе известный как концептуализация [6].

2. МОДЕЛЬ ПРЕДМЕТНОЙ ОБЛАСТИ

Объекты данных в предметной области моделируются по схеме «класс о объект о значение», что, с одной стороны, обеспечивает преемственность с объектно-ориентированным подходом, а с другой — уточняет существующие модели ([6] и др.) применительно к управлению корпоративными комплексами гетерогенных Интернет-ИС. При этом под классом имеется в виду семейство объектов данных интегрированной предметной области, под объектом понимается конкретизация класса шаблоном ИС управления контентом (ИСУК), а значение формируется той же ИС в виде информационной страницы корпоративного Интернет-портала (рис. 2). Применение схемы моделирования объектов данных на примере публикации фотопортрета (РИоШ) в составе информационной страницы представлено на рис. 2. Управление динамикой объектов предметной области моделируется сменой состояний.

Вычислительная модель обеспечивает адекватное отображение динамики и статики гетерогенных слабо-

1

Класс (UML)

Photo

-Name : char -ColorDepth : int -Resolution : int

TemplMask : lohg double

Построение объектов: _

о = [Iu Au]a1 ^ {o} = {o e D \ [Ao]}.

Объе кт (ИСУК)

і і

Агрегирование объектов: 0T(d) = {о \ о : A o T).

Типизация:

Т = {r : D \ A}, OT (А) ISA Т.

Значение (портал)

Рис. 2. Управление контентом корпоративных информационных ресурсов

ПРОБЛЕМЫ УПРАВЛЕНИЯ № З • 2nnG

9

структурированных предметных областей и поддерживает событийно-ориентированное управление контентом в глобальной среде вычислений. В архитектурно-интерфейсном аспекте модель формализует управление проектированием открытых, распределенных, интероперабельных ИС на основе методологий иМЬ, ВРЯ, СОМ и СОЯВА. В отношении управления прототипированием и реализацией поддерживается Ггоп1:-епё/Ьаск-епё-обра-ботка информации из разнородных корпоративных хранилищ данных на основе событийно-управляемых процедур (в форме скриптов) и вычислительных систем на базе динамического языка 80Ь.

Моделирование интегрированной предметной области И основано на установлении отношений между классами С объектов данных, которые моделируются доменами

С = 3м> : [И^у : И(у(цт) — Д) = {у : И|Д},

где С и И находятся в отношении частичного порядка (С 1БА И), Д — критерий принадлежности объекта к классу С с точки зрения предметного эксперта, у — переменный объект.

Класс сложных («многомерных») объектов представим как и-арное отношение между ними:

Яп = 3^ : [V*, ..., у^у* : V*, ...,

^У„ : УМу*, •••, Уп] — *) = {[У1 : у\, •••, VvИ : УЖ',

где Г — критерий принадлежности объекта к классу .п.

Таким образом, произвольный класс объектов представляет собой семейство упорядоченных пар (У1: V), где у. — Е-й атрибут класса, а у — тип атрибута. Фреймовое представление для бинарного отношения приведено в работе [5].

Отметим, что в состав атрибутов входят как данные, так и метаданные, например, размерности объектов, ограничения целостности и другие параметры. К метаданным относится и числовая характеристика (битовое поле), определяющая возможность использования класса и его объектов в шаблонах веб-страниц ИС управления контентом.

При конкретизации класса С в соотнесении а* с шаблоном Дк веб-страницы, означивание семейства шаблонов М устанавливает в значение «истинно» тот единственный его элемент т, номер к которого совпадает с номером шаблона:

М = (т*, ..., тк, ..., т*), где V/ = 1, ..., *, т1 е {0, 1};

[М|Дк] = (т*, ..., т*, ..., т*), где тк = (* \ к

[ 0,1 ф к.

Кроме того, атрибуты метаданных у*, ..., Уп конкретизируются объектами метаданных согласно условиям ограничений Р., заданных в соотнесении для шаблона Г:

[(у* : У*), •••, уп : УпЦ = ([у*]^), •••, [уп]1(Рп)) =

= (у1 : V*, ..., уП : К),

причем У^ШАУ*, V' П11/АУп.

Второе соотнесение а2 приводит к конкретизации шаблона (у*, ..., у’и) информационной страницы ИС управления контентом значениями контента (с*, ..., сп):

[у* : , ..., уИ : уй’]с = (у1/сl, ..., уИ/спX

где с* : С*, ..., сп : Сп, причем С* Ш V*, Сп Ш У'п.

Заметим, что уровень абстракции элементарных сущностей модели снижается при переходе от классов к объектам и далее к значениям, а расширяемость объектов при переходах с одного метауровня на другой обеспечивает управление проектированием расширяемых программных комплексов. Объекты, в соответствии с приписанными типами, агрегируются в зависящие от соотнесений совокупности и формируют переменные домены. Нейтральность и семантичность объектов и их компонентов обеспечивают предметно-ориентированное управление процессами проектирования ПО.

Классы и определяются дескрипциями 3иД(и) со значениями [3иД(и)], где Д — критерий отбора. Двукратное применение соотнесений а* е А и а2 е А, где А — домен соотнесений, переводит эти классы сначала в объекты о = [3иД(и)]а*, а затем в значения с = оа2.

Двунаправленный характер соотнесений — от классов к значениям и обратно — обеспечивает адекватное моделирование реинжиниринга ПО, а механизм дескрипций облегчает построения в обоих направлениях.

Переменные домены 0Т(А) = {о|о : А о Т} строятся как семейства объектов о с типами 0, полученных из предметной области И с применением предикатов-критериев отбора Д. При этом совокупность возможных объектов о содержится в области И, а действительных 0Т(А) — в типы Т [5].

Исследование взаимодействия классов, объектов и значений позволяет сформулировать основной принцип моделирования в виде соотношения:

[класс объектов] : соотнесение о объект,

где левая часть соответствует языковому уровню описания классов, а правая — уровню предметной области. Таким образом, для описания классов используются критерии отбора — формулы, идентифицирующие функции из соотнесений в объекты, т. е. класс рассматривается как процесс. Согласно принципу свертывания, для селекции и идентификации объектов будем пользоваться схемой исследования предметной области:

[класс объектов] : соотнесение о о объект > объект > соотнесение о о значение > значение,

где символ «>» означает снижение уровня абстракции.

Таким образом, диаграмма (см. рис. 2) иллюстрирует принцип свертывания:

о = [3иИи]а* о {о} = {о е И |[И(о)]}

и переход от классов объектов в языке к таковым в предметной области посредством функции вычисления значения [•], при котором классы используются для фиксации объектов и, далее, — значений. При этом

10

СПНТНШ $С1ЕНСЕ$ ™ 3 • 2006

класс описывается критерием отбора Д с дескрипцией 3, а вычисление значения формирует соответствие между объектами предметной области и языка описания ее модели.

З. МОДЕЛЬ УПРАВЛЕНИЯ КОНТЕНТОМ В ИНТЕРНЕТ-СРЕДЕ

В качестве модели ИС управления корпоративным контентом в развитие категориальной абстрактной машины предлагается абстрактная машина на основе состояний. Ее динамика формализуется явным перечислением смен состояний. На уровне модели, при отображении шаблонов страниц портала в HTML-код происходит связывание переменных, характеризующих элементы шаблона, с их значениями, а именно, с элементами портальных страниц или, иначе, означивание.

Семантика абстрактной машины строится на основе теории переменных доменов [7]. Типы атомарных шаблонов (элементов контента) получаются из стандартных доменов, а типы более сложных шаблонов — посредством конструкторов доменов. Семантика строится по следующей схеме:

1) перечисление стандартных (наиболее частых в рамках предметной области) доменов;

2) определение конечных (содержащих явно перечислимые элементы) доменов;

3) определение конструкторов (операций построения новых доменов на основе имеющихся), т. е. способов комбинирования доменов;

4) формализация агрегированных доменов на основе атомарных доменов и конструкторов (последние включают в себя операцию [D1 o D2], декартово произведение [D1 х D2 ... х DJ, последовательность D* и дизъюнктную сумму [D1 + D2 ... + DJ).

Язык абстрактной машины содержит множество выражений Е — констант, идентификаторов, операцию присваивания («записи» контента в «слот» шаблона) и др., а также множество команд С — сравнения, последовательного выполнения и т. д. Синтаксис абстрактной машины определяется описанием доменов Ide для идентификаторов, Сот для команд и Ехр для выражений. Система агрегированных доменов имеет вид:

St = Мет х In х Out;

Мет = Ide o [Val + {unbound}];

In = Val *;

Out = Val *;

Val = Type1 + Type2 + ...

Домен St состояния абстрактной машины определяется состоянием памяти Мет с учетом значений Val на ее входе In (т. е. контента) и на ее выходе Out (т. е. веб-страницы). Под управлением памятью понимается отображение из домена идентификаторов в домен значений, т. е. аналог связывания переменной со значением в ламбда-исчислении. Для корректного управления обработкой исключительных ситуаций вводится элемент unbound. Домен значений представляет собой дизъ-

юнктную сумму доменов, содержащих синтаксически допустимые типы контента.

Семантические предложения описывают значения денотатов (правильно построенных конструкций) языка управления объектами абстрактной машины. Денотатом идентификатора при возможности связывания является этот идентификатор, связанный со значением в виде упорядоченной тройки

<значение в памяти, индентификатор, состояние>

без смены состояния, а при невозможности — сообщение об ошибке:

Е[1]о = (т, I = ииЬоии@) еггог о (т, I, о).

Вычисление значения выражения в среде абстрактной машины приводит к такому изменению состояния, что либо происходит связывание переменной со значением, либо (при невозможности связывания) генерируется ошибка:

Е : Ехр о № о [[ Уа1 х /р] + {еггог}]].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вычисление значения команды также приводит к изменению состояния, в том числе с возможностью ошибки:

С : Сот : Сот о [/Р о & + {еггог}]].

Семантическое предложение команды присваивания приводит к смене состояния с подстановкой значения контента у вместо идентификатора шаблона I в памяти:

С : [I = Е] = Е[Е] * Оу(т, /, о).(т[у/1], /, о).

4. АДАПТАЦИЯ МЕТОДОЛОГИИ

Методология проектирования ИС была скорректирована для управления гетерогенными корпоративными информационными ресурсами в среде Интернет. Базовая последовательность проектирования дополнена схемой обработки гетерогенных хранилищ данных, позволяющей пользователям в зависимости от динамически активируемых скриптов-соотнесений взаимодействовать с распределенным хранилищем контента в том или ином состоянии. В этом случае скрипты в виде профилей соединения с БД контента и хранимых процедур инициируются в зависимости от активируемых пользователем событий и обеспечивают распределенное Ггоп1:-епё-управление корпоративными порталами. Динамическое управление профилями доступа к контенту позволяет реализовать строгую и гибкую персонализацию вместе с высокой отказоустойчивостью и защищенностью данных в Интернет-среде.

Методология управления проектированием корпоративных информационных ресурсов включает в себя обобщенный алгоритм интеграции новых компонентов в состав существующих ИС. Алгоритм основан на анализе семантически приоритетных объектов данных и обеспечивает целостность на уровне моделей, а также итеративное управление проектированием корпоративных информационных ресурсов с возможностью реинжиниринга [8].

ПРОБЛЕМЫ УПРАВЛЕНИЯ № З • 2ППG

11

Методология практически апробирована при создании ПО управления персоналом ЦшОие, а также Интернет- и Интранет-порталов в Международной группе компаний (МГК) ИТЕРА.

Системная архитектура программного комплекса предоставляет пользователям определенные ролевые полномочия по вводу, коррекции, анализу и веб-публикации контента.

Автоматизированная трансляция объектов данных в схемы целевых БД и команды абстрактной машины производится с помощью предметно-ориентированного инструментального средства Сопсер1Моёе11ег с визуальной поддержкой семантических сетей, управляющего трансляцией модели предметной области в иМЬ-специфика-цию. При этом обеспечивается непротиворечивость и целостность данных Ц].

Интерактивные интерфейсные средства включают в себя предметно-ориентированные дизайнер форм (в том числе веб-страниц), генератор отчетов, справочную систему и средства администрирования. База данных контента обеспечивает совместное хранение как данных для оперативного доступа, так и метаданных — размерностей и форматов представления объектов, ограничений целостности и др. — для поиска, интеграции и обработки информации. Компоненты программного комплекса охвачены единым интерфейсом и внедрены в среду приложений для учета, планирования и управления корпоративными ресурсами.

В ходе применения методологии спецификации модели данных, сформированные инструментальным средством Сопсер1Моёе11ег, преобразуются в иМЬ-диаграм-мы, затем с помощью традиционных СА8Е-средств — в схемы БД в форме ЕЯ-диаграмм, и в итоге — в атрибуты шаблонов для публикации контента и результирующие веб-страницы.

ЗАКЛЮЧЕНИЕ

Рассмотренная методология положена в основу систем управления распределенными информационными ресурсами в многопрофильной корпорации МГК ИТЕРА, объединяющей около Ю тыс. сотрудников в более чем 20-ти странах мира.

Методология базируется на математической модели объектов данных с состояниями. Разработаны сценарии управления контентом для различных классов пользователей и администраторов ИС. При реализации были построены прототип и полномасштабная версия, компоненты которой прошли экспериментальную проверку в течение 2—5 лет. Веб-страницы, созданные в автоматизированном режиме с помощью ИС управления контентом, доступны через Интранет-портал и Интернет-сайт МГК ИтЕрА (-мшжйега.т).

ЛИТЕРАТУРА

1. Зыков С. В. Проектирование Интернет-порталов. — М.: МФТИ, 2005. — 258 с.

2. Zykov S. V. Integrated Methodology for Internet-based Enterprise Information Systems Development // Proc. of the 1st International Conference on Web Information Systems and Technologies (WEBIST 2005) / Setubal: INSTICC Press, 2005. — P. 168—175.

3. Zykov S. V. Abstract Machine as a Model of Content Management // Proc. of the 6 th Workshop on Computer Science and Information Technologies (CSIT’2004) / Budapest, Hungary, 2004. — Vol. 1. — P. 251—252.

4. Zykov S. V. ConceptModeller: a Problem-Oriented Visual SDK for Globally Distributed Enterprise Systems // Тр. 7-й Между-нар. конф. «Компьютерные науки и информационные технологии» (CSIT’2005). — Уфа: УГАТУ, 2005. — Т. 1. — С. 114—117.

5. Codd Е. F. Relational Completeness of Data Base Sublanguages Data Base Systems / Courant Computer Sci. Symposia Series. — New York: Prentice Hall, 1972. — N. 6.

6. Wolfengagen V. Е. Event Driven Objects // Тр. 1-й Междунар. конф. «Компьютерные науки и информационные технологии» (CSIT'99). — M.: МИФИ, 1999. — С. 88—96.

7. Scott D. S. Lectures on a mathematical theory of computations / Oxford University Computing Laboratory Technical Monograph PRG-19, 1981. — 148 p.

8. Зыков С. В. Управление персоналом с помощью интегрированных информационных систем. — М.: Недра коммю-никейшнс, 2001. — 160 с.

в (495) 411-85-00, доб. 44-21

E-mail: szykov@itera.ru □

С 1998 г. Институт проблем управления РАН выпускает периодический сборник трудов ученых, занимающихся разработкой и исследованием математических моделей управления большими (социально-экономическими, организационными, организационно-техническими и др.) системами. Все статьи, публикуемые в сборнике, проходят рецензирование ведущими специалистами по теории управления.

С 2005 г. сборник "Управление большими системами"является одним из печатных органов организованной ИПУ РАН совместно с ведущими вузами России сети научно-образовательных центров (НОЦ) и издается на ротационной основе всеми НОЦ, входящими в сеть (Волгоградский государственный университет, Воронежский государственный архитектурно-строительный университет, Липецкий государственный технический университет, Самарский государственный аэрокосмический университет).

В 2006 г. сборнику присвоен статус периодического издания. Домашняя страница полнотекстовой электронной версии сборника http://www.mtаs.ru/second.php?ID=15. По этому электронному адресу в свободном доступе вы найдете все вышедшие номера сборника.

12

CONTROL SCIENCES № 3 • 2DDB

i Надоели баннеры? Вы всегда можете отключить рекламу.