Научная статья на тему 'Этапы информационного моделирования'

Этапы информационного моделирования Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3493
131
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
π-Economy
ВАК
Ключевые слова
ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ / INFORMATION MODELING / МОДЕЛЬ ПРЕДМЕТНОЙ ОБЛАСТИ / DOMAIN MODEL / ИНТЕГРАЦИЯ ДАННЫХ / DATA INTEGRATION / РАСПРЕДЕЛЕННАЯ СРЕДА / DISTRIBUTED ENVIRONMENT / КОММУНИКАЦИИ / COMMUNICATION / ДОКУМЕНТООБОРОТ. / DOCUMENT MANAGEMENT.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Липунцов Юрий Павлович

Информационные и экономико-математические модели предопределяют основные характеристики информационных систем – информационное наполнение и интеллектуальность. Рассмотрено информационное моделирование, которое отвечает за количество и качество данных, поступающих на обработку. Информационное моделирование разделено на три стадии – спецификация, реализация, интеграция. В качестве этапов спецификации представлен взгляд на организацию с позиций архитектуры деятельности, коммуникативных актов, документов, сервисов и процессов. В качестве методов реализации модели данных приводится реляционная модель и RDF. Методы интеграции данных разделенные на три категории по степени контроля среды. В контролируемой среде интеграция реализуется методом составления единой модели данных, стандартизации данных, присвоением единых идентификаторов базовым объектам модели, а также отслеживанием целостности данных систем, представленных в единой модели. В полуконтролируемой среде представлены три модели интеграции: сервисная модель, стандартизация форматов данных, семантическая интеграция. В неконтролируемой среде методами интеграции выступают открытые связанные данные и интеграция на основе модели контекста. С ростом объема накапливаемых данных актуальными становятся семантические методы интеграции. При переходе от технологических методов интеграции к семантическим методам существенно возрастает роль специалистов предметной области, которые выступают как поставщики контекста, интерпретаторы данных, а также принципиальные участники разработки архитектурных решений. Использование архитектурных принципов реализации системы на этапе спецификации и дальнейшее следование этим принципам при реализации и интеграции приводят к существенному сокращению затрат на информационное моделирование и реализацию системы в целом.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The information modeling stages

The core characteristics of information systems are defined by information and mathematical models; these are the plenitude of data and data analysis, and the intellectuality of a system. The article discusses different approaches to describing the information model, the types of implementation, and the practice methods of data integration. The definition and analysis are presented from a set of viewpoints, including business architecture, organization as communication, organization as document-flows, services and processes. The implementation is represented by the ER and RDF models. The data integration methods have been divided into three categories according to control type. In a controlled environment the integration can be implemented by creating an integrated data model, standardizing the data, assigning unified identifiers to basic model objects, as well as by tracking the data integrity for the systems included in the model. Three models are possible in a semi-controlled environment: the service model, data formats standardization and semantic integration. In an uncontrolled environment, integration methods involve linked open data and context based models. With the growing number of users and the transition to an open world, semantic principles are becoming more significant. Given the shift from systems integration to the semantic method, the role experts in various areas is growing substantially; these act as suppliers of context, interpreters of data, and the key participants in designing architectural solutions. Using the architectural principles of system implementation during the specification stage and subsequently following these principles through implementation and integration may result in a substantial reduction of the costs of modeling and implementing the system as a whole.

Текст научной работы на тему «Этапы информационного моделирования»

Научно-технические ведомости СПбГПУ. Экономические науки № 6(233) 2015

УДК 330.47; 330.46 DOI: 10.5862/JE.233.20

Ю.П. Липунцов ЭТАПЫ ИНФОРМАЦИОННОГО МОДЕЛИРОВАНИЯ

Iu.P. Lipuntsov THE INFORMATION MODELING STAGES

Информационные и экономико-математические модели предопределяют основные характеристики информационных систем — информационное наполнение и интеллектуальность. Рассмотрено информационное моделирование, которое отвечает за количество и качество данных, поступающих на обработку. Информационное моделирование разделено на три стадии — спецификация, реализация, интеграция. В качестве этапов спецификации представлен взгляд на организацию с позиций архитектуры деятельности, коммуникативных актов, документов, сервисов и процессов. В качестве методов реализации модели данных приводится реляционная модель и RDF. Методы интеграции данных разделенные на три категории по степени контроля среды. В контролируемой среде интеграция реализуется методом составления единой модели данных, стандартизации данных, присвоением единых идентификаторов базовым объектам модели, а также отслеживанием целостности данных систем, представленных в единой модели. В полуконтролируемой среде представлены три модели интеграции: сервисная модель, стандартизация форматов данных, семантическая интеграция. В неконтролируемой среде методами интеграции выступают открытые связанные данные и интеграция на основе модели контекста. С ростом объема накапливаемых данных актуальными становятся семантические методы интеграции. При переходе от технологических методов интеграции к семантическим методам существенно возрастает роль специалистов предметной области, которые выступают как поставщики контекста, интерпретаторы данных, а также принципиальные участники разработки архитектурных решений. Использование архитектурных принципов реализации системы на этапе спецификации и дальнейшее следование этим принципам при реализации и интеграции приводят к существенному сокращению затрат на информационное моделирование и реализацию системы в целом.

ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ; МОДЕЛЬ ПРЕДМЕТНОЙ ОБЛАСТИ; ИНТЕГРАЦИЯ ДАННЫХ; РАСПРЕДЕЛЕННАЯ СРЕДА; КОММУНИКАЦИИ; ДОКУМЕНТООБОРОТ.

The core characteristics of information systems are defined by information and mathematical models; these are the plenitude of data and data analysis, and the intellectuality of a system. The article discusses different approaches to describing the information model, the types of implementation, and the practice methods of data integration. The definition and analysis are presented from a set of viewpoints, including business architecture, organization as communication, organization as document-flows, services and processes. The implementation is represented by the ER and RDF models. The data integration methods have been divided into three categories according to control type. In a controlled environment the integration can be implemented by creating an integrated data model, standardizing the data, assigning unified identifiers to basic model objects, as well as by tracking the data integrity for the systems included in the model. Three models are possible in a semi-controlled environment: the service model, data formats standardization and semantic integration. In an uncontrolled environment, integration methods involve linked open data and context based models. With the growing number of users and the transition to an open world, semantic principles are becoming more significant. Given the shift from systems integration to the semantic method, the role experts in various areas is growing substantially; these act as suppliers of context, interpreters of data, and the key participants in designing architectural solutions. Using the architectural principles of system implementation during the specification stage and subsequently following these principles through implementation and integration may result in a substantial reduction of the costs of modeling and implementing the system as a whole.

INFORMATION MODELING; DOMAIN MODEL; DATA INTEGRATION; DISTRIBUTED ENVIRONMENT; COMMUNICATION; DOCUMENT MANAGEMENT.

Введение. Информационная модель определяет следующие характеристики данных: объем, актуальность, полнота, целостность, своевременность, точность, уникальность и ряд других.

В статье представлен опыт автора в области информационного моделирования и интеграции данных, накопленный при создании информационных моделей уровня

предприятия [2], для отдельных предметных областей, таких как «Образование» [4], «Экология» [3], а также опыт участия в проектах по информатизации государственного сектора и исследованиях по использованию ИКТ в государственном управлении [1, 5].

С ростом обмена данными возрастает роль специалистов предметной области как поставщиков контекста и логики деятельности, поэтому информационное моделирование будем рассматривать как последовательное движение от содержательной точки зрения к технологической. Предложенная последовательность этапов позволяет в прозрачной для специалистов предметной области форме изложить суть информационного моделирования. Аналогичные работы по теме [17, 22] отражают информационное моделирование с технологической точки зрения.

Методика и результаты исследования

1. Спецификация, реализация и интеграция как этапы создания информационной модели.

Одним из вариантов представления этапов создания и реализации моделей является V диаграмма, используемая в системной инженерии. Эта диаграмма отражает укрупненные стадии проекта — спецификацию, реализацию и интеграцию.

В спецификации рассматриваются этапы, относящиеся к абстрактному описанию и представлению и реализующиеся путем построения поисковых моделей абстрактно-теоретического характера. Процесс моделирования начинается с моделей верхнего уровня, а затем они детализируются, т. е. используется принцип «сверху вниз». После завершения спецификации следует реализация — построение моделей на физическом уровне и наполнение их данными. Затем следует стадия интеграции данных. Интеграция, в противоположность спецификации, начинается с локальных систем и поднимается на следующий уровень, т. е. используется принцип «снизу вверх».

В V диаграмме этап спецификации отражается на левой наклонной линии, а этапы интеграции модели на правой, что дает возможность соотносить спецификацию с интеграцией (рис. 1).

Рис. 1. V модель описания жизненного цикла

Такое представление позволяет выполнять трассировку: элементы на левой стороне представляют собой связанные теоретические представления, а компоненты на правой стороне отражают воплощение этих представлений на практике. V диаграмма дает возможность отследить вертикальную и горизонтальную трассировки. Вертикальные связи — связи элементов верхнего уровня с детальными элементами правой и левой сторон диаграммы, а горизонтальные связи — между теоретическими моделями и практиками.

2. Детализация этапов информационного моделирования. Назначение информационной модели — это отражение предметной области в слое данных. Предметная область создаваемой информационной системы может быть достаточно широкой, а отдельные ее части могут быть реализованы в информационных системах. В этом случае необходима интеграция данных других систем. С учетом этого информационную модель предметной области рассмотрим как совокупность собственной модели предметной области и модели интеграции с существующими системами. Собственная модель позволит отразить наше понимание предметной области, а модель интеграции создаст основу для сбора данных из локальных систем и поставку их в унифицированном виде.

Декомпозиция информационной модели. В моделировании предметной области обычно выделяют три уровня абстракции информационных моделей — концептуальные, логические и физические.

Концептуальная информационная модель, как правило, является описательной моделью и близка к представлению предметной области естественным языком. Посредством определений концепций или терминов решается задача представления смысла, который не

всегда удается полностью отразить формальными методами. Концептуальная модель обычно включает словарь, определяющий базовые элементы, и бизнес-правила — ограничения на поведение отдельных элементов. С помощью представления и определений передаются существенные элементы системы и их поведение.

Модель логического уровня представляет собой логику предметной области, выражаемую через совокупность правил, принципов и зависимостей поведения объектов. Модели логического уровня представляют точки зрения (view) на концептуальную модель. Точек зрения может быть несколько, как и несколько вариантов моделей для отражения этих точек зрения. Для создания логических моделей необходимы набор контекстов, их описание и формальное представление. Контекст как понимание окружающей среды субъективен и предопределяется спецификой восприятия субъектом.

В информационном моделировании движение сверху вниз совпадает с движением от содержательного восприятия деятельности к информационному. В качестве вариантов представления логических моделей рассмотрим взгляд на организацию с позиции бизнес-архитектуры, с коммуникативной точки зрения, далее — организация как совокупность документов и в конце сервисная модель и модель бизнес процессов.

После описания деятельности организации естественным языком в концептуальной модели следует структурное представление деятельности в формате бизнес-архитектуры [8]. Этот вариант модели является наиболее близким к управленческим моделям. Предметом моделирования здесь является структурное восприятие деятельности для перевода стратегии в плоскость оперативных действий. Реалистичность модели повышается при включении формальных и неформальных правил, организационного и культурного контекста и других аналогичных элементов.

Взгляд на деятельность организации как на совокупность коммуникационных актов характерна для следующей точки зрения. Основой для моделирования коммуникаций часто используется семантический треугольник Огдена и Ричардса [19], который опре-

деляет соотношение между объектом, его смысловым значением и терминами. Объекты определяются с помощью концепций — носителей значения, а для представления или коммуникации используется имя объекта, определяемое с помощью терминов и обозначений.

Коммуникации являются объектом исследования нескольких проектов по структурному представлению взаимодействий: рабочая группа BMI OMG разрабатывает стандарт SBVR [21]. Принстонский университет ведет проект Wordnet project [26]. Коммуникации являются определяющей частью онтологической модели предприятия Дитца [11], в которой организация рассматривается как совокупность координационной и операционной деятельности, составляющим ее значительную часть. Организация воспринимается как социальная система, имеющая строгий инженерный каркас, который выступает инструментом для ее функционирования и понимания.

Д. Чапин [9] рассматривает коммуникацию как совокупность двух уровней взаимодействия — уровня представления и уровня значения. Уровень представления отражает форму сообщения, а уровень значения содержит совокупность формализованных правил деятельности в контексте текущего взаимодействия.

Определенная часть коммуникаций из экономической деятельности формализуется и переходит в прикладные модели, например коммуникации между покупателем и продавцом в магазине в формализованном варианте превращаются в интернет-магазин.

Существует значительное количество проектов, в которых информационная деятельность основывается на документах и их потоках. Документы отражают направления изменений организации, они являются носителями корпоративных знаний, описывают управленческую деятельность, определяют технологические процессы, содержат руководства систем и т. д. [7, 10]. В [18, 28] понятие «документ» рассматривается с информационной точки зрения, в [29] — как инструмент реализации логики деятельности. Логика реализуется посредством интеллектуального документооборота на основе документа,

включающего модульную форму и методы для выполнения сервисов.

Представление деятельности в виде документов удобно, поскольку в документах содержатся данные, на основе которых просто составить схему и наполнить ее. Но информации из документов часто недостаточно для построения полноценной системы, отражающей логику деятельности.

Следующая группа моделей рассматривает организацию как совокупность сервисов. Сервисы предоставляются предприятием внешним пользователям, а деятельность внутри предприятия интерпретируется как обмен сервисами между подразделениями. Сервисная модель воспринимает поставщика сервиса как «черный ящик». Сервисы рассматривают компоненты с позиций функций и внешнего поведения, такой подход применяется для эксплуатации компонентов и управления ими.

Наиболее детально логику деятельности отражает идеология бизнес-процессов. На уровне бизнес-процессов каждый компонент рассматривается как «белый ящик», содержание элементов которого прозрачно. Такой подход характерен для стадий создания и эксплуатации моделей и применяется также для их изменения. Инженерия компонент предполагает детальное представление элементов, их состав и взаимосвязи. Все модели верхнего уровня, претендующие на реализацию, должны быть прописаны в форме бизнес-процессов.

Информационная модель логического уровня обеспечивает конкретно ориентированный, но платформо-независимый взгляд на информацию с позиций логических структур данных. Информационные модели можно рассматривать как способ представления элементов системы и их поведения. С содержательной позиции логические модели обеспечивают формальное представление определенного контекста. Вариантом такого представления является схематичное отражение элементов организации: состава архитектурных компонентов и их взаимосвязей, моделей коммуникативных актов, схем движения документов, сервисной модели деятельности, модели бизнес-процессов. Важным элементом отражения логики деятельности

организации является организационная структура. На поздних стадиях проектирования значительная часть логических моделей воплощается в логическую модель данных, представляемую набором сущностей и ассоциаций между ними. В таком виде представление готово для реализации в виде физической модели данных.

Реализация. Построение модели данных. В информационных моделях структурное представление реального мира превращается в символьное описание состояния элементов системы и их отношений. Модель данных может отражать активность и статику. Статика описывается данными и ограничениями. Вариантами отражения активности в модели данных являются таблицы состояний, потоков данных, транзакции в форме сущностей пересечений. Существенная часть модели данных это роли пользователей: сотрудники при взаимодействии с информационной системой интерпретируются как пользователи, а их положение в организационной структуре трансформируется в роль.

Физическая модель представляет содержание логической модели в формате модели базы данных. Она является наиболее техно -логической, поскольку определяет представление данных для конкретных приложений и технологий, формат хранения данных и обмен ими.

Основным вариантом моделирования предметной области является создание реляционной модели данных. В реляционных моделях объекты, транзакции и прочие элементы реального мира отражаются в сущностях и детализируются в атрибутах. Дополнительными элементами модели данных являются связи и их характеристики, которые предопределяют типы пересечения множеств элементов сущностей.

Существенной частью современных информационных моделей являются конечные автоматы. В информационной модели они реализуются посредством отражения в модели данных состояния системы, возможных вариантов перехода, набора команд, распределения полномочий между агентами и т. д.

С развитием всемирной паутины WWW, включающей большое количество участников, разработаны технологии описания ре-

^ЖаучнО-Технические^ведомости^СПбГПУ.^Эко

сурсов в формате RDF (Resource Description Framework). Формат позволяет организовать хранение данных в виде триплетов, представляющих собой бинарные отношения «субъект — предикат — объект». Дополнением такой модели является онтологическая модель в форме графа связанных сущностей. С использованием этой модели данных создаются такие классы приложений, как вики-педии, социальные сети и прочие масштабные решения в среде веб.

Новой реальностью в области данных становятся большие данные (Big Data) как следствие индустриализации поставки данных, а также возрастания количества поставщиков данных в виде умных устройств. Для работы с большими данными необходима настройка традиционных методов обработки данных на большее количество переменных и адаптацию расчетных алгоритмов.

Интеграция. Создание современных приложений предполагает активное информационное взаимодействие систем компонентов, их интеграцию. Информационная система обычно предполагает взаимодействие с другими системами, а информационная модель включает несколько источников данных. Для управления организацией необходимы данные из разных предметных областей, при

этом в отдельных организационных единицах, как правило, используют локальную систему, не ориентированную на обмен данными с внешней средой. Поэтому интеграция данных выделяется как самостоятельная деятельность.

Рассмотрим следующую последовательность моделей интеграции. Интеграция в рамках контролируемой среды, на уровне предприятия; интеграция в полуконтролируемой среде, за рамками предприятия; интеграция путем создания технологической инфраструктуры; интеграция путем построения модели единых форматов данных; семантическая интеграция. Наиболее интеллектуальным вариантом является модель интеграции в неконтролируемой среде. В эту категорию попадают модели открытых связанных данных и модели естественной интеграции (рис. 2).

Методы интеграции данных предопределяются степенью контроля распределенной среды. При этом набор данных, подлежащих обмену, может иметь разное наполнение: может включать только базовые компоненты, либо базовые компоненты и их транзакции без действий (существительные), либо описание логики деятельности (существительные и глаголы).

\К°нцептуал ьная\ Полезная информация /Естественная

модель \ Ч--------------— —---------/

\ / связанность ^деятельности \

Свободный обмен

Архитектура \ информацией / 0™рытые

\ ч--------------------»• / и свяаанные .

Vдеятельности \ / данные

О \ \ Модель \ _ /Семантическая , •у \ \ Л Сообщения, бизнес-правила / / ,

\ \ коммуникациях ^______________/ интеграция / I §

\\\ доМ>°дел-ьо \ Документы / ЕдДк|ное / //

■Ъ \ \ документо- \ . / пространство / / Ё

\ \ \ оборота \ •+■----------> / имен / /

XV Модель \ Сервисы Аехнологическая/ / О-\ \ сервисов \ <-------> / интеграция! / ^

\ \ \-Модель \ Базовые /~М-7 /&

% \\ бизнес- \ компоненты/ Мастер- / / & % \ \ процессов \ / данные / / £

* ~7 Л

Физическая модель данных предметной области

Реализация

Рис. 2. V модель информационного моделирования

Интеграция в рамках предприятия реализуется по модели мастер-данных. Мастер-данными называют информацию о базовых информационных объектах предметной области. Управление мастер-данными вводится с целью исключения повторяющихся записей, не полных, противоречивых данных о базовых объектах.

Большинство предприятий используют эту модель для объединения локальных унаследованных информационных систем. Имеется описание пяти уровней зрелости развития мастер-данных [12]. На последних уровнях зрелости базовые объекты связаны между собой и автоматически обновляются при выполнении транзакций, т. е. интегрируется информация о логике деятельности. Технологически обмен данными на уровне одной организации может быть реализован путем внедрения решений с центральным звеном: применение систем класса ERP, внедрение технологий интеграции приложений, например ESB (Enterprise Service Bus).

Если создаваемая на этапе реализации физическая модель данных ориентирована на работу с мастер-данными, то интеграция компонент на первом уровне пройдет беспроблемно (рис. 2, горизонталь Базовые компоненты).

Деятельность современной организации не ограничивается внутренним контуром, идет активное информационное взаимодействие с разными категориями контрагентов. Целью создания информационной модели в полуконтролируемой среде является максимальная автоматизация информационного обмена, индустриализация поставки данных. Модель обмена данными с контрагентами предопределяется сущностными характеристиками контрагентов.

Организация взаимодействия между системами в полуконтролируемой среде может быть реализована на трех уровнях, отличающихся интеллектуальностью обмена и интерпретации данных [21—23]:

— создание технологической инфраструктуры, используемой для сбора, хранения и передачи данных;

— разработка единых форматов данных для структур данных;

— семантика, посредством которой данные могут быть преобразованы в наделенную смыслом информацию.

Наиболее простая модель предполагает обмен данными посредством технологической инфраструктуры и создания сервисов для обмена. Этот тип интеграции не предполагает выделения слоя данных: формирование запроса к данным, проверка их качества, преобразование и публикация реализуются поставщиком сервисов. Сервисы представляют собой технологическое решение интеграции на следующем уровне абстракции по отношению к модели данных. При переходе на следующий уровень абстракции скрывают слой исходных данных и технологические особенности систем, в которых эти данные находятся.

Положительным моментом этого варианта является возможность обмена данными и функциями между любыми системами, а также легкость подключения новых информационных систем. Ограничением этой модели является возрастание сложности при увеличении количества сервисов. Например, при использовании этой идеологии для выполнения административных процессов в государственном секторе многообразие сервисов создает достаточно плотный шерстяной клубок. Этот тип модели реализован в Системе межведомственного электронного взаимодействия СМЭВ 2.0 [6].

Для использования модели интеграции посредством сервисов необходимо на этапе теоретического моделирования описывать сервисную модель деятельности (рис. 2, горизонталь Сервисы)

Более сложный вариант интеграции — использование форматов данных. При реализации этого метода интеграции слой данных имеет определяющее значение, модели включают интеграцию содержательных и технических метаданных. Развитие этой модели предполагает интеграцию XML-форматов не только структурированных, но и неструктурированных данных.

Основой идеологии взаимодействия систем в этих моделях являются документы, пакеты. Обмен пакетами используется такими моделями обмена, как National Information Exchange Model (OJP) [20], Statistical Data and Metadata Exchange (SDMX) (Statistical Working Group) [31], Health Level Seven (HL7) [14]. Существует большое количество отраслевых словарей, ориентированных на отражение данных предметной области. Примерами та-

^ЖауЧН0-ТеХНИЧе£КИе^еД0М2£ТИ^ПбГПУ.ЭК0Н0МИЧе£КИе^аУКИ^№6232™215

ких словарей в коммерческом секторе являются e-Business XML (ebXML), Extensible Business Reporting Language (XBRL), Human resource XML (HR-XML) и др.

Разработка физической модели данных в системах, участвующих в информационном обмене по этим моделям, как правило, проводилась до начала работы с обменом данными. Поэтому для реализации схемы используется компонента, преобразующая метаданные локальных систем в метаданные стандартизированной модели. Если деятельность по стандартизации имен перенести на стадию разработки требований, стандартизировать пространство имен в спецификации на создание физической модели данных, то появляется возможность обмениваться пакетами документов без дополнительных компонентов (рис. 2, горизонталь Документы).

Любое взаимодействие между участниками, независимо от его характера, предполагает передачу смысла, реализацию семантики. Семантическая модель в каждом случае является абстракцией, которая описывает соотношение реального мира с его символьным отражением в виде сущностей и экземпляров. Реализацию семантики на уровне данных призваны обеспечить два механизма: механизм присвоения имен объектам, определения данных, и механизм однозначной идентификации объектов, идентификации данных. Присвоение имен объектам реализовано в модели форматов данных, легкая идентификация объектов в распределенной среде в семантических методах обеспечивается посредством URI (Unified Resource Identifier). Использование стандартизированных словарей и единых идентификаторов URI при создании модели данных дает возможность беспрепятственного общения со всеми участниками, работающими по аналогичным правилам (рис. 2, горизонталь Сообщения и бизнес-правила).

Наиболее развитым из трех приведенных методов в полу-контролируемой среде является создание технической инфраструктуры, реализуемой чаще всего по модели создания интеграционной шины [30]. Семантика данных остается незначительно задействованной, вместе с тем уровень развития информационных технологий достиг уровня, когда реализация семантических методов становится реальной. На методы семантической интеграции опи-

раются архитектурные модели обмена государственными данными Евросоюза (European Interoperability Reference Architecture) (ISA) [16], а также стандарт Unified Profile for DoDAF, MODAF, and NAF [23].

Значительная часть спецификаций, используемых для интеграции в полуконтролируемой среде, выпускается OMG. В рамках этой группы работают несколько подразделений, занимающихся этой темой. Результатами работы являются спецификации для работы с сервисами Common Object Request Broker Architecture (CORBA), Model Driven Architecture (MDA), Semantics of Business Vocabulary and Rules (SBVR) [21], Unified Modeling Language (UML), язык архитектурного описания OMG SysML.

Один из вариантов повышения информационной наполненности систем — это использование открытых связанных данных. У участников информационного обмена — государственных организаций, корпоративного сектора и прочих организаций накоплено значительное количество данных. Потенциальные пользователи преследуют разные интересы и заинтересованы в получении удобного доступа к данным. В модели отрытых связанных данных накопленная информация публикуется в машиночитаемом формате для повторного использования. Механизмом связывания данных в этих моделях выступают открытые реестры: Opencorporates (OpenCorporates) [25], Legal Entity Identifier (OpenCorporates LEI) [24], European Legislation Identifier (Eur15) [13]. Если при составлении информационной модели заложено использование единых в рамках сообщества идентификаторов, то система способна обмениваться любыми сообщениями в рамках этого сообщества (рис. 2, горизонталь Свободный обмен информацией).

При работе в слабосвязанной среде с привлечением технологий семантического веба реализуются методы интеграции с использованием спецификаций W3C [32—34]. Среди базовых стандартов этого консорциума — XML и спецификации для работы с XML документами, SOAP, RDF, OWL, SPARQL, URI и т. д. В области работы с открытыми данными используются словари Semantically-Interlinked Online Communities (SIOC) [33], Simple Knowledge Organization System SKOS [34], DCAT (Data Catalog Vocabulary) [32] и др.

Семантика данных, предполагающая единые форматы данных и идентификаторы, не всегда достаточна для передачи полного смысла, для этого необходим контекст как дополнительное условие интерпретации. Такую интерпретацию можно получить из совокупности моделей. Примером такой интеграции является Связанные посредством моделей данные (Model-Based Linked Data) [15]. В случае если связанность данных будет обеспечиваться моделями деятельности, система будет получать полезную информацию в контексте модели деятельности (рис. 2, горизонталь Полезная информация).

Выводы. Итак, рассмотрена последовательность этапов информационного моделирования в форме V модели. Такое представление позволяет соотнести деятельность на этапах интеграции с этапами разработки, выявить особенности исполнения интеграции и перенести как можно больше работ на этап определения требований, спецификаций.

Интеграция данных — наиболее затратная деятельность при создании крупных систем. Ее реализация требует дополнительных затрат, если принципы интеграции недостаточно проработаны в спецификациях, некорректно сформулированы требования к отдельным компонентам. Наиболее актуально использование этих принципов в информатизации государственного сектора, где значительная часть деятельности — межведомственное взаимодействие, но большинство систем ориентировано на локальную работу.

Тема информационного моделирования, индустриализация поставки данных часто воспринимается как раздел информационных технологий. Вместе с тем существенная часть информационного моделирования требует непосредственного участия специалистов предметной области. Их вовлеченность необходима для составления корректной информационной модели, а также для полноценного использования имеющейся информации. С развитием индустриальных методов поставки данных появляются новые возможности для анализа данных. Большинство специалистов в области экономико-математических, эконо-метрических методов, используя готовые программные продукты, ориентируются на работу с выборочными данными, что существенно снижает ценность выводов.

Методы разработки физической модели данных, а также описание отдельных практических элементов методов интеграции не входили в задачи данного исследования и являются дальнейшим направлением развития этой темы. Вариантом построения модели данных могут быть шаблоны, используемые для отражения основных направлений, таких как базовые объекты предметной области, их транзакции, роли участников, пространственно-временные характеристики, а также показатели мотивации экономической деятельности. В методах интеграции важное место занимают модели онтологий как базис для выполнения интеграции на логическом и физическом уровнях.

СПИСОК ЛИТЕРАТУРЫ

1. Липунцов Ю.П. Электронное государство. Ч. 1. Модели и архитектура. М.: ТЕИС, 2010.

2. Липунцов Ю.П. Базовые информационные объекты модели данных предприятия как основа коммуникаций в слабосвязанной среде (на примере образовательного учреждения высшей школы) // Инжиниринг предприятий и управление знаниями (ИП&УЗ-2015): матер. конф. М.: МЭСИ, 2015.

3. Липунцов Ю.П. Информационные системы в сфере защиты природы: [аналит. доклад Невский экологический конгресс] // Аналитический вестник Совета Федерации ФС РФ, 2013.

4. Липунцов Ю.П. Стандартизация данных предметной области «Образование» // Современные информационные технологии и ИТ-обра-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

зование: матер. конф. М.: ВМиК, 2013.

5. Липунцов Ю.П. Электронное государство. Ч. 2. Информационная инфраструктура. М.: ТЕИС, 2012.

6. Минкомсвязь РФ. Технологический портал СМЭВ. URL: http://smev3.gosuslugi.ru/portal/ (дата обращения: 12.01.2015).

7. Arif M. et al. Enterprise-wide information system for construction // A document based approach. Journal of Civil Engineering, 2011, no. 2, vol. 15.

8. Business Architecture Guild. A Guide to the Business Architecture Body of Knowledge™ (BIZBOK™ Guide). Washington DC, 2013.

9. Chapin D. Implementing SBVR with Practitioner's Perspective Semantic Web Rules // RuleML. Washington: Springer, 2010.

10. Corradini F. et al. Document Exchange Methodology for CollaborativeWork in e-Government, 2006.

11. Dietz Jan L.G. Enterprise Ontology Theory and Methodology. Springer, 2006.

12. Dyche J., Levy E. The Baseline on Master Data Management: Five Levels of Maturity for Master Data Management. URL: http://tdwi.org/articles/2009 /01/05/baseline-on-mdm-five-levels-of-maturity-for-master-data-management.aspx (дата обращения: 12.03.2015).

13. European Legislation Identifier. URL: http:// eli.legilux.public.lu/eli (дата обращения: 02.02.2015).

14. HL7. Health Level Seven http://www.hl7.org. URL: http://www.hl7.org (дата обращения: 12.02.2015).

15. Hodgson R. An industry perspective on deployed semantic interoperability solutions // SEMIC Conference. Athens: TopQuadrant, 2014.

16. ISA. European Interoperability Reference Architecture (EIRA). URL: https://joinup.ec.europa.eu /asset/eia/description (дата обращения: 10.04.2015).

17. Lee T.Y. Information modeling: from design to implementation, 1999.

18. Meier J., Sprague R. Towards a Better Understanding of Electronic Document Management // HICSS, 2006, vol. 53.

19. Ogden C.K., Richards I.A. The Meaning of Meaning // A Study of the Influence of Language upon Thought and of the Science of Symbolism. University of Cambridge, 1923.

20. OJP. National Information Exchange Model. URL: https://www.niem.gov/ (дата обращения: 22.02.2015).

21. OMG BMI. Semantics of Business Vocabulary and Rules // SBVR. URL: http://www.omg.org/spec /SBVR/ (дата обращения: 14.01.2015).

22. OMG. Semantic Information Modeling for Federation (SIMF RFP), 2011. URL: http://tinyurl.

com/SIMFrfp (дата обращения: 12.08.2014).

23. OMG UPDM. Unified Profile for DoDAF, MODAF and NAF. URL: http://www.omg.org/spec /UPDM/ (дата обращения: 02.02.2015).

24. Opencorporates LEI. The Global Legal Entity Identifier System. URL: openleis.com (дата обращения: 05.02.2015).

25. Opencorporates (OpenCorporates). URL: https:// opencorporates.com/ (дата обращения: 03.02.2015).

26. Princeton University Wordnet. URL: http:// wordnet.princeton.edu (дата обращения: 12.04.2015).

27. Rainey Larry B., Tol Andreas. Modeling and Simulation Support for System of Systems Engineering Applications. Springer, 2010.

28. Ralph H., Sprague J. Electronic Document Management: Challenges and Opportunities for Information Systems Managers // MIS Quarterly, 2005, no. 1, vol. 19.

29. Sabucedo L. et al. Knowledge-based platform for eGovernment agents. A Web-based solution using semantic technologies // Expert Systems with Applications, 2009.

30. Schmidt John G., Lyle David. Lean Integration: An Integration Factory Approach to Business Agility. Addison-Wesley, 2010.

31. Statistical Working Group Statistical Data and Metadata Exchange. URL: http://sdmx.org/ (дата обращения: 23.03.2015).

32. W3C DCAT. Data Catalog Vocabulary. URL: http://www.w3.org/ns/dcat (дата обращения: 14.02.2015).

33. W3C SIOC. Semantically-Interlinked Online Communities, 2007. URL: http://www.w3.org/Sub mission/2007/02/ (дата обращения: 23.03.2015).

34. W3C SKOS. Simple Knowledge Organization System, 2004. URL: http://www.w3.org/2004/02/skos/ (дата обращения: 12.04.2015).

REFERENCES

1. Lipuntsov Iu.P. Elektronnoe gosudarstvo. Ch. 1. Modeli i arkhitektura. M.: TEIS, 2010. (rus)

2. Lipuntsov Iu.P. Bazovye informatsionnye ob"ekty modeli dannykh predpriiatiia kak osnova kommunikatsii v slabosviazannoi srede (na primere obrazovatel'nogo uchrezhdeniia vysshei shkoly). Inzhiniring predpriiatii i upravlenie znaniiami (IP&UZ-2015): mater. konf. M.: MESI, 2015. (rus)

3. Lipuntsov Iu.P. Informatsionnye sistemy v sfere zashchity prirody: analit. doklad Nevskii ekologicheskii congress. Analiticheskii vestnik Soveta Federatsii FS RF, 2013. (rus)

4. Lipuntsov Iu.P. Standartizatsiia dannykh predmetnoi oblasti «Obrazovanie». Sovremennye informatsionnye tekhnologii i IT-obrazovanie: mater. konf. M.: VMiK, 2013. (rus)

5. Lipuntsov Iu.P. Elektronnoe gosudarstvo. Ch. 2. Informatsionnaia infrastruktura. M.: TEIS, 2012. (rus)

6. Minkomsviaz' RF. Tekhnologicheskii portal SMEV. URL: http://smev3.gosuslugi.ru/portal/ (data obrashcheniia: 12.01.2015). (rus)

7. Arif M. et al. Enterprise-wide information system for construction. A document based approach. Journal of Civil Engineering, 2011, no. 2, vol. 15.

8. Business Architecture Guild. A Guide to the Business Architecture Body of Knowledge™ (BIZBOK™ Guide). Washington DC, 2013.

9. Chapin D. Implementing SBVR with Practitioner's Perspective Semantic Web Rules. RuleML. Washington: Springer, 2010.

10. Corradini F. et al. Document Exchange Methodology for CollaborativeWork in e-Government, 2006.

11. Dietz Jan L.G. Enterprise Ontology Theory and Methodology. Springer, 2006.

12. Dyché J., Levy E. The Baseline on Master Data Management: Five Levels of Maturity for Master

Data Management. URL: http://tdwi.org/articles/2009 /01/05/baseline-on-mdm-five-levels-of-maturity-for-master-data-management.aspx (accused Mach 12, 2015).

13. European Legislation Identifier. URL: http:// eli.legilux.public.lu/eli (accused February 02, 2015).

14. HL7. Health Level Seven http://www.hl7.org. URL: http://www.hl7.org (accused February 12, 2015).

15. Hodgson R. An industry perspective on deployed semantic interoperability solutions. SEMIC Conference. Athens: TopQuadrant, 2014.

16. ISA. European Interoperability Reference Architecture (EIRA). URL: https://joinup.ec.europa.eu /asset/eia/description (accused April 10, 2015).

17. Lee T.Y. Information modeling: from design to implementation, 1999.

18. Meier J., Sprague R. Towards a Better Understanding of Electronic Document Management. HICSS, 2006, vol. 53.

19. Ogden C.K., Richards I.A. The Meaning of Meaning. A Study of the Influence of Language upon Thought and of the Science of Symbolism. University of Cambridge, 1923.

20. OJP. National Information Exchange Model. URL: https://www.niem.gov/ (accused February 22, 2015).

21. OMG BMI. Semantics of Business Vocabulary and Rules. SBVR. URL: http://www.omg.org/spec /SBVR/ (accused January 14, 2015).

22. OMG. Semantic Information Modeling for Federation (SIMF RFP), 2011. URL: http://tinyurl.com/ SIMFrfp (accused August 12, 2015).

23. OMG UPDM. Unified Profile for DoDAF, MODAF and NAF. URL: http://www.omg.org/spec/

UPDM/ (accused February 02, 2015).

24. Opencorporates LEI. The Global Legal Entity Identifier System. URL: openleis.com (accused February 05, 2015).

25. Opencorporates (OpenCorporates). URL: https:// opencorporates.com/ (accused February 03, 2015).

26. Princeton University Wordnet. URL: http://wordnet.princeton.edu (accused April 12, 2015).

27. Rainey Larry B., Tol Andreas. Modeling and Simulation Support for System of Systems Engineering Applications. Springer, 2010.

28. Ralph H., Sprague J. Electronic Document Management: Challenges and Opportunities for Information Systems Managers. MIS Quarterly, 2005, no. 1, vol. 19.

29. Sabucedo L. et al. Knowledge-based platform for eGovernment agents. A Web-based solution using semantic technologies. Expert Systems with Applications, 2009.

30. Schmidt John G., Lyle David. Lean Integration: An Integration Factory Approach to Business Agility. Addison-Wesley, 2010.

31. Statistical Working Group Statistical Data and Metadata Exchange. URL: http://sdmx.org/ (accused Mach 23, 2015).

32. W3C DCAT. Data Catalog Vocabulary. URL: http://www.w3.org/ns/dcat (accused February 14, 2015).

33. W3C SIOC. Semantically-Interlinked Online Communities, 2007. URL: http://www.w3.org/Submission /2007/02/ (accused Mach 23, 2015).

34. W3C SKOS. Simple Knowledge Organization System, 2004. URL: http://www.w3.org/2004/02/skos/ (accused April 12, 2015).

ЛИПУНЦОВ Юрий Павлович — доцент Московского государственного университета им. М.В. Ломоносова, кандидат экономических наук.

119991, ул. Ленинские Горы, д. 1, ГСП-1, г. Москва, Россия. E-mail: [email protected]

LIPUNTSOV Iurii P. — Lomonosov Moscow State University.

119991, Leninskie Gory str. 1. GSP-1. Moscow. Russia. E-mail: [email protected]

© Санкт-Петербургский государственный политехнический университет, 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.