ТЕХНИЧЕСКИЕ НАУКИ
Материалы международной конференции
«Математика и информационные технологии в нефтегазовом комплексе», посвященной дню рождения великого русского математика - академика П.Л. Чебышёва и приуроченной к 20-летию сотрудничества ОАО «Сургутнефтегаз» и компании SAP
(Сургутский государственный университет ХМАО - Югры, 14-18 мая 2014 г.)
Управление ИТ-проектами и портфелем ИТ-проектов
УДК 658.51:622.3(571.122)Сургутнефтегаз:004.6
Клюсов А.О.
Klyusov A.O.
Подход к формированию информационной модели крупного предприятия
Approach to the formation of Information model for a large-scale enterprise
В данной работе рассмотрен подход к формированию информационной модели крупного предприятия, которое основано на использовании методологии архитектурного подхода в части управления данными. При формировании модели используется каталог объектов, содержащий описание данных.
This paper highlights an approach to the formation of a large-scale enterprise information model. The formation is based on the usage of the architectural approach methodology in terms of data management. To form a model it is used a catalog of the objects, containing the data's description.
Ключевые слова: ОАО «Сургутнефтегаз», архитектура предприятия, архитектура данных, информационная модель.
Key words: OJSC "Surgutneftegas", enterprise architecture, data architecture, information model.
На крупных предприятиях производственные процессы тесно связаны между собой. Связь между процессами также отражается и на информационном уровне. Для автоматизации таких процессов необходимо полное понимание используемых данных. Нужна информация, в каких из существующих информационных систем обрабатываются данные. Не менее важно знать, в каких информационных системах планируется создавать или развивать функциональность по ведению данных. Понимание систем первоисточников ведения данных оказывает значительное влияние на процессы по управлению нормативно-справочной информацией.
В процессах, связанных с автоматизацией деятельности предприятия, как при создании, так и при сопровождении информационных систем важную роль в управлении данными оказывает наличие информационной модели. Информационная модель может использоваться при планировании работ по изменению функциональности,
отслеживанию изменений структур данных и правил ведения в разных информационных системах. Также информационная модель может использоваться для обеспечения достоверности информации.
Формирование и поддержание информационной модели в актуальном состоянии является сложной задачей, которая должна учитывать особенности предприятия и процессов управления информационными технологиями.
Применение архитектурного подхода позволяет организовывать формирование и наполнение информационной модели на уровне предприятия. В части описания данных методологией [1] выделяется понятие «сущность данных». «Сущность данных» отражается на трех уровнях - «концептуальном», «логическом» и «физическом».
В ОАО «Сургутнефтегаз» для описания информации используются три вида сущностей данных: «Тип бизнес-объекта», «Справочник» и «Показатель» [2].
В первую очередь требуется наполнять каталог типов бизнес-объектов. Это «концептуальный» уровень описания данных. Использование каталога бизнес-объектов востребовано в информационно-аналитических системах, так как они предназначены для аккумулирования данных из различных источников и разнообразного представления этих данных. Наличие описания по основным бизнес-объектам позволит определять дублирование данных как при загрузке, так и при формировании отчетов.
Но в методологии [1] не приводятся правила (методы) и процессы по выделению сущностей данных. А существующие методы направлены на выявление сущностей данных на более низком (логическом и физическом) уровне и ориентированы на формирование структуры базы данных конкретной информационной системы.
В связи с этим для ОАО «Сургутнефтегаз» необходимо выработать свой подход к формированию информационной модели.
Подход должен учитывать возможность использования информационной модели на уровне бизнес-пользователей и ИТ-специалистов. Для специалистов ИТ-области нужна информация о логическом представлении данных, структурах их хранения и преобразованиях. Также необходимы сведения о правилах внесения и дальнейшей обработки данных на уровне информационной системы. Для бизнес-пользователей нужна информация о том, какие данные есть в информационных системах и каким образом получить к ним доступ.
В качестве исходной информации, для выявления бизнес-объектов, могут использоваться следующие источники: описание бизнес-процессов, регламенты взаимодействия служб и т.п. Также может применяться описание действий по работе с данными в информационных системах, например инструкции пользователя (технологические инструкции, операционные инструкции). Дополнительно информация может собираться путем анкетирования.
Структура каталога бизнес-объектов должна формироваться таким образом, чтобы описание могло использоваться при построении ИТ-решений. Описание бизнес-объекта должно отражать, в каких информационных системах он используется, какие операции над ним выполняются, какие есть связи с техническими объектами в информационных системах (таблицы, представления, отчеты и т.д.). С другой стороны, описание должно отражать использование бизнес-объекта в рамках деятельности предприятия, основные идентификаторы и логическую связь между другими бизнес объектами, отражающую представление предметной области.
Предлагается следующая структура каталога бизнес-объектов:
- полное и краткое наименование бизнес-объекта;
- текстовое пояснение;
- возможные синонимы;
- классификация (категоризация);
- владелец - служба, которая определяет набор ключевых атрибутов;
- метаданные - перечень атрибутов, правила ведения, ссылки на технические объекты;
- владелец технических метаданных - ИТ-службы, ответственные за ведение структур данных в информационных системах;
- источник, на основе которого включен бизнес-объект (как правило, это документ).
Для обеспечения возможности использования каталога он должен содержать ограниченное количество бизнес-объектов. Количество должно быть достаточным для понимания используемых данных в деятельности предприятия. В каталог включаются понятия, которые используются бизнес-пользователями.
С учетом того, что бизнес-объект является концептуальным представлением реального мира, применение формальных методов по извлечению сведений о нем из существующих информационных систем затруднено. Ориентироваться только на структуру таблиц и хранящиеся данные очень сложно. Это связано с высокой степенью вариативности в представлении и понимании этих данных.
Использование методов интеллектуального анализа данных [5] для первичного формирования бизнес-объектов требует дополнительной обработки и значительных трудозатрат на анализ результатов. А при реализации новых ИТ-решений для некоторых бизнес-объектов может и не быть их отражения в информационных системах. Поэтому необходимо создание процессов по выявлению бизнес-объектов экспертами и обеспечение контроля внесения элементов в каталог. Результатом этого процесса будет принятие решения о включении бизнес-объекта в каталог или внесение изменений в его описание. Сопоставление с существующими бизнес-объектами позволит исключить дублирование. Также рассмотрение разными экспертами позволяет укрупнять бизнес-объекты и тем самым обеспечить наличие допустимого количества записей для возможности дальнейшего использования специалистами.
Команда экспертов состоит из специалистов, задействованных в проектировании и сопровождении основных информационных систем на предприятии. Для крупных информационных сис-
тем дополнительно определяются эксперты по отдельным модулям (например, финансы, сбыт). Эксперты должны знать, каким образом выполняется обработка данных в информационных системах (модулях), какие службы вносят и используют данные.
Процесс первичного формирования включает в себя создание перечня данных, которые обрабатываются в информационных системах, в том числе участвующих в интеграции. Часто передается более узкий список объектов, достаточный для решения задач в рамках системы приемника. Это может приводить к дублированию схожих бизнес-объектов. Указание первоисточника для выявленных данных позволяет сопоставлять обнаруженные бизнес-объекты и укрупнять их.
На основе сформированного перечня данных определяется принадлежность их к видам сущностей. Для вида сущностей данных «Классификаторы» и «Показатели» формулируются бизнес-объекты, связанные с ними, и включаются в общий список. Затем выполняется группировка (категоризация) выявленных бизнес-объектов, например места, документы, технологические комплексы.
В ОАО «Сургутнефтегаз» в ходе анализа были определены два уровня групп (категорий). Например, первый уровень «Участники деятельности», второй уровень «Внешние участники» и «Внутренние участники».
После сбора потенциальных бизнес-объектов необходимо оценить правильность их выделения, сопоставить между собой и с бизнес-объектами в каталоге. Полученный список рассматривается всеми экспертами, по результатам обсуждений вносятся корректировки.
При рассмотрении большого количества бизнес-объектов, предлагаемых к включению в каталог, и участии большого количества экспертов основную сложность представляет анализ текстового пояснения, которое дают эксперты, обосновывая причины выделения бизнес-объекта.
Развитие предлагаемого подхода по выявлению бизнес-объектов и наполнению каталога основано на выставлении экспертных оценок соответствия бизнес-объекта определенным признакам в процессе принятия решения о включении предлагаемых элементов.
Признаки могут быть разделены на «общие» и «типовые». «Общие» - это признаки, которые распространяются на все бизнес-объекты, а «типовые» соответствуют определенным типам бизнес-объектов. Например, к «общим» призна-
кам можно отнести обособленность информационного объекта (сущности данных) - наличие процессов по ведению ключевых атрибутов. К «типовым» - признак «документ», отражающий представление ключевых атрибутов в виде отдельного документа («Паспорт изделия», «Счет-фактура»).
Следует учесть, что выставление оценок зависит от конкретных экспертов [3; 4]. Необходимо уточнение уровня эксперта и области его знаний. Эти характеристики должны использоваться при сопоставлении оценок экспертов и формировании итогового заключения, в связи с чем должны быть внедрены механизмы по верификации экспертных данных.
Для снижения трудозатрат различных экспертов на обработку и сопоставление выявленных признаков необходимо их представление в цифровом виде.
Дополнительно при возможности описания структуры данных бизнес-объекта могут быть использованы методы интеллектуального анализа данных [5]. Данные методы могут использоваться для подтверждения соответствия бизнес-объектов, хранящихся в информационных системах, или выделения различных групп данных.
Совместное применение предлагаемых методов позволит обеспечить процесс выявления и сравнения бизнес-объектов (на уровне значений) и наполнение ими каталога.
Таким образом, предлагаемый подход, основанный на использовании указанных видов сущностей данных (особенно бизнес-объектах), определении основных атрибутов и процессов ведения каталога, позволяет формировать информационную модель крупного предприятия.
За счет привлечения экспертов по основным информационным системам в состав информационной модели включены все ключевые данные, используемые на предприятии. А за счет их типизации уменьшено количество этих объектов.
Процесс выявления и согласования следует «встроить» на всех стадиях жизненного цикла ИТ-решения.
Для уменьшения трудоемкости и обоснованности включения элементов в каталог бизнес-объектов предлагается выполнять экспертную оценку их соответствия. Для этого определяются признаки, позволяющие оценить принадлежность к бизнес-объекту, в цифровом виде, доступном для дальнейшей обработки. Определяется метод проведения оценок и методики их верификации.
Литература
1. Content Metamodel // The Open Group TOGAF 2011. URL: http://pubs. opengroup.org/architecture/ togaf9-doc/arch/chap34.html (дата обращения: 08.04.2014).
2. Гимранов Р. Д., Агиевич В. А. Обеспечение достоверной информации в информационной системе крупного предприятия на основе архитектурного подхода // Нефтяное хозяйство. 2013. № 4.
3. Малин А. С., Мухин В. И. Исследование систем управления. М., 2002.
4. Орлов А. И. Экспертные оценки : учеб. пособие. М. : ИВСТЭ, 2002.
5. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. / А. А. Барсегян [и др.]. 2-е изд. СПб. : БХВ-Петербург, 2007.