Научная статья на тему 'Управление основными данными как одна из задач интеграции корпоративных систем управления'

Управление основными данными как одна из задач интеграции корпоративных систем управления Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY-NC-ND
975
562
Поделиться

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Калабин В. В.

Эта статья посвящена исследованию задач интеграции информационных систем управления. В фокусе исследования находится проблема управления основными данными, методы и средства её решения и взаимосвязь с другими задачами интеграции, такими как интеграция пользователей информационных технологий, интеграция данных, интеграция приложений, интеграция информации, интеграция платформ и стандартов.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Калабин В. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Текст научной работы на тему «Управление основными данными как одна из задач интеграции корпоративных систем управления»

УПРАВЛЕНИЕ ОСНОВНЫМИ ДАННЫМИ КАК ОДНА ИЗ ЗАДАЧ ИНТЕГРАЦИИ КОРПОРАТИВНЫХ СИСТЕМ УПРАВЛЕНИЯ

В.В. Калабин,

консультант по интеграции корпоративных приложений, Департамент Корпоративных Систем Управления, IBS

Эта статья посвящена исследованию задач интеграции информационных систем управления. В фокусе исследования находится проблема управления основными данными, методы и средства её решения и взаимосвязь с другими задачами интеграции, такими как интеграция пользователей информационных технологий, интеграция данных, интеграция приложений, интеграция информации, интеграция платформ и стандартов.

Введение

Если проанализировать структуру информационной подсистемы современных крупных организаций, можно обнаружить характеристики, общие для всех организаций. К этим характеристикам относится большое число информационных систем, автоматизирующих отдельные процессы, сферы деятельности и организационные подразделения. Это информационные системы разных производителей, с разными датами запуска в эксплуатацию, использующие различные аппаратные и программные платформы, имеющие различную информационную архитектуру и т.д. Типичную ситуацию для крупных и средних современных организаций принято называть гетерогенным ИТ-ландшафтом. Гетерогенный ИТ-ландшафт, динамически изменяющийся за счет непрекращающихся внедрений новых информационных систем и вывода из эксплуатации старых, вместе с перечисленными факторами — глобализация рынков, слияние и поглощение, рост компаний, требования регулирующих органов, ставит перед руководством организации и ИТ-подразделением новые задачи, связанные с применением новых подходов к управлению информационной подсистемой организации — задачи интеграции.

Многие аналитические, консалтинговые агентства, производители программного обеспечения в области интеграции систем управления и прочие

заинтересованные стороны предлагают свои классификации задач интеграции. Нами предлагается классификация (табл.1), полученная в результате анализа и выделения общих характеристик среди имеющихся. При составлении данной классификации принималось во внимание обязательное наличие на рынке готовых к использованию специализированных инструментов для решения того или иного класса задач интеграции.

В данной статье мы остановимся на рассмотрении задачи управления основными данными, смежных задачах интеграции и их взаимосвязи с управлением основными данными.

Управление основными данными:

проблема и решение

В каждой организации существуют наборы данных, содержащие информацию, позволяющую идентифицировать и уникально определять ключевые бизнес-сущности. Это клиенты, продукты, поставщики, материалы и прочее. Такие данные принято называть мастер-данными. В литературе встречаются следующие синонимы понятию «мастер-данные» — «основные данные», «нормативно-справочная информация (НСИ)». Для эффективной работы руководители и исполнители бизнес- операций должны располагать точной информацией о своих основных данных. Однако в большинстве организаций эта информация неполная и рассогласованная — основные

Таблица 1

Классификация задач интеграции

Класс Задачи Инструменты и технологии

Интеграция пользователей информационных технологий ♦ Единая точка доступа к информационным ресурсам (Single Sign On) ♦ Управление знаниями (Knowledge Management) ♦ Организация работы в команде (Collaboration) ♦ Портальные технологии

Интеграция данных ♦ Консолидация и анализ данных из учетных систем ♦ Сбор и подготовка данных (Extract Transform Loading, ETL) ♦ Управление основными данными (Master Data Management) ♦ Хранилища данных (Data Warehouse, DW) ♦ Системы управления основными данными ♦ Инструменты ETL

Интеграция информации ♦ Построение сер-висно-ориентиро-ванной архитектур (SOA, Service Oriented Architecture) ♦ Композитные приложения

Интеграция приложений ♦ Управление бизнес-процессами (Business Process Management) ♦ Обмен сообщениями (Enterprise Messaging) ♦ Системы управления бизнес процессами (Business Process Management Suites, BPMS) ♦ Системы обмена сообщениями

Интеграция платформ и стандартов ♦ Организация сетевого взаимодействия оборудования ♦ Организация взаимодействия разных ♦ Стандартизация форматов и протоколов взаимодействия ♦ LAN ♦ Win, Unix, Novell... ♦ XML, XSLT, J2EE, SOAP, UDDI, WSDL, HTTP, FTP, JDBC

данные, определяющие одни и те же объекты, присутствуют в различных системах и ведутся обособленно.

Отличаются определения одних и тех же бизнес-сущностей и записи основных данных (контент). Рассмотрим типичную проблемную ситуацию. Один и тот же поставщик в разных системах закупок может фигурировать под разными наименованиями. Товар, который в одной системе проходит под названием «офисные расходные материалы», в другой системе именуется «канцтоварами», а в третьей — «бумагой». Если эти основные данные не гармонизированы, глобальный анализ затрат по

заказам на поставку в этом случае покажет, что предприятие закупило небольшие количества бумаги, офисных расходных материалов и канцтоваров у четырех различных поставщиков. В действительности же приобретено большое количество бумаги у одного поставщика (рис. 1). Если на предприятии отсутствуют чёткие данные о том, закупки каких именно материалов и у каких поставщиков оно совершает, такому предприятию сложно потребовать у своих поставщиков перехода на более выгодные условия поставки, связанные с большими объёмами закупок.

Задача управления основными данными, как и другие задачи интеграции, появилась совсем недавно. Ориентировочно 10 лет назад. Одними из основных факторов стали массовое и зачастую беспорядочное внедрение учетных систем, слияния и поглощения компаний и, как следствие, — задачи интеграции информационной инфраструктуры. Появляющиеся задачи рассматривались как локальные задачи интеграции и решались в большинстве случаев разработкой интеграционных интерфейсов между системами, нуждающимися в синхронизации данных (речь идет о тех случаях, когда в этих системах присутствовала поддержка соответствующих интеграционных интерфейсов). В других случаях проблема решалась на уровне регламентов бизнес-процессов, когда, например, заведение или удаление справочных данных в информационной системе, используемой несколькими подразделениями одной компании, должно было быть согласовано со всеми этими подразделением, что приводило к снижению эффективности операционной деятельности (см. рис. 2)

В отличие от традиционных подходов к управлению основными данными, новый системный подход, основанный на выделении в один класс задач, связанных с управлением основными данными предприятия, привёл к появлению нового типа информационных систем — систем класса управления основными данными (Master Data Management, MDM). Вопросы управления качеством корпоративных справочных данных перестали рассматриваться в контексте корпоративной отчетности или операционных приложений. Это привело к появлению нового типа проектов в каталоге услуг ИТ консалтинговых компаний. Этот тип проектов базируется на внедрении специализированной системы управления основными данными. Задача консистентного распределения основных данных в этом случае решается созданием службы НСИ, определением регламента её работы, разграничением сфер ответственности с бизнес-подразделениями

Система закупок 1

Система закупок 2

Товар Поставщик К-во

Бумага ООО «Канцлер» 10

Бумага ООО «Канцлер и Со» 10

Глобальный анализ затрат

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Товар Поставщик К-во

Бумага ООО «Канцлер» 10

Бумага ООО «Канцлер и Со» 10

Канцелярские принадлежности ООО «Канцлер» 5

Офисные принадлежности ООО «Канцлер» 10

MDM Система

Система закупок 3

Товар Поставщик К-во

Канцелярские принадлежности ООО «Канцлер» 5

Товар Поставщик К-во

Офисные принадлежности ООО «Канцлер» 10

—!

Глобальный анализ затрат

I

Товар Поставщик К-во

Офисные принадлежности ООО «Канцлер» 10

Рис. 1. Иллюстрация проблемы управления основными данными

Рис. 2. Эволюция подходов к управлению нормативно-справочной информацией (НСИ)

и предоставлением службе НСИ инструмента управления — системы управления основными данными. Срез данных из этой системы признается верным всеми ИТ-системами и бизнес-подразделениями организации. Для обмена информацией с этой системой должны быть проработаны регламенты взаимодействия с другими системами, т.е. правила, по которым происходит сбор, обработка записей в данной системе и распространение во все остальные.

Чтобы лучше уяснить себе предназначение такой специализированной системы и понять, в чём состоит её «специализация», следует оттолкнуться от простейших моделей. Цель управления основными данными — консистентность (целостность, сопоставимость, своевременность) этих данных во всех ИС организации. Поэтому на первый взгляд достаточно обеспечить необходимое качество всей корпоративной справочной информации в одной из систем ландшафта и разработать механизмы синхронизации данных из этой системы с другими системами. Такой подход успешно применяется на практике, если нужно интегрировать две системы по двум—пяти справочникам, т.е. «залатать локальные бреши» интеграции. Очевидные минусы — необходимость существенного изменения и доработки модели данных и бизнес-логики в одной из систем. Но зачастую просто невозможно, и как следствие — необходимость поддержки такой разработки.

Следующим шагом можно считать разработку с нуля либо приспособление уже имеющейся информационной системы исключительно для управления основными данными. Существенное преимущество здесь — возможность создания информационной модели основных данных (всех общекорпоративных сущностей и атрибутов) и её импле-ментации в проектируемой БД, а также возможность использования специализированных средств БД для встраивания логики в процесс управления данными с применением триггеров, хранимых процедур, сохраненных запросов и т.д. Недостатком остается заказной характер разработки такого рода системы со всеми вытекающими последствиями — необходимость поддержки со стороны разработчика, проблемы масштабируемости, производительности, интегрируемости, безопасности, что обычно становится узким местом системы, когда у неё единственный заказчик.

Дальнейшее развитие решений состояло в появлении специализированных информационных систем по управлению основными данными. Такие системы создаются известными производителями

программного обеспечения, бизнес-приложений и интеграционных приложений мирового уровня — SAP, Oracle, IBM, Tibco и др. Примеры таких систем: SAP MDM, Oracle Customer Data Hub, Oracle Financial Consolidation Hub, Oracle Product Information Management, IBM WebSphere Product Center, IBM WebSphere Customer Center, TIBCO Collaborative Information Manager, Hyperion Master Data Management, Kalido 8M. Эти системы постоянно обновляются разработчиками. Вендоры обеспечивают сервис 24*7, необходимую документацию, сценарии использования, руководства по решению типовых проблем и прочие «удобства», способствующие внедрению таких систем. «Специализация» этих систем не заканчивается полной поддержкой их жизненного цикла со стороны вендора. Основное преимущество — это функциональные возможности по интеграции основных данных между информационными системами организации.

Основные функциональные возможности систем управления основными данными зависят от конкретной системы и даже от конкретного примера её внедрения. Но в целом можно выделить круг общих функциональных возможностей, предоставляемых классом систем управления основными данными (рис. 3):

Ведение и использование основных данных пользователями включает в себя просмотр, создание, изменение, удаление записей справочников; гибкие возможности поиска данных с использованием простых и сложных фильтров, гартировок по нескольким полям, сохранения результатов запросов; навигация по структуре репозитория; работа со специализированными типами объектов как классификации, таксономии и др.

Управление структурами (объектами) основных данных включает в себя использование встроенных конструкторов для создания справочников и классификаторов; создание и поддержку метаданных объектов НСИ; автоматическое создание таблицы соответствия; создание и ведение сложных структур данных, как иерархии, таксономии; управление версиями иерархий.

Выверка и нормализация основных данных включает в себя верификацию и очистку входящих данных; механизмы идентификации и обработки дублей; сравнение и слияние дублирующихся объектов;

Ведение и использование основных данных пользователями

Управление основными данными

Управление структурами (объектами) основных данных

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выверка и нормализация основных данных

Интеграция с информационными системами компании

Администрирование процесса управления основными данными

Рис. 3. Управление НСИ с помощью системы класса Master Data Management

настройку проверок полей на основе бизнес-правил заполнения и выверки записей справочников.

Интеграция с информационными системами Компании включает в себя поддержку стандартных сценариев управления основными данными (консолидация, гармонизация, централизация); пред-настроенные шаблоны репозиториев основных данных; автоматизированный импорт изменений от локальных систем и экспорт изменений в локальные системы; сопоставление полей между локальной и центральной структурами данных; предоставление приложениям, пользователям и порталам стандартизированного набора общих разделяемых сервисов по доступу и управлению основными данными.

Администрирование процесса управления основными данными включает в себя управление ролями и полномочиями пользователей; управление изменениями и статусами записей справочников; ведение истории изменений объектов НСИ; протоколирование актов обмена данными; применение WorkFlow для управления потоками операций по изменению НСИ и выполнению экспорта/импорта.

Вышеперечисленные функциональные возможности могут быть значительно расширены, если рассматривать внедрение системы управления НСИ не как независимое решение, а в составе внедрения интеграционной платформы. Рассмотрим, какие другие типовые интеграционные задачи стоят перед организацией, и какова их взаимосвязь с управлением НСИ.

Интеграция пользователей информационных

технологий

Пользователь будет максимально интегрирован со средой, если потратит минимальное количество времени на выполнение своих задач с помощью используемых инструментов. В силу гетерогенного характера ИТ-среды это требование означает минимальные усилия со стороны пользователя на обмен информацией с разнородными ИТ-приложениями, используемыми им при выполнении своих бизнес-функций. Решение этой проблемы — в реализации концепции единой точки доступа, персонализированной с учетом потребностей бизнес пользователей в организации доступа к определенному набору информационных ресурсов. Эта концепция подразумевает минимальные «лишние» действия пользователя (например, ввод авторизационных данных, запуск новых приложений, терминальных сессий, повторяющийся ввод одной и той же информации и т.д.) за счет предоставления доступа к единому интерфейсу приложения, включающего все необходимые для пользователя информационные сервисы и ресурсы.

Решение задач интеграции пользователей друг с другом и со средой на текущем этапе развития ИТ видится в использовании портальных решений. Портал (от англ. portal «главный вход; ворота») — веб-сайт, предоставляющий пользователям возможность получения доступа к различным информационным сервисам предприятия и к информации из различных информационных ресурсов, а также обмен информацией с другими пользователями. Порталы также предоставляют пользователю дополнительные возможности по выбору и структурированию информации, отвечающей его интересам.

Согласно сложившимся стандартам, портальные решения предлагают пользователям стандартизированный набор возможностей:

^ встраивание стандартных приложений. Стандартные элементы, которые можно встраивать в портал: календарь, опросы, блоги, исследования, пользовательские папки и т.д.; ^ управление документами и контентом. Порталы помогают организовывать генерируемые в организации документы и другие информационные объекты и способствуют организации эффективных процессов обмена этой информацией; ^ сотрудничество. Виртуальные комнаты общения, коммуникации онлайн (чаты, разделяемые приложения), интеграция с имеющимися на предприятии приложениями и технологиями сотрудничества (WebEx, Exchange, Lotus Notes и др.); ^ поиск и навигация. Гибкие возможности поиска необходимой информации и документов, быстрого доступа к нужной информации за счёт несложной настройки системы навигации по порталу; ^ персонализация. Возможность настройки портала с учетом специфических нужд отдельных пользователей и их групп. Цель персонализа-ции - предоставление быстрого доступа к содержимому и сервисам, часто используемым пользователями портала предприятия. ^ бизнес аналитика и отчетность. Представление на портале отчетов, получаемых из BI-систем. ^ управление бизнес-процессами. Возможность создания и мониторинга исполнения многошаговых процессов, охватывающих множество различных систем и пользователей.

Каким образом портальные решения могут способствовать улучшению качества процесса управления основными данными? Ответ на вопрос о связи между управлением основными данными и портальными решениями вытекает из: сущности портальных технологий как нового канала информационного взаимодействия сотрудников с информационными ресурсами предприятия; сущности задачи управления основными данными как задачи обеспечения высокого качества данных (своевременность, точность, непротиворечивость) об основных бизнес-сущностях в информационных системах организации. С точки зрения влияния на процесс управления основными данными портальные решения изменяют способ осуществления владельцами НСИ своих типичных бизнес-функций: создание, изменение

и удаление новых записей справочников; утверждение или отклонение запросов на изменения объектов основных данных; осуществление проверок и вали-даций данных; поиск, идентификация и слияние дублирующихся записей и т.д.

В простейшем случае на портал выводятся визуальные интерфейсы, позволяющие проводить операции изменения, удаления, изменения и создания новых записей справочников. Пример более сложного использования порталов для управления НСИ — интеграция потока работ по утверждению изменений в НСИ со стандартным функционалом порталов. В результате такой интеграции можно реализовать следующий сценарий.

В случае создания новой записи справочника контрагентов в одном из филиалов организации, сотрудник группы поддержки НСИ в центральном офисе получает уведомление в персональную папку входящей корреспонденции. Сотруднику группы НСИ предоставляется выбор — отклонить изменения, принять изменения либо принять изменения с дополнительной корректировкой. Сотрудник группы НСИ принимает изменения, осуществляя дополнительную корректировку описания контрагента. В результате автор изменений получает в папке входящей корреспонденции портала сообщение, удостоверяющее тот факт, что его изменения приняты с определенными корректировками. В центральном репозитории контрагентов появляется новая запись.

Интеграция данных

Структурированные данные в организации хранятся во множестве информационных систем. В этих системах объекты данных могут дублироваться, дополнять друг друга или даже противоречить друг другу. Для исправления этой ситуации необходимо решать ещё один класс задач — интеграцию данных. Управление основными данными — одна из задач этого класса. Но кроме неё, существуют другие задачи, взаимозависимые с управлением основными данными, а именно:

^ консолидация и анализ данных из учетных систем;

^ сбор и подготовка данных.

Задача консолидации и анализа данных из учетных систем, решается с помощью хранилищ данных и OLAP-технологий — наиболее распространенной из задач интеграции данных. Такая распространенность связана с тем, что процессы, поддерживаемые информационными системами данного класса, т.е.

процессы анализа и планирования — ключевые, обеспечивающие конкурентное преимущество в любом бизнесе. Необходимость в автоматизации этих процессов очевидна для лиц, принимающих решения. Это привело к большому числу внедрений BI-систем. Причина, по которой мы рассматриваем BI-системы как элемент интеграции гетерогенной информационной среды, в том, что хранилища данных этих систем не только позволяют решать аналитические задачи и аккумулируют в себе справочные и транзакционные данные из различных систем, но и решают важную задачу интеграции данных. Однако хранилища данных совместно с различными аналитическими надстройками, (специализированные приложения по бюджетированию, финансовой консолидации, управлению по ключевым показателям), предоставляя определенный набор информационных сервисов аналитикам, не решают всех задач интеграции. Любое хранилище данных содержит в себе и транзакционные и справочные данные, аккумулируемые из множества систем. С ростом числа систем и постоянно изменяющихся требований к новой информации со стороны её потребителей, в отдельные задачи выделились: задача организации корпоративной справочной информации; задача сбора, подготовки и загрузки данных. Ранее эти задачи решались как составляющие проектов по внедрению хранилищ данных.

Задача сбора, подготовки и загрузки данных возникает всякий раз при необходимости передачи информации между системами. Исторически сложилось так, что термин ETL использовался исключительно, когда речь заходила о преобразовании данных для загрузки в хранилище данных. Это несколько узкий взгляд на проблему качества корпоративных данных и остается верным, когда хранилище данных — единственная информационная система, активно обновляемая данными из других систем. Наполнение некоторой информационной системы-получателя данными из одной или более систем-источников распадается на извлечение данных из систем-источников, преобразование данных (агрегация данных, перевод значений и структур, очистка данных) и загрузку данных в целевую систему.

Каким образом управление основными данными связано с другими задачами интеграции данных? Рассмотрим проектирование кубов данных для поддержки процессов бюджетирования. Строящиеся в таких проектах кубы OLAP содержат обычно от 5 до 15 измерений. Каждое такое измерение в общем случае — иерархическая структура, состоящая из элементов данных, носящих справочный характер, например, бизнес-единицы, валюты, страны, города,

клиентов и т.д. При передаче транзакционной информации (фактов) по этим аналитикам в хранилище данных возникает задача приведения присланных кодов справочников и классификаторов к кодам, используемым в хранилище данных. Один из способов решения этой задачи — использование межсистемных справочных объектов, хранящихся в системе управления основными данными. В этом случае в момент проведения подмены кодов, необходимая таблица соответствия может потребляться из этой системы. Технически это может быть реализовано экспортом таблицы соответствия (таблицы, содержащей ключи данного справочного объекта в клиентских системах) из системы управления основными данными в хранилище данных, либо система управления основными данными может предоставить Web-сервис или API функцию, которая по идентификатору клиентской системы и идентификатору объекта в данной системе вернет глобальный ключ данного объекта. Применение систем MDM берет на себя решение части задач, связанных с управлением справочными данными путем реализации части функции (импорт, хранение, выверка справочных данных) хранилищ данных и OLAP-систем.

Одна из существенных проблем при внедрении системы MDM — организация импорта данных из локальных систем. При этом структура (схема данных, онтология) репозитория MDM отличается от структуры данных, вводимых в систему. Чаще всего для системы MDM существует несколько систем — источников данных. Это могут быть другие базы данных, хранилища данных, файлы и прочее. Информация может загружаться с участием пользователя, в пакетном режиме или вводиться интерактивно прямо в репозиторий MDM. В каждом из этих случаев возникают задачи преобразования данных, их интеграции, задачи исправления ошибок в них, а также контроль их адекватности. Решение этих задач может осуществляться, в процессе загрузки данных, в режиме «наведения порядка в репозитории». Таким образом, ETL процесс — неотъемлемая составляющая общего процесса, управления НСИ.

Вопрос, с помощью какой из систем — системы управления НСИ или специализированной ETL системы — должен быть реализован ETL процесс, является открытым и зависит от конкретной задачи. Применимы следующие рекомендации. Если MDM система поддерживает весь необходимый для управления НСИ ETL функционал (поиск и устранение дубликатов, идентификация записей при импорте, логические условия и др.), то достаточно использовать только систему MDM. Если нужного

функционала нет, необходимо использовать ETL систему как при импорте в MDM, так и в процессе очистки записей внутри репозитория основных данных. Например, в продукте SAP MDM есть возможность использования внешних сервисов обогащения (Enrichment Services) для улучшения качества данных непосредственно в репозитории системы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Интеграция информации

EII (Enterprise Information Integration) — отдельный и особый вид интеграции, дополняющий такие традиционные виды, как интеграция приложений и интеграция данных.

Председатель комитета по интеграции корпоративной информации Консорциума по интеграции Джон Тейлор (John Taylor) утверждает, что EII — это интеграция данных из многочисленных систем в унифицированное, согласованное и точное представление, предназначенное для изучения и обработки данных [1]. Основная цель концепции интеграции информации — представление множества источников данных в виде единой виртуальной БД. Клаудиа Имхофф, эксперт мирового уровня в области ИТ, основатель и президент Intelligent Solutions, определяет EII как «технологию для интеграции в режиме реального времени несопоставимых типов данных из многочисленных источников как внутри, так и за пределами корпорации. Инструменты EII обеспечивают универсальный уровень доступа к данным и используют технологию поиска информации (pull technology) или возможности работы по запросам» [2].

Концепция интеграции информации технологически базируется на понятии сервисно-ориентированной архитектуры (SOA, Service Oriented Architecture) — подходе к интеграции информационных систем, основанном на разработке композитных приложений, использующих сервисы со стандартизированными интерфейсами. В результате обеспечивается универсальный механизм доступа ко всем системам посредством Web-серви-сов, а также универсальное представление данных в формате XML. Отдельные компоненты композитных приложений могут быть распределены по разным узлам сети, и предлагаться как независимые, слабо связанные, заменяемые сервисы. Программные комплексы, разработанные в соответствии с SOA, часто реализуются как набор Web-сервисов, интегрированных при помощи известных стандартных протоколов (SOAP, WSDL, и т.п.).

Интерфейс компонентов композитных приложений обеспечивает скрытие деталей реализации конкретного компонента (ОС, платформы, языка программирования, вендора, и т. п.) от остальных компонентов. Это позволяет обращаться не только к данным, «удобно» хранящимся в базах данных, но и в коммерческих и заказных приложениях, Web-контенте, документах, рисунках, и пр. Эксперта портала ebizQ Бесс Голд-Бернштейн: «EII создает слой абстракции между приложениями, которые запрашивают информацию, и исходными системами. Этот слой абстракции исключительно важен для SOA. Доступ к различным наборам агрегированных данных может быть представлен как сервис в SOA». SOA — гибкий способ комбинирования и многократного использования компонентов для построения сложных распределённых программных систем.

При ближайшем рассмотрении двух современных ИТ-концепций — MDM и SOA — возникает вопрос, как MDM позиционируется в SOA. Система MDM не является частью ERP или BI-системы. Подход к решению задачи управления мастер-данными базируется на предпосылке: справочные данные используются всеми корпоративными систем управления, а предоставление качественной НСИ следует рассматривать как сервис, потребляемый этими корпоративными бизнес-приложениями, в полном соответствии с SOA.

Таким образом, система управления НСИ — компонент корпоративной информационной архитектуры, предоставляющий всем заинтересованным информационным системам сервисы, связанные с управлением мастер-данными. Основные группы сервисов:

^ доступ к мастер-данным; ^ многофункциональный поиск мастер-данных;

^ запросы в службу ведения НСИ на изменение/добавление данных; ^ запросы в службу ведения НСИ на установление ссылок или переходных ключей; ^ функции ведения основных данных (корректировки и добавления), доступные экспертам — специалистам службы НСИ; ^ доставка (репликация) основных данных в прикладные системы — потребители мастер-данных по запросу или по событию.

Часть этих сервисов может предоставляться системой управления НСИ непосредственно в виде Web-сервисов.

Интеграция корпоративных приложений

Несколько лет назад появился термин «EAI» (интеграция корпоративных приложений), обозначающий интеграционную платформу, состоящую из системы передачи сообщений, брокера для маршрутизации и трансформации, набора адаптеров, упрощающих взаимодействие с приложениями и данными из различных систем. EAI — технология, с помощью которой организация добивается централизации и оптимизации интеграции корпоративных приложений, используя те или иные формы технологии оперативной доставки информации (push technology), которая управляется внешними событиями (event-driven) [2]. Эта технология успешно решает задачу фиксации изменений и их переноса в соответствующие приложения или системы. Интеграция приложений состоит в получении, трансформации, маршрутизации и доставке сообщений (все эти функции мы объединяем вместе под термином «обмен сообщениями») и управлении бизнес-процессами.

Концепция интеграции приложений технологически базируется на системах обмена сообщениями. Такие системы предназначены для выполнения основной EAI задачи — обмена сообщениями между приложениями по определенным событиям. Обмен сообщениями может производиться как в синхронном, так и в асинхронном режиме. Синхронный режим предполагает получение ответа одновременно с отправкой сообщения. Под одновременностью понимается ожидание отправляющей стороны в получении ответа. Обмен сообщениями считается выполненным по факту получения ответа от получающей стороны. Для асинхронного сообщения взаимодействие между отправителем и системой обмена сообщениями оканчивается в момент, когда система обмена сообщениями получает сообщение.

В последнее время в среде ИТ и бизнес-экспертов появились различные трактовки термина «управление бизнес-процессами». Приведём определение Association of Business Process Management Professionals (ABPMP): «Business Process Management (BPM) — это дисциплинированный подход к выявлению, изображению, исполнению, документированию, мониторингу, контролю и измерению как автоматизированных, так и неавтоматизированных бизнес-процессов, обеспечивающий достижение устойчивых результатов, согласующихся со стратегическими целями организации». BPM подразумевает обдуманные, объединенные технологически-поддерживаемые определения, улучшения, инновации и управление непрерывными бизнес-процессами, улучшающими

бизнес-результаты, придающими ценность и позволяющими организации гибко подходить к своим бизнес-целям. Многие вендоры создают приложения, позволяющие организациям наиболее эффективно управлять своими бизнес-процессами. Это подразумевает механизмы создания, выполнения, измерения и контроля. Однако, многие предприятия имеют унаследованные программные продукты, часто выполняющие узкоспециализированные функции. Вполне понятна цель организаций включить эти приложения в свои бизнес-процессы. Таким образом, задача, которую решает программное обеспечение класса управления бизнес-процессами состоит и в интеграции приложений, но не на уровне обмена сообщениями, а на уровне абстракции — уровне бизнес-процессов.

Использование программного обеспечения класса ЕА1 рекомендуется при внедрении систем управления мастер-данными, поскольку процесс управления основными данными имеет межсистемный характер. Наиболее типовые сценарии управления мастер-данными, — консолидация, гармонизация и централизованное ведение — оперируют терминами «событие» и «передача данных». Поэтому когда речь заходит о реализации этих сценариев с помощью конкретных инструментов, на первый план выходят системы, основная зона ответственности которых — именно обмен сообщениями между информационными системами организации. В компоненты системы управления НСИ аналитики включают в интеграционную платформу (шину обмена данными) [6].

Процесс управления справочной информацией предполагает активное участие владельцев данных в очистке данных, оперативной обработке, утверждении изменений и др. Типовые бизнес-сценарии по управлению основными данными могут включать участие более одного сотрудника, например: автора изменений, специалиста НСИ — обработчика заявок и специалиста НСИ, утверждающего изменения. В таких случаях возникает задача информационной поддержки таких бизнес-сценариев. Как минимум, необходим простейший workflow-функционал, но чаще появляется необходимость в моделировании и выполнении более сложных бизнес-процессов с отдельными шагами: обращения (вызовы сервисов) во внешние системы; поиск и слияние двойников; отправка почтовых сообщений; взаимодействие с пользователем и другое. Для поддержки таких расширенных сценариев управления основными данными необходимо совместное использование и интеграция системы управления основными данными с системой управления

бизнес-процессами (BPMS, Business Process Management Suite).

Интеграция платформ и стандартов

Для организации взаимодействия отдельных информационных систем в рамках единого интеграционного решения важно предусмотреть различные технологические стандарты, с использованием которых построены отдельные системы. Выделяют следующие уровни абстракции для технологий, используемых при организации обмена информацией:

^ организация сетевого взаимодействия оборудования;

^ организация взаимодействия разных отдельных систем ОС;

^ стандартизация форматов и протоколов взаимодействия.

Любое готовое интеграционное решение может в полной мере считаться таковым, если предоставляет средства для решения технологических задач, связанных с возможной несовместимостью используемых сетевых протоколов, операционных систем, протоколов обмена информацией и т.д. Хороший тон — широкая поддержка интеграционной платформой устоявшихся стандартов в области обмена данными - XML, XSLT, J2EE, SOAP, UDDI, WSDL, HTTP, FTP, JDBC и др.

Системы управления основными данными предоставляют централизованные сервисы для всех заинтересованных сторон — бизнес-приложений, систем управления базами данных, конечных пользователей. Поэтому такие системы должны обеспечивать свободу доступа к своим сервисам с использованием максимального числа возможных интерфейсов доступа. На сегодняшний день большинство

MDM систем предлагаются как компоненты интеграционных платформ, поэтому достигается совместимость с общепринятыми стандартами. Например, отсутствие встроенной возможности доступа к базам данных напрямую может компенсироваться возможностью доступа к последним с использованием промежуточного программного обеспечения — шины обмена сообщениями или ETL средства. Тем не менее, уже на уровне интерфейсов самой системы MDM крайне желательна поддержка некоторого минимума интеграционных возможностей, в частности, возможность обмена файлами в формате XML с использованием схем форматов данных XSD. Все известные поставщики MDM-решений объявляют о поддержке в будущем доступа к функциям этих систем через вызовы Web-сервисов, что способствует интероперабельности систем.

Заключение

Управления основными данными — одна из ключевых задач интеграции гетерогенного информационного ландшафта. Качество решения этой задачи зависит от применяемого подхода — от «заплатки брешей» путем донастройки и перепрограммирования систем до системного подхода. Последний состоит во внедрении полнофункционального интеграционного решения, включающего одной из своих компонент систему управления основными данными. Наличие в системном ландшафте таких компонент интеграционного решения как портал предприятия, система класса ETL, система управления бизнес-процессами, система обмена данными и хранилище данных, в значительной степени расширяет функциональные возможности системы управления основными данными, её круг применения и обеспечивает синергети-ческий эффект от её внедрения. ■

Список литературы

1. John Taylor - Thoughts from the Integration Consortium: Enterprise Information Integration: A New Definition (http://www.dmrevi-ew.com/article_sub.cfm?articleId=1009669)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Claudia Imhoff - Understanding the Three E's of Integration EAI, EII and ETL (http://www.dmreview.com/article_sub.cfirtfartic-leId=1023893)

3. SAP NetWeaver 2004s Solution Map (http://www.sap.com/solutions/businessmaps/6064CC13D46849EC8491E2308AA43795/index.epx)

4. WebSphere integration and infrastructure capabilities (http://www-306.ibm.com/software/info1/websphere/index.jsp?tab=landings/wso-verview&S_TACT=105AD02W&S_CMP=campaign)

5. Enterprise information portal (http://en.wikipedia.org/wiki/Enterprise_portal)

6. Костяков С. - Бизнес по нормам и правилам. (http://iemag.ru/?ID=620190)