УДК 517.3
КЛАССИФИКАЦИЯ И ОСНОВНЫЕ НАПРАВЛЕНИЯ СОВЕРШЕНСТВОВАНИЯ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННЫХ СИСТЕМ, ОБЕСПЕЧИВАЮЩИХ ПРОЦЕСС УПРАВЛЕНИЯ СЛОЖНЫМИ ТЕХНИЧЕСКИМИ СИСТЕМАМИ
Я.Е. Львович, Д. Д. Лапшин
Проведен анализ автоматизированных информационных систем (АИС), обеспечивающих процесс аналитической обработки данных и поддержки принятия решений в процессе управления развитием СТС. Определены основные направления их совершенствования
Ключевые слова: классификация, базы данных, технические системы
В настоящее время для повышения оперативности и своевременного информационного обеспечения решения задач в процессе управления развитием сложными техническими системами реализованы автоматизированные информационные системы, ориентированные на оперативную и аналитическую обработку информации .
Системы оперативной обработки данных (СОД) - это средства ведения баз данных и формирования регламентированных отчетов; эти системы удовлетворяют требованиям пользователей, при условии корректной организации структуры базы данных и значительно облегчают процессы повседневной обработки информации, поступающей из различных источников. В отличие от СОД применение автоматизированных систем поддержки принятия решений (СППР) связано с рядом основных проблем.
А. Сложность использования моделей поддержки принятия решений в процессе управления развитием СТС непрограммируемым пользователем. В СППР реализованы различные модели на основе методов исследования операций, прогнозирования, вариационного анализа и динамического программирования, теории вероятностей, экспертных оценок и др. Для их практического применения пользователи должны знать математические методы расчета, алгоритмы их программной реализации, язык программирования, систему управления базой данных, языки доступа к данным, структуру и содержание базы данных. В данных системах реализовывать методы с использованием типовых видов
Львович Яков Евсеевич - ВГТУ, д-р техн. наук, профессор, тел. (4372) 43-77-04 Лапшин Дмитрий Дмитриевич - ВГТУ, аспирант, тел. (4372) 55-43-09
рассуждений и анализа, характерных для данной предметной области.
Б. Ориентация моделей поддержки принятия решений на исследовательские задачи. СППР изначально разрабатывались для выполнения исследовательских задач. Реализация управлением развитием сложных технических систем имеет ряд существенных особенностей и отличий: работа в условиях дефицита времени; задачи распределены и рассредоточены в пространстве и времени по многим рабочим местам и этапам; большая часть процедур должна периодически повторяться; неопределенность данных в процессе анализа и принятия решений. Характеристика систем, ориентированных на аналитическую обработку в научно-исследовательских организациях и организациях управления представлена в табл. 1.
Анализ таблицы показывает, что при использовании моделей СППР в практической работе органов управления основная часть усилий и большая часть времени пользователями тратится на процесс подготовки и уточнения исходной информации, необходимой для функционирования соответствующих моделей поддержки принятия решений. Перенесение “один к одному” исследовательских моделей и методов на практические задачи с учетом данных особенностей и отличий в работе органов управления и исследовательских организаций затрудняет, а иногда делает невозможным их использование.
В. Ориентация моделей СППР на решение “прямых” задач в процессе управления развитием сложных технических систем. Результаты моделирования представляются в виде типового отчета, и, как правило, после просмотра такого отчета появляется не готовый ответ, а возникает новая серия вопросов, требующих оперативного решения как прямых, так и обратных задач.
Каждый новый запрос должен быть сначала формально описан, передан программи-
сту и выполнен. К тому времени, когда ответ на запрос получен, часто оказывается,
Таблица 1
Характеристики данных в системах, ориентированных на оперативную и аналитическую обработку информации
Характеристики Аналитическая обработка в научноисследовательских организациях Аналитическая обработка в организациях управления
Источник данных Внешние (по отношению к аналитической системе) Внешние и внутренние
Частота обновления Низкая частота, большими порциями Высокая частота, большими порциями
Возраст данных Исторические (за период в несколько лет, десятки лет) и прогнозируемые Исторические (ретроспективные), текущие и прогнозируемые данные
Уровень агрегации Агрегированные данные Детализированные и агрегированные данные
что решение уже принято или произошла ошибка, и был получен ответ совсем не на тот запрос. Алгоритм и результаты расчета по моделям СППР стандартизируются и специфицируются на этапе разработки, что впоследствии оборачивается потерей гибкости, когда любое непредвиденное изменение исходных условий не позволяет их использовать или ставит под сомнение полученный результат. Однако, труднопред-сказуемость современных производственно-экономических условий развития СТС, повышение неопределенности и риска делают особенно актуальным принятие решений в нерегламентированных ситуациях.
Для адаптации к реальным условиям систем поддержки принятия решений в процессе управления развитием СТС необходимо:
а) получить возможность решать прикладные задачи анализа, используя их содержательное описание и определения значений исходных данных без программирования процесса решения задач в реальном масштабе времени;
б) создать инструментальные средства с “дружественным” интерфейсом, реализующие типовые виды рассуждений и анализа, характерные для данной предметной области;
в) повысить гибкость функциональных возможностей системы (она должна распознавать и идентифицировать неизвестные ранее типы прямых и обратных задач и/или запросов к базе данных и построить для их решения расчетные схемы).
Сделаем некоторые замечания о базах данных (БД) СОД и СППР.
1. Основным источником информации для БД СОД является деятельность органа управления. БД СППР требуют использования внешних источников информации (например, статистических отчетов подчиненных организаций).
2. В БД СОД содержатся оперативные данные не более чем за 12 месяцев. Для проведения достоверных анализа и прогнозирования в БД СППР нужно иметь информацию о процессе управления развитием СТС и состоянием внешней среды на протяжении нескольких лет.
3. Во многих ОУ одновременно существуют несколько СОД с собственными БД. Оперативные БД СОД содержат семантически эквивалентную информацию в разных форматах, с разным указанием времени ее поступления и иногда даже противоречивую. Информация, используемая в СППР, единообразно представляется, согласовывается и должна максимально соответствовать информации оперативных БД СОД.
4. СОД создаются в расчете на решение конкретных задач. Обычно набор запросов к БД СОД известен уже при проектировании. Набор запросов к БД СППР предсказать невозможно.
5. БД СОД по своей природе являются сильно изменчивыми, что учитывается в СУБД (нормализованная структура таблиц БД, строки хранятся неупорядоченно, деревья для индексации). БД СППР относительно мало изменчивы, что учитывается при организации их структуры.
6. Для БД СППР обычно хватает защиты информации на уровне таблиц. Ис-
ходные данные и результат функционирования СППР требуют более детализированного разграничения доступа.
В реализованных АИС базы данных представляют собой либо локальные, разрозненные, противоречивые, дублирующие друг друга наборы информации, отличающиеся различными формами представления данных, либо единую базу данных, размещенную на одном узле вычислительной сети. При использовании такой БД в многопользовательском режиме неизбежно происходит замедление доступа к данным. Основная причина этого - последовательная обработка трансакций СУБД. Особо остро данная проблема проявляется в случае, когда требуется агрегированная и отсортированная информация из базы данных по финансированию региона, департамента промышленности, предприятия и т.д. Следовательно, для ускорения доступа и повышения оперативности формирования соответствующих решений необходимо:
а) разделить функциональные компоненты единой БД на оперативную и аналитическую части; аналитическая БД должна работать только в режиме чтения и содержать только агрегированные данные; уровень агрегации определяется уровнем организационной иерархии - запроса и временем, располагаемым для принятия решений;
б) разместить функциональные компоненты единой БД на отдельных узлах вычислительной сети;
в) разработать механизм автоматического наполнения и верификации информации в аналитическую БД из оперативной БД и других внешних источников.
Разработка автоматизированных информационных систем (СОД, СППР) проводилась, как правило, по двум направлениям: создавалась единая универсальная программа, охватывающая все множество задач предметной области, или формировался набор программ, каждая из которых решала некоторое подмножество задач.
Первое направление приводило к появлению программ гигантских размеров и труднообозримой структуры, что усложняло алгоритмы программ и создавало проблемы для последующего их сопровождения и развития. Второе направление разработки программ влекло за собой их излишнюю сложность и неортогональность, т.е. в такой программной конфигурации дублировались алгоритмы решения задач, поскольку был реализован неэкономичный принцип “каждой задаче - отдельную программу”.
Для того чтобы обеспечить гибкость АИС, ориентированных на анализ данных и поддержку принятия решений в процессе управления развитием СТС, и сократить расходы на разработку, целесообразно использовать пакетный подход при проектировании. Цель данного подхода - сформировать набор модулей, охватывающих предметную область. Это означает, что для любой задачи может быть построена расчетная схема, ее решающая: подмножество модулей из сформированного набора, надлежащим образом организованное.
Отличие пакетного подхода от библиотеки модулей состоит в том, что при построении библиотеки не ставится цель “покрытия” предметной области, т.е. формирования конкретных конфигурационных программ исключительно из модулей, хранящихся в библиотеке. Как правило, программа состоит из модулей, разработанных и хранящихся вне библиотеки. Они, помимо основной, функциональной нагрузки, должны обеспечивать межмодульный интерфейс (взаимодействие по данным и управлению). В пакете программ любая конкретная конфигурация программы должна целиком состоять из модулей пакета, что позволит работать с ним любому пользователю, не знакомому с программированием. Для этого все основные проблемы интерфейса должны быть решены на стадии проектирования пакета.
Расширение класса задач должно достигаться за счет имеющегося набора модулей путем автоматической генерации расчетной схемы решения аналитической задачи. Подключение к пакету дополнительных, вновь создаваемых, модулей производится в том случае, если имеющий набор не позволяет решить поставленную задачу либо создана новая или усовершенствованная форма или вариант расчета конкретного показателя. При этом не должны изменяться существующие модули, а значит, не пострадает работоспособность отлаженных ранее алгоритмов, методов и способов расчета, что обеспечивает дальнейшее развитие пакета.
Совокупность модулей пакета - это база знаний, которая вместе с оперативной и аналитической базами данных образует единое общекорпоративное хранилище данных. Хранилище данных - предметноориентированный, интегрированный, неизменный набор данных, хронологически организованный для целей поддержки управления. Подход к построению хранилища данных для интеграции неоднородных источников принципиально отличается от
подхода к динамической интеграции разнородных БД. Строится новое крупномасштабное хранилище, управление данными в котором происходит по другим правилам, чем в исходных оперативных БД.
У. Инмон сформулировал классическое определение информационного хранилища. По его определению это специальным образом администрируемая база данных, содержимое которой имеет следующие свойства: предметная ориентация, интегрированность данных, инвариантность во времени, неразрушаемость (стабильность) информации и минимизация избыточности информации.
Предметная ориентация. В отличие от БД в традиционных информационных системах, где данные подобраны в соответствии с конкретными приложениями, информация в информационном хранилище ориентирована на задачи поддержки принятия решений, для СППР требуются “исторические” данные. Хорошо спроектированные структуры данных отражают развитие всех направлений во времени.
Интегрированность данных. Данные в информационное хранилище поступают из различных источников, в которых они могут иметь разные имена, атрибуты, единицы измерения и способы кодировки. После загрузки в информационное хранилище данные очищаются от индивидуальных признаков, т.е. они как бы приводятся к общему знаменателю, и с этого момента они составляют единое информационное пространство.
Инвариантность во времени. В оперативной БД истинность данных гарантирована только в момент чтения, поскольку уже в следующее мгновение они могут измениться в результате очередной трансакции. Важным отличием аналитической базы от оперативной - является то, что данные в них сохраняют свою истинность в любой момент процесса чтения. В оперативной БД информация часто модифицируется как результат выполнения каких-либо трансакций. Временная инвариантность данных в аналитической БД достигается за счет введения полей с атрибутом “время” (день, неделя, месяц) в ключи таблиц. В результате записи в таблицах аналитической базы данных никогда не изменяются, представляя собой снимки данных, сделанные в определенные отрезки времени.
Неразрушаемость (стабильность) информации. В оперативной БД записи могут регулярно добавляться, удаляться и редактироваться, а в аналитической БД, как следует из требования временной инвариант-
ности, однажды загруженные данные никогда не меняются. С ними возможны только две операции: начальная загрузка и чтение (доступ). Это и определяет специфику проектирования структуры базы данных для аналитической БД. Если при создании СОД разработчики должны учитывать такие моменты, как откаты трансакций после сбоя сервера, борьба со взаимными блокировками процессов, сохранение целостности данных, то для СППР такие проблемы не столь актуальны - перед разработчиками стоят другие задачи, связанные, например, с обеспечением высокой скорости доступа к данным.
Минимизация избыточности информации. Поскольку информация в аналитическую БД загружается из оперативной БД, возникает вопрос, не ведет ли это к чрезмерному дублированию данных. На самом деле избыточность минимальна, что объясняется следующими причинами:
а) при загрузке информации из оперативной БД в аналитическую данные фильтруются; многие из них вообще не попадают в аналитическую БД, поскольку лишены смысла с точки зрения использования в системах поддержки принятия решений;
б) информация в СОД носит, как правило, оперативный характер, и данные, потеряв актуальность удаляются; в аналитической БД, напротив, хранится историческая информация, и с этой точки зрения перекрытие содержимого аналитической БД данными СОД оказывается весьма незначительным:
в) в аналитическую БД поступает некая итоговая информация, которая в БД СОД вообще отсутствует;
г) во время загрузки в аналитической БД записи сортируются, очищаются от ненужной информации и приводятся к единому формату.
В качестве технологии представления информации в аналитической БД и режиме использования необходимы традиционный статический анализ данных (ББ8) и динамический интерактивный многомерный анализ данных (ОЬЛР/ЯОЬЛР). Сравнительная характеристика статического и аналитического анализа данных представлена в табл. 2.
Результатом работы аналитической системы в случае ББ8-технологии являются регламентированные многостраничные отчеты и диаграммы.
ОЬЛР/ЯОЬЛР-технология представляет собой развитие методов работы с реляционной базой данных, что позволило
существенно повысить эффективность их использования в аналитической работе. Ключевые особенности ОЬЛР/ЯОЬЛР:
многомерный взгляд на данные со стороны конечного пользователя, многомерное
представление данных в целевой базе данных, проведение сложных вычислений над массивами данных, привязка информации ко времени, обеспечивающая возможность анализа динамики данных.
В СППР для управления развитием СТС необходимо предусматривать элементы обеих технологий анализа данных. Хранилище данных может использоваться исключительно как источник для регламентированных аналитических сводок и отчетов или для регламентированной статической обработки. ОЬЛР - инструментарий служит для работы с оперативными данными из традиционной СОД.
Таблица 2
Сравнение характеристик статического (регламентированного) и динамического анализа
Характеристика Статический анализ Динамический анализ
Типы вопросов Сколько? Как? Когда? Почему? Что будет, если?
Время отклика Не регламентируется Секунды
Типичные операции Регламентированный отчет, диаграмма, график Последовательность интерактивных отчетов, диаграмм, экранных форм, динамическое изменение уровней агрегации и срезов данных
Уровень аналитических Средний Высокий
требований
Тип экранных форм В основном определенный заранее, регламентированный Определяемый пользователем
Уровень агрегации дан- Детализированные и суммарные В основном суммарные
ных
Возраст данных Исторические и текущие Исторические, текущие и прогнозируемые
Типы запросов В основном предсказуемые Непредсказуемые
Назначение Работа с историческими и текущими данными, регламентированная аналитическая обработка Работа с историческими, текущими и прогнозируемыми данными. Многопроходной анализ, моделирование и построение прогнозов
Можно заключить, что направлениями совершенствования АИС управления развитием СТС являются:
а) построение распределенной структуры единой корпоративной базы данных в виде хранилища данных, разделение оперативной и аналитической БД и их физическое размещение на отдельных узлах вычислительной сети, организация их взаимодействия, единообразное представление и согласование информации, грануляция защиты аналитической БД (индивидуальные права доступа к определенным строкам и/или столбцам таблицы);
б) разработка базы знаний, содержащей методы, методики и алгоритмы задач, решаемых в процессе управления развитием СТС. и поддержание ее в актуальном состоянии;
в) обработка и согласование архивных данных, накопленных в процессе функционирования СОД в органах управления; создание компоненты для извлечения и “очистки” информации из разных источников;
г) повышение гибкости функциональных возможностей СППР в процессе управления развитием СТС; СППР должна распознавать и идентифицировать невыделенные ранее типы задач и/или запросов к БД и создавать расчетные схемы для их решения;
д) возможность решения задач анализа по их содержательному описанию и определение значений исходных данных без применения программирования в реальном масштабе времени;
е) создание инструментальных средств с “дружественным” интерфейсом, которые используют типовые виды рассуждения и анализа, характерные для данной предметной области;
ж) совершенствование технологии разработки АИС на основе пакетного подхода.
Литература
1. Сахаров А.А. Концепции построения и реализации информационных систем, ориентированных на анализ данных // СУБД. i99б. № 4.
2. Сахаров А.А. Принципы проектирования и использования многомерных баз данных (на примере Oracle Exspress Server) // СУБД. i99б. № 3.
3. Каменнова М.С. Корпоративные информационные системы: технологии и решения // СУБД. 1995. № 3.
Воронежский государственный технический университет
CLASSIFICATION AND DIRECTIONS TO IMPROVE INFORMATION SYSTEMS ENSURING THE PROCESS OF CTS DEVELOPMENT MANAGEMENT
I. E. Lvovich, D.D. Lapshin
An analysis has been conducted of automated information systems (AISs) ensuring the process of analytical data and decision-making support in the process of CTS development management. Main directions of their improvement have been determined
Key words: qualification, base of dates, technical systems