К ВОПРОСУ ОРГАНИЗАЦИИ ИНФОРМАЦИОННОГО ХРАНИЛИЩА С АНАЛИТИЧЕСКОЙ ОБРАБОТКОЙ ДАННЫХ
Захарченко Р.И.,
Краснодарский филиал Военной академии связи, constz@mail.ru
Мясникова А.И.,
Северо-Кавказский филиал Московского технического университета связи и информатики, anna_zimnyaya@mail.ru
Ключевые слова:
автоматизированные системы управления связью, лицо принимающее решение, информация, система поддержки принятия решения, система обработки данных
АННОТАЦИЯ
При выработке и принятии в автоматизированных системах управления связью (АСУС) решений, соответствующих складывающейся обстановке по связи, основополагающую роль играет их обоснование по имеющейся у лица принимающего решение (ЛПР) информации и знаниям, которые должны удовлетворять требованиям полноты, достоверности, адекватности, непротиворечивости. В интересах выработки адекватного решения используются как внутренние информационные ресурсы, которые формируются исходя из отражения деятельности (функционирования) объекта в документах, других видах и способах сбора, обработки, хранения информации, так и внешние по отношению к объекту информационные ресурсы, а также глобальные - из средств массовой информации и т.д.
Эти обстоятельства вынуждают использовать имеющиеся в настоящее время весьма развитые программно-технические средства и новые информационные технологии для создания системы поддержки принятия решения (СППР). Широкое и эффективное применение этих средств на пунктах управления связью различных уровней становится жизненно необходимой составляющей для принятия обоснованных решений в АСУС. На первых этапах создания АСУС требовалось навести порядок именно в процессах повседневной рутинной обработки (переработки) данных, на что в настоящее время ориентированы традиционные системы обработки данных (СОД).
US
RESEARCH
Процесс принятия решения по связи осложняется тем, что он проходит в следующих специфических условиях [1]:
огромных объемов справочной и распорядительной информации;
неполноты и противоречивости поступающей из различных источников информации;
разнородности форм представления данных; малых сроков на принятие решения; высокой цены ошибки принятого решения; высокой степени взаимозависимости должностных лиц по связи при обмене информацией
Более того, СППР по отношению к СОД являются в определенном смысле вторичными. Здесь возможна аналогия с производством. Любая продукция, прежде чем попасть на склад и быть отгружена потребителю, должна быть сначала произведена. И прежде чем заниматься анализом данных, необходимо эти данные иметь (произвести), что и является одной из функций СОД.
Современный уровень развития аппаратных и программных средств сделал возможным повсеместное ведение баз данных оперативной информации на всех уровнях управления. В процессе своей деятельности в автоматизированных информационных системах военного назначения организации сложилась парадоксальная ситуация - информация вроде бы где-то есть, её даже слишком много, но она неструктурированна, несогласованна, разрознена, не всегда достоверна, её практически невозможно найти и получить. Кроме больших объемов информации базы данных хранят в себе большие потенциальные возможности по извлечению полезной аналитической информации, на основе которой можно выявлять скрытые тенденции, строить стратегию развития, находить новые решения [2].
Именно на разрешение этого противоречия - отсутствие информации при ее наличии и даже избытке - нацелена концепция "информационного хранилища" (англ. - Data Warehouse). Эта технология выполняет функции предварительной подготовки и хранения данных для СППР на основе информации из системы управления связью (или баз данных АСУС), а также информации из внешних источников, которые всегда присутствуют в достаточном количестве в течение длительного периода времени (годы) в информационном хранилище по определенным правилам. Они используются в различных временных режимах для анализа как источник данных для разного рода отчетности и обоснования управленческих решений [3].
В основе концепции информационного хранилища лежат такие основополагающие идеи, как интеграция ранее разъединенных детализированных данных (исторических архивов с данными из хранилища), их согласование и возможная агрегация.
Предметом рассмотрения концепции информационного хранилища являются сами данные. После того, как традиционная СОД реализована и начинает функционировать, она становится ровно таким же самостоятельным объектом реального мира, как и любой производственный процесс. А данные, которые являются одним из конечных продуктов такого производства, обладают ровно теми же свойствами и характеристиками, что и любой промышленный продукт: сроком годности,
местом складирования (хранения), совместимостью с данными из других СОД, рыночной стоимостью, транспортабельностью, комплектностью, ремонтопригодностью и т.д.
Для качественной и своевременной обработки данных в информационном хранилище АСУС к данным предъявляется ряд требований, которые представлены в таблице 1[4].
Таким образом, предметом исследования в информационном хранилище являются не способы описания и отображения элементов и систем связи, а собственно данные как самостоятельный объект предметной области, порожденной в результате функционирования ранее созданных информационной систем.
В результате концепция информационного хранилища АСУС обладает следующими отличительными чертами:
она является это не концепцией анализа данных, а концепцией подготовки данных для анализа;
она не предопределяет архитектуру целевой аналитической системы, а говорит о том, какие процессы должны выполняться в системе, не конкретизируя, где конкретно и как эти процессы должны выполняться;
она предполагает не просто единый логический взгляд на данные, а реализацию единого интегрированного источника данных.
Последнюю особенность следует раскрыть подробнее. Сегодня достаточно популярны решения, предполагающие интеграцию различных СОД на основе единого справочника метаданных (поддерживающего единый логический взгляд данные), но не единого интегрированного источника данных. При этом по каждому новому запросу предполагается динамическая выгрузка данных из различных СОД, их динамическое согласование, агрегация и транспортировка к пользователю. Очевидно, что для определённых классов приложений это решение вполне корректно. Но следует заранее понимать все ограничения, им накладываемые.
Кроме единого справочника метаданных, средств выгрузки, агрегации и согласования данных, концепция информационного хранилища подразумевает интегрированность, неизменчивость, поддержку хронологии и согласованность данных (таб. 1). И если два первых свойства (интегрирован-ность и неизменчивость) влияют в основном только на режимы анализа данных неинтегрированной базы данных, в которой используются специализированные методы хранения и доступа (сегодня, по крайней мере, трудно говорить о реализации интерактивного динамического анализа), то последние два (поддержка хронологии и согласованность), существенно сужают список решаемых аналитических задач.
Без поддержки в АСУС хронологии (наличия исторических данных) нельзя говорить о решении задач прогнозирования и анализа тенденций. Но наиболее критичными и болезненными, оказываются вопросы, связанные с согласованием данных.
Основным требованием аналитической обработки данных является не столько оперативность, сколько достоверность ответа. Но достоверность, в конечном счете, и определяется согласованностью. Пока не проведена работа по взаимному согласованию значений данных из различных источников, сложно говорить об их достоверности.
В АСУС проблема согласованности данных стоит чрез-
Предметная ориентированность Все данные об элементах и системе связи собираются (обычно из множества различных источников^ очищаются, согласовываются, дополняются, агрегируются и представляются в единой, удобной для их использования и анализа форме.
Интегрированность Все данные об элементах и системе связи взаимно согласованы и хранятся в едином хранилище
Неизменчивость Исходные (исторические) данные, после того как они согласованы, верифицированы и внесены в хранилище, остаются неизменными и используются исключительно в режиме чтения
Поддержка хронологии Данные хронологически структурированы и отражают историю за достаточный для выполнения задач анализа и прогнозирования период времени.
Таб 1.Основные требования к данным в информационном хранилище АСУС
вычайно остро, так как в ней на пунктах управления связью различных уровней иерархии используются для хранения информации собственные базы данных. Возможно возникновение ситуаций, когда на один и тот же вопрос базы данных смежных, но различных уровней иерархии АСУС могут дать различный ответ. Это может быть связано как с не синхронностью моментов модификации данных, так и отличиями в трактовке одних и тех же событий, понятий и данных, изменением семантики данных в процессе развития предметной области, элементарными ошибками при вводе и обработке, частичной утратой отдельных фрагментов архивов и т.д. Учесть и заранее определить алгоритмы разрешения всех возможных коллизий не реально. Тем более, это нереально сделать в оперативном режиме, динамически, непосредственно в процессе формирования ответа на запрос.
Поэтому, как было сказано выше, концепция информационного хранилища определяет лишь самые общие принципы построения аналитической системы АСУС и в первую очередь сконцентрирована на свойствах и требованиям к данным, но не способах их организации и представления в целевой базе данных и режимах их использования.
Иными словами, концепция информационного хранилища АСУС фактически не затрагивает и оставляет свободу выбора в следующих вопросах, относящихся:
к конкретным способам представления данных в целевой БД (например, многомерное или реляционное [3]);
к конкретным способам проведения анализа данных (статический или динамический).
В связи с большим объемом и сложностью проблема собственно анализа данных в информационном хранилище АСУС имеет следующие два направления:
1) оперативный анализ данных (англ. - On-Line Analytical Processing, OLAP). Основной задачей OLAP-анализа является быстрое (в пределах нескольких секунд) извлечение информации, необходимой должностным лицам по связи для обоснования или принятия решения;
2) интеллектуальный анализ информации (англ. - Data mining). Предназначен для выявления и фундаментального исследования скрытых тенденций и закономерностей в процессах функционировании систем связи. Требования по времени в интеллектуальному анализу менее жестки, но для него используются более сложные методики. Решаемые с его помощью задачи дают, как правило, результаты стратегического
значения. При решении сложных задач в режиме Data mining необходимо использовать мощные специальные программные средства (программный инструментарий).
На основе выше изложенного следует, что построение СППР в АСУС в настоящее время необходимо осуществлять на основе построения информационной подсистемы АСУС на концепции информационного хранилища, отвечающей требованиям современного времени и полностью удовлетворяющей должностных лиц по связи. Это - достаточно сложный и трудоемкий процесс. При этом в состав СППР должен включаться следующий набор программных продуктов:
1) средства построения информационного хранилища (data warehousing);
2) системы оперативной аналитической обработки (OLAP);
3) информационно-аналитические системы (Enterprise Information Systems);
4) средства интеллектуального анализа данных (data mining);
5) инструменты для выполнения запросов и построения отчетов.
Основным элементом СППР будет являться информационного хранилища с аналитической обработкой данных ИХ, логическая структура которого будем строиться по следующей методике содержащей 3 этапа.
Создание инфологической модели (ИЛМ) ИХ целесообразно проводить в следующей последовательности:
выявление выделить типовых объекты учета предметной области (ТОУ), реквизиты и связи между ТОУ;
анализ реквизитов и выделение среди них многомерных данных, определение возможных групп синхронного изменения динамических реквизитов, определение динамических связей;
формирование фрагментов ИЛМ, включающих несколько информационных объектов;
объединение фрагментов в единую ИЛМ ИХ и уточнение состава и структуры информационных объектов, фрагментов и всей ИЛМ ИХ в целом.
Инфологическая модель ИХ, отображающая объекты (сущности) предметной области, их учитываемые характеристики - реквизиты, а также взаимные связи представляется чаще всего в виде графической диаграммы.
Рассмотрим подробнее содержание этапа создания ИЛМ
ИХ.
Исходя из анализа существующей ИЛМ для традицион-
US
RESEARCH
ных баз данных (БД) АСУС, необходимо выделить типовые объекты учета (ТОУ), реквизиты и связи между ТОУ. Результаты этого анализа приведены ранее.
Далее необходимо осуществить анализ реквизитов и выделение многоиерных данных.
Динамические реквизиты обладают доменом (областью допустимых значений), представляющим собой множество дискретных значений. Примерами многомерных данных являются, «ДАТА ИЗМЕНЕНИЯ СОСТОЯНИЯ», «ВРЕМЯ ИЗМЕНЕНИЯ СОСТОЯНИЯ» и т.д.
Определения динамических связей необходим для спецификации другого класса многомерных данных, указывающих, в каком семантическом отношении в данный момент времени находятся те или иные экземпляры объектов учета.
Динамические связи характеризуются тем, что они обладают атрибутом «Время установления». При наличии такой связи на ER- диаграмме для их отображения на логическом уровне порождаются специальные реляционные отношения, содержащие ключевые атрибуты связываемых сущностей и атрибут "Время установления".
Анализ показывает, что в предметной области БД АСУС из двух основных типов связей - структурных и ассоциативных, только последний тип относится к классу динамических. Структурные (иерархические) связи не изменяются за период существования в БД, что обусловлено их направленностью на описание построения отдельных элементов системы связи, не подлежащих реконфигурации.
Ассоциативные связи, напротив, изменяются во времени, т.к. направлены на представление различных вариантов построения сетей и системы связи и их реконфигурацию во времени.
Определение групп динамических реквизитов, синхронно изменяющихся во времени, необходимо для минимизации числа отношений в реляционной логической структуре ИХ.
Необходимым условием принадлежности реквизита к такой группе является следующее. Если изменяется значение данного реквизита в момент времени (0, то остальные реквизиты данной группы также изменяют свои значения и именно в этот момент
Формально это условие может быть записано следующим образом
V], (Т^А) => (ТАг ^А), где А, А} G, G - группа синхронно изменяющихся атрибутов.
В конечном итоге осуществляется формирование инфо-логической модели предметной области ИХ. Для этого предлагается использовать расширенный вариант диаграммы «сущность-связь», который в дальнейшем будем называть многомерной диаграммой «сущность-связь» и обозначать ЕКТ-диаграммой.
Построение ERT-диаграммы осуществляется по общепризнанным принципам построения традиционных ER-диа-грамм. Однако при этом помечаются (маркируются) многомерные данные: реквизиты и связи.
Этап формирования ИЛМ БД в теории баз данных считается практически не формализуемым, выполняемым совместно экспертом в предметной области БД и разработчиком БД. Полученная на этом этапе ИЛМ ИХ играет роль исходных данных в методике формирования логической структуры ИХ АСУС объединения, представленной на рис.1.
На втором этапе методики формируется логическая структура ИХ в терминах МРН. Структурными элементами схемы ИХ на этом этапе являются схемы МРН.
Для того чтобы при формировании логической структуры ИХ можно было воспользоваться правилами, следует перейти к рассмотрению МРН в форме универсального отношения. На МРН, распространяется правило, означающее, что между универсальным отношением МРН и его нормализованной структурой существует взаимно однозначное соответствие.
Таб. 2. Требования к показателям качества ИХ АСУС объединения
Название свойства Наименование показателя Требование к показателю
Достоверность Коэффициент ошибки отображения контролируемой ситуации, Кошк(штрсит 10"8-Ю"10
Коэффициент ошибки обработки запросов Кошобрзапр К-ош.обр.запр ТБД^ Кош.обр.запр Рел.БД
Полнота Степень полноты, а «ТБД> «Рел.БД
Безопасность Вероятность несанкционированного доступа к ИХ ю-11-ю-12
Непротиворечивость Коэффициент рассогласования, Крс Крс ТБД< Крс Рел.БД
Доступность Коэффициент доступности, Кд Кд ТБД> Кд Рел.БД
Оперативность Время выдачи информации по темпоральному запросу пользователя <2минуты
Целостность Коэффициент целостности, Кц Кц ТБД> Кц Рел.БД
Объемность Объем ИХ, V У—>тт
HiS
RESEARCH
1. Формирование инфологической модели ИХ в виде ERTдиаграммы
1.1. Выявление выделить типовых объекты учета предметной области (ТОУ), реквизиты и связи между ТОУ
1.2. Анализ реквизитов и выделение среди них многомерных данных, определение возможных групп синхронного изменения динамических реквизитов, определение динамических связей
1.3. Формирование фрагментов КМ, включающих несколько информационных объектов
1.4. Объединение фрагментов в единую КМ ИХ, уточнение состава и структуры информационных объектов и фрагментов КМ
2. Формирование логической структуры ИХ в терминах ТРН
2.1. Выделение на КМ ИХ связей между сущностями (групп факторов) и установление значений их характеристик
2.2. Выбор правила преобразования фрагмента КМ ИХ, определяемого заданной связью (группой факторов)
2.3. Формирование фрагмента логической структуры ИХ в терминах универсальных отношений ТРН согласно выбранным правилам
2.4. Объединение полученных фрагментов логической структуры ИХ
3. Формирование логической структуры ИХ в терминах реляционной модели
3.1. Преобразование схем ТРН, представленных в виде схем универсальных отношений, в исходные фрагменты реляционной структуры ИХ 3.2. На основании разработанных алгоритмов манипулирования многомерными данными, разработка программной надстройки, в зависимости от используемой СУБД, обеспечивающей поддержку реляционно-ориентированной модели представления данных
Рис. 1. Методика формирования логической структуры ИХ АСУС объединения
Поэтому формирование логической структуры ИХ можно проводить в два этапа следующим образом.
На первом этапе фрагмент ИЛМ ИХ преобразуется в совокупность универсальных отношений МРН. Для преобразования применяются правила. Результирующие отношения Я, соответствуют универсальным отношениям МРН.
На втором этапе универсальные отношения МРН преобразуются в нормализованные схемы МРН вида в соответствии с правилами декомпозиции.
Фрагменты логической структуры ИХ представляют собой совокупности универсальных отношений МРН. При этом полагается, что сущность №1 имеет атрибуты <КЬ Аь Р^, а сущность №2 - атрибуты <К2, А2, Р2>, где А! и А2 - статические, а Р! и Р2 - динамические меняемые атрибуты. Атрибут времени обозначается Т. Универсальное отношение МРН TSi обозначается Ти,.
Следует отметить, что особенностью результирующего
фрагмента схемы ИХ является возможность попадания в одно универсальное отношение МРН динамических атрибутов Р! и Р2 от двух различных сущностей. Они имеют различные множества значений атрибута "Время", которые могут не пересекаться, т.е что динамические атрибуты Р! и Р2 изменяются не синхронно. В этом случае для того чтобы сохранить возможность преобразования Ти в ТS, необходима декомпозиция Ти на два отношения. Например, Ти со схемой 8сИ(Ти) = < К!,К2,А!,А2,Т, Р!,Р2 > в этом случае декомпозируется на ТS! со схемой = < К!,А!,Т, Р! > и на ТS2 со схемой 8сИрт2)
= < К2, А2,Т, р2 >.
В состав TS! и ТS2 входят следующие атрибуты: TS! ={ Идентификатор, ...,Р!} ТS2 ={ Идентификатор, ..., Р2}, где
Р!={Состояние, Время, Причина смены}, Р2={Состояние, Время, Причина смены}.
В состав ТS3 и ТS4 входят атрибуты:
ТS3 = {Идентификатор,...,
TS4 ={ Идентификатор, ..., Б2}, где
р!={Состояние, Время, Причина смены}; Б2={Состояние, Время, Объект использования}.
Группа Б2 содержит атрибуты, характеризующие состояние участка тракта.
Последовательность действий на втором этапе имеет следующий вид:
1) выделение на КМ ИХ связей и установление значений их характеристик;
2) выбор правила преобразования фрагмента КМ ИХ, определяемого заданной связью (группой факторов);
3) формирование фрагмента логической структуры ИХ в терминах универсальных отношений МРН согласно выбранным правилам;
4) объединение полученных фрагментов логической структуры ИХ.
На третьем этапе методики формируется логическая структура ИХ в терминах реляционной модели. Данный этап предполагает следующую последовательность действий:
1) преобразование схем МРН, представленных в виде схем универсальных отношений, в исходные фрагменты реляционной структуры БД;
2) на основании разработанных алгоритмов манипулирования многомерными данными, разработка программной надстройки, в зависимости от используемой СУБД, обеспечивающей поддержку реляционно-ориентированной модели представления данных.
Преобразование схем МРН в исходные фрагменты реляционной структуры ИХ осуществляется в соответствии с положениями разработанной МПТД.
Для этой цели предлагается следующий набор правил.
1. Каждый TSi, отображается в совокупность {Кг0ДгЛ}, где , Яг0Дг- - совокупность реляционных отношений.
2. В состав я/1 входят отношения со схемой {КьАг0}, где Аг0 - статические атрибуты отношений.
3. В состав Я,- входят несколько многомерных отношений
А
Я- со схемой {К-, Б)}, в соответствии с количеством Б- (или количеством групп синхронизации).
В состав каждого из Я- входят ключевые атрибуты Т -атрибуты времени ("Дата" "Время" или только "Дата" в зависимости от характера изменения группы динамических атрибутов), динамические атрибуты.
На основе полученных результатов по формированию ма-нипуляционной, целостной частей модели ПТД и разработанных алгоритмов манипулирования многомерными данными, производится программирование программной надстройки РСУБД реализующей МПТД. Разработка программной надстройки СУБД, реализующей МПТД, возможна в произвольной реляционной СУБД, так как требует от последней только поддержки операций реляционной алгебры.
В результате выполнения последнего этапа методики формируется реляционная схема ИХ, полностью определяющая логическую структуру ИХ.
Таким образом, рассмотренная методика является необходимым инструментарием для реализации ИХ АСУС в среде реляционных СУБД.
К настоящему времени сформулированы общие требо-
вания, которым должен отвечать набор показателей качества
БД: [5].
соответствие целевому назначению системы; возможность измерения;
достаточная полнота показателей, обеспечивающая оценку различных свойств системы;
высокая чувствительность к изменениям значений параметров системы и внешней среды; простота вычисления;
возможность приближенной оценки показателей по экспериментальным данным.
Исходя из условий функционирования АСУС и особенностей процесса проектирования ИХ и АСУС в целом, частными требованиями к набору показателей качества ИХ являются:
возможность определения предпочтительного варианта ИХ, при котором обеспечивается максимальная эффективность функционирования АСУС;
чувствительность к изменениям значений управляемых параметров, определяющих вариант построения ИХ;
полнота оценки свойств, характерных для ИХ АСУС. Для обоснованного выбора состава показателей качества, необходимо выделить свойства, присущие ИХ АСУС.
В настоящее время не существует формальных подходов к формированию показателей качества БД и отсутствует единое мнение по составу свойств, по которым можно оценить качество БД различных АСУ, в том числе и АСУС. В большинстве работ основными свойствами БД считаются ее целостность и объем, а при оценке по показателям определяющим соответствие варианта построения БД требованиям АСУС, используются показатели оперативности обработки запросов.
Рассмотрим информационную подсистему АСУС с позиций системного анализа и теории динамических систем. Основные положения этого подхода заключаются в следующем.
Пусть имеется система G (для АСУС, например, таковой является система связи), которая характеризуется в текущий к-й момент вектором состояния хк={хгк}.
АСУС управляет системой в, вырабатывая последовательность управляющих воздействий и = {иь и2, ..., ик} на состояние системы и выходные воздействия в ={§1, §2, ..., §к}, оказывающие влияние на окружающую среду.
Для АСУС, например, в качестве среды понимаются: физико-климатические факторы; преднамеренные воздействия противника; эксплуатационные отказы технических средств связи; поступающий в базу данных поток запросов и т.д.
Состояние среды на текущем временном шаге описывается вектором wk.
Со стороны среды на систему G оказывается входное воздействие ук.
Совокупность параметров 8к = {хк, wk, ук} является текущей ситуацией системы G и среды.
Имеющаяся в АСУС подсистема наблюдения за текущей ситуацией (в ее состав входят все возможные источники информации для баз данных АСУС: автоматические датчики информации, АРМ должностных лиц и т.д.) снимает отсчет параметров состояния системы в и среды 8к = {хкЛ, wkл, укл}, которые затем передаются в базу данных информационной подсистемы АСУС.
По запросу органа управления АСУС (должностных лиц и
HiS
RESEARCH
автоматизированных задач управления), иначе называемого в терминах теории динамических систем системой ситуационного управления (ССУ), из базы данных поступает информация 1к.
На основе поступившей информации Ik в ССУ вырабатывается решение dk. На основе решения dk вырабатывается реакция АСУС в виде {uk, gk}.
Под воздействием {uk} система G совершает последовательный переход из состояния xj в состояние xk. Каждое состояние xk характеризуется своим эффектом 3k, определяющим способность G функционировать по своему предназначению (иначе - степень достижения поставленной цели).
Методами теории оптимального управления можно построить оптимальный план U* = {uj*, u2*, ..., uk*}, при котором на k-м временном шаге система G переходит в состояние xk* и имеет максимальный эффект 3k*. Однако в реальности система переходит в xk , имея эффект 3k, меньший или равный
3k*.
Одной из причин, почему не вырабатывается оптимальное решение dk*, определяющее оптимальное воздействие uk*, является недостаточно высокое качество информации Ik хранящейся в БД, и соответственно поступающей из нее в ССУ
В свою очередь именно качество информации, поступающей по запросам из БД, является мерой качества самой базы данных как совокупности ее внешних свойств, существенных для вышестоящей системы, т.е. для АСУС.
Цель перехода от традиционных БД к ИХ АСУС, является повышения качества предоставляемой информации. Для выделения свойств, характеризующих качество, или эффективность построения, ИХ АСУС достаточно определить, какие свойства составляют содержание понятия качества информации.
В известном подходе предлагается рассматривать качество информации по трем основным свойствам: полноте, достоверности и оперативности.
Полнота информации - свойство, определяющее возможность выборки из базы данных необходимого для принятия оптимального решения количества информационных элементов.
Простейшим показателем этого свойства служит коэффициент полноты информации
Кп = Mj/M, (1)
где Mj - количество выбранных из базы данных факторов, характеризующих текущую ситуацию системы G и среды; М-необходимое для принятия оптимального решения количество факторов.
Не все факторы являются одинаково значимыми для принятия решения. Поэтому большую применимость имеет коэффициент полноты другого вида, учитывающий коэффициенты значимости // каждого /-го фактора
м.
а,
JV — г=1
Кп
(2)
2Х
/=1
Некоторые факторы можно выявить, только обработав данные за предыдущие временные срезы {8к_^, ..., 8к-1}, где L- глубина анализа, в этом и заключается достоинство ТБД, которые
предоставляют возможность для анализа накопленной исторической информации.
Для полной оценки необходимого количества факторов, которые характеризуют состояние системы и среды необходимо, во первых, хранить в ИХ наибольшее количество таких факторов, а во вторых вести учет статистики влияния каждого из факторов на текущую ситуацию.
Таким образом, можно сделать вывод о том, что коэффициент полноты будет зависеть от количества хранящихся в ИХ факторов влияющих на состояние системы и среды и от глубины ретроспективы хранимых данных.
Достоверность данных - свойство, определяющее точность хранимых и обрабатываемых в БД данных. Свойство достоверности рассматривается в двух аспектах: как ошибка оценивания контролируемой ситуации и как достоверность результатов обработки запросов к ИХ. [6].
Ошибки оценивания контролируемой ситуации вызываются тем, что оценки контролируемой ситуации 8кл = (хкл, ^к", укл} отличаются от истинных 8к = {хк, wk, ук}.
С точки зрения статистической теории оценивания точность оценки 8кЛ определяется объемом выборки п. При этом предполагается, что оценка состоятельна, т.е. 8кЛ ^8к по вероятности при увеличении п. Пусть оценка при этом является несмещенной, т.е. Е{8кЛ} = 8к, Ь {8кл} = 0, где Е{.} - оператор математического ожидания; Ь {8кл} - смещение оценки.
Тогда качество оценки оценивается степенью рассеивания значений оценки около истинной величины оцениваемого параметра. Наиболее распространенной мерой рассеяния является дисперсия оценки Б {8кЛ}. Следует отметить, что для несмещенных оценок их относительная эффективность определяется соотношением е = БтЫ / (пБ{ 8кЛ }) .
Таким образом, достоверность отображения контролируемой ситуации определяется точностью оценок ее параметров, которая, в свою очередь, зависит от объема исходных данных, используемых при построении этих оценок. Достоверность результатов обработки запросов к ИХ при абсолютно достоверных данных хранящихся в ИХ и отображающих контролируемую ситуацию, зависит от правильной формулировки запроса должностными лицами по организации связи, от ограничений накладываемых используемой СУБД и корректности организации логической структуры ИХ. Как уже отмечалось, в АСУС в настоящее время и в ближайшей перспективе используются реляционные СУБД, которые не в состоянии достоверно обработать произвольный темпоральный запрос к ИХ. Если полагать, что структура ИХ спроектирована правильно и темпоральный запрос сформулирован корректно, то достоверность обработки запроса будет зависеть от правильности работы алгоритмов манипулирования данными темпоральной надстройки над реляционной СУБД. Таким образом, свойство достоверность ИХ необходимо, в зависимости от целевого предназначения системы, оценивать параметром Кош.контрсит - коэффициент ошибки оценивания контролируемой ситуации К^^т^сит = LоJL (отношение числа данных, не совпадающих в пределах заданной точности с некоторым истинным значением (Ьош), к общему числу данных (Ь) МБД), или параметром Кошобр.,,апр - коэффициент ошибки обработки запросов Кошобр.,,апр= Ыош/Ы (отношение количества некорректно обработанных запросов к общему
числу запросов пользователя).
Оперативность обработки данных - свойство, определяющее способность обработать заданное количество информации, которое определяется запросом к базе данных, в требуемые временные сроки. Оперативность оценивается показателем -средним временем обработки запроса (4ср). [6].
Анализ составляющих среднего времени выполнения запросов tз.ср, позволяет сделать вывод о том, что это время складывается из совокупностей времени поиска требуемого блока данных на диске, времени считывания с диска, времени передачи в оперативную память, времени процессорной обработки данных в оперативной памяти и других. С большой степенью точности можно полагать, что tз.ср зависит от числа операций обмена между ВЗУ (диском) и оперативной памятью (ОП), осуществляемых в ходе выполнения запроса и определяемых структурными решениями по построению БД, а также от производительности ЭВМ, которая характеризуется временем считывания одного релевантного блока данных, объемом оперативной памяти и тактовой частотой процессора. При одном и том же числе операций обмена, увеличение производительности ЭВМ приведет соответственно к увеличению оперативности выполнения запросов к ИХ.
Перечисленные выше свойства ИХ относятся к свойствам целевого назначения эта группа свойств характеризует соответствие ИХ требованиям вышестоящей системы, в роли которой для ИХ выступает АСУС объединения. К данной группе следует отнести свойства ИХ, характеризующие состояние данных ИХ, при котором обеспечивается функционирование АСУС с определенным уровнем эффективности. Наряду со свойствами целевого назначения, ИХ обладают свойствами состава и структуры, технологическими и экономическими свойствами, в которые включены свойства, отражающие затраты на разработку и восстановление ИХ в случае наруше-
ния ее целостности, а также свойства, характеризующие ресурсоемкого ее использования.
Безопасность - свойство, определяющее способность информации сохраняться в ИХ в неизменном виде при наличии преднамеренных и непреднамеренных воздействий. Данное свойство оценивается показателем - вероятности несанкционированного доступа к данным в БД (Рнсд).
Таким образом, состав требований к показателям качества ИХ можно определить в виде, представленном в таб. 2.
Таким образом, удовлетворение предъявленных выше требований при проектировании ИХ даст возможность оценить эффективность построения ИХ относительно используемых в настоящее время традиционных реляционных БД АСУС объединения и рекомендовать использование ИХ при решении задач планирования и оперативного управления связью.
Литература
1. Постояннов А.В., Филиппов В.А., Щукин Б.А. Электронные хранилища информации и WEB-технологии. - 2007, 512 с.
2. Информационные технологии в науке и образовании. Учебное пособие. Часть 1. Теоретические основы. Под ред. И.Б. Саенко. - СПб.: ВАС, 2007.
3. Иванов А. Ю., Саенко И. Б. Основы построения и проектирования реляционных баз данных. - СПб.: ВАС, 1998. - 80 с.
4. Шатров М.В. Об оценке числа обменов с внешней па-мятью при поиске по файлам и связям в базе данных // Вопросы радиоэлектроники. Научно-технический сборник. Серия СУПР. - Вып. 3. - С. 67-74.
5. Иванов А. Ю., Обрезков А. И., Саенко И. Б. Разработка реляционных баз данных с помощью системы MicroSoft Access. Учебное пособие. - СПб., ВУС, 2006. - 120 с.
6. Волков П.И. и др. Построение критерия эффективности систем автоматизации управления. - Л.: ВАС, 1999. - 74с.
TO A QUESTION OF THE ORGANIZATION OF INFORMATION STORAGE WITH ANALYTICAL DATA HANDLING
Zakharchenko R., Military Academy of communications, constz@mail.ru
Myasnikova A., Branch of the North Caucasias Moscow technical university of communication and informatics, anna_zim-nyaya@mail.ru
Abstract
In the development and adoption of automated systems Control Module (ADR) solutions corresponding to the evolving situation onthe communication plays a fundamental role for the justification available to the person making the decision maker (DM) information and knowledge, which must satisfy the requirements of completeness, accuracy, adequacy, consistency. In the interests of developing adequate solutions are used as internal information resources, which are formed on the basis of reflection activities (functioning) object in documents, other types and methods of collection, processing, storage, and external to the object information resources, and global of media, etc.These circumstances make use of the currently available highly developed software and hardware tools and information technology to create a decision support system (DSS). Widespread and effective use of these funds at control communication at various levels becomes an
essential component for making informed decisions in ADR.In the early stages of creating ADR is required to establish order in the daily routine of processing (processing) data on what is currently directed towards the traditional data processing system (ODS).
Keywords: automated communication control systems, decision maker, information, decision support system, the data processing system.
References
1.Postoyannov A.V., Filippov V.A., Shchukin B.A. Electronic information storage and WEBTechnology, 2007. 512 p.
2. Information technologies in science and education. Textbook. Part 1. Theoretical Foundations / Ed. I.B. Saenko. St. Petersburg, 2007.
3. Ivanov A.Yu, Saenko I.B. Fundamentals of building and designing relational databases. St. Petersburg, 1998. 80 p.
4. Shatrov M.V.On the number of exchanges with foreign na myatyu when searching for files and links in the database / Questions electronics. Scientific and technical collection. SUPR Series. Issue. 3. Pp. 6774.
5. Ivanov A.Yu., Obrezkov A.I., Saenko I.B. Development of a relational database system using MicroSoft Access. Textbook. St. Petersburg, 2006. 120 p.
6. Volkov P.I .etc. Building efficiency criterion automation control systems. L., 1999. 74 p.