Научная статья на тему 'ИНФОРМАЦИОННО ОРИЕНТИРОВАННАЯ ТЕХНОЛОГИЯ СОЗДАНИЯ АДАПТИВНЫХ АВТОМАТИЗИРОВАННЫХ СИСТЕМ'

ИНФОРМАЦИОННО ОРИЕНТИРОВАННАЯ ТЕХНОЛОГИЯ СОЗДАНИЯ АДАПТИВНЫХ АВТОМАТИЗИРОВАННЫХ СИСТЕМ Текст научной статьи по специальности «Компьютерные и информационные науки»

18
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЗАЦИЯ / АДАПТИВНЫЕ СИСТЕМЫ / ИНФОРМАЦИОННАЯ МОДЕЛЬ / ИЕРАРХИЧЕСКИЕ СТРУКТУРЫ / ЯЗЫК ЗАПРОСОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Чернышев Г.В.

Предлагаются решения, ориентированные на создание прототипов адаптивных автоматизированных систем и учитывающие возможность изменений в предметных областях. Сформулированы принципы построения таких систем и дано описание некоторых механизмов их реализации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Чернышев Г.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «ИНФОРМАЦИОННО ОРИЕНТИРОВАННАЯ ТЕХНОЛОГИЯ СОЗДАНИЯ АДАПТИВНЫХ АВТОМАТИЗИРОВАННЫХ СИСТЕМ»

Известия Кабардино-Балкарского научного центра РАН № 4 (48) 2012

ИНФОРМАТИКА. НАНОТЕХНОЛОГИИ

УДК 004.043:64.011.56

ИНФОРМАЦИОННО ОРИЕНТИРОВАННАЯ ТЕХНОЛОГИЯ СОЗДАНИЯ АДАПТИВНЫХ АВТОМАТИЗИРОВАННЫХ СИСТЕМ

Г.В. ЧЕРНЫШЕВ

ФГБУН Институт информатики и проблем регионального управления Кабардино-Балкарского научного центра РАН 360000, КБР, г. Нальчик, ул. И. Арманд, 37-а E-mail: iipru@r ambler. ru

Предлагаются решения, ориентированные на создание прототипов адаптивных автоматизированных систем и учитывающие возможность изменений в предметных областях. Сформулированы принципы построения таких систем и дано описание некоторых механизмов их реализации.

Ключевые слова: автоматизация, адаптивные системы, информационная модель, иерархические структуры, язык запросов.

1. Введение

Практика построения автоматизированных систем для предметных областей, относимых к большим и/или сложным или характеризующихся высокой динамикой состава и взаимосвязей объектов, обычно опирается на технологию разработки, суть которой заключается в следующем. Проводится тщательное исследование предметной области, строятся модели взаимосвязи и функционирования ее объектов, реализуются программные и информационные компоненты. Но при этом, как правило, еще до окончания разработки выясняется, что в предметной области произошли изменения, которые требуют внесения корректив в уже созданные компоненты. Дальнейшее функционирование автоматизированной системы обычно также связано с постоянным внесением в нее изменений, адекватных изменениям в предметной области.

В данной работе предлагаются решения, ориентированные на создание прототипов адаптивных автоматизированных систем, учитывающие возможность изменений в предметных областях. Термин "прототип" используется здесь в обычном смысле, как предварительная реализация создаваемой системы. Особенность состоит в том, что предварительная реализация для некоторых предметных областей может являться и рабочей версией автоматизированной системы (например, когда нет особых требований к производительности системы).

Также рассматриваются вопросы обеспечения максимально возможной независимости информации базы данных как обязательной компоненты большинства автоматизированных систем от логики их использования.

Целью работы является изложение принципов построения подобных систем и описание некоторых механизмов их реализации.

Обсуждение отмеченных аспектов построения автоматизированных систем будем проводить на примере конкретной предметной области - лесопожарной обстановки в части мониторинга и оперативного прогноза развития складывающейся обстановки.

Автоматизация мониторинга и оперативного прогноза чрезвычайных ситуаций, в том числе и в области лесопожарной обстановки, является актуальной задачей для территориальных образований различного уровня [1]. Однако она требует учета особенностей ис-

ходной информации, кодирования основных информационных составляющих и других информационных и программных аспектов, суть которых описана ниже.

2. Источники исходной информации

Основным источником оперативной (ежедневной) информации о лесопожарной обстановке является "Сводный отчет о действующих лесных пожарах", подготавливаемый Федеральным бюджетным учреждением "Центральная база авиационной охраны лесов" (ФБУ "Авиалесоохрана"). В отчете в разрезе федеральных округов и субъектов Российской Федерации приводятся группы показателей:

- число действующих и локализованных лесных пожаров;

- количество ликвидированных пожаров;

- площади, пройденные пожарами за день (учитываются площади, покрытые и не покрытые лесом);

- нарастающие итоги (по количеству очагов и площадей пожаров) с начала пожароопасного периода и другие.

Следует отметить следующие проблемы, возникающие при автоматизации обработки этой информации. За последнее десятилетие неоднократно изменялся формат отчета. Так, последнее изменение (2008 год) связано с предоставлением документов в файлах MS Excel. Помимо этого изменялись структура документа и состав показателей (в сторону их увеличения) лесопожарной обстановки.

При использовании кодификаторов в базах данных автоматизированных систем возникают трудности, связанные с автоматическим кодированием объектов административно-территориального деления России, т.к. в исходных документах приводятся их тестовые наименования, формат которых также изменялся. В дополнение к этому происходили изменения в самом административно-территориальном устройстве страны.

К тому же кодификаторы общеиспользуемой информации характеризуются неполнотой и неоднозначностью. Так, не существует официального кодификатора федеральных округов. Общероссийский классификатор административно-территориальных образований (ОКАТО) содержит код субъекта РФ, которые отличаются от кодов субъектов, используемых другими ведомствами.

В данной работе рассмотрим вариант построения прототипа автоматизированной системы данной проблемной области, опирающейся на исходную информацию от ФБУ " Авиалесоохрана".

3. Принципы построения автоматизированной системы

Создаваемая автоматизированная система для любой проблемной области должна базироваться на принципах, обеспечивающих прежде всего ее гибкость и расширяемость при внесении модификаций, связанных с изменениями в предметной области.

В 60-е годы XX века были сформулированы основополагающие принципы создания информационных систем: новых задач; системного подхода, первого руководителя, разумной типизации проектных решений, непрерывного развития системы, минимизации ввода-вывода информации.

В действующем ГОСТе РД 50-680-88 эти принципы были переформулированы и названы следующим образом: системности, развития (открытости), совместимости, стандартизации (унификации), эффективности. При разработке информационных систем необходимо придерживаться этих принципов. В то же время, учитывая изложенные выше особенности предметных областей (на примере лесопожарной обстановки), можно предложить дополнительные принципы построения информационной системы.

Прежде всего система должна строиться и расширяться с использованием принципа интерфейсной адаптации [2], обеспечивающего возможность получения систем желаемых конфигураций композицией необходимых составляющих, сопряжение которых осуществляется программами-переходниками. Идея состоит в том, чтобы получать желаемую конфигурацию системы не посредством переделки уже имеющихся модулей, а путем введения переходников, обладающих требуемыми свойствами. Здесь мы расширяем данный принцип, распространяя его и на информационную составляющую автоматизированной системы - базу данных. При требуемом изменении структуры базы данных можно вводить новые информационные составляющие, связывая их, при необходимости, с уже имеющимися структурными образованиями.

Принцип инструментальности [3] требует строить систему, состоящую из подсистем, таким образом, чтобы подсистемы можно было использовать не только в составе системы, но и самостоятельно. Примером может служить система запросов к базе данных, средства которой используются внутри системы для работы с метаданными, хранящимися в базе данных, могут использоваться в прикладных программах, написанных на разных языках программирования (по принципу интерфейсной адаптации), а также автономно без непосредственной связи со всей системой.

К базовым подсистемам, которые необходимы для любой предметной области, при этом можно отнести, например, следующие: ввод информации в базу данных из внешних источников; вывод информации из базы данных во внешние источники; расчетная подсистема, функционирующая на основе механизма событий; отображение информации в форме графиков; отображение информации в форме карт-схем.

Третья из перечисленных подсистем появляется в соответствии с принципом расширенной базы данных, согласно которому в базе данных описывается не только схема данных предметной области, но и схема метаданных, и схема, описывающая логику обработки информации предметной области. При этом поддержка всех схем должна осуществляться соответствующими (настраиваемыми) программными компонентами системы.

Рассмотрим использование принципа расширенной базы данных на примере разработки подсистемы отображения информации в форме графиков. Пусть для каждой территориальной единицы требуется формировать (и совместно отображать) графики, отражающие следующие ряды данных:

1) фактические данные по очагам и площадям пожаров с начала пожароопасного периода;

2) среднемноголетние данные (используя все годы наблюдений);

3) данные по году-аналогу;

4) данные за соответствующий период максимально пожароопасного года;

5) данные за соответствующий период минимально пожароопасного года.

Для того чтобы получить последние три ряда из вышеперечисленных, необходимо ранжировать имеющуюся информацию по годам. Для проведения ранжирования предлагается следующий подход:

- сначала рассчитываются среднемноголетние значения с формированием ряда усредненных ежедневных данных (очаги, площади) в условном году для каждой территории (в качестве среднего будем использовать среднеарифметическое значение);

- по каждому году и территории суммируются ежедневные отклонения показателей очередного года от среднемноголетних значений, результат запоминается в форме множества {(к, /к, 5к)}, где к - год, /к - сумма отклонений количества очагов пожаров в к -м

году, 5к - сумма отклонений количества очагов пожаров в к -м году;

- ранжирование производится сортировкой полученного множества по требуемому показателю ( ^ или Sk ).

Более подробно ранжирование годовых рядов будем проводить следующим образом. Пусть у*,у*,...,у*,---,у* - среднемноголетние значения (нарастающим итогом) какого-либо параметра лесопожарной обстановки. Через у\к),у^),...,у^),...,у^) обозначим значения данного параметра в k -м году. Ранг каждого года

rk

= Z (y* - y(k)),

тогда максимально пожароопасный год есть год с max rk, а минимально пожароопасный -

k

с min r .

kk

Если rc - ранг текущего года, тс, - ближайший ранг, меньший либо равный r, а тс,, -ближайший ранг, больший либо равный r, т.е. rc, < rc < rc„, то год-аналог определяется из выражения min (|rc - rc, |, |rc - rc„ |).

Таким образом, если в структурах используемой базы данных отразить приведенные особенности подготовки информации для графического отображения, а также разработать соответствующую интерпретирующую подсистему, то получим универсальное средство для построения подобных графиков.

Далее охарактеризуем информационную составляющую рассматриваемой автоматизированной системы согласно принципу расширенной базы данных.

4. Информационная модель лесопожарной обстановки

Информационную модель будем описывать иерархическими структурами [4], используя средства представления данных, реализованные в системах управления базами данных иерархического типа ИНЕС и НИКА [2,5]. Имеющиеся там типы данных можно разбить на три группы: простые (элементарные или терминальные), составные и указатели.

Простые типы представляют логически неделимые данные, к основным из них относятся: T (целый), TF (плавающий), TW (текст), TL (логический, предназначен для хранения произвольной совокупности битовых символов размером до 16 109 байт) и другие.

Основной составной тип данных - тип структуры. Логически тип структуры представляет тип некоторого объекта, а его составляющие - типы компонент (свойства, составные части) этого объекта. В число компонент структурного типа могут, в свою очередь, также входить структурные типы.

Тип структуры PS(T,T2,•••,Tik) представляет один элемент декартова произведения

T х T xL х T . Наличие в каждом множестве T пустого элемента ^ позволяет исполь-

i1 i2 k ij ij

зовать не полностью заполненные структуры.

Ситуация с совокупностью эквивалентных структур, расположенных на одном уровне и подчиненных общей вершине, позволяет ввести еще один составной тип - тип массива (структур). Формально тип массива PA определяется так:

PA(T,T ,...,T ) сT хT х-хT .

A i1 h' ik ' — i1 i2 ik

Приведенные типы позволяют компактно описывать сложные иерархические структуры. На рис. 1 приведен фрагмент структуры описания данных для автоматизированной системы мониторинга и оперативного прогноза лесопожарной обстановки.

=== Корень описания данных ===

ДОК_ЛЕСОХР: массив Док: структура дата: дата, ключ ТЕРРИТОРИЯ: массив

ТЕРРИТОРИИ: массив Т: структура

код: текст, ключ тип: текст наим: текст ВЫБОРКИ: массив

СРЕДНЕМНОГОЛЕТНИЕ : массив

РАНГ_ОЧАГИ: массив

РАНГ_ПЛОЩАДИ: массив

РАСЧЕТЫ: массив

ГРАФИКИ: массив

СХЕМЫ: массив

МЕТАДАННЫЕ: массив

Рис. 1. Структура описания базы данных

Поддерево вершины ДОК_ЛЕСОХР (вместе с подчиненными вершинами) отражает

структуру исходного документа о лесопожарной обстановке.

Поддерево вершины ТЕРРИТОРИИ содержит описания информационных рядов (в подчиненных вершинах ВЫБОРКИ и СРЕДНЕМНОГОЛЕТНИЕ ), используемых для формирования прогноза, построения графиков или формирования карт-схем по каждой территориальной единице.

Поддерево вершины РАСЧЕТЫ предназначено для описания логики необходимых вычислений и/или информационных преобразований. Поддеревья вершин ГРАФИКИ и СХЕМЫ содержат описания форматов графических изображений (шрифты, цвета, легенды, типы линий и областей и т.п.).

Поддерево вершины МЕТАДАННЫЕ описывает системные характеристики информационных элементов базы данных (структура кодов, шаблоны, префиксы и т.д.).

Как уже отмечалось, принцип расширенной базы данных подразумевает хранение в базе данных описания логики обработки информации предметной области. Рис. 2 содержит описание структуры данных для этой цели.

Автоматизация расчетов базируется на механизме событий. В системе определено множество событий, которые вызывают инициирование вычислений и/или преобразования информационных структур (одно из важнейших событий - запись в базу данных нового документа). Каждое событие имеет номер (вершина код в поддереве вершины РАСЧЕТЫ ).

Каждое событие может вызвать совокупность вычислений или преобразований (поддерево вершины ДЕЙСТВИЯ ). Для каждого подобного действия параметры для его испол-

нения (аргументы операций и их расположение в базе данных) описываются в поддереве вершины ПУТИ.

РАСЧЕТЫ : массив

Событие: структура код: текст, ключ ДЕЙСТВИЯ: массив

Действие: структура номер: целое, ключ описание: текст ПУТИ: массив

Путь : структура номер: текст, ключ префикс: текст ВЕРШИНЫ: массив

Вершина: структура имя: текст, ключ действие: текст аргумент: текст

Рис. 2. Обобщенная структура описания расчетов

Описания логики обработки информации представляют собой выражения языка запросов для баз данных иерархического типа.

Конструкция N . Ы2 X . X . Ыт обозначает путь в дереве от вершины с именем Ы1 (через вершину с именем Ы2 и т.д.) к вершине с именем Ыт. Символ "." обозначает спуск от одной вершины к другой. Вместо имен вершин можно использовать обозначения переменных, начинающиеся с символа "#". Тогда при спуске эти переменные либо должны иметь значения, связанные с именами вершин, либо получат значения, связанные с вершинами, через которые они проходят. В последнем случае переменные могут снабжаться фильтрами, регулирующими перебор вершин на соответствующем уровне, в форме # pi | {фильтр,К , фильтр} (для множественного фильтра) либо в форме #pi | фильтр (для одиночного фильтра).

Для спуска по составному пути в дереве с автоматическим перебором вершин на уровне элементов массивов служит конструкция

#р4,К,#р е N X . # р X . # Рк X . Ыт ,

где # pi - значение имени вершины (возможно, с фильтром), а множество имен, указанных слева от е , является подмножеством множества имен, встречающихся в составном пути, т. е.

{# р4,К,# д } £ {# д,К,# Рк }.

Символ е здесь играет двойную роль: во-первых, он указывает, что перед переменными # р^ ,К ,# рi подразумевается присутствие квантора всеобщности (его можно указать

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и явным образом), во-вторых, при переборе вершин, задаваемых переменными #р1,К ,#рк, каждая из переменных #р^ ,К ,#рi получает соответствующее значение.

Использовать эти значения можно в выражениях, отделенных от приведенной конструкции знаком ":".

Например, для расчета среднемноголетних значений следующий фрагмент "(#й |<= @ёа^["дд.мм"], #^ е ДОК_ЛЕСОХР .#й. ТЕРРИТОРИЯ .#t. ПОЖАРЫ .

{# f е итог_очаги, #^е итог_площ} :

ТЕРРИТОРИИ . #t. СРЕДНЕМНОГОЛЕТНИЕ . #d.

{очаги =+ #f, площади =+ #за_годы_оч =+ 1, за_годы_пл =+1} описывает перебор всех исходных документов, имеющих дату (обозначенную переменной #d ), не превосходящую текущую (шаблон ["дд.мм"] для функции текущей даты @ date указывает на игнорирование номера года), далее перебор всех подчиненных территориальных единиц (# t ) с выборкой в переменные # f и # 5 необходимых параметров лесо-пожарной обстановки. После знака " : " описано использование задействованных переменных: спуск в поддерево ТЕРРИТОРИИ (с другой подчиненностью территориальных единиц и дат) и корректировка вершин очаги, площади, за_годы_оч, и за_годы_пл в

данной точке базы данных. Введя обозначения

ter(#d,#t) ° ДОК_ЛЕСОХР .#d. ТЕРРИТОРИЯ .#t. ПОЖАРЫ, mean(#t, #d) ° ТЕРРИТОРИИ .#t. СРЕДНЕМНОГОЛЕТНИЕ .#d, а также <~, вместо символа е получим более компактную эквивалентную запись # d,# t <~ ter (<= @ date, _) .{# f <~ итог_очаги,# 5 <~ итог_площ} :

mean(#t, #d).{очаги =+ # f, площади =+ #5, за_годы_оч =+1, за_годы_пл =+ 1} Полученная запись располагается в поддереве вершины РАСЧЕТЫ (рис. 2): под вершиной ДЕЙСТВИЯ будут располагаться два экземпляра массива ПУТИ (выражения для ter (# d, # t ) и mean(# t,# d )), а действия для каждой вершины будут содержаться в поддереве ВЕРШИНЫ.

5. Вопросы реализации Как видно из описания примера расчета среднемноголетних значений (п.4), пути в дереве хорошо представляются функциональными выражениями (например, введенные обозначения ter (# d, # t ) и mean(# t,# d ) по форме являются функциями). Поэтому вполне естественно программную реализацию автоматизированной системы базировать на каком-либо подходящем языке функционального программирования со строгой типизацией.

При значительном количестве выходного графического материала, отражающего анализ предметной области и прогнозные тенденции ее развития, соответствующую информацию для удобства использования целесообразно оформлять во внешних файлах в требуемом формате (изображения в графических форматах, слайды в формате MS PowerPoint и т.п.). Эту возможность можно легко реализовать с помощью базовой подсистемы вывода информации из базы данных во внешние источники (п. 3), описывая необходимые преобразования данных опять-таки в поддереве вершины РАСЧЕТЫ .

Для всех отмеченных моментов по реализации автоматизированной системы ключевую роль играет система запросов, которая сама должна быть построена с использованием вышеперечисленных принципов (п. 3).

Важность системы и языка запросов связана с тем, что запросы к базе данных имеют двойственную природу [2]. С одной стороны, они базируются на схеме базы данных и поэтому обладают свойствами этой схемы, а с другой стороны, запрос является алгоритмом описания действий над базой данных. Поэтому в части считывания-записи данных и их обработки можно сказать, что запрос - это подсхема базы данных, наделенная чертами программы.

Еще одна возможность запроса - создание и модификация самой схемы данных. В связи с этим для упрощения использования при реализации необходимо придерживаться ти-

пизации возможных запросов, предназначенных для создания в базе данных новых или изменения существующих информационных объектов; выборки данных из базы данных; добавления новых данных; внутренних преобразований в базе данных; удаления данных.

6. Выводы

В данной работе описан подход к созданию информационных систем, базирующихся на автоматизации процессов из предметных областей, характеризующихся высокой динамикой внутренних изменений. Автоматизация реализуется за счет информационного описания не только объектов и связей между ними, но и процедур обработки данных для этих объектов.

Предложены принципы (интерфейсной адаптации, инструментальности, расширенной базы данных) построения подобных систем, позволяющие обеспечить гибкую и оперативную настройку информационной системы при изменениях в предметной области силами самих пользователей.

Основные информационные аспекты предлагаемого подхода продемонстрированы для задач мониторинга и прогнозирования в предметной области, связанной с лесопожарной обстановкой.

ЛИТЕРАТУРА

1. Чернышев Г.В. О функционировании системы мониторинга и прогнозирования чрезвычайных ситуаций // Межгосударственный научно-практический журнал "Пожарное и спасательное дело", 2009. № 5. С. 31-33.

2. ЕмельяновН.Е. Введение в СУБД ИНЕС. М.: Наука, 1988. 256 с.

3. Арлазаров В.Л. СУБД как инструментальная система. М.: ВНИИСИ АН СССР, 1985. 32 с.

4. Чернышев Г.В. Алгебраические аспекты информационного моделирования иерархических структур // Доклады Адыгской (Черкесской) Международной академии наук, 2007. Т. 9. № 1. С. 176-178.

5. Годунов А.Н, Емельянов Н.Е., Космынин А.Н., Солдатов В.А. Система НИКА / Системы управления базами данных и знаний. - М.: Финансы и статистика, 1991. С. 209-248.

INFORMATION-ORIENTED TECHNOLOGY OF CREATION OF ADAPTIVE AUTOMATED SYSTEMS

G.V. CHERNYSHEV

Institute of Computer Science and Problems of Regional Management of KBSC of the Russian Academy of Sciences 360000, KBR, Nalchik, 37-a, I. Armand street E-mail: iipru@rambler.ru

Solutions for development prototypes of adaptive automation systems, considering the possibility of changes in the subject areas are offered. The principles of building such system are formulated and some of the mechanisms for their implementation are described.

Key words: automation, adaptive systems, informational model, hierarchical structure, queries language.

Работа поступила 15. 06. 2012 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.