Научная статья на тему 'Применение технологии OLAP для построения тематических карт'

Применение технологии OLAP для построения тематических карт Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
249
71
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНОЛОГИЯ OLAP / ТЕМАТИЧЕСКАЯ КАРТА / ГЕОГРАФИЧЕСКАЯ ИНФОРМАЦИОННАЯ СИСТЕМА / КАРТОГРАФИЧЕСКАЯ ПРИВЯЗКА МНОГОМЕРНЫХ ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Евсюков Александр Анатольевич

Статья посвящена интеграции программных инструментов технологии оперативной аналитической обработки данных OLAP и географических информационных систем. Предлагается использовать операции над многомерными данными технологии OLAP в качестве инструмента формирования аналитических запросов для построения тематических карт в ГИС.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение технологии OLAP для построения тематических карт»

Евсюков А.А.

Институт вычислительного моделирования СО РАН (ИВМ СО РАН), старший научный сотрудник, alev@icm.krasn.ru

Применение технологии OLAP для построения тематических карт

КЛЮЧЕВЫЕ СЛОВА:

Технология OLAP, тематическая карта, географическая информационная система, картографическая привязка многомерных данных.

АННОТАЦИЯ:

Статья посвящена интеграции программных инструментов технологии оперативной аналитической обработки данных OLAP и географических информационных систем. Предлагается использовать операции над многомерными данными технологии OLAP в качестве инструмента формирования аналитических запросов для построения тематических карт в ГИС.

Технология географических информационных систем (ГИС) является неотъемлемой составляющей современных информационно-аналитических систем. Применение ГИС в сочетании со средствами оперативной аналитической обработки данных OLAP (On-Line Analytical Processing), экспертными системами и другими информационными технологиями требует развития новых программных средств. Предназначенные для решения задач в своих областях, такие программные средства не рассчитаны на тесное взаимодействие. Различие в пользовательских интерфейсах, методах хранения данных и прочие факторы затрудняют работу пользователя.

Целью данной работы является разработка алгоритмических средств, обеспечивающих единую среду и общее управление оперативной обработкой данных OLAP [1] с возможностью их отображения и интерпретации в ГИС. На основе интеграции OLAP и ГИС предлагается реализация технологии оперативного географического моделирования. Требование оперативности предполагает получение информации по территориально ориентированным задачам в реальном времени.

Интеграция ГИС и OLAP-системы [2] способствует повышению наглядности представления результатов аналитической обработки данных, сочетая ее с геомоделированием. Возможности динамической связи картографических объектов с многомерными данными существенно расширяют функциональность как OLAP-системы, так и встроенной в

систему ГИС. В результате интеграции OLAP-система приобретает дополнительные возможности наглядного представления многомерных данных, ГИС - мощный блок управления данными на основе OLAP с развитым инструментарием по формированию аналитических запросов.

Интерактивный картографический инструментарий

Рассмотрим механизм отображения данных OLAP-анализа на карте. В основе механизма динамической связи карты и гиперкуба данных OLAP-системы лежит картографическая привязка данных, устанавливающая соответствие между территориальными объектами карты и одним из измерений гиперкуба - географическим измерением. Привязка географического измерения осуществляется к одному или нескольким картографическим слоям. Чтобы значения показателя гиперкуба отобразить в виде тематической карты, необходимо построить легенду тех слоев, к объектам которых выполнена картографическая привязка. При построении легенды используются методы тематического картографирования, позволяющие объекты слоя разбить на классы на основе соответствующих значений анализируемого показателя.

В качестве интерактивных инструментов в программную реализацию средств геомоделирования добавлен блок управления многомерными данными. Блок управления включает в себя список аналитических показателей, доступных для построения тематических карт, а также фильтр многомерных данных. Применение фильтрации позволяет выполнять операцию среза гиперкуба данных с помощью фиксации значений любых измерений, кроме географического. Также для одного выбранного аналитиком измерения (например, времени) в панель инструментов ГИС добавлен выпадающий список его значений. При изменении анализируемого показателя или фиксации значений измерений происходит новое формирование тематической карты. Предусмотрена возможность сохранить для каждого показателя свою уникальную легенду отображения слоев.

При геомоделировании результатов OLAP-анализа помимо использования статических картографических слоев, предлагается использовать методы динамического формирования объектов слоя [3]. Такой вид слоев соответствует представлению на карте объектов, существование, местоположение и форма которых определяется в зависимости от данных, принятых из OLAP-системы. Для формирования новых слоев могут быть использованы таблицы агрегатов, содержащие агрегированные данные, прошедшие предварительную обработку. Это позволяет сформировать новый слой не только на основе собранных статистических данных, но и на основе аналитических результатов.

Для получения информации о сформированных картографических объектах предусмотрены информационные карточки. В карточках отображаются значения показателей, соответствующие данному объекту для фиксированных на данный момент измерений. Также в

информационные карточки добавлены ссылки для запуска расчетных методик. Набор доступных методик определяется аналитиком в зависимости от назначения конкретной модели.

Механизм картографической привязки многомерных данных Формально многомерный куб данных OLAP-системы может быть представлен в виде: G= <D,F> , где D={d 1 т} - множество осей

(измерений гиперкуба). Каждое измерение представляет собой упорядоченное множество значений определенного типа; F = {/ 12-- >!п} - совокупность множеств значений показателей, определяющих его информационное наполнение. В рамках представленной модели многомерных данных для определения значения показателя будем использовать функцию от т переменных, по числу измерений: X = X (Л1. Л2-, Лт ) .

Для осуществления картографической привязки в гиперкубе

выделим географическое измерение Л, значения которого совпадают с полем привязки картографического слоя, одного или нескольких. Выберем

Л А л А

измерение " для создания анимации. Значения измерения " заранее не фиксированы. Это позволяет отобразить анимацией динамику изменения

любого показателя в зависимости от значений лЛ .

Для построения тематической карты зафиксируем значения

измерений Л- : Л ф Л ф лЛ, ' =1 т и из F выберем показатель 1*, который

1* = ? * Л * Л ЛА Л * ) Л * Л * Л *

будет отображаться на карте: 7 7 ' " 2-•>">•••-" >•••" т), где 1 2"-"' т -

фиксированные значения измерений (метки), кроме Л и , которые не фиксированы и соответственно может принимать любое значение из своей области определения. Построение множества значений показателя 1 * определим как операцию среза над гиперкубом данных G по всем фиксированным измерениям.

Для отображения значений показателя 1 * построим электронную карту М =< L,8 >, где ь = А ьр} - множество картографических

слоев; 8 - упорядоченное множество значений свойств

отображения карты.

Слой Li определяется как L¡ =< 01, Т, А} (0г, Т), Р{ >, где

_ / 1 2 f¡ \

1 -(Ч'^'• ) - упорядоченное множество территориальных объектов

Т = (I1 I2 & )

заданного типа, 1 ¡'"'' ¡ у - упорядоченное множество атрибутивных свойств слоя - полей атрибутивной таблицы Аг, Аг (°, Т) - атрибутивная

Т

таблица, элементы которой ¡ определены значениями из набора 1 для каждого объекта из 01, здесь ^ =11 определяет строки таблицы, а к =1

- столбцы таблицы (поля), р <в>с > - легенда слоя, здесь в -

с=(с1 с 2 с

упорядоченное множество значении свойств слоя, * / -

упорядоченное множество классов разбиения множества объектов ° слоя А.

Привязка географического измерения 7 осуществляется к одному или нескольким картографическим слоям. Пусть ^ — ^ - подмножество

слоев, к которым осуществляется привязка, и мощность его _1. Каждый

л\ • _ у 1

слой содержит атрибутивную таблицу *,1 _ 1>1. В одном из полей таблицы

к*

к * Г1 1

I к * е [1>ё*1 хранится множество идентификаторов объектов слоя. Если

а1>к*1 д 7 у _ 1~7 0}

значение идентификатора * / , то к объекту * можно

построить картографическую привязку значения показателя ?*. Таким образом устанавливается соответствие между территориальными

объектами карты и географическим измерением гиперкуба 7.

Чтобы значения показателя ? * отобразить в виде тематической карты, необходимо построить легенду тех слоев ^— ^, к объектам которых

выполнена картографическая привязка. При построении легенды р =<в*>с' > используются методы тематического картографирования, позволяющие объекты 0* слоя разбить на классы С* на основе соответствующих значений анализируемого показателя ? *. Для того чтобы на карте различать объекты 0* разных классов из С*, для каждого класса задается ряд настроек отображения в*: цвет объектов, цвет контура и тип заливки объектов для площадного слоя, условное обозначение (символ) объектов для точечного слоя, состояние (видимые или скрытые).

В результате картографической привязки многомерных данных будет И = Г

построено тематических карт, каждая из которых является

отображением значений анализируемого показателя ? * из среза гиперкуба

данных по всем измерениям, кроме географического измерения 7. При этом каждой из Г построенных карт будет соответствовать свое значение

7 А л А ■ _ 1

измерения * е >1 _ >г. Картограммы могут отображаться через равные промежутки времени в режиме анимации, либо быть выбраны для просмотра пользователем.

На основе представленной выше модели построен алгоритм картографической привязки многомерных данных. Упрощенная блок-схема алгоритма приведена на рисунке 1. После выбора карты, перед выбором слоев для картографической привязки, добавлена возможность динамического формирования картографических слоев.

Рис. 1. Алгоритм картографической привязки многомерных данных

Если необходимость в динамическом формировании слоя в поставленной задаче существует, во множество слоев Ь карты М добавляется слой Ьа . При этом динамически можно сформировать не один,

а несколько новых слоев. Далее определяются слои, к которым будет осуществляться картографическая привязка данных. Выбирается анализируемый показатель.

Для всех территориальных объектов из слоев привязки происходит определение, каким образом данные объекты отображать на карте. Для этого строится отображение территориальных объектов записям атрибутивной таблицы из определенных полей привязки. Если элементу атрибутивной таблицы не соответствует ни одно из значений географического измерения, то территориальный объект не будет отображаться на тематической карте. Если территориальному объекту соответствует пустая мера гиперкуба данных, то объект визуализируется на карте с пометкой «нет данных». В обратном случае, по значению анализируемого показателя, соответствующего объекту, определяется класс, которому принадлежит объект. При визуализации на карте объект наследует свойства отображения данного класса.

Пример использования разработанного инструментария

Приведем пример интеграции инструментов OLAP и ГИС технологий на основе разработанных алгоритмических и программных средств. В качестве прикладной задачи рассмотрим обработку данных мониторинга химически опасных объектов (ХОО) с возможностью проведения расчетов масштабов техногенных аварий [4, 5]. Необходимо построить OLAP-модель оперативной обстановки на ХОО. Модель использует информацию из справочников ХОО, аварийно химически опасных веществ (АХОВ), содержания АХОВ на ХОО, перечня ОКАТО, списка метеостанций и данных измерений с метеостанций. Метеорологические данные используются для расчета химических аварий на ХОО. На основе установления связей между перечисленными таблицами идет построения гиперкуба данных. Измерениями гиперкуба являются: наименование и идентификатор ХОО, АХОВ (имеющееся на предприятии), метеостанция (находящаяся в одном населенном пункте с ХОО), дата измерения, код территории. Показатели построенного гиперкуба - это состояние ХОО, содержание АХОВ на ХОО, температура воздуха, направление и скорость ветра.

После построения OLAP-модели необходимо выполнить картографическую привязку многомерных данных. Привязка осуществляется к сохраненной карте, покрывающей собой всю сеть ХОО из справочника объектов. Сам слой ХОО является точечным, формируется динамически на основе текущего содержания одноименного справочника. Для формирования слоя используются географические координаты ХОО, хранящиеся в справочнике. Кроме организации пространственной данных на основе справочника формируется атрибутивная таблица слоя ХОО. Привязка значений гиперкуба к карте осуществляется на основе соответствия идентификаторов ХОО из одноименного измерения гиперкуба к полю идентификаторов ХОО сформированной атрибутивной таблицы.

КреЦенка

Направление ветра (азимут)

ЗАО «Назаровское», отделение П, шясокоыбннат «Ачинский»

Рассчитать по РД 32.04.233-90 Рассчитать по ТОКСИ

Скорость ветре, м/с рГ

Температура С

"инка

Масса вещества кг 1600

Данные для 14Д3.2013;

Температура, гр . _

СосновоеГОзе!

ветра, гр

Орловка

Малая Покровка

И Д | Температура

ИХоо

• /раи^тк^йлиьл/, 0 Температура-Ф

Ш Строения

Ц Районы

|

0 Вадоемы

ЩРекн

0 №М5А5ЮЫ{юлл |Х] Кварталы

ЕЭ Населенные пункт

I "I

0 ОШЕСТ_ ТУРЕ ¡к о Ц Дороги

0 ОШСТ_ ТУРЕ (ко |Х] Населенные пункт 0 МРТУРЕ {мзссы} 0 Растительность

II

ЕВ ПШЕСТ_ ТУРЕ/к« |х] Точечные НП СФС Ш 0&€СТ_ ЛЕЕ/хл Н Субъекты СФО

I

Ш ОЕУЕСТ_ Г/ЕЕ/а»

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На рисунке 2 приведено картографическое представление результатов OLAP-моделирования. Динамически сформированный слой ХОО отображается в виде символьных значков, цвет которых зависит от текущего состояния объекта - одного из показателей построенной OLAP-модели. Красный цвет соответствует аварийному состоянию объекта, зеленый - нормальному состоянию. Серым цветом отображаются объекты, для которых нет данных (значений показателя) на текущую дату. Предусмотрена возможность переключения текущей даты (являющейся измерением гиперкуба) и выбора показателя, для чего в навигационной панели инструментов добавлены выпадающие списки значений.

Для обзора значений показателей, соответствующих конкретным объектам введена информационная карточка объектов. Карточка отображаются в случае наведения курсором мыши на точечный объект динамически сформированного слоя. В информационной карточке пользователь может узнать информацию о значениях по всем показателям, соответствующих ХОО для выбранной даты. На рисунке 2 приведена информационная карточка для Ачинского мясокомбината.

О Й а а Ф Ча * в # ^ 55 11:118034,59 Т] ^ ф <3 О О № 1$,

j-J| 14.03.2013

3]Х: 90°32'59", Y: 5б°18'18"

Оценка последствий химических аварий Н

Рис. 2. Гидрологическая обстановка на территории Красноярского края

В информационную карточку объекта добавлены пункты выбора методики, с помощью которой можно произвести расчет результатов химической аварии. После выбора методики загружается отдельная форма с полями входных данных для дальнейшего расчета. По умолчанию значения формы заполняются текущими значениями показателей (такими как масса АХОВ и метеоданные), переданных OLAP-модели. При этом пользователь может изменить полученные значения. На рисунке 2 можно

увидеть форму «оценки последствий химических аварий», где входные данные для расчета заполнены на основе данных информационной карточки ХОО.

После выполнения расчета происходит динамическое формирование нового картографического слоя, соответствующего рассчитанной зоне заражения. Масштабный коэффициент карты пересчитывается, так чтобы были видны новый слой и окружающие его окрестности. Автоматически происходит формирование списка объектов, хотя бы частично попавших в зону заражения.

Заключение

Интеграция ГИС и OLAP-системы способствует повышению наглядности представления результатов аналитической обработки данных, сочетая ее с геомоделированием. Возможности динамической связи картографических объектов с многомерными данными существенно расширяют функциональность как OLAP-системы, так и встроенной в систему ГИС. В результате интеграции OLAP-система приобретает дополнительные возможности наглядного представления многомерных данных, ГИС-инструментарий формирования аналитических запросов для построения тематических карт.

Литература

1. Codd, E.F. Providing OLAP. On-line Analytical Processing to User-Analists: An IT Mandate / E.F. Codd, S.B. Codd. - C. T. Salley, E. F. Codd & Associates, 1993.

2. Ноженкова, Л.Ф., Евсюков А.А., Ноженков А.И. Методы управления и геоинформационного моделирования в технологии OLAP // Journal of Siberian Federal University. Engineering & Technologies 1 (2009 2), 49-58.

3. Евсюков, А.А. Динамическое формирование картографических слоев в информационно-аналитических системах / А.А. Евсюков // Вестник Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнева. №1. - Красноярск: 2011. - С. 15-20.

4. Korobko A.V., Penkova, T.G., Nicheporchuk VV., Minaev A.S. The integral OLAP-model of the emergency risk estimation in case of Krasnoyarsk region // Proc. 36th In-ternational Convention. The conference «Business Intelligence Systems (miproBIS)», 2013. - pp. 1456-1461.

5. Евсюков, А.А. Использование средств оперативного геомоделирования для мониторинга ЧС на территории Сибирского федерального округа / А.А. Евсюков, В.В. Ничепорчук, А.А. Марков // ГЕО-Сибирь-2010. Т. 1. Геодезия, геоинформатика, картография, маркшейдерия. Ч. 3 : сб. матер IV Междунар. научн. конгресса «ГЕО-Сибирь-2010», 19-29 апреля 2010 г., Новосибирск. - Новосибирск : СГГА, 2010. С. 132-137.

i Надоели баннеры? Вы всегда можете отключить рекламу.