Научная статья на тему 'Модели данных для формирования банка геоинформации'

Модели данных для формирования банка геоинформации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
180
76
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Модели данных для формирования банка геоинформации»

УДК.528.94 М.В. Спесивцев СГГ А, Новосибирск

МОДЕЛИ ДАННЫХ ДЛЯ ФОРМИРОВАНИЯ БАНКА ГЕОИНФОРМАЦИИ

На современном этапе развития общества принятие эффективных управленческих решений невозможно без анализа информации, полученной из различных источников. Сбор, систематизация и оперативный анализ такой информации невозможны без внедрения современных компьютерных технологий. С развитием ГИС-технологий появились новые запросы, которые стали требовать все более оперативной информации. В связи с этим возникла потребность в электронно-цифровой информации, которая обладает гибкостью, оперативностью, способностью быстро обновляться, обрабатываться и храниться в понятном для компьютера виде.

Необходимым условием ведения любой деятельности, связанной с принятием решений по управлению территориями, планированием и прогнозным моделированием, является наличие банка информации о конкретном географическом пространстве, то есть банка геоинформации. Геоинформация разделяется на геометрическую и семантическую части. Геометрическая часть - это информация о визуальном представлении объекта геопространства в пространственно-временной координатной системе. Семантическая часть - это атрибутивное описание объекта геопространства. Таким образом, геоинформация - это упорядоченная пространственно координированная информация об объектах геопространства в цифровой компьютерно-воспринимаемой форме, предназначенная в качестве исходного материала для моделирования геопространства в интересах конкретного потребителя, использующего геоинформационные системы [3].

Банк геоинформации дает возможность свободы и легкости доступа к данным со стороны государственных и коммерческих организаций и простых граждан.

Банк геоинформации предлагается формировать на основе распределенных баз данных. Это можно обосновать возможностью его логического разбиения на тематические модели, которые будут создаваться и вестись различными инженерными службами, что позволит уменьшить вероятность потери информации вследствие программных и аппаратных сбоев, то есть повысится автономность информационных блоков, как составляющих банка данных; позволит эффективно использовать имеющееся оборудование; рационально загрузить вычислительную сеть и повысить доступность к данным.

На фазе логического проектирования баз данных возник вопрос о выборе модели БД и их СУБД. В настоящее время наиболее распространенны модели [2]:

- Иерархическая;

- Сетевая;

- Реляционная;

- Объектно-ориентированная;

- Объектно-компонентная.

Иерархическая БД состоит из упорядоченного набора деревьев, более точно, из упорядоченного набора нескольких экземпляров одного типа дерева. Тип дерева состоит из одного «корневого» типа записи и упорядоченного набора из нуля или более типов поддеревьев (каждое из которых является некоторым типом дерева). Тип дерева в целом представляет собой иерархически организованный набор типов записи (рис. 1) [1].

Здесь «Отдел» является предком для «Начальник» и «Сотрудники», а «Начальник» и «Сотрудники» - потомки «Отдел». Между типами записи поддерживаются связи.

База данных с такой схемой могла бы выглядеть следующим образом (рис. 1) [1].

Отдел

310

25 I 1250000

т

Начальник I Сотрудники

1 846 Иванов 33 | 34 Иванов | 100000

83 Сидоров 100010

Рис. 1. Пример иерархической БД

Все экземпляры данного типа потомка с общим экземпляром типа предка называются близнецами. Для БД определен полный порядок обхода -сверху-вниз, слева-направо.

Примерами типичных операторов манипулирования иерархически организованными данными могут быть следующие:

- Найти указанное дерево БД (например, отдел 310);

- Перейти от одного дерева к другому;

- Перейти от одной записи к другой внутри дерева (например, от отдела - к первому сотруднику);

- Перейти от одной записи к другой в порядке обхода иерархии;

- Вставить новую запись в указанную позицию;

- Удалить текущую запись.

Автоматически поддерживается целостность ссылок между предками и потомками. Основное правило: никакой потомок не может существовать без своего родителя. Аналогичное поддержание целостности по ссылкам между записями, не входящими в одну иерархию, не поддерживается.

Иерархические модели хорошо подходят для задач с явно выраженной иерархически соподчиненной структурой информации и запросов. Они обладают низким быстродействием, трудно модифицируемы, но эффективны с точки зрения организации машинной памяти.

Сетевой подход к организации данных является расширением иерархического. В иерархических структурах запись-потомок должна иметь в точности одного предка; в сетевой структуре данных потомок может иметь любое число предков [1].

В сетевых моделях каждая запись в каждом из узлов сети может быть связана с несколькими другими узлами; кроме данных, записи содержат в себе указатели, определяющие местоположение других записей, связанных с ними. Такие модели очень трудно редактировать, например, удалять и создавать записи, так как вместе с данными нужно редактировать и указатели. Подобные модели хорошо работают в случае решения сетевых, коммуникационных задач (рис. 2).

Тип связи определяется для двух типов записи: предка и потомка. Экземпляр типа связи состоит из одного экземпляра типа записи предка и упорядоченного набора экземпляров типа записи потомка.

В иерархической и сетевой моделях для поиска конкретной записи необходимо вначале определить путь поиска к записи, а затем просмотреть все записи, находящиеся на этом пути.

Реляционные базы данных завоевали самую широкую популярность. Они свободны от всех ограничений, связанных с организацией хранения данных и спецификой запоминающих устройств. Эти модели имеют табличную структуру, строки таблицы соответствуют одной записи сведений об объекте, а столбцы содержат однотипные характеристики всех объектов. Всевозможные способы индексации данных существенно сокращают время поиска и запроса к данным.

Реляционная модель данных позволяет разделить проблему управления пространственными данными на две части:

- Представление геометрии объектов, топология объектов;

- Работа с атрибутами объектов.

Основное преимущество данного метода хранения геоинформации состоит в следующем:

- Атрибуты и пространственная информация могут храниться в разных блоках банка данных;

- Атрибуты могут быть удалены, изменены без изменения пространственной базы данных;

- Атрибуты могут быть привязаны к пространственным единицам и представлены разными способами.

Одно из основных преимуществ реляционных баз данных - применение унифицированного языка запросов SQL.

В объектно-ориентированных базах данных отсутствует понятие таблиц и записей, вместо них выступают понятия класса и объекта класса. Любая сущность реального мира моделируется в виде объекта. Объекты характеризуются набором атрибутов (состояние объекта), которые определяют их текстовые, численные, графические, пространственные и иные размерности. Поведение объекта - набор методов, оперирующих над состоянием объектов. Объекты, имеющие одинаковый набор атрибутов, составляют класс объектов. Один и тот же объект не может принадлежать более одному классу [2].

Для создания ГИС, более тесно связанной с реальным миром, обеспечения самых широких возможностей для наращивания функциональности системы и ее настройки, в частности, поддержки собственных моделей данных со специфическими объектами, а также создания программного обеспечения более высокого качества - с точки зрения его использования и поддержки - за счет применения современных технологий разработки, целесообразно использовать объектно-компонентную модель. Это обусловлено тем, что на практике реализуется множество объектно-ориентированных принципов, общеприменимых при проектировании программного обеспечения.

Компонент - это двоичный программный код, который может использоваться повторно. Благодаря своей самодостаточности и автономности, компоненты являются строительными блоками, которые могут быть собраны в более крупные системы и способны обеспечить структурированную и безопасную работу системы. Поддерживается возможность наследования и полиморфизма.

Наследование - это возможность использовать существующий код в других компонентах.

Полиморфизм - некоторый процесс, при котором каждый объект имеет собственную реализацию для операций (создание, рисование, удаление и т. д.).

Объектно-компонентные структуры позволяют унифицировать хранение геометрии и атрибутики при отображении взаимосвязанных объектов. Огромный минус - отсутствие декларативного стандартного языка запросов, синхронизацией доступа и управлением транзакциями.

На основе перечисленных преимуществ и недостатков в каждой из моделей предлагается использовать комбинированный метод проектирования баз данных. Пространственный банк данных, в котором хранится информация о пространственной привязке объектов, следует проектировать на основе объектно-компонентного подхода, семантический банк, который

содержит атрибутивную информацию об объектах, - на основе реляционного подхода. В этом случае сохраняются основные преимущества каждой из моделей, а именно: хранение и гибкость оперирования сложными объектами (объектно-компонентная модель), использование структурированного языка запросов SQL (реляционная модель).

Каждая семантическая запись связывается с определенным для нее объектом через уникальный идентификатор, создаваемый автоматически вместе с объектом. Связь через идентификатор позволит привязать к объекту более одной записи через косвенную связь, создать сложную иерархию связей атрибутивных данных между собой с прямой или косвенной привязкой к объекту (рис. 3). Объектно-компонентный подход допускает существование объектов без атрибутивных данных, например, объектов, используемых в качестве условных знаков.

Таким образом, комбинированный метод позволяет исключить недостатки каждой из моделей и сохранить их преимущества.

Объект 1

Ло Улица Дом

1\ Алтайская 144

2 Калинина 80

Nr

Объект 2

ID Жильцы дома

r Иванов

1 Петров

1 Сидоров

Рис. 3. Пример сложной иерархии связей атрибутивной информации с прямой

и косвенной привязкой к объекту

Предлагаемый подход обеспечивает базовую структуру, обеспечивающую каждому пользователю возможность расширить собственную информационную модель, позволит гибко оперировать объектами моделируемого геопространства и наиболее близко отвечать основным коммерческим и не коммерческим целям и нуждам государственных и не государственных учреждений.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Глушаков С.В., Ломотько Д.В. Базы данных. - М., 2002. - 504 с.

2. Капралов Е.Г., Кошкарев А.В., Тикунов В.С. Основы геоинформатики. - М.: Издательский центр «Академия», 2004. - 352 с.

3. Карпик А.П. Методологические и технологические основы геоинформационного обеспечения территорий. - Новосибирск: СГГА, 2004. - 260 с.

© М.В. Спесивцев, 2005

i Надоели баннеры? Вы всегда можете отключить рекламу.