Научная статья на тему 'Оптимальная по времени обработки запросов ГИС'

Оптимальная по времени обработки запросов ГИС Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
161
49
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Андрющенко А. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оптимальная по времени обработки запросов ГИС»

у‘ = {Р,,Рг),{Р2 >Рз),-{Р,-2>Р,-,),{Р.Г-1 .Р, )} .

где ц(Р,) = д(Р2) =... = ч(Р,) = са.

Заключение

Предложенная в данной работе технология векторизации карт программно реализована на базе 1ВМ РС под операционной оболочкой МБ Проведены испытания. определена область применения

данной программы и доказана ее эффективность по сравнению с другими аналогичными программными пакетами. Ведутся исследования в области новых применений искусственного интеллекта в программных средствах ГИС.

ЛИТЕРАТУРА.

1. Дуда Р.. Харт, П. Распознавание образов и анализ сцен. М.: Мир. 1976.

2. Розенфелъд Р. Распознавание и обработка изображений с помощью вычислительных машин. М.: Мир. 1972.

УДК 519.85:528.9

А.А. Андрющенко ОПТИМАЛЬНАЯ ПО ВРЕМЕНИ ОБРАБОТКИ ЗАПРОСОВ ГИС

Введение

В большинстве простых СУБД не возникает проблем с оптимизацией по критерию времени запроса. так как такая задача может быть легко решена при помощи сортировки. Однако. в случае с базами данных. требующих поддержки более одного типа запросов. возникает проблема эффективности доступа к данным. К сожалению. такой механизм как индексирование. который применяется в большинстве СУБД. не является эффективным с точки зрения машинной реализации. а позволяет лишь решить проблему доступа в общем случае.

Известно. что одной из наиболее важных характеристик программ. работающих с большими объемами данных. является скорость их считывания с магнитных накопителей и устройств типа СО-ИОМ в оперативную память компьютера. При реализации процедур чтения данных следует учитывать особенности последовательного и произвольного доступа для используемого типа накопителя. В случае. если данные хранятся на СО-ИОМ. отношение времен произвольного и последовательного чтения блоков данных равного размера может составлять 10 раз. Это связано с особенностями аппаратной реализации накопителей данных.

Данная работа посвящена оптимизации такого подкласса СУБД. как ГИС. по времени запросов к данным. В ней предлагается классификация ГИС по способу хранения данных. оценивается эффективность некоторых способов и решается задача построения оптимальной структуры данных по критерию обработки запросов.

Способы хранения данных в ГИС

Под способом хранения данных в ГИС будем понимать набор значений некоторых характеристик. каждая из которых отражает один из аспектов представления данных.

Предварительно необходимо заметить. что данные всех ГИС имеют одну общую особенность. Данные каждой ГИС можно разделить на два набора: атрибутные и пространственные. Пространственные данные отражают географические особенности той или иной местности. атрибутные содержат семантическую информацию о географических объектах.

После анализа ряда зарубежных и отечественных ГИС определился следующий набор характеристик представления данных в ГИС:

а) Тип пространственных данных:

• растровый;

• векторный;

• смешанный.

б) Способ декомпозиции пространственных данных:

• по объектам;

• по слоям. состоящим из однотипных объектов.

в) Способ хранения атрибутных данных:

• совместно с пространственными данными для каждого объекта;

• в виде независимых баз данных произвольной структуры.

г) Тип индексирования данных:

• данные не индексируются;

• пространственное индексирование;

• атрибутное индексирование;

• смешанное индексирование.

Оптимальная структура данных по критерию обработки запросов

Способ хранения данных для конкретной ГИС определяется главным образом в зависимости от задач. которые она решает. Наиболее универсальные ГИС обладают следующим набором значений перечисленных выше характеристик:

а) тип пространственных данных: смешанный;

б) способ декомпозиции пространственных данных: по слоям. состоящим из однотипных объектов;

в) способ хранения атрибутных данных: в виде независимых баз данных произвольной структуры;

г) тип индексирования данных: смешанное индексирование.

Назовем такой способ хранения универсалъным. Он является наиболее гибким. Практически значение каждой характеристики в универ-салъном способе означает наибольший уровень декомпозиции данных. Это в свою очередь гарантирует наилучшие показатели по следующим основным критериям структур данных:

• простота построения набора данных;

• простота модификации данных;

• простота наращивания объема данных;

• время доступа к данным.

Поскольку декомпозиция по слоям предполагается самым универсалъным способом хранения. далее будем говорить о структуре данных слоя.

Для разработки оптимальной структуры данных по критерию обработки запросов будем исходить из оптимальных схем выполнения самих запросов. В случае с ГИС выделяются три основных типа запросов:

• пространственный запрос (приоритет 0. высший);

• атрибутный запрос (приоритет 1);

• запрос идентификации (приоритет 2. низший).

Пространственный запрос к данным производится при необходимости вывода пространственной информации на дисплей или принтер. Атрибутный запрос — при необходимости предоставления некоторой выборки из атрибутной базы данных. Запрос идентификации — при необходимости одновременного получения пространственной и атрибутной информации по некоторому объекту.

И пространственные. и атрибутные данные имеют схожую структуру — набор записей. каждая из которых соответствует географическому объекту. Исходя из этого. самую простую (и оптимальную в смысле выполнения запросов) структуру данных можно представить следующим образом (рис. 1).

Рис 1

Однако в случае больших баз данных такая структура может не обеспечить быстрой работы запросов. Чтобы избежать этого недостатка, применим дополнительную декомпозиция баз данных. Для этого определим пару хэш-функций. Одну — на множестве пространственных данных, вторую — на множестве атрибутных данных. Выбор оптимальной функции представляется отдельной задачей, поэтому в нашу структуру введем два черных ящика — “Spatial hash” и “attribute hash”, на вход которых будет поступать исходный запрос, а на выходе будет значение хэш-функции. Каждому такому значению будет соответствовать также некоторое подмножество записей исходных баз данных. Для доступа к этом подмножествам (блокам) понадобится два дополнительных индекса — индекс пространственных блоков и индекс атрибутных блоков.

Введя хэш-функцию и пропустив через нее исходные базы данных, получаем новые индексированные базы, причем порядок записей в них будет отличаться от исходных. Для того, чтобы не разрушить связь, которая существует между каждой атрибутной и пространственной запи-

сью. необходимо ввести дополнительный индекс соответствия (“ге1^ех”) для одной из двух баз данных. Здесь возникает проблема выбора базы данных. которая должна будет работать через “ге1^ех”. Выберем для этого атрибутную базу. поскольку приоритет атрибутного запроса ниже пространственного.

После предложенных выше модификаций структура данных будет иметь вид представленный на рис. 2.

Рис. 2.

Эта структура данных обладает более высокой скоростью обработки запросов для больших объемов данных по сравнению с первым вариантом. а также сохраняет свойство оптимальности. поскольку также базируется на оптимальных схемах выполнения запросов.

Заметим также. что при подборе хэш-функций необходимо исходить из семантики состава самих запросов. Правильный подбор хэш-функций позволяет значительно ускорить работу всей СУБД.

УДК 519.85

С.Л. Беляков

ПРЕДСТАВЛЕНИЕ СЛОЖНОЙ ГЕОГРАФИЧЕСКОЙ КАРТЫ В ИНФОРМАЦИОННОЙ СИСТЕМЕ

Электронные географические карты (ЭГК) находят все более широкое применение в системах информационно-поискового назначения. диспетчирования. моделирования. навигации. мониторинга и многих других. Созданы мощные геоинформационные системы (ГИС) [1.2]. обладающие совершенным инструментарием для построения карт и наполнением их разнородной информацией. Как показывает практика. ЭГК представляют собой сложные объекты. обработка которых как единого целого затруднительна. Типичной является ситуация. когда получение картографической информации пользователем в сети ЭВМ требует передать несколько десятков мегабайт данных и выполнить на сетевой станции обработку сотен

i Надоели баннеры? Вы всегда можете отключить рекламу.