Научная статья на тему 'Векторизация карт в ГИС'

Векторизация карт в ГИС Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1758
105
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Векторизация карт в ГИС»

РАЗДЕЛ VI МОДЕЛИРОВАНИЕ ГИС

УДК 519.85:528.9

А.А. Андрющенко

ВЕКТОРИЗАЦИЯ КАРТ В ГИС

1. Введение

Данная работа посвящена исследованию в области технологии векторизации картографических изображений для геоинформационных систем (ГИС). Проблема состоит в том, что накопленный за долгие годы банк бумажных карт невозможно использовать в ГИС без предварительной обработки и преобразования в ГИС-совместимый электронный формат хранения географических карт. Особенность такого преобразования заключается в принципиальном различии в структурах исходного и выходного форматов, что делает преобразование неоднозначным. Сканированные при помощи электронных сканеров карты представляют собой массивы точек изображения. То есть единственный примитив, составляющий такую карту, — точка изображения с ее интенсивностью. В то же время ГИС работают с картами, состоящими из примитивов более высокого порядка — географических объектов (точек, многоугольников, ломаных линий), обогащенных семантикой. Очевидно, необходимо выделение семантической информации, неявно представленной в исходном изображении карты. Данная работа предлагает технологию векторизации карт, построенную на использовании аппарата распознавания образов.

2. Представление данных

Дадим формальное определение растрового и векторного изображений.

Пусть х,у — координаты точки в декартовой системе координат; п, т — количество делений на координатных осях. Определим через

Рх,у точку растрового изображения, где х е X = {1,2,...п},у еУ = {1,2,...от}.

Зададим растровое изображение как множество точек Р = ,

Каждая точка изображения содержит два вида информации: о ее геометрическом положении и о цветовой характеристике. Геометрическое положение точки определяется ее положением в декартовой системе координат, а цвет — положением в трехмерном цветовом пространстве. В качестве базиса цветового пространства выберем 3 полуоси: красного, зеленого и синего направлений. Тогда точка изображения может быть представлена следующим образом:

х е X, у е У.

где г е Я = {1,2,...к},g е О = {1,2,...к},Ь е В = {1,2,...к},

к — число градаций цвета,

(х, у) е X х У.

Множества Я, О, В содержат возможные значения красной, зеленой и синей цветовых составляющих соответственно (значения на базисных цветовых полуосях), определяемых при дискретизации изображения. От мощности этих множеств зависит набор градаций яркостей и цветовых оттенков изображения.

Декартово произведение множеств X X У содержит возможные значения координат точек изображения в двух перпендикулярных осях соответственно. Мощности множеств X и У определяют размеры и разрешение изображения.

Для удобства обработки информации определим две функции на

множестве Р : д' Р — Я X О X В и 2\ Р —— X X У:

4( Р) = \г, ^ Ь — цветовая составляющая точки растрового изображения, где Р е Р, ^Г, g,Ь е Я X О X В ; г(р) = (х у)

— геометрическая составляющая точки растрового

изображения, где Р е Р, (х,у) е X X У.

На множестве X X У определим функцию расстояния между двумя точками в соответствии с метрикой абсолютного значения [1] (расстояние Хэмминга):

р(р\, р2) = \х2 - х\\ + |у2 - у\, причем (х1,у!) = г(р1),(х2,у2 = я(р2) .

Подобно тому, как растровое изображение состоит из точек, векторное изображение состоит из объектов различных типов. Тип объекта определяет его геометрическую форму. В случае с географическими картами выделяются 3 типа объектов:

1. Объекты точечного типа. Каждый объект определяется так же, как и точка растрового изображения:

8, Ь) Xх, у)

где \ґ,g,b) Є Я X О X В , \Х,у/ Є X X У и может обозначать точечные

гео-объекты.

2. Объекты типа ломаной линии. Каждый объект определяется как множество отрезков (задаваемых координатами их концов), составляющих ломаную линию.

^ { Рі, Рг)Х Рг, Рз),-{ Р/-2, Р/-),( Р/-і, Р/ )},

где Р1,Р2Р/ Є Р, ^(р1) = ц(р2) =...= Ц(Р/) , / — число точек излома и концевых точек. Гео-объекты данного типа могут являться, например, дорогами, реками.

3. Объекты типа многоугольника. Каждый объект определяется как множество отрезков (задаваемых координатами их концов), составляющих самонепересекающуюся замкнутую кривую:

V0 = {{Р^ Р^}^ Рз), • ■■( Р/ ^ Р/-\\{ Р/-\, Р/ )},

где РиР2,...Р/ е Р, ^Р^ = Ч(Рг) =••• = Ч(Р/) , Р\ = Р/ , /-1 — число

точек излома. Гео-объекты данного типа наиболее распространены.

Это любые регионы, покрывающие определенную площадь изображения.

Зададим векторное изображение как множество объектов

Р' = М и{г‘} и{г0 }•

3. Схема процесса векторизации

Самая общая схема процесса векторизации выглядит следующим образом:

• последовательно просматриваются все объекты на изображении;

• для каждого выделяемого объекта определяются его тип и специфичные его типу параметры;

• в зависимости от типа объекта выбираются и применяются алгоритмы выделения объекта из изображения, его идентификации, а затем векторизации.

Процесс повторяется, пока не будут выделены все объекты из исходного изображения.

Необходимо ввести следующие ограничения на параметры процесса:

1. Типы гео-объектов, которые представляют интерес с точки зрения распознавания. Всего 3 типа:

• точка (Ур );

/ I ч

• ломаная линия (V );

• многоугольник (V0).

2. Признаки, необходимые для идентификации типа объекта:

• площадь Б;

• характеристика полноты Я' Р0 — [0,1], где Р0 £ Р есть множество точек растра изображения, составляющих объект. Характеристика полноты говорит о степени вытянутости объекта.

3. Характеристика точечности для объекта /13' Р0 — [0,1]. Она задается в виде функции принадлежности и определяет степень того факта, что объект с площадью S принадлежит множеству объектов точечного

типа {Vе }. Вид функции принадлежности определяется экспертом.

4. Характеристика линейности для объекта ' Р° — [0,1]. Задается в виде функции принадлежности и определяет степень того факта, что объект с отношением полноты Я принадлежит множеству объектов типа ломаной линии {у7}. Вид функции принадлежности определяется экспертом.

Рис. 1. Алгоритм идентификации типа и параметров объект

5. Параметр, задающий максимальное расстояние между элементами линии dmax. Зависит от конкретной карты и определяется пользователем системы.

6. Признаки, необходимые для однозначной идентификации элемента линии:

• длина I;

• число изменений толщины к;

• множество изменений толщин W = {wi } , i £ I = {1,2,...к} ,

wi е[ W|ow, Wкi ] , где Wlow и Wкi — нижний и верхний пороги толщины

линии соответственно.

7. Возможные цвета точек объектов изображения.

Цвет объектов является ключевым признаком при их поиске и идентификации. В общем случае на изображении могут присутствовать

объекты разных цветов, количество которых определяется при дискретизации изображения. Однако анализ изображения производится по выделяемым цветовым слоям, состоящим из точек одного цвета. Поэтому алгоритм векторизации в конкретный момент времени работает только с этими точками. Все остальные цвета можно считать фоновыми. Обозначим цвет точек анализируемого слоя через со £ Я X в X В, а цвет фона

— через сь = Я X в X В \ с0.

8. Порог соглашения с экспертным решением Е. Представляет величину из диапазона [0,1]. Используется при принятии решения о типе идентифицируемого объекта. Величина порога варьируется пользователем системы.

Для процесса векторизации необходимы следующие процедуры:

Процедура поиска произвольного объекта в изображении. Определяется на множестве Р . Результат ее действия — нахождение некоторого элемента р множества Р, удовлетворяющего условию $(р) = Со .

Процедура выделения произвольного объекта из изображения. Определяется на множестве Р. Результат ее действия — выделение некоторого подмножества Ро £ Р , элементы которого удовлетворяют условию связной области [2].

Процедура идентификации типа и параметров объекта. Определяются на множестве Р. Результат их действия — идентификация типа и параметров объекта.

Полностью алгоритм идентификации типа и параметров объекта проиллюстрирован на рис. 1.

Площадь объекта определяется в процессе распространения волны в процедуре выделения произвольного объекта. Формально площадь объекта есть $ = |р° | .

Характеристика полноты определяется следующим образом. Вычисляется ограничивающий прямоугольник для объекта с координатами

верхнего левого угла (х1, у1) £ X X У и правого нижнего угла (х2, у2 £ X X У. Обозначим количество точек объекта в строке растра х

через Ькх, а в столбце у — через Ту. Сканируя объект по строкам и столбцам, получим некоторую величину

X 2 у2

V = X А + Х С,,

X=X1 у=у1

нормализовав которую, получим характеристику заполненности объектом ограничивающего квадрата — характеристику полноты объекта

Т°

1 =---------------------------2; 1: Р° ®[0,1].

2 * (тах( х2 - х1, у2 - у1))2 11

После того, как площадь и характеристика полноты вычислены, можно приступать к идентификации (см. рис 1.). Процесс каждого сравнения представляет подстановку сравниваемой величины (площади или характеристики полноты) в эталонную функцию принадлежности (харак-

теристику точечности или линейности). Результат представляет величину в диапазоне [0,1]. Если это значение превышает заранее заданный порог соглашения с экспертным решением Е, то принимается положительное решение.

Процедура поиска периода линии заключается в определении множества образующих его элементов. Если период линии состоит из более одного элемента, то необходимо указание его дополнительных элементов в интерактивном режиме. Период считается найденным, если обнаружено более одного элемента, признаки которых достаточно схожи (вероятность совпадения превышает порог соглашения с экспертным решением Е) для того, чтобы их можно было идентифицировать как элементы периода одной линии.

Процедура распознавания и выделения объектов. Определяется на множестве Р. Результат ее действия — сформированное множество

Р ' = {уР } и{у'} ир }.

Для объектов точечного типа и типа замкнутой кривой эти процедуры основаны на алгоритме выделения произвольного объекта из изображения и встроены в процесс идентификации типа объекта.

Для выделения точечного объекта необходимо вычислить центр

ограничивающего его прямоугольника рс Є Р°. Координаты центра можно считать векторными координатами объекта Ур = рс.

Для выделения ломаной линии применяется следующая процедура. В цикле последовательно просматриваются характеристики элементов периода линии. Таким образом в конкретный момент работы алгоритма выделения известны характеристики искомого элемента линии. Эти характеристики сравниваются с характеристиками всех объектов, находящихся на расстоянии і тах от центра элемента линии, найденного на предыдущем шаге. Если результат сравнения превышает порог соглашения с экспертным решением Е, то найденный объект добавляется к линии. При

проходе по элементам линии их центральные точки рс Є Р используются для формирования множества точек, представляющих линию в векторной форме РТ С Р°. Затем из элементов РТ = {Рі> Р2>-" Р/ } Формируется множество

Vі = {Рі.Рг)^Рг.Рз).-(р/-2.Р/-і).(р/-1.Р/)} ,

где яМ = q(P2) =... = Ч(р,) = с° .

Для выделения многоугольника необходимо выделить его контур. Все точки объекта, имеющие в ближайшем окружении менее 8 смежных точек, считаются принадлежащими его контуру. В процессе обхода этого контура составляется множество точек, определяющих границу объекта.

РТ £ Р° , РТ ={ рТ }, где X ч(р, р°° ) < 8 *, ] £{1,2,..., $},i ^ ] .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Далее из элементовРТ ={pl,^...р,},р, = р, формируя

множество

у‘ = {р„ р2 ),(р2 , л >,.••( р,-2, р,-1 ),(р,-, р,)}.

где Ч(р1) = Ч(р2) =... = Ч(р, ) = С° .

Заключение

Предложенная в данной работе технология векторизации карт программно реализована на базе 1ВМ РС под операционной оболочкой МБ Проведены испытания, определена область применения

данной программы и доказана ее эффективность по сравнению с другими аналогичными программными пакетами. Ведутся исследования в области новых применений искусственного интеллекта в программных средствах ГИС.

ЛИТЕРАТУРА.

1. Дуда Р., Харт, П. Распознавание образов и анализ сцен. М.: Мир, 1976.

2. Розенфельд Р. Распознавание и обработка изображений с помощью вычислительных машин. М.: Мир, 1972.

УДК 519.85:528.9

АА. Андрющенко ОПТИМАЛЬНАЯ ПО ВРЕМЕНИ ОБРАБОТКИ ЗАПРОСОВ ГИС

Введение

В большинстве простых СУБД не возникает проблем с оптимизацией по критерию времени запроса, так как такая задача может быть легко решена при помощи сортировки. Однако, в случае с базами данных, требующих поддержки более одного типа запросов, возникает проблема эффективности доступа к данным. К сожалению, такой механизм как индексирование, который применяется в большинстве СУБД, не является эффективным с точки зрения машинной реализации, а позволяет лишь решить проблему доступа в общем случае.

Известно, что одной из наиболее важных характеристик программ, работающих с большими объемами данных, является скорость их считывания с магнитных накопителей и устройств типа СО-ИОМ в оперативную память компьютера. При реализации процедур чтения данных следует учитывать особенности последовательного и произвольного доступа для используемого типа накопителя. В случае, если данные хранятся на СО-ИОМ, отношение времен произвольного и последовательного чтения блоков данных равного размера может составлять 10 раз. Это связано с особенностями аппаратной реализации накопителей данных.

Данная работа посвящена оптимизации такого подкласса СУБД, как ГИС, по времени запросов к данным. В ней предлагается классификация ГИС по способу хранения данных, оценивается эффективность некоторых способов и решается задача построения оптимальной структуры данных по критерию обработки запросов.

i Надоели баннеры? Вы всегда можете отключить рекламу.