Научная статья на тему 'Метод автоматического отождествления линий равных высот при создании цифровых карт местности на основе картометрического подхода'

Метод автоматического отождествления линий равных высот при создании цифровых карт местности на основе картометрического подхода Текст научной статьи по специальности «Математика»

CC BY
128
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Зикратов Игорь Алексеевич

Предложен метод, основанный на использовании критерия максимального правдоподобия, позволяющий осуществлять отождествление линий равных высот в процессе оцифровки картографического материала при наличии шумов сканирования. Рассмотрены критерии нахождения узловых точек для аппроксимации линий равных высот ортогональными полиномами и построения точек экстраполяции.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Зикратов Игорь Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Method of automatic identification of equal heights lines during creation of digital region's maps

The method based on use of maximal plausibility criterion is offered, allowing carrying out identification of equal heights lines during digitization of cartographical material with scanning noises, is offered. Criteria of central points finding for approximation of equal heights lines by orthogonal polynoms and creation of extrapolation points are considered.

Текст научной работы на тему «Метод автоматического отождествления линий равных высот при создании цифровых карт местности на основе картометрического подхода»

\ МОДЕЛИРОВАНИЕ СИСТЕМ И ПРОЦЕССОВ

УДК 681.518

МЕТОД АВТОМАТИЧЕСКОГО ОТОЖДЕСТВЛЕНИЯ ЛИНИЙ РАВНЫХ ВЫСОТ ПРИ СОЗДАНИИ ЦИФРОВЫХ КАРТ МЕСТНОСТИ НА ОСНОВЕ КАРТОМЕТРИЧЕСКОГО ПОДХОДА

И. А. Зикратов,

канд. техн. наук, доцент

Санкт-Петербургское высшее военное училище радиоэлектроники

Предложен метод, основанный на использовании критерия максимального правдоподобия, позволяющий осуществлять отождествление линий равных высот в процессе оцифровки картографического материала при наличии шумов сканирования. Рассмотрены критерии нахождения узловых точек для аппроксимации линий равных высот ортогональными полиномами и построения точек экстраполяции.

The method based on use of maximal plausibility criterion is offered, allowing carrying out identification of equal heights lines during digitization of cartographical material with scanning noises, is offered. Criteria of central points finding for approximation of equal heights lines by orthogonal polynoms and creation of extrapolation points are considered.

В настоящее время во многих отраслях деятельности человека нашли широкое применение географические информационные системы (ГИС), представляющие собой эффективное средство для анализа задач, в которых в качестве исходных данных используются данные о пространственном положении объектов земной поверхности (географические данные).

Для использования в ГИС географические данные преобразуются в цифровой формат, составляющий основу цифровых карт местности (ЦКМ). В настоящее время наиболее распространенным способом создания ЦКМ является так называемый картометрический подход, суть которого заключается в сканировании бумажного картографического материала и формировании цифровых данных, по содержанию и точности соответствующих исходным топографическим картам. Процесс преобразования данных с бумажных карт в компьютерные файлы называется оцифровкой. Достоинство такого подхода заключается в относительной простоте реализации, однако ему свойственны и некоторые недостатки, затрудняющие практическое использование ЦКМ.

Во-первых, при сканировании бумажной карты неизбежно проявление в той или иной степени

неточностей съема информации, заключающихся в образовании случайных разрывов сканируемых линий, или, наоборот, вводе лишних точек, т. е. появлении «шумов» сканирования. Это может приводить к ошибкам при построении профилей рельефа местности, когда сглаживаются существующие или отображаются несуществующие неровности (рис. 1).

Во-вторых, при устранении подобных «шумов» и технологических разрывов линий остается вы-

Сечения линий равных высот

Флуктуация профи.1Я рельефа местности, вызванная «шумовой» точкой сканирования

Истинный профиль рельефа местности

■ Рис. 1. Иллюстрация влияния «шумов» сканирования на формирование профиля рельефа местности

сокой доля ручного труда при оцифровке данных, что, с одной стороны, является предпосылкой появления ошибок оператора и, с другой стороны, обусловливает повышение себестоимости ЦКМ. Очевидно, что интенсивность «шумов» сканирования можно снизить путем использования качественной бумажной основы, сканеров с высокими характеристиками или совершенствованием программного обеспечения процесса оцифровки, реализующего алгоритмы фильтрации «шумов» сканирования.

Использование подобных алгоритмов позволит осуществить автоматическое распознавание по заданным критериям объектов оцифровки и создание цифровой базы географических данных, сгруппированных по тематическому признаку. При этом снижается степень ручного труда и уменьшается вероятность появления ошибок оператора.

Решение этой задачи может быть реализовано путем анализа графического файла, созданного при сканировании исходной топографической карты. Анализ заключается в последовательном переборе координат пикселей графического файла с определением стандартными библиотечными функциями цвета пикселя, присущего тому или иному объекту (линии равных высот - коричневый, дороги - черный и т. д.), и его взаимного положения по отношению к соседним точкам этого объекта. Такой функцией может, например, служить функция £еІРіхе1() библиотеки ОБ языка Рег1. Результатом координатного и цветового анализа пикселей будет принятие решения о принадлежность координатных точек к тому или иному объекту местности и заполнение соответствующих полей тематической базы данных (ТБД). Очевидно, что при этом должен осуществляться пересчет координатных точек в географическую систему координат.

Совокупность пикселей может образовывать как некие детерминированные фигуры (цифры, топографические знаки, символы, прямоугольники, окружности и т. д.), входящие в состав условных обозначений карты, так и нерегулярные объекты со случайной формой и координатами (линии равных высот, дороги, границы лесных массивов и т. д.).

В первом случае при анализе координатной информации массива пикселей целесообразно использовать методы распознавания образов, которые заключаются в отнесении имеющихся данных к определенному классу с помощью выделения существенных признаков, характеризующих эти данные, из общей массы несущественных деталей [1]. Наличие «шумов» сканирования дает основу для использования также статистических методов распознавания, которые представлены в работах ряда авторов, например [2, 3].

Рассмотрим более подробно формирование тематической базы данных для второго случая, когда необходимо устранить «шумы» сканирования

и технологические разрывы при обработке графических данных об объектах с произвольной формой, примером которых могут служить линии равных высот (ЛРВ).

В этом случае, учитывая, что ЛРВ на картах не пересекаются, запись в ТБД информации о текущей координате линии высоты а может осуществляться тогда, когда при изменении текущей координаты графического файла на один пиксель стандартная функция возвращает цвет предшествующего пикселя, что свидетельствует о продолжении ЛРВ в данном направлении. Если же соседние пиксели имеют другой цвет, то записи по данной ЛРВ прерываются. Ближайший найденный пиксель в этом случае может относиться как к линии высоты а, так и к смежной ЛРВ (рис. 2).

Таким образом, необходимо разработать алгоритм, позволяющий при последовательном анализе пикселей графического файла, относящихся к заданной ЛРВ, в случае обрыва этой линии принять решение, является ли найденная точка продолжением этого объекта. При этом обрыв линии может являться следствием «шума» (см. рис. 2) или технологическим разрывом, служащим для вставки условного знака карты (высоты ЛРВ и ДР-)-

Так как координаты разрывов и «шумовых» точек являются случайными, то разрабатываемый алгоритм должен быть основан на решении статистической задачи отождествления координатных точек. Так, на рис. 3 изображены две ЛРВ, имеющие технологические разрывы, которые служат для вставки значений высот, и «шумовая» точка. Точки разрыва обозначены по принадлежности к ЛРВ буквами и отождествляемые точки -Ох, 02,03. При последовательном анализе координат ЛРВ 1-3 для этого случая возможны следующие варианты соотнесения отождествляемых точек к точкам разрыва ЛРВ:

Дх ~ Ох, .Кх — О2> -Кх ~ 03,

#2 — Ох, Я2~02, -К2 ~ Оз.

У ▼ х0 х1 х2 Хд х4

■ Рис. 2. Пиксель (х1г у3) - точка разрыва ЛРВ, пиксели (х2, у і) и (х4, у3) - отождествляемые точки

5 10 Хщ 15 Хщ Х0[ Х0д Х0г 20 X

и Рис. 3. К постановке задачи отождествления

Логический анализ вариантов отождествления позволяет выявить и исключить из рассмотрения ложные пары отождествляемых точек, при которых происходит пересечение ЛРВ (/?!“ 03 и Я2— Ох), однако оставшиеся варианты отождествления требуют дополнительного анализа:

Я1-01 и^-02 (1 вариант),

-02 и Щ -03 (2 вариант).

Для решения этой задачи построим точки экстраполяции (ЭТ) функции /лрв1(х)> аппроксимирующей функцию ЛРВ 1, и / лрвгС*)» аппроксимирующей функцию ЛРВ 2. В рассматриваемой ситуации такими точками будут:

ЭТП - точка экстраполяции функции /лрв1 \хо1); ЭТ12- точка экстраполяции функции ^Рт \хо2) 5 ЭТ22-точка экстраполяции функции /*ЛРВ21 х0г );

ЭТ23-точка экстраполяции функции ^1РВ2 (^о3) • Тогда можно рассмотреть две альтернативные гипотезы отождествления:

гипотеза 01 и ЭТП относятся к ЛРВ 1,

аД2, О2 и ЭТ22 относятся к ЛРВ 2;

гипотеза Н2 - 02 и ЭТ12 относятся к ЛРВ 1,

а #2, 03 и ЭТ23 относятся к ЛРВ 2.

Результатом статистического отождествления ЛРВ является выбор одной из альтернативных гипотез. При этом возможны ошибочные решения, характеризующиеся некоторой стоимостью. В данной задаче нет оснований считать, что ошибочные решения имеют различные стоимости, поэтому в качестве критерия оптимального выбора

гипотезы может быть использован критерий максимального правдоподобия.

Функции правдоподобия, которые представляют собой совместную плотность вероятности координат точек разрыва и отождествления при условии их принадлежности к соответствующим ЛРВ, с учетом взаимонезависимости этих координат, будут иметь вид:

^Н1 = ^{хщ,Ущ /^ЭТц ’¿/этп )х

'Уох IхЭТП ’УэТп )х хУУ (хЛ2, ущ / *эт22»^эт22)х хТУ ( х0^, у0( / ^эт22 » ^эт22) ’ (1)

^Н2 = /*ЭТ12 ’^ЭТ12 ) Х

^( хо2 ,г/о2 / хэт12> У эт12)х

,Ущ /ХЭТ23 ’^ЭТ23 )х

хТУ (х0з, у0з / ^эт23»Уэт23) • (2)

В выражениях (1), (2) условия принадлежности отождествляемых точек к ЛРВ представляют отклонения их координат от соответствующих ЭТ. Действительно, вероятность принадлежности некоторой отождествляемой точки к ЭТ тем выше, чем меньше их взаимное удаление. Поэтому от условных плотностей вероятности можно перейти к

безусловным, зависящим от взаимного удаления координатных и экстраполяционных точек:

ЬН1 - ^г(АК'л1/іі)^(ДК'о1/іі)х хТУ ^ АК ^ / 22 ) ^ ( АКо2 / 22 )»

^Н2 “ /12)^(^-^02/12 )х

хТУ ( ДИд2/23) Ж (АИ0з /23),

где

Л; /Ч

Дії

О/ /У

Хя1 хэти ¡4

У к, ~Уэти

хоі ~хэти А*0у/,

Уоі “-Уэту АУо}/ц

(3)

(4)

(5)

(6)

Из выражений (З)-(б) следует, что условия принадлежности координатных точек Яь и Ог к ЛРВ представляют отклонения их координат от соответствующих ЭТ. Действительно, вероятность принадлежности координатной точки к ЭТ тем выше, чем меньше их взаимное удаление.

Отсюда можно сделать вывод, что алгоритм построения точек экстраполяции существенно определяет степень достоверности решения задачи отождествления. Для разработки такого алгоритма рассмотрим ЛРВ как некую функцию у = Дх), заданную таблично на дискретном множестве точек х0, х1у ..., хт. В данном случае относительно ЛРВ известны только дискретные значения этой функции, и чтобы вычислить другие ее значения за неким отрезком (а, Ь) узловых точек (точки экстраполяции), ее необходимо приблизить аппроксимирующей функцией /лРВМ^)'

Учитывая, что при наличии случайных ошибок в значениях функций, какие имеются при сканировании ЛРВ, предпочтительно применять «сглаживающую» аппроксимацию, которая малочувствительна к шумам, целесообразно воспользоваться представлением аппроксимирующих функций ортогональными многочленами вида [4]:

/лрв(^) = аоФо(х) + а1Ф1(л:) + ”- + апФп(х)’ (?)

где фА (х) - многочлены степени к, попарно ортогональные на заданном множестве точек, получаемые методом Грама - Шмидта, а коэффициенты ак определяются по формулам

----------------’ А = 0, 1, 2, ..., п; п<т.

I

і=о

В этом выражении У у представляют собой заданные положительные веса, которые в рассматриваемой задаче можно принять равными единице.

Отрезок (а,Ъ), на котором задаются п узловых точек, выбирается из следующих соображений. Линии равных высот представляют собой кривые со случайными отклонениями от некоторого среднего уровня. Корреляцию точек ЛРВ можно качественно описывать с помощью радиуса корреляции -характерного расстояния, на котором корреляционная функция существенно меняется. Так, для гауссовой корреляции таким расстоянием может быть разнесение координат, при котором корреляционная функция уменьшается в е раз. В работе [5] приведены и другие критерии для вычисления величины I случайного поля. В общем случае эта величина не является однозначно определенной -одной и той же корреляционной функции можно сопоставить несколько радиусов корреляции. Однако для одного и того же участка местности часть флуктуаций ЛРВ может отображаться либо не отображаться на карте в зависимости от картографического масштаба, что сужает возможный разброс величины I при дальнейшем анализе оцифрованного материала. В этом случае размеры отрезка (а, Ь) можно задавать исходя из величины радиуса корреляции ЛРВ.

Корреляционные функции ЛРВ 1 и ЛРВ 2 при условии стационарности /^(я) имеют вид

Ш1М (*)/!(*+<;!);

В'Л^'г) = + ^2)-

где ^ и Е,2 ~ величины сдвига между координатными точками соответствующих функций. Для рассматриваемого примера графики корреляционных функций представлены на рис. 4.

Из графиков видно, что смежные ЛРВ имеют схожие функции корреляции. Если радиус корреляции определять по уровню 0,5, то 1г = 3,72, а 12 = 4,09.

Щ)

1

0,5

0

-0,5

0 2 4 6 8 10 12 14 16

■ Рис. 4. Нормированные корреляционные функции ЛРВ 1 и ЛРВ 2:

______КФ ЛРВ 1;

...... КФЛРВ2

При определении /лРВ1,2(Х) по формуле (7) для снижения объема вычислений удобно задавать равноудаленные узловые точки, лежащие в пределах отрезков (а1,Ь1) для ЛРВ 1 и (а2,Ь2), где аг - хя. хц . Так, при пяти узловых точках

выражения для ортогональных многочленов (х) имеют сравнительно простой вид [4]:

1

!•£

~2~

Фа(0 =

К*2-2) ,

—(з5*4-155*2+72) 112' '

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2х-а-Ь л/г пл/г

где t---------М, ¿М - количество равных час-

Ъ-а

тей (для пяти узловых точек М = 2).

Результаты вычислений точек экстраполяции представлены на рис. 5. Вычисленные по формулам (5) и (6) величины подставляются в выражения для плотностей вероятности (3) и (4) и в соответствии с критерием максимального правдоподобия принимается решение о выборе гипотезы. Если рассматривать АКЯ/^ и АК0/^ как результат аддитивного воздействия достаточно большого количества независимых случайных факторов, обусловленных погрешностями в изготовлении исходного картографического материала, его оцифровке и пересчете координат, то соответствующие распределения \у1аНм /^ I можно полагать гауссовыми. Корреляционные матрицы данных распределений имеют вид

К

мі/ц

2 °Мх К-Мху

К-Мху 2 Му

где М =(В,0) ;

стмх ~ дисперсия случайной вели-

чины АХ

чины АУ1

М. /у » ®Му

М:/Ц

К

Мху

дисперсия случайной вели-- корреляционный момент

АХ м і / і і и АТм:/а вектора АКМ щ.

Тогда Ж АК

нием

можно представить выраже-

^(АКм./у) = Сехр{-^/у}’ (8)

где С

2п

К

Мі/а

1/2

константа; Я

М;/Ц

к

М:/Ц

2К л/г^,,АХт\/г /^АУлуТ + (7

Щ ^^Мху М- /і] Му- /¿у иМхаі Му- /і}

квадратичная форма.

У

2.5

2

1.5 1

0,5

О

-0.5

\

4 •.///>£ 1 \

\ ч N. V . „р 00'

Узл овые точки х ЭТи

ЭТ23 +о: Є) + ° Т12

ХЛРЯ 2 \ СГ ' " ' эт о°3 '.2

о

5 10 15 20 X

Рис. 5. Определение точек экстраполяции

С учетом выражения (8) можно преобразовать выражения функций правдоподобия (3) и (4) к виду

ЬЯ1=Сехр{-<2Я1};

Ь

Я2-Сехр{ Фя2},

(9)

(Ю)

где Ян; - сумма квадратичных форм.

Таким образом, из функций (9) и (10) максимальное значение принимает та, которая имеет минимальную сумму квадратичных форм, следовательно, выбор гипотезы отождествления сводится к оценке значений Ян) и поиску наименьшего из них. Для рассматриваемого примера выбирается гипотеза Н1 , так как Ян\ < Ян2 •

Решающее правило отождествления можно распространить на произвольное число ЛРВ и отождествляемых точек. Очевидно, что предшествующий логический анализ по выявлению неприемлемых вариантов отождествления, когда происходит пересечение ЛРВ, как и в представленной задаче, позволяет сократить число рассматриваемых гипотез, что приведет к сокращению времени вычисления.

Литература

1. Ту Дж., Гонсалес Р. Принципы распознавания образов: Пер. с англ. - М.: Мир, 1978. - 416 с.

2. Горелик А. Л., Скрипкин В. А. Методы распознавания. - М.: Высшая школа, 1984. - 208 с.

3. Фу К. Последовательные методы в распознавании образов и обучении машин: Пер. с англ. - М.: Наука, 1971.-255 с.

4. Корн Г., Корн Т. Справочник по математике. - М.: Наука, 1974. - 831 с.

5. Басс Ф. Г., Фукс И. М. Рассеяние волн на статистически неровной поверхности. - М.: Наука, 1972. - 424 с

i Надоели баннеры? Вы всегда можете отключить рекламу.