Научная статья на тему 'Сравнение методов сегментации пикселей топографических карт по типам объектов'

Сравнение методов сегментации пикселей топографических карт по типам объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
303
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТОПОГРАФИЧЕСКИЕ КАРТЫ / МЕТОДЫ СЕГМЕНТАЦИИ / КЛАСТЕРИЗАЦИЯ / ДЕТКЕТОР КЭННИ / ИСКУССТВЕННЫЕ НЕЙРОННЫЕ СЕТИ / TOPOQRAPHIC MAP / SEQMENTATION METHODS / CLUSTERINQ / CANNY DETECTOR / ARTIFICIAL NEURAL NETWORK

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тарасян Владимир Сергеевич, Дмитриев Никита Владимирович

Рассмотрены методы сегментации множества пикселей топографических карт по типам объектов в решении проблемы построения геоинформационных систем местности. В качестве методов для сравнения были выбраны метод кластеризации k-средних, модификация метода Кэнни, метод искусственных нейронных сетей и ручной метод в качестве эталонного. Эксперимент проводился автоматически при помощи разработанных программных средств с помощью гиперпараметрической оптимизации методов. При обработке фрагмента топографической карты получены цифровые изображения изолиний и отметок высот, числовые параметры качества методов. Наилучшее качество достигается при использовании метода искусственных нейронных сетей, который рекомендуется для сегментации множества пикселей в решении поставленной задачи.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Тарасян Владимир Сергеевич, Дмитриев Никита Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARISON OF METHODS FOR SEGMENTING PIXELS OF TOPOGRAPH IC MAPS BY OBJECTS TYPES

Methods for seqmentinq sets of pixels of topoqraphic maps by object types in solvinq problem of formation qeoqraphic information system are considered. There are methods for comparison such as к-means clusterinq, modification of Canny detector, artificial neural network and manual method as a benchmark. Experiment of verification of methods is performed automatically usinq implemented software with hyperparameter optimization. The main results are produced from fraqment of topoqraphical map diqital imaqes of contours and hiqh marks and numerical values of qual ity criteria. Experiment shows the best qual ity is achieved by usinq intellectual methods of artificial neural networks and it's recommended for seqmentinq of pixels at formation of qeoqraphic information system.

Текст научной работы на тему «Сравнение методов сегментации пикселей топографических карт по типам объектов»

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА, ОБРАБОТКА И ЗАЩИТА ИНФОРМАЦИИ

УДК 004.932.1

СРАВНЕНИЕ МЕТОДОВ СЕГМЕНТАЦИИ ПИКСЕЛЕЙ ТОПОГРАФИЧЕСКИХ КАРТ ПО ТИПАМ ОБЪЕКТОВ

B.C. Тарасян, Н.В. Дмитриев

Рассмотрены методы сегментации множества пикселей топографических карт по типам объектов е решении проблемы построения геоинформационных систем местности. В качестве методов для сравнения были выбраны метод кластеризации k-средних, модификация метода Кэнни, метод искусственных нейронных сетей и ручной метод в качестве эталонного. Эксперимент проводился автоматически при помощи разработанных программных средств с помощью гиперпараметрической оптимизации методов. При обработке фрагмента топографической карты получены цифровые изображения изолиний и отметок высот, числовые параметры качества методов. Наилучшее качество достигается при использовании метода искусственных нейронных сетей, который рекомендуется для сегментации множества пикселей в решении поставленной задачи.

Ключевые слова: топографические карты, методы сегментации, кластеризация, деткетор Кэнни, искусственные нейронные сети.

Стремительное расширение экономических связей между регионами России и странами ближнего зарубежья, обусловленное развитием промышленных и торговых отношений, привело к осознанию того, насколько оптимально происходит строительство тех или иных объектов логистической и транспортной инфраструктур [1]. Одним из наиболее актуальных и действенных способов на этапе проектирования является использование геоинформационных систем в качестве систем поддержки принятия решения [2]. Геоинформационные системы позволяют хранить, анализировать и визуализировать пространственные данные, полученные на основе реальной местности. Чтобы получить эти данные, авторами были выбраны топографические карты как содержащие наиболее полную и точную информацию.

Топографические карты представляют собой карты с подробным указанием опорных геодезических пунктов, рельефа, грунта, растительности, гидрографии, хозяйственных и культурных объектов, дорог, коммуникаций и других объектах местности. За каждым определённым типом объекта закреплено правило его изображения: форма, цвет, положение, текстура и т.д. Каждый объект может иметь двумерную (поля, озёра), линейную (коммуникации, изолинии) или точечную (цифры, символы и идеограммы) структуру. Для получения геоинформационной системы необходимо разделить топографическую карту по функциональным слоям, что является непростой задачей, так как часто возникают ситуации пересечения нескольких объектов сразу, т.е. топографические карты являются сложными не только с точки зрения структуры, но и с точки зрения топологии [3, 4].

Так как все объекты карт отличаются между собой, прежде всего, цветом, то основной целью исследования было изучение методов сегментации множества пикселей цифровых изображений и определение лучшего в рамках работы с топографическими картами.

Проблема преобразования топографической карты в геоинформационную систему стояла бы не так остро, если бы карты представляли собой векторные изображения, а не растровые. В векторных изображениях все объекты являются математически описанными геометрическими элементами, такими, как точки, линии, многоугольники и т.д., которые могут быть как сгруппированы, так и нет. В растровых изображениях как таковых объектов нет: изображение является двумерной матрицей пикселей, за которыми закреплён только определённый цвет.

Так как целью авторов является построение геоинформационной системы на основе отсканированной топографической карты, то, прежде всего, необходимо выполнить сегментацию множества пикселей между несколькими типами объектов, такими, как пиксели изолиний, пиксели водных объектов, пиксели определённых почв и т.д. Такое разделение можно сделать согласно правилу построения топографических карт, причём определяющей характеристикой является цвет объектов, так как объекты одной функциональной группы либо имеют одинаковый цвет, либо отличаются оттенками одного цвета. После сегментации необходимо будет применять различные методы векторизации растровых изображений, например, для преобразования изолиний в сплайны [5].

Каждый пиксель на растровом изображении, как уже говорилось ранее, определяется только своим цветом, выраженным в цветовых координатах пространства RGB, но этот цвет не является стандартным (взятым из некоторого заранее известного набора), так как при сканировании происходит дискретизация уровней цвета с некоторой погрешностью. Реаль-

ная карта может быть потёртой, выцветшей, пожелтевшей или потемневшей, сам пиксель может лежать на границе нескольких объектов. Всё это приводит к тому, что пиксель можно описать при помощи формулы

n

P = I щ ■ Ci+E, i=1

где P - вектор цвета пикселя в пространстве RGB; n - количество типов объектов карты; Ci - вектора цветов типов объектов топографической карты; E - вектор зашумлённости (может иметь отрицательные координаты); - весовые коэффициенты при векторах цветов.

В общем случае примерно знают вектора цветов для всех типов объектов топографических карт (на разных картах они могут отличаться, так как не существует строгого стандарта на их выполнение), но не знают вектор зашумлённости и весовые коэффициенты. Поэтому необходимо реализовать процедуру, которая распределяла бы множество пикселей карты между основными функциональными типами объектов.

Как известно, общего решения задачи сегментации множества пикселей цифровых изображений не существует, но разработаны некоторые общие методы, которые и можно применить в данной задаче.

Прежде всего, укажем прямой способ сегментирования множества пикселей - ручной, так как будут использоваться его результаты в качестве эталонных для сравнения с другими методами и определения критериев качества. Для этого была проведёна непосредственная обработка фрагмента топографической карты.

Среди автоматических методов выделяется метод кластеризации k-средних, основанный на цветовом разделении изображений на k кластеров, его алгоритм приведён на рис. 1, а. Данный метод очень хорошо работает на выделении двумерных объектов, так как среднее цветовое расстояние между пикселями одного функционала - небольшое число, то есть легко выставить пороговое значение, шумы легко подавляются [6]. Но данный метод может плохо себя проявить при работе с линейными объектами, так как при их сканировании получаются размытые кривые, и выставить однозначный порог уже не получится.

Поэтому для линейных объектов используются специальные методы выделения краёв или границ. В данном случае оценивается не вектор пикселя в цветовом пространстве, а перепад яркости по направлениям, то есть градиенты. К таким методам относятся операторы первого порядка: Собеля, Прюитта, Робертса и детектор границ Кэнни, операторы второго порядка, метод согласованности фаз [7]. Последние два типа методов не подходят для решения исследуемой задачи, так как некорректно работают на зашумлённых изображениях. Из методов первого порядка наиболее успешным является модификация детектора границ Кэнни (рис. 1, б). Оригинальный детектор содержит операцию сглаживания с помощью фильтра

Гаусса, что привело бы к потере качества вследствие высокой информационной плотности карт (из-за маленьких размеров объектов, несущих информацию).

Детектор Кэнни определяет любые границы, поэтому для того, чтобы выделить необходимые границы, необходимо выполнить его только для определённого цветового пространства, радиус которого выбирается значительно большим, чем расстояние в методе ^-средних.

Рис. 1. Блок-схема алгоритмов: а - кластеризации к-средних; б - модификации метода Кэнни

Кроме данных методов, при работе с изображениями часто применяются искусственные нейронные сети (ANN) как один из основных методов машинного обучения. ANN могут быть использованы для распознавания любых типов объектов, как двумерных, так и линейных [3]. ANN являются одним из самых медленных из представленных методов, но обладающим наибольшими возможностями и масштабируемостью. Алгоритм представлен на рис. 2.

Кроме того, после данных процедур сегментирования необходимо выполнить морфологическую постобработку полученных множеств пикселей с помощью таких операций, как дилатация, эрозия, замыкание и размыкание, для того, чтобы максимально нивелировать воздействие шумов: избавиться от разрывов изолиний и нарастить области до соприкосновения [5].

Рис. 2. Алгоритм искусственной нейронной сети

Одной из проблем при программной реализации данных методов выступили критерии качества, описанные ниже. Каждый из представленных методов обладает набором параметров, влияние которых невозможно оценить теоретически, поэтому для достижения наивысшей эффективности над каждым методом была осуществлена гиперпараметрическая оптимизация с использованием сетки поиска (Grid Search) [8]. Параметры, по которым была осуществлена параметризация, представлены в табл. 1.

Таблица 1

Параметры оптимизации методов сегментации

Название метода Параметры

Кластеризация ^-средних Количество кластеров, количество итераций алгоритма, минимальное расстояние между центрами кластеров

Модификация метода Кэнни Верхние и нижние пороги срабатывания, радиус цветового пространства распознаваемого объекта

Искусственная нейронная сеть Тип ANN., количество нейронов во вложенном слое, передаточная функция нейронов

На выходе всех представленных методов - двумерная булева матрица, определяющая, принадлежит ли пиксель к исследуемому типу объектов топографической карты или нет. Поэтому создадим два критерия оцен-

ки качества рассматриваемых методов согласно теории математической статистики: по ошибке первого рода (ложное срабатывание) и второго рода (пропуск срабатывания). В качестве критериев будем рассматривать отношение ошибочных пикселей (по тому или иному роду) к количеству уже определённых к типу ручным методом.

Для случаев выделения двумерных объектов ошибки первого и второго рода оказываются на несколько порядков меньшими, чем для линейных и точечных объектов. Поэтому для оценки качества методов были исследованы объекты, отвечающие за функционал отражения высоты местности: изолинии и отметки высот коричневого цвета.

В качестве наглядного изображения фрагмента топографической сети было выбрано изображение, представленное на рис. 3. Полученные результаты преобразования после выполнения гиперпараметрической оптимизации показаны на рис. 4. В табл. 2 в увеличенном виде представлены распознанные изолинии и числа для более наглядного просмотра, а в табл. 3 приведены численные показатели качества: критерии ошибок и быстродействие (в относительном времени выполнения взято за единицу время выполнения модификации детектора Кэнни).

Рис. 3. Фрагмент реальной оцифрованной топографической карты

Таблица 2

Сравнение методов сегментации множества пикселей: увеличенные изображения

№ Название метода Изображение изолинии и числа

1 Оригинальное изображение

2 Ручной

3 Кластеризация к- "5. "-Р- ^ !--

средних

4 Модификация метода Кэнни

5 Искусственная ней-

ронная сеть

Таблица 3

Сравнение методов сегментации множества пикселей: численные параметры

Название метода Ошибки первого рода, % Ошибки второго рода, % ^ВЫП? С Т 1 ВЫП. ОТН., раз

Ручной - - - 600 ~ 4000

Кластеризация к-средних 2 27 0,15 1,0

Модификация детектора Кэнни 5 18 0,23 1,5

Искусственная нейронная сеть 6 7 2,56 17,1

В данной статье рассматривались методы сегментации множества пикселей между типами объектов топографических карт. Согласно данным, полученным в результате эксперимента, было определено, что лучшим методом для выделения линейных объектов с точки зрения качества является метод искусственной нейронной сети: с незначительным увеличением ошибок первого рода происходит значительное уменьшение ошибок второго рода. Этот результат оказался предсказуемым, так как топографические карты представляют собой сложные структурные объекты, для преобразования которых необходимо использовать сложные модели с большим количеством параметров, что и обеспечивается искусственной нейронной сетью. Но это не означает, что другие методы совсем неприме-

103

нимы в задаче сегментации множества пикселей топографических карт: они могут использоваться при выделении крупных двумерных объектов, при этом скорость работы будет выше.

в г

Рис. 4. Результаты выполнения сегментации множества пикселей различными способами: а - ручная сегментация; б - классификатор к-средних; в - модификация детектора Кэнни; г - искусственная

нейронная сеть

В дальнейшем полученные сегментированные пиксели можно использовать для распознавания цифр, группировки их в числа, объединения их с изолиниями и т.д., осуществить векторизацию исходного изображения и разделить его по функциональным слоям. Полученную геоинформационную систему можно использовать для оптимального проектирования объектов транспортной и логистической инфраструктур, например, рассчитывать оптимальные точки пересечения транспортных путей.

104

Список литературы

1. Zhuravskaya M., Tarasyan V. Forming of the regional core transport network taking into account the allocation of alternative energy sources based on artificial intelligence methods // Transport Problems. 2014. V. 9. N 4. P. 121 - 130.

2. Тарасян В. С., Дмитриев Н. В. Система автоматизированного построения виртуальной модели местности по топографической карте // Молодежь в науке: Новые аргументы: сборник научных работ II Международного молодежного конкурса. Ч. I. 2015. С. 62 - 65.

3. Тарасян В.С., Дмитриев Н.В. Интеллектуальная система анализа и преобразования топографических карт [Электронный ресурс] // Современные проблемы науки и образования. 2015. № 2; URL: www.scienceeducation.ru/12921614 (дата обращения: 14.09.2015).

4. Ebi N., Lauterbach B., Besslich Ph. Automatic data acquisition from topographic maps using a knowledge-based image analysis system // ISPRS92 IV-B4. P. 655 - 663.

5. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. М.: Техносфера, 2006. 616 с.

6. A novel fast image segmentation algorithm for large topographic maps / Miao Qiguang, Xu Pengfei, Liu Tiange, Song Jianfeng, Chen Xiaojiang // Neurocomputing. 2015. V. 168. P. 808 - 822.

7. Deshmukh Nilesh K., Kurhe Ajay B., Satonkar Suhas S. Edge Detection Technique for Topographic Image of an Urban/Peri-Urban Environment Using Smoothing Functions and Morphological Filter // International Journal of Computer Science and Information Technologies. 2011. Vol. 2 (2). P. 691 - 693.

8. Bergstra James J, Bengio Yoshua. Random Search for HyperParameter Optimization // Journal of Machine Learning Research 13. 2012. P. 281 - 305.

Тарасян Владимир Сергеевич, канд. физ.-мат. наук, доц., зав. кафедрой, [email protected], Россия, Екатеринбург, Уральский государственный университет путей сообщения,

Дмитриев Никита Владимирович, асп., dmitrievnikita13@,gmail. com, Россия, Екатеринбург, Уральский государственный университет путей сообщения

COMPARISON OF METHODS FOR SEGMENTING PIXELS OF TOPOGRAPHIC MAPS BY OBJECTS TYPES

V.S. Tarasyan, N.V. Dmitriev 105

Methods for segmenting sets of pixels of topographic maps by object types in solving problem of formation geographic information system are considered. There are methods for comparison such as k-means clustering, modification of Canny detector, artificial neural network and manual method as a benchmark. Experiment of verification of methods is performed automatically using implemented software with hyperparameter optimization. The main results are produced from fragment of topographical map digital images of contours and high marks and numerical values of quality criteria. Experiment shows the best quality is achieved by using intellectual methods of artificial neural networks and it's recommended for segmenting ofpixels at formation of geographic information system.

Key words: topographic map, segmentation methods, clustering, Canny detector, artificial neural network

Tarasyan Vladimir Sergeevich, candidate of physical mathematical sciences, docent, head of chair, vtarasyan@gmail. com, Russia, Ekaterinburg, Ural State University of Railway Transport,

Dmitriev Nikita Vladimirovich, postgraduate, dmitrie vnikita 13@ gmail. com, Russia, Ekaterinburg, Ural State University of Railway Transport

УДК 336.74

ОСНОВНЫЕ ЗАЩИТНЫЕ ПРИЗНАКИ БАНКНОТ: ПУБЛИЧНЫЕ ЭЛЕМЕНТЫ

В. А. Селищев, Я.Р. Голубничая

Рассматриваются основные визуальные защитные элементы банкнот, представляющие собой первый уровень проверки их подлинности и предназначенные для распознавания населением без использования специальных технических средств.

Ключевые слова: водяной знак, защитная нить, защитные волокна, микроперфорация, голограмма, способы печати, микропечать, скрытое изображение, цветопе-ременные краски.

Подделывать денежные знаки стали сразу по мере их появления, поэтому на протяжении веков ведется постоянная борьба с фальшивомонетничеством, которое наносит существенный экономический ущерб. Защитные признаки (элементы) банкнот - это трудновоспроизводимые графические или технологические элементы, препятствующие их подделке или фальсификации. Общее количество защитных элементов в банкноте может быть около 100 или больше.

Банкноты - это особый полиграфический продукт, имеющий несколько уровней защиты. Защитные признаки первого уровня (публичные) ориентированы на население и, как правило, распознаются органолептиче-ски. Элементы второго уровня (машиночитаемые) предназначены

106

i Надоели баннеры? Вы всегда можете отключить рекламу.