УДК 004.93 DOI: 10.12737/24913
К.В. Шошина, Р.А. Алешко, А.Т. Гурьев, Т.В. Карлова, С.А. Шептунов
АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ ПРИ ДЕШИФРИРОВАНИИ СНИМКОВ БЕСПИЛОТНЫХ ЛЕТАТЕЛЬНЫХ АППАРАТОВ
Описаны алгоритмы кластеризации цифрового изображения, которые используются в методике автоматизированного объектного тематического дешифрирования лесных дорог и других объектов по снимкам с беспилотных летательных аппаратов (БПЛА), полученным без дополнительного оборудования. Высокая достоверность дешифриро-
вания является показателем эффективности алгоритма, разработанного с учетом методики обработки снимков БПЛА лесных дорог.
Ключевые слова: лесные дороги, беспилотные летательные аппараты, тематическое дешифрирование, алгоритмы кластеризации, матрица ошибок.
K.V. Shoshina, R.A. Aleshko, A T. Guriev, T V. Karlova, S.A. Sheptunov
ALGORITHMS OF CLUSTERING AT DECODING PHOTOES OF UNMANNED AERIAL VEHICLES (DRONES)
The procedures and algorithms automating a process of a multilevel subject decoding are of particular interest. In the paper there is described a development of algorithms for automatic object identification on the basis of clustering. In the investigation the algorithm for a cluster analysis of AKM (improved of k- means) which allows identifying first an object in the picture and then highlighting it graphically is used. This algorithm is formed on the basis of the k-means algorithm allowing the fulfillment of a rapid cluster analysis. The improvement of AKM algorithm consists in a possibility of the computation of an optimum cluster number at a specified maximum cluster number. The accuracy of the results of subject decoding is assessed. One of the methods for the assessment of reliability is a statistic assessment of picture decoding re-
liability. For this it is necessary to create a matrix of errors at cluster definition and to calculate accuracy. It is possible to use a method of cross-tabulation for the presentation of pixels defined correctly in an obtained subject map of forest roads and a map formed on the basis of UAV pictures and data of ground investigations. A general accuracy of object decoding as a result of the work of AKM algorithm and a procedure of UAV picture processing of forest roads characterizes a degree of reliability as a high one.
The options for the further improvement of a procedure and algorithms are offered.
Key words: forest roads, unmanned aerial vehicles (drones) (UAV), subject decoding, clustering algorithms, error matrix.
Введение
Решение задачи дешифрирования снимков беспилотных летательных аппаратов (БПЛА) сводится к задаче распознавания образов. Существует большое разнообразие алгоритмов, реализующих эту задачу [1-4]. Кластеризация позволяет автоматически разбивать множество объектов на группы в зависимости от их сходства.
Кластеризация предназначена для разбиения совокупности объектов на однородные группы (кластеры или классы). Если данные выборки представить как точки в признаковом пространстве, то задача кластеризации сводится к определению наибольшей концентрации точек.
Цель кластеризации - поиск существующих структур. Кластеризация является описательной процедурой, она не делает никаких статистических выводов, но дает возможность провести разведочный анализ и изучить структуру данных. Кластер можно охарактеризовать как группу объектов, имеющих общие свойства [4-7].
Кластеризация процесса тематического дешифрирования включает в себя следующие этапы:
1. Выделение характеристик.
2. Определение метрики.
3. Разбиение объектов на группы.
4. Представление результатов.
Разработка методики тематического дешиф
Поскольку координаты объектов систем лесных дорог и обработки цифровых изображений непрерывны и вещественны, то воспользуемся классической метрикой Евклида
зирования снимков БПЛА
d Ofr2») = J^=i(xik~xjk)2X где k -количество характеристик (свойств), хл— характеристики объектов i и /.
Для снимка БПЛА с тремя каналами RGB имеем метрику
где xiRrxJRrxiGrxJGrxiB,xJB - значения каналов RGB объектов i и j.
В исследовании используется алгоритм кластерного анализа АКМ (улучшенный k- средних), который позволяет сначала распознать объект на снимке, затем выделить его графически. Данный алгоритм построен на основе алгоритма k-средних, позволяющего проводить быстрый кластерный анализ; для возможности использования этого метода необходимо иметь гипотезу о наиболее вероятном количестве кластеров (если число кластеров заранее не известно, используют k = 2). Суть алгоритма представлена на рис. 1. Улучшение алгоритма АКМ заключается в возможности расчета оптимального числа кластеров при заданном максимальном числе кластеров [8]. Алгоритм представляет собой итерационную процедуру, в которой выполняются следующие шаги:
1. Задаются начальные максимальное и минимальное числа центроидов.
2. Для каждой записи исходной выборки определяется ближайший к ней центр кластера.
3. Вычисляются центроиды - центры тяжести кластеров. Каждый центроид - это вектор, элементы которого представляют собой средние значения признаков, вычисленные по всем записям кластера. Затем центр кластера смещается в его центроид.
4. Добавляется или убирается центроид исходя из условий:
- если расстояние до данных больше заданного, то создается новый центроид;
- если кластер состоит из количества точек меньше заданного, то кластер убирается;
- если расстояния между центроидами меньше заданного, то кластеры объединяются.
Далее 3-й и 4-й шаги итеративно повторяются. Очевидно, что на каждой итерации происходит изменение границ кластеров и смещение их центров. В результате минимизируется расстояние между элементами внутри кластеров.
Результаты работы алгоритмов кластеризации к-средних и АКМ для распознавания объектов приведены на рис. 2 и 3. В результате работы алгоритма к-средних пиксели изображения разбиты на 4 кластера: лесная гравийная дорога; водные объекты; болота и увлажненные участки территории; лес.
Результатом обработки снимка БПЛА алгоритмом АКМ являются 5 кластеров: лесная дорога; лесные насаждения; болота и увлаженные участки; водные поверхности; нелесные поверхности. Далее необходимо оценить полученные результаты обработки изображений.
Произвольный выбор к объектов как исходных центров кластеров, к = 2 А Д ДЛ д д Д дд д
Назначение каждого объекта наиболее подходящему кластеру
Пересчет кластерных центров
Перераспределение объектов
Перераспределение объектов
Пересчет кластерных центров
Рис.1. Укрупненная схема алгоритма кластеризации
Оценка достоверности результатов дешифрирования снимков БПЛА
Одним из способов оценки достоверности тематического
дешифрирования является визуальная оценка. Результатом обработки снимков БПЛА алгоритмом к-средних является распределение пикселей в несколько групп: однозначно выделяются дороги, реки и другие объекты гидрографии (рис. 2); достаточно хорошо - участки заболоченности, застоя воды и зарастания дороги; выбоины на дорогах, а также тип растительности (например, породно-
возрастные характеристики леса) практически не распознаются. Также на снимке много шума (рябь), который мешает определению кластеров. Можно сделать вывод, что данный алгоритм применим для распознавания крупных (в масштабе снимка) пространственных объектов с целостной структурой. Если объект имеет разрозненную структуру, необходимо использовать другие методы и алгоритмы.
Рис. 2. Результат работы алгоритма к-средних (слева - снимок до кластеризации, справа - изображение после обработки)
Рис. 3. Результат работы алгоритма АКМ (слева - снимок до кластеризации, справа - изображение после обработки)
Визуальная оценка изображения, полученного с помощью алгоритма АКМ, также свидетельствует о достаточно уверенном распознавании дорог и объектов гидрографии. Гораздо лучше распознаются болота и лесные территории, однако выделить их таксационные характеристики невозможно. Уверенно распознаются водные поверхности, но часть пикселей от теней объектов попала в этот кластер. Устранить данную ошибку необходимо как модификацией алгоритма, так и подбором снимков. При планировании съемки БПЛА необходимо учитывать высоту и азимут Солнца, чтобы исключить тени (хотя тени могут выступать в качестве косвенного дешифровочного признака при определении высоты деревьев).
Другим способом оценки достоверности является статистическая оценка достоверности дешифрации снимков. Для этого необходимо построить матрицу ошибок определения кластеров и рассчитать точность. Воспользуемся кросс-табуляцией [7] для отображения правильно определенных пикселей полученной тематической карты лесных дорог и карты, постро-
енной по снимкам БПЛА и данным наземных исследований. Правильно выделенные пиксели располагаются по диагонали матрицы ошибок. По одной оси матрицы (горизонтально) располагаются расчетные данные, то есть данные, полученные в ходе тематического дешифрирования; по другой (вертикально) - данные, используемые для проверки. При верификации результатов полагается, что проверяемый результат потенциально является неточным, а проверочные карты хорошо отражают реальную ситуацию. Элементом матрицы ошибок является количество пикселей кластера к, распознанных как кластер I. Элементом матрицы ошибок является количество пикселей кластера к, распознанных как кластер к. В ходе исследования было выделено 5 кластеров: 1 - гравийная дорога, 2 - водные поверхности/объекты гидрографии (реки, озера), 3 - болота, 4 - лес, 5 - нелесные поверхности. Матрицы ошибок при кластеризации снимка БПЛА методом к-средних и с учетом разработанной методики обработки снимков БПЛА приведены соответственно в табл. 1 и 2.
Таблица 1
Матрица ошибок при кластеризации снимка методом k-средних
Расчетные классы
Дорога Вода Болото Лес I PA, % OE, %
Л о о Дорога 379 2 13 11 405 93,58 6,42
ей ч « Вода 8 423 25 8 464 91,16 8,84
3 Болото 5 52 138 56 251 54,98 45,02
К Л ч ей <и Лес 53 37 64 53 207 25,60 74,40
I 445 514 240 128 993 66,33
Рн UA, % 85,17 82,30 57,50 41,41 66,59 74,83
CE, % 14,83 17,70 42,50 58,59
Общая точность дешифрации Р вы-считывается как отношение суммы значений правильно выделенных пикселей по диагонали к общему количеству пикселей в матрице:
Р =
ДГ '
где N - общее число пикселей; тп - число кластеров.
Р = 74,83 Для определения точности определенного расчетного класса необходимо разделить сумму правильно определенных пикселей кластера на общее количество пикселей в этом кластере согласно проверочным данным. Этот показатель PA называют точностью производителя (producer's accuracy). Он показывает, насколько хорошо результат дешифрации кластера совпадает с проверочными данными.
рл -
где - сумма элементов к-й строки.
Для объекта «Лесная дорога» этот показатель равен 93,58 %.
Похожий показатель может быть вычислен для реального кластера, если разделить количество правильно классифицированных пикселей кластера на общее количество пикселей в этом кластере согласно проверяемым данным. Этот показатель UA (user's accuracy) называют точностью пользователя. Он показывает пользователю классификации, насколько вероятно, что данный кластер совпадает с результатами кластеризации.
,
¿jfci^jti
где - сумма элементов ¿-го столб-
ца.
Для объекта «Лесная дорога» этот показатель равен 85,17 %.
Элементы вне диагонали показывают несовпадения между расчетными и реальными пикселями кластеров.
Расчетные показатели достоверности для кластеризации снимков с помощью к-алгоритма говорят о следующем: общая точность дешифрации Р = 74,83 % является удовлетворительной (должна быть > 70%), но значение показателя является нижней границей порога. Это связано с особенностью снимка: большая часть территории представлена лесными поверхностями. А они, как известно, достаточно сложны для дешифрирования, особенно для установления таксационных показателей. Следовательно, данный алгоритм для дешифрирования лесов не подходит. Это подтверждают низкие показатели точности производителя и пользовательской точности для лесов: РА = 25,60 %, ИЛ = 41,41 %. Однако дорога и река на снимке были определены уверенно: для лесной дороги -РА = 93,58 %, ИЛ = 85,17 %, для реки - РА = 91,16 %, ИЛ = 82,30 %. Результаты статистической проверки подтвердили визуальную оценку: крупные пространственные объекты, к которым относятся лесные гравийные дороги и объекты гидрографии, дешифрируются с достаточно высокой степенью достоверности; объекты с разрозненной структурой дешифрируются с неудовлетворительной достоверностью.
Посчитаем достоверность результатов дешифрации с учетом методики обра-
ботки снимков БПЛА лесных дорог (табл. | 2).
Таблица 2
Матрица ошибок при кластеризации снимка методом АКМ с учетом методики
Расчетные классы
1 2 3 4 5 I РЛ, % ОЕ, %
л 1 517 7 8 19 27 578 89,45 10,55
о о ей 2 7 1724 28 375 3 2137 80,67 19,33
ч и 3 10 319 2462 251 2 3044 80,88 19,12
3 К л 4 4 19 74 415 6408 343 7259 88,28 11,72
5 34 79 67 287 2351 2818 83,43 16,57
ей « Рн I 587 2203 2980 7340 2726 13462 84,54
ИЛ, % 88,07 78,26 82,62 87,30 86,24 84,50 85,01
СЕ, % 11,93 21,74 17,38 12,70 13,76
Общая точность дешифрации объектов в результате работы алгоритма АКМ и методики обработки снимков БПЛА лесных дорог составила Р = 85,01 %, что характеризует степень достоверности как высокую (> 81%).
Сравнение результатов как визуальной, так и статистической оценки позволяет сделать выбор в пользу алгоритма кластеризации АКМ с учетом методики обработки снимков БПЛА лесных дорог. Средняя точность разработанных алгоритмов на 10% выше точности классического алгоритма к-средних.
Пользовательская точность выше по всем кластерам, кроме воды: Щ = 38,07%; Ша = 32,62%; Ш4 = 37,30%; ЦА- = 36,24%. Это объясняется особенностями снимка: водная гладь занимает небольшую часть отснятой территории. Также из матрицы ошибок (табл. 2) видно, что часть пикселей из кластеров «Гравийная дорога», «Болото», «Лес» и «Нелесные насаждения» попала в кластер «Вода». Это объясняется наличием теней на снимке. Такая проблема
Заключение
Можно сделать вывод, что алгоритмы кластеризации показали достаточно хорошие результаты при дешифрировании снимков БПЛА. Преимуществами алгоритмов кластеризации являются скорость и объем обработки. Данные алгоритмы ре-
может решиться планированием времени съемки.
Обработка снимков по разработанной методике позволила выделить большее количество кластеров, однако особенности лесных насаждений алгоритм не учитывает. Решением данной задачи может быть частичное обучение с учителем. Маркировка классов лиственных и хвойных деревьев может помочь в более качественном распознавании таксационных параметров лесов. Еще одним способом повышения точности дешифрации лесных территорий является использование мультис-пектрального оборудования при съемке. В исследовании анализировались три канала
:, видимого спектра. В свою очередь, муль-тиспектральные снимки позволят анализировать инфракрасный канал, который содержит важную информацию о растительном покрове.
В результате модификации классического алгоритма к-средних удалось избежать проблемы пустых кластеров благодаря ограничениям, реализованным в алгоритме АКМ.
комендуются при обработке больших объемов данных, какими являются ортофото-планы, построенные по серии снимков БПЛА. Алгоритм АКМ, разработанный с учетом методики тематической обработки снимков БПЛА лесных дорог, показал бо-
лее точные данные. Алгоритмы кластеризации с модификацией могут применяться для многоуровневого тематического дешифрования снимков БПЛА видимого
спектра, обеспечивающего сопоставление на каждом уровне семантических характеристик реальных объектов и их изображений.
Работа выполнена при поддержке гранта № 14-07-98801 «Разработка информационной системы мониторинга и управления лесными территориями (на примере архипелага Соловецкие острова)»
СПИСОК ЛИТЕРАТУРЫ
1. Jain, A. Data Clustering: A Review / A.Jain, M.Murty, P.Flynn // ACM Computing Surveys. -1999. - Vol. 31. - № 3.
2. Информационно-аналитический ресурс, посвященный машинному обучению, распознаванию образов и интеллектуальному анализу данных. -URL: www.machinelearning.ru/.
3. Чубукова, И. А. Курс лекций «DataMining» / И.А.Чубукова; Интернет-университет информационных технологий. - URL: www.intuit.ru/department/database/datamining/.
4. DataMining. Классификация и кластеризация. -Режим доступа: http://bug.kpi.ua/stud/work/RGR/ DATAMINING/classifandcluster.html (дата обращения: 01.07.2015).
5. Заславский, А. А. Оценка согласованности субъективных классификаций при заданных классах / А.А.Заславский, Т.А.Пригарина // Социология:
методология, методы, математические модели. -1994. - № 3-4.
6. Манылов, И.В. Сравнение алгоритмов дешифрации аэрофотоснимков земель сельскохозяйственного назначения / И.В.Манылов // Информационно-управляющие системы. Обработка информации и управление. - 2011. - № 3. - С. 2429.
7. GIS-Lab. Географические информационные системы и дистанционное зондирование. Матрица ошибок и расчет показателей точности тематических карт. - URL: http://gis-lab.info/qa/error-matrix.html (дата обращения: 10.07.2015).
8. Козинов, А.П. Вейвлет-преобразование и одно-классовая классификация для мониторинга состояния дамб / А.П.Козинов, А.Л.Пяйт, И.И.Мохов, Ю.П.Иванов // Информационно -управляющие системы. Обработка информации и управление. - 2014. - № 4. - С. 24-32.
1. Jain, A. Data Clustering: A Review / A.Jain, M.Murty, P.Flynn // ACM Computing Surveys. -1999. - Vol. 31. - № 3.
2. Information-Analytical Resource Devoted to Computer Training, Image Identification and Intelligent Analysis. - URL: www.machinelearning.ru/.
3. Chubukova, IA. Lecture Course "DataMining" / IA.Chubukova; Internet-University of Information technologies. - URL: www.intuit.ru/department/database/datamining/.
4. DataMining. Classification and Clustering. -Access Mode: http://bug.kpi.ua/stud/work/RGR/ DATAMINING/classifandcluster.html (address date: 01.07.2015).
5. Zaslavsky, А.А. Assessment of subjective classification coordination at specified classes / А.А.Zaslavsky, Т.А.Prigarina // Sociology: Methodology, Methods, Simulators. - 1994. - № 3-4.
Сведения об авторах:
Шошина Ксения Владимировна, ст. преподаватель Северного (Арктического) федерального университета им. М.В. Ломоносова, е-тай: [email protected].
Алешко Роман Александрович, к.т.н., доцент Северного (Арктического) федерального университе-
6. Manylov, I.V. Comparison of algorithms for decoding aerial photos of agricultural lands / I.V.Manylov // Information-Control Systems. Information Processing and Management. - 2011. -№ 3. - pp. 24-29.
7. GIS-Lab. Geographical Information Systems and Remote Sensing. Matrix of Errors and Computation of Accuracy Indices and of Subject Maps. - URL: http://gis-lab.info/qa/error-matrix.html (дата обращения: 10.07.2015).
В. Kozinov, АР. Wavelet-transformation and one-class classification for dam state monitoring / А.R.Kozinov, А.L.Peight, I.I.Mokhov, Yu.P.Ivanov // Information-Control Systems. Information Processing and Management. - 2014. - № 4. - pp. 24-З2.
Статья поступила в редколлегию 5.12.2016.
Рецензент: д.т.н., профессор Куликов М.Ю.
та им. М.В. Ломоносова, е-тай: го[email protected].
Гурьев Александр Тимофеевич, д.т.н., профессор Северного (Арктического) федерального университета им. М.В. Ломоносова, е-mail: [email protected].
Карлова Татьяна Владимировна, д.т.н., профессор Института конструкторско-технологической информатики Российской академии наук, e-mail: [email protected].
Shoshina Kseniya Vladimirovna, Senior Lecturer of Lomonosov Northern (Arctic) Federal University, Phone: 89602808370, е-mail: [email protected]. Aleshko Roman Alexandrovich, Can. Eng., Assistant Prof. of Lomonosov Northern (Arctic) Federal University, Phone: 89600006336, е-mail: [email protected].
Шептунов Сергей Александрович, д.т.н., профессор Института конструкторско-технологической информатики РАН, тел.: 89037268472, е-mail: [email protected].
Guriev Alexander Timofeevich, D. Eng., Prof. of Lomonosov Northern (Arctic) Federal University, Phone: 89217203906, е-mail: [email protected]. Karlova Tatiana Vladimirovna, D. Soc., Prof. Institute of Design-Technological Informatics of RAS, Phone: 89037769078, е-mail: [email protected]. Sheptunov Sergey Alexandrovich, D. Eng., Prof. Institute of Design-Technological Informatics of RAS, Phone: 89037268472, е-mail: [email protected].