Научная статья на тему 'ОПРЕДЕЛЕНИЕ РАЗМЕРА СКОЛЬЗЯЩЕГО ОКНА И ОПТИМАЛЬНОГО ЧИСЛА КЛАСТЕРОВ ПРИ РЕШЕНИИ ЗАДАЧИ ТЕКСТУРНОЙ СЕГМЕНТАЦИИ ДАННЫХ МУЛЬТИСПЕКТРАЛЬНОЙ АЭРОФОТОСЪЕМКИ'

ОПРЕДЕЛЕНИЕ РАЗМЕРА СКОЛЬЗЯЩЕГО ОКНА И ОПТИМАЛЬНОГО ЧИСЛА КЛАСТЕРОВ ПРИ РЕШЕНИИ ЗАДАЧИ ТЕКСТУРНОЙ СЕГМЕНТАЦИИ ДАННЫХ МУЛЬТИСПЕКТРАЛЬНОЙ АЭРОФОТОСЪЕМКИ Текст научной статьи по специальности «Математика»

CC BY
224
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРИЗНАКИ ХАРАЛИКА / ТЕКСТУРНАЯ СЕГМЕНТАЦИЯ / МЕТОД ГЛАВНЫХ КОМПОНЕНТ / СКОЛЬЗЯЩЕЕ ОКНО / КЛАСТЕРИЗАЦИЯ / HARALIK FEATURES / TEXTURE SEGMENTATION / PRINCIPAL COMPONENT ANALYSIS / SLIDING WINDOW / CLUSTERING

Аннотация научной статьи по математике, автор научной работы — Журбин Игорь Витальевич, Баженова Айгуль Илсуровна, Шаура Александр Сергеевич, Злобина Анна Григорьевна

Рассматривается вопрос определения размера скользящего окна при расчете текстурных признаков и определения оптимального числа кластеров при последующей кластеризации в задаче поиска следов антропогенного воздействия по данным мультиспектральной аэрофотосъемки. Используемая в работе схема сегментации включает в себя этапы: формирование системы текстурных признаков Харалика, уменьшение размерности признакового пространства с использованием метода главных компонент, кластеризация методом k -means. Сегментация мультиспектрального изображения проведена с использованием окон размерами 7×7, 15×15, 25×25, 45×45. Наилучший вариант сегментации получен при использовании окна размером 25×25 и 4 кластеров.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Журбин Игорь Витальевич, Баженова Айгуль Илсуровна, Шаура Александр Сергеевич, Злобина Анна Григорьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DETERMINING THE SLIDING WINDOW SIZE AND THE OPTIMAL NUMBER OF CLUSTERS IN THE PROBLEM OF TEXTURE SEGMENTATION OF MULTISPECTRAL AERIAL PHOTOGRAPHY DATA

The problem of determining of the sliding window size and the optimal number of clusters in the task of searching for traces of anthropogenic impact on multispectral image is considered in this paper. The texture segmentation scheme used in the work includes the following stages: the formation of Haralick texture feature system, reduction of the feature system using the principal component method and clustering with k -means method. It is necessary to take into account the size of the objects under study and the image resolution choosing the sliding window size. Based on this data processing according to the segmentation stages was carried out for sliding window sizes: 7×7, 15×15, 25×25, 45×45. Eighteen features for each window size were obtained - six main Haralick features calculated for three spectral bands of a multispectral image. The analysis of the obtained features using the method of principal components made it possible to identify 4, 5, 4 and 4 principal components for the window sizes: 7×7, 15×15, 25×25 and 45×45, respectively. Then it is necessary to set such a parameter as the number of clusters at the stage of clustering by the k -means method. In this work for this purpose the Calinski -Harabasz (CH) index is used, which is the greater, the denser the individual clusters and the more clearly the clusters are separated from each other. The optimal number of classes according to the CH index for windows 7×7 and 15×15 is two, and for windows 25×25 and 45×45 - four. The recommended number of clusters for windows 7×7 and 15×15 is clearly insufficient to describe the features of the landscape and vegetation in the area under consideration. This is confirmed by the clustering results. Since small window sizes as well as very large ones, smooth out the differences between textures, reducing the number of well-separated classes it was concluded that the sliding window size and the number of object classes to be distinguished can’t be determined independently of each other. Analysis of the clustering results shows that the best option was obtained using a 25×25 window and a cluster number of 4.

Текст научной работы на тему «ОПРЕДЕЛЕНИЕ РАЗМЕРА СКОЛЬЗЯЩЕГО ОКНА И ОПТИМАЛЬНОГО ЧИСЛА КЛАСТЕРОВ ПРИ РЕШЕНИИ ЗАДАЧИ ТЕКСТУРНОЙ СЕГМЕНТАЦИИ ДАННЫХ МУЛЬТИСПЕКТРАЛЬНОЙ АЭРОФОТОСЪЕМКИ»

УДК 004.932.2

DOI: 10.15350/17270529.2020.4.41

ОПРЕДЕЛЕНИЕ РАЗМЕРА СКОЛЬЗЯЩЕГО ОКНА И ОПТИМАЛЬНОГО ЧИСЛА КЛАСТЕРОВ ПРИ РЕШЕНИИ ЗАДАЧИ ТЕКСТУРНОЙ СЕГМЕНТАЦИИ ДАННЫХ МУЛЬТИСПЕКТРАЛЬНОЙ АЭРОФОТОСЪЕМКИ

ЖУРБИН И. В., БАЖЕНОВА А. И., ШАУРА А. С., ЗЛОБИНА А. Г.

Удмуртский федеральный исследовательский центр Уральского отделения РАН, 426067, г. Ижевск, ул. Т. Барамзиной, 34

АННОТАЦИЯ. Рассматривается вопрос определения размера скользящего окна при расчете текстурных признаков и определения оптимального числа кластеров при последующей кластеризации в задаче поиска следов антропогенного воздействия по данным мультиспектральной аэрофотосъемки. Используемая в работе схема сегментации включает в себя этапы: формирование системы текстурных признаков Харалика, уменьшение размерности признакового пространства с использованием метода главных компонент, кластеризация методом £-means. Сегментация мультиспектрального изображения проведена с использованием окон размерами 7^7, 15^15, 25x25, 45x45. Наилучший вариант сегментации получен при использовании окна размером 25x25 и 4 кластеров.

КЛЮЧЕВЫЕ СЛОВА: признаки Харалика, текстурная сегментация, метод главных компонент, скользящее окно, кластеризация.

ВВЕДЕНИЕ

Исследование природной среды регионов, где современные ландшафты сложились под влиянием многовекового хозяйственного воздействия, является важной и актуальной задачей, эффективное решение которой возможно с применением мультиспектральной аэрофотосъемки. Примером трансформации природной среды в результате индустриального освоения территории служат горнозаводские округа - особая форма организации металлургической промышленности Урала второй половины XVIII - XIX вв. [1]. Горнозаводской округ представлял собой единый хозяйственно-территориальный комплекс, включавший одно или несколько предприятий, каждое из которых имело собственную заводскую дачу - земельные угодья с промышленными сооружениями, рудными месторождениями, лесными массивами, пашнями, усадьбами рабочих и пр. Для реконструкции исторической инфраструктуры горнозаводских округов требуется выявление основных промышленных сооружений (плотина, пристань, производственные корпуса и пр.), вспомогательных производств (места рубок леса, углежоги и пр.) и участков хозяйственного освоения, заброшенных во второй половине XIX - начале XX вв.

Промышленные сооружения обычно достаточно явно выражены и в современном ландшафте, в то время как следы антропогенного преобразования природной среды визуально не фиксируются, а их расположение достоверно неизвестно. Признаком для выявления следов сплошных рубок леса, пашен и сенокосов на вырубках являются лесные массивы, возникшие в результате вторичной сукцессии растительности на заброшенных участках [2, 3]. Таким образом, задача обнаружения следов антропогенного воздействия на природную среду сводится к задаче анализа ландшафта и растительности.

Такой анализ может быть основан не только на рассмотрении спектральных характеристик отражающей способности объектов растительности, выраженных отдельными значениями яркостей пикселей, но и на изучении текстурных свойств изображений. Исследование текстурных свойств зависит от выбранного подхода, рассматриваемого набора

признаков и размера скользящего окна. Размер скользящего окна ключевым образом влияет на восприятие текстуры и зависит от характерных размеров изучаемых объектов, а, в конечном счете, существенно влияет на результат решения задачи.

Целью данной работы является определение оптимального размера скользящего окна и количества кластеров, позволяющих классифицировать элементы ландшафта и растительности при поиске следов антропогенного воздействия на природную среду на примере дачи Пудемского железоделательного завода Омутнинского горного округа, расположенного в северной части современной Удмуртии (рис. 1, а, с. Пудем).

ОБЛАСТЬ ИССЛЕДОВАНИЯ И ИСХОДНЫЕ ДАННЫЕ

Исследуемая в настоящей работе территория (рис. 1, б) соответствует фрагменту исторической карты [4], приведенному на рис. 1, в. Выделенная белым контуром пашня располагалась на местах сплошных вырубок леса, необходимых как топливо в производственном процессе Пудемского железоделательного завода. Так как лесной покров на сегодняшний день полностью восстановлен, следы антропогенного воздействия не имеют визуальных отличительных черт.

Рис. 1. Участок исследования: географическое положение с. Пудем (а), ортофотоплан (б) и историческая карта (в)

Согласно ботанико-географическому районированию европейской части России, северная часть Удмуртии, где была расположена дача Пудемского завода, входит в состав Урало-Западносибирской таежной провинции Евроазиатской таежной области. Здесь сосредоточены елово-пихтово-южнотаежные леса [5, с. 30 - 32]. Следовательно, участки заброшенных пашен и кварталы лесных вырубок при вторичной сукцессии должны маркироваться компактным произрастанием коренных пород елового леса [6, 7]. Таким образом, поиск исторических сельскохозяйственных угодий (следов антропогенного воздействия) на территории дачи Пудемского завода (рис. 1) можно свести к задаче классификации лесов.

Применение мультиспектральной съемки для решения поставленной задачи объясняется тем, что получаемое в результате изображение состоит из нескольких одноканальных изображений в разных спектральных зонах в диапазоне от видимого до инфракрасного электромагнитного излучения (Green, RedEdge, NIR). Учитывая, что исследуемые нами объекты земной поверхности (разные виды лесов) обладают разной отражательной способностью, такие снимки обладают высокой информативностью для целей распознавания.

Комплекс работ по аэрофотосъемке региона Пудемского железоделательного завода (общая площадь - 60 км2) и созданию ортофотопланов в системе координат МСК-18 выполнен специалистами ООО «Финко» (г. Ижевск). Использовался беспилотный летательный аппарат самолетного типа Supercam S350F с цифровой фотокамерой Sony а6000 и мультиспектральной камерой Parrot Sequoia. Съемка выполнена в ранний период вегетации. Фотограмметрическая обработка аэрофотоснимков в видимом диапазоне в программе PHOTOMOD UAS позволила сформировать ортофотоплан c разрешением 0.1 м на пиксель (рис. 1, б). Фотограмметрическая обработка мультиспектральных аэрофотоснимков выполнялась в программной системе Pix4d. В результате получены карты отражений по каждому спектральному каналу (рис. 2).

СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЯ

В общем случае задача сегментации изображения заключается в разбиении пикселей на непересекающиеся области с однородными свойствами и близкими значениями рассматриваемых признаков. Точность решаемой задачи при этом во многом зависит от системы признаков, описывающих исследуемые объекты. В настоящей работе обработка изображений выполняется по схеме, представленной на рис. 3.

Уменьшение

Мультиспектрапьное Формирование

—> —> размерности системы —> Кластеризация

изображение системы признаков признаков

Рис. 3. Обобщенная схема сегментации мультиспектрального изображения

Для каждого канала мультиспектрального изображения на этапе формирования системы признаков рассчитываются текстурные признаки Харалика [8]. На этом этапе необходимо определиться с размером скользящего окна. На следующем этапе реализуется уменьшение размерности признакового пространства с применением метода главных компонент (РСА) [9]. Заключительный этап подразумевает кластеризацию пикселей изображения в системе признаков, полученных на предыдущем шаге. При этом важным параметром, требующим изучения, является задаваемое количество кластеров.

ТЕКСТУРНЫЕ ОСОБЕННОСТИ ИЗОБРАЖЕНИЯ

Чаще всего в качестве признаков мультиспектрального изображения выступают цвет, яркость или текстура, а также их возможные сочетания. Понятие «текстуры» существенно более сложное, чем «цвет» или «яркость», поскольку определяется не только значениями интенсивностей единичного пикселя, но также характеристиками и взаимным расположением пикселей в некоторой окрестности. На изображениях ландшафта «текстура» является более стабильной характеристикой, чем интенсивность отдельных пикселей, поскольку при мультиспектральной съемке достаточно медленно меняется со временем и в меньшей степени зависит от условий освещенности, времени съемки, и других факторов. Кроме того текстура достаточно постоянна для определенных типов ландшафта или видов растительности, но в то же время существенно различна для разнородных областей. Пример текстур, характерных для различных видов растительности в пределах рассматриваемой территории, приведен на рис. 4.

Рис. 4. Различные виды ландшафтных текстур

Рис. 4 хорошо демонстрирует тот факт, что внутри обозначенных классов «Хвойный лес», «Редкий лес», «Лиственный лес», «Смешанный лес» или «Открытый грунт», текстура соответствующих им фрагментов изображения практически постоянна, но существенно изменяется при переходе от одного класса к другому.

Восприятие текстуры существенно зависит от масштаба, определяемого размером скользящего окна WXW. В [10] показано, что при разрешении снимка 0.1 - 0.2 м на пиксель малое окно (3*3 или 5*5 пикселей) работает как детектор градиента яркости и недостаточно для определения крупных объектов. По мере увеличения размера окна снижается роль отдельных пикселей, а мелкие детали становятся неразличимы, но при этом начинают проявляться более крупные объекты и структуры. Исследования показали, для текстурной обработки аэрофотоснимков лесных массивов и сельскохозяйственных угодий эффективно окно, размером близким к 20*20 пикселей. Дальнейшее увеличение окна до размера 80*80 пикселей и более приводит к незначительному изменению значений признаков, а последующее увеличение - к искажению.

При имеющемся разрешении аэрофотоснимков дачи Пудемского завода окна с размерами 3*3, 5*5 или 7*7 пикселей не захватывают каких-либо существенных ландшафтных объектов и даже при визуальном рассмотрении не могут в полной мере охарактеризовать текстуры соответствующих им областей (рис. 5). Окно 15*15 является переходным, его характеризующие способности сильно зависят от его конкретного расположения относительно исходного снимка и того, какие объекты попали внутрь. Размер окна 25*25 пикселей позволяет визуально различить большинство текстур на рассматриваемой территории, и в областях с лесной растительностью оно захватывает целиком одно крупное или несколько более мелких деревьев, что делает возможным определение видового состава растительности. Дальнейшее увеличение окна до размеров 45*45 и 81*81 позволяет захватить еще больше элементов, образующих текстуру, но при этом снижает значимость самих таких элементов, поскольку их анализ в большей степени основан на количественном соотношении пар светлых и темных пикселей, которое при одинаковых численных значениях может соответствовать качественно разным текстурам. Кроме того, большое окно в большей степени обладает свойствами сглаживающего фильтра, поэтому после обработки малые объекты и области могут стать неразличимыми. Таким образом, при выборе окна необходимо ориентироваться на характерные размеры образующих текстуру элементов.

3*3

5*5

7*7

15*15

25*25

45*45

81*81

Рис. 5. Изображения хвойного леса в скользящих окнах разных размеров ФОРМИРОВАНИЕ СИСТЕМЫ ПРИЗНАКОВ

Для того чтобы различать текстуры машинным способом необходимо уметь извлекать и количественно выражать признаки, описывающие ее локальные свойства. В качестве таких признаков могут выступать: статистические (признаки Харалика, Тамура, и т.д.), геометрические (диаграмма Вороного), модельные (фрактальные поля) или спектральные (вейвлет- и Фурье-анализ, фильтры Габора).

В задачах текстурной сегментации изображений наиболее часто используются статистические признаки, которые рассчитываются по матрицам смежности уровней серого. Они обеспечивают наиболее полное описание текстурных особенностей за счет выявления пространственных связей между парами смежных пикселей с учетом их ориентации, а также позволяют адаптироваться к характерным размерам базовых элементов, образующих текстуру, за счет подбора величины скользящего окна.

Нормированная матрица смежности выступает в роли функции плотности распределения вероятностей проявления определенных смежных пар пикселей в различных областях изображения в пределах текущего положения скользящего окна. При этом сама процедура анализа изображения на основе статистических текстурных признаков состоит их нескольких этапов:

1. Квантование исходного изображения I, что позволяет преобразовать его из полутонового изображения со значениями яркости в интервале [0,..., 255] в квантованное изображение Iq с N уровнями градаций серого в интервале [1,., N].

2. По квантованному изображению Iq для каждого положения скользящего окна размером WXW строится матрица Хв - матрица смежности уровня серого (Gray-Level Co-Occurrence Matrix, GLCM):

, ч WW IX если Iq(m, к) = i и Iq\m + d, к + d )= j

ХД = '' ' j

m=l k=i [0, в противном случае

Матрица смежности показывает, как часто пара пикселей с интенсивностями i и j оказывается смежной. Понятие смежности в направлении в определяется вектором re =(dx, dy), где dx и d - расстояние между пикселями по горизонтали и по

вертикали соответственно. GLCM рассчитывается для каждого из направлений r0 =(dx, d ),

rn =(dx, dy ), rM =\tx, dy ) и Гъл =\lx, dy ), после чего усредняется

X = 1 4

( \ Xn + X, + X, + X37r

0 n n in

. 4 2 T J

ТУ X

и нормируется P = ■

N N

YL x (i, j)

i=i j=i

3. По нормированной матрице смежности P = {ру) рассчитываются значения

текстурных признаков Харалика [8], Soh [11] или Clausi [12].

В данной работе для решения задачи сегментации мультиспектральных аэрофотоснимков использованы текстурные признаки Харалика. В анализе использованы мультиспектральные снимки местности в трёх спектральных каналах, что не только существенно повышает информативность исходных данных, но и увеличивает размерность задачи. Поскольку не все текстурные признаки Харалика являются взаимно независимыми [13], было принято решение ограничиться рассмотрением основных из них: Contrast, Correlation, Energy, Entropy, Homogeneity, Variance (табл. 1).

В формулах расчета текстурных признаков, приведенных в табл. 1, приняты условные обозначения, представленные в табл. 2. Выражение ^ (Q) обозначает второе по величине

собственное число матрицы Q .

Эти шесть признаков характеризуют три группы свойств одноканальных изображений: контрастность (Contrast, Homogeneity), упорядоченность (Energy, Entropy), классические статистические оценки (Variance, Correlation).

Контрастность характеризуется абсолютными значениями разностей уровней серого в пределах рассматриваемого окна, что влияет на расположение ненулевых элементов матрицы смежности относительно главной диагонали: чем сильнее различается яркость пикселей изображения, тем дальше от главной диагонали расположены ненулевые элементы матрицы GLCM. Contrast - характеризует резкость изображения и глубину «борозд» текстуры, низкая контрастность соответствует размытым текстурам. Homogeneity -противоположен Contrast, характеризует «сглаженность» области изображения, большие значения признака соответствуют однородным областям (с небольшой разницей в уровне серого), а близкие к 0 - наоборот.

4

2

4

Таблица 1

Основные текстурные признаки Харалика

Contrast N N 2 " j) Pj i=\ j=i

Correlation N N fiY j"My 1 SI y Pj i=i j=i l Л ) j

Energy N N I SPj 2 i=1 j=1

Entropy N N -II p j log p j i=1 j=1

Homogeneity N N p is pi S S1+(i - j)2

Variance (Sum of squares) N N ZZ(i-M)2 Pj i=1 j =1

Признаки, относящиеся к мерам упорядоченности, показывают, насколько регулярно или хаотично расположены темные и светлые пиксели. Energy - оценивает однородность и грубость текстуры, максимален для однотонных областей. Entropy - характеризует случайность и неравномерность, максимальные значения признака соответствуют случайному распределению значений яркости пикселей.

Таблица 2

Условные обозначения

a, ii * «P N Py ( j ) = S Pj i=1

N Mx =S i • Px (i ) i=1 N M y =S j • Py ( j) j=1

N =S(i "Mx )2 • Px (i) i=1 N 2 =S( j "My ) • Py ( j ) j=1

Статистические оценки соответствуют классическим понятиям математической статистики. Variance - оценивает разброс частот встречаемости определенных пар смежных пикселей, соответствует квадрату стандартного отклонения. Correlation - оценивает линейность зависимости значений уровня серого от соответствующих значений для смежных пикселей.

В каждом из трех спектральных каналов Green, RedEdge и NIR (рис. 2) рассчитаны шесть признаков: Contrast, Correlation, Energy, Entropy, Homogeneity, Variance, т. е. всего получено 18 значений текстурных признаков Харалика (рис. 6) для каждой точки исследуемой области. Все исследование проводилось для окон размерами 7*7, 15*15, 25*25 и 45*45 пикселей.

Contrast Correlation Energy Entropy Homogeneity Variance

min^^^^^^^Hl^^:___: max

Рис. 6. Визуализация текстурных признаков Харалика (для окна 25*25)

УМЕНЬШЕНИЕ РАЗМЕРНОСТИ СИСТЕМЫ ПРИЗНАКОВ

Визуальный анализ рис. 6 показывает, что некоторые из 18 признаков коррелируют между собой, что подтверждает необходимость применения метода главных компонент. Применив метод РСА к исходному набору текстурных признаков, выделены четыре значимых главных компонент (рис. 7, а), объясняющие более 90 % суммарной дисперсии исходных данных (рис. 7, б).

Рис. 7. Анализ главных компонент: визуализация значимых главных компонент РС1-РС4 (а)

и график кумулятивной дисперсии (б)

Первая главная компонента PC1 более контрастно разделяет участки разной структуры, поскольку наблюдается положительная корреляция со значениями Contrast, Entropy, Variance и отрицательная - со значениями Energy и Homogeneity. Такая зависимость характерна для всех спектральных каналов.

Вторая главная компонента отражает постоянство структуры: наибольший вклад вносит признак Correlation. Так как значения Correlation во всех спектральных каналах высокие (близкие к 1), на PC2 не проявляются участки хаотичной структуры в виде случайного шума.

Третья главная компонента имеет наибольшую положительную корреляцию с Correlation в Green и Energy в NIR. Значит, максимальным значениям будут соответствовать однородные участки в соответствующих спектральных каналах. Аналогичная интерпретация для четвертой главной компоненты PC4, имеющей положительную корреляцию с Correlation в Rededge и Energy в Green.

Уменьшение размерности системы признаков позволяет не только упростить визуальное представление исходных данных (для сравнения рис. 6 и рис. 7, а), но и существенно снизить вычислительные затраты на дальнейшую обработку.

КЛАСТЕРИЗАЦИЯ

После выделения и отбора признаков последним этапом решения задачи сегментации изображения (рис. 3) является применение одного из известных алгоритмов кластеризации для выявления однородных областей. Часто в подобных задачах используется метод к-шеапБ [14], поскольку он легко реализуется и хорошо масштабируется к большому объему данных.

Наиболее существенным недостатком метода и одной из основных причин возможной субъективности результатов кластеризации является необходимость априорно задать число определяемых кластеров.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Один из подходов, позволяющих решить данную проблему, основан на анализе индексов СаНпвЫ -НагаЬа82 (СН) [15]:

Ш(К)=х ТТ'

где - общая дисперсия между кластерами, - общая дисперсия внутри кластера, N - число объектов, для которых выполняется разбиение, к - количество кластеров.

Индекс СН тем больше, чем плотнее отдельные кластеры и чем чётче разделяются кластеры между собой. Соответственно, оптимальному числу кластеров будет соответствовать наибольшее значение индекса СН.

Анализ индексов СН проведен для результатов кластеризации при задании количества кластеров от 2 до 10 (рис. 8). Оптимальное число классов согласно индексу СН для окон 7*7 и 15*15 равно двум, а для окон размером 25*25 и 45*45 - четырем.

Количество рекомендуемого числа кластеров для окон 7*7 и 15*15 является явно недостаточным для описания особенностей ландшафта и растительности на рассматриваемой территории, поскольку не позволяет различить типы объектов, присутствующие на исследуемом фрагменте изображения: «Хвойный лес», «Редкий лес», «Лиственный лес», «Смешанный лес» или «Открытый грунт» и т. д.

Число классов Число классов

Рис. 8. Анализ индексов СН для разных размеров скользящих окон

Еще одной оценкой количества классов может быть несколько завышенное значение числа групп объектов, требуемых определения. Завышение априорной экспертной оценки числа классов требуется для того, чтобы дать алгоритму дополнительную свободу и позволить вынести неопределенные ранее объекты или ошибочные значения в свободные классы и не допустить их слияния с известными классами. Для выбранной территории дачи Пудемского завода минимальное число классов может быть определено по ортофотоплану (рис. 1, б): «Хвойный лес», «Редкий лес», «Лиственный лес», «Смешанный лес», «Открытый грунт» (в том числе дороги).

Таким образом, можно предположить, что количество искомых классов должно быть около 6 - 8.

В данной работе кластеризация проведена с помощью метода Л-шеапБ для различных размеров скользящего окна и соответствующего числа кластеров, оптимального согласно оценке СН.

Дополнительно получены результаты при задании избыточного числа кластеров, равного 8, выбранного на основании экспертной оценки присутствующих на ортофотоплане объектов. Результаты сегментации исходных изображений при нескольких размерах скользящего окна представлены на рис. 9.

Анализ результатов кластеризации в пространстве признаков, рассчитанных с размерами скользящего окна 7*7 и 15*15 (рис. 9, а; рис. 10, а), при оптимальном по СН количестве кластеров показывает невозможность разделения типов лесной растительности. Для окна 25*25 и 4 определяемых классов хорошо выделяется представляющая интерес область компактного произрастания хвойного леса (рис. 9, б), возникшая в результате вторичной сукцессии растительности на заброшенных участках. При увеличении числа выделяемых классов с 4 до 8 происходит нарушение целостности классов и смешивание типов лесной растительности внутри них, при этом становится затруднительным выделение различных областей, соответствующих ортофотоплану.

Результаты кластеризации для окна размером 45*45 сопоставимы с результатами, полученными для окна размером 25*25, однако очертания классов в большей степени сглажены и меньше соответствуют реальным границам на ортофотоплане.

Кроме того, поскольку вычислительные затраты для обработки изображением скользящим окном 45*45 в разы выше, чем при использовании окна 25*25, можно сделать вывод о том, что для решения поставленной задачи наиболее целесообразно использовать скользящее окно размером 25*25.

а) б) в)

Рис. 9. Результат кластеризации: окно 15*15, 2 класса (а); окно 25*25, 4 класса (б);

окно 25*25, 8 классов (в)

Для сопоставления полученных результатов с имеющимися историческими данными, произведено наложения класса «Хвойный лес» (полученного для окна 25*25 и 4 классов) на историческую карту (рис. 10). Принимая во внимание тот факт, что положение пашни изменялось в течение времени, о чем свидетельствуют карты разных лет [16, 17], а ее зарастание хвойным лесом происходило не равномерно, можно считать полученную оценку ее примерного расположения адекватной, что хорошо видно на рис. 10, б.

а) б). в)

Рис. 10. Сопоставление результата кластеризации с исторической картой: окно 15*15, 2 класса (а); окно 25*25, 4 класса (б); окно 25*25, 8 классов (в)

Как было сказано выше, попытка увеличения числа кластеров при тех же текстурных признаках и значениях скользящего окна не приводит к улучшению решения задачи сегментации (рис. 10, в).

Таким образом, в решаемой задаче наилучшим выбором параметров является окно размером 25*25 и количество разделяемых классов равное 4.

ЗАКЛЮЧЕНИЕ

В данной работе представлено решение задачи сегментации мультиспектрального аэрофотоснимка с целью поиска следов антропогенного воздействия посредством классификации типов лесов. При этом ключевым вопросом является выбор оптимальных значений размера скользящего окна при расчете текстурных признаков Харалика и количества кластеров при использовании метода &-шеа^. С одной стороны, в задачах текстурной сегментации размер скользящего окна определяется параметрами текстуры, ее

грубостью и характерными размерами образующих ее элементов. С другой стороны, размер скользящего окна и количество выделяемых классов или типов объектов не могут быть определены независимо друг от друга, поскольку малые размеры окна, как и очень большие, сглаживают различия между текстурами, уменьшая число хорошо разделяемых классов. Увеличение числа классов дает больше свободы при использовании метода &-means, позволяя вынести неопределенные ранее объекты или ошибочные значения в свободные классы и не допустить их слияния с другими классами. Однако это не приводит к улучшению решения задачи сегментации, поскольку число разделяемых классов зависит от информативности исходных признаков и их возможностей, определяемыми размерами скользящего окна.

В рассмотренной задаче наилучшим выбором является окно 25*25 при 4 разделяемых классах, что позволило по мультиспектральным снимкам территории дачи Пудемского завода выделить расположение области компактного произрастания хвойного леса, возникшего в результате вторичной сукцессии, в местах антропогенного преобразования природной среды.

Полученные результаты хорошо соотносятся с данными исторических карт, что подтверждает возможность применения и адекватность представленного в работе подхода.

СПИСОК ЛИТЕРАТУРЫ

1. Васина Т. А. Формирование горнозаводских округов в конце XVIII - первой половине XIX веков на территории современной Удмуртии // Научный диалог. 2019. № 7. С. 222-239.

2. Мониторинг биологического разнообразия лесов России: методология и методы / отв. ред. А.С. Исаев, Центр по проблемам экологии и продуктивности лесов РАН. М.: Наука, 2008. 453 с.

3. Kalinina O., Goryachkin S. V., Lyuri D. I., Giani L. Post-agrogenic development of vegetation, soils, and carbon stocks under self-restoration in different climatic zones of European Russia // Catena, 2015, vol. 129, pp. 18-29.

4. Государственный архив Свердловской области // Ф. 59. Оп. 3. Д. 2220. Л. 1.

5. Удмуртская Республика: Энциклопедия Изд. 2-е, исп. и доп., гл. ред. В. В. Туганаев. Ижевск: Удмуртия, 2008. 768 с.

6. Нешатаев В. Ю. Антропогенная динамика таежной растительности Европейской России: дис. д-ра биол. наук. СПб., 2017. 312 с.

7. Уланова Н. Г. Механизмы сукцессий растительности сплошных вырубок в ельниках южной тайги // Актуальные проблемы геоботаники. III Всероссийская школа-конференция. Лекции. Петрозаводск: Карельский научный центр РАН, 2007. С. 198-211.

8. Haralick R. M., Shanmugam K. & Dinstein I. Textural Features for Image Classification // IEEE Transactions on Systems, Man, and Cybernetics, 1973, no. 6, pp. 610-621.

9. Jolliffe I. T. Principal Components Analysis. 2nd ed. N.Y.: Springer-Verlag New York Inc., 2002.

487 p.

10. Колодникова Н. В. Обзор текстурных признаков для задач распознавания образов // Доклады Томского государственного университета систем управления и радиоэлектроники. 2004. № 1 (9). С. 113-124.

11. Soh L.-K. & Tsatsoulis C. Texture Analysis of SAR Sea Ice Imagery Using Gray Level Co-Occurence Matrices // IEEE Transactions on Geoscience and Remote Sensing, 1999, vol. 37, no. 2, pp.780-795.

12. Clausi D. A. An analysis of co-occurrence texture statistics as a function of grey level quantization // Canadian Journal of Remote Sensing, 2002, vol. 28, iss. 1, pp. 45-62.

13. Ulaby F. T., Kouyate F., Brisco B., Williams T. H. L. Textural Information in SAR Images // IEEE Transactions on Geoscience and Remote Sensing, 1986, vol. GE-24, iss. 2, pp. 235-245.

14. Красильников Н. Н. Цифровая обработка 2D- и 3D-изображений: Учебное пособие. СПб.: БХВ-Петербург, 2011. 608 с.

15. Calinski T. and Harabasz J. A Dendrite Method for Cluster Analysis: Communications in Statistics // Theory and Methods, 1974, vol. 3, iss. 1, pp. 1-27.

16. Государственный архив Свердловской области // Ф. 59. Оп. 3. Д. 2221. Л. 1.

17. Государственный архив Свердловской области // Ф. 59. Оп. 4. Д. 3363. Л. 1.

Determining the Sliding Window Size and the Optimal Number of Clusters in the Problem of Texture Segmentation of Multispectral Aerial Photography Data

Zhurbin I. V., Bazhenova A. I., Shaura A. S., Zlobina A. G.

Udmurt Federal Research Center, Ural Branch of the Russian Academy of Science, Izhevsk, Russia

SUMMARY. The problem of determining of the sliding window size and the optimal number of clusters in the task of searching for traces of anthropogenic impact on multispectral image is considered in this paper. The texture segmentation scheme used in the work includes the following stages: the formation of Haralick texture feature system, reduction of the feature system using the principal component method and clustering with k-means method. It is necessary to take into account the size of the objects under study and the image resolution choosing the sliding window size. Based on this data processing according to the segmentation stages was carried out for sliding window sizes: 7*7, 15*15, 25*25, 45*45. Eighteen features for each window size were obtained - six main Haralick features calculated for three spectral bands of a multispectral image. The analysis of the obtained features using the method of principal components made it possible to identify 4, 5, 4 and 4 principal components for the window sizes: 7*7, 15*15, 25*25 and 45*45, respectively. Then it is necessary to set such a parameter as the number of clusters at the stage of clustering by the k-means method. In this work for this purpose the Calinski -Harabasz (CH) index is used, which is the greater, the denser the individual clusters and the more clearly the clusters are separated from each other. The optimal number of classes according to the CH index for windows 7*7 and 15*15 is two, and for windows 25*25 and 45*45 - four. The recommended number of clusters for windows 7*7 and 15*15 is clearly insufficient to describe the features of the landscape and vegetation in the area under consideration. This is confirmed by the clustering results. Since small window sizes as well as very large ones, smooth out the differences between textures, reducing the number of well-separated classes it was concluded that the sliding window size and the number of object classes to be distinguished can't be determined independently of each other. Analysis of the clustering results shows that the best option was obtained using a 25*25 window and a cluster number of 4.

KEYWORDS: Haralik features, texture segmentation, principal component analysis, sliding window, clustering.

REFERENCES

1. Vasina T. A. Formirovanie gornozavodskih okrugov v konce XVIII — pervoj polovine XIX vekov na territorii sovremennoj Udmurtii [Formation of mining districts in the end of 18 th - first half of 19th century on territory of modern Udmurtia]. Nauchnyi dialog [Scientific Dialogue], 2019, no. 7, pp. 222-239. https://doi.org/10.24224/2227-1295-2019-7-222-239

2. Monitoring biologicheskogo raznoobraziya lesov Rossii: metodologiya i metody [Monitoring of biological diversity of Russian forests: methodology and methods]. Otv. red. A.S. Isaev, Tsentr po problemam ekologii i produktivnosti lesov RAN. Moscow: Nauka Publ., 2008. 453 p.

3. Kalinina O., Goryachkin S. V., Lyuri D. I., Giani L. Post-agrogenic development of vegetation, soils, and carbon stocks under self-restoration in different climatic zones of European Russia. Catena, 2015, vol. 129, pp. 18-29. https://doi.org/10.1016/j.catena.2015.02.016

4. Gosudarstvennyy arkhiv Sverdlovskoy oblasti [State Archives of the Sverdlovsk Region]. F. 59. Op. 3. D. 2220. L. 1.

5. Udmurtskaya Respublika: Entsiklopediya [Udmurt Republic: Encyclopedia]. Izd. 2-e, isp. i dop., gl. red. V. V. Tuganaev. Izhevsk: Udmurtiya Publ., 2008. 768 p.

6. Neshataev V. Yu. Antropogennaya dinamika taezhnoy rastitel'nosti Evropeyskoy Rossii [Anthropogenic dynamics of taiga vegetation in European Russiaences]. Dis. d-ra biol. nauk. St. Petersburg, 2017. 312 p.

7. Ulanova N. G. Mekhanizmy suktsessiy rastitel'nosti sploshnykh vyrubok v el'nikakh yuzhnoy taygi [Mechanisms of vegetation succession of clear-cuttings in southern taiga spruce forests]. Aktual'nye problemy geobotaniki. III Vserossiyskaya shkola-konferentsiya. Lektsii [Actual problems of geobotany.

III All-Russian School-Conference. Lectures [Petrozavodsk: KNTs RAN Publ., 2007, pp. 198-211. http://resources.krc.karelia.ru/geobotany/doc/school2007-0/actual probl geobotany lectures 198-211.pdf

8. Haralick R. M., Shanmugam K. & Dinstein I. Textural Features for Image Classification. IEEE Transactions on Systems, Man, and Cybernetics, 1973, no. 6, pp. 610-621. https://doi.org/10.1109/TSMC.1973.4309314

9. Jolliffe I. T. Principal Components Analysis. 2nd ed. N.Y.: Springer-Verlag New York Inc., 2002.

487 p.

10. Kolodnikova N. V. Obzor teksturnykh priznakov dlya zadach raspoznavaniya obrazov [Review of textural features for pattern recognition problems]. Doklady Tomskogo gosudarstvennogo universiteta sistem upravleniya i radioelektroniki [Proceedings of the TUSUR University], 2004, no. 1(9), pp. 113-124. https://cyberleninka.ru/article/n/obzor-teksturnyh-priznakov-dlya-zadach-raspoznavaniya-obrazov

11. Soh L.-K. & Tsatsoulis C. Texture Analysis of SAR Sea Ice Imagery Using Gray Level Co-Occurence Matrices. IEEE Transactions on Geoscience and Remote Sensing, 1999, vol. 37, no. 2, pp. 780-795. https://doi.org/10.1109/36.752194

12. Clausi D. A. An analysis of co-occurrence texture statistics as a function of grey level quantization. Canadian Journal of Remote Sensing, 2002, vol. 28, iss. 1, pp. 45-62. https://doi.org/10.5589/m02-004

13. Ulaby F. T., Kouyate F., Brisco B., Williams T. H. L. Textural Information in SAR Images. IEEE Transactions on Geoscience and Remote Sensing, 1986, vol. GE-24, iss. 2, pp. 235-245. https://doi.org/10.1109/TGRS.1986.289643

14. Krasil'nikov N. N. Tsifrovaya obrabotka 2D- i 3D-izobrazheniy [Digital Processing of 2D and 3D Images]. Uchebnoe posobie. St. Petersburg: BKhV-Peterburg Publ., 2011. 608 p.

15. Calinski T. and Harabasz J. A Dendrite Method for Cluster Analysis: Communications in Statistics. Theory and Methods, 1974, vol. 3, iss. 1, pp. 1-27. https://doi.org/10.1080/03610927408827101

16. Gosudarstvennyy arkhiv Sverdlovskoy oblasti [State Archives of the Sverdlovsk Region ]. F. 59. Op. 3. D. 2221. L. 1.

17. Gosudarstvennyy arkhiv Sverdlovskoy oblasti [State Archives of the Sverdlovsk Region ]. F. 59. Op. 4. D. 3363. L. 1.

Журбин Игорь Витальевич, кандидат технических наук, главный научный сотрудник, Физико-технический институт УдмФИЦ УрОРАН, тел. 8(912)8530973, e-mail: zhurbin@udman.ru

Баженова Айгуль Илсуровна, кандидат технических наук, научный сотрудник, Физико-технический институт УдмФИЦ УрО РАН, тел. 8(950)1743743, e-mail: aigul_bazh@udman.ru

Шаура Александр Сергеевич, кандидат технических наук, научный сотрудник, Физико-технический институт УдмФИЦ УрО РАН, тел. 8(906)2868057, e-mail: shauraa@,mail. ru

Злобина Анна Григорьевна, кандидат технических наук, научный сотрудник, Физико-технический институт УдмФИЦ УрО РАН, тел. 8(952)4018129, e-mail: elf54@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.