Научная статья на тему 'ОБНАРУЖЕНИЕ ЛЕСНЫХ ВЫРУБОК С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКОГО АЛГОРИТМА АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ'

ОБНАРУЖЕНИЕ ЛЕСНЫХ ВЫРУБОК С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКОГО АЛГОРИТМА АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
алгоритм автоматической классификации / лесные вырубки / непараметрический алгоритм / дискретизация области значений многомерных случайных величин / данные дистанционного зондирования / automatic classification algorithm / logging / non-parametric algorithm / sampling of the range of values of multivariate random variables / remote sensing data

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — В.П. Тубольцев, В.Л. Авдеенок

Рассматриваются результаты применения непараметрического алгоритма автоматической классификации для обнаружения лесных вырубок. В качестве исходных данных используется многозональная космическая съемка земной поверхности. Для обнаружения классов применяется непараметрический алгоритм автоматической классификации статистических данных большого объёма, построенный на уменьшении объема исходной информации на основе декомпозиции многомерного пространства признаков.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — В.П. Тубольцев, В.Л. Авдеенок

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DETECTION OF DEFORESTATION USING NON-PARAMETRIC AUTOMATIC CLASSIFICATION ALGORITHM

The article consider results of application of non-parametric algorithm of automatic classification for detection of forest felling are considered. A multi-zone space survey of the Earth's surface is used as input data. To detect classes, a non-parametric algorithm for automatic classification of large-volume statistical data is used, based on a reduction in the amount of initial information based on the decomposition of the multidimensional feature space.

Текст научной работы на тему «ОБНАРУЖЕНИЕ ЛЕСНЫХ ВЫРУБОК С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКОГО АЛГОРИТМА АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ»

Секция «Программные средства и информационные технологии»

УДК 004.93

ОБНАРУЖЕНИЕ ЛЕСНЫХ ВЫРУБОК С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКОГО АЛГОРИТМА АВТОМАТИЧЕСКОЙ

КЛАССИФИКАЦИИ

1 2* 1 2 В. П. Тубольцев ' , В. Л. Авдеенок '

1 Сибирский государственный университет науки и технологий имени академика М.Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 2 Центр защиты леса Красноярского края - филиал ФБУ «Рослесозащита» Российская Федерация, 660036, Красноярск, Академгородок, д. 50 «а», к. 2

E-mail: Vitalya.98@mail.ru

Рассматриваются результаты применения непараметрического алгоритма автоматической классификации для обнаружения лесных вырубок. В качестве исходных данных используется многозональная космическая съемка земной поверхности. Для обнаружения классов применяется непараметрический алгоритм автоматической классификации статистических данных большого объёма, построенный на уменьшении объема исходной информации на основе декомпозиции многомерного пространства признаков.

Ключевые слова: алгоритм автоматической классификации, лесные вырубки, непараметрический алгоритм, дискретизация области значений многомерных случайных величин, данные дистанционного зондирования.

DETECTION OF DEFORESTATION USING NON-PARAMETRIC AUTOMATIC

CLASSIFICATION ALGORITHM

V. P. Tuboltsev1, 2*, V. L. Avdeenok1, 2

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation Branch of FBI "RCFH" Centre of Forest Health of Krasnoyarsk Region 50a bldg.2, str. Akademgorodok, Krasnoyarsk, 660036, Russian Federation E-mail: Vitalya.98@mail.ru

The article consider results of application of non-parametric algorithm of automatic classification for detection of forest felling are considered. A multi-zone space survey of the Earth's surface is used as input data. To detect classes, a non-parametric algorithm for automatic classification of large-volume statistical data is used, based on a reduction in the amount of initial information based on the decomposition of the multidimensional feature space.

Keywords: automatic classification algorithm, logging, non-parametric algorithm, sampling of the range of values of multivariate random variables, remote sensing data.

Введение. В основе современных методов изучения лесных массивов лежит применение данных дистанционного зондирования, чаще всего космической съемки земной поверхности. С каждым годом объем данных, получаемых с космических аппаратов возрастает. Это связано с увеличением группировки космических аппаратов, а также с улучшением пространственного и спектрального разрешений съемочного оборудования. В связи с этим

требуются современные алгоритмы обработки и классификации данных дистанционного зондирования Земли.

Непараметрический алгоритм автоматической классификации, в условиях статистических данных большого объёма, основан на их «сжатии» путём декомпозиции многомерного пространства признаков. В результате исходная выборка преобразуется в массив данных, составленный из центров многомерных интервалов дискретизации и соответствующих им частот принадлежности случайных величин. Основу процедуры классификации составляют проверка близости центров многомерных интервалов дискретизации и соотношений между их частотами. При этом выделяются классы, количество которых априори не задаётся. [1]

Цель данной работы состоит в анализе и сравнении результатов применения непараметрического алгоритма автоматической классификации статистических данных большого объема с результатами работы с итеративного самоорганизующегося метода анализа данных (ISODATA).

Методика дискретизация области значений. Для «сжатия» исходной информации V = (V-V- = Т~й.) большого объёма п многомерной случайной величины ж = («^/р = 1,fc) производим разбиение области её значений. Обозначим через длину интервала дискретизации по признаку xv. Пусть N - количество многомерных интервалов дискретизации с центрами i* = (f^v = L& a ^J = ÍS - соответствующие им частоты принадлежности случайных величин. В работах [2, 3] для восстановления плотности вероятности случайной величины х = (г„,к = 1, к) по данным V = = 1, Лг ) предложена статистика, в

которой коэффициенты размытости -+B,w= 1,А" при N te

Формула дискретизации многомерной случайной величины была предложена в результате анализ формул оптимальной дискретизации областей определения одномерной и двухмерной плотностей вероятности. [4]

-tírí -tK \йь

ÄjE= (j S j jPfabK.Sjddxj.KdXb j =

Коэффициент Ü 1 и его значения уменьшаются с ростом размерности к случайной величины.

Для независимых многомерных случайных величин с плотностью вероятности p(x) часто используется формула Скотта [5], которая основана на оценивании производных от р(х) по компонентам х,,v = 1,к .

Результаты применения. Исследуемая территория соответствует равнинной местности со смешанными лесами, расположенной в 84 км на юго-запад от города Усть-Илимск Иркутской области. Исходная информация была сформирована по фрагменту спутниковой съемки Sentinel-2A с пространственным разрешением 20 метров. Космическая съемка была осуществлена в августе 2020 года. Размеры фрагмента составляют 339*337 пикселей. Каждый из пикселей характеризуется шестью спектральными каналами: Green (560 nm), Red (664.5 nm), Vegetation red edge (740.2 nm), NIR (835.1 nm), SWIR (1613.7 nm) и SWIR (2202.4 nm). На фрагменте снимка визуально просматриваются свежие лесные вырубки и уже имеющие растительный покров, участки недавних лесных пожаров и гари более ранних годов, темнохвойные и светлохвойные массы, дороги, русло реки, открытые участки земной поверхности.

Секция «< П р о граммные е редст в а i и информацио нньее те х н о ло е и и » <

Рис. 1. Фрагмент спутниковой съемки Sentinel-2A в инфракрасном диапазоне (а). Пространственное

отображение результатов автоматической классификации, полученных с использованием непараметрического алгоритма автоматической классификации (б) при количестве классов M = 64 и итеративного самоорганизующегося метода анализа данных (ISODATA) (в) при количестве

классов M = 64.

Результаты автоматической классификации непараметрическим алгоритмом и методом Iterative Self-Organizing Data Analysis Technique сопоставимы. Границы лесных вырубок четко просматриваются на обоих растровых изображениях. Стоит отметить, что непараметрический алгоритм автоматической классификации более детально выделил участки повреждения лесных масс, не относящихся к вырубкам. Так же алгоритм выделил участки с темнохвойными и светлохвойными массивами.

Непараметрический алгоритм автоматической классификации статистических данных большого объёма основан на декомпозиции пространства признаков, что позволяет ускорить

обработку и классификацию данных дистанционного зондирования Земли, путем «сжатия» объема исходной выборки. Данный алгоритм рекомендуется использовать для обработки многозональной съемки поверхности Земли с целью обнаружение нарушений лесных массивов.

Исследование выполнено при финансовой поддержке РФФИ, Правительства Красноярского края и Красноярского краевого фонда науки в рамках научного проекта № 2041-240001.

Библиографические ссылки

1. Лапко, А.В. Программные средства реализации непараметрического алгоритма автоматической классификации статистических данных большого объема / А.В. Лапко, В. А. Лапко, С.Т. Им, В.П. Тубольцев, В.Л. Авдеенок, А.В. Бахтина

2. Лапко, А.В. Регрессионная оценка плотности вероятности и её свойства / А.В Лапко,

B. А. Лапко // Системы управления и информационные технологии. - 2012. - Вып. 49. - №3-1. -

C. 152 - 156.

3. Lapko, A.V. Regression Estimate of the Multidimensional Probability Density and Its Properties / A.V. Lapko, V.A. Lapko // Optoelectronics, Instrumentation and Data Processing. 2014. - Vol. 50. - No. 2. - P.148 - 153.

4. Лапко, А.В. Метод дискретизации области значений многомерной случайной величины / А.В. Лапко, В. А. Лапко // Измерительная техника. - 2019. - №1. - С. 16 - 20.

5. Scott, D.W. Multivariate Density Estimation: Theory, Practice, and Visualization. / D.W. Scott // New Jersey: John Wiley & Sons. - 2015. - 384 p

© Тубольцев В.П., Авдеенок В. Л., 2021

i Надоели баннеры? Вы всегда можете отключить рекламу.