Научная статья на тему 'АНАЛИЗ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ПРИРОДНЫХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ'

АНАЛИЗ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ПРИРОДНЫХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ Текст научной статьи по специальности «Математика»

CC BY
37
6
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АВТОМАТИЧЕСКАЯ КЛАССИФИКАЦИЯ / БОЛЬШИЕ ВЫБОРКИ / ДИСКРЕТИЗАЦИЯ ОБЛАСТИ ЗНАЧЕНИЙ МНОГОМЕРНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН / ДАННЫЕ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ / ЛЕСНЫЕ МАССИВЫ / AUTOMATIC CLASSIFICATION / BIG DATA / DISCRETIZATION OF VALUE AREA MULTIDIMENSIONAL RANDOM VARIABLES / REMOTE SENSING DATA / WOODLANDS

Аннотация научной статьи по математике, автор научной работы — Авдеенок Валерий Леонидович, Тубольцев Виталий Павлович

Рассматриваются результаты автоматической классификации данных дистанционного зондирования лесных массивов. Для обнаружения классов используются непараметрические алгоритмы, основанные на дискретизации и анализе области значений многомерных случайных величин.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Авдеенок Валерий Леонидович, Тубольцев Виталий Павлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «АНАЛИЗ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ПРИРОДНЫХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ»

10

"CHRONOS" ЕСТЕСТВЕННЫЕ И ТЕХНИЧЕСКИЕ НАУКИ #4(32), 2020

АНАЛИЗ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ ПРИРОДНЫХ ОБЪЕКТОВ С ИСПОЛЬЗОВАНИЕМ НЕПАРАМЕТРИЧЕСКИХ АЛГОРИТМОВ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ

Авдеенок Валерий Леонидович

студент 4 курса Научно-образовательного центра «Институт космических исследований и высоких технологий» ФГБОУ ВО «Сибирский государственный университет науки и технологий

имени академика М.Ф. Решетнева», Красноярск Тубольцев Виталий Павлович студент 4 курса Научно-образовательного центра «Институт космических исследований и высоких технологий» ФГБОУ ВО «Сибирский государственный университет науки и технологий

имени академика М.Ф. Решетнева», Красноярск

Аннотация. Рассматриваются результаты автоматической классификации данных дистанционного зондирования лесных массивов. Для обнаружения классов используются непараметрические алгоритмы, основанные на дискретизации и анализе области значений многомерных случайных величин.

Abstract. The article consider results of automatic classification remote sense data of woodlands. For the detection of classes used nonparametric algorithms based on discretization and analysis of value area multidimensional random variables.

Ключевые слова: автоматическая классификация, большие выборки, дискретизация области значений многомерных случайных величин, данные дистанционного зондирования, лесные массивы.

Keywords: automatic classification, big data, discretization of value area multidimensional random variables, remote sensing data, woodlands.

Методы автоматической классификации используются при создании математического обеспечения аппаратно-программных комплексов обработки данных дистанционного зондирования природных объектов. В работах [1, 2] под классом понимается множество значений случайных величин, соответствующих одномодальному фрагменту плотности вероятности в пространстве признаков исследуемых объектов. В данном направлении разработаны непараметрические алгоритмы автоматической классификации, которые позволяют обнаруживать классы с использованием итерационных процедур распознавания образов ядерного типа [3-4]. Однако их вычислительная эффективность имеет тенденцию к снижению по мере роста объёмов обрабатываемой информации. Полученные результаты развиваются на синтез непараметрических систем автоматической классификации статистических данных большого объема [5]. Их синтез основан на «сжатии» исходной информации путём дискретизации области значений случайных величин и использовании полученных результатов при непараметрическом оценивании совместной плотности вероятности.

Цель данной работы состоит в применении непараметрических алгоритмов автоматической классификации при обработке данных дистанционного зондирования природных объектов и анализе получаемых результатов.

Методика автоматической классификации. Для «сжатия» исходной информации V = (х1, 1 = 1, п) большого объёма п многомерной случайной величины х = (ху, V = 1, к) осуществим декомпозиции области её значений, используя рекомендации работ [6-8]. В результате исходная выборка V преобразуется в массив данных V = (г[,..., г1к, Р1, I = 1, Ы), составленный из значений центров , V = 1, к интервалов (элементов) дискретизации Б1 пространства признаков х анализируемых объектов и частот Р1 принадлежности значений х элементам Б1, 1 = 1, N.

Обнаружение первого класса начинается с элемента дискретизации с максимальной частотой Р из массива данных V. Формируется итерационная процедура обнаружения смежных к нему элементов, расстояние между центрами которых не превышает длину интервала дискретизации. Все эти элементы относятся к первому классу, так как соответствующие им частоты из промежуточного массива данных меньше найденной максимальной. Пусть Н(1) - множество номеров элементов отнесённых на приведённом выше первом этапе идентификации к первому классу. Далее последовательно рассматривается каждый элемент с номером из Н (1), определяются смежные ему элементы и анализируются их частоты. Если частота смежного элемента больше частоты анализируемого элемента, то он на данном этапе классификации не идентифицируется. В противном случае рассматриваемый смежный элемент относится к первому классу. Приведённая процедура идентификации повторяется до Ьго этапа классификации пока для всех элементов с номерами Н(Ь) выполняется условие: соответствующие им частоты меньше частот смежных к ним элементов. Обнаруженные элементы первого класса исключаются из исходных данных. Среди оставшихся данных выбирается элемент с максимальной частотой и представленная выше итерационная процедура классификации повторяется.

Результаты применения. Исследуемая территория соответствует равнинной местности с смешенными

''CHRONOS'' ЕСТЕСТВЕННЫЕ И ТЕХНИЧЕСКИЕ НАУКИ #4(32), 2020

11

лесами, расположенной в юго-западной части Дзержинского района. Исходная информация была сформирована по фрагменту спутниковой съемки ЬаЫБа! 8 с пространственным разрешением 30 метров. Размеры фрагмента составляет 127*97 пикселей. Каждый из пикселей характеризуется четырьмя спектральными каналами: синий (хх), зеленый (х2), красный (х3), ближний инфракрасный (х4).

Рисунок 1 - Фрагмент спутниковой съемки Landsat 8 OLI & TIRS в видимом (а) и инфракрасном

диапазонах (б). Пространственное отображение результатов автоматической классификации, полученных с использование программного продукта Erdas Imagine (в) и непараметрического алгоритма

(г) при количестве классов M = в.

Пространственное распределение результатов работы двух сравниваемых алгоритмов классификации визуально сопоставимы. На преобладающей площади исследуемого фрагмента четко выражены лесные массивы лиственницы и березы, а также редкие кустарники, тени от облаков и участок лесной вырубки.

Непараметрический алгоритм автоматической классификации рекомендуется использовать для четкого выделения классов лесных массивов по данным дистанционного зондирования.

Исследование выполнено при финансовой поддержке гранта РФФИ № 18-01-00251.

Список литературы:

1. Цыпкин Я. З. Основы теории обучающихся систем. М.: Наука, 1970. 251 с.

2. Васильев В. И., Эш С. Н. Особенности алгоритмов самообучения и кластеризации // Управляющие системы и машины. 2011. №3. С. 3-9

3. Лапко А. В., Лапко В. А., Хлопов А. Н. Непараметрический алгоритм автоматической классификации статистических данных // Изв. вузов. Приборостроение. 2011. Т.54, №4. С. 72-78.

4. Лапко А. В., Лапко В. А. Непараметрический алгоритм автоматической классификации в условиях статистических данных большого объема // Информатика и системы управления. 2018. Т. 57, №3. С. 59 -70.

5. Лапко А.В., Лапко В.А. Непараметрический алгоритм автоматической классификации многомерных случайных величин в условиях больших выборок // Решетневские чтения. 2018. Т. 1. № 22. С. 367-368.

6. Лапко А.В., Лапко В.А. Оптимальный выбор количества интервалов дискретизации области изменения одномерной случайной величины при оценивании плотности вероятности // Измерительная техника. 2013. №7. С. 24 - 27.

7. Лапко А.В., Лапко В. А. Выбор оптимального количества интервалов дискретизации области значений двухмерной случайной величины // Измерительная техника. 2016. №2. С. 14-17.

8. Лапко А.В., Лапко В.А. Оптимальный выбор количества интервалов дискретизации области изменения одномерной случайной величины при оценивании плотности вероятности // Измерительная техника. 2019. №1. С. 16 - 20.

© Авдеенок В.Л., Тубольцев В.П., 2020

i Надоели баннеры? Вы всегда можете отключить рекламу.