Научная статья на тему 'Нечеткие кластеры с объемными прототипами в тематической обработке данных дистанционного зондирования Земли'

Нечеткие кластеры с объемными прототипами в тематической обработке данных дистанционного зондирования Земли Текст научной статьи по специальности «Математика»

CC BY
66
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЧЕТКАЯ КЛАСТЕРИЗАЦИЯ / FUZZY CLUSTERING / ОБЪЕМНЫЕ ПРОТОТИПЫ / VOLUME PROTOTYPES / СХОДСТВО КЛАСТЕРОВ / CLUSTERS SIMILARITY / EXTENDED C-MEANS ALGORITHM / EXTENDED GUSTAFSON-KESSEL ALGORITHM / РАСШИРЕННЫЙ АЛГОРИТМ С-СРЕДНИХ / РАСШИРЕННЫЙ АЛГОРИТМ ГУСТАФСОНА КЕССЕЛЯ

Аннотация научной статьи по математике, автор научной работы — Бучнев А. А., Пяткин В. П.

Рассматривается технология нечеткой кластеризации данных дистанционного зондирования Земли (ДЗЗ) расширенными алгоритмами С-средних и Густафсона-Кесселя. Расширения алгоритмов состоят в использовании объемных прототипов и меры сходства кластеров. Объемные прототипы менее чувствительны к шумовым выбросам в распределении данных. Кроме того, использование меры сходства позволяет объединять кластеры в процессе кластеризации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Бучнев А. А., Пяткин В. П.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Fuzzy Clusters with Volume Prototypes in the Thematic Processing of the Earth Remote Sensing Data

The fuzzy clustering technology of the Earth remote sensing data, based on extended C-means and Gustafson-Kessel algorithms, is discussed. The algorithms extensions consist of clusters with volume prototypes construction and using of clusters similarity measure. The volume prototypes are less sensitive to a bias in the distribution of the data, and similar clusters are merged during clustering.

Текст научной работы на тему «Нечеткие кластеры с объемными прототипами в тематической обработке данных дистанционного зондирования Земли»

Journal of Siberian Federal University. Engineering & Technologies, 2017, 10(6), 723-726

УДК 528.8.04, 528.88

Fuzzy Clusters with Volume Prototypes in the Thematic Processing of the Earth Remote Sensing Data

Aleksey A. Buchnev and Valeriy P. Pyatkin*

Institute of Computational Mathematics and Mathematical Geophysics SB RAS 6 Akademika Lavrentieva, Novosibirsk, 630090, Russia

Received 26.01.2017, received in revised form 14.03.2017, accepted 19.07.2017

The fuzzy clustering technology of the Earth remote sensing data, based on extended C-means and Gustafson-Kessel algorithms, is discussed. The algorithms extensions consist of clusters with volume prototypes construction and using of clusters similarity measure. The volume prototypes are less sensitive to a bias in the distribution of the data, and similar clusters are merged during clustering.

Keywords: fuzzy clustering, volume prototypes, clusters similarity, extended C-means algorithm, extended Gustafson-Kessel algorithm.

Citation: Buchnev A.A., Pyatkin V.P. Fuzzy clusters with volume prototypes in the thematic processing of the earth remote sensing data, J. Sib. Fed. Univ. Eng. technol., 2017, 10(6), 723-726. DOI: 10.17516/1999-494X-2017-10-6-723-726.

© Siberian Federal University. All rights reserved

* Corresponding author E-mail address: [email protected], [email protected]

Нечеткие кластеры с объемными прототипами в тематической обработке данных дистанционного зондирования Земли

А.А. Бучнев, В.П. Пяткин

Институт вычислительной математики и математической геофизики СО РАН Россия, 630090, Новосибирск, пр. Академика Лаврентьева, 6

Рассматривается технология нечеткой кластеризации данных дистанционного зондирования Земли (ДЗЗ) расширенными алгоритмами С-средних и Густафсона-Кесселя. Расширения алгоритмов состоят в использовании объемных прототипов и меры сходства кластеров. Объемные прототипы менее чувствительны к шумовым выбросам в распределении данных. Кроме того, использование меры сходства позволяет объединять кластеры в процессе кластеризации.

Ключевые слова: нечеткая кластеризация, объемные прототипы, сходство кластеров, расширенный алгоритм С-средних, расширенный алгоритм Густафсона-Кесселя.

Одним из основных вопросов тематической обработки (интерпретации) данных ДЗЗ является вопрос повышения качества распознавания. Возникающие трудности обусловлены, в частности, «загрязнением» выборок смешанными векторами признаков, т.е. векторами, которые образуются при попадании в элемент разрешения съемочной системы нескольких природных объектов [1, 2]. Большинство алгоритмов классификации для отнесения векторов признаков классам вычисляют для каждого вектора значения подходящей функции «правдоподобия». В случае зачисления вектора признаков в класс по максимальному значению функции правдоподобия получается так называемая жесткая кластеризация (например, так работает классический алгоритм ^-средних).

Альтернативным подходом служит нечеткая кластеризация, которая позволяет каждому вектору признаков принадлежать одновременно всем кластерам с определенной степенью членства (принадлежности) в каждом кластере. Одним из первых алгоритмов нечеткой кластеризации является, вероятно, алгоритм С-средних [3]. Вопросы реализации и использования этого алгоритма в обработке данных ДЗЗ освещаются в [4].

Дальнейшим развитием системы нечеткой кластеризации данных ДЗЗ выступает реализация нечеткой кластеризации расширенными алгоритмами С-средних (Fuzzy C-means - FCM) и Густафсона-Кесселя (Gustafson-Kessel - GK) [5]. В алгоритме FCM выбранная метрика, определяющая форму получаемых кластеров, одинакова для всех кластеров и не меняется в процессе работы. Принципиальное отличие алгоритма GK от алгоритма FCM состоит в том, что каждый кластер имеет индивидуальную метрику, основанную на нечеткой ковариационной матрице кластера (метрика Махаланобиса). Эта метрика динамически меняется в процессе выполнения итераций алгоритма.

Расширения FCM- и GK-алгоритмов (получаются E-FCM- и E-GK-алгоритмы) состоят в следующем [5].

AlekseyA.Buchnev аппЛСРепуР Pyaekm. FuzzyCluAerswitM"^lumePrototapes intheThematicProcessing.

В качостве пр ототипо в ользук^т^с^я о бъемныеп рсооти пы (vo/и me prototypes).

Объемныйпрототип-выпуклоеи компакано о а признаков. В

раетносто1 иклее валгориеме .Е-^ДМисполаеъется пвклидвпл мета)ика, тоапа вртнмврототи-пом 15еввееггг ггпершам с центром v¡ и ]Э£1д^л^пв]е1 г,■ длп --ем класеорее. Мекета премиалос xk, для которопп рпегсояние ^гаС-а,17!) < г, являетея элементомоМърматеп пратпплпаивходит в i-й кластер с членством 1.0. В алгоритме E-GK объемный прототип кластера - гиперэллипсоид.

Мерн рьезтоспия, лсполаауемая is нессширепнвих алгоритмах, опрептевется на основе всхеъи-ъмары пС Дие^ певлона п сначала ъычипяяетгя значени еъ CtC^X а аатамрасстоя-ниедооВъемного пегсоотипа 40«е;в^ткв равным e¡fc = max (0, e¿fc — r¿). Таким образом, векторы признаков, лежащие внутри объемного прототипа i-го кластера, имеют нулевое значение членства в других кластерах, что уменьшает влияние плотных областей в данных на центры °РК(ох клтеседов. ^ке^ы объемных протоскпоь оиредкляютлн нк основе ебъемов класте-

Bвoддеeяпoнятиe<<cxoдcтвa>>Сыда/ЬflэтД)клacтepoв. Cxенcтвoклаcвтлoвлпределяется на оснхае нечвтиой весмчеющеД мены. Дхидвух нрчеоних класкероя ufycC ие/x^j) нечеткая вклю-чающаямераопределяется как

т _ VLl ч'" (pifc.pjfce

_ VW р ■

¿lfc=1 pífc

Здесь N - число векторов признаков в наборе данных; u¡k - значение членства k-го вектора в i-м кластере. Включающая мера не является симметрической, но она используется для построения симметрической меры сходства нечетких кластеров ui(xk) и u(xk):

S¡j = max(T¡,, Ii).

Начиная с заведомо большего числа кластеров, кластеры, степень сходства которых превышает заданный порог, объединяются в итерационном процессе кластеризации для того, чтобы получить подходящее разбиение данных.

Приведенные ниже рисунки демонстрируют процесс построения карты нечеткой кластеризации алгоритмом E-FCM. На рис. 1 приведен фрагмент изображения бассейна Обского водохранилища, полученного 19.04.2011 ИСЗ Terra (EOS AM-1), сканер Modis. Рис. 2 содержит изображения нечетких кластеров (всего их два), соответствующих состоянию водно-ледовой поверхности бассейна водохранилища.

Заметим, что во входных данных было задано 7 кластеров, в результате работы алгоритма все векторы признаков были разбиты по двум кластерам. В качестве начального разбиения векторов признаков по нечетким кластерам используются выходные данные алгоритма С-средних.

Соответствующая вычислительная процедура реализована в рамках модели параллельного программирования OpenMP под управлением ОС Windows. Включение алгоритмов E-FCM и E-GK в состав программного комплекса по обработке спутниковых данных PlanetaMonitoring позволяет расширить возможности системы кластеризации комплекса по построению разбиения, наиболее полно соответствующего внутренней структуре данных.

Работа выполнена частично при финансовой поддержке Российского фонда фунда-менталъныхисследований (проект № 16-07-00066) и Программы Т.33П фундаментальных исследоааний Прюзидиумы РАН (ирпоктМ 0315в2015-0СЪ2р.

Спасвк литератур ы

[1] Асмус В.В. Программно-аппаратный комплекс обработки спутниковых данных и его применение для задач гидрометеорологии и мониторинга природной среды. Москва, 2002. 75 с. [Asmus V.V. Software-hardware complex processing of satellite data and its application to problems of hydrometeorology and environmental monitoring, Moskva, 2002. 75 p. (in Russian)]

[2] Шовенгердт Р. А. Дистанционное зондирование. Модели и методы обработки изображений. М.: Техносфера, 2010. 560 с. [Schowengerdt R.A. Remote sensing. Models and methods for image processing. Moskva, Technosfera, 2010, 560 p. (in Russian)]

[3] Bezdek J.C. Pattern recognition with fuzzy objective function algorithms. Plenum Press, New York, 1981.

[4] Асмус В.В., Бучнев А.А., Пяткин В.П. Жесткая и нечеткая кластеризация данных дистанционного зондирования Земли. Журнал СФУ. Сер. Техника и технологии, 2016, 9(7), 972-978. DOI: 10.17516/1999-494X-2016-9-7-972-978. [Asmus V.V., Buchnev A.A., Pyatkin V.P. Hard and fuzzy clustering of the earth remote sensing data. J. Sib. Fed. Univ. Eng. technol., 2016, 9(7), 972-978. DOI: 10.17516/1999-494X-2016 -9-7-972-978. (in Russian)]

[5] Uzay Kaimak and Magne Setnes. Extended Fuzzy Clustering Algorithms. ERIM report series ERS-2000-51-LIS. Rotterdam, Netherlands, November 2000, 24.

i Надоели баннеры? Вы всегда можете отключить рекламу.