Научная статья на тему 'Основні міри подібності та нові підходи до їх застосування при класифікуванні гіперспектральних космічних зображень'

Основні міри подібності та нові підходи до їх застосування при класифікуванні гіперспектральних космічних зображень Текст научной статьи по специальности «Математика»

CC BY
434
37
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ГИПЕРСПЕКТРАЛЬНОЕ КОСМИЧЕСКОЕ ИЗОБРАЖЕНИЕ / КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ / МОДЕЛЬ ВЕКТОРНОГО ПРОСТРАНСТВА / МЕРЫ ПОДОБИЯ / HYPERSPECTRAL SATELLITE IMAGE / IMAGE CLASSIFICATION / VECTOR SPACE MODEL / SIMILARITY MEASURES / ГіПЕРСПЕКТРАЛЬНЕ КОСМіЧНЕ ЗОБРАЖЕННЯ / КЛАСИФіКУВАННЯ ЗОБРАЖЕНЬ / МОДЕЛЬ ВЕКТОРНОГО ПРОСТОРУ / МіРИ ПОДіБНОСТі

Аннотация научной статьи по математике, автор научной работы — Альперт С. І.

У даній статті описується новий підхід класифікування гіперспектральних космічних зображень, який використовує поняття моделі векторного простору та векторних функцій подібності, таких як міра Серенсена-Дайса, косинусна міра подібності, м’яка косинусна міра подібності, міра Жаккара, міра перекриття та асиметрична міра. Було показано, що косинусна міра подібності це міра кута між двома ненульовими -вимірними векторами, які представляють об’єкти у -вимірному просторі. Також наголошувалося на тому, що м’яка косинусна міра подібності це міра м’якої подібності між двома векторами, тобто ця міра виражає подібність між парами характеристик векторів. Для обчислення м’якої косинусної міри використовується матриця подібності характеристик. На відміну від звичайної косинусної міри подібності, яка розглядає характеристики векторного простору як повністю незалежні, м’яка косинусна міра враховує подібність характеристик векторного простору, що дозволяє узагальнити поняття косинусної міри подібності. Також було розглянуто коефіцієнт Жаккара, який виражає подібність між скінченними множинами та дорівнює відношенню кількості елементів перетину множин до кількості елементів їхнього об’єднання. У статті описаний коефіцієнт Серенсена-Дайса, який був незалежно відкритий двома науковцями: Товардом Серенсеном та Дайсом Лі Раймондом. Було показано, що коефіцієнт перекриття вимірює перекриття двох скінченних множин та визначається як відношення кількості елементів перетину двох множин до кількості елементів тієї множини, яка є меншою. Було зауважено, що асиметрична міра подібності виражає операції, пов’язані із включенням векторів. У статті були проаналізовані основні властивості та характеристики даних векторних функцій подібності. Також було розглянуто приклад обчислення мір подібності для двох векторів. Запропоновані векторні функції подібності можуть бути використані в задачах інформаційного пошуку, при вирішенні різноманітних екологічних задач та при класифікуванні гіперспектральних космічних зображень.В данной статье описывается новый подход к классификации гиперспектральных космических изображений, который использует понятие модели векторного пространства и векторных функций подобия, таких как мера Серенсена-Дайса, косинусная мера подобия, мягкая косинусная мера подобия, мера Жаккара, мера перекрытия и ассиметричная мера. Было показано, что косинусная мера подобия это мера угла между двумя ненулевыми -мерными векторами, которые представляют объекты в -мерном пространстве. Также акцентировалось на том, что мягкая косинусная мера подобия это мера мягкого подобия между двумя векторами, то есть эта мера выражает подобие между парами характеристик векторов. Для вычисления мягкой косинусной меры используется матрица подобия характеристик. В отличие от обычной косинусной меры подобия, которая рассматривает характеристики векторного пространства как полностью независимые, мягкая косинусная мера учитывает подобие характеристик векторного пространства, что позволяет обобщить косинусную меру подобия. Также был рассмотрен коэффициент Жаккара, который выражает подобие между конечными множествами и равен отношению количества элементов пересечения множеств к количеству элементов их объединения. В статье был описан коэффициент Серенсена-Дайса, который независимо был открыт двумя учеными: Товардом Серенсеном и Дайсом Ли Раймондом. Было показано, что коэффициент перекрытия измеряет перекрытие двух конечных множеств и определяется как отношение количества элементов пересечения двух множеств к количеству элементов того множества, которое является меньшим. Было замечено, что ассиметричная мера подобия выражает операции, связанные с включением векторов. В статье были проанализированы основные свойства и характеристики данных векторных функций подобия. Также был рассмотрен пример вычисления мер подобия для двух векторов. Предложенные векторные функции подобия могут быть использованы в задачах информационного поиска, при решении различных экологических задач и при классификации гиперспектральных космических изображений.This paper describes the new approach for hyperspectral satellite images classification, which uses a concept of Vector Space Model and vector similarity functions, such as: Sorensen-Dice coefficient, cosine similarity, soft cosine measure, Jaccard coefficient, overlap measure and assymetric measure. It was shown, that cosine similarity is a measure of the angle between two t-dimensional object vectors. It also was noticed, that soft cosine measure is a measure of “soft” similarity between two vectors. Soft cosine measure considers similarity of pairs of features. For calculation of the soft cosine measure, the matrix of similarity between features is used. The traditional cosine similarity considers the vector space model features as independent or completely different, while the soft cosine measure proposes considering the similarity of features in the vector space model, which allows generalization of the concepts of cosine measure. It also was considered Jaccard coefficient that measures similarity between finite sample sets, and is defined as the size of the intersection divided by the size of the union of the sample sets. Sorensen-Dice coefficient was described in this paper too. This coefficient is used for comparing the similarity of two samples. It was independently developed by the two scientists: Thorvald Sorensen and Lee Raymond Dice. It was shown, that overlap coefficient measures the overlap between two finite sets. It is defined as the size of the intersection of two sets divided by the smaller of the size of the two sets. It also was noticed, that asymmetric measure describes the inclusion relations between vectors. Main properties and characteristics of these vector similarity functions were analyzed in this paper. It was also considered an example, where similarity measures between two vectors were computed. Proposed vector similarity functions can be applied in information retrieval, various ecological tasks and hyperspectral satellite image classification.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Основні міри подібності та нові підходи до їх застосування при класифікуванні гіперспектральних космічних зображень»

УДК 528.06 С.1. АЛЬПЕРТ*

ОСНОВН1 М1РИ ПОД1БНОСТ1 ТА НОВ1 П1ДХОДИ ДО IX ЗАСТОСУВАННЯ ПРИ КЛАСИФ1КУВАНН1 Г1ПЕРСПЕКТРАЛЬНИХ КОСМ1ЧНИХ ЗОБРАЖЕНЬ

Науковий Центр аерокосмiчних дослiджень Землi 1ГН НАН Украши, м. Кшв, Украша_

Анотаця. У дант статтi описуеться новий пiдхiд класифiкування гтерспектральних космiчних зображень, який використовуе поняття моделi векторного простору та векторних функцт поди бностi, таких як мiра Серенсена-Дайса, косинусна мiра подiбностi, м 'яка косинусна мiра подiбно-стi, мiра Жаккара, мiра перекриття та асиметрична мiра. Було показано, що косинусна мiра по-дiбностi - це мiра кута мiж двома ненульовими t -вимiрними векторами, як представляють об 'екти у t -вимiрному просторi. Також наголошувалося на тому, що м 'яка косинусна мiра подiб-ностi - це мiра м 'яког подiбностi мiж двома векторами, тобто ця мiра виражае подiбнiсть мiж парами характеристик векторiв. Для обчислення м 'яког косинусног мiри використовуеться мат-риця подiбностi характеристик. На вiдмiну вiд звичайног косинусног мiри подiбностi, яка розгля-дае характеристики векторного простору як повтстю незалежт, м 'яка косинусна мiра враховуе подiбнiсть характеристик векторного простору, що дозволяе узагальнити поняття косинусног мiри подiбностi. Також було розглянуто коефщент Жаккара, який виражае подiбнiсть мiж сюн-ченними множинами та дорiвнюе вiдношенню кiлькостi елементiв перетину множин до кiлькостi елементiв гхнього об'еднання. У статтi описаний коефщент Серенсена-Дайса, який був незалеж-но вiдкритий двома науковцями: Товардом Серенсеном та Дайсом Л1 Раймондом. Було показано, що коефщент перекриття вимiрюе перекриття двох сктченних множин та визначаеться як вiд-ношення кiлькостi елементiв перетину двох множин до кiлькостi елементiв тiег множини, яка е меншою. Було зауважено, що асиметрична мiра подiбностi виражае операцИ, пов 'язат iз вклю-ченням векторiв. У статтi були проаналiзованi основт властивостi та характеристики даних векторних функцт подiбностi. Також було розглянуто приклад обчислення мiр подiбностi для двох векторiв. Запропоноват векторт функцп подiбностi можуть бути використат в задачах тформацтного пошуку, при виршенш рiзноманiтних екологiчних задач та при класифжуванш ги перспектральних космiчних зображень.

Ключовi слова: гiперспектральне космiчне зображення, класифтування зображень, модель векторного простору, мiри подiбностi.

Аннотация. В данной статье описывается новый подход к классификации гиперспектральных космических изображений, который использует понятие модели векторного пространства и векторных функций подобия, таких как мера Серенсена-Дайса, косинусная мера подобия, мягкая косинусная мера подобия, мера Жаккара, мера перекрытия и ассиметричная мера. Было показано, что косинусная мера подобия - это мера угла между двумя ненулевыми t -мерными векторами, которые представляют объекты в t -мерном пространстве. Также акцентировалось на том, что мягкая косинусная мера подобия - это мера мягкого подобия между двумя векторами, то есть эта мера выражает подобие между парами характеристик векторов. Для вычисления мягкой косинусной меры используется матрица подобия характеристик. В отличие от обычной косинусной меры подобия, которая рассматривает характеристики векторного пространства как полностью независимые, мягкая косинусная мера учитывает подобие характеристик векторного пространства, что позволяет обобщить косинусную меру подобия. Также был рассмотрен коэффициент Жаккара, который выражает подобие между конечными множествами и равен отношению количества элементов пересечения множеств к количеству элементов их объединения. В статье был описан коэффициент Серенсена-Дайса, который независимо был открыт двумя учеными: Товардом Серенсеном и Дайсом Ли Раймондом. Было показано, что коэффициент перекрытия измеряет перекрытие двух конечных множеств и определяется как отношение количества элементов пересечения двух множеств к количеству элементов того множества, которое является меньшим. Было замечено, что ассиметричная мера подобия выражает операции, связанные с включением векторов. В статье были проанализированы основные свойства и характеристики данных векторных функций подобия. Также был рассмотрен пример вычисления мер подобия для

© Альперт С.1., 2019

1028-9763. Математичш машини i системи, 2019, № 1

двух векторов. Предложенные векторные функции подобия могут быть использованы в задачах информационного поиска, при решении различных экологических задач и при классификации гиперспектральных космических изображений.

Ключевые слова: гиперспектральное космическое изображение, классификация изображений, модель векторного пространства, меры подобия.

Abstract. This paper describes the new approach for hyperspectral satellite images classification, which uses a concept of Vector Space Model and vector similarity functions, such as: Sorensen-Dice coefficient, cosine similarity, soft cosine measure, Jaccard coefficient, overlap measure and assymetric measure. It was shown, that cosine similarity is a measure of the angle between two t-dimensional object vectors. It also was noticed, that soft cosine measure is a measure of "soft" similarity between two vectors. Soft cosine measure considers similarity of pairs of features. For calculation of the soft cosine measure, the matrix of similarity between features is used. The traditional cosine similarity considers the vector space model features as independent or completely different, while the soft cosine measure proposes considering the similarity offeatures in the vector space model, which allows generalization of the concepts of cosine measure. It also was considered Jaccard coefficient that measures similarity between finite sample sets, and is defined as the size of the intersection divided by the size of the union of the sample sets. Sorensen-Dice coefficient was described in this paper too. This coefficient is used for comparing the similarity of two samples. It was independently developed by the two scientists: Thorvald Sorensen and Lee Raymond Dice. It was shown, that overlap coefficient measures the overlap between two ^ finite sets. It is defined as the size of the intersection of two sets divided by the smaller of the size of the two sets. It also was noticed, that asymmetric measure describes the inclusion relations between vectors. Main properties and characteristics of these vector similarity functions were analyzed in this paper. It was also considered an example, where similarity measures between two vectors were computed. Proposed vector similarity functions can be applied in information retrieval, various ecological tasks and hyperspectral satellite image classification.

Keywords: hyperspectral satellite image, image classification, Vector Space Model, similarity measures. 1. Вступ

З кожним роком все бшьше актуальних природоресурсних та еколопчних задач виршу-еться i3 залученням методiв дистанцшного зондування Землi (ДЗЗ). Методи ДЗЗ сьогодш широко використовуються при вивченш природних ресурав, при ощнюванш стану лiсiв, урбашзованих територш та сшьськогосподарських земель, аналiзi причин та наслщюв природних катастроф, при пошуку родовищ корисних копалин.

За останнш час суттево збшьшилося рiзноманiття матерiалiв ДЗЗ, що, у свою чергу, сприяло розробщ та впровадженню нових ефективних методiв виршення природоресурсних задач. Серед уах матерiалiв, яю використовуються при виршенш задач ДЗЗ, саме ri-перспектральш зображення е найбшьш шформативними, оскшьки мютять у собi надзви-чайно великий обсяг даних про об'екти зйомки. 1нформащя, отримана з пперспектральних зображень, дозволяе розтзнавати та класифшувати об'екти, ощнювати ix стан, фшсувати змши, що вщбуваються з об'ектами спостереження, та надавати прогнозы ощнки [1-2].

Слщ зазначити, що процедура класифшування е найбшьш складною процедурою при обробщ пперспектральних зображень.

У данш статп буде показано, що при виршенш задач класифшування супутнико-вих зображень може бути застосовано поняття векторноi модел^ тобто представлення ознак, що вщповщають певним класам, векторами, як належать одному векторному простору. В основi використання моделi векторного простору для виршення задач класифшу-вання лежить ппотеза компактносп, яка стверджуе, що ознаки, яю належать тому самому класу, утворюють компактну область, причому обласп, що вщповщають рiзним класам, не перетинаються. Ознаки з рiзниx клаав утворюють неперервш обласп, мiж якими можна провести меж та класифшувати новi ознаки. При цьому при застосуванш векторних кла-

сифiкаторiв близьюсть двох ознак може бути виражена як через вщстань, так i через мiру подiбностi.

Мета даног статтг полягае в аналiзi та порiвняннi основних мiр подiбностi, якi ви-користовуються при розв'язанш задач класифiкування, зокрема, при класифшуванш ппер-спектральних космiчних зображень. При цьому розглядаються такi мiри подiбностi, як ко-синусна мiра подiбностi, м'яка косинусна мiра подiбностi, мiра Жаккара, мiра Серенсена-Дайса, мiра перекриття та асиметрична мiра. Аналiзуються основнi характеристики i влас-тивост даних мiр та наводяться конкретш приклади 1'х обчислення.

2. Основш м1ри под1бност1 2.1. Косинусна м1ра под1бност1

Косинусна мiра подiбностi - це мiра кута мiж двома ненульовими t -вимiрними векторами, яю представляють об'екти у t -вимiрному просторi. Два однаково напрямленi вектори ма-ють косинусну мiру подiбностi, рiвну "1", два ортогональнi вектори мають мiру подiбностi "0", а два вектори, що мають дiаметрально протилежнi напрями, мають мiру подiбностi "-1". Слiд зазначити, що в основному в задачах використовуеться косинусна мiра подiбно-стi в дiапазонi вiд "0" до "1".

Одиничш вектори вважаються максимально «подiбними», якщо вони паралельнi, а у випадку ортогональносп вектори вважаються максимально «розбiжними».

Вираз для обчислення косинусно'1 мiри подiбностi можна отримати з формули для обчислення скалярного добутку [3-5]:

{и, у) = ||и||-||у||с08(и, V), (1)

де М = V" ^ + - + и? - норма (довжина) вектора и ;

^ ^у2 +... + у] - норма (довжина) вектора V ;

\т = л/у

(2) (3)

соБ(и, у) - косинус кута мiж векторами и та V. Косинусна мiра подiбностi обчислюеться за такою формулою:

/ \ У

5/'/«! (и, V) = соз(и, V) = трррт = , ~ ( = - косинусна м1ра под1бносп, (4)

Я

V к=1 к=1

де и = (и1,...,и(),у = (у1,...,у() - вектори ознак об'екпв, ик,Ук - компонента (координата)

г

вектор1в и та V, ^икУк - скалярний добуток м1ж цими векторами.

к=1

Тобто з формули (4) маемо, що косинусна мiра подiбностi дорiвнюе вiдношенню скалярного добутку векторiв и та V до добутку норм (довжин) векторiв и та V.

Зауважимо, чим бшьше значення норм векторiв, тим менше буде значення косинусно'1 мiри подiбностi.

Зазначимо, що крiм поняття косинусно'1 мiри, в задачах класифшування часто використовуеться поняття косинусно'1 вщсташ, яка обчислюеться за такою формулою:

сШтц (и, V) = 1 - (и, V), (5)

де (и, у) - косинусна мiра подiбностi.

t

« s "v

soft _ cos ine{u, v) = . JlL .--, (7)

Якщо припустите, що и та v - одиничш нормоваш вектори, тобто ||w|| = 1, ||v|| = 1, тодi косинусну Mipy подiбностi можна виразити через евклщову вiдстань таким чином:

||м-v||2 =(и-v)T(u-v) = IUI2 + llvf -2uTv = 2-2uTv = " " ^ ^ J ........ (6)

= 2(1 - uTv) = 2(1 - (u, v>) = 2[1 - ||m|| |[v|| cos(u, v)] = 2[1 - cos(u, v)].

2.2. М'яка косинусна Mipa под1бност1

М'яка косинусна Mipa подiбностi - це Mipa м'яко' подiбностi мiж двома векторами, тобто ця мipa виражае подiбнiсть мiж парами характеристик (координат) вектоpiв. На вiдмiнy вiд звичайно'' косинусно'' мipи подiбностi, яка розглядае характеристики векторного простору як повшстю незалежш, м'яка косинусна мipa враховуе взаемозв'язок та подiбнiсть характеристик векторного простору, що, у свою чергу, дозволяе узагальнити поняття косинусно'1 мipи подiбностi.

Для обчислення м'яко'1 косинусно'1 мipи використовуеться матриця S подiбностi характеристик, елементами яко'1 можуть виступати будь-яю мipи подiбностi.

Для двох t -мipних вектоpiв u та v м'яка косинусна мipa розраховуеться за такою формулою:

Е

де si}. - similarity^feature feature j).

У випадку, якщо под1бносп mí ж характеристиками немае, тобто su — 1, .v;; - 0 для i Ф j), то формула (7) стае eKßi валентною формул! звичайноТ косинус-но'1' мipи (4).

Косинусна мipa та м'яка косинусна мipa подiбностi можуть використовуватися не тiльки в шформатищ та в задачах пошуку подiбних докyментiв, але й при знаходженш вза-емозв'язку мiж об'ектами в задачах кластеризацп та при класифшуванш гiпеpспектpaльних космiчних зображень.

2.3. Mipa Жаккара

Mipa Жаккара - це бшарна мipa подiбностi, запропонована Полем Жаккаром у 1901 рощ. Це перший вщомий коефщент подiбностi, який широко застосовуеться у таких напрямах, як шформатика, бiологiя, еколопя, пошук подiбних текстiв, геоботaнiкa. Також мipa Жак-кара використовуеться при виршенш задач дистaнцiйного зондування Земл^ зокрема, при визнaченнi нaйбiльш надшних спектральних кaнaлiв при клaсифiкyвaннi пперспектраль-них космiчних зображень [6-11].

Mipa Жаккара двох множин Ak та A¡ обчислюеться за такою формулою:

\А слА,\

sim2(Ak, 4) = Р-(8)

Коефiцiент Жаккара доpiвнюе вiдношенню кiлькостi елементiв перетину множин до кшькосп елементiв 1'хнього об'еднання. Приклад. Припустимо, ми маемо двi множини:

4 ={1,8,2,7,4,5}; А, ={3,9,8,6,4,1}.

Теда перетин множин Ак та А1 буде АкглАг = {1,8,4}. Об'еднання множин Ак та Аг: 4^4 ={1,2,3,4,5,6,7,8,9}.

Потужнiсть (кшьюсть елементiв) перетину множин Ак та 4 буде дорiвнювати "3", а потужшсть (кiлькiсть елементiв) об'еднання даних множин буде "9". Тод^ зпдно з формулою (8), коефiцiент Жаккара буде:

\А,слА\ 3 1

яш?(4,Д) = Н-т = - = - = 0,333.

2 * ' 4 и 4 9 3

Тепер наведемо ймовiрнiсну iнтерпретацiю мiри Жаккара:

5Ш2(4,4) = р(Лп4). У векторному виглядi коефiцiент Жаккара мае вигляд:

(9)

-^-г-, (Ю)

¿=1

де г/= (г/13...,и^, V = - вектори ознак об'екпв.

2.4. М1ра Серенсена-Дайса

М1ра Серенсена-Дайса - бiнарна мiра подiбностi, яка використовуеться для порiвняння двох об'ектсв. Була запропонована незалежно один вщ одного двома вченими Торвальдом Серенсом та Лi Раймондом Дайсом у 1948 та 1945 роках вщповщно [12-15].

М!ра Серенсена-Дайса двох множин обчислюеться за такою формулою:

2|4п4|

(п)

Ймовiрнiсна штерпретащя мiри Серенсена-Дайса:

. ^ ^ 2Р(АкпА) 31т3(Ак,4) = \* // (12)

Р(Ак) + Р(А1) У векторному виглядi даний коефiцiент мае вигляд:

= —--. (13)

2Х+Е

к=1

Слiд наголосити на тому, що мiра Серенсена-Дайса використовуеться при виршен-нi екологiчних задач, при сегментацп зображень, застосовуеться в медициш та шформати-цi.

2.5. Mipa перекриття (Overlap Coefficient)

Mipa перекриття вимiрюe перекриття мiж двома множинами та визначаеться як вщношен-ня кшькосп елементiв перетину двох множин до кшькосп елементiв rid множини, яка е меншою [16-18].

Mipa перекриття визначаеться за такою формулою:

simA{Ak,Al)= (14)

mmHM4P

Також слiд наголосити на тому, що, у випадку, коли одна i3 множин Ak чи Д е пустою, а друга - непуста множина, то тодi ix коефщент перекриття буде piвен "0".

У випадку, коли обидвi множини Ak та A[ е пустими, то ix коефiцiент перекриття буде piвен "1".

У векторному виглядi мipa перекриття розраховуеться за такою формулою:

t

^ukvk

sim4(u,v) =--;-. (15)

k=i

2.6. Асиметрична Mipa

Асиметрична мipa розраховуеться за такими формулами:

£min (uk,vk)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

sim5(u,v) = ——--, (16)

IX

£min (vk,uk)

sim5(v,u) - ——--, (17)

k=1

причому вирази (16) та (17) не е тотожними, оскшьки мipa подiбностi мiж векторами и та v не спiвпaдaе з мipою подiбностi мiж векторами v та и.

Асиметричш мipи виражають операцп включення мiж векторами. Тобто, вектор и включаеться до вектора v при умовi, якщо всi властивосп та характеристики, якi прита-манш вектору и, також будуть притаманш, у свою чергу, i вектору v.

Асиметрична мipa використовуеться в задачах пошуку та клaсифiкувaння об'ектив, де важливу роль грае iеpapxiчне розташування.

3. Приклади обчислення основних Mip подiбностi

Розрахуемо мipи подiбностi для двох таких вектоpiв:

и = (Х 1,2,3,0,1),

v = (0,0,1,0,2,2).

Для цього спочатку обчислимо суму координат кожного iз вектоpiв и та v :

—1 + 1 + 2 + 3 + 0 + 1 — 8,

к=1 t

^vk —0 + 0 + 1 + 0 + 2 + 2 — 5.

к=1

Далi обчислимо норми BeKTopiB u та v :

J]//; = л/l2 +12 + 22 + 32 + О2 +12 = >/Гб = 4,

(19)

¿v2 = л/о2 + О2 +12 + О2 + 22 + 22 =ф = 3.

yk

k=1

Розраховуемо скалярний добуток BeKTopiB u та v . Це буде сума добуткiв координат даних вeктopiв:

t

Х«Л=[(1.0) + (1.0) + (2.1) + (3.0) + (0.2) + (1.2)]=4. (20)

к=1

Тепер знаходимо суму мiнiмумiв координат вeктopiв u та v :

t

^ min (ик ,vk)= min(l, 0) + min(l, 0) + min(2,1) + min(3,0) + min(0,2) + min(l, 2) = 2. (21)

k=1

1) Використовуючи формулу (4) та вирази норм вeктopiв u та v (19), вираз для скалярного добутку (20), знаходимо косинусну мipу пoдiбнoстi:

t

У^ и1Уь

к к ^ 4 1

siwi (u,v)= , k=l = =-= — = - = 0,333.

n '' ' „ 4-3 12 3

EuiS

4

V

2) Використовуючи формулу (10), вирази (18) та (20), знаходимо мipу Жаккара:

2>л 4 4

(к, v) = --к-т-:-=-= - = о, 444.

^ ^ 8 + 5-4 9

2^uk+Lvk-2^ukvk

к=1 к=1

3) Згiднo з формулою (13), маемо мipу Серенсена-Дайса:

t

2У^1 г/,v,

| 2-4 8

simJu,v) = ————--=-= — = 0,615.

^b ^Ь 8 + 5 13

к=1 Аг=1

4) За формулою (15) розраховуемо мipу перекриття:

t

2>Л 4 4

sim4{u,v) =-^---=-= — = 0,8.

mm&.ZO min(8'5) 5

Аг=1 Аг=1

5) За формулами (16) та (17) знаходимо асиметричш мiри подiбностi BeKTopiB u

та v:

t

£min(Mt,vt)

sim.(u,v) = -- - - - - 0,25,

5 ^ 8 4

k=1

Uk

t

I>n(v,A) 2

sim5 (v,u) = ——;-= - = 0,4.

I

k=l

Vk

4. Висновки

У данш статтi було показано, що при виршенш задач класифiкування гiперспектральних космiчних зображень широко застосовуеться векторна модель, яка являе собою представ-лення об'екпв класифiкування у виглядi векторiв з одного спiльного векторного простору. При цьому наголошувалося на тому, що векторна модель е основою для розв'язку не тшь-ки задач шформацшного пошуку та класифшування документiв, а ще може бути застосо-вана при вирiшеннi задач ДЗЗ, а саме при класифшуванш супутникових зображень [1920].

Застосовуючи векторну модель та основнi мiри подiбностi, можна розв'язувати задачу подiбностi об'ектiв, що класифiкуються. При цьому при застосуванш векторних кла-сифiкаторiв близькiсть двох ознак може бути виражена як через вщстань, так i через мiру подiбностi.

У роботi були розглянутi i проаналiзованi основнi мiри подiбностi та ix властивостi. Розглядалися такi мiри подiбностi: косинусна мiра подiбностi, м'яка косинусна мiра подiб-ностi, мiра Жаккара, мiра Серенсена-Дайса, мiра перекриття, асиметрична мiра та наведенi приклади ix обчислення.

Було наголошено на тому, що розглянутi мiри подiбностi використовуються не тiльки при виршенш задач iнформацiйного пошуку, таких як класифшащя та пошук документ, а ще широко застосовуються у таких сферах, як шформатика, бюлопя, екологiя, геоботанiка та дистанцiйне зондування Земл^ а саме при виршенш задач класифiкування гiперспектральниx космiчниx зображень.

Запропонований тдхщ з використанням векторное! моделi та основних мiр подiбно-стi при класифiкуваннi супутникових зшмюв може застосовуватися при розв'язаннi рiзно-манiтниx природоресурсних, екологiчниx задач, при класифшуванш лiсiв, сшьськогоспо-дарських земель та при пошуку корисних копалин [21-22].

СПИСОК ДЖЕРЕЛ

1. Чандра А.М., Гош С.К. Дистанционное зондирование и геоинформационные системы. М.: Техносфера, 2008. 312 с.

2. Еремеев В., Мордвинцев И., Платонов Н. Современные гиперспектральные сенсоры и методы обработки гиперспектральных данных. Исследование Земли из космоса. 2003. № 6. С. 80-90.

3. Sidorov G., Gelbukh A., Gómez-Adorno H., Pinto D. Soft Similarity and Soft Cosine Measure: Similarity of Features in Vector Space Model. Computación y Sistemas. October 2014. Vol. 18, N 3. P. 491-504. DOI: 10.13053/CyS-18-3-2043 (retrieved 7).

4. Альперт С.1. Новий тдхщ до застосування основних мiр близькост та методу Роккю при вир> шенш задач класифшування. Астрономгчна школа молодих вчених: зб. праць XX^i' мiжнар. наук. конф. (Умань, 23-24 травня 2018 р.). Умань, 2018. С. 120-121.

5. Попов М.О. Сучасш погляди на штерпретащю даних аерокосм1чного дистанцшного зондування Земль KocMinna наука i технолог1я. 2002. Т. 8, № 2/3. C. 110-115.

6. Альперт С.1. Новий модифшований метод класифшування пперспектральних косм1чних зображень на основ1 теоpii Демпстера-Шейфера. Icтoрiя розвитку науки, техтки та oceimu за темою «Гуматстичний 3Miст мегaтехnoлoгiчnoгo cвiту»: зб. праць XV^i' М1жнар. молодiжноi наук.-практ. конф. (Кшв, 13 квгтня 2017 p.). Кшв, 2017. С. 97-99.

7. Jaccard P. Distribution de la flore alpine dans le Bassin des Dranses et dans quelques regions voisines. Bull. Soc. Vaudoise sci. Natur. 1901. Vol. 37, Bd. 140. P. 241-272.

8. Елисеева И.И., Рукавишников В.О. Группировка, корреляция, распознавание образов. Статистические методы классификации и измерения связей. М.: Статистика, 1977. 143 с.

9. Гарбук С., Гершензон В. Космические системы дистанционного зондирования Земли. М.: Изд-во А и Б, 1997. 296 с.

10. Попов М., Станкевич С. Методы оптимизации числа спектральных каналов в задачах обработки и анализа данных дистанционного зондирования Земли. Современные проблемы дистанционного зондирования земли из космоса. М.: ИКИ РАН, 2006. Т. 2, № 1. С. 61-63.

11. Аковецкий В.И. Дешифрирование снимков. М.: Недра, 1983. 320 с.

12. S0rensen T. A method of establishing groups of equal amplitude in plant sociology based on similarity of species and its application to analyses of the vegetation on Danish commons. Biologiske Skrifter, Kongelige Danske Videnskabernes Selskab. 1948. Vol. 5, N 4. P. 1-34.

13. Looman J. Adaptation of Sorensen's K for estimating unit affinities in prairie vegetation. Ecology. 1960. Vol. 41, N 3. P. 409-416.

14. Bongasser M., Hungate W.S., Watkins R. Hyperspectral Remote Sensing: Principles and Applications. Boca Raton, FL: CRC Press, 2008. 119 p.

15. Альперт С.1. Новий удосконалений тдхщ до комбшування даних на основi теорп Демпстера-Шейфера. 1дег та новацИ' в cиcтемi наук про Землю: зб. мaтеpiaлiв Vll^i Всеукр. молодiжноi наук. конф. (Кшв, 25-27 жовтня 2017 р.). Кшв, 2017. С. 26-27.

16. Vijaymeena M.K., Kavitha K. A Survey on Similariy Measures in Text Mining. Machine Learning and Applications. An International Journal. 2016. Vol. 3, N 1. P. 19-28. D0I:10.5121/mlaij.2016.3103.

17. McCoy R.M. Fields Methods in Remote Sensing. New York: Guilford Press, 2005. P. 150-160.

18. Chang C.-I. Hyperspectral Data Processing: Algorithm Design and Analysis. Hoboken, NJ: John Willey & Sons, 2013. 1164 p.

19. Попов М.А., Альперт С.И., Подорван В.Н. Метод классификации космических изображений с использованием подхода Демстера-Шейфера. Исследование Земли из космоса. 2016. № 5. С. 26-37.

20. Альперт С.1. Поpiвняння нового удосконаленого тдходу до комбшування суперечливих даних з правилом Ягера. Украгнський журнал дистанцтного зондування Землi. 2018. № 17. С. 14-17. URL: http://www. http://uj rs.org.ua/uj rs.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

21. Корн Г., Корн Т. Справочник по математике. М.: Наука, 1974. 831 с.

22. Renyi A. Probability theory. Amsterdam, North - Holland Pub. Co, 1970. 670 p.

Стаття надтшла до редакцп 22.11.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.