Научная статья на тему 'Удосконалений метод комбінування даних на основі теорії Демпстера-Шейфера за наявності суперечливих даних'

Удосконалений метод комбінування даних на основі теорії Демпстера-Шейфера за наявності суперечливих даних Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
104
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕОРИЯ СВИДЕТЕЛЬСТВ / EVIDENCE THEORY / ПРАВИЛА КОМБИНАЦИИ / COMBINATION RULES / ПРОТИВОРЕЧИВЫЕ СВИДЕТЕЛЬСТВА / CONFLICTING EVIDENCE / ПРАВИЛО ДЕМПСТЕРА / DEMPSTER’S RULE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Альперт С. І.

Правило комбинации Демпстера является наиболее известным правилом комбинации, поскольку оно оперирует с неполными и неточными данными. Но данное правило не может работать при наличии слишком противоречивой информации. Правило комбинации Мерфи может оперировать с противоречивыми частями свидетельства, оно считает среднюю базовую массу. Но этот метод тоже имеет определенный недостаток, поскольку не учитывает взаимосвязь между свидетельствами. Поэтому было предложено новое усовершенствованное правило комбинации, основанное на теории Демпстера-Шейфера, которое простое для вычислений и имеет высокую точность.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Dempster’s rule of combination is the most popular rule of combinations, because it processes incomplete and uncertain data. But this rule can not deal with highly conflicted information. Combination method of Murphy can deal with conflicting bodies of evidence, it calculates the mean of the basic probability assignment. But this method also has some disadvantage. Correlation among various evidences is not taken into account. It was proposed a new improved combination method. Based on the Dempster-Shafer theory, a new method has the advantage of simple calculation and high accuracy.

Текст научной работы на тему «Удосконалений метод комбінування даних на основі теорії Демпстера-Шейфера за наявності суперечливих даних»

УДК 528.06 С.1. АЛЬПЕРТ*

УДОСКОНАЛЕНИЙ МЕТОД КОМБ1НУВАННЯ ДАНИХ НА ОСНОВ1 ТЕОР11 ДЕМПСТЕРА-ШЕЙФЕРА ЗА НАЯВНОСТ1 СУПЕРЕЧЛИВИХ ДАНИХ

Науковий Центр аерокосмiчних дослiджень Землi 1ГН НАН Украши, м. Кшв, Украша

Анотаця. Правило комбгнацИ Демпстера е найбыьш вгдомим правилом комбгнацИ, оскшьки воно оперуе з неповними та неточними даними. Але дане правило не може працювати за наявност1 за-надто суперечливог тформацИ Правило комб1нацИ' Мерф1 може оперувати з суперечливими час-тинами св1дчення, воно розраховуе середню базову масу. Але цей метод також мае певний недолт, оскшьки не враховуе взаемозв 'язок м1ж св1дченнями. Тому було запропоноване нове вдосконалене правило комбтацИ, засноване на теорИ Демпстера-Шейфера, яке просте для обчислень i мае ви-соку точтсть.

Ключовi слова: теорiя свiдчень, правила комбiнацiг, суперечливi свiдчення, правило Демпстера.

Аннотация. Правило комбинации Демпстера является наиболее известным правилом комбинации, поскольку оно оперирует с неполными и неточными данными. Но данное правило не может работать при наличии слишком противоречивой информации. Правило комбинации Мерфи может оперировать с противоречивыми частями свидетельства, оно считает среднюю базовую массу. Но этот метод тоже имеет определенный недостаток, поскольку не учитывает взаимосвязь между свидетельствами. Поэтому было предложено новое усовершенствованное правило комбинации, основанное на теории Демпстера-Шейфера, которое простое для вычислений и имеет высокую точность.

Ключевые слова: теория свидетельств, правила комбинации, противоречивые свидетельства, правило Демпстера.

Abstract. Dempster's rule of combination is the most popular rule of combinations, because it processes incomplete and uncertain data. But this rule can not deal with highly conflicted information. Combination method of Murphy can deal with conflicting bodies of evidence, it calculates the mean of the basic probability assignment. But this method also has some disadvantage. Correlation among various evidences is not taken into account. It was proposed a new improved combination method. Based on the Dempster-Shafer theory, a new method has the advantage of simple calculation and high accuracy. Keywords: evidence theory, combination rules, conflicting evidence, Dempster's rule.

1. Вступ

За останне десятил1ття задача об'еднання даних, отриманих i3 р1зних джерел, стала особливо актуальною, оскшьки знаходить широке застосування у таких сферах, як обробка, аналiз та класифшування зображень, виршення сшьськогосподарських, ресурсознавчих, еколопчних задач, вшськова справа.

У данш статп буде розглянуто декшька методiв об'еднання даних, отриманих iз рь зних суперечливих джерел шформацп. Буде наголошено на тому, що, не зважаючи на чис-ленш переваги правила комбшацп Демпстера, його не можна застосовувати за наявносп суперечливо'1 шформацп, оскшьки у цьому випадку дане правило дае невiрнi результати.

Буде розглянуто метод усереднення Мерфi для тдрахунку середньо! базово! маси гшотез, який може оперувати iз суперечливими даними. Описуються переваги та недолши даного методу.

У данш робот буде запропоновано новий удосконалений метод комбшування даних за наявносп суперечливих джерел шформацп, який, на вщмшу вщ методу Мерф^ враховуе корелящю мiж рiзними свщченнями та ефективно виршуе задачу комбшування даних [1-4].

© Альперт С.1., 2018

ISSN 1028-9763. Математичш машини i системи, 2018, № 2

2. Основш положення теорн Демпстера-Шейфера

За останнш час застосування теорп Демпстера-Шейфера (ТДШ) дозволило досить успiшно виршити багато задач, якi потребували об'еднання шформацп i3 рiзних джерел.

Математичний апарат теорп Демпстера-Шейфера дае можливють працювати в умо-вах забрудненосп та неповноти даних 3i складними гипотезами, пропонуе просте правило для комбшування даних вiд рiзних джерел (спектральних каналiв), дозволяе будувати ш-тервальнi оцiнки достовiрностi гiпотез. У ТДШ ключовим поняттям е поняття "маси" (mass), яке е узагальненням класичного поняття ймов1рносп. Масою можна вщокремити поняття вщсутносп дов1рп вщ недов1рп. Нехай Д, - обмежена множина, а Д (/ = 1,2,...) -його тдмножини, тодi базова ймовiрнiсть визначаеться через функцiю m :

т(0) = О,

J] тЦ) = 1, (/ = 0,1,2,...). (1)

4

Нехай m i m2 - базовi ймовiрностi гiпотези, отримано'1' з незалежних доведень, а Ль та A2j (/, j = 0,1,2,...) - вщповщш центральш елементи (да(Д.) > 0, т(А2/) > 0) • Тод1 правило

комбшацп Демпстера задае нову базову ймовiрнiсть, яку можна представити за допомогою тако'1' формули:

m(Ak) = A^A -, (2)

де ( '= £ щ(А1г )т2(А2/) к°Фц1ент конфлжтностк (3)

А11слАг]=®

Коефiцieнт конфлштносп С вказуе, наскiльки суперечливими мiж собою е джерела шформацп (спектральш канали). С лежить в штерваш [0; 1], чим сильнiше щ протирiччя, тим ближче до одинищ стае величина С [5-11].

3. Комбшащя даних, отриманих 1з суперечливих джерел шформащ!'

Правило комбшацп Демпстера мае таю двi важливi математичш властивостi, як комутати-внiсть та асощатившсть.

Але правило комбшацп Демпстера мае певний недолш. Його не можна застосовува-ти при занадто суперечливих джерелах шформацп, оскiльки за наявносп великого значен-ня коефщента конфлiктностi дане правило дае невiрнi результати.

Тому в 2000 рощ Мерфi було запропоновано метод для тдрахунку середньо'' базо-во'' маси для кожно'' гiпотези. Цей метод усереднюе усi базовi маси, отримаш з п частин свiдчення, а потсм iтерацiйно комбiнуе новi усереднеш базовi маси для кожно'' гшотези за правилом комбшацп Демпстера. У порiвняннi з iншими пiдходами метод Мерфi може опе-рувати iз суперечливими свiдченнями.

Розглянемо випадок, коли в нас е п базовi маси: щ(а),т2(а),...,тп(а). Використовуючи пiдхiд усереднення Мерф^ маемо:

. . т,(а) + тп(а) +... + т (а) , ч

т(а) = —^-2—-^, (4)

п

де а - деяка ппотеза. Метод Мерфi працюе з суперечливими джерелами шформацп, але цей метод також мае певний недолш. Вш не враховуе корелящю (взаемозв'язок) мiж рiз-

ними свщченнями, що, у свою чергу, призводить до незадовшьного вирiшення задачi об'еднання суперечливих даних. Метод усереднення Мерфi ефективно вирiшуe задачу комбшування суперечливих свiдчень, але звичайне усереднення не завжди дае надiйнi результата, особливо у випадку, коли кшькють свщчень е недостатньою для прийняття рь шення. Причина цього полягае в тому, що просте усереднення не враховуе асощативний зв'язок мiж свщченнями, отриманими з рiзних джерел.

Тому у даному випадку пропонуеться використовувати новий модифшований метод комбшування даних за наявносп великого значення коефщента конфлштносп на основi ТДШ [12-17].

4. Новий модифжований метод комбшування даних за наявност великого значення коефiцieнта конфлiктностi

Представлений метод складаеться з 7 етатв.

1) Визначаемо вщстань мiж двома частинами свщчення mi and my :

dBPA(m,mjmil2+\mj\2 ~2(m>mj))' d

'2

BPA

[0Д].

2* 2*

{m„mj)=Yilm'(Ak)mMi)

k=\ 1=1

|4n4| |4^4|

(5)

(6)

де П Л - коефiцiент Жаккара двох множин Ak та Аг.

Коефiцiент Жаккара дорiвнюе вiдношенню кшькосп елементiв перетину множин до кшькосп елементiв 1хнього об'еднання. Був запропонований Полем Жаккаром у 1901 рощ. У формулi (6) на коефщент Жаккара множиться кожен доданок окремо.

Imi ||2 = {mi - звичайна евклщова норма.

2) Визначаемо мiру подiбностi мiж двома частинами свiдчення mt and my :

sim(mj, rrij) = 1 — d(mi., m^). (7)

3) Припускаемо, що число частин свщчення - n . Будуемо матрицю подiбностi:

SMM =

1

12 1

Sn\ Sn2

Jln

1

(8)

4) Функцiя пiдтримки кожно'1 частини свiдчення щ визначаеться, як

Sup(mi) = ¿j.., / = 1,2,..., п.

3 = 1

(9)

5) Здiйснюючи об'еднання даних, ми прагнемо дiзнатися, яке саме свщчення (спектраль-

ний канал), що ми використовуемо, е надшним. Можливим е випадок, що одна частина свщчення е важлившою за шшу, i кожна частина свiдчення мае свою певну вагу у цшому свщченш. Наприклад, пiд час тривалих вимiрювань деякi сенсори можуть бути бшьш на-дiйнiшими за iншi завдяки високiй стабiльностi. Таким чином, сенсори можуть вiдрiзняти-ся за ступенем надшносп. Ось чому процедура надання ваги свщченню е досить важли-

вою, особливо, коли свщчення, отримат з рiзних сенсорiв, мають високий коефщент кон-флiктностi. У цьому випадку задача полягае в тому, щоб визначити серед усiх свiдчень, яке з них е бшьш надшним, а якому можна придiлити менше уваги. Надiйним шляхом вирь шення дано'1 задачi е такий: якщо певна частина свiдчення знаходить пщтримку в iнших свiдченнях, то тодi дане свiдчення буде мати бшьшу вагу, нiж та частина свщчення, яка мае високий стутнь розбiжностi (протирiччя) з iншими свiдченнями. Беручи за основу дане правило, опишемо «стутнь надшносп» свiдчення, яке е вагою й вщображае важливють кожно'1 частини свiдчення.

Надiйнiсть кожно'1 частини свiдчення щ визначаеться, як

сы^—Р(Ш)

XSUP (щ)

i=1

n

Звщси також маемо ^ Crdi = 1. Зпдно з формулами (7) та (9), ми можемо зробити

висновок, що, чим коротша вiдстань вiд дано! частини свщчення до шших частин свщчен-ня, тим бшьшим е ступiнь пщтримки (функцiя пiдтримки) дано! частини свщчення. Якщо частина свщчення отримуе значну пщтримку у шших частин свщчення, то !! стутнь надшносп е високим, i вона буде мати бшьший вплив на кшцевий результат об'еднання да-них. Навпроти, якщо певна частина свщчення суперечить шшим свщченням, то !! стутнь надшносп - низький, отже, ця частина свщчення мае значно менший вплив на кшцевий результат комбшацп даних, отриманих з рiзних джерел. Таким чином, стутнь надшносп -це вага, яка е шдикатором важливосп даного свiдчення.

6) Коефщент ваги тм свiдчення для певно! гiпотези a :

п

ти (a) = YJ( 'i-c/(mi )x 171(a). (11)

i—\

7) Дал1, використовуючи правило Демпстера, комбшуемо коефщ1енти ваги (11) п - 1 раз за умови, якщо ми маемо n частин свiдчення.

Псевдокод

n: number of images Si

For / := 1 to n For j := 1 to n

S is a vector of images S

begin

write С St ='); readln (Si); write ('Sj ='); readln (S.);

writeln ("шукаемо вiдстань мiж спектральними каналами S та Sj: (mi,щ) readln (dBPA (щ, щ));

end. begin

writeln ("шукаемо функцiю подiбностi мiж парами спектральних каналiв St та S.: sim (щ, m ) ");

readln (sim (щ , m.)); end.

Program Matrix ("будуемо матрицю подiбностi")

type Tindex=1,..., n*

Vector=array [Tindex]of real;

Matrix =array[Tindex] of vector;

var sim: matrix;

action: real;

n,m (n = m): tindex;

procedure Matrix Input S (var sim: Matrix);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

var i, j: real;

begin

writeln ("Введ1ть", их и, "елеменпв"); for / := 1 to n do for j := 1 to n do begin

write ('sim['J,'.',j,'] = );

read (sim[i, j]);

end.

For i := 1 to n do begin

s:=0

for j:-1 to n do 5 := 5 + sim[i, j]

writeln ("рахуемо функцiю пiдтримки i -го свщчення, тобто рахуемо суму елемешив у рядку матриц S "); end.

For / := 1 to п S is a vector of images St

Sort S begin

writeln ("рахуемо функцп надшносп для всiх свiдчень: Crd (mi) "); readln ( Crd (щ));

writeln ("рахуемо зважеш середнi базовi маси (коефщенти ваги) для всiх гiпотез:

mM(А) mM(B),...");

readln (Щм(А), Щм(B),...); end.

For / := 1 to п — 1 do begin

writeln ("знаходимо новi базовi маси для вах гiпотез, комбiнуючи коефщенти ваги за правилом Демпстера: m*(A), m*(B),... "); readln (m*(A), m*(B),...); end.

5. Висновки

У данш poGoTÍ було розглянуто та проаналiзовано декiлька методiв об'еднання даних, отриманих з pÍ3HHx джерел. Було показано, що правило комбшацп Демпстера не можна застосовувати за наявносп занадто суперечливих джерел шформацп, oскiльки воно дае не-вipнi результати. Було описано альтернативний метод усереднення Мерф^ який може опе-рувати суперечливими даними та давати кpащi результати, нiж правило комбшацп Демпстера. Але також було зазначено, що i метод Меpфi мае певний недолш, оскшьки не врахо-вуе асoцiативний зв'язок мiж свiдченнями.

Тому в данш робот було запропоновано новий метод комбшування даних, який вь дображае асощативний взаемозв'язок мiж свiдченнями, враховуе вщстань мiж свiдченнями i може ефективно оперувати за наявносп занадто суперечливих свщчень [18-20].

У майбутньому запропонований метод об'еднання даних, отриманих iз суперечливих джерел, буде використовуватися при розв'язанш задач класифшування лiсiв, урбашзо-ваних теpитopiй, сшьськогосподарських земель, при пошуку корисних копалин та розв'язанш piзнoманiтних природоресурсних задач.

СПИСОК ДЖЕРЕЛ

1. Hegarat-Mascle S. Application of Dempster-Shafer Evidence Theory to Unsupervised Classification in Multisource Remote Sensing / S. Hegarat-Mascle, I. Bloch, D. Vidal-Madjar // IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING. - 1997. - Vol. 35, N 4. - P. 1018 - 1031.

2. Shafer G. A Mathematical Theory of Evidence / Shafer G. - Princeton, NJ: Princeton University Press, 1976. - P. 875 - 883.

3. Попов М.О. Сучасш погляди на штерпретацда даних аерокосм1чного дистанцшного зондування Земл1 / М.О. Попов // Косм1чна наука i технолопя. - 2002. - Т. 8, № 2/3. - C. 110 - 115.

4. McCoy R.M. Fields Methods in Remote Sensing / McCoy R.M. - New York: Guilford Press, 2005. -P. 150 - 160.

5. Чандра А.М. Дистанционное зондирование и геоинформационные системы / А.М. Чандра, С.К. Гош. - М.: Техносфера, 2008. - 312 с.

6. Еремеев В. Современные гиперспектральные сенсоры и методы обработки гиперспектральных данных / B. Еремеев, И. Мордвинцев, Н. Платонов // Исследование Земли из космоса. - 2003. -№ 6. - С. 80 - 90.

7. Альперт С.1. Новий модифшований метод класифшування гшерспектральних косм1чних зобра-жень на основ1 теорп Демпстера-Шейфера / С.1. Альперт // Зб. праць XV-oi' М1жнар. молод1жно! наук.-практ. конф. «1стор1я розвитку науки, техшки та освгги» за темою «Гумашстичний змют ме-гатехнолопчного свггу», (Кшв, 13 кв1тня 2017 р.). - Кшв, 2017. - С. 97 - 99.

8. Гарбук С. Космические системы дистанционного зондирования Земли / С. Гарбук, В. Гершензон. - М.: Изд-во А и Б, 1997. - 296 с.

9. Попов М. Методы оптимизации числа спектральных каналов в задачах обработки и анализа данных дистанционного зондирования Земли / М. Попов, С. Станкевич // Современные проблемы дистанционного зондирования земли из космоса. - М.: ИКИ РАН, 2006. - Т. 2, № 1. - С. 61 - 63.

10. Аковецкий В.И. Дешифрирование снимков / Аковецкий В.И. - М.: Недра, 1983. - 320 с.

11. Bongasser M. Hyperspectral Remote Sensing: Principles and Applications / M. Borengasser, W.S. Hungate, R. Watkins. - Boca Raton, FL: CRC Press, 2008. - 119 p.

12. Альперт C.I. Новий удосконалений тдхщ до комбшування даних на основ1 теорп Демпстера-Шейфера / C.I. Альперт // Зб. матер1ал1в VII-oi Всеукр. мoлoдiжнoi наук. конф. «^i та новацй в систем1 наук про Землю», (Кшв, 25-27 жовтня 2017 р.). - Кшв, 2017. - С. 26 - 27.

13. Chang C.-I. Hyperspectral Data Processing: Algorithm Design and Analysis / Chang C.-I. - Hoboken, NJ: John Willey & Sons, 2013. - 1164 p.

14. Beynon M.J. The Dempster-Shafer theory of evidence: an alternative approach to multicriteria decision modeling / M.J. Beynon, B. Curry, P. Morgan // Omega: Int. Journal of Management Science. -2000. - Vol. 28, N 1. - P. 37 - 50.

15. Taroun A. Dempster-Shafer Theory of Evidence: Potential usage for decision making and risk analysis in construction project management / A. Taroun, J.B. Yang // The Built & Human Environment Review. - 2011. - Vol. 4, Special Issue 1. - P. 155 - 166.

16. Корн Г. Справочник по математике / Г. Корн, Т. Корн. - М.: Наука, 1974. - 831 с.

17. Barnett J.A. Calculating Dempster-Shafer plausibility / J.A. Barnett // IEEE Trans. Pattern Anal. Machine Intell. - 1991. - Vol.13. - P. 599 - 602.

18. Renyi A. Probability theory / Renyi A. - Amsterdam: North-Holland Pub. Co, 1970. - 670 p.

19. Dempster A. Upper and lower probabilities induced by a multivalued mapping / A. Dempster // Annals of Mathematical Statistics. - 1967. - Vol. 38, N 2. - P. 325 - 339.

20. Zhang L. Representation, independence and combination of evidence in the Dempster-Shafer Theory of Evidence / L. Zhang // Advances in the Dempster-Shafer Theory of Evidence. Edited by R.R. Yager, J. Kacprzyk, M. Ftdrizzi. - New York: John Wiley & Sons, 1994. - P. 51 - 69.

Стаття над1йшла до редакцп 17.04.2018

i Надоели баннеры? Вы всегда можете отключить рекламу.