Научная статья на тему 'Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера'

Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
75
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
интеграция / геопространственные данные / интероперабельность / неопределенность / согласованность гипотез / конфликтность источников / теория свидетельств ДемпстераШейфера. / integration / geospatial data / interoperability / uncertainty / hypotheses coordination / conflicts of sources / Dempster-Shafer theory of evidence

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — М. О. Попов, Л. М. Артюшин, М. В. Топольницький, О. В. Титаренко, Ю. В. Шморгун

В статье рассматривается подход к интегрированию гетерогенных геопространственных данных на базе единой научно-методической платформы – теории свидетельств Демпстера-Шейфера. Приведена структурно-логическая схема интегрирования гетерогенных геопространственных данных, суть которой сводится к последовательному интегрированию таких данных на трех базовых уровнях: физическом, логико-семантическом и принятия решений. Проанализированы особенности интегрирования гетерогенных геопространственных данных на физическом, логико-семантическом уровнях, а также специфика их интегрирования на уровне гипотез (решений) в рамках теории свидетельств Демпстера-Шейфера, которая заключается в необходимости релевантного описания конфликта, который потенциально может возникнуть при наличии противоречивых свидетельств (гипотез) и получении интервальной оценки вероятности наступления события, что в свою очередь предусматривает разработки или выбор определенных правил, которые позволяют ее точно рассчитать в определенном интервале. Кроме того, приведены общие ограничения интегрирования, сформулированы новые подходы к оценке эффективности выполнения тематических заданий, которые сводятся к определению уровня неопределенности на трех разных уровнях: информационных источников, скомбинированных (интегрированных) распределений гипотез и принятия решений. Предложена структурно-логическая схема нового метода, который дает возможность учитывать коррелированность и согласованность гипотез, конфликтность источников геопространственных данных, а также представлены примеры интегрирования геопространственных данных классическим (комбинационное правило Демпстера) и авторским методами при решении задач поиска месторождений углеводородов, идентификации компактных искусственных объектов. Подтверждена эффективность предложенного метода, определены условия и ограничения его применения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article deals with an approach towards integration of geospatial data based on the unified research and methodical platform – the Dempster-Shafer theory of evidence. The article presents a structural chart of heterogeneous geospatial data integration which enables a consecutive integration of such data at three basic levels: physical, logical-semantic and decision-making. It analyzes peculiarities of heterogeneous geospatial data integration at physical and logical-semantic levels as well as particulars of their integration at the level of hypotheses (decisions) within the Dempster-Shafer theory of evidence which envisages a relevant conflict description that can potentially break out in case of controversial evidences (hypotheses) as well as obtaining interval evaluation of the event likelihood of occurrence, which, in its turn, requires development and selection of certain rules allowing its precise calculation in the determined interval. Besides, the article sets forth general limitations of integration and new approaches to efficiency of topical tasks evaluation that basically include calculation of the uncertainty levels at three different levels: information sources, combined (integrated) distributions of hypotheses and decisionmaking. The article presents a structural-logical chart of a new approach enabling to consider hypotheses correlation and coordination, conflicts of geospatial data sources. It also provides examples of geospatial data integration to classical (the Dempster’s combination rule) and author’s methods during search for hydrocarbon deposits and identification of compact artificial objects. The article proves the efficiency of the proposed method. It defines conditions and restrictions for its use.

Текст научной работы на тему «Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера»

https://orcid.org/0000-0003-1738-8227 https://orcid.org/0000-0002-7488-7244 https://orcid.org/0000-0002-4848-3270 https://orcid.org/0000-0001-5804-1022 https://orcid.org/0000-0001-5283-5155

УДК 528.854:519.722:004.93:004.62

М.О. ПОПОВ*, Л.М. АРТЮШИН**, М.В. ТОПОЛЬНИЦЬКИЙ***, О.В. ТИТАРЕНКО*,

Ю.В. ШМОРГУН****

1НТЕГРУВАННЯ ГЕТЕРОГЕННИХ ГЕОПРОСТОРОВИХ ДАНИХ НА ОСНОВ1

ТЕОРП СВ1ДЧЕНЬ ДЕМПСТЕРА-ШЕЙФЕРА

Науковий Центр аерокосмiчних дослiджень Землi 1ГН НАН Украни, м. Кшв, Украша Державний науково-дослiдний iнститут аыацп, м. Кшв, Украша Военно-дипломатична академiя iMeHi £вгешя Березняка, м. Кшв, Украша

Кшвський нацiональний унiверситет iMem Тараса Шевченка, м. Кшв, Украша_

Анотаця. У статтг розглядаеться тдхгд до 7нтегрування гетерогенних геопросторових даних на баз1 единог науково-методичног платформи - теорИ св1дчень Демпстера-Шейфера. Наведено структурно-лог1чну схему ¡нтегрування гетерогенних геопросторових даних, суть яког зводиться до посл1довного ¡нтегрування таких даних на трьох базових р1внях: ф1зичному, лог1ко-семантичному та прийняття р1шень. Проанал1зовано особливост1 ¡нтегрування гетерогенних геопросторових даних на ф1зичному, лог1ко-семантичному р1внях та специф1ку гх ¡нтегрування на р1вт гтотез (р1шень) у рамках теорИ св1дчень Демпстера-Шейфера, яка полягае у необх1дност1 релевантного опису конфл1кту, що потенщйно може виникнути при наявност1 суперечливих св1д-чень (г1потез) та отримант ттервальног ощнки ймов1рност1 настання поди, що у свою чергу пе-редбачае розробки або обрання певних правил, якг дозволяють гг точно розрахувати у визначеному Штервал1. Кр1м того, приведено загальн обмеження ¡нтегрування та сформульовано нов1 тдходи до ощнки ефективност1 виконання тематичних завдань, якг зводяться до обрахунку р1вня неви-значеност1 на трьох р1зних р1внях: тформацтних джерел, скомб1нованих (ттегрованих) розпод1-л1в г1потез та прийняття р1шень. Запропоновано структурно-лог1чну схему нового методу, який дае змогу враховувати корельовамсть 7 узгоджемсть г1потез, конфлтттсть джерел геопросторових даних, та представлено приклади ¡нтегрування геопросторових даних класичним (комб1на-ц1йне правило Демпстера) 7 авторським методами при виршенш задач пошуку родовищ вуглевод-мв та ¡дентифтацп компактних штучних об 'ект1в. Ыдтверджено ефективмсть запропоновано-го методу, визначено умови 7 обмеження його застосування.

Ключовi слова: ¡нтегрування, геопросторов1 дам, ттероперабельтсть, невизначемсть, узгодже-мсть г1потез, конфлтттсть джерел, теор1я св1дчень Демпстера-Шейфера.

Аннотация. В статье рассматривается подход к интегрированию гетерогенных геопространственных данных на базе единой научно-методической платформы - теории свидетельств Демп-стера-Шейфера. Приведена структурно-логическая схема интегрирования гетерогенных геопространственных данных, суть которой сводится к последовательному интегрированию таких данных на трех базовых уровнях: физическом, логико-семантическом и принятия решений. Проанализированы особенности интегрирования гетерогенных геопространственных данных на физическом, логико-семантическом уровнях, а также специфика их интегрирования на уровне гипотез (решений) в рамках теории свидетельств Демпстера-Шейфера, которая заключается в необходимости релевантного описания конфликта, который потенциально может возникнуть при наличии противоречивых свидетельств (гипотез) и получении интервальной оценки вероятности наступления события, что в свою очередь предусматривает разработки или выбор определенных правил, которые позволяют ее точно рассчитать в определенном интервале. Кроме того, приведены общие ограничения интегрирования, сформулированы новые подходы к оценке эффективности выполнения тематических заданий, которые сводятся к определению уровня неопределенности на трех разных уровнях: информационных источников, скомбинированных (интегрированных) распределений гипотез и принятия решений. Предложена структурно-логическая схема нового метода, который дает возможность учитывать коррелированность и согласованность гипотез, конфликтность источников геопространственных данных, а также представлены примеры интегрирования геопространственных данных классическим (комбинационное правило Демпстера) и

© Попов М.О., Артюшин Л.М., Топольницький М.В., Титаренко О.В., Шморгун Ю.В., 2019 ISSN 1028-9763. Математичш машини i системи, 2019, № 3

авторским методами при решении задач поиска месторождений углеводородов, идентификации компактных искусственных объектов. Подтверждена эффективность предложенного метода, определены условия и ограничения его применения.

Ключевые слова: интеграция, геопространственные данные, интероперабельность, неопределенность, согласованность гипотез, конфликтность источников, теория свидетельств Демпстера-Шейфера.

Abstract. The article deals with an approach towards integration of geospatial data based on the unified research and methodical platform - the Dempster-Shafer theory of evidence. The article presents a structural chart of heterogeneous geospatial data integration which enables a consecutive integration of such data at three basic levels: physical, logical-semantic and decision-making. It analyzes peculiarities of heterogeneous geospatial data integration at physical and logical-semantic levels as well as particulars of their integration at the level of hypotheses (decisions) within the Dempster-Shafer theory of evidence which envisages a relevant conflict description that can potentially break out in case of controversial evidences (hypotheses) as well as obtaining interval evaluation of the event likelihood of occurrence, which, in its turn, requires development and selection of certain rules allowing its precise calculation in the determined interval. Besides, the article sets forth general limitations of integration and new approaches to efficiency of topical tasks evaluation that basically include calculation of the uncertainty levels at three different levels: information sources, combined (integrated) distributions of hypotheses and decision-making. The article presents a structural-logical chart of a new approach enabling to consider hypotheses correlation and coordination, conflicts of geospatial data sources. It also provides examples of geospatial data integration to classical (the Dempster's combination rule) and author's methods during search for hydrocarbon deposits and identification of compact artificial objects. The article proves the efficiency of the proposed method. It defines conditions and restrictions for its use.

Keywords: integration, geospatial data, interoperability, uncertainty, hypotheses coordination, conflicts of sources, Dempster-Shafer theory of evidence.

DOI: 10.34121/1028-9763-2019-3-35-46

1. Вступ

Як свщчить досвщ виршення природоресурсних, сшьськогосподарських, наукових, обо-ронних та шших складних задач, виникае потреба у залученш рiзномаштноi шформаци щодо об'екпв штересу. Це, в залежносп вщ потреб, може бути геолопчна, геофiзична, оп-тична, радюлокацшна та шша шформащя. Для ii отримання використовуються вщповщш датчики, сенсори, бази даних. Особливо важливу роль ввдграють геопросторовi даш (ГПД), яю формуються на основi матерiалiв аерокосмiчноi та наземно'1' зйомки, рiзномашт-них карт, GPS-приладiв тощо.

У статп представлено системний тдхщ до штегрування ГПД, розглянуто структур-но-лопчну схему штегрування, особливосп проведення штегрування на рiзних рiвнях, об-меження штегрування, тдходи до оцшки ефективносп виконання тематичних завдань та приклади ix виршення на основi теорп свщчень Демпстера-Шейфера (ТСДШ).

2. Постановка задач1

Вивчення об'екта штересу та прийняття ршень щодо його стану або подальшо'1' поведшки потребуе наявносп единой узгоджено'1' шформацшно'1' модель Створюеться така модель у результат аналiзу шформацп, що отримуеться шляхом комплексування (штегрування) ге-терогенних даних вiд рiзниx джерел. Але при цьому юнують двi проблеми.

Перша проблема полягае у тому, що датчики геопросторових та шших необхщних даних мають рiзну фiзичну природу, внаслiдок чого даш можуть бути кшькюними, описо-вими (номiнальними), аналоговими, цифровими тощо. Вони можуть мати рiзну достовiр-нiсть i точнiсть, вiдрiзнятись масштабом, вимiрнiстю (2D, 3D), форматом представлення. Тобто, при виршенш зазначених вище задач неминуче мають справу з гетерогенними да-ними.

Друга проблема полягае у тому, що трансформування даних в шформащю та ïï ком-плексування для послщуючого прийняття рiшень - багатоетапний лопко-обчислювальний процес, можливостi автоматизацп якого внаслщок його суттевоï складностi досить обме-женi. Тому на сучасному етат розвитку iнформацiйних технологiй цей процес може бути реалiзований лише за участю людини.

1нтегрування гетерогенних ГПД в таких умовах неможливо без вщповщно'1' науково-методично'1' платформи.

Метою cmammi е обгрунтований вибiр тако'1' платформи та розроблення на ïï базi нового пiдходу до штегрування гетерогенних ГПД.

3. Аналп можливих шля\1в вир1шення задач!

Моделi i методи, яю розробляються для виршення складних науково-прикладних задач, звичайно спираються на математичний iнструментарiй або теорп ймовiрностей i статисти-чних ршень, або теорп нечiтких множин. Кожен iз цих шструментарпв мае сво'1' особливо-стi i нiшу застосування.

Застосування ймовiрнiсно-статистичних методiв можливе лише за умови наявносп достатньо великих вибiрок даних, що описують властивосп об'екта дослiдження, причому областi значень таких даних тдпорядковуються певним iмовiрнiсним розподiлам. Ще одним недолгом iмовiрнiсно-статистичних методiв е ïx неспроможшсть обробляти супереч-ливi данi та даш, вщносно яких вiдсутня будь-яка шформащя, тобто фактично юнуе «не-знання» щодо об'екта дослiдження [1].

Основна перевага використання теорп неч^ких множин полягае у наявносп велико'1' кiлькостi комбiнацiйних операторiв, якi дозволяють користувачу адаптувати схему штег-рацп iз специфiкою даних [2]. Проте, вибiр таких операторiв потребуе експертних оцiнок. Крiм того, ускладнена валщащя результатiв, якi одержуються методами теорп неч^ких множин.

Враховуючи недолiки вказаних методiв, перспективним е вивчення можливостей штегрувати гетерогеннi ГПД за допомогою шструментар^ ТСДШ. Теорiя свiдчень може бути штерпретована як узагальнення теорп ймовiрностi. У теорп ймовiрностi свiдчення пов'язаш тiльки з однiею iз можливих подш. У ТСДШ свiдчення може бути пов'язано од-ночасно з кшькома можливими подiями - множиною подiй. У результатi в ТСДШ вони можуть мати сенс на бшьш високому рiвнi абстракцiï без необхщносп вдаватися до при-пущень щодо свiдчення в межах множини. Там, де свщчення достатньо обгрунтоваш та дозволяють однозначно визначити 1'х iмовiрнiсть, ТСДШ використовуе модель традицiйно'ï ймовiрностi. Однiею з ïï найбшьш важливих особливостей е те, що вона дозволяе усунути неоднозначшсть визначення рiзного рiвня точностi у вщношенш iнформацiï та виключае необхiднiсть у додаткових припущеннях щодо ïï подання. Крiм того, вона дозволяе визначити пряму невизначешсть вiдгуку системи у випадку, коли неточносп на входi та на ви-ходi характеризуються множиною або iнтервалом [3].

Тому саме ТСДШ пропонуеться нижче як науково-методична платформа для штегрування гетерогенних ГПД.

4. Структурно-лопчна схема штегрування гетерогенних геопросторових даних

За схемою, наведеною на рис. 1, штегрування ГПД мае здшснюватися на трьох рiвнях: фь зичному, лопко-семантичному та гшотез (ршень). 1нтегрування гетерогенних даних на фiзичному рiвнi обумовлено ïх рiзноманiттям i вщмшностями та зводиться до конверсiï даних в единий формат фiзичного представлення. Ця задача пов'язана з проблемою ште-роперабельностi [3]. Вона виршуеться шляхом взаемного узгодження багатьох факторiв (рис. 2), якими описуються даш. Таке узгодження означае трансформування кожного фак-

TOpa до дeякого yнiфiковaного вигляду, що дозволяе дaлi поpiвнювaти ïx в единш шкaлi тa iнтepпpeтyвaти в однш логiко-ceмaнтичнiй cиcтeмi оцiнок.

Рдаунок 1 - Cтpyктypно-логiчнa cxeмa iнтeгpyвaння гeтepогeнниx дaниx

Риcyнок 2 - Фaктоpи зaбeзпeчeння iнтepопepaбeльноcтi дaниx

Iнтeгpyвaння дaниx нa логiко-ceмaнтичномy piвнi включae ceлeкцiю нaйбiльш цiнниx i xapa^ep-ниx влacтивоcтeй об'eктa доcлiджeнь по нaбоpax дa-ниx, фоpмyвaння гiпотeз щодо його кaтeгоpiï (клacy), вcтaновлeння зв'язкiв тa вiдноcин у контекст! пpeд-мeтноï облacтi. Ocновними eтaпaми пpовeдeння ште-гpyвaння нa цьому piвнi е пpоцeдypи гeнepyвaння множин гiпотeз, ïx aнaлiз i оцiнювaння, вибip тай-бiльш iмовipниx гiпотeз, a тaкож обpaння вщповщ-нж мeтодiв клacифiкyвaння, aнaлiзy зв'язкiв тa ви-знaчeння вiдношeнь (pиc. 3).

Як вжe вiдзнaчaлоcь, гeнepyвaння, aнaлiз тa оцiнювaння гiпотeз - cклaднa iнтeлeктyaльнa зaдaчa, оcобливо, якщо кожта cитyaцiя мae cвоï оcобливоcтi i, як пpaвило, нe повтоpюeтьcя, a зaвдaння викону-ютьcя звичaйно в yмовax нeвизнaчeноcтi, обyмовлe-но'1 чинником витадковост! i бpaком знaнь. Тому зa-звичaй гeнepyвaння множини гiпотeз здiйcнюeтьcя бeзпоcepeдньо людиною. Cepeд гiпотeз, якi re^py-ютьcя, можуть бути як позитивш, тaк i ^штивт, тобто тaкi, якi вiдповiдно пiдтвepджyють нaявнicть тевнох' влacтивоcтi у об'eктa iнтepecy aбо нi. Пpи оцiнювaннi пpaвдоподiбноcтi гiпотeз зacтоcовyють мeтоди дeдyктивного [4] i aбдyктивно-го aнaлiзy [5].

l'eHFJiyilHIllIH ЧЕЮЖНИ I i II DI tL I

АнадЬтя oí i i нотка и и я г I ноте *

JÍiiñlp riñera

If и flip метод i в кл:1С1|ф1ку|1:ишн, iiiiu.ihy шн itíir i.i ни ныченьл bllllllLUUIb

Риcyнок 3 - По^ловн^ть пpовeдeння iнтeгpyвaння ГПД m логiко-ceмaнтичномy piвнi

З точки зору автоматизацп когштивно-аналпичних процеав найбшьш перспектив-ним е кшькюний пiдхiд до оцiнювання ймовiрностей ппотез, однак психологiчнi дослi-дження i практика показують, що людина звичайно намагаеться уникнути жорстких одно-значних оцшок (hard estimate), i значно бшьш схильна до так званих м'яких оцшок (soft estimates) [6].

«Жорстка» гiпотеза характеризуеться тшьки одним твердженням, наприклад, досль джуваний об'ект - це «штучний об'ект». «М'яку» гшотезу можна представити сукупнiстю кiлькох тверджень щодо дослщжуваного об'екта (явища), яю об'еднанi математичним оператором «АБО». Наприклад, дослщжуваний об'ект - це «штучний об'ект» або «приро-дний об'ект». Можливють формування таких гiпотез е об'ективною реальшстю пiд час ви-вчення будь-яких складних або простих об'ектiв (явищ), оскiльки на практищ вкрай рiдко зустрiчають данi, аналiз яких дозволяе з високою достовiрнiстю висувати «жорсткi» гшо-тези. Така особливють робить сам процес дослщження об'екта (явища) бiльш гнучким i дозволяе уникнути значних помилок тд час його аналiзу та штерпретацп.

Результатом оцiнювання гiпотез е визначення значення ïx iмовiрностi. Тому основною задачею цього етапу е розрахунок зазначених величин для вах альтернативних гипотез. Фшальним кроком процедури формування та дослщження ппотез е вибiр множини, яка найбшьш адекватно описуе (штерпретуе) вхщш даш. Зазначений етап передбачае порь вняння рiзниx iнтерпретацiй вxiдниx даних i е, в певному сена, виршенням оптимiзaцiй-ноï зaдaчi. Для виршення цього питання можуть застосовувати методи математичного програмування, ймовiрнiснi або iншi методи. Проведення процедур клaсифiкувaння, аналь зу зв'язкiв та визначення вщношень передбачае обрання вiдповiдниx методiв та пiдxодiв з урахуванням специфiки гетерогенних даних.

1нтегрування на рiвнi ппотез (ршень) передбачае об'еднання множин ппотез (кла-сифiкaцiйниx рiшень) за певними правилами в единий шформацшний ушверсум. Для ви-рiшення зазначеного питання пропонуеться застосовувати ТСДШ [7-9].

Головною особливютю тд час iнтегрувaння на цьому рiвнi е питання обгрунтовано-стi конфлiкту - його релевантшсть [3, с. 102]. У загальному випадку вона може бути описана за рахунок урахування особливостей джерел надходження даних, свщчень, яю вони формують, та оператора комбшування, що використовуеться для ïx штегрування (рис. 4).

Р ел ева нтн icTb (обгрунтовашсть) конфликту

Область застосування

Джерела

Типи джерел

KLibKicTb джерел

JOCTOBipHiCTb

джерел

Корельован1сть джерел

Су п ер еч л ив1сть джерел

Свщчення

Типи свйчень KilbKiCTb Узгоджешсть Корельованкть

свйчень свйчень

ëJ

Оператор комбшування (штегрування) ч

Тип оператора Алгебра-1чш властивост1 Обробка конфл1ктл" Перевагн Недол1ки

Рисунок 4 - Особливост1 1нтегрування гетерогенних ГПД на р1вн1 ппотез (ршень)

Саме штегрування на рiвнi гшотез (ршень) е нaйбiльш вiдповiдaльним етапом. На основi отриманих даних на цьому рiвнi формуються висновки, складаеться прогноз та приймаеться ршення щодо дослвджуваного об'екта (явища).

5. Особливостi штегрування гетерогенних геопросторових даних на рiвнi гшотез (рь шень)

Вiдповiдно до структурно-лопчно! схеми (див. рис. 1), перед проведенням штегрування гетерогенних ГПД на рiвнi гшотез (ршень) формуеться штеграцшна модель. Для ïï побу-дови можуть бути зaстосовaнi методи мультимоделювання, зокрема [10]: стикувальний (docking), груповий (collaboration), взаемодп (interoperation), штеграцшний (integration) та зв'язностi (coupling). Пюля цього вiдбувaеться комбiнувaння (iнтегрувaння) сформованих гшотез (класифшацшних рiшень) на основi ТСДШ.

У рамках ТСДШ е три вaжливi функцп: функцiя базового ймовiрнiсного розподiлу (BPA) або функщя маси (m), функцiя довiри (Belief - Bel) та функщя прaвдоподiбностi (Plausibility - Pl). Функцiя базового ймовiрнiсного розподiлу (функцiя маси) може бути ш-терпретована як класична ймовiрнiсть [11]. Така концепцiя була тдтримана в [12]. Це ду-же важлива i корисна штерпретащя ТСДШ, проте необxiдно зауважити, що вона не завжди може продемонструвати повний спектр репрезентативних можливостей BPA [13]. Величина ймовiрностi поди (у класичному розумшш) перебувае в межах нижньо! i верхньо! гра-ниць - Belief i Plausibility вщповщно:

Bel(A)<P(A)<Pl(A). (1)

Вона визначаеться однозначно, якщо Bel(A) = Р(А). У даному випадку це вщповь дае класичнш теорп ймовiрностi, тобто всi ймовiрностi P(X) однозначно визначаються для вах пiдмножин А унiверсaльноï множини Q [14, с. 97]. В шшому випадку функцп Bel ( A) i Pl (A) можна розглядати як нижню i верхню границ ймовiрностi, вiдповiдно, де фактичне значення ймовiрнiсть P(A) знаходиться в штервал^ що описуеться. Верхня i нижня грaницi ймовiрностi, якi отримаш iншими пiдxодaми до зaгaльноï теорп шформацп, не можуть бути безпосередньо штерпретоваш як функцп Bel (A) та Pl (A) [15, с. 216].

Тому для визначення величини ймовiрностi настання подп, яка у подальшому за-стосовуеться для прийняття iнформaцiйниx рiшень, необxiдно розробити або обрати вщ-повiднi пiдxоди, що дозволяють ïï точно розрахувати у визначеному штерваль

6. Обмеження штегрування гетерогенних геопросторових даних

Застосування гетерогенних ГПД при виршенш рiзномaнiтниx тематичних завдань накла-дае ряд обмежень на можливосп ïx сумюного оброблення та aнaлiзу. В роботi [16] наведено ряд таких обмежень. Серед них необхщно видшити таю:

1. 1нтегрування будь-якоï кiлькостi ГПД не може замшити джерело (сенсор), яке найбшьш адаптовано тд середовище або об'ект, що дослщжуеться. Будь-яка комбшатя сенсорiв може забезпечити надшну роботу системи, проте, окремо зазначеш сенсори не дозволяють визначити характеристики об'екта або явища, що становить штерес. Д. Холомом (D. Hall) наведений приклад мехашчно! системи, в якш окремi сенсори вимi-рюють швидкють ïï роботи, рiвень вiбрaцiï та тиску, що становить цшну iнформaцiю про експлуaтaцiйнi характеристики зазначено! системи, проте, нaвiть у сукупносп, вони не дозволять вимiряти значення ïï поточноï температури.

2. Наступний рiвень (етап) оброблення вхщних ГПД не дозволяе компенсувати або виправити помилки попереднього рiвня (етапу) оброблення. 1нтегрування рiзнорiдниx ГПД не дозволяе виправляти помилки попереднього етапу ^вня) оброблення або вщсут-

ност попереднього оброблення вхщних даних. Наприклад, нездатшсть iдентифiкувaти або отримувати необхщт параметри об'екта дослiдження або явища не можуть бути виправ-леш за допомогою складних aлгоритмiв розтзнавання обрaзiв.

3. Результат iнтегрувaння гетерогенних ГПД може бути пршим, шж надана шфор-мaцiя окремим джерелом (сенсором), якщо використовуеться некоректна математична модель, яка описуе принцип дп сенсора. Застосування некоректних математичних моделей, що описують принцип дп сенсора, призведе до викривлення результату штегрування даних, оскшьки ïx вклад або ефект буде невiрним.

4. Пщ час штегрування гетерогенних ГПД не юнуе ушверсальних алгорш^в ïx комбшування. Не юнуе оптимальних aлгоритмiв iнтегрувaння даних. Зазвичай реальш приклaднi прогрaмнi продукти не задовольняють обмеженням алгоршмв, якi використо-вуються для штегрування рiзнорiдниx ГПД (наприклад, наявшсть aпрiорниx даних або статистично незалежних джерел надходження шформацп).

5. Пщ час iнтегрувaння гетерогенних ГПД завжди не вистачае навчальних вибiрок. У загальному випадку завжди юнуе проблема з навчальними вибiркaми, яю застосовують-ся пiд час, наприклад, розтзнавання обрaзiв. Тому необxiдно застосовувати пбридш методи, до яких можна вщнести методи моделювання, синтаксичного представлення або ïx комбшащю.

6. Важко оцшити результат, який отримуеться шляхом штегрування гетерогенних ГПД. Одшею iз головних задач пiд час розробки системи штегрування рiзнорiдниx ГПД е оцшка ефективностi ïï застосування в реальних умовах. Навпь при наявносп покaзникiв ефективностi окремих джерел (сенсорiв) щодо виконання поставлених завдань або алгори-тмiв обробки визначити ефектившсть системи зазвичай складно, оскшьки не завжди зро-зумiло, яким чином той або шший пщхщ до iнтегрувaння даних дозволить якюно функцю-нувати системi в операцшному середовищi.

7. 1нтегрування гетерогенних ГПД е нестатичним процесом. Процес штегрування рiзнорiдниx ГПД е перацшним, динaмiчним процесом, який постiйно спрямований на уто-чнення оцiнки об'екта дослщження.

Безумовно, наведет вище обмеження мають бути враховат тд час розроблення вь дповiдниx методiв або способiв iнтегрувaння рiзнорiдниx ГПД.

7. Невизначешсть як характеристика контенту для прийняття шформацшних р1шень

Як було вщзначено, одним з обмежень процесу штегрування рiзнорiдниx ГПД е склaднiсть оцшки його результату. Це пов'язано, в першу чергу, з тим, що наявш (класичт) показни-ки ефективносп, наприклад, достовiрнiсть правильного дешифрування (розтзнавання), не можуть бути напряму використат. Таку ситуатю можна пояснити тим, що в результат iнтегрувaння даних е ситуатя, коли iснуе багатоальтернативтсть рiшення, що приймаеть-ся. Причому жодна з альтернатив не виключаеться i мае власне значення ваги (достовiрно-сп настання подй, яку вона характеризуе). Крiм того, за результатами штегрування макси-мальну вагу може мати альтернатива, яка мала мшмальне вхщне значення або може вщ-бутись незначне зменшення ваги гшотези, яка у первинному розподш мала максимальне значення i за результатами штегрування його зберегла. Тому традицшний пщхщ до оцшки шформацшного контенту, який полягае у застосувант ймовiрнiсно-стaтистичниx методiв як единий i достатнш, не може бути застосований.

З огляду на це, для характеристики шформацшного контенту, на основi якого приймаються шформацшт ршення, авторами пропонуеться оцшювати рiвень невизначе-носп (T). Такий пiдxiд обумовлений тим, що процес aнaлiзу та штерпретацп iнтегровaниx даних розглядаеться як шформацшний процес, у результaтi якого зтмаеться деяка неви-знaченiсть щодо дослщжуваного об'екта (явища) [17, с 12]. У свою чергу, збшьшення кшь-костi iнформaцiï або ïï прирют безпосередньо впливають на достовiрнiсть його aнaлiзу та

штерпретацп. При наявносп приросту шформацп щодо дослiджуваного об'екта потенцш-но мае вщбуватись пiдвищення достовiрностi його аналiзу та штерпретацп [18, 19, с. 43].

Для оцшки ефективностi виконання тематичного завдання при штегруванш гетеро-генних ГПД, Kpi м ор1ентування на вщповщну вагу (достов1ршсть) кожно'1 альтернативи, пропонуеться оцшювати прирют шформацп AI m щодо дослщжуваного об'екта (явшца), який можна обрахувати за таким виразом:

Л/О) = Tpr (m) - Tps (m), (2)

де Tpr(m), Tps(m) - первинний та апостерюрний рiвнi невизначеностi щодо об'екта (яви-ща) вiдповiдно.

У рамках ТСДШ можна видшити три рiвнi обрахунку значення невизначеносп : рь вень шформацшних джерел, скомбiнованих (iнтегрованих) розподiлiв гшотез та прийняття рiшень. Для обрахунку значення невизначеносп на рiвнi шформацшних джерел та скомбь нованих (штегрованих) розподiлiв гiпотез можуть бути застосоваш вирази, запропонованi Дж. Клiром (G. Klir) [13, 20]:

- для рiвня iнформацiйних джерел:

TsourCe (m) = Z m(A)log^ , (3)

АсП Bg fi \АГЛВ\ V !

де m(A), m(B) - функцiя маси для пiдмножин A i B вщповщно; |A| - кiлькiсть елемешив (кардинальнiсть) пiдмножини A ; |v4nß| - кшьюсть елемешив перетину шдмножин A i В .

Такий тдхщ до обрахунку невизначеностi може бути використаний для проведення процедур оптимiзацiï обрання iнформацiйних джерел ГПД при виршенш тих чи шших те-матичних задач;

- для рiвня скомбшованих (iнтегрованих) розподiлiв гiпотез:

Thypotheses{m) = - Е m{Al)log2 \А\ + - X (Bel(A) log2 Bel (А) + PI (A) log2 PI (А))

\АеП С Aeü.

(4)

де с визначаеться як

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ (5)

АеП

Для обрахунку невизначеносп на рiвнi прийняття ршень може бути застосовано значення ймовiрнiсноï шформацшно'1 емностi (Probabilistic Information Content (PIC) [21]:

1 N

PIC = 1 + --- -^Р(Ап)\оё2(Р(Ап)), (6)

де N - загальна кшьюсть гiпотез.

Пiдходи, якi представленi виразами (4)-(6), е квiнтесенцiею вирiшення конкретно'1 тематично'1 задачi при проведеннi штегрування рiзнорiдних ГПД та поряд iз використан-ням класичних iмовiрнiсно-статистичних методiв дозволяють додатково оцiнити отрима-ний результат.

Таким чином, можна констатувати, що особливютю при iнтегруваннi рiзнорiдних ГПД е процедура обрахунку рiвня невизначеностi щодо дослiджуваного об'екта (явища). Невизначенiсть при iнтегруваннi гетерогенних ГПД - це нове поняття для характеристики контенту, яке призначене для оаб, що приймають iнформацiйнi ршення.

8. Приклади вир1шення тематичних задач на основi запропонованого подходу

Було застосовано комбшацшне правило Демпстера для штегрування геолого-геофiзичних даних, супутникових даних i окремих шарiв цифрово! моделi мюцевосп при вирiшеннi двох задач: пошуку покладiв нафти i газу та щентифшацп компактних штучних об'eктiв. Результати штегрування наведено на рис. 5 та рис. 6. Подiбний тдхщ дозволив:

1. Спрогнозувати нафтогазоноснiсть для територп Липоводолинського родовища. Проте, для бшьшо! 11 частини такий прогноз став неможливим, оскшьки значення функцш довiри i правдоподiбностi дорiвнюють нулю (рис. 5 а) [7, с. 41].

2. Видшити чпю зони, як пiдкреслюють зони розущiльнення, вузли перетину роз-ломiв рiзних напрямiв, що е перспективними для наявносп скупчень вуглеводнiв, для тв-шчно-захщного шельфу Чорного моря. Одночасно чпко визначились зони концентрацп структур, виявлених геофiзичними методами, хоча деякi виявлеш i пiдготовленi до глибо-кого буршня структури потрапили в зони низько! ймовiрностi (рис. 5 б) [3, с. 93].

а б

Рисунок 5 - Результат застосування комбшацшного правила Демпстера у задач1 пошуку поклад1в нафти та газу: а) для Липоводолинського родовища [7]; б) для швшчно-захщного шельфу Чорного моря [3]

■ >и". ■■ -'Й

ЙТШЁ

ТЫ т^-V. V' V

. V >7

а б

Рисунок 6 - Результат застосування комбшацшного правила Демпстера у задач1 щентифшацл компактних штучних об'екпв: а) для багатоспектральних/гшерспектральних аерокосм1чних зображень [9]; б) для даних аерокосм1чного зшмання та окремих шар1в цифрово! модел1 мсцевосп

3. Виявити з достатньо високою точнютю (Ре[0,7; 0,94]) на об'еднаному зобра-женнi клас об'екпв, який не вдавалось видiлити на окремому супутниковому гшерспект-ральному зображенш (рис. 6 а) [9, с. 66].

4. Вщнести кожний об'ект iнтересу до конкретного виду, тдвищити достовiрнiсть його штерпретацп та аналiзу в середньому на 44 % та зменшити рiвень невизначеностi на 13 % (рис. 6 б).

Проте, головним недолгом тд час використання класичних положень ТСДШ для iнтегрування гетерогенних ГПД на рiвнi рiшень е спiрнiсть результату, що отримуеться, в умовах значного конфлшту мiж джерелами надходження шформацп [2, с. 132], що тдтве-рджуеться отриманими результатами.

Для швелювання зазначеного недолiку авторами, керуючись положеннями, сфор-мульованими вище у пп. 4-7, було розроблено метод, який дозволяе врахувати корельова-шсть i узгодженiсть гiпотез та конфлштшсть джерел ГПД [3]. Його структурно-лопчну схему наведено на рис. 7.

Рисунок 7 - Структурно-лопчна схема запропонованого методу

Результати застосування розробленого методу для виршення тих самих задач наведено на рис. 8.

а б

Рисунок 8 - Результат застосування запропонованого методу: а) у задач1 пошуку поклад1в нафти та газу для Липоводолинського родовища; б) у задач1 щентифшацн компактних штучних об'екпв для даних аерокосм1чного зшмання та

окремих шар1в цифрово! модел1 мюцевосп

1. Запропонований метод дозволяе вщнести кожний об'ект iHTepecy до конкретного виду, пщвищити достовiрнiсть його штерпретацп та аналiзy в середньому на 4 % та змен-шити рiвень невизначеностi на 28 % (рис. 8 б).

2. Основна перевага запропонованого методу - позбавлення недолшв, що характеры для комбшацшного правила Демпстера, можливють переходу вщ штервально'1 до точ-ково'1 оцшки [7, с. 38].

9. Висновки

Запропоновано та обгрунтовано новий тдхщ до штегрування гетерогенних геопросторо-вих даних. Наведено структурно-лопчну схему штегрування, особливосп його проведення на рiзних рiвнях. Як науково-методичну платформу для проведення штегрування обрано теор^ свщчень Демпстера-Шейфера. Крiм того, приведено загальн обмеження штегру-вання, сформульовано новi пiдходи до оцiнки ефективностi виконання тематичних завдань та представлено приклади ix вирiшення на рiвнi гiпотез (рiшень).

Отриманi результати дають пщстави стверджувати про можливiсть застосування теорп свiдчень Демпстера-Шейфера для проведення штегрування гетерогенних геопросто-рових даних на рiвнi гiпотез (рiшень) та ii дiездатнiсть у класичному виглядi лише для ви-падкiв, коли конфлшт мiж джерелами надходження шформацп е мшмальним.

Для нiвелювання зазначеного недолшу пропонуеться новий метод, який дозволяе врахувати корельовашсть i yзгодженiсть гшотез та конфлiктнiсть джерел геопросторових даних. Результати застосування запропонованого методу для тих же тематичних задач до-зволяють зробити висновок, що вш позбавлений недолшу, який характерний для комбшацшного правила Демпстера, i дае можливють перейти вiд штервально'1 до точково'1 оцiнки вщповщно! гшотези.

Подальшi дослiдження мають бути спрямоваш на узагальнення розвинених у статп методiв iнтегрyвання на випадки, коли необхщно здiйснити комплексний аналiз та штерп-ретацiю суттево неоднозначних даних (soft data), наприклад, експертних даних, i достатньо точних даних (hard data), наприклад, даних, отриманих техшчними засобами видового спо-стереження.

СПИСОК ДЖЕРЕЛ

1. Le Hegarat-Mascle S., Bloch I., Vidal-Madjar D. Application of Dempster-Shafer evidence theory to unsupervised classification in multisource remote sensing. IEEE Transactions on Geoscience and Remote Sensing. 1997. Vol. 35, N 4. Р. 1018-1031.

2. Дюбуа Д., Прад А. Теория возможностей. Приложения к представлению знаний в информатике. Москва: Радио и связь, 1990. 228 с.

3. Novel Remote Sensing Methods for Mineral Prospecting: monograph / ed. V.I. Lyalko, M.O. Popov. K.: NASU, 2017. 221 p.

4. Josang A. Conditional reasoning with subjective logic. Journal of Multiple-Valued Logic and Soft Computing. 2008. Vol. 1, N 15. P. 5-38.

5. Fischer H.R. Abductive reasoning as a way of worldmaking. The Impact of Radical Constructivism on Science. 2001. Vol. 6, N 4. P. 361-383.

6. Heuer R. Psychology of intelligence analysys. Washington, DC: Center for Study of Intelligence. Central Intelligence Agency, 1999. 184 p.

7. Попов М.О., Станкевич С.А., Топольницький М.В., Титаренко О.В. 1нтегращя дистанцшних та геолого-геоф1зичних даних при пошуках поклад1в нафти та газу на суходола Екологiчна безпека та природокористування. 2017. № 1-2 (23). С. 36-43.

8. Shafer G. A mathematical theory of evidence. Princeton: Princeton University Press, 1976. 297 p.

9. Попов М.О., Топольницкий М.В. Классификация объектов на многоспектральных/гиперспектральных аэрокосмических изображениях на основе теории свидетельств Демпсте-ра-Шейфера. Математичш машини i системи. 2014. № 1. С. 58-69.

10. Zeigler B.P., Praehofer H., Kim T.G. Theory of Modeling and Simulation: Integrating Discrete Event and Continuous Complex Dynamic Systems. 2nd ed. NY: Academic Press, 2000. 510 p.

11. Chokr B., Kreinovich V. How far are we from complete knowledge? Complexity of knowledge acquisition in the Dempster-Shafer approach. Advances in the Dempster-Shafer Theory of Evidence / eds. R.R. Yager, J. Kacprzyk, M. Fedrizzi. NY: John Wiley & Sons, 1994. Р. 555-576.

12. Kramosil I. Probabilistic Analysis of Belief Functions. NY: Kluwer Academic, 2001. 214 р.

13. Klir G.J., Wierman M.J. Uncertainty-Based Information: Elements of Generalized Information Theory. Berlin: Springer-Verlag Berlin Heidelberg, 1999. 168 р.

14. Yager R.R. On the Dempster-Shafer Framework and New Combination Rules. Information Sciences. 1987. Vol. 41. P. 93-137.

15. Dubois D., Prade H. On the combination of evidence in various mathematical frameworks. Reliability Data Collection and Analysis. 1992. Р. 213-241.

16. Hall D.L., McMullen Sonya A.H. Mathematical techniques in multisensor data fusion. 2nd edition. Norwood, MA: Artech House, 2004. 449 p.

17. Богомолов Л.А. Дешифрирование аэроснимков. М.: Недра, 1976. 145 с.

18. Марр Дж. Информационный подход к изучению представления и обработки зрительных образов / пер. с англ. М.: Радио и связь, 1987. 400 с.

19. Аковецкий В.И. Дешифрирование снимков: учеб. для вузов. М.: Недра, 1983. 374 с.

20. Klir G.J. Uncertainty and information measures for imprecise probabilities: An overview. Proc. of 1st International Symposium on Imprecise Probabilities and Their Applications (Ghent, Belgium, 29 June-2 July 1999). Ghent, 1999. P. 234-240.

21. Sudano J. Pignistic probability transforms for mixes of low - and highprobability events. Proc. of Int. Conf. on Information Fusion 2001 (Montreal, Canada, August 2001). Montreal, 2001. P. 23-27.

Стаття над1йшла до редакцп 22.05.2019

i Надоели баннеры? Вы всегда можете отключить рекламу.