Научная статья на тему 'Некоторые не-факторы и методы их моделирования'

Некоторые не-факторы и методы их моделирования Текст научной статьи по специальности «Математика»

CC BY
246
77
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕ-ФАКТОР / НЕОПРЕДЕЛЕННОСТЬ / UNCERTAINTY / НЕЧЕТКОСТЬ / ТЕОРИЯ НЕЧЕТКИХ МНОЖЕСТВ / FUZZY SET THEORY / ТЕОРИЯ СВИДЕТЕЛЬСТВ / THE DEMPSTERSHAFER THEORY (DST) OF EVIDENCE / ТЕОРИЯ ПРАВДОПОДОБНЫХ И ПАРАДОКСАЛЬНЫХ РАССУЖДЕНИЙ / THE DEZERT-SMARANDACHE THEORY (DSMT) OF PLAUSIBLE AND PARADOXICAL REASONING / UN-FACTOR / FUZZY MEASURE

Аннотация научной статьи по математике, автор научной работы — Коваленко И.И., Швед А.В.

В статье выполнен анализ и систематизация наиболее изученных НЕ-факторов. Рассмотрены методы моделирования различных НЕ-факторов на основе современных теорий: теории нечетких множеств, теории свидетельств, теории правдоподобных и парадоксальных рассуждений. Математический аппарат рассмотренных теорий позволяет корректно оперировать различными специфическими видами НЕ-факторов и их комбинациями.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Some un-factors and methods for their simulation

The analysis and systematization of the most common un-factors is carried out in this article. The methods for modeling of various un-factors based on modern theories, such us fuzzy set theory, the theory of evidence, the theory of plausible and paradoxical reasoning are considered. The mathematical apparatus of the considered theories can correctly operate the various specific types of Un-factors and their combinations.

Текст научной работы на тему «Некоторые не-факторы и методы их моделирования»

УДК 004.82

И.И. Коваленко, А.В. Швед НЕКОТОРЫЕ НЕ-ФАКТОРЫ И МЕТОДЫ ИХ МОДЕЛИРОВАНИЯ

Введение. Информационные технологии в последние два десятилетия интенсивно развиваются в рамках сравнительно молодой науки, получившей название «инженерия знаний».

Основу данного научного направления составляют результаты разработок и исследований, связанные с искусственным интеллектом (ИИ): представление знаний и вывод на знаниях; системы искусственного интеллекта (экспертные системы, системы распознавания образов, системы поддержки принятия решений и др.).

В месте с тем, различные предметные области, знания о которых могу быть положены в основу создания систем искусственного интеллекта, как правило, отрицают традиционные свойства формальных систем: точность, полноту, определенность, корректность, и др. Такие отрицаемые свойства были названы «НЕ-факторы», поскольку каждый из них лексически и содержательно фиксирует учет наших Не-знаний при абстрагировании, переходе к формальным системам и интерпретации выводов, полученных на формальном уровне [1]. Поэтому любая формальная система всегда будет характеризоваться наличием определенных НЕ-факторов.

Данное обстоятельство полностью согласуется с основополагающим принципом неопределенности Вернера фон Гейзенберга и является отражением фундаментальной неопределенности процессов макромира.

В проблематике ИИ учет, анализ и управление НЕ-факторами имеет первостепенное значение, что обусловлено творческим характером задач создания интеллектуальных технологий, которые всегда решаются в условиях противоречивости, неполноты, неточности, неопределенности исходных данных, отношений между ними, операций их обработки (алгоритмов, процессов решения). Вместе с тем, как отмечают авторы работы [1], достаточно часто современные методы нечеткой математики, вероятностно-статистического вывода, байесовские и нейроны сети, генетические алгоритмы и др. используются без должного анализа природы присутствующих НЕ-факторов, что может привести к неадекватным моделям и выводам.

Постановка задачи. Целью статьи является рассмотрение похода, в основе которого лежит систематизация наиболее изученных НЕ-факторов и сравнительный анализ методов их моделирования.

Изложение основного материала. Первые НЕ-факторы, получившие название «нечеткость» или «неточность», были определены и изучались в рамках проблематики нечетком математики, основателем которой является Лотфи Заде [1,2].

Однако, целенаправленные системные исследования НЕ-факторов начались с работ А.С. Нариньяни, в которых введено понятие и дана содержательная их трактовка. Анализ литературных источников [1,3,4,5,6,7] позволяет привести ещё ряд существующих подходов к определению НЕ-факторов.

Так, НЕ-факторы по А.С. Нариньяни [5, 8]: НЕТОЧНОСТЬ, НЕДООПРЕДЕЛЕННОСТЬ, НЕОДНОЗНАЧНОСТЬ, НЕЧЕТКОСТЬ.

НЕ-факторы по В.А. Вагину [4]: ПРОТИВОРЕЧИВОСТЬ, НЕМОНОТОННОСТЬ, НЕТОЧНОСТЬ, НЕОПРЕДЕЛЕННОСТЬ, НЕЧЕТКОСТЬ.

НЕ-факторы по Г.В. Рыбиной [6, 7]: НЕЧЕТКОСТЬ, НЕТОЧНОСТЬ, НЕОПРЕДЕЛЕННОСТЬ, НЕДООПРЕДЕЛЕННОСТЬ.

НЕ-факторы по А.Н. Борисову [3]: НЕИЗВЕСТНОСТЬ, НЕДОСТОВЕРНОСТЬ, НЕОДНОЗНАЧНОСТЬ.

Их рассмотрение приводит к выводу о том, что предложенная совокупность НЕ-факторов достаточно «смутно» отображает принципы их унификации и классификации. Это говорит о том, что тема формализации исследования НЕ-факторов на современном этапе, по-видимому, далека от своего завершения.

Вместе с тем в работах [9, 11,12] делается попытка представить НЕ-факторы, обоснованное существование которых определяется методами их моделирования, базирующимися на традиционных, а также новых развивающихся математических теориях (рис.1). Рассмотрим их более подробно.

Неполнота. Некоторые данные не известны, но вся доступная информация полна и корректна. Например, «Возраст этого индивида неизвестен». Единственным способом сокращения этого незнания является сбор недостающих данных (пополнение информации).

Неопределённость. Доступная информация может быть истинной или ложной и оценивается с помощью вероятностных оценок. Например, лицо, которому Вы не доверяете, утверждает, что «Возраст индивида равен 30 годам». Степень доверия этому сообщению может быть выражена с помощью соответствующей вероятностной оценки.

Неточность (нечеткость). Имеется информация, достоверность которой не вызывает сомнений, однако она не точна. Например, достоверная информация «Этот индивид молодой» не точна. Анализ такой информации выполняется методами нечеткой логики, нечётких множеств, нечетких отношений [2].

Однако, могут быть ситуации в которых одновременно присутствуют различные формы незнания. Например, лицо, которому Вы не доверяете, говорит «Индивид молодой». В данном случае имеется комбинация неопределённости и неточности. Такая комбинация может быть промоделирована с применением методов теории свидетельств Демпстера-Шейфера и теории правдоподобных и парадоксальных рассуждений Дезера-Смарандаке [13, 14, 15].

Рис. 1 Классификация форм незнания и методов их анализа

Рассмотрим приведенные НЕ-факторы с позиции перечисленных теорий, что будет способствовать более четкому их различию.

Теория вероятностей оперирует с шансами случайных событий, при этом предполагается, что все события являются хорошо определёнными понятиями. Неопределённость здесь связана только с тем, с какими шансами может произойти каждое случайное событие из полной группы таких событий. Для этого необходимо выполнение двух условий: рассматриваются все возможные в данной ситуации события; реализоваться может только одно из событий.

Часто эти два условия формулируются следующим образом: полную группу событий образуют взаимно исключающие и исчерпывающие события. Традиционно вероятностные оценки р(ег) случайных событий ег, г = 1,п подчиняются следующей системе аксиом:

1. р(ег) > 0, г = 1, п , 0 < р < 1

2. Р(Е) = £р(ег-), Е = {ег | г = Щ};

(1)

3. Если Е с Е, Е2 с Е и Е1 П Е2 = 0, то Р(Е) = р(Е1 и Е2) = р(Е1) + р(Е2). Аксиомы 2 и 3 свидетельствуют об аддитивном характере вероятностных оценок, т.е. в любом

п

случае сумма вероятностей всех случайных событий, образующих полную группу равна ^ р(ег) = 1.

г=1

Следует указать на то, что существует два основных подхода к оцениванию вероятностей событий: объективные оценки вероятностей на основе метода частот и субъективные оценки вероятностей, источниками которых являются эксперты. В первом случае для моделирования неопределенностей могут быть использованы аналитические методы вероятностного вывода, вероятностный вывод на деревьях вероятностей, методы математической статистики, байесовские стратегии и др. Оценки второго вида могут быть использованы для вероятностного вывода на деревьях решений, на сетях уверенностей (сети Байеса),

в задачах классификации (байесовские классификаторы), в задачах принятия решений в условиях риска и

др.

Теория нечетких множеств предназначена для оперирования нечёткими концепциями, которые лежат в основе формирования множеств элементов. Предполагается, что элементы являются хорошо определёнными понятиями. Неопределённость (неточность, нечеткость) здесь возникает при попытке отнести элементы к некоторым классам (множествам), поскольку эти классы (множества) являются нечёткими, следовательно, плохо определенными.

Основным математическим аппаратом нечеткой (fuzzy) алгебры и нечеткой логики является лингвистическая переменная (ЛП), значения которой определяются набором вербальных (словесных) характеристик некоторого свойства объекта. Значения ЛП характеризуются так называемыми «нечеткими множествами» (НМ), которые в свою очередь определяются через некоторую базовую числовую шкалу А и функцию принадлежности тА (х), х e А, тА (х) e [0,1]. Таким образом, НМ - это совокупность пар вида (х, тА (х)), которая определяет субъективную степень уверенности в том, что данное конкретное значение А соответствует определенному элементу НМ.

Данная теория в качестве «инструментов» моделирования неточностей (нечеткостей) предоставляет методы построения функций принадлежности, формирования баз знаний, анализа нечетких отношений и др. Кроме этого, методы нечетких множеств и нечеткой логики могут быть использованы в задачах классификации, принятия решений, прогнозирования, а также при создании систем искусственного интеллекта, в которых используются сочетания возможностей нечеткой математики с нейронными сетями, генетическими алгоритмами и др.

Теория свидетельств Демпстера-Шейфера. Как уже отмечалось выше, теория вероятностей имеет дело с каждым отдельным событием (синглетоном) из полной группы событий и может корректно обращаться с неопределенностями, которые подчиняются аксиомам (1). Вместе с тем, в реальных условиях могут существовать и специфические формы НЕ-факторов, например, комбинация неопределенности и неточности (нечеткости), возникающие в процессе взаимодействия между суждениями экспертов. Формы таких взаимодействий могут иметь различный характер - они могут быть согласованными, совместимыми; могут произвольным образом объединятся и пересекаться. Для моделирования указанных форм взаимодействий может быть использована теория свидетельств Демпстера-Шейфера (ТДШ) [12,13,15], основу которой составляют следующие положения.

Имеется множество элементов Q = {ai | i = 1, n} , называемое основой анализа. Предполагается, что основа анализа W представляет собой множество исчерпывающих (всех возможных в данной ситуации) элементов и взаимно исключаемых (уникально определенных и отличных от других) элементов. При этом априори известно, что только единственный элемент а0 eQ является истинным в каждой конкретной ситуации. Этот элемент называется действительным миром.

На основе анализа Q могут быть сформированы произвольные подмножества элементов Ai с Q при предположениях (свидетельствах), что действительный мир а0 может принадлежать каждому из этих подмножеств.

Свидетельствами называют любые источники информации, на основании которых могут быть получены интересующие нас оценки степеней уверенности. Подмножества Ai могут принимать различные формы и взаимодействовать произвольным образом Ai = {аг} - единичное подмножество; Aj = {а2,а3,а4} - многоэлементное подмножество; Ai u Aj - объединение подмножеств Ai и Aj; Ai n Aj - пересечение подмножеств Ai и Aj и др.

Подмножества Ai основы анализа Q , которым эксперт назначил степени уверенности (основные массы вероятности m(A)) того, что действительный мир может находиться в любом из этих подмножеств, называют фокальными элементами.

Следует отметить, что m(Ai) определяет степень уверенности, отдаваемую Ai, но никаким подмножествам . Это принципиальное положение теории свидетельств.

Наряду c назначениями масс вероятностей m(Ai) на подмножествах основы анализа Q, концептуальную основу ТДШ составляют такие понятия как функцияуверенности и функция правдоподобия.

Значения первой функции для отдельных подмножеств Q выражают всю степень поддержки, отдаваемую каждому из таких подмножеств. Значения второй функции для каждого из подмножеств Q выражает полную степень потенциальной поддержки, которая может быть отдана каждому из этих подмножеств.

Если на одной и той же основе анализа Q назначения степеней уверенности (основных масс вероятности) выполняют несколько независимых экспертов, то возникает задача комбинирования этих назначений. Это производится на основе различных правил комбинирования свидетельств: Демпстера, Ягера, Инагаки, Дюбуа и Прада и др., которые могут быть использованы в ситуациях наличия специфических

(комбинированных) НЕ-факторов.

Теория правдоподобных и парадоксальных рассуждений Дезера-Смарандаке (ТДС) [12, 14] может рассматриваться, как более углубленный вариант ТДШ в том плане, что она может оперировать с более сложными формами НЕ-знания. Например, если элементы основы анализа ог отражают нечеткие и неопределенные понятия: старость-молодость, цветовую гамму и т.д., то некоторые из элементов могут в значительной степени перекрываться друг другом, поэтому выделить полностью различающиеся сог не представляется возможным. В основе концепции ТДС лежат понятия свободной и гибридной модели.

Свободная модель, обозначаемая М(О) рассматривает О только как основу исчерпывающих элементов сог | г = 1, п, которые потенциально могут перекрываться. Гибридная модель определяется из свободной модели путем введения некоторых ограничений общности на некоторые подмножества элементов Д из множества всех возможных подмножеств 0°, когда полагается, что Д ^ 0 . Это объясняется тем, что реальных задачах нет необходимости назначать основные массы вероятностей всем возможным подмножествам 0°, так как всегда возможны элементы, которые будут взаимно исключающими. В качестве ограничений общности широко применяются: ограничение исключаемости ог п... пак =0 и ограничение несуществования и. иок =0 . Так же, как и в теории свидетельств, в ТДС присутствует правило комбинирования, отражающее конъюнктивный консенсус между различными группами свидетельств. В заключение приведем ряд соображений, характеризующих различия между теорией вероятности, ТДШ и ТДС [12, 14].

Пусть О = О, о2} - простейшая основа анализа, состоящая только из двух элементов. Тогда теория вероятностей имеет дело при предположении исключаемости гипотез с основными назначениями вероятностей, такими что т(о1) + т(о2) = 1; ТДШ имеет дело при предположении исключаемости и исчерпываемости гипотез с основными назначениями уверенностей, такими что т(о1) + т(о2) + т(о1 ио2) = 1. ТДС имеет дело с единственным предположением исчерпываемости гипотезсобобщенныминазначениямивероятностей,такимичто т(о1) + т(о2) + т(о1 ио2) + т(о1 по2) = 1.

Выводы. Рассмотренные теории моделирования НЕ-факторов, несмотря на некоторые кажущиеся аналогии между ними, являются совершенно различными теориями. В основе каждой из них лежит специфический математический аппарат, и они предназначены для моделирования различных НЕфакторов.

Сходство между этими теориями заключается лишь в способах получения исходной информации. Оценки вероятностей могут быть получены как объективным, так и субъективным (экспертным) путем. В теории нечетких множеств, для оценки степеней принадлежности элементов данному нечеткому множеству, также используются субъективные оценки. В ТДШ и ТДС для получения оценок степенней уверенности используют только субъективные подходы.

Всё это выдвигает условие детального анализа природы НЕ-факторов, что обеспечит правильный выбор методов моделирования, предоставляемых данными теориями.

ЛИТЕРАТУРА

1. Валькман Ю.Р., Быков В.С., Рыхальский А.Ю. Моделирование НЕ-факторов - основа интеллектуализации компьютерных технологий. // Системш дослщження та шформацшш технологи, 2007. - №1.- С.39 - 61.

2. Заде Л.А. Основы нового подхода к анализу сложных систем и процессов принятия решений // Математика сегодня. - М.: Знание, 1974. - С. 5 - 49.

3. Борисов А.Н., Крумберг О.А., Федоров И.П. Принятие решений на основе нечетких моделей.- Рига: «Зинатне», 1990. - 184 с.

4. Вагин В.Н. Знание в интеллектуальных системах // Новости искусственного интеллекта. - 2002. - №6.

- С. 8 - 18.

5. Нариньяни А.С. Неточность как НЕ-фактор. Попытка доформального анализа.- Препринт РосНИИ ИИ, 1994. - № 2. - 34 с.

6. Душкин Р.В., Рыбина Г.В. Об одном подходе к автоматизированному извлечению, представлению и обработке знаний с НЕ-факторами // Изв. РАН. ТиСУ - 1999. - № 5. - С. 84 - 96.

7. Рыбина Г.В. Модели, методы и программные средства для построения интегрированных экспертных систем: автореферат диссертации на соискание ученой степени д-ра техн. наук: 05.13.11 / Г. В. Рыбина.

- М., 2004. - 44 с.

8. Нариньяни А.С. Недоопределенные модели и операции с недоопределенными значениями. -Новосибирск, 1982. - 33 с. (Препр./ АН СССР. Сиб. отд-ние ВЦ; № 400).

9. Коваленко И.И.. Швед А.В. Современные методы анализа экспертных оценок // Науковi пращ ЧДУ iм. П. Могили, серiя „Комп'ютерш технолопГ, 2012. - вип. 161. - т. 173. - С. 10 - 20.

10. Шокин Ю.И. Интервальный анализ. - Новосибирск: Наука, 1981. - 256 с.

11. Burrus N., Lesage D. Theory of evidence (DRAFT) (Technical Report). Laboratorie de Reserche et Developpment de l Epita, 2003.

12. Uzga-Rebrovs O. Nenoteiktibu parvaldisana. - Rezekne: RA Izdevnieciba, 2010. - Vol. 3. - 560 lpp.

13. Shafer G. A mathematical theory of evidence. Princeton University Press, 1976. - 297 p.

14. Smarandache F., Dezert J. Representation of DSmT. In Advances and Applications of DSmT for Information Fusion. - American Research Press: Rehoboth, 2004. - Vol. 1 - Pp. 3 - 35.

15. Beynon M.J, Curry B., Morgan P. The Dempster-Shafer theory of evidence: an alternative approach to milticriteria decisionn modelling // Omega, 2000. - Vol. 28. - № 1. - Pp. 37 - 50.

КОВАЛЕНКО Игорь Иванович - д.т.н., профессор кафедры программного обеспечения автоматизированных систем Национального университета кораблестроения им. Макарова

Научные интересы: методы анализа данных, прикладной системный анализ, теория оптимальных решений, системы поддержки принятия решений

ШВЕД Алена Владимировна - аспирантка кафедры интеллектуальных информационных систем Черноморского государственного университета имени Петра Могилы

Научные интересы: методы анализа данных, математическое моделирование, информационные технологии, системы поддержки принятия решений

i Надоели баннеры? Вы всегда можете отключить рекламу.