Научная статья на тему 'Выявление характеристик объектов исследуемой области на основе ДСМ-метода автоматического порождения гипотез'

Выявление характеристик объектов исследуемой области на основе ДСМ-метода автоматического порождения гипотез Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
181
55
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Зёрнушкин А. Е., Соколов А. В.

В статье описан метод обработкиинформации, основанный на ДСМ методеавтоматического порождения гипотез (АПГ),представлена функциональная организацияпроцесса формирования множества возможныххарактеристик и описана методика минимизацииэтого множества.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Выявление характеристик объектов исследуемой области на основе ДСМ-метода автоматического порождения гипотез»

УДК 519.8

Зёрнушкин А. Е., Соколов А. В.

ВЫЯВЛЕНИЕ ХАРАКТЕРИСТИК ОБЪЕКТОВ ИССЛЕДУЕМОЙ ОБЛАСТИ НА ОСНОВЕ ДСМ-МЕТОДА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ ГИПОТЕЗ

В статье описан метод обработки информации, основанный на ДСМ методе автоматического порождения гипотез (АПГ), представлена функциональная организация процесса формирования множества возможных характеристик и описана методика минимизации этого множества.

132

Правила правдоподобного вывода, формализующие индукцию, в терминах ДСМ-метода АПГ будем называть правилами правдоподобного вывода 1-го рода (ППВ-1).

Базой фактов (БФ) будем называть множество признаков и свойств объекта, выявленных в ходе анализа на момент применения разработанного метода.

БФ, к которым применяются ППВ-1, содержат (±) - факты и, (т)-факты (примеры неопределенности), представляющие предикат -«свойство Х проявляется через признак Y» Х^1У, где Х -переменная, значениями которой являются представления предполагаемого свойства, а Y - переменная, значениями которой являются представления обнаруженного признака, через который возможно проявление свойства данного объекта. Свойство С может быть представлено как множество элементов (или кортеж). Предикат X^1Y является бесконечнозначным, так как его истинностными значениями являются пары (v, п), где v6{1, -1, 0}, а n6N, N -множество натуральных чисел.

Для формулирования правил индуктивного вывода (ППВ-

1)используются предикаты позитивного и негативного сходства Mn+ (V, W) и Mn-(V, W), где V- переменная, значениями которой являются сходства свойств объектов (+)-фактов и (-)-фактов, соответственно, а W - переменная, значениями которой являются множества свойств, представляющие изучаемый эффект или его часть. Параметр п выражает число применений ППВ-1 (п =0, 1, 2,...), neNj

Для подтверждения правдоподобности результатов применения ППВ-1 на каждом шаге индукции применяются правила правдоподобного вывода по аналогии (ППВ-2). ППВ-2 используют результаты применения ППВ-1 и применяются для уменьшения неопределенности фактов из БФ. Процедура аналогии, применяемая к результатам индуктивного вывода, позволяет на каждом шаге подтверждать или опровергать гипотезы путём установления их сходства с данными БЗ и, в соответствии с результатом сравнения, выдвигать гипотезы о наличии других возможных причин, характеризующих признак или свойство. Абдукция используемая совместно с индукцией позволяет формировать исходные множества, характеризующие признак и свойство объекта, а также сформировать гипотезы о возможном наличии элементов этих множеств не обнаруженных ко времени применения метода.

133

Процесс применения ППВ-1 и ППВ-2 к БФ и БЗ рассматриваемой предметной области сводится к формированию формализованного представления последовательного применения правил вида «индукция-аналогия-абдукция» для формирования гипотез о свойствах объектов на основании анализа предметной области.(4)

Для формального представления результатов применения ППВ-1 и ППВ-2 введём следующие обозначения:

{Si} - универсальное множество сложных свойств объектов предметной области;

{O} - универсальное множество свойств объектов;

{Xi} - универсальное множество признаков;

За область возможных значений множества сложных свойств принимается множество всех возможных сложных свойств {Si}, представленное определенным классификатором. Множество {Si} является базой знаний (БЗ) о предметной области. Каждый элемент этого множества посредством применения правил индуктивного вывода и последующего применения процедуры аналогии определяется из некоторого набора свойств {Oi} и признаков {Xi}, характеризующих то или иное сложное свойство, т.е.

O |u|x, \&\st | (1)

В то же время множество свойств {Oi} определяется некоторым множеством {Xj} признаков, через которые проявляются эти свойства, т.е.

К \ & O (2)

Каждый из элементов множеств {Xi} и {Xj} характеризуется некоторым набором проявлений, {Yi} и {Yj} соответственно, определение которых обуславливает проявление признака, т.е.

\YI& хг и Y\& Xj (3)

В результате последовательного применения правил правдоподобного вывода к текущей БФ и принимая во внимание знания о предметной области из БЗ получим:

Y и Yj & Xi и Xj & Ot и Xj & Si (4)

Формализованное представление результата применения ППВ-1 и ППВ-2 к БФ рассматриваемой предметной области (4) представлено на рис. 1 и имеет вид схемы функциональной организации процесса формирования гипотез об ОС.

134

Рис. 1 - Функциональная организация процесса формирования множества возможных характеристик объекта предметной области, построенная на основе применения ППВ-1, с использованием фундаментальных знаний

Математическая модель представленной организации представляет собой совокупность множеств {Si, Oi, Xi, Xj, Yi, Yj, R}, где Si - множество всех возможных значений характеристик объекта, представленных классификатором;

Oi - множество свойств характеристики Si;

Xi - множество признаков характеристики Si;

Xj - множество признаков характеризующих свойства Oi;

Yi - множество проявлений характеризующих проявление признака Xi;

Yj - множество проявлений характеризующих свойство Xj;

R - множество формальных фундаментальных теоретических правил индуктивного вывода.

Таким образом, видно, что путём применения процедуры последовательного индуктивного вывода, основываясь на ППВ-1,

135

определенных на множестве возможных значений характеристик объектов предметной области {Si} классификатором, из имеющихся параметров признаков и свойств, теоретически возможно выявление характеристики объекта. Основным недостатком описанного метода является возможная неоднозначность результата, то есть высокая вероятность вывода нескольких характеристик из малого количества исходных параметров в условиях нехватки информации.

Для устранения неоднозначности результата область возможных значений {Si} сужается на основании экспертных знаний об особенностях предметной области. Для этого на основании экспертного анализа априорных данных предметной области строится частная информационная модель выявления характеристики объекта, которая позволяет на основании текущей ситуации сделать предположительные выводы о типах свойств и признаков, а также характеризуемых такой их представленностью характеристиках. Для построения такой модели:

1. Производится экспертный анализ текущей предметной области.

2. На основании текущей результатов анализа и опыта работы экспертов из множества обнаруженных проявлений признаков посредством экспертных оценок строится множество характеризуемых ими предполагаемых признаков {Xk}.

3. Из имеющегося на настоящий момент и построенного множества признаков формируется множество характеризуемых этими признаками свойств {Ok}.

4. Из вскрытых и построенных множеств свойств и признаков, рассматриваемых совокупно, экспертным путем выдвигаются гипотезы о характеристике (характеристиках) {Sj}, характеризуемой таким набором признаков и свойств.

В результате описания последовательных теоретических индуктивных выводов, основанных на эмпирических экспертных знаниях, также формируется структура, состоящая из проявлений признаков, свойств, обусловленных ими характеристик и правил их вывода (5).

Yk U Y, & Xk U X, & Ok U X, & Sj (5)

На основании вывода (5) строится функциональная модель процесса формирования множества возможных характеристик на основе экспертных знаний (Рис. 2).

136

БД эталонных признаков

АПС анализа сигнальной обстановки

Формирование множества возможных ситуаций, Sj

Sj - множество значений характеристик, сформированных на основании экспертного анализа априорных данных предметной области;

Ok - множество свойств характеристики Sj;

Xl - множество признаков характеристики Sj;

Xk - множество признаков, характеризующих свойства Ok;

Yl - множество проявлений, характеризующих признаки Xl;

Yk - множество проявлений свойств Xk;

Rf - множество формальных экспертных эмпирических правил индуктивного вывода.

Рис. 2 - Функциональная модель процесса формирования множества возможных характеристик, построенная на основе экспертных знаний

Для сужения области возможных значений ситуаций {Si}, полученной на основе фундаментальных знаний областью возможных значений ситуаций, полученных экспертным путем, строится их пересечение.

137

SI = iSMS-1 (6)

где 1S.1 >1 Sk1 ^ Sj1.

Полученное множество значений ситуаций {Sk} и будет являться наиболее вероятным множеством решений.

В результате проведения вышеописанных операций из всего множества гипотез Sk истинной будет только одна.

Следующим шагом является проверка полученного множества гипотез. В терминах ДСМ-метода этот шаг называется проверкой условия каузальной полноты. Проверка этого условия интерпретируется, как рассуждение по абдукции - условие выполняется, если полученная гипотеза объясняет исходные данные, т.е. если одна из гипотез о наличии у объекта возможного свойства, полученная в результате применения правил первого и второго рода, может объяснить наличие свойств и признаков выявленных изначально (до применения процедур индукции и аналогии).

Цель проверки условия состоит в том, чтобы определить, можно ли принимать полученные в результате работы метода гипотезы. Если условие каузальной полноты не выполняется, необходимо выбрать другую гипотезу и проверить это условие снова.

Для проверки истинности гипотез одна из них условно принимается за истинную и посредством дедуктивного анализа на основании классификатора строятся последовательно:

1. Множество свойств характеристики объекта;

2. Множество признаков свойств;

3. Множество признаков свойств характеристики.

Для проверки полноты множеств строится пересечение множества свойств характеристики {Om}, со множеством свойств, наблюдаемых на настоящий момент {On}

Om П On=O' (7).

Если мощность получившегося в результате пересечения множества O’ равна мощности множества свойств, определяющих характеристику объекта {Om}, то производится проверка множества отдельных признаков, определяющих эту характеристику. Если мощность множества {O’} меньше мощности множества свойств, определяющих характеристику, то строится вычитание множества {O’} из множества свойств характеристик.

On - O’=O

1 i (8)

138

В результате вычитания остаётся одно или несколько свойств {O”}, которые предположительно имеются у объекта, но до настоящего момента их выявлено не было.

Для дальнейшей проверки условия каузальной полноты производится целенаправленное выявление предполагаемого признака с известными проявлениями. В случае подтверждения наличия такого признака делается вывод о наличии проявляемого через него свойства. Такая процедура, с использованием механизма обратной связи с подсистемой добывания, применяется ко всем свойствам, а также к отдельным признакам, определяющим предполагаемую характеристику. Наиболее подтвержденная характеристика и будет являться истинной.

Несмотря на существование возможности проверки каждой характеристики из множества {Si} путем дедуктивного метода анализа, постоянно корректируя деятельность подсистемы добывания для поиска дополнительной информации о предполагаемых на каждом шаге свойствах или признаках, и дальнейшего отбрасывания ложных, с целью повышения оперативности и полноты обработки информации построение экспертной модели необходимо для сужения возможно намного более мощного множества Si гораздо менее мощным Sj и дальнейшей проверки их пересечения Sk.

Таким образом, разработан метод обработки информации, основанный на ДСМ методе автоматического порождения гипотез и организации обратной связи с подсистемой добывания в ходе процесса обработки.

Основными достоинствами предложенного метода являются высокая полнота и оперативность обработки добываемой информации и низкая зависимость процессов обработки от динамики изменения характеристик предметной области. К недостаткам можно отнести необходимость изменения параметров решения задач в реальном масштабе времени.

139

i Надоели баннеры? Вы всегда можете отключить рекламу.