Научная статья на тему 'Экспертная оценка в задачах технической диагностики'

Экспертная оценка в задачах технической диагностики Текст научной статьи по специальности «Математика»

CC BY
123
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЙЕСОВСКАЯ СЕТЬ / ДЕРЕВО ПРИНЯТИЯ РЕШЕНИЙ / ЭВРИСТИЧЕСКИЙ ПОИСК / ТЕХНИЧЕСКАЯ ДИАГНОСТИКА / ВЕРОЯТНОСТНЫЙ ВЫВОД

Аннотация научной статьи по математике, автор научной работы — Солодкий Евгений Михайлович, Петроченков Антон Борисович

Рассмотрены методы точной и вероятностной классификации, которые могут быть использованы в построении экспертных систем для задач технической диагностики

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Экспертная оценка в задачах технической диагностики»

УДК 004.891.3 + 681.518.5

Е.М. Солодкий, А. Б. Петроченков

Пермский государственный технический университет

ЭКСПЕРТНАЯ ОЦЕНКА В ЗАДАЧАХ ТЕХНИЧЕСКОЙ ДИАГНОСТИКИ

Рассмотрены методы точной и вероятностной классификации, которые могут быть использованы в построении экспертных систем для задач технической диагностики.

В сложных системах, состоящих из многих узлов и агрегатов, задачи технической диагностики решают широкий спектр проблем и обеспечивают повышение основных показателей: долговечности, безопасности, безотказности оборудования. С другой стороны, задачи диагностики решаются в условиях неопределенной информации и требуют комплексной экспертной оценки. Экспертная оценка в совокупности с методами искусственного интеллекта позволяет системам диагностики наиболее эффективным способом решать поставленные перед ней задачи.

Диагностика относится к системам распознавания состояния объекта, которые по поступающим описателям (событиям) классифицируют систему. Рассмотрим основные подходы для построения классифицирующих систем технической диагностики.

Эвристический поиск и деревья принятия решений. Любая экспертная система состоит из набора определенных компонент, важнейшей из которых является база знаний, в которой хранятся правила для анализа информации, записанные с помощью языка предикатов. Единичное правило имеет вид:

Если <условие> то <вывод>. (1)

В случае вероятностной оценки в конец конструкции (1) добавляется степень определенности. Правило, сформированное экспертом на основании его практических знаний, называется эвристическим. Соответственно, эвристический поиск - цепочка логических выводов, приводящая к конечному узлу - конечному выводу.

Допустим, что задачей диагностики является классифицировать состояние объекта по совокупности дискретных показателей. Другими словами необходимо определить внутреннюю реализацию булевской функции арности п, равной количеству показателей (симптомов). Данная задача сводится к аппроксимации булевской функции на заданном наборе данных.

Пусть стоит задача определения состояния электрической машины. На основании статистических данных имеется обучающая выборка, состоящая из 3 симптомов и двух исходов по состоянию подшипников. Симптомы: Б1 - повышение температуры масла, В2 -вибрации, В3 - увеличение содержания железа в масле. Возможные исходы (несовместные события): исправное состояние А і и неисправное А2. Обучающая выборка на основе статистики приведена в таблице.

Статистические данные

Ві В2 Вз А 1(А 2)

1 1 1 0

0 0 1 0

1 0 0 1

0 1 0 1

1 1 0 0

Составим дерево решений относительно В2 (рис. 1) и покажем общий принцип построения оптимального дерева решений, информативные узлы которого будут находиться вверху. Для определения информативности симптомов будем использовать понятие энтропии.

Рис. 1. Дерево решений относительно В2

Энтропия системы А, имеющей п возможных состояний (диагнозов), с вероятностями Р(А\), Р(А2),...,Р(Ап) определяется по следующей формуле:

п 1 п

Н (А) = I Р(Л )1св2 = -I Р(Л )1о§2 Р( Л )• (2)

г =1 Р(Аг) г =1

Рассмотрим еще множество сигнальных систем (симптомов) Б]_, В2,... ,Вт, связанных с А, где т - количество таких рассматриваемых систем (в нашем случае их три). Каждая Вг система (г = 1, п) может также иметь определенное количество состояний (в рассматриваемом случае для каждого Вг их два: Вг1 = 1 - наблюдается; Вг2 = 0 - нет).

Информативность сигнальной системы В относительно А составляет:

,!л (В) = Н (А) - Н (А/В). (3)

Формула (3) показывает значение информации относительно А после того, как становится известным состояние системы В.

Учитывая, что Р( АВ) = Р( А/В) • Р(В), получаем

Н (А/В) = Н (АВ) - Н (В). (4)

Подставляем (4) в (3):

JA (В) = Н (А) + Н (В) - Н (АВ).

Учитывая формулу (2), получаем свой «вклад» Вг системы в общую информативность А:

п I

JА (Вг ) = I Р(А} )1о82 Р(А;) +1 Р(Вгк ^ Р(В1к ) -

;=1 к=1 (5)

-11Р( АВк )1о§2 Р( АВк ).

1=1 к=1

В формуле (5) В гк - к-ое состояние системы Вг, I - общее количество

I п

состояний. Учитывая, что Р(А1) = I Р(А]Вк ) и Р(Вк ) = I Р(А]Вгк ),

к=1 1=1

и, приводя вероятности под знак логарифма, получаем:

Р( А,Вгк)

иВ)=ъъпщк >Ь82 \ Р'В\. (6)

1 =1к=1 Р( А )Р(Вгк )

Исследуем нашу систему на предмет информативности ее симптомов, используя полученную формулу (п = I = 2).

Для В\. Р{АіВц) - 1/5; Р{А\В\2) - 1/5; р(А2віі) - 2/5; р(А2В12) - 1/5;

Р(Аі) - 2/5; Р(А2) - 3/5; РВ) - 3/5; Рф) - 2/5;

0 2 0 2 0 4

JА (В,) = 0,21о§2----?---+ 0,21о§2------?--+ 0,41о§2-----?----+

А 2 0,4 • 0,6 2 0,4 • 0,4 2 0,6 • 0,6

0 2

+ 0,21оє2---------; JA(Я) = 0,019973.

0,6 • 0,4

Аналогично получаем. JA (В2) = 0,019973, JA (В3) = 0,419973.

Построим окончательный вариант дерева (рис. 2) с учетом того, что информативность узлов должна убывать с ростом уровня. Корень дерева будет иметь максимальную информативность относительно вывода.

Рис. 2. Оптимальное дерево решений

Полученное дерево решений на половине всех возможных вариантов «отсекает» дальнейшие рассуждения, делая вывод, что подшипник находится в неисправном состоянии. С точки зрения пользователя, оптимальное дерево решений задает минимальное число вопросов, чтобы сделать правильный диагноз. Метод преобразования дерева решений в правила вида (1) описаны в [1]. Данный подход, по сути, создает экспертную базу знаний по полученной статистической информации. В приведенном примере использовались булевские переменные для описания состояния систем А и В, в общем случае возможных состояний может быть больше 2, например, симптом увеличения содержания железа в масле, может иметь значения В31 - незначительная

концентрация, В32 - средняя концентрация, В33 - высокая концентрация. Информативность симптома В, а значит и его положение в дереве в независимости от количества состояний, определяется по формуле (6).

Рассмотрим общие правила для вероятностной оценки диагноза по его симптомам.

Байесовские сети в задачах диагностики. В условиях неопределенной информации во многих случаях вывод не может быть строго определен, но может быть определен вероятностно, т.н. вероятностный вывод. Во многих случаях, связанных с вероятностным выводом получение диагноза сводится к вычислению апостериорного распределения, исходя из имеющегося набора сведений (симптомов). Будем рассматривать и сведения и диагнозы, как множество дискретных переменных зависимых и независимых, тогда для описания системы в целом можно использовать направленный ациклический граф, или байесовскую сеть [2]. На рис. 3 приведена байесовская сеть, описывающая следующую задачу.

Задача. Известно, что 95 % однотипных узлов за время эффективной эксплуатации находятся в исправном состоянии (состояние А). Появление состояния В у исправных узлов составляет 3 %. Требуется вычислить вероятность исправного состояния узла при появлении признака В.

А А 0,95 0,05

в______В!

А 0,03 0,97 А 0,97 0,03

Рис. 3. Граф с таблицами вероятности

Граф, описывающий проблему, представлен на рис. 3. Данный граф представлен всего двумя вершинами (переменными А и В). Значения переменных в данном графе приведены в таблицах условной вероятности, где показана вероятность потомка при означенных переменных его предков. Размер таблицы составляет 2” х 2, где п - количество предков переменной.

В общем случае граф можно определить как G = (У,Е), где V -множество вершин или переменных, Е - множество упорядоченных пар вершин или набор вероятностных связей, каждый из которых можно представить правилом вида (1), или в совокупности с таблицей условной вероятности для каждого /-го узла Р(¥^ | ПР ), где Пу. -

предки V/, (/ = 1, ”) , ” = VI. Тогда, общее распределение вероятности находится по формуле:

Для байесовской сети G основное назначение - решение задач вероятностного вывода, т.е. определение вероятности достижения переменных определенных дискретных значений (U = u, U с V ) при означенных переменных (E = e, E с V \ U ), или P(v\e). В частности, для нашей задачи можно сформулировать P(v\e) = P(A = true\B = true). К точным методам определения вероятностного вывода в байесовской сети относится алгоритм распространения вероятности в кластерных деревьях (Probability Propagation in Trees of Clusters (PPTC)) [3]. Данный алгоритм основывается на переходе от байесовской сети через преобразования над графом к дереву смежности. P(v\e) определяется как:

Для нашего примера преобразования не нужны, можно применить формулу Байеса напрямую:

В формуле (7) А/ - /-е состояние события А, Р(А/ | В) - апостериорная вероятность А/ при наблюдаемом событии В. Именно формула Байеса лежит во многих системах, работающих в условиях неопределенности [4].

n

P(V) = п P(v!\nr,).

i= 1

(7)

V

n

I P(B | Aj) • P(Aj)

(8)

j=1

Также вероятность можно определить по формуле (7).

ч P(A = true,B = true) P(A = true,B = true)

P(A = true | B = true) = ^----------------------L = —^---------------------L

P(B = true) I P( A, B = true)

A

°'95-°'03 0,3701.

0,95 • 0,03 + 0,05 • 0,97

Классификация в системах диагностики является основной задачей, подходы к определению состояния могут быть как вероятностные, так и точные, оба метода рассмотрены в данной статье. Вероятностный подход предполагает построение графа и установление причинноследственных связей между свидетельствами в сети, которые, как правило, определяет эксперт. Г раф состоит из наблюдаемых свидетельств - симптомов, как правило, это листья, корнями служат диагнозы. Определение вероятности диагнозов по поступившим свидетельствам -основная задача байесовской сети. Точные методы классификации основаны на понятии энтропии и определение максимально информативных узлов дерева решений.

Библиографический список

1. Путькина Л.В., Пискунова Т.Г. Интеллектуальные информационные системы. - СПб.: Изд-во ГУП, 2008. - 228 с.

2. Probabilistic Networks and Expert Systems / R.G. Cowell, A.P. Dawid, S.L. Lauritzen, D.J. Spiegelhalter. - Springer, 1999. - 339 р.

3. Huang C., Darwiche A. Inference in belief networks: A procedural guide // International Journal of Approximate Reasoning. - Vol. 15. -№ 3. - October 1996. - P. 225-263.

4. Люгер Д.Ф. Искусственный интеллект, стратегии и методы решения сложных проблем. - 4-е изд. - Вильямс, 2003. - 864 c.

Получено 09.07.2009

i Надоели баннеры? Вы всегда можете отключить рекламу.