Научная статья на тему 'Комплексный подход к оценке качества технической диагностики'

Комплексный подход к оценке качества технической диагностики Текст научной статьи по специальности «Математика»

CC BY
111
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
iPolytech Journal
ВАК
Область наук

Аннотация научной статьи по математике, автор научной работы — Сосинская Софья Семеновна

Рассматриваются задачи технической диагностики и предлагается использовать для оценки качества технической диагностики различные методы искусственного интеллекта: методы классификации объектов, экспертные системы и метод квалиметрической экспертизы. Показано как своеобразие каждого из этих методов, так и их общность, что позволяет применить все эти методы в комплексе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Комплексный подход к оценке качества технической диагностики»

Если заданы координаты (п + 1)-й точки кривой, то коэффициенты получаются как решение линейной системы из (п + 1)-го уравнения.

Преимущество такой аппроксимации кривой заключается в простом вычислении коэффициентов. Однако это имеет ряд существенных недостатков: наличие вертикальных касательных делает невозможной аппроксимацию этой формы. Этот недостаток можно устранить, выбрав соответствующим образом систему координат. Вид аппроксимирующего полинома зависит от выбора системы координат; зависимость между коэффициентами полинома ас и формой кривой не является очевидной, а просматривается только после соответствующих преобразований.

Описанные в статье подходы показывают возможность моделирования простейших кривых с помощью аналитических функций. Подобные направления используются давно, но несмотря на это, они получили дальнейшее развитие с учетом применения методов дифференциальной геометрии.

Библиографический список

1. Алберг Дж., Нильсон Э., Уолш Дж. Теория сплайнов и её приложения. - М.: Мир, 1972. - 318 с.

2. Ахатов Р.Х., Хасанов В.Х. К вопросу формирования математических моделей поверхности сложных технических форм в САПР. Прикладная геометрия и машинная графика в авиастроении. - М,: Изд-во МАИ, 1981. - С. 27-30.

3. Бахвалов Н.С. Численные методы. - М.: Наука, 1975.

4. Василеноко В.А. Сплайны. Теория, алгоритмы, программы. - Новосибирск: Наука СО, 1983. - 186 с.

5. Завьялов Ю.С., Лесус В.А., Скороспелов В.А. Сплайны в инженерной геометрии. - М.: Машиностроение, 1985.

6. Калиткин Н.Н. Численные методы. - М.: Наука, 1978.

7. Осипов В.А Теоретические основы автоматизации геометрических расчётов и машинной графики (автоматизированная система машинной графики). - М., 1978.

8. Самарский А.А. Введение в численные методы. - М.: Наука, 1976.

С.С.Сосинская

Комплексный подход к оценке качества технической диагностики

В технической диагностике возникает ряд задач. Основное внимание в данной работе уделяется оцениванию состояния объекта либо в последующие моменты времени по состояниям объекта в прошлые моменты времени (задача прогнозирования), либо в прошлые моменты времени по текущему состоянию (задача генезиса).

Задача прогнозирования имеет определенную степень точности, которую можно оценить с помощью некоторого критерия.

В любом случае состояние объекта в каждый момент времени определяется набором характеристик или признаков, которые могут измеряться в различных шкалах. Признаки подразделяются на ранговые, или качественные, и количественные. Измерение ранговых признаков производится по шкале порядка, допускающей операции «равно» и «больше - меньше». Например, ранговым признаком является уровень шума: очень высокий, высокий, средний, низкий, очень низкий. Ранговые признаки также приводятся к числовым значениям, соответствующим коду соответствующего ранга. Отличительная особенность количественных признаков -возможность упорядочения значений по числовой шкале.

Для оценки состояния объекта по его характеристикам предлагается использовать известные методы, в частности, методы классификации объектов, использование экспертных систем и метод квалиметрической экспертизы.

Эти группы методов, казалось бы, различны, но при более глубоком рассмотрении имеют много общего, что позволит, на наш взгляд, использовать их сочетание для получения более эффективной оценки качества технической диагностики.

Охарактеризуем каждый из предлагаемых методов.

Задача классификации объектов предполагает наличие системы признаков X - (хх,...х1,...хп), описывающих объекты. Каждый признак может быть измерен в своей шкале, но впоследствии все они должны быть нормированы. Распознавание - это отнесение конкретного объекта к одному из фиксированного перечня образов (классов) по определённому решающему правилу в соответствии с поставленной целью. Размерность признакового пространства п обычно стремятся сделать как можно меньше, поскольку при этом сокращается количество требуемых измерений, упрощаются вычисления, формирующие и реализующие решающие правила, повышается статистическая устой-

чивость результатов распознавания. Вместе с тем уменьшение п, вообще говоря, ведёт к росту риска

потерь. Поэтому формирование признакового пространства является компромиссной, часто интуитивно решаемой задачей. Риск потерь Я фактически является критерием, по которому формируются наиболее информативное признаковое пространство и наиболее эффективные решающие правила. И признаки, и решающие правила должны быть такими, чтобы по возможности минимизировать риск потерь.

Для построения решающих правил нужна обучающая выборка, то есть множество объектов, заданных значениями признаков, принадлежность которых к тому или иному классу достоверно известна и сообщается системе. По обучающей выборке система строит решающие правила. Качество решающих правил оценивается по контрольной выборке, в которую входят объекты, заданные значениями признаков, принадлежность которых тому или иному образу известна, но не сообщается системе. Предъявляя системе для контрольного распознавания объекты контрольной выборки, можно оценить качество обучения.

Обучающая и контрольная выборки должны достаточно полно представлять генеральную совокупность.

Решающие правила достаточно разнообразны, Они могут быть линейными и нелинейными. Если число классов >2, то для разделения каждой пары классов нужна линейная функция, то есть в целом разделяющая функция будет кусочно-линейной. Укажем некоторые наиболее употребимые нелинейные функции. Так, метод ближайших соседей состоит в том, что для каждого класса по обучающей выборке строится эталон, имеющий значения признаков

_ / о о о I

л |х, , х2 , • • •, xп ) 1

1 к

где х:' = —^ х, ; К - количество объектов данного

К

м

образа в обучающей выборке; / - номер признака.

По существу, эталон - это усреднённый по обучающей выборке абстрактный объект. Распознавание осуществляется следующим образом. На вход системы поступает объект X, принадлежность которого к тому или иному образу системе неизвестна. Измеряются расстояния от этого объекта до эталонов всех образов, и X относится системой к тому образу, расстояние до эталона которого минимально. Расстояние измеряется в той метрике, которая введена для решения определённой задачи распознавания.

Если v, V/ - точки в пространстве признаков (X), х2,...хп ) до расстояние с1(V, м>) удовлетворяет трем условиям: 1) = 2) у,м>) = и-, V), 3} с/(у,2)<с1(с1(V,ц>) + СЦИ', 2) .

Примеры известных метрик:

п

- Расстояние Хемминга (1(V, ч>) - ^ [ ухг - ч'Хг

;=1

- Расстояние Евклида с1(v, м>) = ^У] (ух;. - и'х /' .

Существует множество других метрик.

Метод потенциальных функций состоит в рассмотрении объектов, которые разбиты на к классов:

А] . Задано по объектов каждого клас-

са А.. Элементы обучающей выборки образуют матрицу аг.. На этих объектах измерено / признаков: -/],/2у-',/г Каждый из признаков / разбит на лр подинтервалов.

Среднее расстояние между объектами а1 ., принадлежащими классу Д., и исследуемым объектом ах определяется следующей формулой: 1 'ч

/=1

где аи, е Д., ф(а1]Уах) = Л^Фр(ац,ах) .

р=\

фр(а; .,ах) имеет смысл расстояния между а, и ах по признаку / . Это расстояние для числовых

признаков определяется как

ФР(аиРах)

{ аМ,})-а(х)Л

п.

1

V Р

а для нечисловых признаков как

\\оср(1,]) = оср(х) ф(а, ,.аг) = *

•■>' |о,а/и) = а/х),

гдеа (г) - номер подингервала, в котором находится значение признака / на объекте а,.

При решении задачи распознавания образов возникает ряд проблем.

Первая проблема - необходимость сбора данных для обучающей выборки. Кроме того, необходимы данные о влиянии различных признаков на результаты распознавания. Такие данные чаще всего получают путем анкетирования экспертов в конкретной предметной области. Их знания отображаются в виде рангов признаков. Статистика экспертов нуждается в дальнейшей обработке; в частности, необходимо исследовать степень согласованности ответов экспертов по отдельным признакам.

Вторая проблема - информативность признаков. Некоторые признаки могут не оказывать значимого

влияния на значения разделяющей функции и без ущерба для конечного результата могут быть отброшены. Выбор различных подмножеств признаков может приводить к различным результатам. Это связано с корреляцией значений признаков. Поэтому необходимо исследовать наборы признаков как на предмет информативности, так и на предмет взаимной корреляции.

Еще одна проблема, возникающая в системах распознавания образов, - самообучение, то есть выделение классов на основе информации об их признаках в предположении, что существуют наборы сгустков в признаковом пространстве. Задача системы - выявить и описать эти сгустки. Такие методы называются таксономией или построением кластеров.

Деревья решений - один из методов автоматического анализа данных. Основополагающей работой, давшей импульс для развития этого направления, явилась книга Ханта, Мэрина и Стоуна «Experiments in Induction», увидевшая свет в 1966 г.

Деревья решений - это способ представления правил в иерархической, последовательной структуре, где каждому объекту соответствует единственный узел, дающий решение.

Под правилом понимается логическая конструкция, представленная в виде «если ..., то ...». Пример дерева решений для решения задачи: выдать ли кредит на покупку дома, - представлен на рис. 1.

Деревья решений отлично справляются с задачами распознавания образов.

Пусть нам задано некоторое обучающее множество Т, содержащее объекты, каждый из которых характеризуется m признаками, причем известна принадлежность объекта к определенному классу.

Пусть через {С]; С2, ... Ск} обозначены классы, тогда существуют 3 ситуации:

1. Множество Т содержит один или более объектов, относящихся к одному классу Ск. Тогда дерево решений для Т - это лист, определяющий класс Ск.

2. Множество Т не содержит ни одного объекта, то есть это пустое множество. Тогда это снова лист и класс, ассоциированный с листом, выбирается из другого множества, отличного от Т, например, из множества, ассоциированного с родителем.

3. Множество Т содержит объекты, относящиеся к разным классам. В этом случае следует разбить множество Т на некоторые подмножества. Для этого выби-рается один из признаков, имеющий два и более отличных друг от друга значений О], 02, ... On. Т разбивается на подмножества Tj, Т2, ... Тп, где каждое подмножество Tj содержит все объекты, имеющие значение О, для выбранного признака. Эта процедура будет рекурсивно продолжаться до тех пор, пока конечное множество не будет состоять из объектов, относящихся к одному и тому же классу.

Очевидно, что при использовании данной методики построение дерева решений будет происходить сверху вниз.

Наибольшее распространение и популярность получили следующие два алгоритма, реализующие деревья решений:

- CART (Classification and Regression Tree) - это алгоритм построения бинарного дерева решений - дихотомической классификационной модели. Каждый узел дерева при разбиении имеет только двух потомков.

- С4.5 - алгоритм построения дерева решений, количество потомков у узла не ограничено.

При построении деревьев решений особое внимание уделяется следующим вопросам: выбору критерия атрибута, по которому пойдет разбиение, остановки обучения и отсечения ветвей.

Визраш > 40

Нет"

f Образование

Выси ее Средйее Спещ-альюе I \

Имеется дом

Нет

X

Дохсд > 5000

Быда_ь кредит

Нрт

Отказать

Д<

/—

В_.|дот_. кэедит

Рис. 1. Пример дерева решений

ш Информационные технологии в машиностроении

Для построения дерева на каждом внутреннем узле необходимо найти такое условие, которое бы разбивало множество, связанное с этим узлом, на подмножества. В качестве такого условия должен быть выбран один из признаков. Общее правило для выбора признака можно сформулировать следующим образом: выбранный признак должен разбить множество так, чтобы получаемые в итоге подмножества состояли из объектов, принадлежащих к одному классу, или были максимально приближены к этому, то есть количество объектов из других классов («примесей») в каждом из этих множеств было бы как можно меньше.

Были разработаны различные критерии.

Алгоритм С4.5 использует теоретико-информационный подход. Для выбора наиболее подходящего признака предлагается следующий критерий:

Gaw(X) = Info(T) - Info у (Т), где Info(T) - энтропия множества T,

1п/ок(Т) = ±'£\гф(Т,).

1=1 ' J !

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Множества Ть Т2) ... Тп получены при разбиении исходного множества Т по проверке X. Выбирается атрибут, дающий максимальное значение по критерию Gain.

Алгоритм CART использует индекс Gini, который оценивает расстояние между распределениями классов:

п

Gini(сО =1 ~ X Р>'

/=1

где с - текущий узел, a р. - вероятность класса i в узле с.

В пакете Deductor, разработанном фирмой BaseGroup Labs, имеются методы для таксономии и классификации объектов по обучающей выборке на основе дерева решений.

Алгоритм функционирования самоорганизующихся карт (Self Organizing Maps - SOM) представляет собой один из вариантов кластеризации многомерных векторов - алгоритм проецирования с сохранением топологического подобия.

Важным отличием алгоритма SOM является то, что в нем все центры классов упорядочены в некоторую структуру (обычно двумерную сетку). При этом в ходе обучения модифицируется не только класс-победитель (класс, который в наибольшей степени соответствует тестовому объекту), но и его соседи, хотя и в меньшей степени.

При использовании дерева решений с помощью обучающей выборки строится дерево решений, а затем элементы контрольной выборки с помощью дерева относятся к одному из классов.

Экспертная система - это программный комплекс, выполняющий функции эксперта при решении задач в определенной предметной области. Такая система при

своей работе оперирует с базой знаний, которая является более мощным механизмом, чем база данных. База знаний в общем случае содержит правила, позволяющие путем логического вывода генерировать новые знания. База знаний, накопленная на основе знаний эксперта в определенной предметной области и формализованная специалистом по знаниям, может расширяться и пополняться новыми знаниями, полученными как от новых экспертов, так и выведенными из старых.

Результатом работы пользователя с готовой экспертной системой, то есть консультации, является заключение об истинности одного из положений, которые могут быть выведены из состояния базы знаний. Иначе говоря, это можно также трактовать как выяснение принадлежности объекта, характеризуемого некоторыми логическими связями и некоторыми признаками (количественными или качественными) к одному из классов.

Для того чтобы иметь возможность давать не только качественные, но и количественные оценки, процесс логического вывода наряду с математической логикой расширяют понятиями нечеткого множества и нечеткой логики.

Характеристикой нечеткого множества выступает функция принадлежности. Обозначим через МГ^(х)

степень принадлежности х к нечеткому множеству С.

Тогда нечетким множеством С называется множество упорядоченных пар вида С={МР^(х) / х}, где

МЬ'с(х) с / ОД /. Значение МР^х) - 0 означает

отсутствие принадлежности к множеству, МР^(х) - 1

- полную принадлежность.

Проиллюстрируем это на примере. Определим понятие «класс технического состояния оборудования». В качестве X выступает множество наборов параметров технического состояния. Как правило, выделяется от 3 до 5 классов. Выделим 4 класса «Хорошо», «Допустимо», «Требует принятия мер», «Недопустимо». Нечеткое множество для понятия «класс Допустимо» может выглядеть следующим образом:

С={ Х1 / 1,Х2/0.75,X, /0.5, Х4/0.25,Х5 /0}.

Так, множество Х2 принадлежит классу «Допустимо» со степенью принадлежности 0.75, то есть по предположениям одних экспертов оно принадлежит этому классу, а по предположениям других - нет. Именно в этом и проявляется нечеткость задания соответствующего множества.

Для нечетких множеств, как и для обычных, определены основные логические операции. Самыми основными, необходимыми для расчетов, являются пересечение и объединение.

Пересечение двух нечетких множеств (нечеткое "И"): Аг>В\ МРАВ(х ) = тт( МРА (х ),МРВ (х)).

Объединение двух нечетких множеств (нечеткое

AxjB: MFab (х) = тах(MFA (х), MFB (х)).

Многие экспертные системы реализуют нечеткую логику. В частности, такими являются системы FuzzyCLIPS и FLOPS.

С другой стороны, теория нечетких множеств находит применение и в распознавании образов.

Классы естественным образом можно представить как нечеткие множества Ki = \MFK(x)/x). При этом, если функция принадлежности класса MFk (x)g {0, 1}, то имеет место случай четкого класса. В общем случае, нечеткий признак х, принимает значения из некоторого множества Д (будем считать его конечным). Если признак х, нечеток, то для каждого элементарного события xi . <е Di имеется не конкретное значение признака, но функция принадлежности MFxi }(хл>]).

Квалиметрия - наука о количественной оценке качества объекта, описываемого набором признаков. Эти признаки образуют иерархию, то есть один из признаков нижележащего уровня содержит ряд признаков вышележащего уровня (иерархия строится снизу вверх). Подобная иерархия образует расчетную модель объекта. Построение расчетной модели - сложный неформальный процесс, требующий работы группы исследователей в конкретной предметной области.

Рассмотрим, например, построение расчетной модели признаков технического состояния объекта, включающего следующие виды дефектов:

-дисбаланс, то есть неуравновешенность, - наиболее частая причина сильных механических колебаний машин и оборудования;

- расцентровка, то есть смещение осей двигателя и компрессора;

- механические люфты - нарушение структуры материала или конструкции;

-дефекты подшипников, которые подразделяются на дефекты подшипников качения и дефекты подшипников скольжения;

-дефекты передач, которые подразделяются на дефекты зубчатых передач и ременных передач.

Каждый вид дефекта имеет определенные признаки. Анализируя все многообразие признаков, можно построить иерархию признаков (рис. 2). Здесь вершины обозначены следующим образом:

1 - дисбаланс;

1.1 -траектория движения ротора;

1.2 - направления колебаний;

1.3 - временной сигнал;

1.4 - фаза;

1.5 - характерные частоты;

1.6 -спектр.

2 - расцентровка;

2.1 - траектория движения ротора;

2.2 - направления колебаний;

2.3 - временной сигна\;

2.4 - фаза;

2.5 - характерные частоты;

2.6 - спектр.

3 - механические люфты;

3.1 - траектория движения ротора;

3.2 - направления колебаний;

1.6

2.2

2.1 --

Уровень 1

\

4.1.4 423 4.2.4 4.2.5 4.1.3 \ \1/ 4.2.6 5.1.1

41.2 \ 422 \ \ / / / 5-1"2 5.2. 4.1.1 Ч\ \ \ \ Л

, г ^ W J^- v^

\\ /л 4 \41 / do

/

Техническое состояние

\

\ I

\

Рис. 2. Иерархия признаков состояния объекта

3.3 - временной сигнал;

3.4 - фаза;

3.5 - характерные частоты;

3.6 - спектр.

4 - дефекты подшипников;

4.1 - дефекты подшипников качения;

4.1.1 - характерные частоты;

4.1.2 - амплитуда;

4.1.3 - временной сигнал;

4.1.4 - спектр;

4.2 - дефекты подшипников скольжения;

4.2.1 - вихревая неустойчивость смазки;

4.2.2 - масляная хлопающая неустойчивость;

4.2.3 - сухой вихрь;

4.2.4 - гистерезисный вихрь;

4.2.5 -износ;

4.2.6 - повреждение подшипника.

5 - дефекты передач;

5.1 - дефекты зубчатых передач;

5.1.1 - обычный спектр зубчатой передачи;

5.1.2 - износ зуба;

5.1.3 - перегрузка зуба;

5.1.4 - несоосность передачи;

5.2 - дефекты ременных передач;

5.2.1 - эксцентриситет шкивов;

5.2.2 - эксцентриситет ротора;

5.2.3 - несоосность шкивов.

Далее исследователем вводятся ранги признаков г. Ранг изменяется от 1 до наивысшего значения, который равен числу признаков на уровне. Наиболее важный признак имеет наивысший ранг. Для оценки качества группы объектов привлекается группа экспертов. Оценки рангов признаков выполняются каждым экспертом группы. Затем на основе рангов вычисляется вес признаков по формуле

т

У -,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

I п т

Е2Х-

где г . - ранг ! -го признака, определенный / -м экспертом; п - число признаков; т - число экспертов.

Затем эксперты оценивают значения качества признаков конкретных представителей группы в одной из шкал, однако в дальнейшем все они пересчитываются к квалиметрической шкале.

Квалиметрическая экспертиза - экспертиза качества, оцениваемая одним числом. Может определяться одним из двух способов:

- как взвешенная суммарная оценка признаков

п

¿-1

- как взвешенное произведение признаков

/г ai

в=Ш ■

г=1

где qi - оценка качества i-ro признака; а; - вес i-ro признака.

Представляется, что на первом этапе необходимо структурировать признаки технического состояния объекта, разбив их на уровни, подобно тому, как это делается при квалиметрической экспертизе.

Затем следует провести классификацию одним из известных методов, возможно, с некоторой его модификацией. Далее в каждом из классов необходимо оценить качество каждого состояния объекта с привлечением экспертов.

На следующем этапе необходимо сделать логический вывод, фактически также о принадлежности каждого технического состояния к некоторому классу, но уже с помощью экспертной системы.

В результате такой комплексной процедуры, на наш взгляд, удастся сделать процедуру технической диагностики значительно более эффективной.

Для выполнения квалиметрической экспертизы будет использован программный продукт, разработанный автором.

Для выполнения автоматической классификации будет использован пакет Deductor, а также предполагается разработка адаптивной системы на основе нечетких признаков.

Библиографический список

1. Айзерман М.А., Браверман Э.М., Розоноэр Л.И. Теоретические основы метода потенциальных функций в задачах об обучении автоматов разделению входных ситуаций на классы: самообучающиеся автоматические системы. - М.: Наука, 1966. - С. 48-67.

2. Владимирцев A.B., Маругин В.М. и др. Курс лекций, практических занятий, контрольных и лабораторных работ по квалиметрической экспертизе вариантов. - СПб.: Ассоциация по сертификации «Русский Регистр», 2005. - 294 с.

3. Деревья решений - общие принципы работы. Лаборатория Base Group анализа данных. Сайт http://www.baseqroup.nj/

4. Лукьянов A.B. Классификатор вибродиагностических признаков дефектов роторных машин. - Иркутск: Изд-во Ир-ГТУ, 1999. - 228 с,

i Надоели баннеры? Вы всегда можете отключить рекламу.