Ергалиев Д.С. - к.т.н., доцент кафедры космическая техника и технологии Евразийского Национального университета
им. Л.Н. Гумилева, г. Астана
Экстенсиональные методы диагностики
В методах данной группы каждому изучаемому объекту придается самостоятельное диагностическое значение.
Применительно к технической диагностике эти методы базируются на подходе, который рассматривает, например бортовую систему, не как проранжированную по тому или иному показателю цепочку объектов, а как целостные системы, каждая из которых индивидуальна, и имеет особую диагностическую ценность.
Основными операциями в распознавании образов с помощью обсуждаемых методов являются операции определения сходства и различия объектов. Объекты в указанной группе методов играют роль диагностических прецедентов. При этом в зависимости от условий конкретной задачи роль отдельного прецедента может меняться в самых широких пределах от главной до весьма косвенного участия в процессе распознавания. В свою очередь, условия задачи могут требовать для успешного решения участия различного количества диагностических прецедентов от одного в каждом распознаваемом классе до полного объема выборки, а также разных способов вычисления мер сходства и различия объектов. Этими требованиями объясняется дальнейшее разделение экстенсиональных методов на подклассы.
1) Метод сравнения с прототипом.
Это наиболее простой экстенсиональный метод распознавания. Он применяется, например, тогда, когда распознаваемые классы щ
отображаются в пространстве признаков компактными геометрическими группировками. В таком случае обычно в качестве точки - прототипа выбирается центр геометрической группировки класса (или ближайший к центру объект), определяемый как
(1)
Zi = (Xi + X2 + ... + XNi ) / Ni, где Ni - количество объектов в классе w.
2) Метод ближайших соседей.
Метод к-ближайших соседей для решения задач дискриминантного
анализа заключается в следующем.
При классификации неизвестного объекта х к нему находится заданное число к геометрически ближайших в пространстве признаков объектов (ближайших соседей) с известной принадлежностью к распознаваемым классам.
При использовании метода к-ближайших соседей для распознавания образов исследователю приходится решать сложную проблему выбора метрики для определения близости диагностируемых объектов. Эта проблема в условиях высокой размерности пространства признаков чрезвычайно обостряется вследствие достаточной трудоемкости данного метода, которая становится значимой даже для высокопроизводительных компьютеров. Поэтому здесь так же, как и в методе сравнения с прототипом, необходимо решать творческую задачу анализа многомерной структуры экспериментальных данных для минимизации числа объектов,
представляющих диагностические классы.
3) Алгоритмы вычисления оценок (голосования).
Принцип действия алгоритмов вычисления оценок (АВО) состоит в вычислении приоритетов (оценок сходства), характеризующих «близость» распознаваемого и эталонных объектов по системе ансамблей признаков, представляющей собой систему подмножеств заданного множества признаков
В отличие от всех ранее рассмотренных методов алгоритмы вычисления оценок принципиально по-новому оперируют описаниями объектов. Для этих алгоритмов объекты существуют одновременно в самых разных подпространствах пространства признаков.
Используемые сочетания признаков (подпространства) называют опорными множествами или множествами частичных описаний объектов. Вводится понятие обобщенной близости между распознаваемым объектом и объектами обучающей выборки (с известной классификацией), которые называют эталонными объектами. Эта близость представляется комбинацией близостей распознаваемого объекта с эталонными объектами, вычисленных на множествах частичных описаний. Таким образом, АВО является расширением метода k-ближайших соседей, в котором близость объектов рассматривается только в одном заданном пространстве признаков.
Еще одним расширением АВО является то, что в данных алгоритмах задача определения сходства и различия объектов формулируется, как параметрическая и выделен этап настройки АВО по обучающей выборке, на котором подбираются оптимальные значения введенных параметров.
На практике применение АВО для решения высокоразмерных задач сопровождается введением каких-либо эвристических ограничений и допущений.
Рассмотрим подход, называемый коллективами решающих правил.
Так как различные алгоритмы распознавания проявляют себя по-разному на одной и той же выборке объектов, то закономерно встает вопрос о синтетическом решающем правиле, адаптивно использующем сильные стороны этих алгоритмов. В синтетическом решающем правиле применяется двухуровневая схема распознавания. На первом уровне работают частные алгоритмы распознавания, результаты которых объединяются на втором уровне в боке синтеза. Наиболее распространенные способы такого объединения основаны на выделении областей компетентности того или иного частного алгоритма. Простейший способ нахождения областей компетентности заключается в априорном разбиении пространства признаков, исходя из профессиональных соображений конкретной науки (например, расслоение выборки по некоторому признаку). Тогда для каждой из выделенных областей строится собственный распознающий алгоритм.
Другой способ базируется на применении формального анализа для определения локальных областей пространства признаков как окрестностей распознаваемых объектов, для которых доказана успешность работы какого-либо частного алгоритма распознавания.
Самый общий подход к построению блока синтеза рассматривает результирующие показатели частных алгоритмов как исходные признаки для построения нового обобщенного решающего правила. В этом случае могут использоваться все методы интенсионального и экстенсионального направлений в распознавания образов. Эффективными для решения задачи создания коллектива решающих правил являются логические алгоритмы типа «Кора» и алгоритмы вычисления оценок (АВО), положенные в основу так называемого алгебраического подхода, обеспечивающего исследование и конструктивное описание алгоритмов распознавания, в рамки которого укладываются все существующие типы алгоритмов.
Приведенные характеристики различных методов распознавания образов были бы неполными без обсуждения вопроса о критериях качества алгоритмов и о способах оценки этих критериев. Показателями качества обычно являются либо собственно ошибка классификации, либо связанные с ней некоторые функции потерь. При этом различают условную вероятность ошибочной классификации, ожидаемую ошибку алгоритма классификации на выборке объема N и асимптотическую ожидаемую ошибку классификации. Функции потерь также разделяют на функцию средних потерь, функцию ожидаемых потерь и эмпирическую функцию средних потерь.
Сравнение описанных выше методов распознавания образов приводит к следующим выводам.
Применение экстенсиональных методов не связано какими-либо предположениями о структуре экспериментальной информации. Поэтому эффективное использование экстенсиональных методов распознавания образов зависит от того, насколько удачно определены указанные меры
близости, а также от того, какие объекты обучающей выборки (объекты с известной классификацией) выполняют роль диагностических прецедентов. Успешное решение данных задач дает результат, приближающийся к теоретически достижимым пределам эффективности распознавания.
Достоинствам экстенсиональных методов распознавания образов противопоставлена, в первую очередь, высокая техническая сложность их практического воплощения. Для высокоразмерных пространств признаков внешне простая задача нахождения пар ближайших точек превращается в серьезную проблему. Решение проблем возможно с помощью
высокопроизводительных компьютеров.
Теоретические проблемы применения экстенсиональных методов распознавания связаны с проблемами поиска информативных групп признаков, нахождения оптимальных метрик для измерения сходств и различия объектов и анализа структуры экспериментальной информации.
Экстенсиональные методы не страдают необходимостью использования каких-либо оговорок (условий), так как опираются на конкретные, целостные эмпирические факты.
Возможности экстенсиональных методов определяются тем, что они опираются только на одну фундаментальную категорию сходства объектов, которая операционально выражается оценками близости (удаленности) объекта в пространстве признаков. Независимо от размерности описания объектов и их распределения процедура распознавания всегда заключается в расстановке приоритетов указанных оценок. Экстенсиональные методы распознавания образов являются первичными по отношению ко всем методам и потенциальные возможности данных методов не ниже любого другого метода.
Несмотря на безусловность экстенсиональных методов распознавания образов, их практическому применению обязательно должен
предшествовать этап преобразования пространства признаков, позволяющий достигать предела потенциальных возможностей распознавания при
существенном снижении требований к объему анализируемых эмпирических фактов. В свою очередь, лаконичность достигнутого в результате такого преобразования отображения объектов дает возможность не только минимальными средствами реализовывать трудоемкий принцип распознавания на основе сходства с диагностическими прецедентами, но также вскрывать закономерности структуры данных для дальнейшего перехода к интенсиональному знанию особенностей изучаемых феноменов.
Использованная литература:
1 Беляев, Ю. К. Статистические методы обработки результатов испытаний на надежность [Текст] / Ю. К. Беляев. - М.: Знание, 1982.
2 Гренандер, У. Лекции по теории образов [Текст]. В 3 т. Т.1. Синтез образов / У. Гренандер. - М.: Мир, 1979. - 382 с.
3 Гренандер, У. Лекции по теории образов [Текст]. В 3 т. Т.2. Анализ образов / У. Гренандер. - М.: Мир, 1981. - 448 с.