Научная статья на тему 'Распознавание объектов как классификация отображений'

Распознавание объектов как классификация отображений Текст научной статьи по специальности «Математика»

CC BY
282
71
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Мазуров Вл Д.

В задаче распознавания образов общепринятой моделью объекта или ситуации (подлежащим классификации или диагностике) является набор или вектор характеризующих его признаков. В данной статье предлагается качественно новый подход к интерпретации объектов как некоторых отображений, анализируется применимость прежних методов дискриминантного анализа и предлагаются возможности новых подходов к проблеме распознавания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IDENTIFICATION OF OBJECTS AS CLASSIFICATION OF MAPPING

The vector of characteristic attributes or the set is a universally recognized model of an object or situation (liable to classification or diagnostics). A qualitatively new approach is applied to interpret objects as some mapping, adaptability of the former approaches of discriminant analysis is examined and a scope of new approaches to the problem of identification is offered in the given article.

Текст научной работы на тему «Распознавание объектов как классификация отображений»

УРАЛЬСКАЯ МЕТАЛЛУРГИЯ В УСЛОВИЯХ РЫНОЧНЫХ РЕФОРМ И ДЕНАЦИОНАЛИЗАЦИИ В ПОСЛЕДНЕЕ ДЕСЯТИЛЕТИЕ XX ВЕКА

ЗапарийВ.В.

В металлургии ФПГ осуществляют производственную деятельность от выплавки металла, последующей металлообработки до конечной продукции машиностроения, вплоть до товаров народного потребления и т.д. В итоге к началу нового века только в угольнометаллургическом секторе промышленности действовали ФПГ, в состав которых вошли 127 предприятий и организаций, общей численностью 840 тыс. чел. [10, с. 46] Затем начался процесс создания холдингов. Были созданы: Уральская горно-металлургическая компания (УГМК), МЕЧЕЛ, СУАЛ и др.

В черной и цветной металлургии Урала интеграционные процессы активизировались во второй половине 90-х гг., что привело к тому, что в конце XX в. они были

практически завершены. Особую роль в регионе среди металлургических холдингов играет Уральская горно-металлургическая компания (УГМК). Этот холдинг контролировал выпуск около 40% российской катодной меди, пятую часть отечественного производства металлопродукции из сплавов цветных металлов и более половины европейского рынка медных порошков.

Холдингам становится тесно в пределах одной отрасли или же одного регионального хозяйственного комплекса. Постепенно они распространяют свое влияние на соседние территории, интегрируются со смежными производствами, в первую очередь, с машиностроением — основным потребителем продукции металлургии.

ЛИТЕРАТУРА

1. Запарий В.В. История черной металлургии Урала. 90-е годы XX века. М., 2003.

2. Ильина О. Какой будет российская металлургия в 2015 году // Уральский рынок металлов. 2007. №7 - 8.

3. Информация руководителю. М., 2000. №4 (705).

4. Металлоснабжение и сбыт. № 1. 2000.

5. Митин С.Г. О стратегии развития металлургической промышленности России до 2010 года // 300 лет уральской металлургии: Труды Международного конгресса. 4-5 октября 2001 года. Екатеринбург, 2001.

6. Путин В.В. О мерах по реструктуризации российской промышленности. М., 2000. (Электронная версия).

7. Смирнов Л.А. Современное состояние и перспективы развития черной металлургии Уральского региона // 300 лет уральской металлургии: Труды Международного конгресса. 4-5 октября 2001 года.

8. Смирнов Л.А., Ровнушкин В.А. Перспективные металлургические процессы для реконструкции металлургических предприятий // Новые проекты и технологии в металлургии: Сб. трудов конференции. Екатеринбург, 2005.

9. Стратегия развития металлургической промышленности России до 2005 года: Документ Министерства экономики РФ. М., 1999. (Электронная версия).

10. Сухорученков А. Иллюзорная стабильность // Металлы Евразии. 2000. №3.

11. Шевелев Л. Инвестиции без поддержки: Модернизация металлургии и роль государства // Металлы Евразии. 2001. № 5.

12. Экономический вестник ММК. 1999. Апрель. № 9.

ОБРАЗОВАНИЕ

РАСПОЗНАВАНИЕ ОБЪЕКТОВ КАК КЛАССИФИКАЦИЯ ОТОБРАЖЕНИЙ

Мазуров Вл. Д.

В задаче распознавания образов общепринятой моделью объекта или ситуации (подлежащим классификации или диагностике) является набор или вектор характеризующих его признаков. В данной статье предлагается качественно новый подход к интерпретации объектов как некоторых отображений, анализируется применимость прежних методов дискриминантного анализа и предлагаются возможности новых подходов к проблеме распознавания.

IDENTIFICATION OF OBJECTS AS CLASSIFICATION OF MAPPING

V.D. Mazurov

The vector of characteristic attributes or the set is a universally recognized model of an object or situation (liable to classification or diagnostics). A qualitatively new approach is applied to interpret objects as some mapping, adaptability of the former approaches of discriminant analysis is examined and a scope of new approaches to the problem of identification is offered in the given article.

В задачах распознавания, близких к схеме дискриминантного анализа, необходимо (для получения адекватных решений) рассматривать все ее составляющие элементы как принадлежащие к некоторым структурам или пространствам. А именно: нужно рассматривать:

- пространство признаков (самих по себе, а не их значений);

- пространство значений признаков;

- пространство объектов;

- пространство разделяющих правил.

И тогда логичнее всего представлять

объекты как отображения из пространства в пространство.

Итак, будем рассматривать пространство S признаков самих по себе, пространство V значений признаков, пространство VAL ценностей признаков (их информативностей). При этом объекты распознавания нужно рассматривать как отображения fi S V.

Поэтому в распознавании образов надо рассматривать задачи разделения множеств отображений с помощью разделяющих функций от этих отображений.

Пусть f: S V,f - элемент множества F отображений, А и В - некоторые подмножества множества F. А и В - это разделяемые классы объектов. Мы должны найти функцию <р из класса функций Ф - так, чтобы срф > 0 (для/из А), срф < 0 (для/из множества В). Это задача дискриминантного анализа ДА (А, В, F).

Поставим такой вопрос: существует ли универсальный персептрон

S V(S) спрямляющее пространство X -> ÂA(A, В, LIN),

где LIN - класс линейных функций, персептрон, способный разделять непересека-ющиеся множества объектов.

Ответ - положительный (см. теорему [1] о комитетах).

Мазуров Вл. Д.

Итак, мы имеем множество (с той или иной структурой) 5 признаков, и классы А", В~ объектов проявляют себя как совокупности А*, В* операторов из пространства5 в поле К вещественных чисел. Предположим, что имеются конечные подмножества А и В классов А* и В* соответственно: А = { //. ■■■>/’/ В = {¿+/, Сформулируем

задачу дискриминантного анализа; в данном случае это может быть сделано в следующем виде: найти 5 из для которого //(з) > 0 (г =1 ,...,1), ^’(я) < 0 (г = 1+1,...,т).

Положим/^ =/’ф (г = /-Д/(^ =-£’0) (I = 1+1, ..., т).

Тогда задача дискриминантного анализа сводится к решению системы

ф) > 0 0 = 1,...,т), в £ X (1)

Пусть - решение задачи (1). Для классификации неизвестного объекта / вычисляем значение /($'). Полагаем, что / принадлежит А*, если /(Я') > О, /принадлежит В *, если/('5~/) < 0. Если/^ = 0, то суждение об объекте / не высказывается либо произвольно.

Однако система (1) может быть не совместной. В этом случае используем определение комитета [1]:

Комитетом системы (1) называется такой набор С = [з(1), ..., я(ф] элементов из5, что для всякого_/ из множества {1, ..., д}\ неравенство /^(г)) > 0 выполняется более чем для половины элементов 8(г). Условия существования комитета даны в [1].

Использование комитетов снимает вопрос о построении спрямляющего пространства. Однако надо иметь в виду и путь, при котором мы сначала сводим задачу к совместной. Тогда для полноты картины надо уметь применять известные из выпуклого анализа результаты об отделимости к задаче разделения объектов как отображений.

ПЕРВАЯ ТЕОРЕМА ОБ ОТДЕЛИМОСТИ:

Предположим, что А и В - выпуклые подмножества пространства объектов F сг (Б —>■ V}, которое предполагается от-

делимым локально выпуклым линейным топологическим пространством. Пусть внутренность int А непуста. Тогда множества^ и В разделимы ненулевым линейным непрерывным функционалом j тогда и только тогда, когда пересечение множества В с множеством int А пусто: <рф не больше qfg) для всех/из А, g из В.

ВТОРАЯ ТЕОРЕМА ОБ ОТДЕЛИМОСТИ:

Пусть А - замкнутое выпуклое подмножество пространства F er (S V}, и f не принадлежит множеству^. Тогда существует функционал <р из сопряженного пространства F*, сильно разделяющий А и/, то есть существует е > 0 : <рф не больше, чем qff') -Е для всех/из А.

Данный подход к распознаванию объектов легко проиллюстрировать геометрически. В самом деле, пусть множество F отображений/? S R таково, что для любого/ е F множество точек {s е S : f(s) = 0} есть некоторая поверхность в S. Назовем fs £ S : f(s) > 0} положительным полупространством для/ а {s £ S : f(s) < 0}- соответственно, отрицательным полупространством. Тогда поиск решения системы (1) может быть интерпретирован как поиск некоторой фиксированной для классов А и В точки у пространства S, которая лежит в положительном полупространстве для/ (i = 1, ..., т). В случае несовместности системы ищется набор таких точек, удовлетворяющих определению комитета.

В вышеописанном методе неподвижной точки логично встает вопрос об однозначности соответствия поверхностей отображениям. Ведь, взяв произвольное к ф О и рассмотрев отображения вида kf, можно увидеть, что всем им соответствует одна и та же поверхность. Возможно ли, что при разных к эти объекты будут принадлежать к разным классам?

Рассмотрим элементы kf и к f.

\.к1кк2 разных знаков (например, к > О , к2 < 0). Тогда, если kf еА, то обязательно

выполняется к/ е В, так как иначе мы придем в противоречие с теоремой [1] о существовании линейного комитета. Аналогично рассматривается случай к/ £ В.

2. к1 и родного знака. Тогда, если к/ £ А, то аналогично обосновывается, что и к/ £ А.

Введем теперь на элементах пространства 5 отношение эквивалентности:

Уз1,я2£3 З1~я<=>^=ф2(к*0).(2) Очевидно, что элементы одного класса эквивалентности определяют одну и ту же поверхность и, кроме того, зная принадлежность одного из элементов класса множеству^ или В, можно высказывать суждения о всех остальных элементах класса.

Поэтому мы имеем полное право перейти от классификации отображений к классификации соответствующих поверхностей {* £ Я : Щэ) = 0}, (3)

считая, что к ф 0 - некоторый фиксированный множитель.

Однако следует учитывать, что поиск неподвижной точки для поверхностей {и £ Б : ^.(я) = 0} не всегда приводит нас к решению системы (1). Это справедливо только в случае к > 0. Кроме того, часто бывает удобно сформулировать некоторое дополнительное условие на выбор нормирующего множителя к, которое может существенно облегчить последующие вычисления характеристик поверхности.

Главным достоинством геометрической интерпретации исходной задачи распознавания объектов как отображений является возможность пользоваться методами аналитической и (при некоторых условиях на множество К) дифференциальной геометрии.

Кроме того, можно отрешиться от метода неподвижной точки и решать задачу дискриминантного анализа непосредственно на множестве поверхностей (3). Замена разнообразных и порой своеобразных признаков исходных объектов на стандартные и понятные аналитические и дифференциальные характеристики может существенно облегчить вычисления. Часто при этом воз-

можно понижение размерности пространства признаков [2].

В качестве примера, иллюстрирующего все вышесказанное, рассмотрим процесс обработки и анализа изображений.

Системой признаков S будем считать бесконечную сетку. Тогда каждая ячейка-при-знак существует не только сама по себе, но и жестко фиксирована в сетке, т.е. можно говорить об отношениях типа «выше-ниже», «правее-левее», «ближе-далыпе». Таким образом, система признаков S становится топологическим пространством.

Зафиксируем теперь произвольную ячейку в качестве нулевой, а всем остальным поставим в соответствие целочисленный двумерный индекс (i, j), где i и j увеличиваются по мере удаления ячейки от нулевой вправо и вверх и уменьшаются, становясь отрицательными, по мере удаления влево и вниз.

При такой индексации пространству S можно поставить в соответствие пространство Z2 (где Z - пространство целых чисел), а в качестве признака рассматривать точку (i,j) этого пространства. Заметим также, что при стремлении к нулю размеров ячейки мы получим в пределе соответствие пространству R2.

Пусть теперь изображение задано с помощью некоторой функции интенсивности /: S

V, где в качестве S можно рассматривать R2, а пространство Vможет совпадать с R. Т.е. значением признака (х, у) е R2 будет f(x, у).

Если изображение ограничено, то функция / будет иметь вид / : G V, где G a R2. Проверку на принадлежность рассматриваемого признака множеству G можно реализовать с помощью пространства VAL информативностей признаков. Рассмотрим для этого функцию Info(x,y). Ее значением на множестве G является ненулевая информативность признаков из этого множества (которая определяется из некоторых априорных соображений), а на всем остальном пространстве R2 эта функция тождественно равна нулю. В дальнейшем

Мазуров Вл. Д.

анализе будем ограничиваться признаками с ненулевым значением функции/я/о.

Рассмотрим теперь задачу ДА(А, В, Г), где А = {Рр ..., Р}, В = {Р1+1, ..., Р^ - некоторые изображения, заданные с помощью функций интенсивностир(х, у), рт(х, у) е (И2 —>■ Щ. Применяя к ним вышеописанный метод неподвижной точки, получим систему неравенств :

р,(х,у)>0 (¡= 1....I)

р,(х,у)<0 (¡ = 1+1,...,т), (4)

ИЛИ, положив

^=р1(г = 1 -,*),£ = -Р1(г = *+1 -,т), £(х, у)>0 (1=1,...,т). (5)

Сложность решения данной системы напрямую зависит от вида функций р.. Кроме того, следует учитывать, что функции интенсивности на практике, как правило, неотрицательны. Поэтому системы (4) - (5), скорее всего, несовместны.

Рассмотрим теперь геометрическую интерпретацию изображений.

Однако при попытке рассмотреть поверхности типа { (х, у) : /.(.х, у) = 0 } мы вновь сталкиваемся с характерной проблемой. А именно, из-за неотрицательности функций р. рассмотрение подобных задач лишено практического смысла.

С этой точки зрения более показательными будут трехмерные поверхности типа { (X, У, £(х, у)) : 1п/о(х, у) ФО } или, в общем случае,

{ /'7л\ у, г) = 0 : 1п/о(х, у) Ф 0 }, ( 6 )

где, например, в нашем случае Р.(х, у г) = г -/¡(х, у). Вектор состояния для таких поверхностей будет состоять из аналитических или дифференциальных характеристик функций Р..

Рассмотрим один простой способ аналитического получения вектора состояния для поверхности вида (6).

Пусть каждая Т7. задана (или аппроксимирована) некоторой полиномиальной функцией вида

_Р(Зс, у г) = аю + аи х + аа у + + а^ху + ...

+ ак_2х0 + ак'1У0 + акх0',

гдеD = тах{deg(F) : i = 1,

Рассмотрим вектор г. = (a.ff a.J. В качестве нормирующего множителя для поверхности (6) можно рассматривать, например, k. = 1 / 11 г. 11 , если речь идет о методе неподвижной точки, или

( 1 / 11 Гг 11 , если младший ненулевой коэффи-к= ) циент у /■ положителен

7 / 11 7"г 11 , иначе.

для методов, допускающих отрицательное значение к., которые мы и будем рассматривать в дальнейшем.

Пусть теперь F. уже нормированы с помощью к., то есть | г. | = 1 для пересчитанных коэффициентов а... Рассмотрим вектор R (а аа) - вектор состояния для F..

Поскольку аю однозначно восстанавливается по формуле

а = Vl - II R ||2 ,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10 N¡11’

можно считать, что любой поверхности пространства R3, задаваемой полиномом D-й степени, ставится в соответствие точка единичного шара (без “нижней” полусферы) пространства RK.

Однако в некоторых частных случаях размерность пространства состояний можно уменьшить. Приведем пример.

Пусть

F(x, у, -) = (х, у, z) А (х, у, z)T + 2 b (х, у, z)T + с (7) квадрика в R3, где А £ R3x3 - симметрическая, Ь £ R3, с £ R. Для такого задания К =

12. Однако если квадрика приведена к каноническому виду F(x, у z) = а 'х2 + а22 'у2 + a ’z2 h 'х h ’у + b3’z + с величина К становится равной шести, причем для центральной квадрики ненулевыми будут только первые три координаты. Вектор состояния нецентральной квадрики будет также вполовину разрежен, но нули у него будут расположены иначе. Следовательно, не исключена возможность дальнейшего уменьшения размерности пространства состояний.

Для этого построим систему инвариантов квадрики (7) относительно класса аффинных преобразований. Рассмотрим характеристический многочлен матрицы А :

(р(А) = det(A - АЕ) = 50 - + д2Х2 - Xs

а также определитель

Г A bl

А= det / /.

lb с J

В работе [3] доказывается, что величины Sff 5, S2, А составляют полную систему независимых инвариантов квадрики при произвольных аффинных преобразованиях. То есть вектор признаков, полученный с помощью этой системы, будет однозначно характеризовать квадрику вне зависимости от ее расположения и ориентации в пространстве. Кроме того, размерность пространства состояний уменьшилась в три раза (К = 4).

Заканчивая разговор о квадриках, упомянем тот факт, что размерности К = 12, 6, 4 для трехмерных квадрик получаются из выражений п(п+1), 2п, п+1 при п = 3.

И, наконец, упомянем еще несколько методов дискриминантного анализа, которые вполне успешно могут применяться для разделения отображений.

Пусть дана задача ДА(А, В, F), где А, В с В?

- прецедентные множества, заданные с помощью векторов состояния. Предполагается, что А п В = 0.

Решение системы неравенств. Множество F предполагается аффинным или линейным и ищется функция <р(х) = (с, х) + d (или<р(х) = (с, х)) такая, что >0, а е А,

$Ъ) <0, b £ В

Методы решения систем аффинных (или линейных) неравенств достаточно широко изучены и не относятся к теме данной работы.

Метод ближайшего соседа (один из вариантов).

Определим функцию близости ТОЧКИ р£ R к конечному множеству Q С К1-.

К(р, Q) = min{ II p-q || : q eg}, а в качестве разделяющей функции j будем рассматривать выражение <р(р) = С1 К(р, В) - С2 К(р, А), где С , С2 - положительные параметры.

Смысл этого метода состоит в том, что элемент р поочередно сравнивается со всеми элементами прецедентных множеств, среди которых выбирается ему наиболее близкий. С помощью констант С] и С2, а также вида используемой в задании функции близости нормы можно менять форму разделяющей поверхности.

Кроме того, очевиден факт, что если А п В Ф 0 то для любого элемента р из пересечения <р(р) = 0. Т.е. данный метод достаточно корректно работает с противоречивыми условиями, проецируя пересечение прецедентных множеств на разделяющую поверхность, которая, как правило, обрабатывается отдельно.

Метод потенциалов.

На пространстве векторов состояния К" задается функция, которая называется потенциалом. Потенциал определяет близость двух точек х, х0 и обычно задается как функция расстояния между точками. Потенциальная функция, как правило, такова, что она монотонно убывает с увеличением расстояния. Примерами потенциальных функций могут служить

К(х, хг) = (1 + г2 а)1; К(х, хг) = 0~аг ,

где г - расстояние между точками х0 и х; а - константа.

С помощью таких функций на пространстве К" формируется потенциальное поле. Считается, что вектор х относится к классу А, если потенциал поля в точке х положителен. В противном случае вектор х относится к классу В.

Геометрическая интерпретация метода построения потенциального поля очень проста. При появлении первого элемента х] из объединения прецедентных множеств «выпускается» потенциал с центром в х . Знак потенциала определяется тем, к какому классу относится предъявленный пример: если к А, то знак у потенциала положительный, иначе - отрицательный. Теперь на К" задан некоторый потенциал. Для следующего элемента х2 может быть вычисле-

Мазуров Вл. Д.

Пь11г - (л, Ь)

ИлП’-(а,1

11*11’ -2(а,ь) + 11ь111 /и/11 - 2 ( а, I

Ч1Ы12

на величина потенциала К(х2, х^. Если она положительная, и вектор х2 относится к классу А, то потенциальное поле не меняется; если же х2 должен быть отнесен к классу В, то из точки х2 «выпускается» новый потенциал, но с отрицательным знаком. Теперь на К" действует новый суммарный потенциал Ф(х) = К(х, х]) - С2 К(х, х2), где С2 некоторый положительный коэффициент.

Аналогично, если при классификации любого элемента обучающей последовательности с помощью суммарного потенциала совершается ошибка, потенциал меняется так, чтобы по возможности выправить ошибку.

В работе [4] упоминается, что из предположения о гладкости потенциалов точек может быть выведена конечность их количества для построения суммарного потенциала и сходимость алгоритма, выполняющего это построение.

Таким образом, результатом обучения в методе потенциальных функций является построение на К" потенциального поля

• у(-\Та>

О(х) = у у С К(х, х^

i

(суммирование здесь ведется не по всем элементам прецедентных множеств, а лишь по тем, на которых совершалась ошибка). Построенная функция Ф(х) и берется в качестве разделяющей.

Метод проекций.

Построим функцию /: К1 Л - проекцию пространства состояний на числовую ось, удовлетворяющую условию:

а еА Ь е В Да) Ф/(Ь).

Рассмотрим множество .4 хВ = {(а,Ь): а е А, Ь £ В }. Для каждой такой пары (а,Ь) построим прямую Ь, задаваемую параметрическим уравнением и = 0, где I - направляющий вектор, и такую, что рг£а = ргр. Очевидно, что такая прямая единственная для каждой пары, и, следовательно, общее количество построенных прямых не превышает /А х В /= /А / / В /. Вектор I вычисляется по формуле (см. [2]):

Множество всех таких прямых для А х В обозначим через М Возьмем теперь произвольную прямую Ь : х = Ы, такую, что Ь е М, и рассмотрим проекцию произвольной точки у на Ь \

РГ,У = (у,1)1.

Таким образом, проектируя множество С=А и В на прямую Ь, каждой точке с £ С можно поставить в соответствие уникальный для нее числовой параметр / .' / / = рг с =( с , I) I. Следовательно, искомая функция/ может имеет вид:

Дх)=(х, I).

Вопрос о разделениии точек на числовой прямой не представляет никакой сложности, так как может быть сведен, например, к вопросу о принадлежности диагностируемой точки к тому или иному интервалу, либо к построению разделяющего полинома одной переменной, степень которого заведомо не превышает /А /+ / В / - 1.

Стоит также отметить гибкость метода по отношению к динамическому росту мощности прецедентных множеств. Если построенная прямая перестает нас удовлетворять, добавим ее к множеству Ми выбираем другую Ь г М. Выбор такой прямой в отсутствие прочих условий может быть проведен за линейное время (т.е. 0(1 МI) ).

И в заключение еще раз остановимся на основных положениях данной работы.

Во-первых, рассмотрение объектов как отображений пространства признаков самих по себе в пространство значений признаков предоставляет нам широкий спектр математических методов их анализа. Во-вторых, к методам дискриминантного анализа добавляется еще один - метод неподвижной точки, который можно трактовать как поиск признака (или системы признаков), которые являются наиболее информативными при делении объектов на классы. В-третьих, появляется возмож-

ность разбиения объектов на классы эквивалентности, что позволяет существенно упростить процесс диагностики. И наконец, построение нового пространства признаков, которое по своим характеристи-

кам (например, размерности) может быть существенно лучше исходного.

Все это позволяет нам считать данный подход к распознаванию объектов корректным и перспективным.

ЛИТЕРАТУРА

1. Вл. Д. Мазуров Вл.Д. Метод комитетов в задачах оптимизации и классификации. М.: «Наука», 1990.

2. Розенфельд Б.А. Многомерные пространства. М.: «Наука», 1966 г.

3. Файн B.C. Опознавание изображений. М.: «Наука», 1970 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.