НАРУШЕНИЕ ИДЕМПОТЕНТНОСТИ ОРТОГОНАЛЬНОГО ПРОЕКТИРУЮЩЕГО ОПЕРАТОРА В ЗАДАЧАХ РАСПОЗНАВАНИЯ ОБРАЗОВ В РАМКАХ КОНФЛЮЕНТНОЙ СИТУАЦИИ
А.Б. Исаев, В.Ф. Аль-Харази
Кафедра кибернетики и мехатроники Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198
В статье в рамках общей проблемы построения разделяющей плоскости для двух классов образов, отягощенных случайными погрешностями измерений своих признаков (конфлюентная ситуация), получен результат, указывающий на причинно-следственную связь между выбыванием оценок метода наименьших квадратов (МНК) из класса линейных и несмещенных оценок и выбыванием ортогонального и проектирующего оператора, с помощью которого получаются оценки МНК из класса идемпотентных линейных операторов.
Ключевые слова: идемпотентность, конфлюентная ситуация.
Известно, что процедура классификации образов может производиться в условиях, когда результаты измерений координат всех признаков предъявляемых образов отягощены случайными погрешностями (конфлюентная ситуация) и игнорирование погрешностей признаков приводит к грубым ошибкам идентификации объектов при использовании традиционного алгоритма метода наименьших квадратов (МНК) с целью построения разделяющей линии регрессии [1; 2; 3].
Известно также, что оценки МНК для параметров линии регрессии становятся смещенными и неэффективными [2; 3], что и является источником ошибок в задачах идентификации объектов с помощью линейных разделяющих функций.
На наш взгляд, существует глубокая причинно-следственная связь между выбыванием оценок МНК из класса линейных несмещенных оценок и выбыванием ортогонального и проектирующего оператора Р0 (с помощью которого и осуществляется получение оценок МНК) из класса идемпотентных и линейных операторов.
Получение оценок МНК эквивалентно проведению операции проектирования вектора наблюдений YT = [у1, у2,yN] координат признака Y, предъявляемых образов (У е En в общем случае) на подпространство Rm (ш < и), линейное и вещественное, к которому принадлежат результаты измерений признака X распознаваемых образов {х/, у{}, I = 1, Nj ~ число образов, у = 1, ш ~ число классов
образов, Еи ~ евклидово пространство, Rш [х] = 0 ~ пространство проекций оператора Р0, т.е. это пространство координат признака X.
В евклидовом пространстве Еи (наше пространство измерений) эта проекция У = Р0У е R[х] единственная в R[х], а процедура проектирования осуществляется
на пространство векторов признака X, не содержащих погрешности измерений, поэтому сам оператор Р0 является величиной детерминированной и не содержит
случайных погрешностей измерений признака X. Для заданных У и У этот оператор поэтому единственен и представляет собой матрицу
р = х (хтх )-1 Хт (1)
— симметричную (Рт = Р) и идемпотентную (Р2 = Р), как можно убедиться.
Известное утверждение о том, что оценки МНК относятся к классу линейных несмещенных оценок (в частности, оценки МНК для параметров разделяющей линии регрессии) справедливо, пока матрица X (содержащая независимые переменные {х/'} — координаты измерения признака X) — точная, т.е. признак X измеряется без погрешностей.
Если же координаты признака X измеряются с погрешностями, то следует каждому г-тому наблюдению координаты х- (г = 1, N у , у = 1, ш) приписать случайную погрешность 5у так, что в конфлюентной ситуации будет наблюдаться матрица Xд = н + Д, где 5 = [^. ] — точная (истинная) матрица, А = 5гу — матрица погрешностей.
В этой ситуации оценка МНК для вектора параметров линии регрессии (разделяющей линии) теперь будет а (А) = (хт^х^) хДУ вместо традиционной, несмещенной а = (нт5) 5тУ.
В [4] получено приближенное выражение для а (А) — вектора оценок МНК в конфлюентной ситуации:
а (А) = а + (х^ )^ Дте - (хTхд )-1 XтДа, (2)
где все символы введены выше, кроме вектора остатков е = У - ха.
Применяя операцию взятия математического ожидания к обеим частям (2), получаем:
М [а(Д) - а] = М {вА1Дте - В^хтДБ-1 хтУ} * 0
и обращающееся в нуль, например, при А = 0.
Покажем, что в конфлюентной ситуации оператор проектирования РД выбывает из класса симметричных и идемпотентных операторов, т.е. РД *РД и Рд * РД. Действительно:
Рд = (5 + Д)Г(Н + Д)т (н + д)-1 (Н + Д)т,
(T \ ( T T \ T _1
5 51 = B, C = (Д 5 + 5 Д) и, используя разложение XAXA = B _ _B lCB l + B lCB lCB_1, получим:
PA = P + 5B-1AT _5B-1ATP _PAB-l5T. (3)
Из (3) очевидно, что, во-первых, матрица PA (оператор) более не симметрична (т.е. PA Ф PA если A Ф 0) и, во-вторых, PAPA Ф PA (т.е. PA ф Pa ) ~ оператор PA в конфлюентной ситуации не является идемпотентным. Последнее справедливо в силу приближенности разложения (3) и присутствия в нем множителей Дт и Д, отличных от нуля.
Из (3) видно, что симметричность P и его идемпотентность восстанавливаются при Д = 0.
Изложенные выкладки по существу доказывают следующую теорему. Теорема
В конфлюентной ситуации оператор проектирования PA, построенный аналогично оператору P в схеме классического метода наименьших квадратов, выбывает из класса симметричных и идемпотентных операторов.
Из этой теоремы следует, что при использовании алгоритмов, базирующихся прямо или косвенно на классическом МНК в конфлюентной ситуации, нереально существование решения, описывающего единственную оптимальную прямую (разделяющую линию регрессии в нашей задаче). Наличие случайных погрешностей измерений у независимых переменных (в результатах измерений координат признака X) означает нарушение одного из основных постулатов применимости классического МНК и приводит к потере оценками МНК для параметров разделяющей линии регрессии ряда оптимальных статических свойств — несмещенности, эффективности и состоятельности.
Для построения разделяющих поверхностей (в частности, линейных) требуется применять многочисленные алгоритмы конфлюентного анализа [1].
ЛИТЕРАТУРА
[1] Грешилов А.А., Стакун В.А., Стакун А.А. Статические методы принятия решений с элементами конфлюентного анализа. — М.: Радио и связь, 1998.
[2] Исаев А.Б. О применимости метода максимального правдоподобия в конфлюентном анализе // Метрология. — 1984. — № 12. — С. 16—26.
[3] Исаев А.Б. Основные принципы конфлюентного анализа и некоторые алгоритмы обработки линейных зависимостей // Измерительная техника. — 1982. — № 10. — С. 13—16.
[4] Hodges S.D., Moore P.G. «Date Uncertaintes and L.S. Regression» // Applied Statistics. — 1972. — V. 21. — No 2. — P. 185—195.
INFRINGEMENT IDEMPOTENTSES OF THE ORTHOGONAL PROJECTING OPERATOR IN PROBLEMS OF RECOGNITION OF IMAGES WITHIN THE LIMITS OF KONFLUENT SITUATIONS
A.B. Isaev, V.F. Al-Harasi
Cybernetics and Mechatronics Department Peoples’ Friendship University of Russia
Miklukho-Maklaya str., 6, Moscow, Russia, 117198
In the Article, within the limits of a shared problem of construction of a dividing plane for two classes of the images burdened by casual errors of measurements of the signs (the cofluent situation), the result specifying in a relationship of cause and effect between outing of estimations of a method of the least squares (m.n.k. is received.) from a class of the linear and not displaced estimations and outing the orthogonal and projecting operator with which help estimations m.n.k. turn out. From a class of idempotent linear operators.
Key words: idempotentses, cofluent situation.