Научная статья на тему 'Исследование топологических свойств квадратичной формы в задачах распознавания образов'

Исследование топологических свойств квадратичной формы в задачах распознавания образов Текст научной статьи по специальности «Математика»

CC BY
80
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОНФЛЮЭНТНАЯ СИТУАЦИЯ / СУММАРНЫЕ СЛУЧАЙНЫЕ ПОГРЕШНОСТИ ИЗМЕРЕНИЙ / РАЗДЕЛЯЮЩАЯ ЛИНИЯ / СТРОГО ВЫПУКЛАЯ И КВАЗИВЫПУКЛАЯ КВАДРАТИЧНАЯ ФОРМА / ФУНКЦИЯ МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ / ВЫПУКЛАЯ ОБОЛОЧКА / ВОГНУТОСТЬ. ВЫПУКЛОСТЬ. ИСТИННЫЕ И ИЗМЕРЕННЫЕ ЗНАЧЕНИЯ ВЕЛИЧИН ПРИЗНАКОВ ОБРАЗОВ / НЕРАВЕНСТВА ОГРАНИЧЕНИЯ / CONFLUENT SITUATION / OVERALL RANDOM MEASURING ERRORS / SEPARATING LINE / STRICTLY CONVEX AND QUASI-CONVEX QUADRATIC FORM / MAXIMUM LIKELIHOOD FUNCTION / CONVEX SHELL / CONCAVITY / CONVEXITY / TRUE AND MEASURED VALUES OF ATTRIBUTES OF IMAGES / INEQUALITIES-CONSTRAINTS

Аннотация научной статьи по математике, автор научной работы — Алнадфа А., Исаев А.Б.

С учетом суммарных случайных погрешностей измерений координат признаков двух классов образов, заданных своими непересекающимися выпуклыми оболочками, построена функция максимального правдоподобия выборки из координат признаков двух классов образов, погрешности измерений которых распределены по нормальному закону. Показано, что квадратичная форма, соответствующая функции правдоподобия задачи, в рассматриваемой конфлюэнтной ситуации является квазивыпуклой, с помощью исследования ее гессиана получены неравенства, ограничивающие ее область строгой выпуклости, содержащей единственную точку глобального минимума задачи, находимую с помощью специальной итерационной процедуры с начальным приближением из конечной ограниченной области строгой выпуклости. Из данной квадратичной формы получена система квазинормальных взвешенных нелинейных уравнений, приведен способ ее решения, сходящийся к точке глобального минимума. Получено кубическое уравнение относительно параметра (углового коэффициента) разделяющей линии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Алнадфа А., Исаев А.Б.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TOPOLOGICAL PROPERTIES OF QUADRATIC FORM IN IMAGE IDENTIFICATION PROBLEMS

Considering overall imprecision of measuring coordinates of attributes for two classes of images preset as disjoint shells, the function of the highest likelihood has been plotted for sampling of the coordinates of attributes for images of two classes with the normal law distribution of the measurement errors. It is shown that the quadratic form consistent with the likelihood function of the problem is quasi-convex in the considered confluent situation. Based on the analysis of the Hessian of the function, the inequalities are derived, that limit the function's strict convexity domain containing the single point of the absolute minimum of the problem, which is found using a special iterative procedure with the initial approximation from a finite limited domain of strict convexity. Using this quadratic form, a system of quasi-normal weighted nonlinear equations is obtained, and the system solution converging to the absolute minimum point is given. A cubic equation is derived relative to a parameter (slope ratio) of the separating line.

Текст научной работы на тему «Исследование топологических свойств квадратичной формы в задачах распознавания образов»

УДК 004.93

А.Б. Исаев, А. Алнадфа

ИССЛЕДОВАНИЕ ТОПОЛОГИЧЕСКИХ СВОЙСТВ КВАДРАТИЧНОЙ ФОРМЫ В ЗАДАЧАХ РАСПОЗНАВАНИЯ ОБРАЗОВ

С учетом суммарных случайных погрешностей измерений координат признаков двух классов образов, заданных своими непересекающимися выпуклыми оболочками, построена функция максимального правдоподобия выборки из координат признаков двух классов образов, погрешности измерений которых распределены по нормальному закону. Показано, что квадратичная форма, соответствующая функции правдоподобия задачи, в рассматриваемой конфлюэнтной ситуации является квазивыпуклой, с помощью исследования ее гессиана получены неравенства, ограничивающие ее область строгой выпуклости, содержащей единственную точку глобального минимума задачи, находимую с помощью специальной итерационной процедуры с начальным приближением из конечной ограниченной области строгой выпуклости. Из данной квадратичной формы получена система квазинормальных взвешенных нелинейных уравнений, приведен способ ее решения, сходящийся к точке глобального минимума. Получено кубическое уравнение относительно параметра (углового коэффициента) разделяющей линии.

Ключевые слова: конфлюэнтная ситуация, суммарные случайные погрешности измерений, разделяющая линия, строго выпуклая и квазивыпуклая квадратичная форма, функция максимального правдоподобия, выпуклая оболочка, вогнутость. выпуклость. истинные и измеренные значения величин признаков образов, неравенства - ограничения.

Хорошо известно, что в теории распознавания образов так называемая задача «сильной отделимости» [1] имеет важное теоретическое и практическое значение. Это задача заключается в разделении двух (или более) выпуклых непересекающихся «многогранников» слоем наибольшей толщины [2].

Под «многогранниками» мы в нашей работе понимаем выпуклые оболочки соответствующих классов образов, задаваемых, в частности, символическими точками на плоскости XOY, обладающих измеримыми координатами.

ISSN 0236-1493. Горный информационно-аналитический бюллетень. 2016. № 8. С. 30-45. © 2016. А.Б. Исаев, А. Алнадфа.

В [3] предложен итерационно-взвешенный алгоритм построения разделяющей линии для двух классов образов, заданных своими непересекающимися выпуклыми оболочками (виде многогранников), а признаки образом отягощены случайными погрешностями, распределенными по нормальному закону. В целях нахождения оптимальных оценок параметров разделяющие линии регрессии сконструирован алгоритм, получаемый из функция максимального правдоподобия, включающий суммарные случайные погрешности измерений координат признаков предъявляемых классов образов. Рассматривается двумерное, некоррелированное нормальное распределение погрешности по осям ОХ и ОГ (плоский случай). В [3] рассматривается конфлюэнтная ситуация — случайные погрешности измерений координат признаков двух классов образов присутствуют как по оси ОХ, так и по оси 0Y. Для первого класса образов справедливо

X + У =П +Е4 (г = %Ы), (1)

для второго класса образов справедливо

X = ^2 + у2 = п2 +81 (г = 1^), (2)

и суммарные случайные погрешности а и в нормальны — а- N(0, а^ ); 8 - N(0, а2щ ) .

В (1) и (2) х, yi — результаты измерений координат признаков, и = Мх,, П; = Му. их истинные значения, М — символ математического ожидания.

В качестве разделяющей линии используется линия регрессии

У = М(у | х) = Ь0 + Щ + а) + 8Ш , (3)

оценки параметров которой — Ь0 и Ь1 демонстрировали свои оптимальные свойства за счет введения погрешностей в функцию максимального правдоподобия (Ф.М.П.) выборки {х;, у;}, из координат измерений признаков образов двух классов.

Напомним, что рассматривалась конфлюэнтная ситуация [4], вследствие чего оценки метода наименьших квадратов (М.Н.К) теряют все свои оптимальные статические свойства [5], поскольку соответствующий им «оператор проектирования» выбывает из класса ортогональных проектирующих операторов [6].

Если при построении несмещенной и состоятельной оценки линейной регрессии М.Н.К. У = М(у | х) = Ь0 + Ь1х + 8 должна минимизироваться взвешенная сумма квадратов отклонений в направлении той оси координат (ось ОТ), которая содер-

г

У' = ^ X г £л

Рис. 1

жит погрешности, то в конфлюэнтной ситуации (погрешности координат признаков образов по осям ОХ и ОУ) логично допустить, что необходимо минимизировать суммы квадратов отклонений результатов измерений координат признаков вдоль двух осей координат.

Этот алгоритм соответствует минимизации некоторой обобщенной квадратичной формы

^ = £ш(хг)(х. -Ь)2 + £ш(уг)(у -п)2, (к< N0, (4)

где га (х) и га (у.) — некоторые весовые функции результатов измерений координат признаков вдоль осей ОХ и ОУ соответственно. На рис. 1 схематически изображена рассматриваемая ситуация, где Н(^) и Н(^2) — непересекающиеся выпуклые оболочкиклассов образов w1 и w2, т.е. Н(^1)^Н(^2) = 0, а линия У = Ь0 + Ь1х + гт (см. (3)) — разделяющая линия (регрессии).

Заметим что в (4) суммирования разумно проводить не по всем точкам выборок из классов w1 и w2, но по тем точкам двух оболочек, которые являются «ближайшими соседями» [7] по отношению друг к другу. На рис. 1 они выделены кружками.

Именно в этом смысле трактуется суммирование по «/'» от 1 до к, где к < N — это число точек из разных классов, ближе всего расположенных друг к другу («ближайшие соседи» [7]), и такие точки можно виртуально относить к некоторой одной выборке

Считая, что погрешности результатов измерений координат признаков независимы нормально распределены, ясно, что мак-

к

к

{х,Уг }к=1>к < N

(5)

симизация функции максимального правдоподобия (Ф.М.П.) выборки (5)

У г - Ьо - ЬЛг

с,,

(6)

по параметрам = Мх, Ь>0, Ь>1 эквивалентна, в большинстве практических случаев, обращению в минимум обобщенной квадратичной формы SJ,, состоящей в показателе степени экспонен-

ты из (6)

к<Ю

г=1

Х1

У г

V Схг J

Уг - Ь0 - Ь£г

уг

тт(ех£г), (7)

но, в принципе, знак SJ, может указывать как на ее выпуклость, так и на ее вогнутость.

В (6) С(а2х{,с2у{, п, Ю) — константа, не зависящая от Ь0, Ь1, и которую в дальнейшем можно опустить в расчетах, при этом можно считать, что | = } ^ > к) — вектор истинных

значений координат признака X. 11

Положив веса (весовые функции) (х) = —р, (у) =

Схг Суг

(напомним, что а2х. и а2у. — это экспериментальные дисперсии признаков ) — легко видеть, что оценки {|г(г = 1,к),Ь0,Ь\) найдется из системы уравнений:

дЧ '—- дЧ дЧ

= 0 (г = \,к),д^ = 0,^ = 0,

дЬ

дЬ

д^г дЬ0

которая в развернутом виде имеет вид

°1гхг + (Уг - Ь0)

(*)

^ =

2

с2 х. уг г

X сх

(*1)

^Уг - Ь0 - ЬЛг = 0

с

£ (Уг - Ь0 - = 0

г=1

с

уг

Мы, таким образом, должны решить задачу построения разделяющей линии (регрессии) У = Ь0 +Ь1X + е5, в рамках конф-люэнтной ситуации, описываемой (1), (2), где X = | + с; У = ц + е;| = МХ, ц = мУ,г3 - невязка, заключающая в себе информацию о наличии невязок а и в. Напомним,

г=1

Рис. 2

что понятие «невязка» — это виртуальный символ приближенного характера искомого уравнения регрессии. А точки над и под линией, это отобранные ранее так называемые «ближайшие соседи» [7] — такие «точки» (или образы) из разных классов образов w1 и w2, наименее удаленные друг от друга

Исследуем выпуклость квадратичной формы Sг Вычислим ее вторые производные по переменным 4, Ь0, Ь1

V

2 ^ + А Ь2 2 Ь1 С V. > 0

д2 ^ д\2 2 N 1 _2 аvi

д2 дЬ12 2 N ь2 а2. VI

1 ,к ),

> 0

> 0

Данные три неравенства является классическим указанием на унимодальный характер функции SJ, и позволяют сделать вывод, что у функции SJ, возможно существует конечная область унимодальности (строгого минимума), внутри которой функция SJ, выпукла (строго) по каждой из переменных 4, Ь0, Ь1.

Таким образом, SJ,, даваемая(7) в точке (4т, Ь0т, Ь1т}Т имеет глобальный минимум [8]. В силу этого, итерационный процесс сконструированы на базе (*), если он сходится, то сходятся в точке глобального минимума поверхности (7). Ниже эта проблема будет подробно исследована.

Заметим, что в рассматриваемой итерационной процедуре, на некотором т-ом шаге, из (*) вычисляем вектор весов (его компоненты) — Е>т(Ь0"-1, Ь¡"-1), причем такого, что

|m (b0m-1, ЬГ1) = arg min (b,, bx).

Подчеркнем, что, например,при выборе начального приближения для b0, bj в виде оценок b0, fy метода наименьших квадратов (М.Н.К.), по-прежнему

bo,bi,c2xi,a2yiuim e M2, а dim^ = dimx(Vi = 1«0 .

Поскольку Xj e OX это результат реального измерения координаты признака, а ^ — это неизвестное нам истинное значение этой координаты, то практически \\xi - ij < lc2xi, где l e [1,5], i e l,k. Данное ограничения выполняется при внимательном отношении экспериментатора к вычислительной процедуре.

Нетрудно видеть, что последние два уравнения в (*) представляют собой систему нормальных уравнений метода наименьших квадратов (М.Н.К.) с двумя неизвестными b0,b1 . Эта система в подавляющем большинстве практических случаев имеет численное решение (ее определитель не равен нулю). Напомним, что x, |, сХ, o2yi, b0, b1 — действительные числа.

После выполнения элементарных преобразований над двумя последними уравнениями из системы (*) мы придем к уравнениям:

¿-yi - bo2- b1ii = S0(Z Cr) + ) = I У- (8)

i=1 C yi i=1 C yi i=1 Cyi i=1 C yi

£ (yi - bo - b1 С = b^I i2-) + ^L) (9)

i=1 Cyi i=1 Cyi i=1 C yi i=1 C yi

Почеркнем, что все коэффициенты системы из уравнений (8) и (9) — действительные числа.

Введем обозначения:

k 1 k | k | k | 2 I —^ = a11;I —2" = a12;I _2~ = a21>I "IT = a'1

i=1 Cyi i=1 C yi i=1 C yi i=1 Cyi

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

22

ЕУ. _ „ . у У&1 _ „ 2 _ 4' ^ 2 _ °2 ,

«=1 ау. ¿_1 ау.

тогда получим систему нормальных уравнений

I аи + а12 _ ^ [а21 + а22 _ С2

для взвешенного М.Н.К., имеющую численные решения при отличном от нуля ее определителе, с хорошо известным из литературы аналитическим решением [8]

(10)

b _ Cia2i C2ai2 b0 _

b _ c2aii cia2i bi ~

Сделаем существенное замечание относительно выбора начального приближения рассмотренного итерационного процесса. Учитывая возможное нарушения характера выпуклости (ее возможного перехода к «вогнутости»), начальное приближение следует разместить там, где все производные

dS '—- dS dS

^> 0 (i _\,k), 0, 0 db0 dbi

Другими словами, надо решить задачу минимизация с ограничениями сверху на величину ординаты SE:

min SE _ 2; ^ > 0 ^ > 0, ^ > 0 .

db0 dbi

и двигаться по этой области «вниз» к экстремуму, в направлении убывания производных. Это должно быть реализовано наилучшим образом в применяемом нами методе покоординатного спуска [8] в качестве «отправной точки» (начального приближения). Нетрудно видеть, что определитель системы (10) равен нулю тогда и только тогда, когда ^ _ _ _ ••• , то есть измерения проводятся только в одной точке (что нереально).

Следовательно, система (10) в реальных ситуациях всегда имеет численное решение (единственное) для V(^i, x¡) ele Ш2, где I — интервал измерений.

Поэтому мы можем доказать сходимость итерационного процесса решений системы (*). На первом шаге, на основании неизвестной нам выборки {xi,yi}N, по формулам (11) рассчитаем оценки b0 , b1 , взвешенного М.Н.К. и подставляем их в формулу (*1) из системы (*).

Возьмем первое приближение для

с

lixi + bicXi (Vi - b0)

^ (1) _ yi i ■ ~1~ xi^^i (12)

c]i + b12cli

На втором шаге найденные ^ ,(1) подставляем в аи, а12, а21, а22 (см. выше) и из (10) находим у(2) уг> , подставляем их в (*1) и рассчитываем ^.<2) . 0 ' 1

aiia22 a2iai2

11 22 21 22

Вычисления и сами аналитические выражения довольно громоздки и мы приведем систему (10) лишь для второго шага

r(2V^ Ч r(2V^ £^ Vi bo (Z~) + b1 = ХнГ

i=l °yi i=1 °yi i=1 Cyi

_ _ _ 2

i=1 °yi i=1 Cyi i=1 °yi

Решая эту систему, находим b02),;(2) , подставляем их в (12) и вычисляем

-ш _ °2yixi_+ ЬГ^ - £(2)) .2 ,

2 (2) (2) ;2) = ^ + ^ - £ ^ , (13)

< + b ]2 <

где ; даетсяиз (12), Ь0, Ь1 — это оценки М.Н.К. (b0 = Ь0(1), Ь1 = Ь{1)), найденные ;(2) подставляем_в_а11,а12,а21,а22,сис2 (см. (10)) и из (10) или (И) находим Ь;3),Ь;3) .

Проводим далее аналогичные вычисления и операции вплоть до остановки процесса при достижении требуемой точности вычислений производных

dS dS dS

—^ < 8s (Ss << 1),~< 8 (8p < 1),~< se (se << 1)

db0 db1

Нам остается доказать, что в этих условиях с ростом числа итераций процесс сойдется к точке единственного глобального минимума квадратичной формы Sr Очевидно что нами в этом процессе реализуется метод покоординатного спуска [8].

На первом шаге мы ищем minSE по переменной осуществляя сечение SE плоскостью = const, находим

min SE (|i Д, b1) = SE1(4i1, b(, b1) при зафиксированных b0, bx оценках метода наименьших квадратов (oXi = 0 Vi). Далее аналогичным образом ищем

minSE(4i1,b(,b1) = SE(^i1,b(1,b11) , далее, аналогичным образом, на следующем шаге находим величину b1 = arg min SE(^,b(, ЬЦ) и цикл, описываемый формулами (8)—(13) завершен. Как видим, выполнены все условия сходимости метода покоординатного спуска: Sz имеет конечную область строгой выпуклости (это (**), показано выше), дважды дифференцируема, а начальное приближение можно выбирать

в окрестности решение М.Н.К., из которого мы осуществляли «спуск» последовательно по координатам i, а затем Ь0, затем Ь1 [8].

Однако вопрос о сходимости итерационного процесса требует тщательного исследования, поскольку топологический вид квадратичной формы SJ, достаточно разнообразен — она может быть строго, слабо и сильно выпукла, псевдо выпукла, не выпукла (вогнута) другие виды.

Образуем матрицу Гессе — О3*3, и рассчитаем аналитические выражения для ее угловых миноров М1, М2 и определителя DetG

Гессиан О3*3 =

д2 ^ д2 ^ д2 ^

д^2 д60 д^г д61

д2 ^ д2 ^ д2 ^

д60 дЬо2 дЬ0 д61

д2 ^ д2 ^ д2 ^

д61 д61 дЬ0 дЬ12

(14)

Опуская громоздкие выражения для вторых и первых производных, получаем

2!"^ + 2Ь12£^г 26^ Уг _

ОГз =

26*1! —2!-^

-2!

У г _ 60 _

уг

уг

2!^

°уг

Здесь и далее везде понимается суммирование от 1, N, поэтому индексы суммирования опущены. Легко видеть, что

Мц = 2! — + 2612! — > 0

уг

М22 = 4!^т* > 0 (Ух,у е

2)

(15)

уг

Исследуем DetG, разлагая его по третьему столбцу, придем к выражению:

БвЮ = 2! % а^ А - 2! Д - det В - 2! Уг _ 6 _ а^ С (16)

Здесь А =

+ 2612261

уг

уг

261! —|г 2!-^

В =

2! 4+2Ь12!4 261!-2-

уг

-2!

Уг _ 60 _ 261^г

уг

°уг

С =

261! 2! -4-

уг

уг

-2!

уг _ 60 _ 261^г

уг

Анализируя выражения для detS, detC и, учитывая их множители в разложении (6), имеем:

!^2" det В >< 0,! уг _ 6о2_ ^^ >< 0 , в зависимости от случайных значений и знаков величин

^ ^ ^ ^ г=1, ^.

Другими словами, DetG в одной области определения может быть > 0, а в другой области < 0. Напомним, что как было показано выше, в точке экстремума (см. (**)),

д2 V >—- д2 V д2 V

д ^ > 0 (г = 1,NN> 0,^ > 0

д^г

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2

дЬ,

2

0

д6

поэтому в области определения 0,5 , где справедливы последние три неравенства, функция SJ, должна быть строго выпукла.

Одним из вариантов области строгой выпуклости, где должно быть выполнено: М11 > 0, М22 > 0, ОвЬО > 0, является вариант, получаемый из

2!^^ А - 2!^ det В - 2! уг _ 6 2_ det С >0

ВвЮ > 0 ^ 2! ^г-

! Д_ < 0, ¿е! В > 0; X Уг Ьо2 2^г

например, при такой случайной комбинации знаков:

- > 0, ¿е! С < 0 . (17)

„ — С"-

У1 уг

Возможны, естественно, и другие варианты сочетания знаков неравенств ><, но, естественно, все эти варианты необходимо исследовать на совместимость системы неравенств, соответствующих каждому варианту DetG >0 как для данного конкретного варианта, так и всех (или их части) вариантов совместно.

Раскроем первое слагаемое в (16), получим:

2Х^2-Ш А) = 2! ^ * (2£*2£ А) > 0

уг

уг

уг

уг

Раскрывая второе слагаемое в разложении (16): 2!^¿е!В = 2^* ^^ + 2&12

+

2!

у г " Ь0 " 2ЬЛг

уг

уг у

>0

уг

над которым выполним ряд преобразований, с учетом (17), и, не забывая о том, что нам необходима строгая положительность

В = -2!%<

С„

С„

* 2! -4т + 2&12

С„

С,

С„

С

+4^1 !4_! у - [ = -2! -

—у- -уг ) -уг - уг -х-

-2! 4^12 !■А- - 2! 4&1! у - V 2&1^ !■4- =

Г . А

у

у- у

!-г+ь12 !-2-— . — .

хг уг

- 8&1 !у-- &02-

Необходимо заметить, что строгая положительность гаран-р

тируется, если det В < 0 .

Суг ,

Итак, данное выражение - 2 ! -у- det В > 0, что возможно, если

-861 !

уг _ 60 _ Шг

—уг

>-8

V уг У

!-г+612 !-г

—хг —уг

Поскольку правая часть этого неравенства > 0 всегда, то в таком случае и левая часть вся > 0, т.е., опуская > 0 , приходим к ограничению —уг

_861 !!р!4г*! у 62 > 0

с ■

уг

Возвращаясь назад, получили:

-2!^2"detВ > 0 » -861!%! уг _ 602_ ^

суг

(

>-8

2

!с2-

уг У

!-1г+X !±Г

с

уг

(18)

>0

Рассмотрим далее выражение третьего слагаемого

_ Ь0

_2! уг \ Шг det С =

с,,

46, !4-+«Л-! 6 _

С уг Суг

с

с

(

-2!

у г _ Ь0 _ 2

с

= ! -И _ 60 _ ^

Суг

2

уг

Ь ^ +! И _ Ь _ 2

С уг

2 уг

= -8!-^*!

С уг

уг _ Ь0 _ 2 ^г

уг

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

61 !1Г +! у' _ 60 _ ^

—,,

—,,

(-2) =

< 0

^-8! ! у г _ Ь0 _ 2Ь1^

—уг —уг

Ь !:х +!

у г _ Ь0 _ 22

—.,

> 0 (19)

41

Далее, объединяя (16)—(19), приходим к системе неравенств,

требований, гарантирующих det > 0:

2 2

С02£-^тШ А) > 0;

сУ

(II) -2£Д" det В > 0;

с

уг

(III) -2£ Уг Ьо 2 det С > 0;

с

Раскрывая detA, detB, detC, получаем в итоге

22 ( 1 1 (I): 2£%*

с,.

(II) : -8

£3г

V

у

с

с

> 0;

Уг

с ,„

уг у

Ест + Ь12

С ■ С„:

-8&1 £1р£_^* £ Уг Ъ<\ 2Ъ^г > 0;

с

с

(III): -8£4* £

с

уг уг

Уг - Ъ0 - 2Ъ12г

о2.

с

Ъ £-22- +£

Уг - Ъ0 - 2Ъ12г

с

с

> 0;

Данная система неравенств-ограничений гарантирует нам строгую положительность выражений (17) для определителя гессиана О3'3, соответствующего обобщенной квадратичной форме Sz (см. (7)), описывающего область строгой выпуклости Sг Напомним, что в основе аналитического выражения для Sz лежит предположение о нормальном (двумерном) распределении погрешностей измерения координат признаков, предъявляемых для распознавания арпоп не пересекающихся классов образов, в рамках рассматриваемой в работе конфлюэнтной ситуации.

Если снова обратиться к системе уравнений (*) и решить ее методом последовательного исключения переменных, то в результате придем к кубическому уравнению [9] относительно искомого углового коэффициента Ь1 разделяющие линии регрессии:

N__N __N

Ъ1 £с2,- х2; (а2

г=1

г - 2Ъ12 £ сХг хг У г (2г - М£

г=1 г

N__N ___

-£сХгУ2г (2г} + £ хг Уг (г = 0

(20)

г=1

где x2 = x2 - (-Ц-

! — I ^x -),0 = у2 - (>'

Ю.-

i=1

Ё«0

i=1

-), со- = (ст2. + b. a2).

' ) ! ^ ^/í l VI '

yi

Из данного уравнения были получены практически все его частные случаи, касающиеся всех частых случаев комбинаций отношения двух величин дисперсий a2xi и a2yi (i = 1, друг с другом:

(ст^ = 0,<j2yi Ф 0),(axi Ф 0,CT2yi = 0),^ = С ,

xi yi x yi Ci (y)

1 1

где С = const, ю1 (x) = —ю1 (y) = —2--веса измерений.

Заметим, что широко известные регрессии у на х, и х на у, с их традиционными оценками метода наименьших квадратов соответствует упомянутым выше комбинациям

схг = 0 u aУi * 0; aXi * 0, а^ = 0 Уг = . В [9] впервые приведен список инвариантов рассмотренной

, имеющий большое

fx у^

задачи относительно перестановки практическое значение. V у х.

Поскольку кубическое уравнение (20) может, в частности, иметь три действительных корня, необходима существенная дополнительная информация для идентификации «наилучшей» прямой (наилучшего углового коэффициента Ь\ или, что равносильно, наилучшего корня (20) из его трех корней), который будет однозначно соответствовать минимуму Sг

Относительно существования глобального минимума у приведем фундаментальную теорему [5]: «Пусть функция ф(х) непрерывна и ограничена снизу числом В. Тогда, если найдется такая точка х0 е М т, в которой ф(х0) < В,то абсолютный минимум функции ф(х) достигается». В нашей задаче в качестве функции ф(х) должна рассматриваться SJ, (см. (7)), которая будет ограничена снизу и

(

B1 > 0

B1 < min I

f

xi

2

< min

in I

(

yi - b0 - b1^i

4

или же числом

f

B2 > 0

B2 < min I

( yi - b0 -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

< min

in I

2

и, как видно, найдется число Р1 > 0, такое, что 0 < Р1 <B1, или найдется такое число Р2 > 0, такое, что 0 < Р2 <B2.

Но если вернуться к начальной части статьи, где установлена квазивыпуклость SJ, и, одновременно, существование единственной ограниченной замкнутой области строгой выпуклости (см. (**)), то вопрос о существовании глобального минимума у SJ, решается положительно, в полном соответвии с ее квазивыпуклостью.

Не лишне вспомнить [4, 5] «что всякая монотонно-убывающая (возрастающая ) последовательность, ограниченная снизу (сверху) имеет предел».

СПИСОК ЛИТЕРАТУРЫ

1. Ершова А.В., Скопинская И.М. Исследование устойчивости параллельного алгоритма решения задачи сильной отделимости // Вестник ЮУРГУ. - 2012. - № 18.

2. Еремин И. И. Фейеровские методы сильной отделимости выпуклых полиэдральных множеств // Известия высших учебных заведений. Серия Математика. - 2006. - № 12. - С. 33-43.

3. Исаев А. Б., Алнадфа А. Итерационно-взвешенный алгоритм построения линейной разделяющей функции регрессии в задаче классификации образов, признаки которых отягощены погрешностями измерений // Горный информационно-аналитический бюллетень. - 2015. -№ 5. - С. 336-341.

4. Грешилов А. А. Математические методы построения прогнозов. -М.: Радио и связь, 1997.

5. Демиденко Е. З. Линейная и нелинейная регрессии. - М.: Финансы и статистика, 1981.

6. Исаев А. Б., Аль-Харази. Нарушение идемпотентности ортогонального проектирующего оператора в задачах распознавания образов в рамках конфлюэнтной ситуации // Вестник Российского университета дружбы народов. Серия Инженерные исследования. - 2009. -№ 4. - С. 86-88.

7. Ту Дж., Гонсалес Р. Математические принципы распознавания образов. - М.: Мир, 1978.

8. Амосов А. А., Дубинский Ю. А., Копченова Н.В. Вычислительные методы для инженеров. 2-е изд., доп. - М.: Изд-во МЭИ, 2003.

9. Исаев А. Б. Измерительная техника. - 1982. - № 10. - С. 13.

КОРОТКО ОБ АВТОРАХ

Алнадфа А.1 — аспирант, e-mail: antwan.tiger@gmail.com,

Исаев А.Б.1 — профессор, e-mail: a.borisovich@mail.ru, Финансовый университет при правительстве РФ, 1 Российский университет дружбы народов.

Gornyy informatsionno-analiticheskiy byulleten'. 2016. No. 8, pp. 30-45.

udc 004.93 A.B. Isaev, A. Alnadfa

TOPOLOGICAL PROPERTIES OF QUADRATIC FORM IN IMAGE IDENTIFICATION PROBLEMS

Considering overall imprecision of measuring coordinates of attributes for two classes of images preset as disjoint shells, the function of the highest likelihood has been plotted for sampling of the coordinates of attributes for images of two classes with the normal law distribution of the measurement errors.

It is shown that the quadratic form consistent with the likelihood function of the problem is quasi-convex in the considered confluent situation. Based on the analysis of the Hessian of the function, the inequalities are derived, that limit the function's strict convexity domain containing the single point of the absolute minimum of the problem, which is found using a special iterative procedure with the initial approximation from a finite limited domain of strict convexity.

Using this quadratic form, a system of quasi-normal weighted nonlinear equations is obtained, and the system solution converging to the absolute minimum point is given. A cubic equation is derived relative to a parameter (slope ratio) of the separating line.

Key words: confluent situation, overall random measuring errors, separating line, strictly convex and quasi-convex quadratic form, maximum likelihood function, convex shell, concavity, convexity, true and measured values of attributes of images, inequalities-constraints.

AUTHORS

Isaev A.B.1, Graduate Student, e-mail: antwan.tiger@gmail.com, Alnadfa A.1, Professor, e-mail: a.borisovich@mail.ru, Financial University under the Government of Russian Federation, Moscow, Russia,

1 Peoples' Friendship University of Russia, 113093, Moscow, Russia.

REFERENCES

1. Ershova A. V., Skopinskaya I. M. Vestnik Yuzhno-Ural'skogo gosudarstvennogo uni-versiteta. 2012, no 18.

2. Eremin I. I. Izvestiya vysshikh uchebnykh zavedeniy. Seriya Matematika. 2006, no 12, pp. 33-43.

3. Isaev A. B., Alnadfa A. Gornyy informatsionno-analiticheskiy byulleten'. 2015, no 5, pp. 336-341.

4. Greshilov A. A. Matematicheskie metodypostroeniya prognozov (Mathematical methods of forecasting), Moscow, Radio i svyaz', 1997.

5. Demidenko E. Z. Lineynaya i nelineynaya regressii (Linear and nonlinear regression), Moscow, Finansy i statistika, 1981.

6. Isaev A. B., Al'-Kharazi. Vestnik Rossiyskogo universiteta druzhby narodov. Seriya Inzhenernye issledovaniya. 2009, no 4, pp. 86-88.

7. Tu Dzh., Gonsales R. Matematicheskie printsipy raspoznavaniya obrazov (Mathematical principles of image identification), Moscow, Mir, 1978.

8. Amosov A. A., Dubinskiy Yu. A., Kopchenova N. V. Vychislitel'nye metody dlya inz-henerov (Computational methods for engineers, 2nd edition), Moscow, Izd-vo MEI, 2003.

9. Isaev A. B. Izmeritel'naya tekhnika. 1982, no 10, pp. 13.

i Надоели баннеры? Вы всегда можете отключить рекламу.