Научная статья на тему 'К вопросу о разрешимости задачи идентификации двух классов образов в конфлюентной ситуации'

К вопросу о разрешимости задачи идентификации двух классов образов в конфлюентной ситуации Текст научной статьи по специальности «Математика»

CC BY
70
18
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАДАЧА ИДЕНТИФИКАЦИИ / АЛГОРИТМ ПОСТРОЕНИЯ / КОНФЛЮЕНТНАЯ СИТУАЦИЯ / THE PROBLEM OF IDENTIFICATION / ALGORITHM OF CONSTRUCTION / COFLUENT SITUATION

Аннотация научной статьи по математике, автор научной работы — Исаев А. Б., Аль-харази В. Ф.

В статье в рамках двумерной задачи идентификации двух классов образов, заданных своими выпуклыми оболочками, в присутствии погрешностей измерений координат образов (конфлюентная ситуация) показана неразрешимость задачи линейной идентифицируемости двух классов образов при помощи построения разделяющей линии регрессии.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Исаев А. Б., Аль-харази В. Ф.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

To the question on resolvability of the problem of identification of two classes of images in konfluent situations

In Article, within the limits of a two-dimensional problem of identification of two classes of the images set by the convex covers. In the presence of errors of measurements of co-ordinates of images (the confluent situation), is shown unsolvability of a problem of linear identifiability of two classes of images by means of construction of a dividing line of regress.

Текст научной работы на тему «К вопросу о разрешимости задачи идентификации двух классов образов в конфлюентной ситуации»

К ВОПРОСУ О РАЗРЕШИМОСТИ ЗАДАЧИ ИДЕНТИФИКАЦИИ ДВУХ КЛАССОВ ОБРАЗОВ В КОНФЛЮЕНТНОЙ СИТУАЦИИ

А.Б. Исаев, В.Ф. Аль-Харази

Кафедра кибернетики и мехатроники Российский университет дружбы народов ул. Миклухо-Маклая, 6, Москва, Россия, 117198

В статье в рамках двумерной задачи идентификации двух классов образов, заданных своими выпуклыми оболочками, в присутствии погрешностей измерений координат образов (конфлюент-ная ситуация) показана неразрешимость задачи линейной идентифицируемости двух классов образов при помощи построения разделяющей линии регрессии.

Ключевые слова: задача идентификации, алгоритм построения, конфлюентная ситуация.

В работах [1; 2] предложены алгоритмы построения разделяющей функции (линейной) для задач классификации двумерных образов в условиях, когда результаты измерений всех признаков предъявляемых образов отягощены как некоррелированными, так и коррелированными случайными погрешностями. Например, в [2] был предложен вычислительный алгоритм для построения разделяющей линии двух классов образов, заданных своими оболочками, причем в качестве разделяющей линии этих классов образов использовалась линия регрессии, оценки параметров которой получались из решения системы уравнений максимального правдоподобия для решаемой (в рамках конфлюентной ситуации) задачи идентификации пары предъявляемых образов. Предложенные алгоритмы пригодны для задач идентификации двух классов образов, выпуклые оболочки которых не пересекаются с вероятностью Pr = 0,997, ибо изначально распределение погрешностей измерений координат признаков образов считалось нормальным. Мы называем задачу идентификации полностью детерминированной, если в результатах измерений координат признаков образов отсутствуют случайные погрешности. В этом случае вопрос о существовании разделяющей линии решается положительно для любой пары классов образов на основании известной теоремы выпуклого анализа

о существовании разделяющей гиперплоскости для двух непересекающихся непустых выпуклых множеств [3].

Назовем задачу распознавания образов линейно идентифицируемой, если каждый из классов предъявляемых образов (заданный своей выпуклой оболочкой) с помощью некоторой линейной решающей функции может быть отделен от каждого из всех остальных классов. Еще раз подчеркнем, что рассматриваемая задача является двумерной — у каждого из предъявляемых классов {юу} у = 1, 2

(или у = 1, т в общем случае), представляемых своими выпуклыми оболочками

{н (юу ) у = 1,2, результаты измерений координат признаков X и У являются

парами совместных измерений {, у{ (для класса юу, у = 1,2), причем сами

классы (равно как и их выпуклые оболочки {В (шу )} у = 1,2) мы считаем непере-секающимися.

Назовем классы ш ■, представленные своими выпуклыми оболочками В(шу),

почти наверное линейно идентифицируемыми, если с вероятностью Рг = 0,997

( } ) N

каждый предъявляемый образ {х/, у(} ^, у = 1,2 и его выпуклая оболочка В(ш у) могут быть причислены к своему классу шу (у = 1,2).

Будем говорить, что задача распознавания образов линейно не идентифицируема, если предложенное условие линейной идентифицируемости не выполняется хотя бы для одного из предъявленных классов шу (у = 1, т в общем случае), заданного своей выпуклой оболочкой В(шу).

На рис. 1 изображен вариант нарушения условия идентификации.

X

Вг(х\,у\) *— м - 4 о!- А) СО 2 ^ у\ + Ч*1у1) М'

нК- / £ 1

О(хо,у0)

Рис. 1. Вариант нарушения условия идентификации

Вследствие наличия предельной случайной погрешности А у = ±3аг (^) у образа А1Е шь этот образ (т.е. вершина оболочки В(шу)) с вероятностью меньшей 0,997 может оказаться внутри доверительного интервала ±3аг (А1). Это событие будет

А14 = 3аг (А1) > А1С = 5 =

1 ( - х12) ( - х1)

(х2 - х12 ) ( - У12 ) (2 - у1)

= (Ах221) 1 • (а^12 • Ау21 + Ах221 • Ау12) > 0

реализовано, если совершенно естественное требование, содержащее в неявной форме ограничения на ориентацию оболочек В (ш1) и В (ш2) на плоскости ХОУ

(1)

2 12 21 21 12 по отношению друг к другу. Значения символов Ах21, А*! , Ау21, Ах21, Аух содержатся в определителе ГЦ] , раскрыв который, получили (1).

жатся в определителе

Требование 3аУ(А1) = А1А1' равносильно предположению о нормальности распределения погрешностей в результатах измерений хотя бы у одного из признаков всех образов из классов ш1 и ш2.

Итак, мы пришли к тому, что оболочки И (ш1) и И (ш2) считаются неиден-тифицируемыми с вероятностью 0,997, если некоторый образ А1 (одна из вершин оболочки В(ш1)) может быть найден внутри оболочки В(ш2) с вероятностью Р = 0,997. Это событие реализуется, если выполняется условие:

Все изложенное, по сути, является доказательством следующего утверждения.

Утверждение 1

В двумерной задаче идентификации двух классов образов ш1 и ш2, задаваемых своими выпуклыми оболочками Н(ш1) и Н(ш2), в ситуации, когда присутствуют погрешности измерений координат образов (хотя бы у одной из двух координат любого образа), задача неразрешима (т.е. Н (ш1) п н К) Ф 0) с вероятностью 0,997, если

Нетрудно увидеть, что на рис. 1 изображен случай такого взаимного расположения оболочек H(ш1) и H(ш2), при котором Inf H(ш1) > Sup H(ш2). При этом

в качестве разделяющей линии может быть взята линия MM, ортогональная оси OY(или прямой AA'). Все остальное неограниченное сверху число случаев взаимного расположения двух оболочек H(ш1) и H(ш2) реализуется при помощи суперпозиции линейного преобразования вращения двумерной плоскости на угол а (невырожденного преобразования) и преобразования параллельного переноса. Операция вращения может быть описана с помощью выражений:

3a(Al) > (Axfl) 1 • (Ax12 • Ay221 + Ax22J • Ay12) > 0

( - xl2) (x22 - X)

а операция параллельного переноса

где I = 1,2,3,...,Му, у = 1,2,

х{, у{ — новые координаты образов х{, у{ ,

х0, у0 — координаты нового начала координат в старой системе (см. рис. 1).

Другими словами, представленное фрагментом линейное вещественное пространство К2 (плоскость ХОУ) при преобразованиях (2)—(3) может быть полностью покрыто оболочками Н(ш1) и Н(ш2). Справедливо следующее утверждение.

Утверждение 2

В двумерной задаче идентификации двух классов образов ш1 и ш2, задаваемых своими выпуклыми оболочками Н (ш1) и Н (ш2), расположенными в пространстве Я2, все пространство Я2 может быть покрыто как каждой из оболочек порознь, так и двумя одновременно.

Доказательство

Перефразируя утверждение 1, можно сказать, что на плоскости Я2 нет такой замкнутой области, внутри которой никогда не может оказаться любая из вершин (, Ук) какой-нибудь из оболочек Н (ю у), у = 1,2, к = 1, N у . Допустим,

*

что это не так и что существует такая ограниченная и замкнутая область 5 , вовнутрь которой никогда не может попасть какая-либо из вершин (, уу) 5*

ни при каком из преобразований (2—3). Ясно, что любые положения вершин (образов) внутри 5 * будут соответствовать каким-либо интервалам изменения переменных ху, у{. При переносе начала координат это (л0х[, Л0уу), а при осуществлении серии поворотов по Zа ~ (Лаху, Лауу), Х{п - Х[п1 =Л0Х[ (*), Укп - Укп1 = ЛаХу (*), где Х]ы < Х{п — минимальное и максимальное значения абсциссы образа (ху, уу), у{т < у{п — их аналоги ординаты того же образа.

Убедимся, что преобразование вращения (2) является непрерывным (и ортогональным). В самом деле:

x- cos a + y/ sin a = x-x{ sin a + y{ cos a = y{

cos a sin а x{ 1 x *• i 1 ^ P x{ 1 *• i 1

= =

- sin a cos а 1 y 1 1 1 1 y 1 1 yi 1

где P =

cos a sin a - sin a cos a рывны Va j e R1), и ортогонален (Det P = +1)

P (2 ^ R2) непрерывен (ибо функции cos a и sin a непре-

Аналогично: xi - X0 = Xi

и У- - yo = yi

непрерывна в любой точке

M (x-, yt )e R2.

Поэтому преобразования {(2), (3)}: R

2 2 R везде непрерывны в R .

Однако, следуя логике доказательства от противного, существование замкнутой (ограниченной) области 5*, которая не покрывается образами {х/, уу}:

/ у у) I ЛоХк,Лоук ( ч ~ ~

{, Ук }е 1 (*) (см. выше), означает, что по крайней мере оператор вра-

1ЛаХк , Лаук

щения Р (2 ^ Я21 не является непрерывным на области (*), что противоречит

его непрерывности всюду в Я2, установленному выше.

Утверждение доказано.

Итак, мы видим, что линейная неидентифицируемость задачи распознавания двух классов образов ю1 и ю2, возникающая с отличной от нуля вероятностью пересечения их выпуклых оболочек Н (ю1) и Н (ю2), имеет своей причиной кон-флюентную ситуацию (наличие погрешностей измерений координат {х/ , у/} I = 1, N у , у = 1,2) признаков двумерных образов. Здесь у — число классов образов, N у — число пар координат признаков у образов из класса у.

Нетрудно показать, что вероятность неидентификации классов образов ю1 и ю2, интерпретируемая в нашей работе как факт случайного попадания любого из образов рассматриваемых классов ю1 и ю2 внутрь оболочки класса, к которому он не принадлежит (например, образа А1), может быть рассчитана по формуле:

Рг (А1А1 > А1С) = Рг (3аУ (А1) > 5 > 0)

1 - Рг(0 < 3аУ (А1 )<5) = 1 - Ф (5),

где Ф (5) — значение табулированной функции Лапласа для аргумента 5, рассчитываемого по формуле (1).

ЛИТЕРАТУРА

[1] Исаев А.Б., Мастеров С.А., Долгушин Д.Е. К вопросу о проведении классификации образов, учитывающей погрешности в измерении признаков // Вестник РУДН. Серия «Инженерные исследования». — 2007. — № 4. — С. 46—51.

[2] Исаев А.Б., Аль-Харази В.Ф. Процедура классификации образов в схеме конфлюентно-го анализа с корреляцией погрешностей в результатах измерения координат признаков образов // Вестник РУДН. Серия «Инженерные исследования». — 2008. — № 4. — С. 35—43.

[3] Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы. — М.: Мир, 1982. — С. 55—57.

TO THE QUESTION ON RESOLVABILITY OF THE PROBLEM OF IDENTIFICATION OF TWO CLASSES OF IMAGES IN KONFLUENT SITUATIONS

A.B. Isaev, V.F. Al-Harasi

Cybernetics and Mechatronics Department Peoples’ Friendship University of Russia

Miklukho-Maklaya str., 6, Moscow, Russia, 117198

In Article, within the limits of a two-dimensional problem of identification of two classes of the images set by the convex covers. In the presence of errors of measurements of co-ordinates of images (the confluent situation), is shown unsolvability of a problem of linear identifiability of two classes of images by means of construction of a dividing line of regress.

Key words: the problem of identification, algorithm of construction, cofluent situation.

i Надоели баннеры? Вы всегда можете отключить рекламу.