УДК 621.396.96
МОДИФИКАЦИЯ МЕТОДА БАЙЕСА ДЛЯ ЗАДАЧ РАСПОЗНАВАНИЯ
А.И. КОЗЛОВ, А.В. СТАРЫХ, Г.Н. ЖИЛИНСКАЯ
Рассматриваются возможности модификации метода Байеса для решения задач распознавания.
Ключевые слова: распознавание, метод Байеса, радиополяриметрия.
В задачах распознавания геофизических образов (при оценивании параметров ПРВ) необходимо учитывать погрешности измерения признаков.
Рассмотрим байесовский классификатор с учетом погрешностей исходных данных.
Пусть необходимо провести распознавание классов ю,, / = 1, ^ . В процессе наблюдения
получают вектор признаков хг-, і = 1, к, где к - число признаков. Этот вектор является “входом“ решающего правила. При помощи этого правила, вектор может быть отнесен к одному из заданных классов, при этом важное значение имеет вероятность ошибки радиолокационной
классификации геофизических объектов. При известных ПРВ р(х ю, )• р(ю,) для ^ классов, вероятность ошибки будет определяться по формуле
р(е) = 1 - Е |р(х|ю/ )• р(ю/ Vх, (1)
j= Я/
где Я/ - область в пространстве признаков, соответствующая j классу.
Область Я/ определятся при помощи решающей функции ё, (х) = р(х ю, )• р(ю, ) / = 1, ^ .
На практике знания только точечной оценки плотности распределения вероятностей
Ю/) и вероятностей р(ю/) оказываются недостаточными, поскольку они получены в результате наблюдений и поэтому, как любые измерения, они содержат случайные ошибки. К полученным величинам необходимо добавить их интервальные оценки. Это приведет к необходимости корректировки байесовского классификатора. В этом случае
рї(ю / Iх):
[р(х Ю/ )± др(х|Ю/)]- [р(ю . )± АР(ю,)]
[Р(х )±АР(х)]
[Р(х )±АР(х )] = Е [р(х| ю, )± Ар(х| ю, )]• [р(ю, )± Ар(ю,)]
/=1
(2)
при условии ^ Р^ (ю у |х) = 1 .
у=1
При вычислении вероятности ошибки необходимо учитывать погрешности в плотности распределения вероятностей. В этом случае формула (1) примет вид
Р£(е)=1 - ЕI [р (х1ю/ )± Ар(х1ю/)] [р(ю/ )±АР (ю/)ёх.
(3)
/=1 Я,
Пусть параметрический вид функций Р (х ю,) известен. После проведения оценки параметров ПРВ Р (х Ю/) можно получить новую структуру байесовского классификатора. В этом слу-
чае неопределенность значений ПРВ можно выразить через неопределенность параметров соответствующих функций.
В качестве примера рассмотрим распознавание двух классов. Пусть случайные значения
признаков подчиняются закону N(ю2). Этот пример относится к задаче распознавания объектов по ряду признаков. В качестве распознаваемых классов возьмем класс ю (например, поверхность без растительности) и класс (О 2 (например, поверхность, покрытая растительностью). В качестве признака возьмем поляризационный фазор.
Для иллюстрации зададим некоторые исходные данные:
РЦ ) = Р(о>2 ) = 0,5; су =02 = 1,0; ту = 2,0; ^2 = 4,0.
В этом случае вероятность ошибки радиолокационной классификации будет определяться по формуле
*0 ¥
Р(е)= |р(х|ю2 )р(ю2 )ёх + |Р(х|ю1 )р(ю1 )й£ . (4)
-¥ х0
Г раница разделения классов *0 определится из условия Р(х| о Р(о ) = Р(х| о Р(о).
Для заданных распределений
*0 = 0,5(1 +^2 )=3,0. (5)
В рассматриваемом примере погрешность ПРВ будет определяться изменением математического ожидания и дисперсии поляризационного фазора.
Рассмотрим частный случай, когда математическое ожидание плотности распределения вероятностей р(х|Ю2 ) измеряется с некоторой ошибкой т ± Ат2 .
В этом случае граница разделения будет изменяться в некоторых пределах х0 < *0 < *0, а
ее верхний и нижний пределы будут определяться соотношениями:
х0 ^ Р1 = Р или, С1) = N(112 - А% 02); х0 = 0,5(ц - А^ + 1) = *0 + Ах0 = *0 - 0,5^; (6)
*0 ^ Р1 = Р или,01) = М12 + А12,02); *0 = 0,5(11 +А1 +12) = *0 + ■А*0 = *0 + 0,5^, (7)
где *0 - граница, определяемая по формуле (5).
Вероятность ошибки будет находиться в пределах Р'(е)< Р(е)< Р"(е).
Нижний предел вероятности ошибки можно выразить следующим образом Р' (е) = Р(е) + АР' (е), где Р(е) определяется по формуле (4).
Верхний предел вероятности ошибки можно выразить следующим образом Р" (е) = Р(е) + АР" (е).
Вероятность ошибки достигает максимального значения 0,5, при 11 ± А11 »12 ± ^12.
Рассмотрим влияние дисперсии 02 ± А02 на вероятность ошибки и границу Р(\\ю2). Граница будет находиться в пределах *0 < *0 < *0 .
Значение *0 определяется из соотношения Р1 = Р2, т.е. N(11,01 ) = N(12,02 +А02), а значение *0 - из соотношения Р1 = Р{', т.е. N(11,01) = N(12,02 - А02).
Пределы изменения вероятности ошибки будут определяться неравенством
Р(е)- АР'(е) < Р(е) < Р(е) + АР"(е).
Рассмотрим, как объем выборки влияет на погрешности в определении границы и вероятности ошибки. (Производится учет погрешностей параметров ПРВ второго класса, т. е.
1 ±1 02 ^02 ±А02).Ошибки параметров соответствуют: А|12 = 7^(|12), А02 = д/л(р2).
Определим дисперсии параметров ^(|!) и ^0). Для этого воспользуемся функцией правдоподобия
1
ехр
(8)
I I--- '
1 Ы2яа
г=1
Матрицу М можно получить, если взять вторые производные в формуле (8).
Дисперсии параметров будут определяться из обратной матрицы в(б ) = М-. Проведем
численный эксперимент. Определим дисперсии параметров ПРВ второго класса при различных т. Объем выборки п.
Алгоритм моделирования:
1. В качестве исходной модели используются ПРВ второго класса. Параметры поляризационного фазора известны: т2 = 6,0; о2 = 1,0. Модель
р(х|®2 ) =
1
л/2й-1,0
ехр
(х - 6,0)2 2 • 1,02
2. Для получения выборки из заданного нормального распределения датчиком случайных чисел генерируем п различных значений фазора хг .
3. Определяем дисперсии параметров нормального закона при различных объемах выборки.
4. Продублируем эксперимент многократно. Повторим пункты 2 и 3 каждый раз с новым значением п.
Если учитывать ошибки дисперсии ПРВ второго класса, то пределы границы будут определяться по формулам (6) и (7). Вероятность ошибки и ее погрешности можно найти по формуле (4).
Увеличение объема выборки приводит к тому, что
(9)
Нш В(&2 )= Нш В(&2 )= Нш Дт = Нш Дц2 = 0;
п-п---------------п---------------п------------
Нш х0 = Нш х0 = х0; Нш ДР'(в) = Нш ДР"(в) = 0
п п п п -
Анализ полученных результатов показывает, что с увеличением объема выборки, ошибки вероятности принятия правильного решения уменьшаются.
На практике объем выборки ограничен. Например, при радиолокационной классификации по поляризационным признакам, характеристики различных типов поверхностей определяются по единичным измерениям. При таких условиях ошибка принятия правильного решения увеличивается. В этой связи возникает необходимость корректировки формул применительно к поляризационным измерениям, что требует корректировки традиционных формул байесовского классификатора (2)-(3). Погрешности исходных характеристик объектов оказывают влияние на разделяющие функции, что приводит к смещению и изменению форм границ. Поэтому в задачах распознавания радиолокационных образов возникает необходимость учета погрешностей исходных данных.
Для определения оценок параметров функции ^(х, 0) = р(х Юу р(юу) (с стей ПРВ и погрешностей измерения признаков) исходная модель имеет следующий вид
Уг = Л(Х 0)+£г_ 1 хг = %г + 8г, г = 1, п Г
учетом погрешно-
(10)
где е и 8г - ошибки значений функции и аргумента.
Оценка параметров модели (10) методами регрессионного анализа (без учета погрешности измерения признаков) приводит к смещенным оценкам параметров, т. е. к неверным результатам.
Рассмотрим несколько практических случаев. Эти ситуации могут иметь место при решении задач распознавания образов по поляризационным признакам.
1. Параметры ПРВ определены методом наименьших квадратов.
В данном случае имеющаяся информация не дает возможности учесть погрешности ПРВ и погрешности измерения признаков.
2. Параметры ПРВ и их дисперсии определены методом наименьших квадратов.
В данном случае новые, несмещенные оценки параметров ПРВ получить по-прежнему нельзя. Можно определить только интервальные оценки ПРВ.
3. Параметры ПРВ определены. Известны погрешности измерения наблюдаемых величин х и у.
В данной ситуации возможны два случая:
- значения наблюдаемых величин заданы х и У;
- точки измерения х и У не заданы.
В первом случае проблем не возникает. В этой ситуации методами конфлюентного анализа можно определить новые несмещенные оценки параметров и их дисперсии. При этом оценки параметров, полученные методом наименьших квадратов, используются в качестве нулевого приближения.
Во втором случае наблюдаемые значения х и У могут быть получены путем введения дополнительного “шума“. При этом по случайным значениям х и у и их погрешностям можно (методами конфлюентного анализа) определить несмещенные оценки параметров и их дисперсии.
По несмещенным оценкам параметров ПРВ и их дисперсиям можно определить интервальные оценки ПРВ
р{л - ¿ул/ВЛ) < л(х, 0)< Л + ¿ул/Щ) < л(х, 0)}= У, при этом Л = л(х, 0). (11)
Если ПРВ имеют громоздкий вид, то их интервальные оценки можно определить путем использования ряда Тейлора
л(х, 0) » л(х> 00 )+ ^(Х 0)е„ = 00т (0т - 00т ),
(12)
где ^л(х, 0)
0=00
г
■Т
т=1
Эл(х, 0)
Э0„
0т 0От
(Єт 0От)
0т - 00т = Д&т - погрешность оценки па-
раметра 0т.
Погрешность аппроксимации функции л(х, 0) рядом (12) будет определяться как
г(х, 0) = л(х, 0)- л(х, 0)е=0 + ^Л(х, 0)
0=00
Это оценка зависит от знаков слагаемых в формуле (12).
Распределение признаков соответствует нормальному закону. Интервальные оценки ПРВ (с учетом формулы (12)) будут вычисляться по формуле
л(х|0)в » Р(х|ш, р(ш, )|і ±
і ± Х-т дт±!х-т )2-*2
>3
-Да!
(13)
Если ПРВ соответствуют многомерному нормальному распределению, то можно перейти к серии одномерных нормальных распределений. В дальнейшем можно использовать линеаризующее преобразование.
Предложенный метод распознавания по поляризационным признакам дает возможность определять ПРВ, вероятности ошибок и их интервальные оценки (с учетом погрешностей ПРВ и погрешностей измерения их признаков).
ЛИТЕРАТУРА
1. Козлов А.И., Логвин А.И., Сарычев В.А. Поляризация радиоволн. - М.: Радиотехника, 2005. - Т. 1.
2. Козлов А.И., Логвин А.И., Сарычев В.А. Поляризация радиоволн. - М.: Радиотехника, 2005. - Т. 2.
3. Козлов А.И., Логвин А.И., Сарычев В.А. Поляризация радиоволн. - М.: Радиотехника, 2005. - Т. 3.
THE MODIFICATION OF THE BAYES'ES METHOD FOR THE RECOGNITION PROBLEMS
Kozlov A.I., Starych A.V., Zhilinska G.N.
The possibility of the modification of the method Bayes'es are considered for decision of the recognition problems.
Key words: recognition, Bayes'es modified method, radiopolarimetry.
Сведения об авторах
Козлов Анатолий Иванович, 1939 г.р., окончил МФТИ (1962), профессор, доктор физикоматематических наук, Соросовский профессор, заслуженный деятель науки и техники РФ, академик Академии транспорта РФ и Международной академии информатизации, советник ректора МГТУ ГА по общим вопросам, автор более 300 научных работ, область научных интересов - радиофизика, радиопо-ляриметрия, радиолокация.
Старых Александр Васильевич, 1957 г.р., окончил МИИГА (1985), доктор технических наук, профессор кафедры технической эксплуатации радиоэлектронных систем воздушного транспорта МГТУ ГА, автор более 50 научных работ, область научных интересов - радиолокация, радионавигация, радиополя-риметрия.
Жилинская Г алина Николаевна, окончила Рижский Краснознаменный институт инженеров гражданской авиации (1976), кандидат технических наук, преподаватель Рижского института телекоммуникаций, автор более 25 научных работ, область научных интересов - микроволновая радиометрия, дистанционное зондирование окружающей среды.