УДК 621.396
КЛАССИФИКАЦИЯ МАЛОРАЗМЕРНЫХ ЦЕЛЕЙ ПО ВЕКТОРУ НЕЗАВИСИМЫХ ПРИЗНАКОВ С ИЗВЕСТНЫМИ КОРРЕЛЯЦИОННЫМИ СВОЙСТВАМИ
Н.С. Акиншин, В. Л. Румянцев, Е.А. Старожук
Рассмотрена задача адаптивной классификации радиолокационных сигналов, отраженных от двух классов наземных целей по п независимым признакам.
Ключевые слова: классификация сигналов, обучающая выборка, признаки классификации.
В результате наблюдения целей радиолокационными средствами (РЛС) часто существует возможность определения вида распределения признаков классов. В ряде случаев с достаточной для практики
точностью вектор независимых признаков ={х1,Х2,...х} может
быть описан нормальным законом с различными векторами средних значений а],] = 1,2. Если наличие априорной информации позволяет считать
корреляционные связи между элементами р-мерного вектора г-го признака известными, то задача классификации малоразмерных наземных целей (МНЦ) сводится к методам классификации многомерных нормальных совокупностей с известной общей ковариационной матрицей М, рассмотренным в [1]. Однако в указанных работах получены соотношения для ошибок классификации в замкнутом виде применительно к размерности вектора признаков не превышающей трех.
Рассмотрим задачу адаптивной классификации выборки из п независимых признаков, каждый из которых подчинен р-мерному нормальному закону с известной "общей" ковариационной матрицей к классам О1 или 02, если векторы средних значений а) априорно неизвестны, но оценки их могут быть получены по обучающим выборкам произвольного объема. При известных векторах аI и а2 решающее правило классификации, построенное на основе отношения правдоподобия, имеет вид [1-3]
п( \\ г-1 2^
-( а2 -а1 ) М -ЕХг - а1 - а2
1
2 0*. (1)
о
2
, п
где * = 1пС - выбранный порог; С - средний риск принятия решений.
При априорно неизвестных векторах средних в (1) следует подставить оценки максимального правдоподобия
1 т 1 т2
а1 =—Е х1 °ь а2 =—Е х1 ^
т1 г=1 т2 г=1
полученные по обучающим выборкам
Х\Ц = { Xi, xj И X\W2 = { Xi, X2'--- Xm2 } , (2)
объемом m1 и m2 соответственно.
Из соотношения (1) видно, что после измерения i-го признака его значение сравнивается с суммой векторов средних значений для классов W1 и W2, поступающих из блока эталонов, где хранятся результаты обучения классификатора. Далее результат суммируется по n признакам, умно-
^ П / чГ ,1
жается на рассчитываемую величину Q = — a _i) M и результат сравнивается с порогом, зависящим от выбранного критерия распознавания. При неограниченно возрастающих объемах обучающих выборок вероятности ошибок первого и второго рода Р1 и Р2 сходятся к вероятностям ошибок Р10 и Р20 для априорно известных а1 и а2 [2]
P10 = 1 -Ф[R + nd / 2ypnd ]; P20 = Ф[R + nd/2ypnd]; (3)
где Ф [ x] - интеграл вероятности;
d = ^(a2-a1) M1 (a2- aj. На практике часто оказывается необходимым определить вероятности ошибок для произвольных объемов m],j = 1,2 обучающих выборок,
поэтому получим соотношения для вычисления вероятностей Р1 и Р2. Запишем решающее правило (1) в виде
YTM Z £ R , (4)
w1
где Y=a 2 - a1 - р-мерный нормальный вектор с параметрами г л 2 n
a-a1,[(1/m1 +1/т2]м}; Z = -Z xt -a2 - a1 - р -мерный нормальный век-
n i=1
тор с параметрами
{ a2-a1,[1/m1 +1 m2+4/n]M 1W , |-(a 2 - a1),[1/m1 +1/m.+4/n]M J W . Вследствие независимости наблюдений непосредственными вычислениями нетрудно определить степень корреляционной зависимости между Zi и Y Очевидно, коэффициент корреляции
Kz,y,
1___1_
m1 m2
1 + + mi m2 n
= к-
Тогда распределение величины Ц1=21У1 найдется из соотношения
Щ(Ц)= 7 Щ (и (5)
—7
где ЩЦП)=-1 т 2 ехр|—-?(1—к2А+Ц^—при 11^0 (6)
2ро о А1—I 2 о2 ¿,о 2 о л 2 ] р ^
28
= 0 при ¿1=0, 1=2,р. Воспользовавшись результатами работы [2], перепишем решающее правило в виде
О.-,
Zj>,z,=Zt/, <
Q,
i=i
i=i
2R
п
(7)
Обозначая = ^ > с учетом независимости Ц методом характе-
/=1
ристических функций определим Ж(У) следующим образом:
СГ2Ь-К2)27Г] Р~2
W(V)
\
1 'VZt,
{2каха2Ь-К1) 1
7=2
ехр
1 ^ 2 у2 ^ 2VK
(Jxi=2 (J2i=2 (Jl(J2
(8)
¿//'¿ft
2 СЛ1Рш
Обозначая в (8) ^ = , осуществляя замену переменных
7=1
tx = rsm(px t2 = г COS ф sill
tp = Г COS ^ COS COS 2COS (р 1
с учетом якобиана преобразования
7 = (-1) Р> P'cos р'2<рг cos Р~ъ (р2...со%(р
р-2
и интегрируя полученное соотношение для распределения решающей статистики по Г, после преобразований приходим к выражению для ошибки первого рода Р;
Рг = (Ар)ехр
d2
2 <7,
f f /^"'cosP'VexjJ-1/2
/72^(^-3)!!)*
Л-/2
0 -ж/2
2 „
f -2 — rsm^ <7i
(9)
Ф
d 2
InC--rsin^-(Jx(J2Kt + (J2dKtsm(p
(Jl
а&Ф-К2
dtd(p,
где функция имеет вид
А(р) =
\,р = 2К+\ ,р = 2К.
Если размеры обучающих выборок т1 и т2 выбраны одинаковыми, то для критерия максимального правдоподобия (С=1) вероятность ошибок
Р, = Р2 = (А(р)ехр
я/2
| | № СО2 ф
О -я/2
2 а; -1/2
/ <Дя(р-3)\\)*
2
/ -2 — Гътф
О,
(10)
ф
с1 ат(р Ог
Интегрируя (10) сначала по I, вероятность ошибок можно записать в общем виде:
р. = (А(Р)/(Р-3)!!)*
я/2
-я/2
с! ЬШ(р
сг2
(11)
Здесь Вр(Р9 -функция параболического цилиндра, которая может быть вычислена по рекуррентным формулам
приведенным в [4].
Из выражения (11) при р=3 следует известное соотношение для ошибок классификации в трехмерном случае. В случае размерности вектора признаков более высокого порядка может быть вычислено только численным интегрированием. В качестве иллюстрации рассмотрим распознавание двух классов трехмерной нормальной совокупности. Вероятности ошибок при этом запишутся в виде
" (1' а ' (1 ' " (1'
ф —- + Ф —- ф
<Т1 О, Ог
(Л1' 6 -Ф (1
<Т2е?Ф 2 Ф Ог. —-
а2]_
Ох ехР
0\0г 2
2(7?
а а
ф -ф
- <У\-
(12)
На рисунке приведены зависимости Р\=Р2, рассчитанные по соотношению (12), от объема обучающих выборок т.
-п = 2
- п = 3
Зависимости вероятностей ошибочных решений Р2 и Р2 от объема обучающих выборок т
Таким образом, синтезировано решающее правило адаптивного распознавания двух классов Ц по вектору независимых /^-мерных признаков. Показано, что вероятность ошибочных решений уменьшается с ростом размерности вектора признаков и размера векторов обучающих выборок.
Список литературы
1. Фомин Я.А., Тарловский Г.Р. Статистическая теория распознавания образов. М.: Радио и связь, 1986.152 с.
2. Миленький A.B. Классификация сигналов в условиях неопределенности. М.: Сов. радио, 1975. 328 с.
3. Миллиметровая радиолокация: методы обнаружения негауссовских сигналов / Н.С. Акинишн, Р.П. Быстров, B.JL Румянцев, A.B. Соколов; под ред. Р.П. Быстрова. М.: Радиотехника, 2010. 528 с.
4. Градштейн И.С., Рыжик И.М. Таблицы интегралов, сумм, рядов и произведений. М.: ГИФМЛ, 1962. 1097 с.
Акиншин Николай Степанович, д-р техн. наук, проф., нач. отдела, nakinshiii(cyvandex, Россия, Тула, Центральное конструкторское бюро аппаратострое-
Румянцев Владимир Львович, д-р техн. наук, проф., зам. нач. отдела, vlroom(xt у and ex. ги, Россия, Тула, Центральное конструкторское бюро аппаратострое-
Старожук Евгений Андреевич, канд. экон. наук, доц., проректор по экономике и инновациям, abiturieiit(a)bmstu.ru, Россия, Москва, Московский государственный университет им. Н.Э. Баумана
TARGETS CLASSIFICATION BY VECTOR OF INDEPENDENT SIGNS WITH KNOWN CORRELA TION PROPERTIES
N.S. Akinshin, V.L. Rumyantsev, E.A. Starozhuk
Procedure of algoritm synthesis adaptive classification samplings out of n independent signs with known correlation properties applied ti dimention of vector signs exceeding thnee is considered. The synthesized decision mele and structural scheme variant of devise, adaptively detecting two classes Wj, by independent n-dimensional attribute vector are presented. We show, that the probability of incorrect decisions is decreasing with the increase of attribute vector dimension and training sampling vector dimensions.
Key words: classification of signals, the training selection, classification signs.
Akinshin Nikolay Stepanovich, doctor of technical sciences, professor, head of department, nakinshinayandex. ru, Russia, Tula, Central Design Bureau of Apparatostroye-niye,
Rumyantsev Vladimir Lvovich, doctor of technical sciences, professor, deputy head of department, vlroom @yandex. ru, Russia, Tula, Central design Bureau of an apparato-stroyeniye,
Starozhuk Eugene Aleksandrovich, candidate of economic sciences, vice-rector for economy and innovation, abiturient@,bmstu. ru, Russia, Moscow, Moscow State University named after N.E. Bauman
УДК 004.891, 004.912
ИНФОРМАЦИОННАЯ СИСТЕМА ДЛЯ АВТОМАТИЗИРОВАННОГО АНАЛИЗА ЭФФЕКТИВНОСТИ КОЛЛЕКТИВНО-ДОГОВОРНЫХ АКТОВ
В.В. Александров, Н.П. Макаров, А.С. Шустов
Предложен метод автоматизации анализа и оценки статей коллективных договоров на основе расчета порогового значения коэффициента сходства и переноса оценок с найденного аналога на анализируемую статью. Пороговое значение определяется путем анализа собранной статистики на основе действий эксперта. Разработана информационная система для анализа эффективности коллективных договоров. Подсистема анализа статей коллективных договоров, реализующая метод, позволяет сократить время анализа договоров экспертами.
Ключевые слова: автоматическая обработка текста, анализ коллективных договоров, эффективность коллективных договоров, коэффициент сходства фрагментов текстов.
Введение. В условиях постоянного роста накапливаемой информации деятельность человека, связанная со сбором, обработкой и хранением данных и направленная на решение различных проблем, становится все