УДК 004.93
СИНТЕЗ И АНАЛИЗ НЕПАРАМЕТРИЧЕСКИХ СИСТЕМ РАСПОЗНАВАНИЯ
ОБРАЗОВ, ОСНОВАННЫХ НА ДЕКОМПОЗИЦИИ ОБУЧАЮЩЕЙ ВЫБОРКИ
ПО РАЗМЕРНОСТИ
А. В. Лапко1, 2, В. А. Лапко1, 2, Е. А. Юронен1, 3
Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31 2Институт вычислительного моделирования СО РАН Российская Федерация, 660036, г. Красноярск, Академгородок 50/44
3Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, просп. Свободный, 79 E-mail: [email protected]
С позиций принципов декомпозиции обучающей выборки и коллективного оценивания предлагается методика синтеза многоуровневых непараметрических систем распознавания образов для многоальтернативной задачи классификации. Их применение обеспечивает высокую вычислительную эффективность обработки информации большой размерности.
Ключевые слова: распознавание образов, непараметрические системы, большая размерность, декомпозиция обучающей выборки.
SYNTHESIS AND THE ANALYSIS OF THE NONPARAMETRIC SYSTEMS
OF A PATTERN RECOGNITION BASED ON DECOMPOSITION ON DIMENSION
OF THE TRAINING SELECTION
A. V. Lapko1,2, V. A. Lapko1,2, E. A. Yuronen1,3
1Reshetnev Siberian State Aerospace University 31, Krasnoyarsky Rabochy Av., Krasnoyarsk, 660037, Russian Federation 2Institute of Computer Modeling Siberian Branch of the Russian Academy of Sciences 50/44, Akademgorodok, Krasnoyarsk, 660036, Russian Federation 3Siberian Federal University 79, Svobodny Av., Krasnoyarsk, 660041, Russian Federation E-mail: [email protected]
From positions of the principles of training selection decomposition and collective estimation the synthesis technique of multilevel nonparametric systems of pattern recognition for the multialternate classification problem is offered. Their application provides high computing performance of information processing of big dimension.
Keywords: pattern recognition, nonparametric systems, high-dimension, decomposition of training sample.
Непараметрические алгоритмы распознавания образов широко используются в задачах принятия решений и проверки гипотез о распределениях случайных величин [1-6]. Методика синтеза непараметрических систем распознавания образов для двуальтернативной задачи классификации с использованием принципов декомпозиции обучающей выборки по её размерности впервые была предложена в работе [7].
Идея предлагаемого подхода состоит в построении семейства частных решающих функций, соответствующих различным наборам признаков классифицируемых объектов, с последующей их интеграцией в нелинейном решающем правиле с помощью методов непараметриче-
Актуальные проблемы авиации и космонавтики - 2017. Том 2
ской статистики [8; 9]. При этом формирование обобщённого решения о принадлежности ситуации к тому или иному классу осуществляется в пространстве значений частных решающих функций. Полученные многоуровневые непараметрические системы классификации, обеспечивают эффективное решение двуальтернативных задач распознавания образов в условиях обучающих выборок значительной размерности на основе использования принципов коллективного оценивания и технологии параллельных вычислений.
Построим непараметрическую систему классификации для многоальтернативной задачи распознавания образов на основе принципов декомпозиции обучающей выборки.
Разобьем обучающую выборку V = ( х1 , а( х1), 1 = 1, п ) на части
Vj = (, а'('), ' е I}), 3 = 1,
= 1, М -1
где а'(г ) =
-1, если х' е О
м
1, если х1 е^-з = ^
г=3+1
а Iз - множество номеров точек из выборки V, принадлежащих классам Qt, I = 3, М .
Сформируем наборы признаков х(^), t = 1, Т и на этой основе проведём декомпозицию каждой выборки ¥3, 3 = 1, М -1 на части
V- ^) = (х' ^), а'(1), 1 е 1з), ^ = 1Т . По полученным выборкам V3 (t), t = 1, Т, 3 = 1, М -1 построим решающие правила клас-
м
сификации между классом О3 и областью ^
т
(х ^)):
1=3+1
х(t)еп;., если /п (х(t))< 0, х^) е О,-, если /л (х(t)) > 0, t = 1,Т, 3 = 1, М-1.
Непараметрические оценки уравнений разделяющих поверхностей /33 (х (t)) между клас-
м
сом О3 и областью О3 = ^ О1 имеют вид
1=3+1
-1
7,3 (х (t))
>; П с.
vеKt
Еа'(г )П®
'е11
vеKt
ху ()- А ()
, t = 1, Т, 3 = 1, М -1, (1)
где п' - количество элементов множества 13 , 3 = 1, М -1. Здесь К - множество номеров признаков составляющих их набор х(().
Выбор параметров е[, V е К, t = 1, Т, 3 = 1, М -1 при оптимизации частных решающих правил (1) осуществляется в режиме «скользящего экзамена» из условия минимума оценки вероятности ошибки распознавания образов.
Используя непараметрические оценки уравнений разделяющих поверхностей (1), по результатам вычислительных экспериментов сформируем обучающие выборки
(7П (х1 ^)), t = ГТ, а(1), 1 е 1}), 3 = 1, М -1 и построим в пространстве значений /33 (х^)), t = 1, Т решающие правила
'х е О3, если (/п (х(t)), t = ГТ)< 0,
т3 (х):
х еО-3, если
р3 (((х()) t = 1, Т)> 0
где
F (т (x ))
j П <
t=1
)П
ielj t=1
Т (x (t))" j (xi (t))
, Т = 1, m -1.
Параметры сг, г = 1, Т непараметрических решающих правил (х), ] = 1, М -1 находятся из условия минимума статистической оценки вероятности ошибки распознавания образов типа (3).
Обобщённое решение о принадлежности объекта с признаками х формируется на третьем уровне непараметрической системы классификации в соответствии с правилом
'хбП/, если /уТ(х(г)),г = ГТ)>0, у = 1,]-1 и (х(г)),г = ГТ)<0,
:(г)е^м, если ?м-1 ((-1,м (х(г)), г = 1, Т)>
m
(x):
С учётом ранее введённых условий, оценим максимальное время формирования решений рассматриваемой непараметрической системы классификации при использовании параллельных вычислительных технологий. Нетрудно показать, что преимущество предлагаемой системы достигается при к > 4 и kT + T < к.
Предложены двух и трёхуровневые непараметрические системы для решения многоальтернативных задач распознавания образов в пространстве значительной размерности. Методическую основу их синтеза составляют принципы декомпозиции обучающей выборки и коллективного оценивания. Это позволяет использовать технологию параллельных вычислений. Определены условия, при которых обеспечивается существенное сокращение времени формирования решений по сравнению с традиционными непараметрическими классификаторами парзеновского типа.
Библиографические ссылки
1. Лапко А. В., Лапко В. А. Коллектив непараметрических решающих функций в двуаль-тернативной задаче распознавания образов // Системы управления и информационные технологии. 2009. 3.1(37). С. 156-160.
2. Лапко А. В., Лапко В. А. Непараметрическая оценка уравнения разделяющей поверхности в условиях больших выборок и её свойства // Системы управления и информационные технологии. 2010. 1.2 (39). С. 300-304.
3. Лапко А. В., Ченцов С. В. Непараметрические системы обработки информации. М. : Наука, 2000.
4. Лапко А. В., Лапко В. А. Анализ непараметрических алгоритмов распознавания образов в условиях пропуска данных // Автометрия. 2008. № 3. С. 65-74.
5. Лапко А. В., Лапко В. А. Непараметрические алгоритмы распознавания образов в задаче проверки статистической гипотезы о тождественности двух законов распределения случайных величин // Автометрия. 2010. № 6. С. 47-53.
6. Лапко А. В., Лапко В. А. Асимптотические свойства многомерной непараметрической оценки уравнения разделяющей поверхности в двуальтернативной задаче распознавания образов // Системы управления и информационные технологии. 2010. 1 (39). С. 16-19.
7. Lapko A. V., Lapko V. A. Nonparametric Algorithms of Pattern Recognition in the Problem of Testing a Statistical Hypothesis on Identity of Two Distribution Laws of Random Variables // Optoelectronics, Instrumentation and Data Processing. 2010. Vol. 46, № 6. P. 545-550.
8. Parzen E. On estimation of a probability density function and mode // Ann. Math. Statistic. 1962. Vol. 33. P. 1065-1076.
9. Епанечников В. А. Непараметрическая оценка многомерной плотности вероятности // Теория вероятности и ее применения. 1969. Т.14, № 1. С. 156-161.
© Лапко А. В., Лапко В. А., Юронен Е. А., 2017