Краткие сообщения
УДК 519.814:004.93'11
А.А. Поцыкайло
ИСПОЛЬЗОВАНИЕ МЕТОДА К-БЛИЖАЙШИХ СОСЕДЕЙ ПРИ РАСПОЗНАВАНИИ ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ
Рассматривается метод ^ближайших соседей, относящийся к непараметрическим . -сов, также приведен пример обобщения на большее количество классов. Перечислены основные достоинства и недостатки, предложен оптимальный размер области голосования для частного случая.
Метод ^ближайших соседей; область голосования;решающее правило.
A.A. Potsykaylo
METHOD USE TO THE K-NEAREST NEIGHBORS AT RECOGNITION OF HALF-TONE PICTURES
The method of the k-nearest neighbors which is referring to nonparametric methods of recognition is observed. Procedure of construction of a decision rule for two classes is described, the generalisation example for bigger quantity of classes also is resulted. The basic merits and demerits are listed, the optimum size of voting area for a special case is offered.
The method of the k-nearest neighbors; voting area; decision rule.
Задачу распознавания с использованием методов, основанных на статистических решениях можно условно разделить на два класса: параметрический и непараметрический. В первом случае имеется в распоряжении априорная информация о видах распределения распознаваемых объектов, которая и используется в ре.
вовсе. К классу непараметрических методов можно отнести метод k-ближайших , -ятности с целью ее дальнейшего использования для построения оптимальных решающих правил [1, 2, 3].
Оценку функции плотности вероятности получают, используя выборку, со-
N , r X k- X
объекта (k-ближайшего соседа). Для определения «близости» можно воспользоваться любой подходящей метрикой. Тогда в качестве оценки плотности вероятности в точке X можно принять [3]:
k -1______1_
N A(k, N, X )
где A{k,N,X) - объем множества всех точек, расстояния которых до X меньше,
r . , -
r ,
Краткие сообщения
г% п „.п!2
А{к-ы-х)--2гт- (2)
Величина А является случайной величиной, зависящей от выбранного множества N объе ктов.
Оценка (1) может использоваться при распознавании следующим образом. Когда требуется распознать неизвестный объект X, среди имеющихся N объе ктов, из которых N1 объектов принадлежит классу о, а N2 объектов - классу 0)2, находят к ближайших к точке X объе ктов.
Пусть к-1 и ¿2 - соответственно числа объектов из класса о и ®2 среди этих к-ближайших соседей. Тогда оценка (1) принимает вид
щ (х/о> ) = ^ • А ’ 1 = 1,2. (3)
Так как ¿1 и ¿2 числа объектов извлечены из одного и того же гипершара, то объем А - один и тот же как для класса о, так и Для класса 02 . Следователь, , -,
{N1/N2 )(Х/01) {N1/N2 )р{х/02) X е |0 , (4)
[°2
или, подставляя (2) в (3), получим
¿>•>¿2 ^ X е -{ 1 . (5)
К
Таким образом, решение о принадлежности объекта X к тому или другому
к-
сравнения ¿1 и ¿2 .
Данное решающее правило легко обобщается для задачи распознавания . , , -рок к-ближайших к точке X точек. Пусть ^,¿2,---ЛМ - число наблюдений из «0,®2,---,оМ соответственно. Наблюдение Xотносится к тому классу I, из которо-к- , класса, 7 Ф I (7 = 1, 2,...,М ). Решающее правило для распознавания М совокупностей имеет вид [3]:
¿1 = тах{ ,¿2,---Лм X е а>1. (6)
к- -
ния плотностей вероятности и является достаточно простой. Недостатком данного метода классификации является необходимость хранить в оперативной памяти компьютера все объекты и сравнивать каждый из них с неизвестным объектом. В общем случае непараметрические методы распознавания требуют большего объема вычислений при классификации новых наблюдений, чем параметрические методы при наличии обучения. В настоящее время это не является принципиальным ограничением в силу доступности по цене достаточно производительных персо-.
к- -
дей требует оптимального выбора области поиска ближайших соседей. При распознавании полутоновых изображений неизбежно пересечение областей, характеризующих эти объекты в признаковом пространстве. При выборе достаточно боль-
шой или маленькой так называемой области голосования вероятность правильного распознавания падает. Это связано с тем, что предъявляемый объект зачастую находится в области пересечения соседних классов или какой-то из классов пересекается со всеми классами попарно. В ходе проведения эксперимента при распознавании фотографий автомобилей разных марок под фиксированным ракурсом, имеющих достаточно схожий внешний облик, было установлено, что оптимальным размером области голосования является половина минимального радиуса среди всех классов. В качестве признаков были использованы вторые смешанные моменты распознаваемых классов.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Дуда Р., Харт П. Распознавание образов и анализ сцен. - М.: Мир, 1976. - 511 с.
2. Ту Дж., Гонсалес Р. Принципы распознавания образов. - М.: Мир, 1978. - 411 с.
3. Фукунага К. Введение в статистическую теорию распознавания образов. - М.: Наука, 1979. - 367 с.
Статью рекомендовал к опубликованию д.т.н., профессор Е.А. Башков. Поцыкайло Александр Анатольевич
Технологический институт федерального государственного автономного образовательного учреждения высшего профессионального образования «Южный федеральный университет» в г. Таганроге.
E-mail: [email protected].
347928, г. Таганрог, пер. Некрасовский, 44.
Тел.: 88634371626.
Potsykaylo Alexandr Anatolievich
Taganrog Institute of Technology - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”.
E-mail: [email protected].
44, Nekrasovskiy, Taganrog, 347928, Russia.
Phone: +78634371626.