Многомерная математическая модель и геометрический метод
классификации объектов
Р.Р. Агафонова, И.М. Габдуллин, А.В. Мингалев АО «НПО ГИПО»
Аннотация: Представлены математическая модель и геометрический метод классификации объектов по изображению, которые обеспечивают повышение точности классификации объектов за счет фильтрации шумовых объектов.
Ключевые слова: обработка изображений, распознавание объектов, распознавание образов, идентификация объектов, классификация.
В настоящее время цифровая обработка изображений применяется во всех областях науки и техники, в том числе, в тепловидении [1-3]. Одной из актуальных задач при автоматизированной обработке изображений является распознавание и классификация объектов [4-6].
В данной статье описан разработанный авторами метод классификации объектов, основанный на предложенной математической модели, которая представляет собой M замкнутых областей, каждая из которых соответствует одному классу. Замкнутые области строятся в w-мерном пространстве признаков [7,8].
За счет замкнутости областей в решение задачи классификации введено новое понятие «оценка степени схожести», которое позволяет одновременно классифицировать и отфильтровывать объекты [9,10].
Особенностью разработанной математической модели является повышение точности классификации объектов за счет обеспечения фильтрации шумовых объектов. Такая фильтрация достигается тем, что математическая модель содержит (N+1) классов, из которых N - количество предварительно заданных классов, для которых представлена обучающая выборка, а для (N+1) -ого класса не может быть представлена обучающая выборка, так как к этому классу относится «шум».
Принадлежность к (N+1) -ому классу определяют в указанной модели посредством того, что исследуемый объект не принадлежит ни к одному из N предварительно заданных классов на основе оценки степени схожести по их физическим признакам.
Для работы с созданной математической моделью в «-мерном пространстве признаков осуществляется проверка попадания исследуемого объекта в один из классов или за пределы всех классов по его координатам в «-мерном пространстве признаков (вектор координат).
Метод построения границы каждого класса для предлагаемой математической модели состоит в следующем:
1. Строится выпуклая оболочка класса, которая состоит из точек ¿л = .....: = 1. г, где ^ - количество точек, образующих
выпуклую оболочку. Выпуклая оболочка класса строится методом Грэхема.
2. Определяется центральная точка класса (барицентр) С = .....Далее область, занимаемая классом в «-мерном
пространстве признаков, разделяется на Р секторов. Разделение на секторы
происходит за счет соединения центральной точки С с каждой точкой выпуклой оболочки.
3. После разделения на секторы, в каждом из них точки выпуклой оболочки преобразуют, исходя из плотности распределения обучающей выборки предварительно заданного класса, в точки расширенной выпуклой
оболочки класса = г = 1 где /''- количество точек,
образующих расширенную выпуклую оболочку класса, по формуле:
и
(1)
где р(С,Ь- евклидово расстояние от центральной точки С класса до точки Ь^ р{С,Ь- евклидово расстояние от центральной точки С класса до точки
Евклидово расстояние от центральной точки С класса до точки расширенной выпуклой оболочки класса определяют по формуле:
р(С,Ь1)=Н
р(с,Ь,г]
н
(2)
где Н - сумма евклидовых расстояний от центральной точки С класса до
соответствующих точек выпуклой границы, Н - сумма евклидовых
расстояний от центральной точки С класса до т соответствующих точек расширенной выпуклой границы, определяемая плотностью распределения объектов класса в секторе.
Сумму евклидовых расстояний Н от центральной точки С класса до точки Ь1 и соседней точки Ъ1_1 определяют по формуле:
н= у'Г.ь.;)-
(3)
где р(С,Ь^ - евклидово расстояние от центральной точки С до точки р(С,Ь1_1) - евклидово расстояние от центральной точки С до точки Ъг_±.
и
Сумму евклидовых расстояний Н от центральной точки С класса до точки и соседней точки определяемую плотностью распределения
объектов класса в секторе, вычисляют по формуле:
(4)
где Бк - количество точек в текущем секторе класса; к - количество секторов в классе; Т - общее количество точек в классе; - сумма евклидовых
расстояний от точки внутри сектора / = 1,5* до точки Ь1 и точки Ь1_1.
Сумму евклидовых расстояний кг от точки внутри сектора до точки
ЬI и точки определяют по формуле:
.
(5)
Для каждой точки расширенной выпуклой оболочки класса, входящей одновременно в два соседних сектора, вычисляют и усредняют между собой, соответственно, два комплекта координат, определяют расширенную выпуклую оболочку класса, соединяя точки Ьг .
4. Далее в каждом секторе в выпуклую оболочку класса добавляют
точки ^которые находятся на минимальном расстоянии от двух соседних
точек выпуклой оболочки, причем, их добавление в оболочку производят при условии, что другие точки не окажутся вне оболочки класса, при этом
= (х^х^,..., } = 1,£т, где (х±,х%, ...д®) - координаты точки в 77-мерном пространстве признаков; О - количество добавленных точек.
Формируют вогнутую по форме и минимальную по площади оболочку класса, соединяя точки Ь^ и точки щ, затем добавленные в выпуклую
оболочку класса точки а, преобразуют в точки
(.С .С .С
х^,х2},хп} ы = 1,£т , где (х^х^ — I хп) ~ координаты точки в 77-мерном пространстве признаков; О - количество добавленных точек Щ, по
формуле:
г а, = фЩ
1 1 Р&Л-!) ^ 1 1 *
га) - _ ¿Ы^й * (Гь1 _ ■ ~ ^ (6)
где рСЬ^Ь^О - евклидово расстояние между соседними точками выпуклой
оболочки и Ь|_±; рф^Ь^) - евклидово расстояние между соседними
точками расширенной выпуклой оболочки.
5. Далее формируют окончательную оболочку класса, соединяя точки
л
Ь[ и точки а,. Добавление в итоговую границу точек позволяет учитывать
форму распределения объектов класса в евклидовом пространстве.
Классификатор считают обученным и готовым к использованию, когда на основании математической модели и разработанного метода построены границы каждого класса.
Для использования классификатора исследуемый объект помещают в «-мерное пространство признаков. Координатами исследуемого объекта являются его характеристики. Далее осуществляют проверку попадания исследуемого объекта по его координатам в «-мерном пространстве
М Инженерный вестник Дона, №12 (2021) ivdon.ru/ru/magazine/arcliive/nl2y2021/7365
признаков в каждую из областей, определяемых границами N
предварительно заданных классов.
Такой подход к задаче классификации позволяет не только
распределить объекты на классы, но и повысить точность работы системы,
указав на объекты, не относящиеся ни к одному из интересующих классов.
Литература
1. Rifkin R., Aldebaro K. 2004. In Defense of One-Vs-All Classification. Journal of Machine Learning Research. №vol, 5: 101-141. URL: jmlr.org/papers/volume5/rifkin04a/rifkin04a.pdf.
2. Комарцова Л. Г., Максимов А. В. Нейрокомпьютеры: Учебное пособие для вузов. М.: Изд-во МГТУ им. Н.Э. Баумана, 2002. - 320 с.
3. Круглов В. В., Борисов В. В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия-Телеком, 2001. - С. 382.
4. Гонсалес Р., Вудс Р. «Цифровая обработка изображений». М.: Техносфера, 2005. - 1072 с.
5. Ясницкий Л.Н. Введение в искусственный интеллект: Учебное пособие для студ. высш. учебн. заведений. М.: Издательство «Академия», 2005. 176 с.
6. Shapiro M.J., Bonhab G.M. Cognitive processes and foreign policy decision-making. International Studies Quarterly. 1973. №17. pp.147-174.
7. Коротеев М.В. Обзор некоторых современных тенденций в технологии машинного обучения. // E-Management. 2018. №1. С. 26-35. URL: doi.org/10.26425/2658-3445-2018-1-26-35.
8. Гданский Н.И., Рысин М.Л., Крашенинников А.М. Линейная классификация объектов с использованием нормальных гиперплоскостей. // Инженерный вестник Дона, 2012, № 4. URL: ivdon.ru/magazine/archive/n4ply2012/1324/.
М Инженерный вестник Дона, №12 (2021) ivdon.ru/ru/magazine/arcliive/nl2y2021/7365
9. Гданский Н.И., Крашенников А.М. Бинарная кластеризация объектов в многомерных пространствах признаков // Труды Социологического конгресса. РГСУ, 2012. С. 94-989.
10.Крашнин А.М., Гданский Н.И. Рысин М.Л Построение сложных классификаторов для объектов в многомерных пространствах. // Инженерный вестник Дона, 2013, № 2. URL: ivdon.ru/magazine/archive/n2ply2013/1611/
References
1. . Rifkin R., Aldebaro K. Journal of Machine Learning Research. 2004. №5. pp. 101-141. URL: jmlr.org/papers/volume5/rifkin04a/rifkin04a.pdf
2. Komartsova L.G., Maksimov A.V. Neyrokompyutery: Uchebnoye posobie dlya vuzov [Neurocomputers: A textbook for universities]. Moskva, Izdatelstvo MGTU N.E. Baumana, 2002. p. 320.
3. Kruglov V.V., Borisov V.V. Iskusstvennye neyronnye seti. Teoriya i praktika [Artificial neural networks. Theory and practice]. Moskva, Goryachaya liniya-Telekom, 2001. p. 382.
4. Gonzalez R., Woods R. Tsifrovaya obrabotka izobrazenii [Digital image processing]. М.: Tecnosfera, 2005. p. 1072.
5. Yasnitsky L.N. Vvedenie v iskusstvenny intellekt: Uchebnoye posobie dlya studentiov vysshikh uchebnykh zavedeniy [Introduction to Artificial Intelligence: A textbook for students of higher educational institutions]. Moskva, Izdatel stvo "Akademiya", 2005. p. 176.
6. Shapiro M.J., Bonhab G.M. International Studies Quarterly. 1973. №17. p.147-174.
7. Koroteev M.V. E-Management. 2018. №1. pp. 26-35. URL: doi.org/10.26425/2658-3445-2018-1-26-35
8. Gdansky N.I., Rysin M.L., Krashennikov A.M. Inzhenerny vestnik Dona, 2012, № 4. URL: ivdon.ru/magazine/archive/n4ply2012/1324/.
9. Gdansky N.I., Krashennikov A.M. Trudy Sotsiologicheskogo kongressa. RSGU, 2012. pp. 94-98.
10.Krashennikov A.M., Gdansky N.I., Rysin M.L. Inzhenerny vestnik Dona, 2013, № 2. URL: ivdon.ru/magazine/archive/n2ply2013/1611/.