Научная статья на тему 'Метод классификации изображений на основе кластеризации сложных объектов'

Метод классификации изображений на основе кластеризации сложных объектов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
375
42
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОИСК ИЗОБРАЖЕНИЙ / КЛАССИФИКАЦИЯ ИЗОБРАЖЕНИЙ / АППРОКСИМАЦИЯ ФУНКЦИЙ / КОМПЬЮТЕРНОЕ ЗРЕНИЕ / SEARCH FOR IMAGES / CLASSIFYING IMAGES / APPROXIMATION OF FUNCTIONS / COMPUTER VISION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Корсунов Н.И., Торопчин Д.А.

В данной статье рассматривается метод классификации изображений на основе кластеризации сложных объектов, при помощи аппроксимации функций.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

This article deals with the method of classifying images based on clustering of complex objects, using the approximation of functions.

Текст научной работы на тему «Метод классификации изображений на основе кластеризации сложных объектов»

УДК 004.8

МЕТОД КЛАССИФИКАЦИИ ИЗОБРАЖЕНИЙ НА ОСНОВЕ КЛАСТЕРИЗАЦИИ

СЛОЖНЫХ ОБЪЕКТОВ

METHOD OF CLASSIFYING IMAGES BASED ON COMPLEX OBJECTS

CLUSTERING

Корсунов Н.И., Торопчин Д.А. Korsunov N.I., Toropchin D.A.

Белгородский государственный национальный исследовательский университет, Россия, 308015, Белгород, ул. Победы, 85

Belgorod State National Research University, 85 Pobeda St, Belgorod, 308015, Russia e-mail: korsunov@int.bel.ru, 571227@bsu.edu.ru

Аннотация. В данной статье рассматривается метод классификации изображений на основе кластеризации сложных объектов, при помощи аппроксимации функций.

Resume. This article deals with the method of classifying images based on clustering of complex objects, using the approximation of functions.

Ключевые слова: Поиск изображений, классификация изображений, аппроксимация функций, компьютерное зрение.

Keywords: search for images, classifying images, approximation of functions, computer vision

Повышенный интерес научных исследователей в сфере компьютерного зрения к анализу оцифрованных изображений делает все более актуальной проблему выделения областей изображений. В общем виде данная проблема представляет собой задачу кластеризации - распределения пикселей изображений на несколько групп. Полученные группы обычно представляет собой объекты (некоторые области) изображений. Решение такой задачи актуально как при поиске изображений в электронных коллекциях так и при анализе визуальной информации (к примеру, при медицинской диагностике), а так же составлению панорам [Бабаринов С.Л., Щепилова Д.В., 2016].

Все методы кластеризации изображений можно условно разделить на две группы: статистические методы кластеризации и методы кластеризации, основанные на выделении перепадов яркости.

В общем понятие кластеризации можно разделить на три составляющие:

1. Понимание данных путём выявления кластерной структуры. Разбиение выборки на группы схожих объектов позволяет упростить дальнейшую обработку данных и принятия решений, применяя к каждому кластеру свой метод анализа (стратегия «разделяй и властвуй»).

2. Сжатие данных. Если исходная выборка избыточно большая, то можно сократить её, оставив по одному наиболее типичному представителю от каждого кластера.

3. Обнаружение новизны. Выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров.

В первом случае число кластеров стараются сделать поменьше. Во втором случае важнее обеспечить высокую степень сходства объектов внутри каждого кластера, а кластеров может быть сколько угодно. В третьем случае наибольший интерес представляют отдельные объекты, не вписывающиеся ни в один из кластеров. Во всех этих случаях может применяться иерархическая кластеризация, когда крупные кластеры дробятся на более мелкие, те в свою очередь дробятся ещё мельче, и т. д. Такие задачи называются задачами таксономии [Васильев В.И., 1989]. Результатом таксономии является древообразная иерархическая структура. При этом каждый объект характеризуется перечислением всех кластеров, которым он принадлежит, обычно от крупного к мелкому. Классическим примером таксономии на основе сходства является биноминальная номенклатура живых существ, предложенная Карлом Линнеем в середине XVIII века. Аналогичные систематизации строятся во многих областях знания, чтобы упорядочить информацию о большом количестве объектов.

В процессе фотосъемки концентрируется свет, рассеянный объектами в сцене, и создается двухмерное изображение на плоскости изображения. При получении фотоснимков удаленных объектов, изображение характеризуется очень большой сценой и весьма малой плоскостью изображения. При обработке изображений решаются задачи сглаживания и обнаружения краев. Обнаружение краев позволяет повысить уровень абстракции и перейти от перегруженного подробностями (мультимегабайтового) изображения к более компактному, абстрактному изображению. Изображение характеризуется сосредоточенными неоднородностями:

• по глубине;

• по ориентации двух поверхностей;

• по коэффициенту отражения;

• по освещенности.

А так как результаты операции обнаружения краев относятся только к данному конкретному изображению, то в них отсутствуют данные, позволяющие распознать эти различные типы сосредоточенных особенностей в сцене. Поскольку края соответствуют тем участкам изображения, где яркость подвергается резким изменением, то находят такие места и обнаруженные края используют для распознавания объектов.

Существует два подхода распознавания объектов:

• распознавание с учетом яркости;

• распознавание с учетом характеристик.

В первом подходе, непосредственно используется значение яркости пикселей, а во втором с учетом характеристик, таких как участи и края, предусматривается применение данных о пространственном расположении извлеченных из изображения характеристик.

Одним из недостатков метода распознавания с учетом яркости, в котором в качестве векторов характеристик используется необработанные данные о пикселях, является большая избыточность.

В методе распознавания с учетом характеристик, по сравнению с методом распознавания с учетом яркости, уменьшается объем данных, так как количество краев намного меньше количества пикселей изображения, а при обеспечении инвариантности освещенности, края обнаруживаются приблизительно в одних и тех же местах, независимо от точной конфигурации освещенностей.

Метод обнаружения на основе характеристик поставляемых одномерными и двумерными массивами, используется в классификации объектов с помощью самоорганизующихся карт признаков, которые обеспечивают отображение входной информации и хранят отношение существа входных элементов. Основным недостатком нейронных сетей Кохонена является - использование коллекции характеристик, в то время как мозг выделяет целый ряд визуальных групп, которые специализируется с частями объекта.

Так как в методах с учетом характеристик, признаки определяются методом нахождения частей объектов на плоскости (х, у), для повышения эффективности классификация объектов предлагается выделять атрибуты, характерных признаков для отдельных частей объекта. Это обусловлено тем, что в одной части объекта эти атрибуты меняются незначительно, а при переходе через границу от одной части объекта в другой происходит существенное изменение одного или другого из этих атрибутов. В этом случае использование самоорганизующихся карт Кохонена не позволяет классифицировать образ, так как для классификации необходимо не только признаки того или иного атрибута на плоскости но их место в топологической структуре объекта.

Так как количество характерных признаков для частей объекта ограничено, то ждя решения задачи классификации предлагается использовать разбиение области существования изображения на символы, которые в основе разбиваются на поля задающие характеристические функции [Сосулин Ю.Г., Фам Чунг Зунг., 2003].

В отличие от известных методов распознавания образов, задающих сегмент значением единица при наличии в нём следа изображения, предлагается задействовать сегмент характеристическими (базовыми) функциями.

Характеристические (базовые) функции, определяемые в любом из полей разбиения произвольного сегмента, задаются двумерным массивом индексируемым дискретными координатами х^ у на плоскости, которые представляются целыми числами У, Э Такой массив приведен в таблице, задание характеристических функций ау = {0,1}.

Геометрическая иллюстрация разбиения области существования изображения и разбиение сегментов на полях приведена на рисунке 1. Сегментам разбиения изображения объекта на плоскости соответствует Si. Разбиение Sk сегмента на поля соответствует двоичному вектору представлений одной из допустимых (эталонных) функций изображения части объекта в сегменте Sk, которая задается элементами ау.

Так как в поле сегмента должно отображаться всё множество допустимых функций ау, задаваемых вектором Xj, то автомат должен из состояния аj под действием входного сигнала Xi переходить в любое допустимое состояние, что означает представление в сегменте части изображения объекта любой из допустимых функций [М.И. Маркин, 2004].

Таблица Table

Задание характеристических функций Setting characteristic functions A time hash calculation

a11 a12 a1j a1n

a11 a22 a2j a2n

ai1 ai2 aij ain

an1 an2 anj ann

Таким же автоматом записывается любой из сегментов разбиения объекта. постоянное изображение объекта соответствует объединению характеристических функций fSi задающих части сегментных изображений объекта. А так как сегменты строго упорядочены, то последовательность fSi, определяет обрез при классификации изображений объекта.

При линейном представлении множество сегментов последовательности функции fSi представление частей изображения задает т-тый класс обреза, другая последовательность этих функций определяет другой класс. Число классов определяется количеством эталонных изображений.

Произвольное изображение объекта может быть отнесено к тому или иному классу в соответствии с используемой метрикой близости.

Формирование изображения предполагает обучение, как с учителем, так и без него. Обучение с учителем необходимо при формировании таблицы переходов автомата, когда каждому входному вектору Xi ставится в соответствие состояние перехода, задающее соответствующую функцию, так как эти функции определяются априори. Эталонных изображений объектов, формируемых из характеристических функций, отображённых во всех полях полного множества сегментов.

При формировании изображений эталонных объектов, если таких нет, используются несколько из распознанных, обучение ведется без учителя. Когда в соответствие входным векторам ставятся в соответствие каждом сегменте допустимые (эталонные) функции, а их последовательность задает номер соответствующего класса.

Номера классов упорядочиваются по мере представления входных изображений. Изображения, не вошедшие в состав эталонных относят к соответствующему классу, используя заданную меру близости. В случае невозможности отнесения изображения к существующим классам формируются дополнительный класс. Это связано с тем, что все последовательности функций fSi относящиеся к эталонным достаточным для классификации либо не все допустимые пункция вошли в таблицу 1. Предлагаемый метод распознавания изображения состоит в следующем. Формирование классов эталонных изображений

1. По частоте появления пикселей определяют края в изображении объектов используя метод характеристик. Для этого область существования объекта разбивают на конечное множество квадратов, называемых сегментами. Одни из этих сегментов содержат след изображения, другие нет. Как и в известных методах распознавания образов, нейронными сетями квадратам присваиваются номера, и полученные объекты представляются двумерными массивами.

2. Так как квадрат содержит множество пикселей, то задавая базисные функции, определяют, какой из них аппроксимируется распределением пикселей в соответствующем сегменте. Для этого сегменты разбиваются на поля, описываемые двумерными массивами, и пользуюсь базисными функциями, по наименьшему отклонению определяют лучшую из совокупности базисных функций [Хайкин, Саймон,]

3. Квадраты не содержащие изображения являются пустыми, как и содержащиеся в них

поля.

4. Линейные последовательности базисных функций с учетом пустых функций определяются топологией сегментов.

5. Задают меру сходства изображений.

6. Формируют распределение распознаваемого изображения в сегменте его существования.

7. Определяют базисные функции, которые в соответствующих полях описывают распознавание изображений.

8. Формируют линейный массив из базисных и пустых функции.

9. Пользуюсь параметром сходства, относят массив к одному из фиксированных классов или образуют новый класс.

В качестве параметра сходства может быть использовано аффинное преобразование базисных функций. В качестве базисных функций наиболее просто использовать прямые линии с различной топологией представления на плоскости.

Резюме. Таким образом введение кластеризации и аппроксимации функций, позволяет классифицировать изображения.

Список литературы References

Бабаринов С.Л., Щепилова Д.В., 2016. Современные направления в области панорамной съемки. Научные ведомости БелГУ. Сер. Экономика. Информатика. 9(230): 180-187

Babarinov S.L., Shchepilova D.V., 2016. Sovremennye napravleniya v oblasti panoramnoj s"emki. Nauchnye vedomosti BelGU. Ekonomika. Informatika. [Current trends in panorama shooting. Belgorod State University Scientific Bulletin. Economics Information technologies]. 9(230): 180-187

Васильев В.И., 1989. Проблема обучения распознаванию образов. Принципы, алгоритмы, реализация. Киев, "Выща школа": 64.

Vasilyev V. I., 1989. Problema obucheniya raspoznavaniyu obrazov. Principy, algoritmy, realizaciya. Kiev, "Vyshcha shkola" [The problem of learning pattern recognition. The principles, algorithms, implementation. Kiev, "Vyshcha School"]: 64.

Сосулин Ю.Г., Фам Чунг Зунг. 2003. Нейросетевое распознавание двумерных изображений Радиотехника и электроника. т. 48, 8: 969-978.

Sosulin Y.G., Pham Chung Zung. 2003. Nejrosetevoe raspoznavanie dvumernyh izobrazhenij Radiotekhnika i ehlektronika [Neural network recognition of two-dimensional images Radio Engineering Technology and Electronics], T. 48, 8: 969-978.

Маркин М.И. 2003. Синтез нейроаппроксиматоров с неоднородной архитектурой: материал технической информации. Программирование, 4:53-65.

Markin M.I. 2003., Sintez nejroapproksimatorov s neodnorodnoj arhitekturoj: material tekhnicheskoj in-formacii. Programmirovanie [Synthesis neyroapproksimatorov with inhomogeneous architecture: the material of technical information. Programming] 4: 53-65.

Хайкин, Саймон, 2006. Нейронные сети: полный курс, 2-е издание: Пер. с англ. М., издательский дом«Вильямс»: 1104 - Парал.тит.англ.

Haykin, Simon, 2006. Nejronnye seti: polnyj kurs, 2-e izdanie: Per. s angl. M.: izdatel'skij dom«Vil'yams» [Neural networks: a complete course, 2nd edition. Translated from English. Moscow. Publishing House "Williams"]: 1104

i Надоели баннеры? Вы всегда можете отключить рекламу.