Научная статья на тему 'Применение метода опорной гиперплоскости для кластеризации полутоновых изображений'

Применение метода опорной гиперплоскости для кластеризации полутоновых изображений Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
133
27
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КЛАСТЕРИЗАЦИЯ ИЗОБРАЖЕНИЙ / КРИТЕРИИ ТОЧЕК / АЛГОРИТМИЧЕСКИЕ МЕТОДЫ КЛАСТЕРНОГО АНАЛИЗА / КЛАССИЧЕСКИЕ МЕТОДЫ КЛАСТЕРИЗАЦИИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нигомаев Дмитрий Анатольевич, Калайда Владимир Тимофеевич

Рассмотрен разработанный алгоритм кластеризации изображений методом опорной гиперплоскости с использованием вспомогательных задач вычисления формы изображения и метода моментов для представления изображения вектором вещественных чисел. Алгоритм протестирован на реальных наборах фотографий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BEARING HYPERFLATNESS METHOD'S USE FOR HALF-TINT IMAGES' CLUSTERISATION

The developed algorithm of images' clusterisation by means of bearing hyperflatness method is being reviewed, with attendant tasks of image s form count and moments' method for representing an image with a vector of real numbers. Algorithm has been tested on real sets of human fotographs.

Текст научной работы на тему «Применение метода опорной гиперплоскости для кластеризации полутоновых изображений»

УДК 004.93'14

ПРИМЕНЕНИЕ МЕТОДА ОПОРНОЙ ГИПЕРПЛОСКОСТИ ДЛЯ КЛАСТЕРИЗАЦИИ

ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ

Д.А. Нигомаев, В.Т. Калайда

Рассмотрен разработанный алгоритм кластеризации изображений методом опорной гиперплоскости с использованием вспомогательных задач вычисления формы изображения и метода моментов для представления изображения вектором вещественных чисел. Алгоритм протестирован на реальных наборах фотографий.

Процесс идентификации изображений в настоящее время является одной из трудно решаемых проблем анализа изображений. Для облегчения и упрощения решения задачи распознавания образов используется вспомогательная задача кластеризации изображений. Под кластеризацией принято понимать выделение групп близких друг к другу по какому-либо критерию точек. В данной задаче такими группами будут близкие по виду изображения.

Очевидным решением является разделение при помощи нахождения разности двух изображений. Однако тут возникают проблемы, связанные как с чисто технической стороной (различные условия снятия изображения), так и с «человеческим фактором» (изменение позы в разных съемках, изменение внешности - прическа, борода и т.д., изменение расстояния до камеры и т.п.). Поэтому необходимо найти методы, которые позволили бы решать эти проблемы или

снижать их значимость.

В случае задачи кластеризации существуют алгоритмические методы кластерного анализа, которые были исходно развиты для интерпретации многомерных экспериментальных данных, однако они нашли применение и при анализе объектов на плоскости. Чаще всего используются различные методы объединения «ближайших соседей» в смысле расстояния, а также методы, основанные на минимизации сумм внутрикластерных расстояний с одновременной максимизацией суммы межкластерных расстояний [1].

Поставленная задача заключается в том, чтобы распознать в течение разумного промежутка времени пришедший в систему образ - изображение человека, т.е. определить, кому именно принадлежит данное изображение. Такое распознавание может применяться в дальнейшем с различными целями.

Однако изображения представляют собой двумерные объекты, к которым без предварительного преобразования классические методы кластеризации не применимы. Следовательно, необходимы такие преобразования, которые бы позволили, во-первых, привести изображения к единым условиям регистрации, а во-вторых, однозначно поставить в соответствие изображению некоторый набор чисел, интерпретируемый в качестве многомерного вектора, и применять методы кластеризации уже к этим векторам.

Доклады ТУСУРа. 2003 г. Автоматизированные системы обработки информации, управления и проектирования Выделение формы изображения

Очевидно, что невозможно с точностью повторить условия регистрации какого-либо образа. Помимо технической стороны (освещенность, фон и т.д.) есть еще и чисто человеческий фактор - человек не способен принять позу, абсолютно повторяющую уже зарегистрированную. Для того чтобы можно было осуществлять сравнение изображений, необходимо привести их к одинаковым условиям регистрации. В том числе необходимо решить проблему изменения позы человека при съемке. С этой целью применяется вычисление формы изображения.

Формой изображения называется максимальный инвариант класса преобразований, который определяет все то, что относится к данной сцене, и не зависит от условий формирования изображений [2, 3]. Отличия формы одного изображения от формы другого характеризуют свойства сцены, не связанные с условиями регистрации, и могут отражать изменения в содержании изображаемого. В этой ситуации различная природа устройств формирования изображения или изменившиеся условия освещения и т.п. могут моделироваться путем всевозможных преобразований яркости исходного изображения.

Для представления формы изображения принята аппроксимация

п /=1

где с, - интенсивности элементов формы:

у (х Я' 4 _ индикаторные функции, причем множества элементов формы

изображения Л1,А2,А3...,А11 не пересекаются [4, 5].

Можно рассмотреть изображение однородного поля зрения. Форму такого изображения естественно считать более простой. При таком соглашении форма любого изображения /', полученного с помощью преобразования яркостей ^(/'е ^ = не сложнее, чем форма /, и мы будем отмечать этот факт, записывая /'< /. Про такие изображения будем говорить также, что они сравнимы по форме с/. Изображения /'и/ назовем эквивалентными по форме, если /'< ( и р> / . Факт эквивалентности изображений будем отмечать как /'- /.

Форма изображения / состоит из изображений /'</, которые сравнимы по форме с /', но необязательно сравнимы по форме между собой. Что касается других свойств множества , определяющего модель формирования яркости изображений, то в большинстве случаев его можно считать выпуклым. Выпуклость и замкнутость Г гарантирует для наблюдаемого изображения я существование оператора проецирования Р{ на который определяется с помощью решения следующей задачи наилучшего приближения:

п

Изображение Р^ является самым лучшим приближением изображения g изображениями, форма которых не сложнее, чем форма /, соответственно изображение g~Pfg представляет все то, что отличает g по форме от /.

Таким образом, алгоритм вычисления формы изображения сводится к нахождению внутри контура анализируемого изображения участков (необязательно непрерывных) одинаковой интенсивности с =—-— \/(х,у)(Ь<\у , где ц(Д-) - площадь индикаторной функции Д (изображений одинаковой интенсивности), и запоминании координат этих участков.

Эта форма изображения будет являться эталонной для изображений-претендентов (т. е. тех изображений, которые будут сравниваться с эталонным). Контур эталона наносится на изображение-претендент. Индикаторные функции выбранного эталона являются областями, внутри которых происходит усреднение изображения по его форме. При этом незначительные отличия претендента от эталона нивелируются за счет этого усреднения.

Естественно, что средний фон эталона и претендента будут отличаться. Поэтому для объективного распознавания оба изображения приводятся к единому среднему фону.

К полученной новой форме претендента применяется моментный анализ и по численным характеристикам значений моментов эталона и претендента [6] принимается решение о принадлежности объекта к данному классу изображений.

Представление изображения с помощью метода моментов

Вычисление формы изображения позволяет унифицировать условия его регистрации. Однако этого еще недостаточно для четкого и однозначного распознавания. С этой целью можно применить алгоритмы кластеризации, но для их применения изображения должны быть адекватно описаны определенным набором признаков. В основу численного описания изображения положен один из вариантов метода анализа сцены изображения - моментный метод [7]. Удобной и надежной системой признаков для изображений по их геометрическим характеристикам служат моменты инерции различных порядков:

начальные моменты

= \\Яхчу)хау*йхйу (а,р = 0,1,...) (1)

и центральные моменты

Иор=Я/(х,у)(х-хс)а(у-у^6хйу (а,р = 0,1,...), (2)

со

где хс,ус - координаты центра масс, определяемые выражениями = т10/т00, Ус = тох /^оо ■

В выражениях (1), (2) /(х,у)- функция двух измерений, представляющая изображение в качестве случайной величины. Эту функцию можно определить по-разному, но для рассматри-

ваемой задачи наиболее эффективным является представление в виде интенсивности пикселя черно-белого изображения в точке (х, у).

Использование моментов в качестве признаков базируется на следующей фундаментальной теореме [5]: «Бесконечная последовательность моментов изображения {л?аР} или {цар}

однозначно определяется функцией /{х,у) и, наоборот, функция /(х, у) однозначно определяется последовательностью моментов изображения {та(3} или (а,Р = ОД,.,.) ».

Следовательно, вычислив некоторые моменты изображения, можно с достаточной вероятностью его опознать. Какие моменты при этом использовать и с какой точностью необходимо их вычислять, как правило, определяется экспериментально.

Для исследуемых типов изображений целесообразно использовать центральные моменты второго порядка относительно осей х,у

X «

и смешанный момент относительно центра масс \хи = §/{х,у)(х-хс)(у-ус)йх&у , которые

сг.

характеризуют степень концентрации изображения около оси х, оси у и центра масс соответственно.

Отметим, что в теории вероятностей для характеристики рассеяния случайной величины

2 ~>

применяются понятия среднеквадратичного отклонения аЛ.и дисперсии а;, <5у, причем

величины а], ст2 по своему смыслу идентичны моментам инерции ц02 и р.20 соответственно.

Моменты второго порядка описывают эллипс или параболу. Парабола не может описывать изображение в силу своей разомкнутости, следовательно, изображение заменяется эллипсом, который имеет центр в центре тяжести изображения.

Таким образом, изображение характеризуется тремя параметрами: а , Ъ , ср - размерами

большой и малой полуосей и углом наклона эллипса.

Использование моментов более высоких порядков позволяет получить более подробную информацию об изображении. Моменты третьего порядка соответствуют асимметрии изображения по каждой координате

М-з.о ЛС 3

аБх = — , ай - —• а3 о

Они характеризуют степень асимметрии кривой по сравнению с нормальным распределением. Знак коэффициентов указывает на левостороннюю или правостороннюю асимметрию.

Например-, если < 0, то это означает, что изображение более растянуто вдоль оси Ох слева от моды, чем справа и наоборот.

Моменты четвертого порядка - эксцесс, или смещение центра тяжести относительно геометрического центра эллипса:

М-4.0 _ И-0,4 (4)

ехх = 4 ,ех, - 4 • ^

а о

Эти характеристики принимаются за основу при кластеризации изображений. Таким образом, каждое изображение адекватно описывается девятимерным вектором. Обоснованием применимости такого представления является факт возможности разделения изображений как по отдельным параметрам описания изображения, так и по их совокупности. Легко вычисляемые параметры эллипсоида наряду с моментными характеристиками более высокого порядка (асимметрия, эксцесс и др.) являются достаточно надежными характеристиками изображения.

Построение опорной гиперплоскости

В настоящее время существует множество алгоритмов кластеризации [1], но все они имеют те или иные недостатки - одни используют не всю доступную информацию, другие недостаточно эффективны, время работы третьих слишком велико для условий поставленной задачи. Следовательно, необходим простой и быстрый алгоритм, который тем не менее позволяет осуществлять кластеризацию, равнозначную отнесению текущего изображения к какой-либо группе из уже имеющихся, с приемлемым качеством, подразумевающим минимально возможную ошибку кластеризации.

В качестве решающего правила для распознавания было принято решение использовать так называемую «опорную гиперплоскость», т.е. плоскость в и-мерном пространстве векторов, соответствующих изображениям. Каждый вектор является набором вещественных чисел, имеющих смысл моментов изображения, вычисленных по формулам (1)-(4). Термин «опорная» применяется исходя из методики ее построения. Применение опорной гиперплоскости в пространстве признаков в качестве решающего правила кластеризации объясняется следующим: для построения плоскости необходимо найти определяющие ее коэффициенты. В предложенном методе эта задача решается просто, быстро и с незначительными затратами памяти, а быстрота и трудоемкость получения решающего правила играют немаловажную роль в оценке качества алгоритма кластеризации. Еще одной характеристикой решающего правила является степень правильности кластеризации с его использованием, выражаемая в виде вероятности

неправильного отнесения точки к кластеру.

Поскольку для построения гиперплоскости необходима обучающая выборка в виде набора точек, о которых известна принадлежность к определенному классу (группа изображений одного

человека), т.е. метод использует обучение «с учителем», то еще одним параметром алгоритма является чувствительность к так называемым «выбросам», в данном случае - изменение качества решающего правила в случае включения в обучающую выборку точки, лежащей достаточно

«далеко» по совокупности координат от общей группы точек.

Основанием принятия данной методики является гипотеза, что суммы квадратов уклонений точек классов, отличных от опорного, будут сильно отличаться от суммы квадратов уклонений точек опорного класса.

Методика построения гиперплоскости такова: выбирается какой-либо опорный класс, соответствующий группе изображений одного человека, и гиперплоскость строится по точкам этого класса. Уравнение плоскости имеет следующий вид:

|>,+А=о, (5)

¡=0

где х, - компоненты вектора;

Д - коэффициенты плоскости, изначально неизвестные.

Для нахождения коэффициентов Д можно решить систему линейных уравнений, подставив значения компонентов векторов. Однако для решения такой системы необходим набор векторов общим числом, равным размерности пространства. Если векторов будет меньше, то система получится недоопределенной и, следовательно, будет иметь бесконечное множество решений. Если векторов будет больше, то система будет переопределена, т.е. иметь избыточные данные. Обе ситуации вполне реальны в описываемой задаче. Поэтому был предложен иной

метод построения опорной гиперплоскости.

Преобразуем уравнение (5) с целью выразить один из компонентов вектора через другие

компоненты и коэффициенты плоскости:

V п (6)

1*2

ИЛИ

п-1

*2

(7)

(=0, 1*2

А

где а, = —

А-,

Здесь выбран третий компонент вектора, имеющий смысл большой полуоси, величины.

индивидуальной для каждого образа.

Выражение (6) представляет собой уклонение, которое в идеальном случае, т.е. когда точка * лежит на плоскости, равно нулю. Если же точки образуют некоторую группу, через которую нельзя провести плоскость, содержащую их все, то можно, по крайней мере, минимизировать расстояния от точек до плоскости или, что равнозначно, минимизировать уклонения точек от

плоскости. Формула (7) в данном случае представляет собой метод вычисления одной из координат точки, являющейся проекцией реальной точки на оптимальную опорную гиперплоскость.

Имея в наличии -V векторов, можно применить метод наименьших квадратов для минимизации отклонений реальных значений х2 от вычисленных по формуле (7):

./=1 I

V '"2 J

Дифференцируя F{x,a) по неизвестным коэффициентам ах. получаем СЛАУ в виде

— = 2У

дак /=1

Г ( \

п-1 ;=0,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

J

х!

= 0, £ = 0,...,и-1; кФ 2. (8)

Решая систему (8), получаем значения ак.

Так как фактически функция F{x,a) представляет собой дисперсию случайной величины

£ _ J, -ап, то, подставив значения коэффициентов ак в выражение у F(x,a) , полу-

/ = 0.

чим величину доверительного интервала. Эту величину можно применить для классификации нового образа.

ЛИТЕРАТУРА

1. Дыбин B.C., Елизаров А.И., Калайда В.Т. Применение дисперсионного анализа и методов таксономии для кластеризации полутоновых изображений // Доклады Томского гос. ун-та систем управления и радиоэлектроники. Т.6. Автоматизированные системы обработки информации, управления и проектирования. - Томск. : Том. гос. ун-т систем управления и радиоэлектроники, 2001. - С. 170-176.

2. Пытьев Ю.П. Задачи морфологического анализа изображений // Математические методы исследования природных ресурсов Земли из космоса / Под ред. В. Г. Золотухина. - М: Наука, 1984. - С. 41-83.

3. Пытьев Ю.П. Морфологический анализ изображений II Докл. АН СССР. - 1983. - Т. 269.

- № 5. - С.1061-1064.

4. Загоруйко Н.Г. Методы распознавания и их применение. - М.: Сов. радио, 1972.

5. Загоруйко Н.Г. Гипотезы компактности и l-компакгности в методах анализа данных // Сибирский журнал индустриальной математики / Изд-во ИМ СО РАН. - 1998. - Т. 1. - № 1.

6. Kalaida V.T., Belov V.V., Esipova V.A., Klimkin V.M. Physical and Mathematical Methods for the Visualization and Identification of Watermarks II Solanus. Published by the School of Slavonic and East European Studies (University of London). Typeset in Plantin and Times Cyrillic at Oxford University Computing Service. - № 13. - Pp. 80 - 92.

7. Андерсон T.B. Введение в многомерный статистический анализ: Пер. с англ. - М.: Физ-

матгиз, 1963.

i Надоели баннеры? Вы всегда можете отключить рекламу.