Научная статья на тему 'Минимизация размерности признакового пространства при распознавании полутоновых изображений со сложной текстурой'

Минимизация размерности признакового пространства при распознавании полутоновых изображений со сложной текстурой Текст научной статьи по специальности «Математика»

CC BY
214
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛУТОНОВЫЕ ИЗОБРАЖЕНИЯ СО СЛОЖНОЙ ТЕКСТУРОЙ / СТОХАСТИЧЕСКАЯ ГЕОМЕТРИЯ / ТРИПЛЕТНЫЙ ПРИЗНАК / МИНИМИЗАЦИЯ РАЗМЕРНОСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА / COMPLEX HALFTONE TEXTURE IMAGES / STOCHASTIC GEOMETRY / TRIPLE FEATURE / FEATURES SPACE DIMENSION REDUCTION

Аннотация научной статьи по математике, автор научной работы — Федотов Николай Гаврилович, Мокшанина Дарья Алексеевна

Рассмотрены два подхода к проблеме минимизации размерности признакового пространства. Приведены результаты апробации данных подходов. Выделен наиболее эффективный применительно к рассматриваемой проблеме подход.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Федотов Николай Гаврилович, Мокшанина Дарья Алексеевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Минимизация размерности признакового пространства при распознавании полутоновых изображений со сложной текстурой»

УДК 681.39; 007.001.362

Н. Г. Федотов, Д. А. Мокшанина МИНИМИЗАЦИЯ РАЗМЕРНОСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА ПРИ РАСПОЗНАВАНИИ ПОЛУТОНОВЫХ ИЗОБРАЖЕНИЙ СО СЛОЖНОЙ ТЕКСТУРОЙ1

Аннотация. Рассмотрены два подхода к проблеме минимизации размерности признакового пространства. Приведены результаты апробации данных подходов. Выделен наиболее эффективный применительно к рассматриваемой проблеме подход.

Ключевые слова: полутоновые изображения со сложной текстурой, стохастическая геометрия, триплетный признак, минимизация размерности признакового пространства.

Abstract. Examined are two approaches to feature space dimension minimization.

The approaches approbation results are presented. The most efficient approach is found for problem considered.

Keywords: complex halftone texture images, stochastic geometry, triple feature, features space dimension reduction.

Введение

В силу того что изображения со сложной текстурой содержат множество объектов, относящихся к различным видам, каждый из которых обладает своими собственными значимыми характеристиками, задача формирования признаков существенно усложняется.

Аппарат стохастической геометрии предлагает универсальный метод, позволяющий автоматически, без непосредственного участия эксперта, генерировать большое число признаков, являющихся математической абстрактной характеристикой изображения. Опора на большое количество признаков повышает надежность распознавания. Эффективность аппарата стохастической геометрии была подтверждена в работах [1, 2].

С позиции данного метода признаки изображений имеют структуру в виде композиции трех функционалов [1]:

n(F) = 0 ◦ P ◦ T (F П /(р, 0)), (1)

где р, 0 - нормальные координаты сканирующей прямой /(р, 0), с которыми связаны функционалы P и 0 соответственно; функционал T связан с параметром t, задающим точку на сканирующей прямой /(р, 0); Ffo у) - функция изображения на плоскости (х, у).

В связи с характерной структурой такие признаки были названы три-плетными. Функционал Т называют trace-функционалом, P - диаметральным функционалом, 0 - круговым функционалом. Функционалы T, P и 0 выбираются из различных областей математики: теории вероятности, математической статистики, теории рядов и фракталов, стохастической геометрии и т. д. Таким образом, триплетные признаки сохраняют следы генезиса соответствующих областей математики, чем объясняется гибкость и интеллектуаль-

1 Работа выполнена при финансовой поддержке РФФИ, проект № 09-07-00089.

ность алгоритмов распознавания, базирующихся на триплетных признаках. Данный подход позволяет получать признаки, не зависящие от движений изображения и линейных деформаций, т.е. от аффинных преобразований изображения. Кроме того, могут быть получены признаки, которые простым образом зависят от указанных преобразований. Триплетные признаки подробно описаны в [2].

Построение триплетного признака происходит следующим образом (рис. 1). Изображение закидывается всевозможными сканирующими прямыми, определяемыми своими нормальными координатами р и 0. На каждой прямой выделяются однородные по яркости отрезки, характеристикой которых является некоторое действительное число (например, длина отрезка). Множеству полученных характеристик отрезков данной прямой функционал Т ставит в соответствие действительное число. Таким образом, для всех возможных сканирующих прямых получим матрицу значений функционала Т, элемент Т(г, р7, 0) которой соответствует сканирующей прямой с 7-м значением параметра р и /-м значением параметра 0. Далее функционал Р множеству элементов столбца полученной матрицы ставит в соответствие действительное число. Таким образом, для всех столбцов матрицы получим вектор значений функционала Р. Функционал 0 множеству элементов полученного вектора ставит в соответствие некоторое действительное число, которое равно значению искомого признака.

——^(Р(р, 01),..., Р(р, 0И))—— 0(0) = П Рис. 1. Построение триплетного признака изображения

Исходная система признаков независимо от числа ее элементов, как правило, избыточна и включает признаки, не влияющие на классификацию или дублирующие друг друга. Вычислительная сложность получения значений большого числа признаков для каждого распознаваемого изображения, сложность построения решающей процедуры при таком числе признаков, а также неустойчивость результата, связанная с учетом значений неинформативных признаков, обусловливает целесообразность минимизации признакового пространства.

Минимизация признакового пространства заключается в определении минимального набора эффективных поисковых признаков. Для решения данной проблемы могут использоваться различные преобразования и разложе-

ния, например, преобразование Фурье, использование коэффициентов Кару-нена - Лоева, использование методов факторного анализа. В настоящей статье рассмотрены два подхода к проблеме минимизации признакового пространства: подход на основе методов кластеризации множеств и статистический подход. Наиболее эффективный из них применительно к рассматриваемой проблеме определен нами в ходе эксперимента.

1. Подход на основе методов кластеризации множеств

Согласно данному подходу множество признаков представляется в виде векторного пространства, в котором не все измерения в равной степени важны. Тогда задача минимизации сводится к сокращению размерности этого пространства.

Рассмотрим I изображений первого класса и т изображений второго класса. Пусть п - мощность исходного признакового пространства. Каждому изображению в признаковом пространстве соответствует точка, координатами которой являются значения признаков П1, П2, ..., Пп для данной текстуры. Пусть А - множество точек в признаковом пространстве, соответствующих изображениям первого класса; В - множество точек, соответствующих изображениям второго класса.

Рассматриваемый метод кластеризации множеств заключается в выборе такого преобразования исходного пространства, в результате которого максимизируются расстояния между множествами А и В и минимизируются расстояния внутри множеств. Добиться требуемой группировки точек множеств А и В в новом пространстве можно посредством линейного преобразования, матрица которого имеет вид

'»11 ... »1п "

ж = : : ,

у »п1 ... »пп у

где »Л, »72, ..., - весовые коэффициенты измерения, соответствующего

7-му признаку.

Назначение весов »7/- происходит при последовательном попарном сравнении значимостей признаков П7 и П/, где 7, / е{1, 2,..., п] . Чем меньше

расстояние между координатами по оси, соответствующей признаку П7, точек одного класса и чем больше расстояние между координатами точек разных классов, тем больше значимость признака П7. Измерению с большей значимостью следует назначить больший вес. Таким образом, = »кк, где

»кк = шах{»„, М//}.

Пусть, например, признаку П1 в признаковом пространстве соответствует измерение х1, признаку П2 - х2. Проекция точек множеств А и В на плоскость х\Ох2 показана на рис. 2. Координаты точек множеств А и В по оси Ох\ лежат в интервалах [хп, Х12] и [х^, хм] соответственно, по оси Ох2 - в интервалах [х21, х22] и [х23, х24] соответственно. Отрезки [хп, Х12] и [х1з, хм] не пересекаются, в отличие от [х21, х22] и [х23, х24], длины Х12 - Хц и х14 - х13 меньше длин х22 - х21 и х24 - х23. Следовательно, значимость признака П1 больше значимости признака П2. Таким образом, »п > »22. Тогда »12 = м11.

Х2

В

Х21

Х23

Х22

Х24

Хіі Хі2

Хіз Хі4 Хі

Рис. 2. Пример определения весовых коэффициентов признаков Назначение веса wkk признака Пкк производится следующим образом [3]:

где - среднеквадратическое отклонение расстояния между к-ми координатами точек одного класса.

Для определения малоинформативных или избыточных признаков следует привести матрицу линейного преобразования к диагональному виду. Тогда элементами ее главной диагонали будут несмещенные оценки выборочной дисперсии, по которым можно выделить признаки, имеющие малую (или наоборот большую) дисперсию. Выделенные таким образом признаки и есть малоинформативные или избыточные.

П

П

2. В случае допущения ^ м>кк = 1 весовой коэффициент признака оп-

к=1

ределяется выражением

1

2. Статистический подход

Рассмотрим множество С = А и В , состоящее из п изображений класса А и т изображений класса В. Выберем подмножества А' с А (мощность которого -2) и В'с В (мощность которого -2) для обучения системы, т.е. для

определения степени значимости каждого признака, оставшиеся подмножества - для испытания обученной системы.

Обозначим Пк/т - признак, вычисленный путем комбинации к-го 1гаее-функционала с 1-м диаметральным функционалом и т-м круговым функционалом. Его значение для изображения класса А и экземпляра 5 этого класса

обозначим ПАт, соответственно для класса В и экземпляра 5 этого класса

обозначим Пк/т. Вычисляем среднее значение этого признака для всех образцов изображений для обучения:

(

ткіт

п + т

\

І П -кіт,+І П1

І=1

і=1

Стандартное отклонение этого признака по всем классам имеет вид

акіт

( П 2

п + т

т

^ 2 2 2 І ( П кіт — тк1т ) + І ( П ^т — ткЬ

І=1 і=1

Признак является эффективным для распознавания изображений, если его значение устойчиво, когда экземпляр текстуры заменяется на другой элемент того же класса. Таким образом, мы определяем среднюю меру стабильности для каждого признака и измеряем ее с использованием дисперсии значений признаков по всему множеству С:

Я-кІт

а

кіт

( п 1 П 2 2

п + т

т 1 т

" 2

Л

П( -Пкіт )2 + І І (П

І =1 к=і+1 і =1 і=і+1

Ак пкі \2 , Х-' X"' І тлВ — пВІ

кіт Пкіт І

Чем меньше я^т, тем более подходящим является признак Щ/т [4]. Мы можем установить порог Q, который позволит нам назначить вес признакам:

°^кіт

\б Чкіт, если Чкіт — б,

(° если Якіт > О,.

Таким образом, информативными будут те признаки, вес которых не равен нулю.

2

3. Эксперимент

Сравнение эффективности двух подходов к проблеме минимизации признакового пространства проводилось на примере текстур гистологических изображений (рис. 3). Нетрудно заметить, что гистологические изображения имеют сложную текстуру.

Рис. 3. Изображение гистологического препарата

Гистологические изображения получают под микроскопом в диапазоне 50-1000-кратного увеличения, при этом каждый шаг увеличения дает свою долю диагностической информации. При 50-кратном увеличении основным выделяемым объектом является фиброзная ткань, отсечение которой необходимо для дальнейшей обработки фолликул.

Для формирования признаков фиброзной ткани нами использовалось ее полутоновое изображение. Обучающая выборка состояла из 80 гистологических текстур двух видов: фиброзная ткань и гистологические изображения, не содержащие фиброз. Для тестирования системе было представлено 100 гистологических текстур.

Теория распознавания, основанная на аппарате стохастической геометрии и функциональном анализе, ранее применялась лишь к бинарным изображениям, причем формируемые признаки изображений являлись их геометрической характеристикой. В настоящей же задаче мы имеем дело с полутоновыми изображениями, которые, в отличие от бинарных, имеют две группы значимых характеристик: геометрическую и яркостную. Поэтому для классификации полутоновых текстур целесообразно построить распознающую систему, учитывающую как геометрические, так и яркостные особенности изображения.

Для решения поставленной задачи были выделены две группы три-плетных признаков:

1) признаки, характеризующие геометрические особенности изображения;

2) признаки, характеризующие яркостные особенности изображения.

Признаки первой и второй группы имеют одинаковую трехфункциональную структуру вида (1). Отличие между ними заключается лишь в подходе к заданию характеристик однородных по яркости отрезков сканирующих прямых. Для построения признаков, характеризующих геометрические особенности изображения, однородным по яркости отрезкам сканирующих прямых ставится в соответствие некоторая геометрическая величина (например, длина отрезка). Для построения признаков, характеризующих яркостные особенности изображения, однородным по яркости отрезкам сканирующих прямых ставится в соответствие некоторая яркостная величина (например, средняя яркость отрезка).

Границы однородных по яркости отрезков сканирующей прямой для полутоновых изображений, в отличие от бинарных, определяются неоднозначно. В эксперименте был применен следующий метод обнаружения границ однородных по яркости отрезков сканирующей прямой, пересекающей полутоновую текстуру:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1) определялась яркость в каждой точке сканирующей прямой 1(р, 0);

2) по этим данным формировалась функция яркости 1(х) для данной прямой;

, ё1

3) вычислялось значение производной функции яркости —. По ее экс-

тремумам определялись резкие перепады яркости, т.е. граничные точки однородных по яркости отрезков сканирующей прямой /(р, 0).

Принцип выделения однородных по яркости отрезков сканирующей прямой демонстрируется на рис. 4.

Как видно из рис. 4, выбранный метод позволяет с достаточной точностью определять границы однородных по яркости отрезков сканирующей прямой.

После автоматической генерации получено 1000 признаков. Путем процедуры минимизации, основанной на методах кластеризации, было выбрано 48 информативных признаков, весовые коэффициенты которых не меньше 0,5. Приведем некоторые из них:

где Т6 = шах(^-+і - ^) - шіп(ґг+і - ^), Ґ, - границы однородных по яркости от-

ёх

Пі = 08 °Рз ° Тб

; 08 = шіп ;

І

П2 = 05 °Р4 ° Ту,

2

где Ту = 2(+з-^+2)-(^+1-{і)) ;р = шахтіі ; 05 = шахрі ;

і і

Рис. 4. Текстура фиброзной ткани со сканирующей прямой /(р, 0) (а);

функция яркости 1(х) (б); производная функции яркости —

вдоль сканирующей прямой /(р, 0) (в)

П3 = ©з °Р4 ◦ Т8,

гдеТ8 = 2\(ti+3-ft+2)-ft+i-ч^;© 3 = 2Pj ;

П4 = ©4 °P5 ◦ T7,

где P5 =max Tj - min Tij; ©4 = 2 Pj ;

15 — Ü3 “Г5 “ lg.

Путем процедуры минимизации, основанной на статистическом методе, выбрано 39 информативных признаков, весовые коэффициенты которых не меньше 0,5. К их числу относятся:

П1 = ©2 °Р7 ° Т7,

где Р7 = 2 (Ti+ij - Tij )2; ©2 = 2

pj+1- pj

где Р9 = min Tij;

р.=21

где р. = 2 T+i j- Ч

I

П2 = ©3 °Р9 ◦ Т7,

13 - Ü2 ”Г8 “ 18,

П4 = ©3 °Р9 ◦ Т8, П5 = ©9 °Р9 ◦ Т.,

где © 9 = 2 Pj ■ А0 •

Решающая процедура была построена с учетом весовых коэффициентов каждого информативного признака. Ее суть заключается в следующем. Обозначим А - множество изображений фиброзной ткани, В - множество гистологических изображений, не содержащих фиброзную ткань, 7 - тестовое гистологическое изображение. Расстояние между тестовым образцом и множеством А есть

а , а)=^ ^1 Пт - тт

к1т ®Ыт

е mA _ 2 2 ПAi

где mklm 2 Пklm •

«i_1

Тестовое изображение относят к множеству А, если d(t, A) < d(t, B)• Проведенный эксперимент показал, что средняя ошибка классификации для информативных признаков, выделенных с использованием метода кластеризации, составляет 1,6 %, для признаков, выделенных статистическим методом, - 0,3 %•

П

Полученный результат говорит о том, что для минимизации размерности признакового пространства полутоновых изображений со сложной текстурой целесообразно применять рассмотренный статистический метод.

Заключение

Для распознавания полутоновых изображений со сложной текстурой метод стохастической геометрии позволяет автоматически, без непосредственного участия эксперта генерировать большое число признаков, что повышает надежность распознавания. Минимизация размерности признакового пространства, основанная на рассмотренном статистическом методе, обнаруживает высокую эффективность применительно к распознаванию полутоновых изображений со сложной текстурой.

Список литературы

1. Федотов, Н. Г. Теория признаков распознавания образов на основе стохастической геометрии и функционального анализа / Н. Г. Федотов. - М. : Физматлит, 2009. - 304 с.

2. Федотов, Н. Г. Теория распознавания и понимания образов на основе стохастической геометрии / Н. Г. Федотов, Л. А. Шульга // Искусственный интеллект. -2002. - № 2. - С. 282-289.

3. Федотов, Н. Г. Интеллектуальная система поиска биометрических изображений в базе данных на основе стохастической геометрии / Н. Г. Федотов, Д. А. Курынов, А. Г. Петренко, А. С. Кольчугин, О. А. Смолькин // Надежность и качество : труды Международного симпозиума. - Пенза : Информационно-издательский центр ПензГУ, 2006. - Т. 2. - С. 245-247.

4. Kadyrov, A. Texture classification with thousands of features / A. Kadyrov, A. Talebpour, M. Petrou // British Machine Vision Conference (2-5 September, 2002). -Cardiff, 2002. - V. 2. - P. 656-665.

Федотов Николай Гаврилович

доктор технических наук, профессор, заведующий кафедрой экономической кибернетики, Пензенский государственный университет

E-mail: fedotov@pnzgu.ru

Мокшанина Дарья Алексеевна аспирант, Пензенский государственный университет

E-mail: daria-a-m@yandex.ru

Fedotov Nikolay Gavrilovich Doctor of engineering sciences, professor, head of sub-department of economical cybernetics, Penza State University

Mokshanina Darya Aleskeevna Postgraduate student,

Penza State University

УДК 681.39; 007.001.362 Федотов, Н. Г.

Минимизация размерности признакового пространства при распознавании полутоновых изображений со сложной текстурой / Н. Г. Федотов, Д. А. Мокшанина // Известия высших учебных заведений. Поволжский регион. Технические науки. - 2010. - № 1 (13). - С. 54-63.

i Надоели баннеры? Вы всегда можете отключить рекламу.