Выбор оптимальных условий аналитического описания  контурных объектов в задачах анализа изображений и распознавания образов

Куликова Л. И.; Махортых С. А.

Выбор оптимальных условий аналитического описания контурных объектов в задачах анализа изображений и распознавания образов

Куликова Л. И. (Kulikova@impb.psn.ru), Махортых С. А.

Институт математических проблем биологии РАН

Введение

На настоящий день накоплен огромный опыт решения задач анализа изображений и распознавания образов [1-6]. В последнее время помимо общих подходов предлагается довольно широкий спектр новых технологий для решения такого рода задач [7-11], применяется большое количество различных специализированных методов, алгоритмов анализа сигналов и распознавания образов, что говорит о большом интересе исследователей к этому классу задач и актуальности проблемы распознавания в совершенствовании информационных технологий. Данная работа основана на использовании обобщенного спектрально-аналитического метода, который предполагает проведение полной обработки данных в пространстве коэффициентов Фурье, вычисляемых при разложении их в ортогональные ряды с использованием модифицированных классических ортонормированных полиномов и функций [12-14]. Работая в пространстве коэффициентов разложения и учитывая, что это пространство при правильном выборе системы координат и соответствующего ортогонального базиса отражает все существенные для анализа характеристики изучаемого объекта, задача сводится к выявлению и использованию тех коэффициентов разложения, которые являются наиболее информативными. В процессе исследований, применяя то или иное правило отбора информативных признаков с учетом того, что критерии оценки информативности должны выражать степень различимости объектов разных образов, можно получить наиболее информативные (оптимальные) наборы коэффициентов разложения (признаков) для данного объекта и, таким образом, сформировать из исходного пространства коэффициентов признаковое пространство меньшей размерности.

Отличительной особенностью применения предлагаемого метода является его адаптивность к классу сигналов и изображений и универсальность. Метод базируется на хорошо развитом математическом аппарате. Имеются широкие возможности оптимизации предлагаемых алгоритмов, высокий уровень их адаптации, связанный с

X,

выбором системы координат и соответствующего ортогонального базиса в функциональном пространстве Ь2 при аппроксимации сигналов.

Основная часть

Выбор оптимальной системы координат при параметрическом описании контурных изображений имеет целью получить аналитическое описание исследуемого изображения возможно более простым, то есть отрезки ортогональных рядов, описывающих проекции изображения, должны быть по возможности наиболее короткими. Пусть функция г(^), задающая кривую на плоскости, представлена в системе координат О параметрическими уравнениями

го С) = {*о С), Уо С) (1)

в виде цифровых массивов. Пусть система (1) описывается аналитически набором базисных функций В={Х/(7)}

о(*) = 1 АХ С), Уо С) = 1 ЩХг С).

1=1 1=1

Тогда, если понимать точность описания в определенном смысле (например, в среднеквадратичном), требуется выбрать такую систему координат О и такой

ортогональный базис В, для которых величины ^0'У минимальны при одной и той

же точности описания (индекс о означает, что требуемая глубина разложения может зависеть от выбранной системы координат).

В задачах распознавания образов помимо простоты аппроксимации данных необходимо учитывать требование простоты реализации алгоритма распознавания. Другими словами, следует обеспечить минимальную сложность вычислительных процедур и минимальность числа необходимых для распознавания признаков. Две отмеченные цели часто взаимосвязаны. Так, при реализации обобщенного спектрально-аналитического метода сложность расчетов в среднем пропорциональна количеству признаков (возрастает при учете коэффициентов разложения с большим номером).

Для выбора оптимальных геометрических координат будет построен алгоритм оценки информативности базиса. Выполнение данного алгоритма, естественно, будет производиться на этапе обучения основной распознающей процедуры. Предположим, имеется М различных изображений. Среди них есть изображения Ь различных объектов q2,...., qЬ). Каждый объект (1</<Ь) представлен Ш1 изображениями. Таким образом, имеем совокупность различных изображений при этом 1</<Ь и

1<]<т\. При этом выполняется соотношение М = 2 т1. Запишем решающую

г=1

функцию в виде

Ф= 2Р((/, Ч1т ) -а2р( , Ът )

(2)

г,],/ ,т Ш

],т ]*т

Здесь р((у, (/т ) - расстояние (в выбранной метрике) между изображениями и ъ1т

в задаваемом алгоритмом распознавания пространстве признаков. Например, в пространстве коэффициентов разложения с евклидовой метрикой, задаваемой соотношением

Р(1,x 2 ) =

N

2 (- ^2 )2 , ж=(х1, х2, х3,....., х^),

г=1

N - размерность пространства. После постановки в качестве признаков значений коэффициентов разложения выражение (2) перепишется в виде

N0 + N1

NX + N0

Ф= 2 2 (4,г-А0т,гУ-а2 2 (¿0,7-АОпуУ

г,],/ ,т у=1 г, ] ,т у=1

] Фт

(3)

Здесь г, I - номера объектов, ], т - номера изображений в подклассе изображений одного и того же объекта (например, ракурс изображения или изображения объекта на разных расстояниях), у - номер коэффициента разложения (признака), суммирование ведется по всем признакам (например, по коэффициентам разложения

обеих проекций контура, всего N00 + N0 признаков), О - принятая система координат. Так, А0у- коэффициент разложения под номером у ]-того изображения

г-того объекта, рассмотренного в системе координат О. Имеется также свободный параметр а, по которому можно оптимизировать алгоритм.

Сформулируем условие оптимальности геометрического описания в следующем виде: из всех имеющихся вариантов систем координат используем описание Gm, для которого имеет место максимум функции (2), (3)

max

о

N0 + N0

2 2 (А0 ,У А1т,у) а2 2 (А0 ,У Агт,у)

I,] ,1 ,т у=1 Ш

г, ] ,т у=1 ] Фт

При этом либо число N00 + N(0 фиксировано, либо из всего набора коэффициентов используются лишь некоторые с номерами у1 , у2 ,..., уг ,...

Пример 1.

Для примера приведем результат сравнения двух систем координат - полярной и декартовой при описании контурного изображения в задаче распознавания в заданном классе объектов. Для наглядности определим класс объектов буквами латинского алфавита, а для простоты этот класс зададим совокупностью всего из двух букв Б и 2. Пусть каждая из букв представлена тремя изображениями, которые отличаются между собой выбором шрифта, размера, наклона. Таким образом, рассматриваемый класс определен двумя объектами Ь = 2, а полное число изображений М=6.

Параметризация производится в декартовой и полярной системах координат для данных контурных изображений. На первом этапе реализации обучающей процедуры найдем для простого случая двухпризнакового пространства наиболее информативные признаки. Условием оптимальности выбора признакового пространства (с учетом коэффициентов разложения и системы координат) является максимум решающей функции вида (3), который для рассматриваемой задачи примет вид:

/

max

71,72

г,1 = 2

], к=3г 2 2

£ [(4,Г1 - А1к+ (4,Гг - А1к,Г2) 1,1=1 ], к=1 г ф I

(4)

г=3

], к=2 г 2

- а £ [(Ац,У] - Атк,у. ) + (АЦ,у, - Атк)

г=1 ], к=1 ] ф к

В данном случае г, I - номера объектов (г, I = 1,2); т - номера изображений в подклассе изображений одного и того же объекта (], т = 1,3); - два признака,

по которым ведется поиск максимума функции (4). Для класса, представленного в приводимом примере, допустимые значения параметра а удовлетворяют условию

5 < а < 20.

Рассматривается параметризация контурных изображений следующего вида: Г 12 12

< ) = £ АгТг (/), ) = £ ВгТг (/) - в декартовых координатах, (5)

[ г=0 г=0

Г 11 11

< р($) = £С1Т1 (/),0(/) = £(/) - в полярных координатах, (6)

I г=0 г=0

здесь р и 9 - радиальная и угловая координаты, суммы (5) и (6) представляют собой разложение проекций по полиномам Чебышева. В качестве признаков используем величины А1, А2, ...., А12, В1,...,В12 ,..., С0,...,СП, В0,...,Вп - всего 48 признаков (в выражении (4) величины у1 и у2 - суть натуральные числа от 1 до 48). Оптимизация по у1 и у2 (из (4)) с перечисленным набором признаков приводит к решению задачи о двух наиболее информативных признаках (следовательно, об оптимальной системе координат) при распознавании в данном классе изображений.

В рассматриваемом случае решающая функция (4) достигает максимума при у1=40, у2=42, которые соответствуют разложению в полярных координатах, а точнее -пятому и седьмому коэффициентам разложения 9(1). Следовательно, для описания

заданных изображений больше подходит полярная система координат. Расположение точек, соответствующих объектам на оптимальной признаковой плоскости, приведено на рис. 1 (во втором и четвертом квадрантах). Здесь же для наглядности приведены и распознаваемые символы. Таким образом, уже на основании знания лишь двух признаков (двух коэффициентов разложения) распознаются оба объекта (рис. 1).

Рис. 1.

Проверку устойчивости решения данной задачи будем проводить следующим образом: дополним рассматриваемую выборку альтернативными написаниями рассматриваемых символов (Б, 2). После необходимой предварительной обработки изображений объектов получим требуемые аналитические описания полиномами Чебышева. Полученные коэффициенты разложения будем рассматривать как признаки. Выберем признаки с номерами у1=40, у2=42 и расположим точку с

координатами, равными выбранным признакам, на оптимальной признаковой плоскости. Эта точка соответствует вновь введенному изображению Б (см. рис. 2).

Рис. 2.

Из рисунка видно, что обучающая процедура уже на этапе двухпризнакового пространства легко справилась с задачей, она четко и точно распознала букву Б.

Устойчивость решения задачи проверялась еще следующим образом: накладывали шум различного уровня (от 0,2% до 13%) на изображения и пытались распознать их. А конкретно, с помощью генератора псевдослучайных чисел моделировался белый Гауссов шум и аддитивно добавлялся к рассматриваемым изображениям. Получив их аналитическое описание, рассматривая коэффициенты разложения в качестве признаков и вычленив только информативные признаки, при которых функция (4) достигала максимума (у1=40, у2=42), на оптимальной

признаковой плоскости отражали расположение точек, соответствующих рассматриваемым объектам (см. рис. 4.). Как видно из рисунка, наложение шумов не испортило картину, и предложенная процедура также справилась с поставленной задачей. Для наглядности представим изображения одного из рассматриваемых объектов с наложенным на него шумом (2% и 5% соответственно) (см. рис. 3):

Рис. 3.

Рис. 4.

Пример 2.

Рассмотрим другой пример. Попробуем усложнить задачу: определим класс объектов буквами Б, I, Т, ^ ^ г, х (Ь = 7); и пусть каждый объект имеет по 4 различных изображения (М=28). Для наглядности на рисунке 5 представлен весь класс рассматриваемых объектов:

&

I X I 1 Т I Т

г Г Г

£ t t t

£ Г * У

X X

Рис. 5.

Проведем параметризацию в декартовой и полярной системах координат для данных контурных изображений. Так же как и в предыдущем примере, на первом этапе реализации обучающей процедуры рассмотрим случай двухпризнакового пространства и, вычислив максимум решающей функции (4) для данного класса, найдем наиболее информативные признаки. В рассматриваемом случае функция (4) достигает максимума при у1 =30, у2=38, что соответствует разложению в полярных

координатах. И в этом случае, следовательно, для описания изображения больше подходит полярная система координат. Рассмотрим рис. 6, на котором на оптимальной признаковой плоскости представлены точки, соответствующие объектам рассматриваемого класса. Таким образом, знание двух признаков дает возможность распознать лишь один объект, букву г.

Рис. 6.

Следовательно, необходимо перейти к следующему этапу реализации процедуры и рассмотреть случай трехпризнакового пространства. Причем, сначала поступим так: к двум определенным признакам (у1=30, у2=38) подберем третий, вычисляя максимум функции

С

max

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

УЛгЯъ

1,1=7 ] ,к ,п=т1

¡,п=т1 г

I ц

1,1=1 ] к=1 1ф1 ф п

] А1к Л)2 + (А] ,Г2 А1к ,п)2 + (А] ,Гз Ап] ,Уз)2

(5)

=7 ] ,к=т.

] ,к т

- а I [(Ал - А«л )2 + (] - Акл )2 + (А]л - Ап,п )2 =1

] ,к ,п=1 ] фк фп

Максимум функции (5) при заданных у1, у2 достигается при у3=40. Таким образом, располагая на оптимальном пространстве точки, соответствующие буквам рассматриваемого класса (см. рис. 7), видим, что, зная три коэффициента разложения по полиномам Чебышева, распознаются следующие буквы.

Рис. 7.

Но можно подойти к этой задаче и с другой стороны: оптимизировать сразу по трем признакам у1з у2 и у3 (по (5)) В данном случае функция (5) достигает максимума при у1=30, у2=38, у3=40. То есть, и независимая оптимизация по трем признакам дала те же результаты.

Заключение

В свете сказанного появляется возможность существенного сокращения вычислительной работы при распознавании на основе ступенчатого алгоритма. Для каждого этапа (1, 2, ...., у', ....) (рис. 8) находится оптимальный сокращенный набор признаков {Р1}, {Р2},..., {Ру}. На каждом этапе распознающий алгоритм использует свой набор. На каждом этапе заведомо распознаются определенные наборы объектов {01}, {02},..., {0у}. Если исходный набор {К}, то после каждого этапа (если на соответствующем этапе результат не достигнут) число возможных объектов сокращается (класс сужается): {К}\{01}, {К}\{01}\{02} и т. д. Как нетрудно проверить, объем вычислений при этом существенно уменьшается (как за счет сокращения вычислений признаков, так и за счет сокращения вычислений расстояний в признаковом пространстве).

Рис. 8.

Используя обобщенный спектрально - аналитический метод (ОСАМ), при котором коэффициенты разложения рассматриваются как признаки объекта, подошли

к решению задачи анализа изображений и распознавания образов, в частности, к проблеме выбора оптимальных условий аналитического описания контурных объектов в указанных задачах. Работа, по мнению авторов, демонстрирует эффективность применения обобщенного спектрально - аналитического метода в решении подобных задач. Спектр возможного применения ОСАМ очень широк.

Работа выполнена при поддержке РФФИ, проекты 04-02-17368, 04-01-00756.

Литература

1. Горелик А.Л., Скрипкин В.А. Методы распознавания. - М.: Высш. шк., 1977.

2. Дуда Р., Харт П. Распознавание образов и анализ сцен. - М.: Мир, 1976.

3. Загоруйко Н.Г. Методы распознавания и их применение. - М.: Сов. радио, 1972.

4. Патрик Э. Основы теории распознавания образов. - М.: Сов. радио, 1980.

5. Фу К.С. Последовательные методы в распознавании образов и обучении машин.- М.: Наука, 1971.

6. Фу К.С. Структурные методы в распознавании образов. - М.: Мир, 1977.

7. Kotel'nikov I.V. Algorithmic Models for Solving Pattern Recognition Problems // Pattern Recognition and Image Analysis, 1999. V. 9. № 1. P. 67.

8. Sergunin S.Yu., Kvashnin K.M., and M.I. Kumskov M.I. Image Representation in the Recognition Problem on the Basis of Symbol Marking of Its Singular Points // Pattern Recognition and Image Analysis, 2003. V. 13. № 1. P. 170.

9. Djukova E.V., Inyakin A.S., and Peskov N.V. Methods of Combinatorial Analysis in Synthesis of Efficient Recognition Algorithms // Pattern Recognition and Image Analysis, 2003. V. 13. № 2. P. 426.

10. Zagoruiko N.G., Pichueva A.G., Kutnenko O.A., Borisova I.A., Kochetov A.V., Ivanisenko V.A., Nikolaev S.V., Likhoshvai V.A., Ratushnyi A.V. and Kolchanov N.A. Methods of Pattern Recognition for Genetics // Pattern Recognition and Image Analysis, 2003. V. 13. No. 2. P. 193.

11. Kober V.I., M. G. Mozerov, J. Alvarez-Borrego and I. A. Ovseyevich. Nonlinear Image Processing with an Adaptive Structural Element // Pattern Recognition and Image Analysis, 2003. V. 13. No. 3. P. 476.

12. F. F. Dedus, A. F. Dedus, S. A. Makhortykh, and M. N. Ustinin. Generalized Spectral-Analytic Method and Algebraic Algorithms for Pattern Recognition // Pattern Recognition and Image Analysis, 1999. V. 9. No. 4. P. 578-584.

13. F. F. Dedus, S. A. Makhortykh, and M. N. Ustinin. Application of the Generalized Spectral-Analytic Method in Information Problems // Pattern Recognition and Image Analysis, Vol. 12, No. 4, 2002, p.429-437.

14. Ф.Ф.Дедус, С.А.Махортых, М.Н.Устинин, А.Ф.Дедус Обобщенный спектрально - аналитический метод обработки информационных массивов. Задачи анализа изображений и распознавания образов. // М.: «Машиностроение», 1999, 357с.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Куликова Л. И., Махортых С. А.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Куликова Л. И., Махортых С. А.

Contour objects analytical description optimal conditions choice in the image analysis and pattern recognition problems

Текст научной работы на тему «Выбор оптимальных условий аналитического описания контурных объектов в задачах анализа изображений и распознавания образов»