Научная статья на тему 'Алгоритмическое и программное обеспечение для распознавания фигур с помощью Фурье-дескрипторов и нейронной сети'

Алгоритмическое и программное обеспечение для распознавания фигур с помощью Фурье-дескрипторов и нейронной сети Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1231
225
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
фурье-дескрипторы / распознавание фигур / нейронные сети / многоуровневый персептрон / fourier descriptors / shape recognition / neural networks / multilayer perceptron

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нгуен Тоан Тханг

Приведен обзор простых сигнатур фигур на основе контура. Предложены алгоритмы и создано приложение для распознавания фигур с использованием Фурье-дескрипторов и многоуровневой нейронной сети. Сделан вывод о возможности использования Фурье-дескрипторов в качестве входных данных для нейронных сетей при распознавании сложных фигур.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The survey of shape simple signatures on the basis of contour has been introduced. Algorithms were proposed and application for shape recognition using Fourier descriptors and multistage neural network was developed. The conclusion was drawn that Fourier descriptors may be used as input data for neural networks at complex shape recognition.

Текст научной работы на тему «Алгоритмическое и программное обеспечение для распознавания фигур с помощью Фурье-дескрипторов и нейронной сети»

УДК 004.931

АЛГОРИТМИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ДЛЯ РАСПОЗНАВАНИЯ ФИГУР С ПОМОЩЬЮ ФУРЬЕ-ДЕСКРИПТОРОВ И НЕЙРОННОЙ СЕТИ

Тоан Тханг Нгуен

Томский политехнический университет Email: [email protected]

Приведен обзор простых сигнатур фигур на основе контура. Предложены алгоритмы и создано приложение для распознавания фигур с использованием Фурье-дескрипторов и многоуровневой нейронной сети. Сделан вывод о возможности использования Фурье-дескрипторов в качестве входных данных для нейронных сетей при распознавании сложных фигур.

Ключевые слова:

Фурье-дескрипторы, распознавание фигур, нейронные сети, многоуровневый персептрон.

Key words:

Fourier descriptors, shape recognition, neural networks, multilayer perceptron.

Введение

Распознавание образов является центральной задачей в области машинного зрения. Распознавание фигур является частным случаем распознавания образов. Многие задачи распознавания объектов на изображениях могут сводиться к распознаванию фигур. Среди различных способов представления фигур Фурье-дескрипторы доказали свою эффективность и простоту в реализации [1]. В данной работе Фурье-дескрипторы применены совместно с нейронной сетью для решения задачи распознавания фигур.

Обзор простых методов представления фигур

на основе контура

Существующие подходы для представления фигур можно охарактеризовать следующим образом: это методы, основанные на контур[0]е и методы, основанные на области, пространственном домене и домене преобразования; информационно-сохра-няющие (TP) и информационно-несохраняющие методы (NIP). Однако подходы к выделению и представлению фигур обычно разделяются, в зависимости от способов обработки, на одномерные функции представления фигуры (One-dimensional fonction), аппроксимацию полигонов (Polygonal approximation), взаимосвязь пространственных признаков (Spatial interrelation feature), моменты (Moments), методы деления шкалы (Scale-space methods), домены преобразования фигуры (Shape transform domains) [2].

Для представления несложных фигур на основе контуров часто используют: комплексные координаты, функцию расстояния, касательный угол, кривизну контура и Фурье-дескрипторы. Все эти методы (кроме Фурье-дескрипторов) входят в класс «одномерные функции представления фигуры».

Комплексные координаты

Допустим, что изображение представляется в виде функции f (x,y), и P„=(x„,y„), n=[1,N] является множеством точек на границе (контуре) фигуры.

В этом случае zn=xn+iyn называется комплексной координатой. Эти комплексные числа можно использовать в качестве характеристики или дескриптора фигуры или в качестве входных данных для Фурье-преобразования. Тогда контура обозначается в виде функции Р=п, п=[1,Л].

Этот способ очень простой в реализации, но он имеет ряд недостатков: получаемый результат является неинвариантным к перемещению, масштабированию и вращению. Чтобы комплексные координаты были инвариантными к перемещению, 1п считаются с учетом центра тяжести (центроид): Zn=(xn-xg)+i(yn-yg), где g=(xg,yg) - центр тяжести фигуры.

Функция расстояния

Функция расстояния Лп для контура Рп=(хп,уп), п=[1, N вычисляется как расстояние каждой точки (хп,уп) от неподвижной точки С(х0,у0). В качестве С часто выбирается центроид фигуры [2].

кп =7(хп - хо)2 + (Уп - Уо)2-

Функция расстояния имеет те же преимущества и недостатки, что и комплексные координаты.

Касательный угол

Каждый контур считается кривой линией, поэтому можно рассчитать угол прямой касательной к каждой его точки [2]:

= arctan

Уп - Уп

Здесь V - окно небольшого размера.

Несмотря на простоту реализации, метод имеет два больших недостатка: чувствительность к шуму и прерывность. Чтобы избежать прерывности определяется кумулятивная угловая функция рп=в„-в0, где в0 - касательный угол к случайной выбранной точке на контуре. Перед тем, как рассчитать эту функцию, часто применяется фильтр нижних частот. В настоящей работе используется кумулятивная угловая функция как исходная функция для Фурье-преобразования.

Фурье-дескрипторы

Фурье-дескрипторы получаются путем применения Фурье-преобразования к вышеуказанным одномерным функциям представления фигуры [3, 4]. Фурье-дескрипторами называются нормированные коэффициенты Фурье-разложения. Предположим, что контур объект обозначается непрерывной и периодичной функцией с(0, и что

2 г

ak = — I c(t )cos (kmt )dt, T J

2 f . bk = — I c(t )sin (kmt )dt, T

ck =yfak2 + bk2-

Исходное изображение

п - Извлечение контура

Последовательность точек контура

п - Получение кумулятивной угловой функции

Кумулятивная угловая функция

П—~ , Применение Фурье преобразования

U— ■

Коэффициенты Фурье преобразования

Классы (название фигуры)

Распознавание

Рис. 1. Общая схема алгоритма

Для выделения внешних граничных точек используется алгоритм «соседние точки Мора» (Moore’s neighbors) [5]. Результат выделения границы объекта алгоритмом Мора показан на рис. 3.

Выделенный контур сохраняется в виде массива точек Pn=(xn,yn), n=[l,N], где N - количество граничных точек. Точки упорядочены по часовой стрелке. В каждой точке подсчитывается угол наклона касательной линии к горизонтальной оси (угловая функция). Угловая функция меняется в диапазоне [0, 2 л). Таким образом, она прерывна (резкий переход из 2л в 0) и не может служить ис-

ходной функцией для Фурье-преобразования. Для устранения этой проблемы используется кумулятивная угловая функция. Однако кумулятивная функция не лишена недостатков: она прерывна в последней точке контура, и ее значения зависят от длины контура. Чтобы применять Фурье-преоб-разование кумулятивная функция должна быть нормирована [3]:

ф О1) =ф—* у *.

Здесь ф - кумулятивная функция; ф* - нормированная функция; Ь - длина контура.

Здесь ак - реальная часть; Ьк - мнимая часть; ск - Фурье-дескриптор.

Фурье-дескрипторы устойчивы к перемещению, масштабированию и вращению объекта [2, 3] и, следовательно, идеально подходят для представления фигуры.

Алгоритм и его реализация

Процесс реализация системы состоит из двух этапов: обучения и тестирования. Общая схема алгоритма показана на рис. 1.

База данных для обучения содержит 20 «чистых» изображений с одним объектом на черном фоне. Объекты принадлежат классам: окружности, треугольники, прямоугольники, и полигоны (рис. 2).

□ас [о

N п □

□ □□□□

Рис. 2. База данных для обучения нейронной сети

Рис. 3. Выделение контура алгоритмом Мора: а) исходное изображение; б) объект с выделенным контуром

На рис. 4, б-г, показаны касательная функция, кумулятивная угловая функция и нормированная кумулятивная угловая функция для окружности (рис. 4, д-ж).

При применении Фурье-преобразования к нормированной кумулятивной угловой функции получается (рис. 4, д-ж):

1 '

ak =— (t )cos(kt )dt,

л 0

1 2л

bk =— ^ф* (t )sin(kt )dt, л 0

ck=4^

I al + bl.

Полученные таким образом Фурье-дескрипто-ры инвариантны к перемещению, масштабированию и вращению и будут использованы как входные данные для нейронной сети. Количество коэффициентов Фурье-преобразования для нейрон-

а

50 100 150 200 21 0 1 2 3 4 5 6

в г

III ИЩИ'ИРИЦ

lllhlllihlltoill

-0 05

""W*

Рис. 4. Результаты преобразования для окружности: а) исходный контур; б) касательная функция; в) кумулятивная угловая функция; г) нормированная кумулятивная угловая функция; д) реальная часть Фурье-преобразования; е) мнимая часть Фурье-преобразования; ж) Фурье-дескриптор

ной сети будет зависеть от «сложности» фигуры. Эксперимент показывает, что 15-20 коэффициентов достаточно для распознавания несложных тригонометрических фигур. В этой работе используются 20 коэффициентов (дескрипторов).

Рис. 5. Схема нейронной сети

ФИФ

о ВО

<?u<ï

QUO

<£■<?

оИО

оИо

OODI 141

нон

Рис. 6. Тестовые изображения

Для распознавания фигур применяется традиционная многослойная нейронная сеть с обратным распространением ошибки, структура которой показана на рис. 5. В качестве функции активации используется обычная биполярная сигмоидальная функция. Для повышения скорости сходимости сети применяются модификации: Nguyen-Widrow

■3? £ 4

V о

а

Рис. 7. Распознавание более сложных фигур. Данные для: а) обучения; б) тестирования

инициация, моментум, групповое обновление [6]. Эксперимент показывает, что 40-60 нейронов в скрытом слое дают лучший результат в соотношении «времени обучения - сходимости». В данной работе используются 50 скрытых нейронов.

Обсуждение результатов

Программа была реализована на языке С# 2008. Программа предоставляет возможность формирования базы данных для обучения, создания и обучения нейронной сети (многослойный персеп-трон), а также имеет отдельный интерфейс для проверки и тестирования работоспособности.

На этапе обучения сеть сходится после 10000 эпох со среднеквадратической ошибкой 0,001. Программа была протестирована 50 раз с тестовой базой данных, состоящей из 18 изображений (рис. 6). Частота появления ошибок составляет 0,1%.

Для проверки работоспособности алгоритма были созданы другие базы данных тренировки и тестирования (рис. 7). Полученные результаты показали, что алгоритм позволяет распознавать достаточно сложные фигуры, состоящие из простых элементов (круг, эллипс, треугольники...) с высокой точностью: для данных на рис. 7 после 30 тестов были 2 ошибки (частота ошибок - 0,15 %).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выводы

1. Создана программа для распознавания фигур на основе анализа контура с применением Фу-рье-дескрипторов и нейронной сети.

2. Показано, что Фурье-дескрипторы и нейронные сети являются эффективными механизмом для решения задачи распознавания объектов.

3. Разработанная программа способна распознавать сложные фигуры с высокой точностью.

СПИСОК ЛИТЕРАТУРЫ

1. Folkers A., Samet H. Content-based Image Retrieval Using Fourier Descriptors on a Logo Database // Proc. of the 16th Intern. Conf. on Pattern Recognition. - Quebec, 2002. - V. 3. - P. 521-524.

2. Zhang D., Lu G. Review of shape representation and description techniques // Pattern Recognition. - Oxford: Elsevier, 2004. -V. 37. - P. 1-19.

3. Nixon M., Aguado A. Feature Extraction & Image Processing. -Oxford: Elsevier, 2008. - 406 p.

4. Pattern Recognition Techniques, Technology and Applications / Ed. Peng-Yeng Yin. - Croatia: InTech, 2008. - 626 p.

5. Ghuneim A.G. Moore-Neighbor Tracing // Contour Tracing. 2010. URL: http://www.imageprocessingplace.com/downloads_V3/ro-ot_downloads/tutorials/contour_tracing_Abeer_George_Ghun-eim/moore.html (дата обращения: 20.07.2010).

6. Fausett L.V. Fundamentals of Neural Networks - Architectures, Algorithms, and Applications. - Upper Saddle River: Prentice Hall, 1993. - 461 p.

Поступила 15.09.2010 г.

УДК 519.688:53.083.98

АЛГОРИТМ СОВМЕСТНОЙ ФИЛЬТРАЦИИ РЯДОВ КЛЕТОЧНЫХ СТРУКТУР ГОДИЧНЫХ КОЛЕЦ ДЕРЕВЬЕВ

Ю.В. Волков, В.А. Тартаковский

Институт мониторинга климатических и экологических систем СО РАН, г. Томск E-mail: [email protected]

На примере рядов ежегодного прироста трахеид четырех климатипов сосны рассмотрен алгоритм совместной фильтрации, применяемый для повышения качества восстановления биоиндикационной информации.

Ключевые слова:

Биоиндикация, годичные кольца, сезонный рост, математическое моделирование, анализ сигналов.

Key words:

Bioindication, tree-ring, vegetative growth, mathematical simulation, signal analysis.

Введение

Годичные кольца, сформированные в стволе дерева рядами трахеид, являются биологическими индикаторами климатоэкологического состояния окружающей среды. Знание о биоиндикационных свойствах годичных колец может быть расширено и дополнено в результате изучения процессов роста дерева на клеточном уровне.

На поперечном сечении ствола дерева годичные слои отображаются в виде ряда клеток определенного количества (рис. 1), в которых каждая отдельная клетка формировалась в течение некоторого промежутка времени в пределах вегетационного периода под воздействием внешних и внутренних факторов, оказывавших определяющее воздействие на форму и размер клетки, а также на толщину клеточной стенки [1].

i Надоели баннеры? Вы всегда можете отключить рекламу.