Научная статья на тему 'Spectral transform approaches of 3D coordinates for object classification'

Spectral transform approaches of 3D coordinates for object classification Текст научной статьи по специальности «Математика»

CC BY
97
84
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук

Аннотация научной статьи по математике, автор научной работы — Semenov N. N., Leontiev A. E.

This article describes one of the methods to process the data for subsequent classification spectral processing of the three dimensional data. This processing allows, using minimal amount of computation, to transfer the object's coordinates to the starting point, as well as to turn the object around any axis and normalize its size.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Spectral transform approaches of 3D coordinates for object classification»

УДК 681.883.022; 681.883.65

СТЕКТРАЛЬНЫЕ МЕТОДЫ ОБРАБОТКИ ПРОСТРАНСТВЕННЫХ ДАННЫХ ДЛЯ КЛАССИФИКАЦИИ ЦЕЛЕЙ

Н. Н. Семенов,

инженер А. Е. Леонтьев,

канд. техн. наук, инженер НТЦ «Протей»

Рассмотрен один из возможных методов обработки данных для последующей классификации — спектральная обработка пространственных данных. Такая обработка позволяет при минимальном количестве вычислений перенести координаты объекта в начало, повернуть объект вдоль любой оси и пронормировать его размер.

Введение

Обнаружение и классификация целей в современной гидро- и радиолокации — две неразрывно связанные задачи. Если оптимальное обнаружение эхо-сигнала хорошо описано в литературе [1, 2 и др.], то оптимального классификатора до сих пор нет.

Наиболее значимой информацией для классификации объектов локации является их внешний контур. Выделение контура из множества «блестящих точек» на поверхности целей возможно множеством разных методов, хорошо описанных в литературе [1-6]. Это и методы кластеризации; и графические методы, связанные с размытием ярких «блестящих точек» до состояния единого пятна с последующим подчеркиванием границ полученного пятна и выделением его контура фильтрами; и самообучающиеся нейронные сети, выделяющие группы радиолокационных точек по тому или иному признаку. Поэтому считаем задачу выделения контура решенной.

Метод анализа и синтеза контуров как замкнутых кривых на плоскости с помощью Фурье-опи-сания был разработан Р. Л. Косгрифом [3] как метод анализа топологии карт. Кривая представляется параметрически как функция длины дуги или накопленное, начиная с известной начальной точки, изменение кривизны. После нормализации эта периодическая функция разлагается в ряд Фурье и коэффициенты усеченного разложения используются в качестве признаков формы. Коэффициенты более высокого порядка описывают изменения в направлении кривой на протяжении небольшого по длине фрагмента контура, и отбрасыва-

ние их эквивалентно эффекту низкочастотной фильтрации. При этом снижается уровень зашумленности контура, а оставшиеся коэффициенты Фурье концентрируют в себе макроскопическую информацию о форме.

За работой Р. Л. Косгрифа в этом направлении появился ряд работ, из которых следовало, что похожие формы в пространстве Фурье-описания с евклидовой метрикой образуют кластер [7]. В более поздних работах [1, 2, 4, 5, 8, 9] внимание уделялось другим теоретическим и практическим аспектам спектрального анализа контуров.

Например, в работе [8] для получения Фурье-описания вводится нормализованная интегральная функция, устанавливающая связи между геометрией формы и алгебраическими описаниями свойств Фурье-описания контура. Во всех этих работах, использующих понятие спектра Фурье, большое значение играет комплексный гармонический сигнал ехр{£тая}. Так как контур изображения является визуальным образом, то с позиции наглядности проводимого спектрального анализа и интерпретации его результатов целесообразно представить базисные функции также в виде визуальных образов, т. е. в виде контуров. Кроме наглядности, это позволяет оперировать при спектральном анализе и фильтрации контуров сигналами, относящимися к одному и тому же классу.

Адаптация метода к задачам локации целей

Попробуем воспользоваться сведениями, полученными из теории распознавания изображений, для начальной обработки радиолокационных дан-

ных на основе быстрого преобразования Фурье (БПФ) и дальнейшей классификации.

При распознавании радиолокационных образов подлежащий распознаванию элемент определяется множеством координат (х, у) его контура. Координатное описание контура представляется комплексным числом

г(и) = х(п) + ]у(п),

(1)

где п — номер очередной пары измерительных данных, описывающих образ. Для их обработки будем использовать дискретное преобразование Фурье в виде

м-1 ( 2П Л

Р = Р(к) = У 2(п)ехрI -]м^п I

для и = 1, 2, ..., М—1, где М означает количество точек описания структуры, а г(п) — комплексное число, определенное выражением (1). Отдельные компоненты преобразования Фурье образуют вектор Р = [Р0, Р1, ..., РМ-1]. Этот вектор также определяет структуру образа, но в совершенно другом пространстве параметров. Компоненты этого описания позволяют легко преобразовывать данные независимо от их положения, масштаба, угла поворота, а также выбранной начальной точки и общего количества компонент. Следует подчеркнуть, что знание составляющих вектора Р достаточно для полного восстановления формы кривой с помощью обратного преобразования Фурье (ОПФ). Пример исходных данных для преобразования показан на рис. 1. Распознаваемый объект смещен относительно начала координат, повернут и имеет случайный размер.

Нулевой компонент Р0 преобразования Фурье представляет собой среднее значение (центр тяжести) измерительных выборок (х, у;), поскольку

1 М-1

Р0 =--- У 2(п).

0 м^

п=0

Если приравнять это выражение к нулю, образ, представленный вектором Р, перемещается на

Рис. 1. Исходные данные для преобразований

стандартную позицию относительно системы координат, не зависящую от фактического первоначального расположения в пространстве данных. По этой причине вектор Р после такого преобразования имеет вид Рху = [0, Р1, Р2, ..., РМ-1], инвариантный относительно смещения.

Использование в преобразовании Фурье различного количества оригинальных выборок (х;, у) отражается на размерности формируемых векторов Р. Для унификации процесса обработки данных количество наиболее значимых компонент устанавливается априорно. Согласно теории преобразования Фурье, наиболее значимыми для отображения структуры компонентами считаются пары координат Р1 и РМ-1, следующими — Р2 и РМ-2 и так далее. При определении К таких пар формируется редуцированное представление вектора

РК = [0, Р1, Р2, •••, РК, РМ-К •••’ РМ-2, РМ-1], которое независимо от количества измерительных выборок, использованных в преобразовании Фурье, имеет одну и ту же априорно установленную размерность (2К + 1).

Инвариантность относительно масштаба образа можно обеспечить нормированием всех высших компонент разложения Фурье, амплитудой компоненты, соответствующей паре Р1 и РМ-1. Если обозначить коэффициент масштабирования К8, то его можно определить выражением

+ \Рм -1Г.

В этом случае нормализация компонент и = 1 .. М-1 вектора Р выполняется согласно формуле

К

Ъ = 1.. М -1.

При таком преобразовании данных полученная форма вектора Р не зависит от размера образа, что очень удобно для дальнейшей классификации.

Преобразование Фурье состоит из компонент, допускающих оригинальную качественную интерпретацию. Пары компонент (Р1, РМ-1), (Р2, РМ-2) и т. д. имеют свой эквивалент в ОПФ, которое, в частности, для только одной (первой) пары можно представить в виде

М

Е ехр| -]--------

1 1 М

+ Ем-1 ехРI -]

.2 р(М -1)*

М

т? ( 2 рЪ

Е1 ехр I -]— — 1 1 М

М

Л „ ( . 2пЪ Л Л

1+ Ем-1ехр I- ]^

Л

(2)

Уравнение (2) описывает эллипс. Первая пара (Р1, РМ-1) задает главный эллипс с наиболее длинной осью, вторая пара (Р2, РМ-2) — следующий по величине и так далее. Поворот кривой относительно начальной позиции вызывает поворот главной оси эллипса. Поэтому для обеспечения неизменности измерительных данных относительно угла

их поворота следует нормализовать положение этой оси. Коэффициент нормализации угла поворота может быть определен выражением

f

KR = exp

-i

А

где Vр и VРм-1 — углы степенного представления комплексных чисел Р1 и РМ-1 соответственно. Нормализация данных, обеспечивающая их инвариантность относительно угла поворота, основана на умножении каждой компоненты вектора преобразования Фурье Рк на коэффициент Кй:

РкВ = КвРк, к = 1.. М-1.

После такого преобразования вектор характеристик образа, подаваемый на последующий классификатор, не будет зависеть от угла поворота этого образа. Последовательное выполнение описанных преобразований применительно к исходным компонентам вектора Р обеспечивает полную инвариантность относительно перемещения, поворота и масштабирования. Компоненты преобразованного таким образом вектора называются дескрипторами образов. Пример результата работы преобразователя показан на рис. 2. Пунктиром показан образ до нормирования поворота, сплошной линией — после нормирования.

Как видно из рисунка, центр тяжести фигуры действительно находится в координатах (0,0), размер пронормирован до постоянного значения, и последнее действие — нормирование поворота фигуры до горизонтального положения.

Приведем пример таких преобразований на языке МАТЬАВ.

z = X + li.*y;

figure(l); plot(z);

fz = fft(z) ;

Построили комплексные координаты

% Нарисовали исходный набор данных % Нашли пространственный спектр огибающей

Рис.

2. Пример автоматического переноса и разворота образа

fz(1)=0; % Перенесли центр тяжести в (0,0)

Ks = sqrt((abs(fz(2))A2)+abs(fz(end))A2); fz1 = fz./Ks; % Нормировка размеров

Kr = exp(-1i*(angle(fz(2))+angle(fz(end)))/2);

fz2 = fz1.*Kr; % Поворот к горизонтальному представлению

z2 = ifft(fz2); % Обратное преобразование figure(2);

plot(z2,'g'); % Вывод результатов

Важным следствием применения преобразования Фурье в качестве препроцессора считается уменьшение зависимости результатов распознавания от шума, возмущающего измерения. Помехи, как правило, имеют характер высокочастотного шума. В преобразовании Фурье это соответствует полосе разложения в высокочастотном диапазоне (компоненты высшего порядка вектора F). Отсечение этих компонент вызывает автоматическое уменьшение уровня шума в образе сигнала после его воспроизведения. На рис. 3 иллюстрируется влияние конечного количества дескрипторов Фурье на форму воспроизведенных образов: оригинальный зашумленный образ; образ, воспроизведенный с использованием всех 64 дескрипторов Фурье; и образ, воспроизведенный с использованием только наиболее значимых нормализованных дескрипторов Фурье. Из рисунка видно, что уменьшение количества дескрипторов Фурье автоматически повышает качество воспроизведенного образа. Коррекция качества заметна также и при анализе численных значений дескрипторов Фурье. Из анализа зашумленных данных следует, что даже при значительном присутствии шума в измерительных сигналах амплитудные характеристики дескрипторов изменяются очень незначительно. Это полезное качество для распознавания радиолокационных образов, скрытых помехами.

Выходные сигналы препроцессора в виде последовательности компонент дескрипторов Фурье после преобразования, обеспечивающего инвариантность к перемещению, повороту и масштабированию, становятся выходными сигналами для многослойной нейронной сети, играющей роль системы распознавания образов и одновременно выполняющей их классификацию (отнесение каждого образа к соответствующему эталонному классу). Количество входных узлов сети равно количеству дескрипторов Фурье, учитываемых при классификации. Если допустить, что каждый входной нейрон представляет единственный класс, то их количество тоже будет постоянной величиной, равной числу классов. Поэтому подбираться может только количество скрытых слоев и число нейронов в каждом слое.

Классификатор тренируется методом обратного распространения с использованием одного из обучающих алгоритмов на множестве обучающих данных, последовательно представляющих все классы образов, подлежащих распознаванию [10]. В режиме воспроизведения классифицируемый об-

9 10 11 12 13 14 15 16 17

■ Рис. 3. Результат уменьшения числа компонент 25, 15 и 10 компонент соответственно

раз, прошедший через все фазы препроцессора, подается на вход сети, возбуждая тот выходной нейрон, который соответствует требуемому классу.

Из-за зашумленности образов на этапе их распознавания выходные сигналы нейронов сети могут принимать непрерывные значения из интервала [0,1] вместо ожидаемых нуль-единичных значений (с единицей, обозначающей распознанный класс).

Один из способов решения этой проблемы заключается в том, что в качестве представителя распознанного класса признается наиболее активный нейрон (выработавший самый сильный сигнал). Однако такой подход не позволяет сравнивать активность различных нейронов и приводит к ситуации, в которой решение о победе конкретного нейрона принимается даже тогда, когда активность всех нейронов близка к нулю. Это может приводить к ошибочной классификации.

Наилучшим подходом представляется двухуровневая классификация. Вначале проверяется, насколько максимальный сигнал превышает сле-

дующий за ним. Если разница достаточно велика, победителем признается наиболее активный нейрон. В противном случае, а также если уровни активации всех нейронов не превышают определенного порога, интерпретатор при объявлении результата сообщает, что классификация считается неполной, и тем самым предостерегает пользователя от возможной ошибки.

Выводы

Подобная реализация нейросетевого классификатора была апробирована при распознавании и классификации многих разнообразных образов, в том числе букв, цифр, предметов, объектов и т. п. На рис. 4 представлено тестовое множество объектов различных классов, которые распознавались с использованием персептронной сети. После предварительной обработки этих данных с помощью БПФ были сформированы 18-элементные векторные дескрипторы (пять пар наиболее значимых коэффициентов Фурье для амплитуды и для фазы,

№ 1, 2008 "X.

ИНФОРМАЦИОННО-УПРАВЛЯЮШИЕ СИСТЕМЫ 15

■ Рис. 4. Примеры объектов для распознавания

>

при этом имеющие нулевые значения фазовые компоненты F1 и FM-1 не использовались). В ходе многочисленных экспериментов количество скрытых нейронов выбрано равным 8. Применялась простейшая интерпретация результатов. Выходной сигнал в диапазоне 0^0,5 рассматривался как нулевой, а свыше 0,5 — как единица. После норма- лизации компонент преобразования Фурье эффективность распознавания незашумленных сигналов составила 100 %. Только значительная зашумленность измерительных сигналов (исходные данные зрительно почти не распознавались) с уровнем шума порядка 70 % уменьшила эффективность распознавания до 90 %.

Литература /

1. Mahafza Bassem R. Radar Systems Analysis and Design. N. Y.: Chapman & Hall, 2000. 552 p. 2. Osjwsky S. Signal flow graphs and neural networks // Biological Cybernetics. 1994. Vol. 70. P. 387-395. 3. Cossgriff R. L. Identification of Shape. Ohio: OSURF, 1960.622 p. 4. Фурман Я. А. Введение в контурный анализ. М.: Физ-матлит, 2003.592 с. 5. Webb Andrew B. Statistical Pattern Recognition. N. Y.: John Wiley & Sons, 2002. 552 p. 6. Анисимов Б. В., Курганов В. Д., Злобин В. К. Распознавание и цифровая обработка изображений. М.: 7. Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978. 411 с. 8. Theodoridis S., Koutrumbas K. Pattern Recognition. Elsevier: Academic Press, 2003. 490 p. 9. Duda R. O., Hart P. E., Stork D. G. Pattern Classification. N. Y.: John Wiley & Sons, 2001. 738 p. 10. Ray Liu K. J. Pattern Recognition and Image Processing. N. Y.: Marcel Dekker, 2002. 584 p. 11. Патрик Э. А. Основы теории распознавания образов. М.: Сов. радио, 1980. 864 с.

Высш. шк., 1983. 295 c. /

1Б f ИНФОРМАЦИОННО-УПРАВЛЯЮШИЕ СИСТЕМЫ

i Надоели баннеры? Вы всегда можете отключить рекламу.