УДК681.51.007
СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕТОДОВ
МОРФОЛОГИЧЕСКОЙ
НОРМАЛИЗАЦИИ
ЕГОРОВ А.С., МАШТАЛИР С.В.____________
Предлагается модель описания множеств характерных точек изображений с учетом их дискретного представления. Проводится статистический анализ методов морфологической нормализации по крайним точкам и скелетонам. Поиск параметров геометрических преобразований основан на автоматическом выделении множеств аффинно-эквивалентных точек изображений.
Введение
Одной из традиционных, но не имеющих окончательного решения, задач обработки данных является устранение естественных или искусственных деформаций. При обработке изображений типичными являются геометрические искажения, индуцированные изменениями взаимного расположения объекта и видеодатчика. В большинстве случаев такие искажения описываются аффинной группой. Несмотря на многочисленные исследования по нормализации [1-5], существуют классы изображений, для которых целесообразно синтезировать новые алгоритмы, основанные на анализе признаков формы. В частности, переход от полутоновых изображений к анализу множеств бинарных сечений обеспечивает высокие показатели точности и надежности нормализации и достаточную простоту унифицированной программно-аппаратной реализации. При этом решение основано на поиске множеств аффинно-эквивалентных (характерных или особенных) точек изображений.
Поиску множеств особенных точек изображений уделяется весьма пристальное внимание [6-10]. В частности, следует отметить традиционное использование реперных точек, указанных человеком-оператором [6, 8]. Однако в ряде случаев вмешательство человека в процесс работы систем обработки изображений затруднено или вообще невозможно. Существующие же автоматические процедуры поиска множеств аффинно-эквивалентных точек не обладают достаточной помехоустойчивостью применительно к задачам нормализации.
Цель работы - синтез надежных процедур поиска множеств характерных точек изображений в системах, функционирование которых лимитируется реальным масштабом времени. Основными задачами являются описание модели методов поиска особенных точек и анализ эффективности этих методов.
В качестве характеристик эффективности методов нормализации использованы показатели быстродействия, точности и помехоустойчивости. Предлагаемые методы нормализации основаны на автоматическом поиске аффинно-эквивалентных (характерных)
9 0
точек бинарных изображений. Исследованы два метода поиска характерных точек - по крайним точкам бинарных изображений [11] и по их скелетонам [12]. Также проведен статистический анализ методов поиска индексированных множеств особенных точек изображений, основанных на использовании операций бинарной морфологии [13-17], в целях анализа специфики их практического применения.
1. Модели поиска множеств аффинно-эквивалентных точек изображений
1.1. Постановка задачи нормализации
Пусть в некоторые моменты времени t',t" в поле зрения D с R2 зафиксированы два изображения одного и того же объекта. Будем полагать, что они связаны аффинным преобразованием плоскости
B'(x) = g о B''(x), где x є D , g є G = Aff (2, R), действие группы G имеет вид:
B'(x) = B''(Ax) + b, (1)
здесь A є Gl(2, R) - невырожденная матрица второго порядка; b є R2 - вектор параллельного переноса. Каждое из изображений может быть представлено в виде объединения m бинарных сечений
b=um^w,,
где B; = (у є D : B;(y) = 1} ; w, - весовые коэффициенты, связанные с представлением изображения (в общем случае в системе счисления с переменным
основанием). Очевидно, что в" = g о в".
Задача заключается в поиске по известным семействам (B[}im1, (В"}]^ параметров геометрических преобразований изображений A є Gl(2, R), b є R2 . Далее под в будем понимать бинарное изображение.
Подчеркнем, что переход к бинарным сечениям сводит задачу нормализации лишь к обработке характеристик формы изображения объекта и его элементов, в частности, отдельных точек. Ниже, если это не оговорено особо, будем, опуская индекс i, рассматривать одно сечение - бинарное изображение, отождествляя его при необходимости с полутоновым изображением.
Будем рассматривать методы, основанные на анализе некоторых реперных точек. Это связано с тем, что устойчивое автоматическое выделение аффинно-эквивалентных точек обеспечивает простую алгоритмизацию поиска параметров геометрических преобразований (т.е. решения задачи нормализации), так как они непосредственно находятся из системы линейных уравнений
x1,k = a11x1,k +a12x2,k +b1, k = Щ K > 3. x1,k = a21 x1',k +a22x2,k +b2 > ()
Особо отметим, что точный и надежный поиск аффинно-эквивалентных точек наряду с простотой вычисле-
ВЁ, 2005, 1 4
ний, как и другие локальные методы, дает ряд дополнительных возможностей, например, учет частичных заслонений объектов, выход фрагмента изображения из поля зрения:
Эх є D: B(x) ф 0,
(cpi(xi,x2,a1, _, аД ф2(xi,x2 л,...,%))£ D .
1.2. Множества особенных точек изображений
Введем основные определения, необходимые для поиска аффинно-эквивалентных точек на бинарных изображениях, и обоснуем эффективность применения методов математической морфологии в качестве теоретического и прикладного инструментария. Сначала будем полагать, что задано отображение в множество всех подмножеств бинарного изображения У: B ^ 2В, которое выделяет семейства аффинноэквивалентных точек, а затем (после установления необходимых свойств) найдем такие отображения.
Определение 1. Элементы множества ^(В) = {x} назовем особенными точками, если
Vg є G VB' є M Vx' є ЛВ') ,
3!x"e ЛВ") : x' = gox". (3)
Ясно, что из данного определения следует справедливость выполнения равенства и в обратную сторону:
Vg є G VB" є M Vx" є У’") ,
3! x' є У(В') : x'' = g-1 о x' .
В качестве примера множества ЛВ) можно указать границу 9B изображения B. Единственность существования аффинно-эквивалентной точки в (3) на первый взгляд представляется очевидной в силу свойств групповых преобразований. Однако необходимо учитывать, что изображения фактически рассматриваются не в D с R2 , а в D с Z2 , что может приводить к нарушению эффективности действия группы преобразований плоскости, т.е. из равенства
Vx є Z2, ®(g, x) = x не обязательно следует g = e , а кроме того, может существовать подобласть поля зрения D* c D такая, что
3g є G: B(x) Ф 0, Vx є D* ^
^ (91(xb x2, a1,..., ar), Ф2Л, x2, a1, ..., ar)) = const.
Достаточной иллюстрацией может служить изменение масштаба, когда одной точке границы ш может соответствовать несколько точек при одном и том же параметре преобразования.
Определение 2. Индексированные особенные точки © с ЛВ), © = { 0; }iI=1,1 < card {У’)} будем называть характерными, если VB є M, Vg є G имеется
_/ 1 2 ...
подстановка а2 ... аЯ такая, что
0i = g ° 0а;, 0i є ЛВ), 0<хі є У’ о B).
Непосредственно из определения следует, что должно выполняться условие card{y(B)} = = card{(g ° B)}, более точно - card © = card g ° © . Другими словами, необходимо, чтобы отображение у не зависело от аффинных преобразований плоскости.
Пусть Ba с B, а є А, наложим на продуцирующее особенные точки отображение Л B ^ 2B условия:
У(0)=0, VBa с B : Ba ф 0 ^ У(B) ^0 , (4)
^ (UaeA Ba )=UaeA ^ (Ba ), (5)
VB', B'' c B : B' c B'' ^ У(B') с У(B''), (6)
T(ПаєАBa) C ПаєАT(Ba). (7)
Условие (4) указывает на существование требуемого отображения. Условие аддитивности (5) совместно с условием наследования (6) гарантирует возможность пофрагментной обработки, т.е. создает предпосылки для реализации на SIMD-архитектурах. Условие (7) обеспечивает обработку нескольких бинарных сечений изображений, в том числе результатов их промежуточной обработки. Если отображение у взаимнооднозначно, то включение в (7) переходит в равенство.
Будем искать отображения у путем построения суперпозиций теоретико-множественных операций и операций алгебры Минковского на плоскости. Это объясняется тем, что, во-первых, класс битовых сечений замкнут относительно операций алгебры Минковского, во-вторых, сложение и вычитание Минковского
X[+]Y = U уеуХ + у, Х[-]У=П yeyX + y,
где X, У с R2 - произвольные множества.
Подчеркнем, что если фиксировать одно из множеств, а именно его пространственную форму и структуру в операциях (8), (9), то в области определения можно получать подмножества с заданными свойствами. Конструктивным и традиционным путем реализации операций алгебры Минковского применительно к обработке изображений являются операции бинарной морфологии [13-15].
Пусть, по-прежнему, B - бинарное изображение, но определенное в поле зрения D с Z2 . Базовыми операциями являются: расширение (dilation), совпадающее со сложением по Минковскому:
8ы (B) = UheH (B+h)={x є B:[(H + x) П B] c B}, (8)
9 1
BE, 2005, 1 4
и сужение (erosion):
єн(B)=DhEH(B+h) = {x є B:(Hr + x) c B}, (9)
где Hr = { - x є B:x є H},H c D - фиксируемое множество, называемое структурным элементом. Примеры структурных элементов приведены на рис.1.
Рис. 1. Множество структурных элементов
В работе [12] доказано утверждение, что при помощи комбинации морфологических операций (8)-(9) получается аффинно-эквивалентный скелетон изображений:
Фі(Д H) = (£H*(Bi /єN4(Bi)) U (Bi-1 / §N8(Bi)), (10)
где B0 = B, Ф0(B, H) = eH*(9g(B0) ,Bi = Bi_1 /
/d4(Bi_1), i = 1, K, K таково, что BK =0. Тогда совокупность точек, получаемых при помощи (10)
формирует отображение Фі (B, H), которое про-
дуцирует особенные точки, формирующие аффинноэквивалентный скелетон Sk(B). Полученный таким образом скелетон явился основой метода нормализации бинарных изображений по внутренним точкам.
В работе [11] предложен алгоритм поиска множеств внешних характерных точек (метод на базе крайних точек). В этом случае отображение принимает вид
© = {0 є B: 0 є ®(B, H) = єH*(38(B))} . (11).
Полученное при помощи такого отображения множество точек легло в основу метода нормализации по крайним точкам бинарных изображений.
Однако возникает вопрос о точности, надежности и устойчивости этих методов. В целях выяснения этих характеристик, а также установления возможностей их применения на практике проведем сравнительный анализ этих методов морфологической нормализации.
2. Сравнительный анализ методов морфологической нормализации
Представим действие аффинной группы преобразований Aff (2, R) (1) в однородных координатах
B'(x) = g о B''(x) ~ B'(x) = B"(Hx),
где x = (X1,X2,1)T, H = |0A0 bj, A є Gl(2,R),
det A Ф 0 , b є R2 . Для проведения достоверных статистических исследований нам необходимо знать истинные параметры аффинных преобразований и значения, найденные при помощи характерных точек. Иначе говоря, аффинно-эквивалентные изображения будем получать из эталонов Bk (x), k = 1, 2,... аффин-
ным преобразованием, определяемым 3 х 3 матрицей H, т.е. B'(x) = B0 (Hэx). Найденные значения будем обозначать HR, тогда ошибку нормализации в пространстве параметров представим в виде
єм =УІtr[(HH - H3 )(HH - H3 )T], (12)
где tr[°] - след матрицы. Отметим, что данную оценку можно использовать только при достаточно высокой точности нормализации в силу неизометричности аффинных трансформаций.
Ошибку в пространстве изображений определим как меру пересечения эталонного B0(x) и нормализованного Bн (x) = B'(H“1x) изображений в поле зрения D с Z2:
, card(B0 U Bн) - card(B0 П Bн)
61 = 1-------card (Б0 и B„)-----■ (13)
В задачах распознавания оценка (12) более предпочтительна, однако при экспериментальных исследованиях (при фиксации ряда условий регистрации и обработки изображений) формула (13) дает более ясную картину.
При исследовании характеристик методов нормализации по характерным точкам в целях исключения влияния алгоритмов получения бинарных сечений будем пользоваться только бинарными изо бр ажения-ми. На рис. 2 приведены 88 изображений, которые использованы в имитационном моделировании.
Рис. 2. Множество входных изображений
9 2
BE, 2005, 1 4
Примеры результатов нормализации с использованием крайних точек и скелетонов показаны на рис. 3 и 4 соответственно.
Рис. 3. Нормализация на базе крайних точек
Рис. 4. Нормализация с использованием скелетонов
Для того чтобы установить, влияет ли тип входных изображений на точность нормализации, т.е. сопоставимы ли средние ошибок нормализации, был использован аппарат дисперсионного анализа.
Отметим, что независимость каждой выборки от остальных обеспечивается независимостью (случайностью) выбора ансамбля обрабатываемых изображений. Все изображения были представлены на дискретном растре, имеющем 512 х 512 отсчетов. Для обеспечения эквивалентности представлений всех изображений в цифровым виде (исключения погрешностей квантования и дискретизации) они получались путем конвертации в файлы формата BMP различных версий векторизованных шрифтов формата TTF.
Для применения дисперсионного анализа необходимо, чтобы ошибки нормализации были распределены по нормальному закону и их дисперсии были однородны. Для проверки гипотезы нормальности распределения результаты вычислений были разбиты на 10 интервалов, для каждого из которых определялось число ш; результатов и вероятность pi попадания в этот интервал при нормальном законе распределения вероятностей.
Оценка значения критерия %2 при l = 10
X
2 _
£ (mi-npi)2 i=1 ПРІ
= 1,05
?
а критическое значение критерия при числе степеней свободы k = l - 3 = 7 и доверительной вероятности p = 0,99 равно х2 = 1,24 , т.е. нет достаточных оснований, чтобы отвергнуть гипотезу о нормальном распределении.
Проверка гипотезы об однородности ряда дала следующие результаты. Выбирая доверительную вероятность p = 0,99, находим верхний критический предел %2 при числе свободы, равном 87: %2 = 59,279, т.е. имеем соответственно
Qj = 21,74 <х2 = 59,28, Q2 = 4,02 <х2 = 59,28,
что означает: гипотеза об однородности ряда дисперсий не противоречит результатам эксперимента.
Далее вычислим несмещенную оценку колебаний внутри каждой из серий. Получаем для указанных данных при степенях свободы k -1 = 87 и N - k = 528 соответственно:
S2
F =-21 = 1,63 > F0,01 = 1,43 Sr2,1
и
s2
F2 =-22 = 0,161 < F001 = 1,43
Sr, 2
Таким образом, можно утверждать: на основании проведенных экспериментов нет оснований считать, что точность нормализации на базе скелетонов зависит от вида бинарных изображений. Вместе с тем, нет оснований считать, что морфологическая нормализация по крайним точкам не зависит от входных изображений. Полученный результат имеет достаточно прозрачное объяснение: выделение крайних точек является недостаточно устойчивым при анализе «малоплощадных» фрагментов изображений, что вносит ошибочные данные в системы линейных уравнений. У ст-ранение погрешностей такого рода должно осуществляться путем исключения из анализа подобных характерных точек, а также с помощью увеличения числа бинарных сечений изображений. С другой стороны, построение скелетонов основывается на локальной
9 3
BE, 2005, 1 4
симметрии бинарных сечений, т.е. фактически в неявном виде используется некоторая интегральная оценка изображений, что и обеспечивает более высокую устойчивость метода. Иначе говоря, применительно к прикладной специфике решаемых задач необходимо выбирать более быстродействующий или более надежный метод, возможно, комбинируя их.
Подчеркнем, что на конечный результат существенно влияет и число отсчетов дискретного растра. На рис. 5 приведена зависимость усредненной по 10 изображениям и 5 аффинным преобразованиям (50 экспериментам) ошибки нормализации по скелетонам от традиционных для методов цифровой обработки характеристик поля зрения D с Z2 . Видно, что точность существенно повышается и меняется уже незначительно при количестве отсчетов, превышающем 256.
Рис. 5. Усредненная ошибка нормализации при различных дискретных растрах
Также была проведена экспериментальная проверка устойчивости методов морфологической нормализации в условиях наличия шума. Во-первых, рассмотрена зависимость ошибки нормализации в пространстве от уровня и плотности шума. В качестве искажений были использованы Гауссов и равномерный шумы. Результатом явилось следующее: несмотря на плотность шума, при уровне до 40% ошибка нормализации в пространстве не превышает 2% от площади фигуры, что является приемлемым результатом, а в дальнейшем, в зависимости от плотности начинает значительно возрастать. Также рассмотрена зависимость ошибки нормализации от изменения вида шума. Результат: ошибка нормализации в пространстве изменяется сильнее для равномерного шума, зависимость от уровня шумов значительно выше, чем от их плотности.
Проведен экспериментальный анализ, касающийся уточнения параметров геометрических преобразований по множествам бинарных сечений. Можно сделать вывод, что при увеличении информативных обрабатываемых бинарных сечений для данного класса изображений ошибка нахождения параметров уменьшается. Однако, если на начальном этапе добавление
9 4
обработки нового информативного сечения значительно уменьшает среднюю ошибку для класса изображений, то начиная с 6-го сечения ошибка остается практически неизменной. Из этого можно сделать вывод, что оптимальным количеством обрабатываемых информативных сечений для рассматриваемых классов изображений является число в диапазоне от 3 до 6. Следует отметить, что не нужно злоупотреблять количеством сечений, так как многократное увеличение их количества приведет к уменьшению информативности каждого отдельного сечения, что может привести к возникновению значительной ошибки определения параметров нормализации изображений.
Выводы
Основной научной значимостью работы является новый метод описания множеств характерных точек изображений на дискретном растре, устойчивый автоматический поиск которых является одной из необхо -димых частей решения задачи нормализации изображений, а именно задачи нахождения параметров геометрических преобразований. Проанализированы вопросы устойчивости и надежности методов поиска индексированных множеств особенных точек, являющихся решением задачи морфологической нормализации по крайним точкам и скелетонам, на базе комбинаций операций математической морфологии. Для статистического анализа предложенных методов были введены ошибки определения параметров и проведены эксперименты по выявлению зависимостей точности нормализации от вида входных изображений, от наличия шума на изображении, физических размеров изображений и количества анализируемых сечений. В качестве практического значения результатов исследований следует указать, что предложенные методы обладают достаточной эффективностью и могут использоваться в системах технического зрения, однако их применение ограничивается специфическими классами изображений.
Литература: 1. Путятин Е.П., Аверин С.И. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 319 с. 2. Rothe I., Suesse H., Voss K. The method of normalization to determine invariants // IEEE T rans. on Pattern Analisys and Machine Intelegence. 1996. Vol. 18, №4. P. 366377. 3. Pei S.C., Lin C.N. Image normalization for pattern recognition // Image and Vision Computing. 1995. Vol. 13, №8. P. 711-723. 4. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. 512 с. 5.ПутятинЕ.П. Проблема распознавания изображений в системах технического зрения // Проблемы бионики. 1999. Вып. 50. С. 3-11. 6. Daurat А. Salient points of Q-convex sets // International Journal of Pattern Recognition and Artificial Intelligence. 2001.Vol. 15, №7. P. 1023-1030. 7.MikolajczykK, Schmid C. Scale & affine invariant interest point detector // International Journal of Computer Vision. 2004. Vol. 60, №1. P. 63-86. 8. Zhuang X., Zhao D. A morphological algorithm for detecting dominant points on digital curves // SPIE Proc. «Nonlinear Image Processing VI». 1995. Vol. 24. P.372-383. 9. Gold S., Rangarajan A., Lu C.P., Pappu S., Mjolsness E. New algorithms for 2D and 3D point matching: Pose estimation and correspondence // Pattern Recognition. 1998. Vol. 31, №8. P. 1019-1031. 10. Sprinzak J., Werman M. Affine point
BE, 2005, 1 4
matching // Pattern Recognition Letters. 1994. Vol. 15, №4. P. 337-339. 11.Машталир С.В. Поиск аффинитета на основе скелетонизации бинарных изображений // Прикладная радиоэлектроника. 2003. Т. 2, № 2. С. 188-192. 12. Машта-лир С.В., Путятин Е.П. Морфологическая обработка изображений динамических объектов // Автомобильный транспорт. Вып. 12. Харьков: ХНАДУ, 2003. С. 55-58. 13. Serra J. Image analysis and mathematical morphology. Vol. I. London: Academic Press, 1982. 610 p. 14. Image Analysis and Mathematical Morphology: Theoretical Advances / Serra J., ed. London: Academic Press, 1989. 411 p. 15. Heijmans H.J.A.M. Morphological image operators. Boston: Academic Press, 1994. 509 p. 16. Giardina C.R., Daugherty E.R. Morphological methods in image and signal processing. New York: Prentice-Hall, Englewood Clifs, 1988. 321 p. 17. Mathematical morphology and its applications to image and
signal processing / Maragos P., Schafer R. W., Butt M. A., eds. // Computational Imaging and Vision. Vol. 5. Dordrecht-Boston-London: Kluwer Academic Publishers, 2002. 475 p.
Поступила в редколлегию 19.10.2005
Рецензент: д-р техн. наук, проф. Бодянский Е.В.
Егоров Андрей Сергеевич, студент группы ИСПР-03-1 ХНУРЭ. Научные интересы: распознавание образов. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 80667317108.
Машталир Сергей Владимирович, канд. техн. наук, ассистент кафедры информатики ХНУРЭ. Научные интересы: обработка изображений. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 7021-419, e-mail: Ma shtalir_S @kture. krarko v.ua.
УДК621.391
ВОССТАНОВЛЕНИЕ ДВОИЧНЫХ ПОЛИАДИЧЕСКИХ ЧИСЕЛ С ОГРАНИЧЕННЫМ КОЛИЧЕСТВОМ СЕРИЙ ЕДИНИЦ
БАРАННИК В.В., ЮДИН А.К___________________
Излагается восстановление массивов двоичных данных на основе декодирования структурных кодовых конструкций по ограниченному количеству серий единиц. Доказывается взаимооднозначность разработанного представления исходным данным.
Введение
Выполнение требования по достоверности данных является одним из основных условий правильного и своевременного принятия решения [1, 2]. В [3, 4] разработано двоичное полиадическое кодирование данных с ограниченным числом серий. Обосновано, что такое представление позволяет дополнительно относительно известных методов кодирования без внесения погрешности повысить степень сжатия данных. Однако для получения исходных данных на приемной стороне необходимо:
- доказать взаимооднозначность такого представления;
- для полученных условий взаимооднозначности определить систему правил, обеспечивающих восстановление исходных данных без внесения погрешности.
Целью исследования является разработка взаимооднозначного восстановления двоичных данных с ограниченным числом серий единиц в двоичном полиадическом пространстве.
Восстановление данных на основе двоичного полиадического декодирования по числу серий единиц
Перед разработкой восстановления исходных двоичных последовательностей покажем, что представле-
ние, предложенное в работах [3, 4], является взаимооднозначным. В этом случае по заданному коду-номеру N(m, Л, $)j можно восстановить исходную последовательность без внесения погрешности, т. е.
N(m, Л, S)j =фk(A(j)); A(j)* =9d (N(m, Л, S)j);
aizj = aizj, i = 1m; z =1Z, (1)
где A(j) = {aizj>i=1m; A(j) ={a!zj>i=i;m; <Pk,Фа -соответственно операторы кодирования и восстановления двоичных полиадических чисел с учетом ограниченного количества серий единиц; A(j) , A(j) -
соответственно исходная и восстановленная двоичные последовательности; aizj, aizj - izj -е элементы соответственно исходной и восстановленной двоичных последовательностей, принадлежащих z -й допустимой зоне.
Теорема о взаимооднозначности структурного представления двоичных данных в полиадическом пространстве по числу серий единиц. Для
выбранного лексикографического правила нумерации, заданных ограничений на число серий единиц и на расположение единичных элементов для двоичной последовательности A(j) можно сформировать только один код-номер N(m, Л, Q)j [4]. Наоборот, для заданных ограничений и по известному коду-номеру можно восстановить только одну двоичную последовательность A(j), т.е. выполняется условие (1).
Доказательство. Предположим противное, т.е. то, что найдется как минимум один элемент, для которого
выполняется неравенство a*z. Ф aizj. В этом случае как минимум два двоичных полиадических числа с ограниченным количеством серий единиц A(j) и A(j) будут иметь одинаковое значение кода-номера N(m, Л, -9)j = N(m,Л,&)*:
9 5
BE, 2005, 1 4