УДК 004.932.2
А.В. ГОРОХОВАТСКИЙ
ПРОЕКЦИОННЫЕ МЕТОДЫ В ЗАДАЧАХ НОРМАЛИЗАЦИИ И РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ
Исследуются методы нормализации и распознавания изображений, основанные на признаках проекций. Рассматривается влияние геометрических искажений на радоновс-кий образ, выводятся формальные соотношения для определения параметров нормализации. Предлагаются системы инвариантных признаков для распознавания на основе преобразования Радона и моментных инвариантов. Приводятся результаты компьютерных экспериментов.
1. Введение
Задачи нормализации и распознавания изображений являются ключевыми при решении ряда проблем в интеллектуальных системах компьютерного зрения, связанных с обнаружением и оценкой параметров объектов [1]. Основной трудностью при этом являются различного рода искажения: геометрические, действие фона, шумов. Одним из возможных методов решения таких задач есть использование преобразования Радона (ПР), в результате применения которого изображение представляется в виде совокупности проекций [2, 3]. Достоинства этого направления связаны с высокой информативностью признаков ПР, хорошей помехозащищенностью вследствие интегральных свойств, а также возможностью быстрой обработки за счет перехода в пространство одномерных функций.
Известные подходы к построению инвариантной системы признаков на базе ПР нуждаются в усовершенствовании с точки зрения необходимости оценки влияния преобразова-
ний, обеспечения достаточного качества распознавания и построения признаков для многообразия практических применений.
Цель исследования - разработка и оценка характеристик проекционных методов для нормализации и распознавания изображений. Задачи исследования - получение аналитических зависимостей влияния геометрических искажений на функции проекций; синтез метода определения параметров искажений для нормализации на базе проекций; разработка метода построения и сопоставления систем инвариантных признаков на основе ПР; сравнение эффективности предложенных подходов с классическими.
2. Нормализация геометрических искажений изображений на основе
преобразования Радона
Рассмотрим метод определения параметров геометрических искажений изображения для нормализации на базе проекций. Пусть a1;a2 - параметры смещений изображения по координатным осям, ф - угол поворота, а, р - параметры масштабирования. Считаем, что геометрические преобразования не выводят функцию яркости изображения за пределы области d ее определения [1]. Суть ПР состоит в интегрировании функции яркости изображения B(x, y) вдоль прямых под различными углами бе© .
Результат влияния наиболее распространенных геометрических преобразований (смещения, повороты и масштабирование) на радоновский образ R(p, 6) можно оценить как:
6 JJ B(x',y')5(p-x' cos 6-y' sin6 + a1cos 6 + a2 sin6)dx'dy'
R(p,6,a1,a2) _ x'y' , (1)
R(p, 6, ф) _ J J B(x', y')5(p - y' sin(6 -ф) - x' cos(6 - ''
x' y' II '
R(p,6,а,P) _ — J JB(x',y')5(p-—cos6-ysin6)dx'dy' (3)
аР x' y' а p , (3)
(2)
1 xy
R(p, 6, а) _ - J J B(x', y')5(ap - x' cos 6 - y' sin6)dx'dy'
а
X y
(4)
где В(х,у) и В(х',у') - исходное и искаженное изображения; К(р,6,(Р)) - радоновский
образ искаженного изображения с параметрами (Р) .
Оценку смещений осуществим путем применения функционалов центров тяжести к выражению (1). Определим их для Я(р,0°) и Я(р,0°,а1,а2), на основе вычитания которых получим значение параметра а1. Аналогично разность центров тяжести для Я(р, 90°) и Я(р,90°,а1,а2) дает значение параметра а2. Общие формальные выражения при 6 = 0°, 0 = 90° имеют вид:
a1 _
£ pR(p,0°) £ pR(p,0°,a1,a2) _р___р_
£ R(p,0°) £ R(p,0°,a1,a2) p p
£ pR(p,90°) £ pR(p,90°,a1,a2)
(5)
a _ J___p__v 7
2 £ R(p,90°) £R(p,90°,a1,a2) ' p p
Анализ горизонтальной и вертикальной проекций в виде векторов значений является наиболее простым с точки зрения реализации, так как при этом ошибки дискретизации и вычислений незначительны. Использование выражений вида (5) возможно для двух произвольных проекций 61,62 изображения на основе соотношений
a _ sin61(x6b - x6t2) + sin62(x?1 - xQ?) .
1 sin(62 -61) a _ cos 61(x6t2 - xob) + cos 62 (xpb - xH ) , (6)
2 sin(62 -61)
где х81,хе^ хеЬ'хеЬ - центры тяжести проекций с углами 8Ь 82 для эталона и объекта.
Параметр поворота определяем по неполному представлению преобразования Радона. Если для смещений необходимы значения векторов Я(р,0°,а1,а2), Я(р,90°,а1,а2), то здесь достаточно одного из векторов при фиксированном значении р, что непосредственно следует из (2).
Функционалы вида (5), (6) применимы в простых ситуациях при низком уровне помех, в более сложных случаях для определения параметров необходимо применение корреляционного подхода, связанного либо со сканированием внутри столбца радоновского образа (при фиксированном параметре р ), либо с сопоставлением строк образа изображения с одной из строк эталона. Для более надежного определения параметров предлагается выражение
Ф = ш1и(£ |Я(р,0°) -Я(р,8,Ф)|) 8 р ,
использующее интегрирование нескольких проекций. Экспериментальные оценки показывают, что погрешность при определении параметра поворота на основе проекций не превышает шага дискретизации в 2 градуса.
При однородном масштабировании с учетом (4) при р = 0 параметр а находим из соотношения
а = Я(рДа )/Я(р,8). (7)
При этом достаточно использовать лишь одну проекцию. Для обеспечения более высокой точности эффективным есть горизонтальное (вертикальное) направление проектирования. При этом значения функции Я(р,8) для множества 8 применяют для повышения надежности оценки в условиях помех.
Параметр а можно найти на основе множества всех значений р, например, в виде:
a = ^R(p,9,a)/ £R(p,6) (8)
Более сложным для теоретического анализа представляется вариант неоднородного масштабирования при a ф р . В этой ситуации для определения масштабов нужно сформировать и решить систему двух нелинейных уравнений на основе соотношения (3). С этой целью применим пару функционалов: Ф = Jf(u)du и Т = Juf(u)du . Анализ показывает, что одного функционала ф даже для разных углов 8 = 0° и 8 = 90° недостаточно, так как получаются зависимые между собой уравнения. Применяя интегрирование по переменной p в (3) и зафиксировав значение 8 = 0°, на базе функционалов эталона То, Фо и масштабированного образа Та,р фа,р получаем величины неоднородного масштаба
a = Ф2а,рТо / Ф2оТа,р , Р = ф0Та,р / Фх,рТ0 , (9)
где ^x,p=ZR(P,8,a,P), Ф0 = £R(p,8), Ta,p=£pR(p,8,a,P), Т = £pR(p,8).
p p P p
Как видим из (9), для определения параметров достаточно лишь одной проекции изображения при 8 = 0°.
Рассмотрим теперь изменения радоновского образа под действием комбинаций геометрических искажений, которые значительно усложняют задачу оценки параметров вследствие их взаимного влияния.
При преобразованиях поворота и смещений имеем выражение:
R(p,8,aba2,<p) = R(p + a1cos(8-9) + a2 sin(8-ф),8-ф). (10)
Для комбинации однородного масштабирования и смещений получаем:
R(p,8,a,a1,a2) = —R(ap + a1 cos8 + a2 sin 8,8) (11)
a
При комбинации преобразований однородного масштабирования и поворота имеем
Я(рДа,ф) = —Я(ар,0-ф) (12)
а
В наиболее сложном случае при одновременном наличии геометрических искажений смещений, поворота и однородного масштаба имеем общее формальное выражение вида:
Я(р, 0, а, ф,аьа2) = —Я(ар + а1ео8(0-ф) + а2 8т(0-ф), 0-ф) (13)
а
Используя (12), рассмотрим подход к определению параметров искажений для комбинации поворота и однородного масштабирования. В этом случае ПР позволяет разделить действие отдельных искажений: коэффициент масштабирования а влияет на значение параметра р радоновского образа и на величину я, в то время как угол поворота ф оказывается связан только с параметром 0 . Это дает возможность выполнить последовательную нормализацию. Аналогичная ситуация возникает при нормализации комбинации, состоящей из масштабирования и поворота (11).
В случае комбинации поворота и смещений происходит «переплетение» параметров согласно (10). Несмотря на это, возможно применение последовательной нормализации, однако с несколько большими вычислительными затратами. Для определения поворота можно использовать, например, выражение:
ф = тах Я(р, 0)-тах Я(р, 0, ф) (,.)
0 р 0 р , ( )
после чего выполнить нормализацию смещений.
При наличии полной комбинации геометрических искажений (13) можно использовать два подхода. Первый из них заключается в последовательной нормализации искажений на основе соотношений для оценки отдельных параметров или их модификаций. Второй подход можно реализовать путем определения параметров на основе формальных выражений для двух из трех геометрических искажений попарно.
3. Построение систем инвариантных признаков для распознавания
Комбинирование ПР с методами построения инвариантных признаков (моментные инварианты, инварианты на основе преобразования Фурье и т.п.) ускоряет процесс нормализации за счет одномерной обработки. Моментные признаки являются одной из наиболее надежных систем при распознавании визуальных объектов. Рассмотрим метод построения и сопоставления систем инвариантных признаков на основе ПР и моментных инвариантов.
Согласно (1), смещение изображения переходит в смещение проекции при фиксированном значении 0 = 00, в свою очередь, центральные моменты порядка к являются инвариантными к смещениям. Таким образом, выражения вида
^к = | (р ' - —)кя(р ' , 0)ар ', то = | я(р ' , 0)1р ', т1 = | (р ' - а^Щр ' , 0)ёр ', к = 0,1,2,... р' т° Р' р'
являются инвариантными для всех проекций ПР.
Системы инвариантных признаков для других типов искажения строим из соотношения 1к = тк /(т°)ъ , где тк = т° = | Я(р, 0)dp при фиксированном 0 . При этом
р р
параметр 2 обеспечивает инвариантность к изменениям масштаба в соответствии с (3), (4). С учетом свойств ПР и (4) имеем
т° = |-Я(р ' , 0) О^р ' тк = | Йк-Я(р ' , 0)^
р ' а а ' р ' а а а •
Подставив значения т°, тк в выражение для 1к, получим ъ = (к + 2) / 2 . В результате система инвариантных признаков к комбинации искажений однородного масштабирования и смещений имеет вид:
к+2
С!^ =Цк/(Ы~ (15)
В более общем случае при действиях неоднородного масштабирования с параметрами а и в предлагается использовать систему на основе выражений
Мк /(ш0)2, Мк = | рк(Я(р, ё))2ар вида:
С"4*2 = 1 (Я(р, ё))к+1(Р - -^Ч/^1 . (16)
р шо
Как видим, в соотношениях (15) и (16) используются лишь отдельные проекции изображения. Для построения признаков в случае присутствия поворота можно зафиксировать значение р = р и использовать несколько проекций изображения. Заметим, однако, что использование полной проекционной информации для всех значений р более оправдано из-за большей помехозащищенности. Инвариантными системами при наличии искажений смещений, поворота и масштабирования одновременно будут:
а,ф,а. ,а, г а,а. ,а, а,р,ф,а. ,а, г а,р,а.,а, /1-7\
V 2 =1 V 2 (ё)йё, 1кр 12 =| I/ 1 2(ё)аё. (17)
ёе© ёе©
Особенности сопоставления полученных значений инвариантных признаков предложены в [5]. Экспериментальная погрешность системы вида (17) не превышает 3-4%.
Метод построения и сопоставления систем инвариантных признаков изображений на основе ПР и моментных инвариантов состоит из следующих этапов: выполнение ПР; определение функционалов Шк, Цк,Мк; вычисление инвариантных значений (15)-(17) в зависимости от типа искажений; сопоставление с эталонными значениями на основе меры близости.
4. Результаты экспериментальных исследований
Количественная оценка качества распознавания с использованием предложенных признаков проводилась следующим образом. Для каждой из групп эталонных изображений (рис. 1) проведено по 30 экспериментов со случайными значениями параметров из диапазонов: а 1,а2 е [-5; 5] (с шагом в 1 пиксель), а е [0,5; 1,2] (с шагом 0,05). В таблице приведены результаты исследования вероятности правильного распознавания на базе системы признаков вида (15) до 6 порядка. Для достижения высокой вероятности распознавания достаточно единственной проекции изображения, скорость ее обработки (включая собственно процедуру распознавания) составила 0,4 с.
876543210 Л
& ЗР* 1
* А Л Г^ъ Н"СС 1 Ьъ / * 1 -
^ ** М *1 ^ А Л Л * У * Ч ¥ 1
Рис. 1. Экспериментальные наборы изображений
Искажения Набор 1 Набор 2 Набор 3 Набор 4
Смещение 1,0 1,0 1,0 1,0
Масштабирование 0,92 0,94 0,88 0,93
Смещение и масштабирование 0,93 0,94 0,88 0,94
Проведены экспериментальные исследования предложенных методов распознавания на примере автомобильного номера (рис. 2). Распознавание реализовано на признаках вида (16), поскольку отсутствует искажение поворота. Время обработки одного символа составляет около 0,12 с (включая сегментацию, выделение, построение признаков и поиск в базе данных эталонов). Размер базы эталонов составил 279 изображений (16 шрифтов кегль 36). Значение порога бинаризации равно 149 и найдено в интерактивном режиме.
АХ 0513 AT АХ0513АТ
Рис. 2. Пример распознавания автомобильного номера
Экспериментальные исследования показали, что предложенный метод нормализации с использованием ПР имеет преимущество по быстродействию в сравнении с классическими подходами. Сравнивая варианты корреляционных методов (классический и с применением ПР), на примере нормализации смещений получен выигрыш более чем в 500 раз, а при нормализации по моментным признакам центров тяжести (классической двумерной и одномерной на основе ПР) - в 4 раза. Использование ПР в комбинации с одномерной корреляцией для нормализации позволяет достигнуть показателя быстродействия в 1,6 раза лучше, чем для метода ПР с использованием центров тяжести. Это дает возможность применять наиболее помехозащищенный корреляционный метод в пространствах Радона без ограничений на объем вычислений.
5. Выводы
Применение преобразования Радона и его функциональная обработка позволяют построить системы эффективных признаков, пригодные для нормализации и распознавания визуальных объектов. Сочетание интегральных свойств преобразования Радона с переходом из двумерного пространства изображений в пространство векторов-проекций улучшает показатель быстродействия, в то же время является достаточно помехоустойчивым и позволяет решать реальные задачи компьютерного зрения. Анализ лишь отдельных проекций дает возможность построения признаков в реальном масштабе времени, в то время как анализ нескольких проекций может увеличить достоверность распознавания.
Научная новизна работы. В целях повышения эффективности распознавания предложен метод определения параметров геометрических искажений изображений и их комбинаций для нормализации на базе проекций, а также метод построения и сопоставления систем инвариантных признаков изображений на основе ПР и моментных инвариантов.
Практическая значимость. Результаты моделирования метода определения параметров на базе проекций показали повышение быстродействия в 4 раза в сравнении с классической нормализацией на основе функциональных центров тяжести и в сотни раз по отношению к классическому корреляционному методу. Построение процедур распознавания на основе предложенных систем признаков уменьшает время распознавания примерно на 40% в сравнении с двумерными классическими признаками при сохранении высокого уровня достоверности. Перспективы исследования связаны с построением модификаций методов в случае действия помех локального типа.
Список литературы: 1. Путятин Е.П. Обработка изображений в робототехнике / Е.П. Путятин, С.И. Аверин. М.: Машиностроение, 1990. 320 с. 2.Хермен Г. Восстановление изображений по проекциям. М.: Мир, 1983. 350 с. 3. Toft P. The Radon Transform: Theory and Implementation // PhD thesis, Dept. of Math. Modelling Section for Digital Signal Processing, Technical Univ. of Denmark, 1996. 4. Путятин Е.П. Построение инвариантных моментных признаков изображений с использованием одномерных проекций / Е.П.Путятин, А.В. Гороховатский // Вестник НТУ «ХПИ». Системный анализ, управление и информационные технологии. 2006. .№39. С.125-132. 5. Гороховатский А.В. Распознавание изображений на основе признаков проекций / А.В. Гороховатский, Е.П. Путятин // Искусственный интеллект. Интеллектуальные и многопроцессорные системы. Донецк, 24-29 сентября 2007: материалы 8-й Межд. научно-техн. конф. Донецк: ИПИИ, 2007. С.203-207.
Поступила в редколлегию 20.06.2009 Гороховатский Алексей Владимирович, аспирант кафедры информатики Харьковского национального университета радиоэлектроники. Научные интересы: анализ и распознавание изображений. Адрес: Украина, 61166, Харьков, пр. Ленина, 14.