УДК 681.327
АЛГОРИТМ ПАРАЛЛЕЛЬНОЙ НОРМАЛИЗАЦИИ АФФИННЫХ ПРЕОБРАЗОВАНИЙ ДЛЯ ЦВЕТНЫХ ИЗОБРАЖЕНИЙ
ТРИПУТЕНЬ В.В., ТОРОХОВАТСКИЙВ.А.
Рассматривается вопрос нормализации цветных цифровых изображений. Предложен алгоритм параллельной нормализации для цветных изображений в условиях действия аффинных преобразований и яркостных искажений. Исследован вопрос помехоустойчивости рассматриваемого алгоритма.
В современных системах искусственного зрения (СИЗ) процесс обработки изображений реализуется в несколько этапов [1]: 1) сегментация (выделение отдельных изображений из фона); 2) реставрация (фильтрация помех, улучшение качества изображений); 3) нормализация (приведение изображения к какому-то, наперед заданному, эталонному виду); 4) распознавание — этап, где изображение определенным образом классифицируется для последующего решения конкретно стоящей перед СИЗ одной или множества задач.
Необходимость этапов нормализации вызвана тем, что между эталонными и входными изображениями существуют отличия яркости из-за искажений (помех различного рода) и геометрических преобразований. Единый подход к задачам распознавания в условиях преобразований можно осуществить, пользуясь аппаратом теории групп и их представлений [2]. Широко распространенной на практике группой геометрических преобразований является полная аффинная группа, характеризуемая шестью параметрами.
Нормализация сложных многопараметрических преобразований может происходить по параллельной или последовательной процедуре. Параллельная нормализация эффективна, когда отсутствуют простые устойчивые частичные нормализаторы и из нормализаторов подгрупп нельзя синтезировать нормализатор полной группы [1].
В настоящее время практический интерес для исследований вызывают цветные цифровые изображения. Это связано с широким внедрением в повседневной жизни всевозможных цифровых устройств (например, таких как бытовые телевизоры, видеокамеры, фотоаппараты, компьютеры).
Пусть входное дискретное изображение В(х,у) связано с эталонным изображением В0(х,у) преобразованием g из полной аффинной группы Ga:
Bo = g-1B, g є Ga . (1)
Любое аффинное преобразование характеризуется шестью параметрами ay, (і = 1,2; j=1,2,3):
g: x ^ a11x + a12 y + a13; g є g y ^ a21x + a22y + a23, a .
Преобразование g записывается в матричном виде [ 1]:
g: z ^ Az + v, (2)
где z = (x,y), v = (vj, v2), A є GL(2,R) - невырожденная квадратная матрица, размером 2х2. Нужно
определить вектор параллельного переноса n и матрицу А. Для этого необходимо использовать инвариантные характеристики изображений В(х,у) и В0(х,у). Такой величиной, инвариантной к геометрическим преобразованиям аффинной группы, является момент изображения В(х,у):
Pj (B) = Ц B(x, у) Xіyjdxdy, ij = 0,1,2,..., (3)
D W
где D — замкнутая ограниченная область, называемая полем зрения (сканирования), D с R2.
Из формул преобразования моментов следует [1]:
p(B) = Ap(Bo) + v. (4)
Выражение (4) дает два уравнения для опред еле -ния А и v, тогда как число неизвестных равно шести, т.е. необходимо систему (4) доопределить.
Это можно сделать, используя метод сечений [1]. В рассмотрение вводятся финитные функции (в предположении, что изображение В(х,у) полутоновое, т.е. функция распределения яркости В(х,у) принимает m+1 дискретное значение, m>2):
B j (x,y)
1, B(x,y ) = p j; ____
0, B(x,y) ф p j; j = 1,m.
(5)
С помощью функций (5) система (4) доопределяется и может быть разрешена. Решение переопределенной системы, при m>3, находится методом наименьших квадратов [1]:
a= (,...,xm)(,...,xm)[(,...,xm),...,xm)J ,
m j (b) -Apj (Bo))
m і=1' ' ,f,
v =
(6)
(7)
где xj = pj (b) -xo = p j (Bo)
1 m
- Zpj (B);
m і=1 1m
-m Z p-' <Bo); ■
1,m,
t — знак транспонирования.
Обработка цветных цифровых дискретных изображений сложна из-за увеличения информации, подвергающейся обработке. В этом случае необходимо учитывать данные не только о яркости, но также о цветности и насыщенности изображения.
Некоторые необходимые пояснения перед дальнейшим изложением: 1) обработка цветных изображений ведется с помощью персонального компьютера, устройство отображения графической информации которого (монитор) представляет собой RGB-устройство, все приведенные ниже цветные изображения находятся в рамках RGB модели цветности. В этой системе цвет определяется как результат адди -тивного смешения красной, зеленой и синей составляющих: <цвет = красный + зеленый + синий> и таким образом, цвет представляется тремя численными значениями, которые называют RGB-триадой; 2) так как проводится обработка дискретных изображений, то двойные интегралы в формуле (3) представляются в виде двойной суммы.
Применяя метод сечений для цветных изображений, введем в рассмотрение функции:
Bn =
n, B( x, y) = n; ____
0, B(,y) ф n; n=1,15 ,
(8)
где n — индекс цвета в палитре графического адаптера VGA в режиме 640x480 пикселей, 16 цветов [2].
РИ, 1997, № 1
97
Формула (8) предполагает переход из пространства цветных изображений в пространство признаков цвета (индексов палитры). В каждом из индексов палитры хранятся определенные RGB-триады.
Осуществлена программная реализация предложенной модификации метода. Используется палитра, которая находится в файле входного изображения формата PCX. Индекс палитры изображения получают, используя средства системы BIOS графического адаптера. Изображение формата PCX можно синтезировать в любом из графических редакторов или получить при помощи средств ввода изображений в цифровом формате, например, таких как сканеры, цифровые фотокамеры.
Для получения системы уравнений вида (8) синтезируются изображения с четырехбитовой глубиной палитры (количество одновременно отображаемых цветов - шестнадцать). Примеры изображений (синтезированных в графическом редакторе Paintbrush) приведены на рис.
Изображение, поступающее на вход программы параллельной нормализации, центрируется в области D, представляющей собой прямоугольник размером 318x290 дискрет, путем двух смещений, соответственно по оси X и Y:
x —— x +
Й1,0 (B) h 0,0 (В)
У — У +
MB)
h 0,0 (b)
Для последующей нормализации осуществляется геометрическое преобразование из аффинной группы центрированного изображения.
Работа с цветными изображениями осуществляется в несколько этапов: 1) в процессе сканирования области D строится гистограмма изображения по всем индексам; 2) проводится гистограммный анализ, который позволяет исключить из обработки двухцветные изображения и цвета, не присутствующие на конкретном изображении; 3) проводится повторное сканирование области D для вычисления нормированных моментов изображений B и В0 по всем индексам согласно (3).
Погрешность в вычислении параметров геометрического преобразования обуславливается наличием яркостных искажений входных изображений (шумов различного происхождения и вида на входных изображениях), что всегда имеет место в действительности. Для моделирования шумов в программной реализации предложенного алгоритма были использованы процедуры: 1) задается вероятность появления шума в каждой точке области D. Эти точки шума с заданной вероятностью получаем при помощи генератора случайных чисел; 2) цвет наносимой точки шума выбирается при помощи генератора случайных чисел из диапазона от 0 до 15. Было проведено двадцать экспериментов по каждому из изображений и уровню помех. В результате в табл. внесены усредненные значения pG по итогам этих экспериментов. Уровень помех, равный 0, соответствует отсутствию помех. Погрешность нормализации равна
pG -
|ё/| |ё/ |ё/|
где {ёі }, i - 1,6 — параметры преобразований полной аффинной группы; g/ — точное, а g* — вычисленное значение преобразования в условиях действия помех. Величина Pg характеризует относи-
тельную погрешность вычисления параметров.
- цвет № 1
□ - цвет № 2
- цвет № 3
- цвет № 4
Рис. Примеры изображений Приведем некоторые результаты (см. табл.) экспериментов по оценке влияния помех на точность алгоритма параллельной нормализации цветных изображений. Как видно из табл. по результатам экспериментов, нормализация цветных изображений с применением описанного метода имеет практический смысл, так как даже при искажении точек с вероятностью 0,6 относительная погрешность в определении параметров не превышает 6% для изобра-
Таблица
I U Относительная погрешность вычисления параметров (x10-2)
a11 a12 a13 a21 a22 a23
0 0,108 0,557 0,099 0,131 0,078 0,078
0,2 0,585 2,839 1,686 0,586 0,61 0,61
1 0,4 0,982 3,713 2,866 0,89 0,842 0,842
0,6 1,189 6,433 3,579 0,764 1,48 1,48
0,8 2,189 9,372 7,829 1,757 2,081 2,081
0 2,817 2,839 15,313 1,395 0,818 0,818
0,2 9,017 12,595 20,434 2,061 3,045 3,045
2 0,4 13,649 16,979 32,207 3,567 4,447 4,447
0,6 18,455 28,553 34,511 5,771 4,696 4,696
0,8 23,12 35,336 47,942 6,106 8,829 8,829
I = изображения; U = уровень помех
жения, представленного на рис., а. Для более сложного изображения (см. рис.. б) эти показатели ниже. Наиболее устойчивыми параметрами являются смещения (аі3, а23). Для этих параметров обеспечивается высокая точность (погрешность в пределах 5%) для обоих изображений.
Литература: 1. Путятин Е.П., Аверин С. И. Обработка изображений в робототехнике.—М.: Машиностроение.— 1990.—320 с. 2. Абраш Майкл. Таинства программирования графики.—К.: ЗАО “ЕвроСИБ”.- 1995.—383 с.
Поступила в редколлегию 10.09.97
Трипутень Виктор Владимирович, аспирант кафедры ПЭВМ ХТУРЭ. Научные интересы: обработка цветных изображений. Увлечения: футбол, компьютеры. Адрес: 310726, Украина, Харьков, пр.Ленина, 14, тел. 40-94-19.
Гороховатский Владимир Алексеевич, канд. техн. наук, доцент каф. ПЭВМ ХТУРЭ. Научные интересы: распознавание и обработка изображений. Адрес: 310726, Украина, Харьков, пр.Ленина, 14, тел. 40-94-19, 45-22-52.
98
РИ, 1997, № 1