Научная статья на тему 'Приоритетный подход при поиске фрагмента изображения'

Приоритетный подход при поиске фрагмента изображения Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
59
13
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ташлинский Александр Григорьевич, Винокуров Владимир Александрович

Рассмотрен метод минимизации вычислительных затрат при решении задачи выбора процедуры, имеющей наилучшие оценки искомого положения фрагмента изображения, из множества псевдоградиентных процедур, каждая из которых соответствует некоторой области исследуемого изображения. Метод основан на предоставлении приоритета в выполнении очередной итерации процедуре с лучшим текущим значением функции приоритета. Определены требования к функции приоритета. Получены выражения для вероятности ошибочного выбора и выигрыша в вычислительных затратах. Приведены конкретные практические примеры использования предложенного подхода

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ташлинский Александр Григорьевич, Винокуров Владимир Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Приоритетный подход при поиске фрагмента изображения»

СПИСОК ЛИТЕРАТУРЫ

1. Крашенинников В.Р. Псевдоградиентные методы обработки изображений // Тез. докл. I Всесоюзной конференции «Распознавание образов и анализ изображений». Минск: АН БССР, 1991. Ч. 2. Секция 2. С. 91-94.

2. Крашенинников В.Р., Ташлинский А.Г. Оценка геометрических искажений бинарных изображений // Тез. докл. 49-й науч. сессии РНТО РЭС им А.С.Попова. М.: РНТО РЭС, 1994. Ч. 2. С. 122-123.

3. Пытьев Ю.П. Морфологический анализ изображений // ДАН СССР. 1983. Т. 269. С. 1061-1064.

Крашенинников Виктор Ростиславович, доктор технических наук, окончил механико-математический факультет Казанского государственного университета. Профессор кафедры САПР УлГТУ. Имеет статьи и монографии в области статистических методов обработки многомерных случайных полей, в частности, изображений и их последовательностей.

УДК 621.391

А.Г. ТАШЛИНСКИЙ, В. А. ВИНОКУРОВ

ПРИОРИТЕТНЫЙ ПОДХОД ПРИ ПОИСКЕ ФРАГМЕНТА ИЗОБРАЖЕНИЯ

Рассмотрен метод минимизации вычислительных затрат при решении задачи выбора процедуры, имеющей наилучшие оценки искомого положения фрагмента изображения, из множества псевдоградиентных процедур, каждая из которых соответствует некоторой области исследуемого изображения. Метод основан на предоставлении приоритета в выполнении очередной итерации процедуре с лучшим текущим значением функции приоритета. Определены требования к функции приоритета. Получены выражения для вероятности ошибочного выбора и выигрыша в вычислительных затратах. Приведены конкретные практические примеры использования предложенного подхода.

ВВЕДЕНИЕ

Одной из задач обработки и анализа изображений является поиск фрагмента 22 на опорном изображении Решение этой задачи сводится к

© А. Г. Ташлинский, В-А. Винокуров, 1998

17

оценке взаимных геометрических деформаций Z1 и 2г. При этом для изображений, представленных на двумерной прямоугольной сетке отсчетов, хорошо себя зарекомендовали псевдоградиентные процедуры (ПГП) [1,2], сочетающие высокую точность оценивания и устойчивость к шумам с относительно небольшими вычислительными затратами. Вектор параметров деформаций а = (а!, а2,..., аш ) может содержать, например, координаты геометрического центра 2г, угол поворота, коэффициент масштаба и др. Очередное приближение параметра полученное на I -й итерации, определяется соотношением

6,7 = «/(/-}) ' (!)

где Хп - убывающая последовательность, задающая величину шага изменения оценки параметра а, на í -й итерации; ср(-) - некоторая функция от проекции градиента целевой функции качества (ЦФК) ,сх). Выбор 0{7,1,21, а) зависит в основном от характера взаимных амплитудных искажений Z1 и 22. Исследования показывают [3], что при отсутствии или пренебрежимо малых искажениях целесообразно минимизировать средний квадрат межкадровой разности, а при гладких искажениях (например, медленно меняющейся мультипликативной помехе) - максимизировать выборочный коэффициент межкадровой корреляции. Тогда оценки д, ЦФК, полученные на / -й итерации по локальной выборке, содержащей к пар отсчетов изображений Z1 и 2г, определяются соответственно выражениями

9, = ,г2,а(_]}к) = -г2Х к ,--1

(2)

^ \ к_1 -ЮХсрЪср

и = а,_„к) = -——, '-1 . 2 , (3)

где ги е^ отсчеты изображения Z!, попавшие в локальную вы-

борку; г21 = % ^ у;. ^ е Z2 - значения непрерывного изображе-

ния Z2, полученного из 22 с помощью некоторой интерполяции; г - сред-

нее значение наблюдений; (*,-,}>,) - координаты, которые выбираются случайным образом.

Характерной особенностью задачи поиска местоположения фрагмента является то, что, как правило, область П(а) определения параметров а превышает рабочий диапазон Пр(а) 11ГП. Для покрытия области П(а) ее разбивают на подобласти (а) с Qpi, i = 1,7/. В каждой /-й подоб-

__А

ласти работает своя Ш11, отличающаяся начальным приближением ccq . В

результате возникает задача выбора 11111, давшей наилучшие оценки а. При достижении всеми процедурами t итераций в качестве критерия такого выбора можно использовать наилучшее значение ЦФК qj'^. Однако такой подход, как правило, не эффективен, так как в 11111 для уменьшения вычислительных затрат используются локальные выборки небольшого объема.

Поэтому на конечном этапе поиска, опираясь на полученные оценки а^, применяют более мощные критерии, например, максимум глобального выборочного коэффициента корреляции.

Если перед выбором процедуры, давшей наилучшие оценки, все N ПГП доводятся до равного числа итераций, то по сравнению с одной процедурой пропорционально возрастают и вычислительные затраты. При последовательном выполнении ПГП это приводит к увеличению времени поиска, а при параллельном - аппаратурных затрат. Заметим, что в решаемой задаче N может достигать десятков и сотен тысяч.

В работе рассмотрен метод минимизации вычислительных затрат, основанный на предоставлении приоритета в выполнении очередной итерации ПГП, имеющей в текущий момент времени наилучшее значение некоторой функции приоритета (ФП). При этом ПГП, рабочему диапазону которой принадлежит истинный вектор аи eQp/, будем называть v-процедурой, а процедуру, для которой äu <£Qpi, - р-процедурой. Очевидно, при Clpi = 0 v-процедура будет единственной. Если же Clpi * ^ >

то ПГП v-типа может быть несколько.

ФУНКЦИЯ ПРИОРИТЕТА

Обозначим ФП через ц/ и рассмотрим, каким общим требованиям она должна удовлетворять. Исходной информацией для получения значения V|/

19

/-й процедуры являются оценки ее ЦФК , т.е.

_... ^'Л. ФП должна позволять сравнивать качество

11111, выполнивших различное число итераций. Последнее требование можно переформулировать следующим образом: если 1-я ПГП, первой достигшая

/-й итерации, имеет значение ФП то никакая другая процедура при

достижении I -й итерации не должна иметь лучшего значения ФП. Учитывая сказанное, можно выделить два основных свойства ФП: - зависимость модуля от числа итераций является неубывающей функцией

I и/« I <• I ш ЮI-

-минимальное значение модуля ФП наиболее вероятно соответствует у-процедуре.

Заметим также, что не теряя общности, можно считать, что \|/0 = 0 (это условие всегда можно обеспечить выбором точки отсчета). Простейшей ФП, удовлетворяющей сформулированным требованиям, при минимизации среднего квадрата межкадровой разности (2) является

Ч/,=£?,> (4)

Г=1

а при максимизации выборочного коэффициента межкадровой корреляции (3)

Ч>,=£(1-<?/). (5)

»=1

Для нахождения ПРВ м>,(\}/) значений ФП на ?-й итерации в качестве меры связи элементов локальной выборки и Z2/eZ2, i = 1,к, выберем

коэффициент

корреляции рк. При анизотропной корреляционной функции изображений эта характеристика весьма удобна тем, что она не зависит ни от размерностей изображения и вектора а, ни от выбранного способа интерполяции Z2. Возможные значения рк на каждой / -й итерации полностью определяются ПРВ м>, (рк ). Нетрудно показать, что м>( (у) может быть найдена по рекуррентному соотношению

-и» +1

/ -/И//(Рк)Цач/,|рк)аркадм/,, (6)

о -1

где м^Дц/, | рк ] - апостериорная ПРВ составляющей Д\|/, функции приоритета на / -й итерации. 20

Для у-процедуры оценка м^(рк) может быть найдена с помощью методики анализа псевдоградиентных процедур оценивания параметров геометрических деформаций изображений [4], которая позволяет, после дискрети-

зации величины рк, получить ПРВ ™(рк) = ~Рк;) величины рк/,

I

/= 1,«р . При этом шаг дискретизации принципиальных ограничений не имеет и определяется, в основном, имеющимися вычислительными ресурсами. ГТРВ и^Дц/,! рк) зависит от вида ЦФК. В предположении, что и г2(- совместно гауссовские величины с нулевыми математическими ожиданиями,

2 2

дисперсиями а, и ст2 и коэффициентом корреляции р, величина м^Дху^р,,.) для ЦФК (2) и ФП (4) определяется распределением «хи-квадрат» с к степенями свободы [5]

0,х < О

Рк) = Рк ) = "V = \Г'1( > О' (7)

где х =-у1-г .

2а1а2(1-рк)

Для ЦФК (3) и ФП (5) получим [5]

«=о V 2 У п\

(8)

где Г(х) - гамма-функция.

Учитывая, что для р-процедур р « О, при / > 30 формулы (7) и (8) можно существенно упростить

XV

Р1\

х

= Л1-ехр

> V 27и

( 2 Л кш -

Ъ

(10) 21

В качестве примера на рис. 1 приведены ПРВ значений ФП процедур V- и р-типа для анизотропных нормальных изображений без шумов с гауссовской корреляционной функцией радиуса корреляции 5 при ? = 10, 40, 70, и к = 1. В формуле (1) в качестве функции ф(-) использована знаковая функция Б^пО, а Яц = Лю /(1 + Ьг г). Хорошо видно, что с увеличением / площадь пересечения ПРВ V- и р-процедур резко сокращается. Так, при / = 10 она равна 0.22, при / = 40 - 6,3 х\0"3, а при / = 70 - 5,9 х 10~5.

ВЕРОЯТНОСТЬ ОШИБКИ ВЫБОРА У-ПРОЦЕДУРЫ

Под вероятностью ошибки Рош (?) выбора у-процедуры на / -й итерации будем понимать вероятность того, что на / -й итерации лучшее значение целевой ФП будет иметь р-процедура > у/рХ). Если до й итерации доводится не одна, а V процедур, то Р^ (/) соответствует ситуации, когда среди

V процедур, первыми достигших / итераций, не окажется у-процедуры. Вопрос выбора на конечном этапе из этих V процедур наилучшей остается за рамками данной статьи (будем условно предполагать наличие на конечном этапе идеального критерия выбора у-процедуры из V отобранных). Заметим,

Рис. 1. ПРВ значений ФП

что Рош (/) зависит не только от типа изображения, параметров и вида ПГП, но и от начального приближения а 0 вектора параметров. Поэтому для определенности под Рош (/) будем понимать верхнюю границу вероятности

ошибки (вероятность ошибки при а0, дающем наихудшую сходимость в рабочем диапазоне ПГП). Это, конечно, не исключает возможность оценки />0III(i) для любого конкретного значения сх0.

Пусть из общего числа N процедур только одна является процедурой v-типа. Предполагая независимость значений ФП р-процедур, можно записать

«=7 ^ w(i - (i - FPi wfW> (П) 0

где Fp,(\|/) - функция распределения Vjдля процедуры р-типа. Допущение о независимости не является жестким, поскольку отсчеты в областях П,, соответствующих р-процедурам, слабо коррелированы с Z2. Отметим, что если единственному аи соответствует к> 1 v-процедур, то выражение (11) остается справедливым, но ww(vj/) будет иметь смысл ПРВ наименьшего значения ФП процедур v-типа

При выборе v процедур из N ситуация соответствует схеме Бернулли (где случайное событие - лучшее значение ФП у р-процедуры) и выражение

для Р^ (7) может быть записано с использованием биномиального закона

распределения

^ш'(') = К.(чО(» - VH1 - , (12)

где - число сочетаний из N -1 по /. Аналогично могут быть получены выражения для Poul(t), соответствующие ситуации поиска на изображении нескольких идентичных фрагментов.

Рис. 2. Вероятность ошибки выбора

Для примера на рие. 2 приведены графики Рош{^) в зависимости от начального рассогласования а0х по сдвигу вдоль оси х для 40 и 300 итераций

при числе процедур 2, 64, и 40000 и V, равном 1 и 3. Характеристики изображений и параметры ПГП такие же, как и для результатов на рис. 1. По графикам легко можно определить максимальное а0х, обеспечивающее требуемую вероятность ошибки. Хорошо видно, что выбор V > 1 резко снижает Рош (/). На рис.3 для наглядности приведен пример изображения 3500 х 1500 отсчетов и искомый фрагмент (слева внизу), соответствующий на изображении размерам 80 х 80 отсчетов. При этом требуемое число процедур поиска достигает N « 40000.

АНАЛИЗ ВЫЧИСЛИТЕЛЬНЫХ ЗАТРАТ

При приоритетном подходе известно число итераций Т, которое должна выполнить лидирующая процедура для обеспечения заданной Рош. Остальные процедуры выполнят меньшее число итераций. Таким образом, для анализа вычислительных затрат достаточно найти дискретное распределение вероятностей Рп / = 1, Т, числа итераций при заданном Т. Заметим, что Р( -это вероятность того, что на / -й итерации значений ФП р-процедуры превышает значение \|/ т ФП лидирующей процедуры на конечной Г-й итерации. В свою очередь и/... — это случайная величина с ПРВ

где ц/ уТ и ур7- - значения ФП V- и р-процедур на Т-й итерации.

Вероятность того, что \|/р, превысит некоторую фиксированную величину ц/ а, определяется соотношением

со

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1=1

Тогда при V = 1 нетрудно получить

р, = Ч^М^И^^М^ -X

где - ПРВ того, что ФП хотя бы одной из (Л/"-1)-й р-процедур

примет значение у.

Рис. 3. Пример исследуемого изображения

Таким образом, в предположении равных вычислительных затрат т на любую итерацию, средние затраты всех процедур составят

а выигрыш и в быстродействии по сравнению с ситуацией последовательного анализа без приоритета

Как видно из (13), при N » 1 выигрыш для заданного числа итераций слабо зависит от числа процедур. Однако при увеличении N для достижения той же Рош требуется большее Т, соответственно растет и U.

На рис. 4 приведено рассчитанное дискретное распределение вероятностей числа итераций при Т - 40, при параметрах изображений и 111 11, соответствующих предыдущим примерам. Там же отображены экспериментальные результаты (кружочки), полученные с использованием имитированных гауссовских изображений при N = 6800. Можно отметить хорошее соответствие теоретических и экспериментальных результатов, а также то, что, несмотря на большое число ПГП, распределение плохо нормализуется. На рис. 5 приведен график функции выигрыша в вычислительных затратах при Рош меньше Ю-7, Г = 3000, N = 64. Хорошо видно, что основной выигрыш (i/(3000) = 35) достигается уже к 1000 итерации.

Рис.4. Распределение вычислительных рис.5. Выигрыш по вычислительным

затрат затратам

Расчеты и моделирование проведены с помощью библиотеки программ, разработанной в среде Borland C/C++ 5.01 для Windows 95. Время поиска местоположения фрагмента на изображении 3500 х 1500 отсчетов (примерно 40000 процедур), имеющего относительно опорного изображения поворот до ± 90° и масштаб 0.7 ч-1.4, при Рош < 10~8 составляет несколько минут на ПЭВМ с процессором Pentium Pro.

ЗАКЛЮЧЕНИЕ

Предложенный приоритетный подход для задачи поиска местоположения фрагмента изображения при заданных 11111 поиска и классе изображений дает существенное сокращение вычислительных затрат, обеспечивая требуемую вероятность ошибки. Полученные соотношения для вероятности ошибки и вычислительных затрат позволяют находить априорные оценки и настраивать параметры 11111. Возможность рассчитать ПРВ функции приоритета на каждой итерации v-процедуры позволяет минимизировать вероятность ошибки или вычислительные затраты, используя классические вероятностные методы.

СПИСОК ЛИТЕРАТУРЫ

1. Поляк Б.Т., Цыпкин Я.З. Псевдоградиентные алгоритмы адаптации и обучения // Автоматика и телемеханика. 1973. № 4. С. 45-68.

2. Крашенинников В.Р., Ташлинский А.Г. Адаптивные алгоритмы совмещения изображений // Обработка изображений и дистанционные исследования; Тез.докл. междунар. конф. Новосибирск: ВЦ СО АН СССР, 1990. С. 138-139.

3. Tashlinski A.G. Estimating the geometric deformation of sequence of multivariate images // Interactive Systems: The Problems Of Human-Computer Interaction: Тез. докл. 2 междунар. науч.-техн. конф. Ульяновск: УлГТУ, 1997. С. 54-56.

4. Ташлинский А.Г. Методика анализа эффективности процедур оценивания параметров геометрических трансформаций изображений // Радио и волоконно-оптическая связь, локация и навигация: Матер, науч.-техн. конф., Т.З. Воронеж, 1997. С. 1649-1654.

5. Корн Г., Корн Т. Справочник по математике (для научных работников и инженеров). М.: Наука, 1974. 832 с.

Ташлинский Александр Григорьевич, кандидат технических наук, закончив радиотехнический факультет Ульяновского политехнического института. Профессор кафедры САПР УлГТУ. Имеет работы в области статистической обработки изображений.

Винокуров Владимир Александрович, закончил радиотехнический факультет Ульяновского государственного технического университета. Аспирант кафедры САПР УлГТУ. Имеет работы в области оценки геометрических деформаций изображений.

i Надоели баннеры? Вы всегда можете отключить рекламу.