УДК 681.51:007.5
В. А. Гороховатский, Е. О. Передрий
КОРРЕЛЯЦИОННЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ ИЗОБРАЖЕНИЙ ПУТЕМ ГОЛОСОВАНИЯ СИСТЕМ ФРАГМЕНТОВ
Приведены результаты исследований по применению голосующих процедур в корреляционных методах распознавания изображений. Изучены способы формирования систем фрагментов, формализована постановка задачи распознавания, проанализировано разнообразие вариантов голосования, путей выбора признаков фрагментов и установления соответствия между ними. Экспериментальные результаты подтверждают эффективность применения подхода.
ВВЕДЕНИЕ И ПОСТАНОВКА ЗАДАЧИ
Корреляционные методы распознавания приобрели популярность в системах компьютерного зрения из-за высокой надежности, хорошей работоспособности в широком диапазоне внешних условий, а также вследствие высокой помехозащищенности относительно аддитивного шума [1, 2]. Корреляционными считают все подходы к распознаванию, так или иначе основанные на построении меры сходства В, В0) анализируемого изображения В(х, у) е Ш, (х, у) е П и эталона В0(х, у) е ШШ0, Ш0 с Ш (Ш - множество изображений, - множество эталонов, П - область определения изображений) и оптимизации ее значения на множестве и на множестве преобразований д из группы О [3].
Разработка модификаций корреляционного подхода привела к появлению ряда методов, обладающих наряду с устойчивостью к аддитивным шумам также достаточно хорошей помехозащищенностью и к действию помех локального типа. Этот путь связан с анализом фрагментов П изображения, когда область определения П представляется в виде П = и П. В методе частных корреляций [3, 7] при определении координат объектов предполагается построение иерархической меры, значение которой вычисляется в два этапа: сначала для соответствующих фрагментов, а затем на основе этого - результирующее сходство.
Эффективным путем установления соответствия между множествами фрагментов, аппроксимирующими распознаваемый объект и эталоны, является голосование. Методы голосования получили распространение при распознавании визуальных объектов путем анализа множества локальных признаков [4, 5]. Представляется целесообразным осуществить построение корреляционных методов на основе голосования
фрагментов или их признаков, обеспечивая тем самым устойчивость и гибкость принятия решения относительно локальных помех и фона.
Цель исследования - создание модификаций корреляционных методов распознавания визуальных объектов на базе процедур голосования как разновидности структурного анализа изображения.
Задачи исследования - анализ путей формирования набора информативных фрагментов, создание подхода к реализации корреляционного сходства путем голосования системы фрагментов, исследование работоспособности, быстродействия и помехозащищенности представленного подхода путем компьютерного моделирования.
1 ФОРМИРОВАНИЕ СИСТЕМЫ
ФРАГМЕНТОВ
Фрагментация может быть выполнена многими способами, имеющими свои преимущества в определенных ситуациях. В методе частных корреляций в целях использования оптимальных соответствий фрагменты строятся путем включения всех точек объекта (рис. 1, а), в то же время в других ситуациях в интерактивном режиме можно построить более простую и часто более эффективную для целей распознавания систему информативных фрагментов (рис. 1, б). При автоматическом построении характерных признаков с учетом анализа возможного движения объектов система фрагментов формируется путем поэлементного сканирования окном фиксированных размеров [2, 7].
Особенностью применения голосования в корреляционных методах по сравнению с признаковыми под-
Рисунок 1 - Примеры систем фрагментов: а - фиксированная, б - произвольная
© Гороховатский В. А., Передрий Е. О., 2009
ходами есть то, что пространственное соответствие сопоставляемых фрагментов анализируемого изображения и эталона строго фиксируется, что в целом позволяет существенно упростить обработку [5].
Пусть эталонные изображения представлены множествами информативных фрагментов Б0 = {Ь}, i = 1, Sj, Ш0 = {В0}, / е ], где ] - множество классов (эталонов), 3/ - количество фрагментов /-го эталона.
На пространственное размещение фрагментов разных эталонов в общем случае не будем накладывать особых ограничений. Фрагменты эталонов могут выбираться либо с помощью автоматической процедуры путем построения и оптимизации откликов локальных фильтров, либо случайным образом, либо в интерактивном режиме. В частности, информативные фрагменты можно отобрать, учитывая степень различия их характеристик для разных эталонов [2].
В сравнительном аспекте в работе рассматривается несколько разновидностей систем фрагментов, каждая из которых имеет особенности при реализации корреляционных процедур (рис. 1). Первая из систем предполагает выбор фиксированного набора фрагментов, одинакового для всех эталонов и распознаваемого объекта. Частным случаем этой системы есть полная система фрагментов, применяемая в методе частных корреляций [1, 7]. Вторая система предполагает произвольный выбор фрагментов, возможно, различных для отдельных эталонов. Здесь пользователь может случайным образом или в интерактивном режиме выбирать фрагменты, наиболее важные для конкретных применений. При таком построении необходимо для множества распознаваемых эталонов формировать объединенную систему, в которую включены множества фрагментов всех эталонов. Каждая из выбранных систем должна быть проверена на предмет обеспечения необходимого уровня качества распознавания для множества эталонов.
Конкретные применения могут потребовать как построения соответствующих систем фрагментов, так и способов их анализа. Например, пользователь может указать на анализируемом изображении наиболее важные с его точки зрения фрагменты, по которым система распознавания должна отыскать наиболее подходящую модель из базы эталонов [4]. В этом случае распознавание в зависимости от приложения можно осуществлять либо путем сканирования сформированной информативной системой с учетом пространственной структурной связи фрагментов, либо принимать решение на основе обобщения локальных решений каждого из фрагментов.
2 ПОСТРОЕНИЕ МЕТОДОВ ГОЛОСОВАНИЯ
Формализацию процесса распознавания путем голосования фрагментов можно осуществить следующим образом.
Реализуем построение на анализируемом изображении B системы фрагментов, аналогичных эталону с номером j. Затем проведем оптимизацию (с учетом геометрических преобразований) на множестве эталонов значения некоторой функции .), определяющей количество или долю голосов, отданных j-му классу. Значение функции .) от ображает степень соответствия двух изображений, представленных множествами фрагментов. Аргументами функции .) являются: тип системы фрагментов, параметр g геометрических преобразований, номер j-го эталона. Решение принимается в соответствии с максимальным значением ). При фиксированной системе фрагментов .) становится функцией двух переменных -j и g. В результате класс изображения можно определить как
j* = argmaxmaxy(B(j), Bjg), (1)
j e J g e G
где B(j) - система фрагментов, построенная на изображении B в соответствии с фрагментным представлением эталона из класса j, B0g - аналогичная система, полученная на преобразованном под действием геометрического преобразования эталоне B0.
В результате решения (1) наряду с оценкой j* параметра класса получаем также и значение оценки g* для параметра преобразования g. Учитывая, что в корреляционных подходах решение задач оптимизации вида (1) осуществляется, как правило, путем полного перебора возможных значений параметров, порядок поиска максимума принципиального значения не имеет. Решение будет аналогичным, если в (1) вначале найти максимум по переменной j, а затем - по переменной g. В данной работе для конкретности ограничимся рассмотрением случая, когда G есть группа двумерных смещений с множеством значений в пределах поля зрения.
Введем понятие функции i, j) соответствия для пары фрагментов с номерами i и j. В общем случае сравниваемые фрагменты могут иметь разный размер и типы, но в целях упрощения будем рассматривать фрагменты одинакового вида. В корреляци-он-ных методах функция i, j) обычно вычисляется как сходство фрагментов в соответствии с некоторой мерой. В качестве примера i, j) можно использовать одну из метрик р(i, j) для векторных пространств, например, простую в вычислительном пла-не метрику суммы модуля разностей
4( i, j) = -р( i, j) = - i) - Ук\, (2)
k = 1
где k - номер пикселя изображения внутри фрагмента, K - количество точек фрагмента, р(i, j) - расстояние для пары фрагментов (i, j), а знак минус
используется для того, чтобы величина г, /) росла с увеличением сходства. Другой вариант достижения этого свойства - построение функции соответствия вида г, /) = ехр [ -др( г, /)], где д - константа.
Диапазон изменения значений функции г, /) в виде (2) можно считать известным в связи с фиксированным диапазоном яркости изображения. При необходимости этот диапазон можно привести к интервалу [0, 1].
Рассмотрим теперь возможные подходы к построению меры сходства у путем голосования на основе функции
Совместное голосование. Значение функции .) определим в виде
1 Л
у( В (/), В0д) = ^ г, /)
(3)
1 = 1
где предикат пд (г, /) соответствия г-го фрагмента изображения эталону /-го класса определяется в виде бинарной модели
Пд(г, /') =
1,4д( г,/)>б, 0, 4д(г, /)<е,
(4)
где £,д(г,/) - функция соответствия эталону / с учетом параметра преобразования д, а значение 8 задает порог значимости величины £,д(.). Нормировка в соотношении (3) обеспечивает независимость значения голосующей функции от количества фрагментов конкретного эталона, если величины В/ различны. В соответствии с выражением (3) значения функции .) принадлежат отрезку [ 0, 1].
Следует отметить, что значения, полученные в соответствии с соотношениями (3), (4), и далее используемые в (1) при определении максимума, из-за отсечения важной информации могут оказаться незначительными по величине и в результате привести к ложному определению класса. Дело в том, что вычисление в (3), (4) не ограничивает размер коалиции фрагментов, на основе которой принимается решение. В результате решение может быть принято даже по одному фрагменту, что недопустимо с практической точки зрения.
Чтобы избежать этих трудностей, на величину максимума в (1) должно быть наложено дополнительное ограничение вида
максимума необходимо дополнительно проверять условие В (/), В0д )>8т.
Учитывая, что значения .) принадлежат отрезку [ 0, 1 ], значение порога 8т со статистической точки зрения при равноценных фрагментах должно быть выбрано в виде 8т = 0, 5, хотя возможны ситуации, когда степень доверия задается условием 8т<0, 5 [1, 3]. В таком случае решение может быть принято по коалиции наиболее важных фрагментов.
Независимое голосование. Рассмотрим теперь систему из з фрагментов, представляющую собой объединение множеств информативных фрагментов всех 1
классов, з = ^ - количество фрагментов систе-/ = 1
мы. Построим идентичную систему из в фрагментов для изображения и эталонов. Частным случаем есть система одинаковых фрагментов для всех эталонов, т. е. когда вк = В/, к ф/, а координаты и размеры фрагментов разных эталонов совпадают. В таком случае выполнено У к в = $к.
Вначале для каждого из фрагментов полученной системы определим номер класса, для которого достигается максимальное значение величины (г,/), т. е. вычислим
Фд[ г ] = а^та^дС ц ).
1 Е 1
(6)
Значение фд [ г ] при этом зависит от параметра д. Затем на полученном множестве значений фд[ г ] сформируем распределение (гистограмму) рд[/] голосов, отданных элементами множества {фд [ г]} за каждый из классов
Рд[/] = #{ЛФЛг ] = /},
(7)
где символ # обозначает мощность (количество элементов) множества.
Номер результирующего класса определим в соответствии с максимумом по параметру д на множестве полученных гистограмм
/'* = а^тах{ рд[/]}
д е с
(8)
Ограничение вида (5) для данного типа голосования имеет вид
тах{Рд[ 1 ]} ^
д е с '
(9)
тахтах^( В (/), В0д) > 8„
1 е 1 д е С
(5)
т. е. суммарное оптимальное сходство фрагментов приобретает значимость только тогда, когда оно больше некоторой величины степени доверия 8т. Из неравенства (5) следует, что в процессе вычисления
щийся в значимом количестве голосов. Последовательность действий (6)-(8) фактически задает серию возможных построений конкретных алгоритмов.
Принципиальное отличие независимого и совместного видов голосования состоит в том, что при независимом голосовании каждый фрагмент самостоя-
тельно формирует голос, а затем по множеству этих голосов принимается итоговое решение. При совместном голосовании голос за соответствующий класс каждый раз формируется по результатам анализа всех фрагментов системы.
Одним из вариантов подхода является множественное голосование одновременно за несколько классов, что в целом приводит к сглаживанию итоговой гистограммы и повышению устойчивости решения. При этом появляется необходимость использования дополнительных пороговых величин для значений функции г, /), связанных с необходимостью сокращения количества одновременно голосующих элементов.
Заметим, что построение независимого голосования в случае различающихся для эталонов систем фрагментов основано на несколько большем общем количестве фрагментов, чем совместное голосование, и, соответственно, имеет большую информативность, что должно обеспечить и большую надежность решений.
Голосование с поддержкой. Общепризнанным фактом можно считать то, что проведение голосования с учетом голосов соседних фрагментов или ближайших по значению характерных признаков повышает надежность отдельного локального решения за счет увеличения объема используемой информации [4]. Здесь наряду с признаками близлежащей окрестности можно использовать структурные отношения. В результате гистограмма голосов приобретает ярко выраженный максимум, а процедура распознавания становится более устойчивой относительно действия фоновых помех [6].
При соблюдении корреляционных принципов обработки реализация поддержки сводится к анализу множества фрагментов, в пространственном плане соседних с анализируемым. Схематично элементы окрестности в смысле восьмисвязности можно представить в виде рис. 2, где анализируемый фрагмент обозначен ХП (характерный признак), а соседние с ним фрагменты окрестности для конкретности изложения пронумерованы числами от 1 до 8.
В большинстве применений размер фрагмента равен 5 х 5. Таким образом, путем расширения области построения и анализа признаков общий размер поля изображения, участвующего в принятии локального решения, возрастает до величины 15 х 15. Схематично представленное на рис. 2 расположение фрагментов-
соседей лишь иллюстрирует схему анализа. В принципе, допускаются произвольные конфигурации построения и расположения фрагментов, например, в виде прямоугольников или квадратов, пересекающихся между собой или полученных путем сканирования с некоторым шагом.
Заметим, что введенная дополнительная обработка окрестности в любом случае увеличивает итоговое время анализа, поэтому используемые процедуры должны быть по возможности простыми.
Таким образом, для окрестности анализируемого фрагмента с номером г имеем п дополнительных фрагментов в виде совокупности иг = (Ь1, Ьп)г (на рис. 2 п = 8). Множество фрагментов из окрестности соответствующего фрагмента /-го эталона, относительно которого принимается локальное решение, обозначим и/ = {ЬУ, V = 1, п. Эквивалентность окрестностей иг, и/ может быть установлена на основе предиката пи[ иг, и/], подтверждающего или опровергающего локальное решение за класс с номером /
■ ■ Г 1,1и(и1, и/)>е„, Пи[и1, и] = \ ^ ' / и (10) 10,4и(иг, и/)<8и,
где функция £,и(.) характеризует величину сходства (соответствия) двух систем фрагментов иг, и/, а еи -порог значимости сходства.
В общем случае функция ^и[ иг, и/] может быть построена на основе иной меры, чем функция соответствия фрагментов г,/) из выражения (2). С другой стороны, с целью унификации можно использовать и одинаковые соотношения, например,
4и( иг, и) = - £ £ \ЬЫ(г)
■Ь{,
(11)
Рисунок 2 - Расположение фрагментов поддержки
где Ьы - пиксель фрагмента поддержки с номером 1.
«Полный» набор фрагментов. Все три рассмотренных подхода основаны на частичном представлении в виде достаточно небольшого количества информативных фрагментов (5-20). В сравнительном аспекте также представляет интерес подход, когда принятие решения при распознавании опирается на наиболее полную информацию об изображении, описываемую, например, в виде полного покрытия непересекающимися фрагментами, как это можно видеть из рис. 1, а. Количество фрагментов в таком покрытии существенно больше, чем в остальных схемах. Например, при размере изображения 100 х 100 и размере фрагмента 5 х 5 оно равно 400. Наиболее полное представление несет об изображении «сканирующее» представление [7], когда множество фрагментов, применяемых при распознавании, формируется путем сканирования с шагом в один пиксель. Для рассмотренных размеров изображения и фрагмента количество элементов тако-
I = 1 к = 1
го покрытия уже составляет величину (100 - 5 + 1) = = 9216, что усложняет реализацию таких методов в реальном времени, учитывая многократное повторение вычислений в корреляционном подходе.
Полный набор фрагментов может использоваться как при независимой, так и при совместной схеме голосования, хотя он по природе ближе к совместной схеме, т. к. реализует фиксированную структуру системы фрагментов.
Важным свойством системы распознавания, построенной на голосовании произвольного типа, является возможность получения списка фрагментов, по которым принимается окончательное решение. Этот список формируется в процессе работы и представляет собой множество координат выбранных фрагментов. По содержанию списка можно провести верификацию результата распознавания путем наложения соответствующего эталона на изображение [4], а также осуществить аппроксимацию в целях восстановления анализируемого объекта.
Вторым важным аспектом есть возможность досрочно остановить процесс распознавания при достижении некоторых граничных характеристик, сэкономив при этом на объеме вычислений. Это можно осуществить в случае, когда набранное количество голосов, выраженное в значении функции .), близко к максимально возможному значению. Аналогичное действие можно реализовать также при вычислении величин типа (2), (11), учитывая, что с каждым новым слагаемым их значение только уменьшается [2].
3 ВЫБОР ЛОКАЛЬНЫХ ПРИЗНАКОВ И ФУНКЦИИ СООТВЕТСТВИЯ
Основным информационным критерием при принятии решений для всех рассмотренных подходов есть функции соответствия i, j) и E,U(U1, U), значения которых определяют величины различий фрагментов или окрестностей. Понятно, что эти функции можно построить не только на основе корреляционной меры сходства. Другими вариантами системы признаков могут быть следующие.
1. Инвариантные признаки фрагментов. Примеры: моментные инварианты [1], спектральные признаки [2, 8], локальные потоки [6], масштабно-инвариантное преобразование SIFT [5] и другие.
2. Статистические признаки [4]: математическое ожидание, дисперсия, ковариационные характеристики, автокорреляционная функция фрагмента, гистограмма яркости.
Для сопоставления в пространствах этих признаков используются соответствующие меры [2, 4, 7].
Свои особенности имеет функция E,U( U1, Uj) по отношению к i, j). Учитывая основное предназначение методов голосования, связанное с эффективной возможностью локального анализа изображения, вы-
числение Ъ,и(.) в соответствии с принципами фраг-ментной обработки можно реализовать путем формирования неполных комбинаций фрагментов, чтобы обеспечить устойчивость системы поддержки к искажениям ее отдельных элементов. Например, можно считать положительным решение о поддержке, если больше половины фрагментов окрестности подтвердили принятое локальное решение.
Качество распознавания предложенной системы в целом зависит от следующих факторов: распознаваемые объекты (эталоны), методы формирования признаков, правило принятия решения о классе объекта (функция соответствия). Залог успеха - именно в согласовании этих факторов друг с другом. По этой причине важным представляется такой подход, когда для фиксированного множества эталонов и выбранной системы ХП заранее оценивается уровень качества распознавания на основе выбранной функции соответствия. Это можно осуществить на основе имеющейся априорной информации - эталонов. Например, если фрагменты голосуют независимо, критерием качества может быть величина сходства отдельных фрагментов разных классов, а также фрагментов фона. Для случая совместного голосования критичным может быть максимальное сходство между совокупностями фрагментов разных классов. Если же решение строится на соответствии пар фрагментов каждого класса [6], то качество распознавания нужно оценивать на основе парных соотношений.
Место классического корреляционного метода в такой схеме состоит в интегральном по множеству пикселей изображения представлении бинарной модели П(.) и функции соответствия .).
4 ЭКСПЕРИМЕНТЫ И ПРАКТИЧЕСКИЕ
АСПЕКТЫ
Для проведения компьютерных экспериментов использованы полутоновые изображения аквариумных рыбок, примеры которых приведены на рис. 3. Здесь же показаны варианты выбранных в интерактивном режиме фрагментов (по 5 для каждого из эталонов). На рис. 4 приведены примеры распознаваемого изображения на фоне без помехи (а) и под действием локальной помехи (б). Рис. 4, а демонстрирует также оверлейное представление объекта, показывая его истинное местоположение на анализируемом изображении в виде рамки белого цвета.
Размер эталонов выбран равным 100 х 100 пикселей, размер изображения, по которому осуществлялось сканирование и корреляционное сопоставление -125 х 125. Таким образом, общее количество вариантов сравнения при оптимизации по параметру д для одного эталона равно 676. В качестве функции соответствия фрагментов взято значение (2), а порог 8 (в процентах) выбран, исходя из величины отклонения
ч:
му классу, над ближайшим по величине локальным максимумом (тах2) в виде
Рисунок 3 - Эталонные изображения и фрагменты
Рисунок 4 - Распознаваемые изображения:
а - на фоне без помех, б - под действием локальной помехи
от максимального значения, для меры (2) и изображения с 256 градациями равного 5 х 5 х 255 = 6375. Два фрагмента считались эквивалентными, если величина их сходства по метрике (2) превышала пороговое значение, равное -6375е, выраженное в процентах.
Правило подтверждения голоса состояло в том, что а) сходство фрагмента превышает порог 8, б) сходство двух и более соседей из четырех также выше порога 8. Таким образом, для поддержки решения в эксперименте использовались фрагменты с номерами 2, 4, 6, 8 (см. рис. 2).
Качество распознавания можно оценить по гистограмме голосов, пример которой для 8 = 5 % и полного набора фрагментов приведен на рис. 5. По оси абсцисс здесь отложены номера эталонов, а по оси ординат - относительная доля голосов (количество голосов фрагментов, деленное на максимально возможное их число), отданных за каждый из них.
Качественные свойства системы распознавания можно оценить величиной т, представляющей относительное превышение максимума гистограммы р [/], / е /, который соответствует правильно распознанно-
тахр[/] - тах2р [/] тахр[ / ]
(12)
Рисунок 5 - Гистограмма голосов
Значение (12) находится в пределах отрезка [ 0, 1 ]. Чем ближе к единице величина т, тем выше будет надежность построенной системы распознавания. Для гистограммы рис. 5 значение т равно 0,67. Понятно, что с увеличением количества распознаваемых классов, а также при росте числа используемых фрагментов величина (12) снижается. Кроме того, она снижается при увеличении порога 8, т. к. с ростом 8 растет число фрагментов, участвующих в голосовании.
Проведя анализ эталонов (рис. 3), можно отметить, что даже для полного набора фрагментов в количестве 400 характерным есть то, что первый и второй эталоны отличаются от других в смысле построенной модели распознавания всего приблизительно в 170 фрагментах (43 % от общего количества), третий эталон - в 100 фрагментах (25 %). Эта ситуация в целом является типичной для задач распознавания изображений в компьютерном зрении, когда только часть имеющейся визуальной информации может быть применена с пользой. Приведенные процентные соотношения означают величину части пикселей носителя конкретного эталона относительно общего их числа. Конечно, идеальным для фрагментного представления был бы случай, когда решение базируется на максимально возможном числе различающихся для разных эталонов фрагментов. Для эталонов рис. 3 увеличения информативного количества фрагментов можно достичь, например, путем уменьшения размера эталонного изображения. Другим способом может быть выбор нужного количества информативных фрагментов в диалоговом режиме.
Основываясь на характеристиках эталонов, выбиралось значение порога 8т для максимума сходства. Конкретно оно равнялось 8т = 0, 3 для числа фрагментов, равного 10, и 8т = 0, 1 при числе фрагментов, равном 100. В целом априорно задаваемое значение 8т является компромиссом между надежностью распознавания на основе ограниченного числа фрагментов и устойчивостью к локальным искажениям.
Уровень действия аддитивного шума оценивался величиной отношения сигнал - шум в виде цА = = А/(а), где А - средняя яркость информационной части (носителя) для набора эталонов, а - среднеквадратичное отклонение шума с нулевым математическим ожиданием. Для эталонов рис. 3 величина средней яркости равнялась 162.
В табл. 1 приведены значения показателей, отражающих качество распознавания путем голосования фрагментов для разных методов при 8 = 10 % и количестве фрагментов, равном 10. Вариант полного
т=
набора включает 400 фрагментов. Эксперименты показали, что для порога сходства 8 = 5 % большинство из рассматриваемых подходов при действии шума не обеспечивают устойчивых оценок. Величина цА соответствует максимальному значению соотношения сигнал - шум для аддитивного шума, когда вероятность распознавания остается в пределах выше 0,95. Значе-
1ос и
ние цА - это максимальный уровень аддитивных помех при одновременном действии локальной помехи, когда вероятность распознавания остается большей 0,95. Уровень локальной помехи р оценивался соотношением площадей сигнала и помехи в пределах области эталона [8]. В таблице приведены данные при величине р = 2 (примерно третья часть искажена помехой). Здесь приведены также в сравнительном плане значения времени распознавания (в условных величинах).
Таблица 1 - Значения показателей, отражающих качество распознавания
"" —■—Параметры Метод ас| Ца цА" (в = 2) Время
Совместное голосование 5 6 6
Совместное голосование с поддержкой 4,5 5,5 14
Полный набор фрагментов 3,5 4,5 90
Независимое голосование 5,2 6,3 9
Независимое голосование с поддержкой 4,5 5 15
Величина т для рассматриваемых методов без помех находилась в пределах 0,88-1,0, а при помехе с уровнем цА = 5 снижается до диапазона 0,7-0,85. Для методов с поддержкой значение т в целом на 15 % выше, чем без поддержки.
Анализ количества фрагментов, представляющих изображение, показал следующее. Например, при цА = 4 вероятность распознавания для метода совместного голосования с поддержкой при использовании как 5, так и 10 фрагментов равна примерно одной и той же величине 0,85. Таким образом, при высоком уровне шума незначительное увеличение количества фрагментов (от 5 до 10) не приводит к нужному повышению надежности. При снижении же уровня шума (цА > 5) вероятность распознавания и так достаточно высока (больше 0,95). Однако с увеличением количества фрагментов пропорционально растет и время распознавания, поэтому при невысоком уровне шума естественным выглядит использование как можно меньшего количества фрагментов.
Наиболее сильно в плане помехозащищенности выглядит способ полного набора фрагментов, при котором решение опирается на число фрагментов, равное 400, что значительно больше, чем у других подходов (5-20). Как видим из таблицы, надежность этого метода существенно выше (цА = 3, 5), чем при примене-
нии остальных подходов. В то же время и быстродействие данного подхода значительно ниже. Для аддитивных помех помехозащищенность метода голосования с полным набором фрагментов сравнима с характеристиками классического корреляционного метода (ца = 3 [1]).
Повышения надежности при действии помех можно достичь либо весомым увеличением количества фрагментов, либо путем использования поддержки (что более эффективно, т. к. поддержку можно в нужное время отключить).
Применение поддержки, как показали наши эксперименты, в большей степени эффективно при независимом голосовании. Так, при числе фрагментов 10 надежность растет при использовании поддержки, т. к. необходимое соотношение сигнал - шум снижается от 5,2 до 4,5 (табл. 1). Еще более эффективна поддержка для этого вида голосования при малом числе фрагментов. Для независимого голосования при уровне помех цА = 5,5 величины вероятности составили 0,80 и 0,95 соответственно.
Как видим, разные методы голосования в разной степени реагируют на применение поддержки. Причина заключается во внутреннем содержании подходов, т. к. совместное голосование уже включает в себя элементы группового принятия решения, что в целом повышает надежность.
Применение поддержки за счет расширения базы принятия решений снижает величину случайного совпадения фрагментов, поэтому поддержка непосредственно влияет на достоверность распознавания.
Исходя из данных табл. 1, по уровню помехозащищенности к аддитивному шуму методы можно расположить в следующем порядке: полный набор фрагментов, совместное голосование, независимое голосование. Голосование с поддержкой занимает в этом отношении промежуточное положение.
По быстродействию рассмотренные варианты корреляционного подхода, исходя из компьютерного моделирования, можно расположить следующим образом: совместное голосование, независимое голосование, полный набор фрагментов. При этом совместное голосование реализуется примерно в 15 раз быстрее, чем полный набор фрагментов.
ВЫВОДЫ
Корреляционные методы распознавания изображений, основанные на принятии решения системой фрагментов путем голосования, имеют перспективу применения в компьютерном зрении по причине их высокой устойчивости к локальным и фоновым искажениям объектов. Применение ограниченного по объему фрагментного представления значительно сокращает вычислительные затраты, а использование принци-
пов голосования не приводит к усложнению обработки. Рассмотренный спектр подходов к корреляционному голосованию позволяет провести качественный анализ и сделать выводы по применению в практических задачах.
Научная новизна предложенного метода на основе голосования фрагментов состоит в обосновании моделей иерархической меры для сопоставления изображений, которая нацелена на повышение эффективности процедур распознавания в условиях неполной информации об анализируемых объектах.
Практическая значимость подхода заключается в повышенной устойчивости к локальным помехам по сравнению с классическими подходами при сохранении достаточной помехозащищенности к шуму, что подтверждается экспериментами на реальных полутоновых изображениях.
Несомненным достоинством подхода являются его универсальность в плане учета разнообразия возможных условий, возникающих при распознавании визуальных объектов.
Дальнейшие исследования будут направлены на теоретическое обоснование правил принятия решений по множеству отношений фрагментов.
ПЕРЕЧЕНЬ ССЫЛОК
1. Гороховатский В, А, Распознавание изображений в условиях неполной информации / Гороховатский В. А. -Харьков : ХНУРЭ, 2003. - 112 с.
2. Баклицкий В, К, Методы фильтрации сигналов в корреляционно-экстремальных системах навигации / Баклицкий В. К., Бочкарев А. М., Мусьяков М. П. -Москва : Радио и связь, 1986. - 216 с.
3. Гороховатский В. А. Структурно-иерархические методы определения сходства изображений объектов // АСУ и приборы автоматики. - 2005. - Вып. 131. -С. 55-62.
4. Шапиро Л. Компьютерное зрение : пер. с англ. / Шапиро Л., Стокман Дж. - М. : Бином. 2006. - 752 с.
5. Гороховатский В. А. Применение процедур голосования в структурных методах распознавания визуальных объектов / Гороховатский В. А. // Вестник НТУ ХПИ. Системный анализ, управление и информационные технологии. - 2006. - № 39. - С. 132-140.
6. Kim S. Biologically motivated perceptual feature: generalized robust invariant feature / Kim S., Kweon I.-S. // Asian Conference of Computer Vision (ACCV-06), 2006. -P. 305-314.
7. Путятин E. П. Распознавание изображений в пространстве инвариантных локальных признаков / Путятин Е. П., Гороховатский В. А., Кузьмин С. В. // Радиоэлектроника и информатика. - 2006. - № 1(32). -С. 69-73.
8. Путятин E. П. Обработка изображений в робототехнике / Путятин Е. П., Аверин С. И. - М. : Машиностроение, 1990. - 320 с.
Надшшла 16.05.2008
Наведено результати досл1джень i3 застосування процедур голосування у кореляцшних методах розтзна-вання зображень. Вивчено способи формування систем фрагментiв, формалiзована постановка задачi розтзна-вання, проаналiзовано рiзноманiтнi варiанти голосування, шляхи вибору ознак фрагментiв та встановлення вiдповiдностi мiж ними. Експериментальт результати пiдтверджують ефективтсть застосування тдходу.
The results of application of voting procedures in correlation methods of image recognition are shown. The ways of systems of fragments construction are studied. The recognition problem is formalized. The variety of voting procedures, the ways of choosing fragment characteristics and the estab-lishment of the conformity between them are analyzed. The efficiency of the suggested approach is experimentally.
УДК 519.85
И. В. Гребенник, А. В. Баранов
ОЦЕНКИ МИНИМУМА ВЫПУКЛЫХ ФУНКЦИЙ НА КЛАССАХ КОМБИНАТОРНЫХ МНОЖЕСТВ ПЕРЕСТАНОВОК
Исследуются задачи оптимизации выпуклых функций на комбинаторных множествах. Строятся оценки минимума выпуклых функций для классов комбинаторных множеств перестановок, при наличии или отсутствии линейных ограничений на переменные. Построение оценок включает в себя дополнительную процедуру оптимизации. Приводятся примеры, анализируются результаты вычислительных экспериментов.
ВВЕДЕНИЕ
При математическом моделировании классические комбинаторные множества часто с избытком описыва-© Гребенник И. В., Баранов А. В., 2009
ют область допустимых решений комбинаторных оптимизационных задач [1]. В работе [2] введен новый класс комбинаторных множеств - композиционные образы комбинаторных множеств, которые позволяют более адекватно описывать области допустимых решений сложных задач комбинаторной оптимизации. Для решения задач оптимизации на композиционных образах комбинаторных множеств необходимо применять методы комбинаторной оптимизации, которые бы учитывали особенности введенного класса комбинаторных множеств.