Научная статья на тему 'Определение вектора признаков в задаче идентификации по цифровому изображению'

Определение вектора признаков в задаче идентификации по цифровому изображению Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2700
155
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАЗ / ЦИФРОВОЕ ИЗОБРАЖЕНИЕ / ВЕКТОР ПРИЗНАКОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Котов K. A., Токарев В. Л.

Предлагается метод получения и отображения вектора признаков распознаваемого изображения, предоставляющий системе идентификации личности адаптированные данные, на основе которых возможно построение широкого спектра классификаторов, что позволит значительно минимизировать риски ошибочного распознавания объектов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Котов K. A., Токарев В. Л.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Определение вектора признаков в задаче идентификации по цифровому изображению»

УДК 004.825

^ A. Котов, аспират, 33-24-45, [email protected] (Россия, Тула, ТулГУ),

В. Л. Токарев, д-р. техн. наук, [email protected] (Россия, Тула, ТулГУ)

ОПРЕДЕЛЕНИЕ ВЕКТОРА ПРИЗНАКОВ В ЗАДАЧЕ ИДЕНТИФИКАЦИИ ПО ЦИФРОВОМУИЗОБРАЖЕНИЮ

Предлагается метод получения и отображения вектора признаков распознаваемого изображения, предоставляющий системе идентификации личности адаптированные данные, на основе которых возможно построение широкою спектра аас-сифткаторов, что позволит значительно минимизировать риски ошибочного распознавания объектов.

Ключевые слова: образ, цифровое изображение, вектор признаков.

На практике часто возникает задача поиска человека, точнее, сведений о нем, хранящихся в бае данных, по имеющейся фотографии с изображением человека в случайном ракурсе. Но, несмотря на высокую исследовательскую активность в данной области, существует ряд задач, не нашедших пока удовлетворительных решений.

Основными проблемами являются высокие требования к условиям съёмки изображений. Изображения эталонов и объектов распознавания зачастую должны быть получены в близких условиях освещённости, одинаковом ракурсе и должна быть проведена качественна предварительна обработка, приводяща изображения к стандартным условиям (масштаб, поворот, центрирование, выравнивание яркости, отсечение фона). Нежелательно наличие таких факторов, как очки, изменения в причёске, выражении лица и прочих внутриклассовых вариаций. Задача иденификации личности по изображению лица в произвольном ракурсе ставит в тупик большинство существующих методов распознавания.

Рассматривается подход к решению этой задачи, основанный на нахождении вектора признаков, инварианных к ракурсу изображения лица, и оценки его оптимаьной рамерности. Опишем метод сравнения изображений, а точнее полученных из них векторов признаков при идентификации личности человека по цифровому изображению. В качестве априорной информации выступают наборы векторов признаков, полученных с эталонных изображений в двух плоскостях.

Идентификация объекта по его цифровому изображению в общем случае предполагает выполнение следующей последовательности действий:

1. Предварительная обработка и нормализация цифрового изображе-

ни.

2. Выделение информативных сигнаов на изображении, которые необходимы для дальнейшего процесса распознавания, например, по-

строение контура и формирование односвязного контура, подчёркивание некоторых черт лица.

3. Определение множества информативных признаков для идентификации личности по изображению лица.

4. Сравнение изображения с эталоным на основе некоторой метрики и определение вероятности совпадения личностей на распознаваемом и эталонном изображениях.

Первый этап необходим, так как ни одна система регистрации не обеспечивает идеального качества изображений исследуемых объектов. Изображения в процессе формирования их изображающими системами (фотографическими, голографическими, телевизионными) обычно подвергаются воздействию различных случайных помех или шумов. Наиболее простыми и эффективными способами сглаживания подавления шумов являются низкочастотная и медианна фильтрация. В перечень основных действий, которые могут быть выполнены над изображением на стадии предварительной обработки или нормализации, обычно входят:

• поиск области лица на изображении;

• поворот изображения;

• масштабирование;

• кадрирование (вырезание прямоугольной области с заданными раме-рами из полученного в результате предыдущих шагов изображения);

• выравнивание яркостных характеристик изображения,

т. е. применение различных фильтров, изменяющих контраст, интенсивность и т. д., в зависимости от исходных значений параметров.

Возможные решения задачи предварительной обработки изображений достаточно хорошо описываются в [1,2]. Большинство алгоритмов поиска области лица на изображении дают неудовлетворительные результаты при подаче на вход слабоконтрастных фотопортретов. Надёжно работающим при подаче на вход как изображений, полученных сканированием удостоверений личности, так и фотопортретов, поступивших с видеокамеры, с однотонным и сложным (пёстрым) фоном, алгоритмом является следующий [3].

Шаг 1: Выделение краёв на фотопортрете А с помощью оператора Со-беля и нвертирование полученного изображения А':

А = Б (А),

А' = 0-А',

где £ - фильтр Собеля; О - константа, равная количеству уровней яркости изображения, обычно О = 255.

Шаг 2: А' бинаризируется в соответствии с методом Отсу:

Оі (А')

0.4 <Т°рі

1, >Т°рі и

где Т°р - оптимальный для А' порог бинаризации, вычисленный в соответствии с дискриминантным критерием максимальной межклассовой (объект/фон) дисперсии уровней яркости.

Шаг 3: Для А" строится пирамида, состояща из множества изображений

мі = {а,", а" ,...а;},

где A"t - изображение с размерами (т/с) х (п/с), параметр с подбирается экспериментально как компромисс между качеством и временем обработки. Каждый пиксель а'\ вычисляется в соответствии с выражением

1 і+с/2 І+c /2

а" (К Л~2 X Xа " (X У),

с х-і-с /2 у=і-с / 2

Размеры изображений А" отличаются, соответственно и размеры лица (в пикселя) будут варьироваться. При сопоставлении эталона фиксированного размера (в результате экспериментов выбран эталон С (6x5)) с каждым из А'\ разница в масштабе не играет существенной роли - там, где мозаичное изображение области лица будет совпадать по рам еру с эталоном, функция сравнения ^ (А "і, С) будет иметь минимальное значение. В кче-стве І7 (А"ь С) может быть использована городска метрик.

В результате, оценив каждую из областей изображения, где может находиться лицо, выбирается та, при сравнении с которой ^ (А "і, С) даёт

минимальный отклик. Если раница в значениях оценки ^ для нескольких

областей минимальна или отсутствует, то поверяются соответствующие им области на смежных мозаикх А "і1, А"і+1 и вычисляется комплексна оценка.

На втором этапе производится выделение контуров лица как наиболее информативных сигнлов, необходимых для последующего определения вектора признаков и построения на основе этого вектора решающих правил. Помимо выделения контуров встаёт задача построения односвязных или нера-рывных контуров, которые наиболее удобны при использовании лгоритмов и методов контурного анаиза изображений.

Получение контура можно рассматривать как сегментацию путем выделения границ объектов. При таком способе сегментации объекты представляются их границами. Выделение границ объектов можно рассматривать и кк самостоятельную практическую задачу, не связанную непосредственно с сегментацией. Границы - основа формирования различных признаков и грамматик при распознавании изображений.

Понятие границы объекта так же, кк и понятие самого объекта, невозможно точно формлизовать в терминах цифрового изображения В (і,

І). Из эвристических соображений граничные точки ищутся как точки резкого перепада функций яркости.

Так как наиболее простой способ определения точек перепада фун-ции - это дифференцирование, то сначла нужно получить непрерывную

модель изображения. Для этого заменим растр D на прямоугольную область в плоскости (x, y) и определим изображение как функцию B (x, y). Для этого (абстрактного) изображени будем считать, что B (x, y) - дифференцируема функция своих аргументов. Перепад яркости в точке (xO, yO) определяется в этом случае как норма градиена функции B (x, y) в точке (xO, yO), т. е. норма вектора.

Норму вектора можно определить раличными метриками, однако в сиу дискретности поля зрени D непосредственное вычисление grad B (x, y) невозможно. Чтобы воспользоваться дифференцированием для определения перепада яркости в точке, необходимо выбирать один из двух путей:

- с помощью интерполяции перейти от функции B (i, j) к функции B (x, y), заданной в прямоугольной области плоскости (x, y), содержащей все точки растра D;

-воспользоваться методами численого дифференцирования,

т. е. дифференцирования таблично заданной функции.

Первый путь получи название метода функциональной аппроксимации. Он связан с большими вычислительніми затратами и в задачах робототехники не получил большого распространения. Наиболее распространенны является второй путь, называемый градиенным методом, методом контрастирования, или методом пространственного дифференцирования.

Алгоритмы пространственного дифференцировани основаны на вычислении гради єна функции яркости B (i, j) с помощью одной из численных формул. Выбор формулы дискретного дифференцирования является главнім отличием одного алгоритма от другого.

Общий подход к обнаружению перепадов на одноцветном изображении иллюстрируется в виде блок-схемы на рис. 1.

Контрастирование По роговый

B(i,j) перепадов G(i,j) детектор E(i,j)

Рис. 1. Пороговая система обнаружения перепадов

Исходное изображение, представленное массивом чисел В (1,])„ подвергается линейной или нелинейной обработке с тем, чтобы усилить перепады яркости. В результате образуется массив чисел О ((,]), описывающий изображение с подчеркнутыми изменениями яркостей. Переход В (I, ]) ^ О (I, ]) является контрастированием изображения. Затем выполнется операция сравнения с порогом и определяется положение элементов изобра-жени с ярко выраженными перепадами.

Контрастирование является только частью задачи выделени границ. Для выделени границ следует сформировать критерий принадлежности точки (I, ]) границе области объектов. Для формирования такого критери

выбирают некоторый порог Т и точку (і, j)ЄD считают граничной, если О (и 1) >Т. При отсутствии априорной информации для выбора порога Т его можно найти тем же путем анализа гистограммы изображения О (і, і), примерно, что и порог, разделяющий яркость объектов и фона.

Формирование односвязных контуров основано на сравнении по ряду критериев элементов дискретизации, описывающих исходную многосвязную геометрическую систему.

Пусть имеется исходный массив контурных точек - поле поиска. При формировании в памяти машины любого односвязного контура можно выделить ячейку памяти А для записи начального элемента выделяемого конура и ячейку памяти Т для записи текущей опорной точки, по отношению к которой в поле поиск имеется ближайшая точка, принадлежаща этому конуру. Начальный пиксел А может определяться рядом способов, в данной работе - с помощью обхода плоскости сверху вниз и слева направо.

Процесс формирования односвязного конура состоит из трех этапов:

- выбор опорной точи Т;

- нахождене точки в поле поиск, ближайшей к опорной;

- пересылка найденого в поле поиск элем єна контура в массив точек формируемого односвязного контура.

Условиями выбора ближайшей точки по отношеню к опорной являются следующие:

а) точки должны иметь одинаковую яркость:

Вт = вк, (1)

где ВТ иВк - яркости соответствено опорной точки Ти выбраной из массива поля поиска точк к;

б) точки должны располагаться близко друг к другу. Это условие проверяется по неравенству

(хт ~хк)2 +(Ут -Ук)2 <2. (2)

Однако этих двух условий не всегда бывает достаточно для правильного выбора точки к, ближайшей к опорной точке (рис. 2).

Рис. 2. Неоднозначная ситуация для получения односвязного контура

Здесь условиям (1) и (2) для опорной точи 2 удовлетворяют сразу точки 1, 3 и 4. Поэтому для правильного выбора точи к необходимо дополнительное условие, характеризующее направление движения при формировании односвязных контуров. С этой целю вводится понятие элементарного вектора - вектора V, соединяющего два элемента изображения (точки выделяемых контуров - точки Т и к, параметры которых удовлетворяют условиям (1) и (2)) и направленного отточки Тк точке к. Всего таких векторов VI может быть восемь. На рис. 3 один из восьми векторов VI указывает направление входа вектора ¥8 в к/+1-й элемент дискретизации и выходит из точки Т/, которая была опорной на предыдущем шаге препарирования.

6

кі+і 5 —

4

Рис. 3. Возможные положения элементарного вектора Vi

Угол а, характеризующий направлене этого вектора, отсчитывается от направления аналогичного вектора V, имевшего место на предыдущем шаге препарирования.

Если в кчестве едницы угла поворота элементарного вектора возьмем угол, равнш 45°, то кждому из восьми векторов Уі можно поставиь в соответствие некоторое число иі=Епґ (4Ыж) .

Теперь можно счиать, что из всех точек, удовлетворяющих условиям (1) и (.2), ближайшей считается та, которой соответствует число иі = иітіп = шіпУі [Епґ (4ап)]. Это условие и берется в качестве дополниель-ного.

На каждом шаге препариовани сравнваются параметры начальной А и текущей опорной Т точек. При совпадени параметров эти точек выделене односвязного контура зaкaнчнaeтcя. Если на очередном і-м шаге поиска новой опорной точки ее не оказывается, то делается шаг назад, то есть за опорную принмается точка Т-1 предыдущего шага препа-рировани и т. д. В этом случае формиование односвязного конура заканчивается тогда, когда нужно сделать шаг назад за начальню точку А.

Третий этап заключается в формиовани множества признаков, опи-сывающи фотопортреты. Наиболее эффектиным и применяемым является

набор из 33 антропометрических точек лица человека. Этим набором признаков уже несколько десятилетий пользуются криминалисты всего мира. На основе этого баового набора были определены: 47 отношений расстояний между ними. Были использованы: два способа оценки исходного набора признаков. Первый, основанный на статистически данных, заключается в анаи-зе отношения Fj= Did/Dim Величины: Did и Dim. определялись следующим образом. Для элементов каждого i-го кластера вычислялись среднее арифметаческое Ми признака Pri и его дисперси Dli:

Mli

gi

К PrJi

j=___________

gi

Dli

gi

K(Mli -Prjiу

J=_______________

1

где i

номер кластера; gi

gi

количество элементов i-го кластера, т. е. количество портретов i-го человека; l - номер признака. Затем определялись среднее Mlm и дисперси Dim от велшин Mli:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

к

Ё Mii

Mim = ----------,D

к

lm

К(Mlm ~Mli) i=1

2

к-1

Здесь к - количество кластеров, т. е. человек, а также среднее Мы и дисперсия Dld величиной-:

к

KDn

M/m = *=—

к

Dld\^

K(Mld ~Dli) i=1______

2

к-1

Геометрический смысл отношения Fi=Di(/Dim следующий: чем больше для данного РгЙ дисперсия величин Мц, тем шире диапазон колебания признака при описании различных людей, тем, следовательно, выше ценность данного признака для их различия. Чем меньше дисперсия величин Dli, тем меньше колебание признака Ргй для портретов одного и того же человека, т. е. тем кучнее будут располагаться в признаковом пространстве элементы одного кластера. Следовательно, чем больше Dlm и одновременно чем меньше Dld, тем лучше признак выделяет образы одного кластера, а величина Fl=Dld/Dlm для такого признака будет стремиться к 0. Такая оценка признака РТ1 не зависит от значений других признаков и от изменения размерности признакового пространства, т. е. любой признак, претендующий на включение в итоговый набор, может быть оценен один раз и сравнен с остальными признаками без пересчёта их оценок.

Второй способ был основан на оценке изменений, происходящих во взаимном расположении обраов в признаковом пространстве при удалении из набора того либо иного признака. Для этого, определив средне значения признаков для обраов каждого кластера и приняв их за координаты центра кластера А- вычислялись средне арифметические расстояний между

центром Лі и образом Б] Иными словами, определялся средний радиус МУі п-мерной сферы1 в признаковом пространстве, в среднем описывающей данный кластер.

На четвёртом этапе для решения задачи сравнения изображений с эталоном предлагается метод, основанный на контурной согласованной фильтрации.

Этот метод использует всю информацию, имеющуюся в контурах ТУЭ и N изображений ЖЭ и Ж, и инвариантен к параметрам линейных преобразований. Из-за небольшого, по сравнению со всеми изображениями, количества контурных точек временные затраті будут сравнительно невысокими. Рассмотрим основные аспекты решения этой задачи.

Пусть получен ряд изображений Ж], ] = 1,2,. . . , М одного и того же объекта, причем положение объекта при формировании изображения не фиксировано: возможны линейные преобразования соответственно с параметрами к, А<р, \^\ переноса, поворота, масштабирования. Кроме того, каждое из изображений Ж] содержит в качестве неизбежных составляющих помехи, вызванные действием ошибок дискретизации В и широкополосного шума п. Ансамбль полученных изображений объекта запишем как

ЖіЛср,| ц|) + В +п\м.

Пусть после прохождения предыдущих этапов обработки изображения в результате применения к Ж] оператора выделения контура и последующей эквализации сформирован ансамбль контуров этих изображений, имеющих одну и ту же рамерность к. Дополнительно осуществим нормировку этих контуров, р а делив элементарный вектор (ЭВ) V] (т) каждого конура на величину своей нормы \\А]'\\. Ансамбль нормированных контуров имеет вид

К;нЛФ,1^1> А п )}1 м •

Все мешающие факторы, имеющие место в первом представлении, окаывают влияние на вид комплекснозначных контуров N н, причем добавились шумы экваизации. Контуры, входящие в этот ансамбль, содержат одинаковое количество ЭВ и имеют одинаковую, равную единице норму. Они отличаются друг от друга только произвольным углом поворота и наличием у каждого вектор-контура случайной составляющей. Процедуру совмещения конуров одного и того же объекта определим следующим обраом.

Пусть \щі(т) \ — модуль ВКФ конуров У],н и N1, н изображений Ж] и Ж, причем \пі,1 (т0) \ — максимаьное значене этого модуля, т. е. \щі(т)\ = \Пі і\тах- Для совмещения контуров необходимо призвести сдвиг начаьной точки а0 одного из изображений на т0 ЭВ таким образом, чтобы отсчет ВКФ \ П], 1 (Отстал максимальнім, т. е. чтобы \ Щі(0)\ = \пі,1\тах (рис. 4).

а т0 т 6 т0=0 т

Рис. 4. Изменение мод ля ВКФ двух контуров: а - при случайном положении контуров; б - при оптимальном

совмещении контуров

Тогда контуры N н (т0) и И, н будут оптимально совмещены по критерию максимальной схожести, задаваемой модулем их ВКФ. Отсюда следует, что для оптимального совмещения при неизвестном сдвиге начальной точки контуров одного и того же изображения необходимо:

1) сформировать нормированные и эквализованные представления этих контуров;

2) вычислить количественную меру схожести совмещенных контуров в виде отсчета П I (т) \ их ВКФ при т = 0;

3) варьируя положение начальной точки одного из контуров, получить максимальное значение меры: | Щ1(0)\ = | П 1\тах-

Эксперименальная часть включала в себя исследовани по зависимости качества распознавания от размера вектора признаков. Эксперимен состоял из рада опытов. В первом опыте была вычислена величина F для каждого из признаков. Затем проводилось распознавание с уменшенным набором признаков. Поочерёдно исключался каждый признак. Кроме коэффициента распознавания, каждый раз вычислялось среднее арифметическое радиусов кластеров Т.

Эксперименты производились на двух базах данных, состоящих из 250 портретов 50 людей, под разными ракурсами и на бае из 96 портретов 16 людей, снятых в различных возрастах: поочерёдно каждый из портретов становился тестируемым, а оставшиеся - базой данных, на которой проводился поиск, т. е. фактически в каждом случае распознавание выполнялось И раз, где N - это размер базы данных.

В результате эксперимента лучший процент распознавани да набор, получившийся при удалении из базового набора двух из тридцати трёх признаков (с наименьшими значениями F). Пиковый коэффициент распознавания составил 67,8 % на бае ракурсов и 94,2 % на бае возрастов. Причём рамер-ность 19 для вектора признаков является пороговой, так как качество распознавания при меньших рлмерностях сил но падает (рис.5).

123456789 ІОН 12131415161718192021222324252627282930313233 размерность вектора признаков

Рис. 5. Изменение процента правильных распознаваний от размерности

вектора на базе ракурсов

В результате исследования были разработан метод получени вектора признаков для идентификации личности по фотопортрету, а также способ отображени вектора в пространство эталона для последующего сравнения. Основными отличительными особенностями метода являются вы1-сокая устойчивость к различим в условиях съёмки распознаваемых изображений и эталонных, стабильная работа при изменении ракурса лица на цифровом изображении, а также устойчивость к возрастным изменениям.

Библиографический список

1. Сойфер В. А. Компьютерная обработка изображений. Ч. 2. Методы1 и алгоритмы: //Соросовский образовательный журнал. №3. 1996. С. 110 -117.

2. Прэтт У. Цифровая обработка изображений; пер. с англ. М.: Мир, 1982. Кн. 2. 480 с.

3.Starovoitov V., SamalD. and Sankur В. Matching of faces in came-raimages and document photographs// Proceedings of bit. Conf. on Acoustic, Speech, and Signal Processing. 2000. Vol. IV. Istambul. P.2349-2352.

4. Самаль Д. И., Старовойтов В. В. Подходы: и методы: распознавани людей по фотопортретам. Минск: ИТК НАНБ, 1998. 54с.

5. Самаль Д. И., Старовойтов В. В. Методика автоматизированного распознавани людей по фотопортретам // Цифровая обработка изображений. Минск: ИТК, 1999. С. 81-85.

6. Самаль Д. И., Старовойтов В. В. Выбор признаков для распознава-ни на основе статистических данных // Цифровая обработка изображений. Минск: ИТК, 1999. С.105-114.

7. Graham D. B. and Allinson N. M. Face recognition using virtual parametric eigenspace signatures Image Processing and its Applications. 1997. P. 106-110.

8. Lanitis A., Taylor C. J. and Cootes T. F. Automatic Interpretation and Coding of Face Images Using Flexible Models.// IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997.

9. Grudin M. A., Lisboa P. J., Harvey D. M. Compact multi-level representation of human faces for identification.// Image Processing and its Applications. 1997. Vol. 19. P. 743-756.

V. Tokarev, K. Kotov

The image signs vector determination for identification task

The method of image signs vector determination and it relation to pattern space are discussed.

Получено 12.11.2009

УДК 004.825

И. Н. Набродова, ведущий инж., (4872) 33-24-45, [email protected] (Росси, Тула, ТулГУ),

В. Л. Токарев, д-р техн. наук, проф., (4872) 33-24-45, [email protected] (Россия, Тула, ТулГУ)

ОЦЕНИВАНИЕ ЗАКОНОМЕРНОСТЕЙ ДЛЯ БАЗЫ ЗНАНИЙ

Рассмотрен метод достижения адекватности лингвистической модели реальной системе, используемой для компьютерной поддержки принятия решений сложных задач.

Ключевые слова: база знаний, оценивание.

Введение. Одной из задач, возникающих пи создании компьютерных систем поддержки принятия решений, является оценивание закономерностей, связывающих различные переменные, массивы: значений которьк имеются в храш:ли1це данных. Хранилищем данных сегодня называют предметно-ориентированное, интегрированное, привязанное ко времен, неизменяемое собрание данных, используемых для поддержки процесса принятия управленческих решений. Предметна ориентация означает, что данные объединены: в категории и хранятся в соответствии с теми областями, которые они описывают, а не в соответствии с приложениями, которые их используют. Привязанность ко времен означает, что хранилище можно рассматривать как собрание исторических данных, т. е. конкретные значения данньгс однозначно связан: с определенными моментами времени.

i Надоели баннеры? Вы всегда можете отключить рекламу.