Научная статья на тему 'Сравнение цвета в задачах проверки подлинности документов, удостоверяющих личность'

Сравнение цвета в задачах проверки подлинности документов, удостоверяющих личность Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
132
21
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КВАНТИЗАЦИЯ / СТЕПЕНЬ ПОДОБИЯ / КАРТА КОЭФФИЦИЕНТОВ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы —

Представлен метод описания цветных объектов на сложных сценах, а также алгоритм сравнения таких объектов по цветовому тону, используя метод гистограмм и их квантизацию. Размеры объектов, их форма и цвет могут быть произвольными. Методы выделения объектов могут отличаться от рассматриваемых.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы —

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARISON OF COLOR IN AUTHENTICATION OF IDENTITY DOCUMENTS TASKS

Method of color objects description in complex scenes and the algorithm of comparison of color tone on such objects using histogram method and quantization is presented. HSL color model is used in proposed algorithm. The size of objects and color can be arbitrary. Methods of objects detection can differ from discussed.

Текст научной работы на тему «Сравнение цвета в задачах проверки подлинности документов, удостоверяющих личность»

_Доклады БГУИР_

2013 № 7 (77)

УДК 004.932.2

СРАВНЕНИЕ ЦВЕТА В ЗАДАЧАХ ПРОВЕРКИ ПОДЛИННОСТИ ДОКУМЕНТОВ, УДОСТОВЕРЯЮЩИХ ЛИЧНОСТЬ

Е.И. СТЕПАНЬКОВА, НА. ВОЛОРОВА

Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 220013, Беларусь

Поступила в редакцию 17 июня 2013

Представлен метод описания цветных объектов на сложных сценах, а также алгоритм сравнения таких объектов по цветовому тону, используя метод гистограмм и их квантизацию. Размеры объектов, их форма и цвет могут быть произвольными. Методы выделения объектов могут отличаться от рассматриваемых.

Ключевые слова: квантизация, степень подобия, карта коэффициентов.

Введение

На данный момент все большее распространение получают цветные цифровые фото- и видеокамеры. Это и системы видеонаблюдения, и медицинское оборудование, и многое другое. Их использование, в свою очередь, приводит к необходимости анализа объектов на сложных цветных сценах. Эффективные методы описания цветных объектов необходимы при решении таких задач как распознавание, верификация и многих других. Существуют различные подходы и методы для описания и выделения объектов произвольной формы, размеров и цвета, и под каждую задачу разрабатываются алгоритмы, которые дают приемлемые результаты для конкретных условий их эксплуатации [1]. Причинами, которые могут влиять на устойчивость работы таких систем, являются изменения условий освещенности (интенсивность и спектр), цветовой разброс однотипных объектов и пр. Представленный в данной работе алгоритм позволяет производить сравнение объектов при разбросе цветового тона, что значительно повышает устойчивость работы подобных систем. Разработка алгоритма производилась для решения задачи распознавания и верификации документов (паспортов, идентификационных карт и др.) по их цветным фотографическим изображениям. Особенностями данной задачи является то, что местоположение цветных объектов на изображении является постоянным, что позволяет использовать простую схему описания изображения документа в целом. На изображениях документов зачастую присутствуют блики, голограммы и другие элементы, которые делают невозможным выделение структурных особенностей (рис. 1).

Рис. 1. Пример паспорта Болгарии, на котором присутствуют блики и голограммы

К тому же многие документы имеют схожий формат заполнения, и отличаются лишь по цвету бланка (рис. 2).

Рис. 2. Пример паспортов Швеции, имеющих схожий формат заполнения, но отличающихся по цвету

бланка

Указанные факторы ухудшают работу структурных алгоритмов распознавания. Именно поэтому возникла задача сравнения цветных изображений, вариант решения которой представлен в статье.

Обоснование выбора цветовой модели

Большинство современных цветовых моделей ориентированы либо на устройства цветовоспроизведения, либо на определенные прикладные задачи, в которых работа с цветом является непосредственной целью. Аппаратно-ориентированными цветовыми моделями, наиболее часто используемыми на практике, являются модель RGB для цветных мониторов и широкого класса цветных видеокамер, модели CMY и CMYK для цветных принтеров. Для нашей задачи более подходящими являются другие цветовые модели, такие как HLS и HSV. Одним из преимуществ этих моделей является лучшее соответствие восприятию цвета человеком. Например, описывая цвет автомобиля, человек не говорит о процентном содержании в нем красного (R), зеленого (G) и синего (B). Человек описывает объект с помощью цвета (цветового тона), насыщенности и светлоты либо яркости. Вторым неоспоримым преимуществом является разделение яркостной и цветовой составляющей на изображении, что дает возможность использовать многие из полутоновых методов обработки для решения тех или иных задач. Особенности данных моделей таковы, что с каналами можно работать независимо друг от друга.

Недостатком данных цветовых моделей является погрешность вычисления насыщенности при переводе из RGB. Для системы HLS это проявляется как при значениях RGB близких к 0, так и близких к 255, а для HSV - лишь для близких к 0 значений. Это означает, что степень доверия к насыщенности при таких условиях не должна быть высокой.

В данной задаче будем использовать цветовую модель HLS [2].

Описание объекта (сцены)

Стоит отметить, что способ описания в большой степени зависит от решаемой задачи. Важное значение имеют такие факторы как форма и размеры объектов, их контраст относительно сцены, постоянство различных параметров объекта и сцены. Под каждую конкретную задачу можно построить такое описание, которое будет наиболее полно соответствовать существенным особенностям объекта (сцены). Для объяснения работы метода будет использоваться довольно простое описание, которое позволяет наглядно продемонстрировать работу предлагаемого алгоритма. Алгоритм состоит из двух частей - этап обучения и этап проверки.

Этап обучения состоит из следующих шагов:

- разбиение изображений на элементарные области (далее - ЭО);

- расчет гистограммы цветового тона для каждой элементарной области;

- сравнение гистограмм ЭО предыдущего и следующего изображений;

- формирование карты стабильности.

Этап проверки состоит из следующих шагов:

- разбиение изображения на элементарные области;

- расчет гистограммы цветового тона для каждой элементарной области;

- сравнение гистограмм ЭО с учетом карты стабильности;

- формирование результата сравнения.

Структурная схема работы алгоритма представлена на рисунке.

Рис. 3. Структурная схема работы алгоритма

Для получения описания документа необходимо разбить изображения на некоторое количество одинаковых по размеру прямоугольных областей. В нашем случае на изображение накладывается прямоугольная сетка, разбивающая его на мелкие области.

Далее, рассчитываются гистограммы цветового тона для каждой ЭО. Расчет гистограммы цветового тона имеет свою особенность. В гистограмму вводятся два дополнительных столбца. Первый из них - это количество «черных» пикселей, т.е. пикселей с низкой яркостью. Второй дополнительный столбец гистограммы предназначен для «серых» пикселей - для тех, у которых значения насыщенности являются недостаточно высокими. Для каждой задачи задаются значения яркости и насыщенности, начиная с которых разработчик считает целесообразным оценивать цветовую составляющую, т.к. при низких значениях яркости или насыщенности даже значительное изменение цветового тона для человека будет неразличимо. Формирование столбца «черных» пикселей происходит по следующим правилам:

- пиксели, имеющие значения яркости меньше нижней границы интервала, относятся к «черным»;

- пиксели, имеющие значения яркости больше верхней границы интервала, относятся к «цветным»;

- пиксели, яркость которых попадает внутрь заданного интервала, распределяются между столбцом «черных» и «цветных» пикселей с коэффициентами, определяемыми формулами

к

color

Lcur Lm

- L

kblack ~ 1 кcolor,

(1) (2)

где Ьсиг - текущее значение яркости, Ьтп - нижняя граница интервала, Ьтах - верхняя граница интервала.

Другими словами, часть количества пикселей, попадающих внутрь заданного интервала, относится к «черным», а часть - к «цветным».

В решаемой задаче использовались значения Ьтп = 10, Ьтах = 15 . Аналогичным образом производится расчет столбца «серых» пикселей по каналу насыщенности.

Данные интервалы перехода вводятся для исключения ситуации значительного различия гистограмм при значениях яркости и насыщенности близких к граничным. Для примера на рис. 4 представлены гистограммы канала яркости для двух элементарных областей, имеющих одинаковый цветовой тон, например зеленый.

Рис. 4. Гистограммы цветового тона двух элементарных областей, у которых цветовой тон одинаковый

Если фиксированный порог яркости для данного класса изображений будет равным 10, то для рассматриваемых элементарных областей гистограммы цветового тона будут выглядеть так, как представлено на рис. 5. Результат пересечения получится равным 40 % площади области.

Рис. 5. Гистограммы цветового тона двух элементарных областей, у которых порог яркости равен 10

Если же использовать интервал яркости, например, от 8 до 12, и рассчитать гистограмму с учетом вышеуказанных формул, то процент совпадения составит уже 75 %.

Рис. 6. Гистограммы цветового тона двух элементарных областей, у которых порог яркости в пределах

от 8 до 12

Сравнение гистограмм цветового тона

Сравнение гистограмм цветового тона на этапе обучения и на этапе проверки происходит одинаково. Сравнение происходит в 3 этапа:

1) квантизация гистограммы цветных пикселей;

2) сравнение полученных квантов;

3) формирование результата сравнения с учетом «серых» и «черных» пикселей.

Для выделения пиков цвета гистограмма цветового тона квантуется. Для этого формируется интегральная гистограмма, которая получается из исходной путем суммирования пикселей в окне фиксированного размера. Для данной задачи окно задается шириной 20 градаций. Далее по интегральной гистограмме находится максимальный пик, и на исходной гистограмме цветового тона выделяется квант, соответствующий центру тяжести пикселей в фиксированном окне, а все значения в этом окне исходной гистограммы обнуляются. Поиск начинается заново, пока не найдутся все кванты на гистограмме. Если расстояние между двумя найденными квантами на гистограмме меньше заданного окна, то данные кванты объединяются в один. Это необходимо для того, чтобы в одном окне присутствовал только один квант. Далее значения в квантах нормируются в интервал [0, 1], чтобы можно было обрабатывать изображения в различных разрешениях.

Для сравнения квантов необходимо выделить соответствующие кванты на гистограмме исходного изображения и на гистограмме изображения, полученного на этапе обучения. Кванты считаются соответствующими, если расстояние между ними не более заданного, в противном случае кванты считаются несоответствующими. Для данной задачи это расстояние равно заданному окну. Степень подобия соответствующих квантов считается как

тС] = (1—|р, -рЛ) ■ кИ, (3)

где | р, — Pj| - модуль разности величин двух соответствующих квантов на 1 -том и ] -том

изображениях, кИ - это коэффициент соответствия квантов (рис. 7), рассчитываемых по формуле:

кИ =

1,(т — т.) < 10

1—(| т — т I —10) /10,10 < (т — т}) < 20,

0,(т — т ) > 20

(4)

где | т — т. | - модуль разности положений двух соответствующих квантов на I -том и ] -том изображениях.

Рис. 7. Расчет коэффициента соответствия квантов в зависимости от модуля разности положений квантов

После обработки всех соответствующих квантов рассчитываются степени различия несоответствующих квантов (на каждом сравниваемом изображении):

тКу =£ Р Р] ,

(5)

где Рг - величина несоответствующего кванта на 1 -том изображении, р] - величина несоответствующего кванта на ] -том изображении.

Общая степень подобия по цветовому тону рассчитывается по формуле:

тИШу = тСу — тЦ.. (6)

Общая степень подобия элементарных областей по цвету рассчитывается как

Р = 0,8 • тИиву + 0,1 ■ тВ1аску + 0,1- тОгау, (7)

где тВ1аск] - результат пересечения соответствующих столбцов «черных» пикселей на 1 -том и ] -том изображениях, тСгау ] - результат пересечения соответствующих столбцов «серых» пикселей на 1 -том и ] -том изображениях, I - индекс элементарной области.

Формирование карты коэффициентов

На этапе обучения формируется карта стабильности. Коэффициент стабильности для

каждой элементарной области рассчитывается по формуле

Ъ- — 1 ^шах р1

к = 1--/ < Р < / ,

1 1 _1 ' шт г1 шах'

шах шп

(8)

где Р[ - среднее арифметическое степеней подобия для данной области по всем

изображениям, ?шП - установленный порог, ниже которого коэффициент стабильности к1

считается равным 0. Для решаемой задачи этот порог задается 0,7, 1шах - установленный порог,

выше которого коэффициент стабильности к1 считается равным 1. Для решаемой задачи этот

порог задается 0,9, I - индекс элементарной области.

Другими словами, коэффициент стабильности является средней степенью совпадения цвета для определенных элементарных областей. Карта стабильности определяет вклад каждого значения элементарной области в общий результат.

Формирование результата сравнения с учетом карты коэффициентов

На этапе проверки общая степень подобия на изображении рассчитывается с учетом коэффициентов из карты стабильности:

n

X min(1' Pi +(! - k)) • k1

Prob = ^-n-' (9)

i=0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где p - степень подобия цвета l -той элементарной области, 1 — k - средняя степень

различия цвета l -ой элементарной области, kf - вес сегмента l -той элементарной области,

n - количество элементарных областей; kf вводится для того, чтобы занизить вероятности непохожих областей.

Заключение

Данный алгоритм был разработан для использования в системе распознавания документов. Полный цикл сравнения изображений, полученных с камеры с разрешением 3 Мп, происходит менее чем за 1 мс. Использование свойства независимости цветового тона от уровня освещенности, а также подтверждение пространственного распределения яркости позволили решить задачу распознавания типа документа без применения структурных алгоритмов.

COMPARISON OF COLOR IN AUTHENTICATION OF IDENTITY DOCUMENTS TASKS

E.I. STEPANKOVA, N.A. VOLOROVA

Abstract

Method of color objects description in complex scenes and the algorithm of comparison of color tone on such objects using histogram method and quantization is presented. HSL color model is used in proposed algorithm. The size of objects and color can be arbitrary. Methods of objects detection can differ from discussed.

Список литературы

1. Forsyth D.A., Ponce J. Computer Vision: A Modern Approach. 2002.

2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М., 2005.

i Надоели баннеры? Вы всегда можете отключить рекламу.