Научная статья на тему 'Площадь дискового покрытия – дескриптор формы изображения'

Площадь дискового покрытия – дескриптор формы изображения Текст научной статьи по специальности «Математика»

CC BY
390
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Компьютерная оптика
Scopus
ВАК
RSCI
ESCI
Область наук
Ключевые слова
дисковое покрытие / многоугольная фигура / медиальное представление / скелет / радиальная функция / бицикл / disk cover / polygonal figure / medial representation / skeleton / radial function / bicircle

Аннотация научной статьи по математике, автор научной работы — Ломов Никита Александрович, Местецкий Леонид Моисеевич

Рассматривается понятие «ширина фигуры» применительно к объектам сложной формы с целью использования в качестве интегрального морфологического дескриптора в задачах распознавания изображений. Предлагается подход к описанию этого понятия на основе покрытия фигуры дисками определенного размера. В качестве дескриптора формы используется функция, отражающая зависимость площади дискового покрытия от размера дисков. Предлагается метод аналитического вычисления площади покрытия для многоугольных фигур. Универсальность метода определяется возможностью аппроксимации многоугольными фигурами растровых изображений и объектов с нелинейной границей. Метод основан на использовании медиального представления фигуры в виде скелета и радиальной функции. Предлагаемый метод обеспечивает высокую точность и вычислительную эффективность расчёта площади дискового покрытия. Эффективность предлагаемого дескриптора формы демонстрируется на примере приложения к задаче распознавания компьютерных шрифтов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Area of the disk cover as an image shape descriptor

A "width of a shape" concept considered in relation to variable-width objects is used as the integral shape descriptor for image recognition tasks. The approach to the definition of this concept is based on covering the figure of interest with certain-size disks. A function that defines the area of disk cover against the disk size is used as a shape descriptor. An analytical method for calculating the area of disk cover for polygonal figures is proposed. The possibility to approximate by polygonal figures binary raster images and objects with non-linear boundaries makes the approach universal. The proposed method is based on the medial representation of objects as a skeleton and a radial function. The method provides high accuracy and computational efficiency. The efficiency of the proposed shape descriptor is illustrated by the example of its application to the digital font recognition problem.

Текст научной работы на тему «Площадь дискового покрытия – дескриптор формы изображения»

ОБРАБОТКА ИЗОБРАЖЕНИЙ, РАСПОЗНАВАНИЕ ОБРАЗОВ

ПЛОЩАДЬ ДИСКОВОГО ПОКРЫТИЯ - ДЕСКРИПТОР ФОРМЫ ИЗОБРАЖЕНИЯ

Н.А. Ломов, Л.М. Местецкий Факультет вычислительной математики и кибернетики МГУ, Москва, Россия

Аннотация

Рассматривается понятие «ширина фигуры» применительно к объектам сложной формы с целью использования в качестве интегрального морфологического дескриптора в задачах распознавания изображений. Предлагается подход к описанию этого понятия на основе покрытия фигуры дисками определенного размера. В качестве дескриптора формы используется функция, отражающая зависимость площади дискового покрытия от размера дисков. Предлагается метод аналитического вычисления площади покрытия для многоугольных фигур. Универсальность метода определяется возможностью аппроксимации многоугольными фигурами растровых изображений и объектов с нелинейной границей. Метод основан на использовании медиального представления фигуры в виде скелета и радиальной функции. Предлагаемый метод обеспечивает высокую точность и вычислительную эффективность расчёта площади дискового покрытия. Эффективность предлагаемого дескриптора формы демонстрируется на примере приложения к задаче распознавания компьютерных шрифтов.

Ключевые слова: дисковое покрытие, многоугольная фигура, медиальное представление, скелет, радиальная функция, бицикл.

Цитирование: Ломов, Н.А. Площадь дискового покрытия - дескриптор формы изображения / Н.А. Ломов, Л.М. Местецкий // Компьютерная оптика. - 2016. - Т. 40, № 4. - С. 516-525. -DOI: 10.18287/2412-6179-2016-40-4-516-525.

Введение

Ширина объектов является важной характеристикой формы изображений. Для объектов сложной формы, у которых разные части имеют разную ширину и протяжённость, эта характеристика не может быть хорошо описана скалярной величиной, например, «средней» шириной. Поэтому в качестве дескриптора ширины требуется описание «распределения» ширины, которое характеризует весь спектр её значений.

Локальное описание ширины может быть основано на следующем интуитивном представлении: чем большую ширину имеет объект в какой-либо из своих частей, тем большего размера примитив можно разместить в этой части. Если же вписать в объект примитивы заданного размера, например, диски определенного диаметра, то часть объекта, покрытую примитивами, можно рассматривать как область заданной ширины. Тогда функцию, описывающую зависимость площади этой области от размера примитива, можно считать интегральным описанием ширины объекта.

В данной статье предлагается подход к построению дескриптора ширины изображения, который основан на площади дискового покрытия объекта (рис.1). В статье дескриптор называется «морфологической шириной» объекта. Выбор диска в качестве примитива позволяет, во-первых, сделать дескриптор ширины инвариантным к сдвигу, повороту, а с дополнительной нормировкой -и к масштабированию изображения. Во-вторых, он даёт возможность описать области заданной ширины с помощью медиального представления формы - скелета и радиальной функции.

Выбор многоугольной фигуры (многоугольника с многоугольными дырами) в качестве модели формы объекта обусловлен двумя причинами. С одной сто-

роны, с помощью многоугольных фигур можно с высокой точностью аппроксимировать границы сложных объектов, представленных как нелинейными кривыми, так и дискретными растровыми изображениями. С другой стороны, для многоугольной фигуры медиальное представление может быть получено с помощью высокоэффективных алгоритмов вычислительной геометрии.

Рис. 1. Дисковые покрытия фигуры «ящерица» (справа изображены образцы покрывающих дисков)

Дескриптор ширины объекта представляет собой диаграмму зависимости площади покрытия от размера покрывающих дисков (рис. 2).

Предлагаемый в статье метод аналитического вычисления площади дискового покрытия для многоугольных фигур включает следующие этапы.

1. Медиальное представление многоугольной фигуры в виде скелета и радиальной функции на основе диаграммы Вороного линейных сегментов, составляющих границу фигуры.

2. Представление многоугольной фигуры сложной формы в виде объединения элементарных гео-

метрических фигур, называемых бициклами. Бицикл - это объединение вписанных в фигуру кругов с центрами на ребре скелета.

3. Представление дискового покрытия фигуры в виде объединения подмножества бициклов и вычисление площади дискового покрытия на основе площадей бициклов.

4. Построение функции распределения площади дискового покрытия как функции от размера диска.

Площадь покрытия, пике2, *-104 7

6

5

4

3

2

1

О 10 20 30 40 50 Радиус, пике

Рис. 2. Диаграмма зависимости площади дискового покрытия фигуры «ящерица» от размера (радиуса) покрывающих дисков

Предложенный метод расчёта морфологической ширины многоугольной фигуры на основе площади дискового покрытия имеет высокую точность и вычислительную эффективность.

1. Предыдущие работы

Для решения задачи анализа ширины объектов изображений может быть применен метод pattern spectrum [1], основанный на дискретной математической морфологии [2]. В русскоязычной литературе для этого метода используется термин «морфологический спектр Марагоса» [4, 5]. Дескриптором ширины объекта может служить диаграмма морфологического спектра, которая строится на основе операции морфологического открытия с использованием дискового структурирующего элемента. Пример использования этого подхода описан в [3]. Метод допускает простую программную реализацию, однако имеет высокую вычислительную сложность, особенно при работе с большими изображениями высокого разрешения. Для сокращения времени вычислений в работах [4, 5] предложен комбинированный дискретно-непрерывный подход к вычислению морфологического спектра Марагоса, что позволило существенно сократить время вычислений, однако не настолько, чтобы задачу можно было решать в реальном времени работы систем компьютерного зрения. В работах [7, 8] предпринята попытка построения так называемой медиальной ширины, основанной на непрерывной модели формы. Этот подход обеспечил требуемую вычислительную эффективность за счет применения метода непрерывного скелета [6]. Однако диаграмма медиальной ширины оказалась слишком чувствительной к результату промежуточной операции стрижки скелета. Предлагаемое в настоящей работе

решение также основывается на непрерывных скелетах, но нечувствительно к стрижке, поскольку вообще исключает стрижку скелета при вычислении морфологической ширины.

2. Дисковое покрытие и скелет фигуры

Определение 1. Фигурой называется замкнутая область на плоскости, ограниченная конечным числом непересекающихся замкнутых жордановых кривых.

Определение 2. Пустым кругом называется круг, целиком лежащий в фигуре.

Определение 3. Дисковое г-покрытие фигуры -объединение всех пустых кругов радиуса г.

Примеры дискового г-покрытия для разных значений г представлены на рис. 1.

Определение 4. г-площадь фигуры - площадь её дискового г-покрытия.

Согласно этому определению, площадь всей фигуры - это её 0-площадь.

Определение 5. Морфологическая ширина фигуры - это г-площадь фигуры как функция от г.

Морфологическая ширина является невозрастаю-щей функцией параметра г.

Множество вписанных кругов тесно связано с медиальным представлением фигуры в виде скелета и радиальной функции.

Определение 6. Вписанным кругом фигуры называется пустой круг, который является максимальным, т.е. не содержится ни в каком другом пустом круге.

Определение 7. Скелетом фигуры называется множество точек-центров всех вписанных кругов.

Определение 8. Радиальная функция определена в точках скелета и ставит в соответствие точке скелета радиус вписанного круга с центром в этой точке.

Очевидно, что каждый пустой круг радиуса больше г может быть представлен как объединение пустых кругов радиуса г. Поэтому любой вписанный круг с радиусом г или больше г содержится в дисковом г-покрытии. Следовательно, дисковое г-покрытие фигуры совпадает с объединением всех вписанных кругов радиуса не меньше г. Центры таких вписанных кругов составляют подмножество точек скелета. Таким образом, для вычисления морфологической ширины фигуры достаточно рассматривать только круги, центры которых лежат на скелете. Задача состоит в том, чтобы для заданных значений аргумента г получить соответствующие значения г-площади фигуры. Для этого нужно на основе медиального представления фигуры выделить множество всех вписанных кругов радиуса г и больше и найти площадь объединения этих кругов. Решение этой задачи для многоугольных фигур будет получено в явном виде.

3. Многоугольные фигуры и бициклы

Определение 9. Многоугольной фигурой называется фигура, у которой граница состоит из замкнутых ломаных линий.

Границу многоугольной фигуры можно представить как объединение конечного числа подмножеств, называемых сайтами: сайтов-точек (вершины фигу-

ры) и сайтов-сегментов (стороны фигуры без концевых точек).

Скелет многоугольной фигуры (рис. 3) имеет вид геометрического графа, рёбрами которого являются отрезки прямых линий и квадратичных парабол, а вершинами - концевые точки рёбер. Каждое ребро представляет собой связное множество точек-центров вписанных кругов, касающихся одной и той же пары сайтов, называемых образующими сайтами ребра. Если это пара однотипных сайтов (два сайта-точки или два сайта-сегмента), то ребро имеет форму прямолинейного отрезка. Если же сайты разнотипные (сайт-точка и сайт-сегмент), то ребро представляет собой отрезок квадратичной параболы.

Построение скелета многоугольной фигуры осуществляется с помощью высокоэффективных алгоритмов вычислительной геометрии [6]. Предлагаемый метод вычисления г-площади, использующий особые свойства скелета многоугольной фигуры, основан на декомпозиции фигуры на составляющие элементы - бициклы.

Определение 10. Бициклом называется множество всех вписанных кругов с центрами на одном ребре скелета. Линия ребра называется осью бицикла.

Различаются три типа бициклов в зависимости от пары образующих сайтов его ребра: линейный (два сайта-сегмента - рис. 4а-б), параболический (сайт-сегмент и сайт-точка - рис. 4в) и гиперболический (два сайта-точки - рис. 4г). Такая терминология определяется характером зависимости радиальной функции от положения точки на оси бицикла.

а) б)

Рис. 4. Бициклы: оси, собственные области, внешние сектора концевых кругов

Круги с центрами в вершинах скелета называются концевыми кругами бицикла.

Граница бицикла представляет собой огибающую семейства входящих в него кругов. Границы линейных и параболических бициклов включают полностью либо частично образующие сайты-сегменты

(рис.4а-в). Кроме этого, границы бициклов всех типов состоят из дуг концевых кругов.

Определение 11. Внешним сектором бицикла называется сектор концевого круга, опирающийся на дугу в границе бицикла.

Определение 12. Спицей называется отрезок прямой, соединяющий точку скелета с ближайшей точкой границы фигуры.

Определение 13. Собственной областью бицикла называется объединение всех спиц, инцидентных точкам оси бицикла.

Бицикл представляет собой объединение собственной области и пары внешних секторов. Форма собственной области зависит от типа бицикла (рис. 4). Для линейного бицикла она складывается из двух треугольников (рис. 4а) либо двух трапеций (рис. 4б). В параболическом бицикле - это фигура «домик», которую можно рассматривать как объединение трапеции и треугольника (рис.4в), в гиперболическом - объединение двух треугольников (рис.4г).

Пусть М - многоугольная фигура, Мг - подмножество фигуры, образованное объединением всех спиц длины г и более. Очевидно, что множество Мг целиком лежит в г-покрытии. Собственные области бициклов образуют покрытие всей многоугольной фигуры, совпадающее с объединением всех спиц, т.е. М0=М (рис. 5). Объединение собственных областей совпадает с фигурой, а пересекаться области могут только по своим граничным спицам.

Рис. 5. Покрытие многоугольной фигуры собственными областями бициклов

Определение 14. Бицикл называется монотонным, если радиальная функция монотонно убывает или возрастает вдоль его оси.

Очевидно, что линейный бицикл является монотонным, поскольку радиальная функция линейно зависит от положения точки на оси. Линейный бицикл постоянной ширины будем считать монотонным по определению.

В параболическом бицикле в случае, когда вершина параболы является внутренней точкой оси бицикла, при прохождении через вершину характер изменения радиальной функции меняется с убывающего на возрастающий (рис. 4в). Вершина параболы является точкой локального минимума радиальной функции и бицикл при этом не является монотонным. В остальных случаях, когда вершина параболы лежит вне оси либо совпадает с концевой точкой оси, параболический бицикл является монотонным.

В гиперболическом бицикле монотонность определяется положением центров концевых кругов относительно линии сайтов (прямой, проходящей через сайты-точки). Если центры лежат по разные стороны от этой линии, то точка пересечения её с осью бицикла находится внутри оси и в ней достигается минимум радиальной функции - бицикл не монотонный (рис. 4г). В остальных случаях гиперболический бицикл является монотонным.

Вычисление морфологической ширины для монотонных бициклов представляет собой более простую задачу, чем для немонотонных. Поэтому целесообразно представить фигуру в виде объединения только монотонных бициклов. Для этого каждый немонотонный бицикл может быть заменен парой монотонных бициклов. В немонотонном бицикле всегда существует лишь один минимум радиальной функции, поэтому его ось можно разбить на два участка монотонности. Разбиение немонотонных бициклов на монотонные пары представляет собой коррекцию скелетного графа путём добавления в него вершин в минимальных точках бициклов и разбиения соответствующих рёбер на 2 части. В примере (рис. 5) четыре экстремальных бицикла разбиты на монотонные пары. Пунктиром показаны соответствующие собственные области бициклов.

4. Собственные области и внешние сектора

На рис. 6 представлены монотонные бициклы всех трёх типов. Здесь г и К - радиусы меньшего и большего концевых кругов, / - расстояние между их центрами. Если бицикл является линейным или параболическим, то он имеет образующий сайт-сегмент, и тогда t - длина проекции оси бицикла на этот сайт:

Г = ^ /2-(К - г )2 .

В параболическом бицикле р - расстояние между сайтом-точкой и прямой линией сайта-сегмента (фокальный параметр параболы). В гиперболическом бицикле q - расстояние между сайтами-точками.

Для линейного бицикла (рис. 6а) площадь собственной области определяется как сумма площадей двух трапеций, имеющих основания г и К и высоту /:

= 2• ((К + г)/2)• Г = (К + г)• Г . (1)

Угловой размер внешнего сектора меньшего концевого круга:

фПп = 2а = 2 • ). (2)

Для параболического бицикла (рис. 6б) площадь собственной области складывается из площади такой же трапеции и площади треугольника с вершинами в центрах концевых кругов и в сайте-точке. Площадь треугольника вычисляется по формуле Герона:

^ = ((К + г)/2) • Г + ^ Р (Р - К)(Р - г)(Р -/) , (3)

где Р = (К + г + /)/2.

Угловой размер внешнего сектора меньшего концевого круга параболического бицикла есть

Фраг = (Р2) + а = (р2) + а^т((р - г)/г). (4)

Д\

в) ^---^

Рис. 6. Собственные области и внешние сектора бициклов: линейного (а), параболического (б), гиперболического (в)

Площадь собственной области гиперболического бицикла (рис. 6в) складывается из площадей двух треугольников, вычисляемых по формуле Герона:

К = ^ Р (Р - К)(Р - г)(Р - /) . (5)

Угловой размер внешнего сектора меньшего концевого круга

Фнур = 2 а^п^/2г). (6)

5. Усеченные бициклы

Дисковое г-покрытие многоугольной фигуры при г = 0 совпадает с самой многоугольной фигурой. По мере роста г покрытие сжимается: часть фигуры, покрытая дисками, уменьшается (рис. 7). Само покрытие при этом представляет собой фигуру, граница которой

Дисковое г-покрытие есть объединение вписанных в многоугольную фигуру кругов с радиусом больше или равным г. Будем называть множество центров этих кругов осью г-покрытия. Очевидно, ось г-покрытия пред-

ставляет собой подмножество скелета многоугольной фигуры. Это подмножество при малых значениях г является связным, но с ростом г оно может разбиться на несколько связных компонент (рис. 7).

Таким образом, скелет многоугольной фигуры делится на две части: ось г-покрытия - это подмножество с радиальной функцией г или больше, и остальная часть - подмножество, в котором радиальная функция меньше г. Оба эти подмножества можно рассматривать как геометрические графы.

Для каждого г > 0 все бициклы многоугольной фигуры разбиваются на три группы: широкие (входят в г-покрытие), узкие (не входят в г-покрытие) и усеченные (входят в г-покрытие частично).

Пусть в монотонном бицикле R1 и R2 - радиусы минимального и максимального кругов. В широком бицикле R1 > г, в узком R2 < г.

Если в бицикле R1 < г < R2, то в г-покрытие входят лишь те его круги, у которых радиус не меньше г. Определим операцию сечения такого бицикла, которая состоит в удалении кругов с радиусом меньше г. Полученный новый бицикл будем называть усечённым. Усеченный бицикл имеет те же образующие сайты и тот же тип (линейный, параболический или гиперболический), что и исходный бицикл. Минимальным кругом усеченного бицикла становится круг радиуса г, а максимальным остается круг с радиусом R2.

Обозначим C1, C2 - центры меньшего и большего концевых кругов. Для полного описания усеченного бицикла и расчёта его площади достаточно вычислить новое положение меньшего концевого круга.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть точка C - это искомый центр круга с радиусом г (рис. 8).

и Ь Ь2

Рис. 8. Коррекция усеченных бициклов Для линейного бицикла (рис. 8а) имеем C = С1 + (С2 -С1,

где 1 = (г - R1) / - R1) . В частном случае, когда R2=R1, полагаем 1 = 0.

Для параболического бицикла (рис. 8б) выберем полярную систему координат (р, ф) с началом в сайте-

точке V бицикла и осью, ортогональной сайту-сегменту. Уравнение параболы в этих координатах имеет вид р =p / (1+008 (ф)), где p - фокальный параметр параболы. Центры концевых дисков имеют координаты ф1) и C2(R2, ф2), где ф1 = агооо8 (р/^-1), ф2=агсоо8 (р/Я2-1). Искомая точка C ф), ф = агооо8 (р/Я-1) . Не нарушая общности, будем считать ф1 < ф2. Вектор VC получается из VC1 поворотом на угол 9 = ф-ф1 и умножением на коэффициент гК-1. Тогда искомый центр круга есть C = V + (г/Я1) • б ■VC, где С - матрица поворота на угол 9:

' 0089 8Ш9 0089

С =

В гиперболическом бицикле (рис. 8в) точка C лежит между C1 и С2. Пусть q - расстояние между сайтами-точками. Если V - сайт-точка, то проекции векторов VC, VC1 , VC2 на ось бицикла имеют длину

г 2 -\±

ь = ^а =

ь = \уц=,| Rl2-\2

ь2 = ус2=

R22 -\2

Тогда С = С1+(С2 - Сху\ где 1 = (Ь-Ь1)/(Ь2-Ь1).

Полученные формулы позволяют найти новое положение меньшего концевого круга, после чего вычисление площади бицикла и угловых размеров внешних секторов осуществляется по тем же формулам (1)-(6), что и для широких бициклов.

Таким образом, дисковое г-покрытие представляет собой объединение двух множеств бициклов: полных бициклов, у которых R1 > г, и усеченных бициклов, у которых R1 < г <R2. При этом покрытие формируется из собственных областей всех этих бициклов, а также из внешних секторов меньших кругов усеченных бициклов.

Такая структура дискового покрытия позволяет свести задачу вычисления г-площади многоугольной фигуры к суммированию площадей собственных областей и внешних секторов бициклов. На рис. 7 собственные области выделены светлым, а внешние сектора - темным серым цветом.

Собственные области бициклов пересекаются только по общим границам, имеющим нулевую площадь, поэтому общая площадь объединения собственных областей равна сумме площадей собственных областей бициклов.

Концевые круги усечённых бициклов в г-покрытии имеют радиус г. Площадь внешнего сектора с углом ф есть = (ф/2) г2. Но сектора могут иметь нетривиальные пересечения. Пересечения возникают, когда происходят «разрывы» оси г-покрытия (рис. 7в). В этом случае вычисление общей площади

2

2

2

2

внешних секторов представляет собой более сложную задачу.

6. Пересечения бициклов

Определим те бициклы, которые могут иметь существенные пересечения друг с другом. При расчёте г-площади необходимо найти пересечения только смежных бициклов, т.е. тех, между которыми образуются разрывы за счёт удаления узких бициклов, имеющих ширину меньше г.

Нас будут интересовать только внешние сектора меньших концевых кругов бициклов. В монотонном бицикле угловые размеры внешнего сектора меньшего концевого круга ф < я.

Определение 15. Два усеченных бицикла в г-покрытии называются смежными, если существует маршрут в скелете, соединяющий центры их концевых кругов, такой, что радиальная функция во всех точках маршрута меньше г.

Внешний сектор усеченного бицикла может иметь пересечение не только с внешним сектором другого бицикла, но и с его собственной областью. При вычислении вклада внешних секторов двух пересекающихся усеченных бициклов в г-площадь фигуры необходимо найти площадь только той части каждого сектора, которая не входит в собственные области. На рис. 9 представлены примеры возможных взаимных расположений внешних секторов двух усеченных бициклов. В первом случае (рис. 9а) в пересечении двух секторов образуется фигура «линза», граница которой состоит из двух одинаковых дуг окружностей. Во втором случае (рис. 9б) пересечение секторов представляет собой более сложную фигуру, граница которой включает прямолинейные отрезки спиц и дуги окружностей. Серым цветом на рис. 9 выделены области, образованные объединением внешних секторов за вычетом пересечения с собственными областями бициклов. Такие области будем называть внешней зоной пары бициклов.

Рис. 9. Взаимное положение пары пересекающихся внешних секторов усеченных бициклов

Обозначим:

£>ялк - площадь концевых кругов бициклов,

- площадь линзы, образованной пересечением концевых кругов,

5,1(<х'), ^ - площади внешних секторов бициклов,

Б^""), Ж>т') - площади внутренних секторов концевых кругов.

Внутренний сектор - это дополнение внешнего сектора в концевом круге. Внутренние сектора смежных усеченных бициклов не имеют пересечений между собой. Поскольку угловые размеры внешних секторов не превосходят я, получается, что размеры внутренних секторов не меньше я.

Лемма 1. Площадь внешней зоны, образованной парой внешних секторов двух пересекающихся усеченных бициклов, равна сумме площадей этих секторов за вычетом площади линзы, образованной пересечением концевых кругов

s = S<ext) + Sf >- S^. (7)

Доказ ательство.

Общая площадь объединения двух пересекающихся концевых кругов равна 2Sdick-S¡ens.

Поскольку внутренние сектора кругов не пересекаются, получаем:

S = ( 2Sd¡k - Sfens )-( ST >+ Sf >).

Очевидно, Sdlkk — S¡exí ) + S¡mt ) = S¡exí ) + Sf).

С учетом этого получаем искомое соотношение для площади внешней зоны

S — (S S (int ) ) + (S S (int ) ) S —

S — (Sdisk - ) + (Sdisk - S2 ) - Slens —

— S(ext^ + S^xt) - S¡

Лемма доказана.

Пусть j1, j2 - угловые размеры двух пересекающихся внешних секторов. Тогда

S|ext)— (ji • г2)/2, S2ext)— j • r2)/2.

Угловые размеры линзы, образованной двумя окружностями радиуса г, с центрами, расположенными на расстоянии h < 2г друг от друга, составляют 9 = arccos(h/2r).

Площадь этой линзы

SlenS — r2 (9-sin9).

Таким образом, площадь (7) внешней зоны пары пересекающихся бициклов равна

S — j • r 2)/2 + (j2 • r 2)/2 - r2 (9-sin 9). (8)

Более сложным представляется случай пересечения трёх и более внешних секторов. Возможные варианты пересечения трёх одинаковых кругов представлены на рис. 10. Однако, как будет показано ниже, при пересечении трёх усеченных бициклов варианты, изображенные на рис. 10а, б, невозможны.

Рис. 10. Пересечения трех концевых кругов усеченных бициклов

Рассмотрим сначала случай, когда линза в пересечении двух кругов целиком лежит внутри третьего круга (рис. 10а). В примере линза кругов А и С накрывается кругом В.

Лемма 2. Пусть А, В, С - одинаковые круги и линза в пересечении кругов пары А и С лежит внутри круга А (рис. 11 а). Тогда сумма дуг круга В, накрытых кругами А и С, больше я.

Доказательство.

Обозначим а, Р угловые размеры линз, лежащих в пересечении пар кругов ЛпБ и БпС. Изменим положение круга С на С' так, чтобы в АЛБС' было БС'= БС, ¿Б = (а+Р) / 2 (рис. 11б). Треугольник АЛБС' получается из АЛБС путем поворота стороны БС так, чтобы в точке Б совместились углы линз пар кругов ЛпБ и БпС. Построим касательную ОН для круга Б в точке Б. Построим также хорды БЕ и Б¥, проходящие через угловые точки линз. Поскольку в АЛБС' сторона ЛС'< ЛС, это означает, что круг С'лежит не дальше от круга Л , чем С, и поэтому тоже имеет пересечение с Л. Из простых геометрических рассуждений получаем:

¿ОБЕ = а / 2, ¿FБH = Р / 2.

а) \---/ б)

Рис. 11. К доказательству леммы 2

Условие пересечения линз состоит в следующем

2 • ¿ОБЕ + 2 • ¿FБH > я,

что доказывает утверждение леммы (а+Р) > я.

Следствием леммы 2 является вывод, что круг Б не может быть меньшим кругом усеченного бицикла, поскольку его внешний сектор не меньше а+Р и в этом случае круг не является минимальным в бицикле. Таким образом, случай, изображенный на рис. 10а, не может образоваться при построении г-покрытия. Рассмотрим теперь второй случай, представленный на рис. 10б.

Лемма 3. Если в дисковом г-покрытии концевые круги трёх бициклов имеют непустое пересечение, то в объединении этих кругов существует пустой круг с радиусом г.

Доказательство.

Пусть три круга с центрами в точках Л, Б, С и радиусом г имеют непустое пересечение (рис. 12). Обозначим аЛБ, аБС угловые размеры линз, лежащих в пересечении пар кругов ЛпБ и БпС соответственно. Угловые размеры дуг внешних секторов не превышают я, поэтому аЛБ < я и аБС < я.

Рис. 12. К доказательству леммы 3 Область пересечения трёх кругов представляет собой круговой треугольник АБ1Е1Е1, сторонами ко-

торого являются дуги gA, gB, gC кругов A,B, C. Треугольник ADEF лежит в объединении кругов A, B, C. Для доказательства утверждения леммы достаточно показать, что радиус описанной окружности ADEF больше или равен r. Имеем:

ZDEF = ZDEE1 + ZFEE1,

ZDEEj = (abc -ge)/2,

ZFEE, = (a ab-ga )/2,

ZDEF = ((авс +a ab )-(ga + gc))/2,

ZDBF = abc +aAB -gb .

В круговом треугольнике ADjEjFj выполняется неравенство треугольника gB < gA + gC. Действительно, круговой треугольник со сторонами, составленными их дуг окружностей одинакового радиуса, можно рассматривать как плоскую развертку сферического треугольника на сфере такого же радиуса. В этом случае окружности равны большим кругам этой сферы и длина сторон сферического треугольника совпадает с длиной дуг кругового треугольника. Поскольку для сферического треугольника, как известно, неравенство треугольника выполняется, оно выполняется и для кругового треугольника тоже.

Отсюда следует, что

ZDBF > 2 • ZDEF. (9)

В ZDBF имеем

DF = 2r • sin (ZDBF /2).

А в ADEF согласно теореме синусов:

DF/sin (ZDBF /2) = 2R*, (10)

где R - радиус описанного круга ADEF, который, в свою очередь, является вписанным в объединение кругов A, B, C. Поскольку углы ZDBF < я, а ZDEF < я/2, получаем из (9)

sin (ZDBF / 2) > sin (ZDEF).

Отсюда из равенства (10) имеем

DF 2r • sin (ZDBF /2)

R =-

> r.

2- sin (ZDBF /2) 2- sin (ZDEF)

Лемма доказана.

Лемма 4. Если концевые круги трёх бициклов имеют непустое пересечение, то пары бициклов не являются смежными.

Доказательство. Согласно лемме 3 существует круг радиуса r или больше, лежащий в объединении трёх концевых кругов бициклов. Поскольку концевые круги являются пустыми, то и этот круг пустой. Тогда существует максимальный пустой круг, его содержащий и имеющий радиус не меньше r. Центр этого максимального круга является точкой скелета, которая лежит между центрами концевых кругов бициклов. Следовательно, условие смежности бициклов не выполнятся и бициклы смежными не являются, что и требовалось доказать.

Это показывает, что вариант пересечения трех смежных усеченных бициклов (рис. 10б) невозможен. Единственный возможный вариант пересечения тройки усеченных бициклов - это попарные пересечения, как в примере на рис. 10в. Для этого случая очевидным образом обобщается лемма 1.

Лемма 5. Площадь внешней зоны, образованной внешними секторами трех попарно пересекающихся усеченных бициклов, равна сумме площадей этих секторов за вычетом площадей линз, образованных пересечением концевых кругов.

Теорема. Площадь дискового покрытия много -угольной фигуры равна сумме площадей собственных областей всех бициклов и внешних секторов усеченных бициклов за вычетом площадей парных пересечений смежных усеченных бициклов.

Доказательство. Часть дискового покрытия - это подмножество фигуры, образованное объединением всех спиц длины г. Площадь этой части равна сумме площадей всех широких и усеченных бициклов. Остальная часть дискового покрытия состоит из внешних секторов усеченных бициклов. Как следует из лемм 2-4, возможны лишь попарные пересечения внешних секторов усеченных бициклов. Суммарная площадь этих внешних секторов согласно леммам 1 и 5 равна сумме площадей этих секторов за вычетом общей площади линз, лежащих в пересечениях концевых кругов смежных усеченных бициклов. Теорема доказана.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Поиск пар смежных усеченных бициклов осуществляется на основе скелета многоугольной фигуры, начиная с точек минимума радиальной функции. От каждой точки минимума локальным поиском в ширину проходятся все бициклы, ширина которых меньше г. В результате последовательного анализа ширины этих бициклов будут найдены все усеченные бициклы, которые граничат с узкой компонентой скелета, примыкающей к данной точке минимума радиальной функции.

7. Структура алгоритма

Таким образом, для вычисления г-площади можно воспользоваться представлением дискового г-покрытия в виде объединения бициклов. Для этого нужно сделать следующие шаги.

1. Построить медиальное представление многоугольной фигуры в виде скелета и радиальной функции. Найти все элементарные подграфы скелета - рёбра. Алгоритм описан в [6].

2. Найти рёбра, на которых расположены точки минимума радиальной функции, и разбить их на монотонные части (параграф 3). Построить множество монотонных бициклов, покрывающих многоугольную фигуру.

3. Для заданного значения г найти множество усеченных бициклов и вычислить положение их меньших концевых кругов (параграф 5).

4. Для полных и усеченных бициклов вычислить площади собственных областей и найти их сумму (параграф 4).

5. Для усеченных бициклов вычислить внешние сектора и найти их суммарную площадь (параграф 5).

6. Найти все линзы в пересечении внешних секторов и вычислить их суммарную площадь (параграф 6).

7. Найти г-площадь как сумму площадей собственных областей и концевых секторов бициклов за вычетом суммарной площади линз.

8. Распознавание компьютерных шрифтов

В качестве примера применения предлагаемого метода морфологического анализа изображений рассмотрим задачу распознавания компьютерных шрифтов по некоторому контексту. В настоящее время количество компьютерных шрифтов исчисляется тысячами. Необходимость определения, каким шрифтом набран текст, возникает у дизайнеров, разработчиков шрифтов, компаний-правообладателей. Один из подходов к классификации шрифта состоит в разработке метрики сходства пары шрифтов и использовании для классификации методов, основанных на ближайших соседях. Построение метрики сходства шрифтов необходимо также для решения другой задачи, связанной с работой дизайнеров и типографов: выбор похожего шрифта для использования в том случае, когда отсутствует лицензия на какой-то шрифт и нужно подыскать замену.

Целью эксперимента, описанного ниже, является оценка возможностей использования предлагаемого метода для решения указанных задач.

На рис. 13 демонстрируются диаграммы ширины для 5 букв шрифта Times New Roman, входящих в слово HORSE. Пример показывает, что символы шрифта имеют индивидуальные хорошо различимые портреты.

Площадь покрытия, пике2, х-104 9 Г

30 35 40 45 Радиус, пике

Рис. 13. Диаграммы ширины символов одного шрифта Различия между портретами одной и той же буквы Н, изображенной в разных шрифтах одинаковым размером, представлены на рис. 14.

Эти диаграммы получены для изображений высокого разрешения, которые рассматриваются в качестве эталонных образцов.

Для проведения эксперимента в более реальных условиях построены эталонные растровые изображения 52 символов латиницы (26 строчных и 26 прописных букв) из 1884 шрифтовых начертаний коллекции цифровых шрифтов компании Паратайп [9]. Размеры шрифтов подобраны таким образом, чтобы высота

прописной буквы H составила 1000 пикселов. По этим изображениям были построены непрерывные скелеты методом, описанным в [6], и на их основе вычислены диаграммы ширины с шагом радиуса в 0,1 пиксела.

Площадь покрытия, пике2, х104

16 Г

?jc l|p «|« jjl i

14 *-*-*-*-*-*-*-*-*

12 ------------------------------------------Times New

: Roman

10 S ---Arial

! ......... гг/тулт/»?/?

, Ц ; — *— Britannic

б ...................; j 1 Bold

■ 1

0 10 20 30 40 50 60 70 80

Радиус, пике

Рис. 14. Диаграммы ширины символа разных шрифтов

Для этих же шрифтов получены изображения символов в более низком разрешении, так чтобы высота буквы H составила 100 и 50 пикселов. По этим изображениям построены диаграммы ширины с шагом радиуса 0,01 и 0,005 пиксела соответственно. Эти диаграммы нормализованы таким образом, чтобы их можно было сравнивать с диаграммами эталонных символов шрифтов. Нормализация состоит в растяжении в 100 раз по ординате и в 10 раз по абсциссе и в 400 раз по ординате и в 20 раз по абсциссе для высоты 100 и 50 соответственно. В результате все нормализованные диаграммы используют один и тот же набор значений радиусов.

Создание базы эталонных диаграмм на компьютере с процессором Intel® Core i5TM и 6 ГБ оперативной памяти заняло 3,6 часа на 97968 изображений символов шрифтов (0,13 с на один символ), причем почти все это время было затрачено на растеризацию букв большого размера, а построение скелетов и расчет диаграмм ширины заняли в сумме менее 10 минут (0,006 с на один символ).

Сравнение диаграмм тестовых изображений с диаграммами эталонов выполнено в метрике L1. В качестве интегральной метрики сходства шрифтов используется линейная комбинация расстояний между диаграммами всех 52 символов. Коэффициенты линейной формы получены на основе обучения по всему набору тестируемых шрифтов. Вычисление расстояний между всеми парами шрифтов по 52 буквам из 1884 начертаний заняло 70 минут. Это означает, что время запроса - проверки одного начертания по базе эталонов - составляет 2,25 секунды.

Результаты эксперимента показали, что уровень правильного распознавания шрифта при высоте 100 составил 96 %, а при высоте 50 - более 91 %.

Таким образом, проведенный эксперимент подтвердил работоспособность предложенного метода и показал его эффективность на практической задаче сравнения большого количества изображений с весьма высоким качеством распознавания.

Заключение

Предложенный дескриптор и метод его вычисления открывают новые возможности по применению высокоэффективных алгоритмов вычислительной геометрии в анализе и распознавании формы изображений. Известные подходы к вычислению дескрипторов для ширины фигур, использующие методы дискретной математической морфологии, имеют высокую вычислительную сложность. Предложенная непрерывная модель ширины многоугольных фигур на основе дискового покрытия позволила провести декомпозицию исходной задачи и свести вычисления к простым геометрическим расчётам.

Разработанный алгоритм является первым, позволяющим получить точное аналитическое представление функции распределения ширины многоугольной фигуры. Аппроксимация растровых объектов многоугольными фигурами даёт возможность использовать метод при анализе и распознавании изображений. Высокая эффективность предлагаемого метода позволяет сравнивать и измерять сходство фигур по их ширине в системах реального времени.

Благодарности

Работа выполнена при поддержке РФФИ (грант №14-01-00716).

Литература

1. Maragos, P. Pattern Spectrum and Multiscale Shape Representation / P. Maragos // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 1989. - Vol. 11(7). -P. 701-716. - DOI: 10.1109/34.192465.

2. Serra, J. Image Analysis and Mathematical Morphology / J. Serra. - London: Academic Press, 1982.

3. Ramirez-Cortes, J.M. A Feature extraction method based on the pattern spectrum for hand shape biometry / J.M. Ramirez-Cortes, P. Gomez-Gil, G. Sanchez-Perez, D. Baez-Lopez // Proceedings of the World Congress on Engineering and Computer Science, WCECS 2008, October 22 - 24, San Francisco, USA, 2008.

4. Визильтер, Ю.В. Морфологические спектры / Ю.В. Ви-зильтер, С.В. Сидякин. - В кн.: Техническое зрение в системах управления - 2012. Труды научно-технической конференции / под ред. Р.Р. Назирова. - М.: ИКИ РАН, 2012. - С. 234-241.

5. Vizilter, Yu.V. Comparison of shapes of two-dimensional figures with the use of morphological spectra and EMD metrics / Yu.V. Vizilter, S.V. Sidyakin // Pattern Recognition and Image Analysis. - 2015. - Vol. 25(3). - P. 365-372.

6. Местецкий, Л.М. Непрерывная морфология бинарных изображений / Л.М. Местецкий. - М.: Физматлит, 2009. - 288 с. - ISBN 978-5-9221-1050-1.

7. Местецкий, Л.М. Медиальная ширина фигуры - дескриптор формы изображений / Л.М. Местецкий // Машинное обучение и анализ данных. - 2014. - Т. 1, № 9. - С. 1291-1318.

8. Местецкий, Л.М. Распознавание формы гибких объектов изображений на основе спектров ширины / Л.М. Местецкий, Е.М. Зак, Н.А. Ломов // Приволжский научный журнал. - 2014. - № 4. - С. 59-67.

9. Якупов, Э. 2008-2014. ПАРАТАЙП. Цифровые шрифты. Каталог / Э. Якупов, И. Петрова, Г. Фридман, А. Ко-ролькова, Б. Левин. - М., 2015.

-Times New

Roman

---Arial

......... Garamond

-----Rockwell

—*— Britannic Bold

Сведения об авторах

Ломов Никита Александрович, аспирант факультета вычислительной математики и кибернетики МГУ, в 2015 году окончил МГУ по специальности «Прикладная математика и информатика». Область научных интересов: вычислительная математика, обработка и распознавание изображений, программирование. E-mail: nikita-lomov@mail.ги .

Местецкий Леонид Моисеевич, доктор технических наук, профессор, работает на кафедре математических методов прогнозирования факультета вычислительной математики и кибернетики МГУ и на кафедре интеллектуальных систем Московского физико-технического института. Область научных интересов: вычислительная геометрия, обработка и распознавание изображений, компьютерная графика. E-mail: mestlm@mail.ги .

ГРНТИ: 28.23.15.

Поступила в редакцию 10 июня 2016 г. Окончательный вариант - 15 августа 2016 г.

AREA OF THE DISK COVER AS AN IMAGE SHAPE DESCRIPTOR

N.A. Lomov, L.M. Mestetskiy Lomonosov Moscow State University, Computational Mathematics and Cybernetics Faculty, Moscow, Russia

Abstract

A "width of a shape" concept considered in relation to variable-width objects is used as the integral shape descriptor for image recognition tasks. The approach to the definition of this concept is based on covering the figure of interest with certain-size disks. A function that defines the area of disk cover against the disk size is used as a shape descriptor. An analytical method for calculating the area of disk cover for polygonal figures is proposed. The possibility to approximate by polygonal figures binary raster images and objects with non-linear boundaries makes the approach universal. The proposed method is based on the medial representation of objects as a skeleton and a radial function. The method provides high accuracy and computational efficiency. The efficiency of the proposed shape descriptor is illustrated by the example of its application to the digital font recognition problem.

Keywords: disk cover, polygonal figure, medial representation, skeleton, radial function, bicircle.

Citation: Lomov NA, Mestetskiy LM. Area of the disk cover as an image shape descriptor. Computer Optics 2016; 40(4): 516-525. DOI: 10.18287/2412-6179-2016-40-4-516-525.

Acknowledgements: The work was funded by the Russian Foundation for Basic Research grant No. 14-01-00716.

References

[1] Maragos P. Pattern Spectrum and Multiscale Shape Representation. IEEE Trans On Pattern Analysis and Machine Intelligence 1989; 11(7): 701-716.

[2] Serra J. Image Analysis and Mathematical Morphology. London: Academic Press; 1982.

[3] Ramirez-Cortes JM, Gomez-Gil P, Sanchez-Perez G, Baez-Lopez D. A Feature extraction method based on the pattern spectrum for hand shape biometry. Proc World Congress on Engineering and Computer Science 2008.

[4] Vizilter YuV, Sidyakin SV. Morphological spectra [in Russian]. Computer vision in control systems 2012. Proceedings of the scientific-technical conference, Moscow: 14-16 March 2012: 234-241.

[5] Vizilter YuV, Sidyakin SV. Comparison of shapes of two-dimensional figures with the use of morphological spectra and EMD metrics. Pattern Recognition and Image Analysis 2015; 25(3): 365-372.

[6] Mestetskiy LM. Continuous morphology of binary images: figures, skeletons, circulars [in Russian]. Moscow: "Fizmatlit" Publisher; 2009.

[7] Mestetskiy LM. Medial width of a figure - an image shape descriptor [in Russian]. Machine Learning and Data Analysis 2014; 1(9): 1291-1318.

[8] Mestetskiy LM., Zak EM., Lomov NA. Recognition of flexible object shape based on width spectrum [in Russian]. The Privolzhsky Scientific Journal 2014; 4(32): 59-67.

[9] Yakupov E, Petrova I, Fridman G, Korolkova A, Levin B. 2008-2014 - PARATYPE Originals - Digital Typefaces. Moscow: 2015.

Authors' information

Nikita Alexandrovich Lomov graduated from Moscow State University in 2015, majoring in Applied Mathematics and Informatics. Currently he is a graduate student of Computational Mathematics and Cybernetics faculty of Lomonosov Moscow State University. Research interests are computational mathematics, image processing, pattern recognition, and programming. E-mail: nikita-lomov@mail.ru.

Leonid Moiseevich Mestetskiy doctor of Technical Sciences, professor, working at the Mathematical Methods of Forecasting department at the Faculty of Computational Mathematics and Cybernetics, Lomonosov Moscow State University, and at the Intelligent Systems department at the Faculty of Control and Applied Mathematics, Moscow Institute of Physics and Technology. Research interests are computational geometry, image processing, pattern recognition, and computer graphics. E-mail: mestlm@mail.ru .

Received June 10, 2016. The final version - August 15, 2016.

i Надоели баннеры? Вы всегда можете отключить рекламу.