Серия «Математика»
2014. Т. 9. С. 39—48
Онлайн-доступ к журналу: http://isu.ru/izvestia
УДК 519.6
Анализ плоских контурных изображений с метрикой
М. Д. Каташевцев
Иркутский государственный технический университет
Аннотация. Рассмотрена задача анализа плоских контурных изображений в рамках логико-эвристической парадигмы. Рассматривается модель представления растрового контурного изображения как системы дуг и связей дуг. Каждая дуга связана с другой дугой через отношение связи дуг. Дуги и связи дуг представляют собой простейшие элементы с заданным набором свойств. В базовой модели дуга обладает двумя свойствами — градусная мера дуги и направления обхода (по часовой, против часовой стрелки). В работе вводится новая расширенная модель представления растрового контурного изображения. В новой модели расширяется понятия дуги. К дуге добавляется новое свойство — относительная (относительно других дуг образующих систему данного изображения) длина дуги. Приведен алгоритм построения новой модели на основе скелетизированного изображения. Разобраны особенности построения универсального дерева образцов для расширенной системы. Приведена процедура сведения дерева образцов для расширенной модели к дереву образцов базовой модели. Приведены некоторые оценки сложности алгоритмов преобразования растровых изображений и алгоритмов сведения расширенного дерева образцов к базовому. Приводятся оценки сложности базовых алгоритмов распознавания. Получены результаты, свидетельствующие о том, что введение расширенной модели никак не влияет на сложность базовых алгоритмов распознавания. Выдвинуто предположение, что добавление любого конечного числа характеристик к представлению дуги никак не повлияет на сложность распознавания. Предложен новый способ уменьшения количества образцов в дереве образцов путем реализации процедуры детализации образца, заключающийся в удалении из образца дуг, чьи относительные размеры меньше некоторого порогового значения.
Ключевые слова: анализ изображения, распознавание, логико-эвристический, растровое, алгебраическая система, относительная мера.
1. Введение
В статье [1] была рассмотрена формализация представления контурных изображений на основе дуг и связей дуги:
M =< A, R, V; Sector, Angle, Relation > (1.1)
где A — множество всевозможных дуг, R — множество связей дуг, V — множество допустимых углов (например от 0 до 360 градусов). Функция Sector : A ^ V — задает градусную меру дуги; Angle : R ^ V — задает угол соединения двух дуг; Relation : R ^ A х A — сопоставляет каждой связи дуги, те дуги, которые она соединяет.
По сути был реализован алгоритм сведения растрового изображения к системе дуг и связей дуг. Такое представление почти идеально вписалось в методы, ранее успешно использовавшиеся для решения задач распознавания генетического кода и составления расписаний [3].
Замечание 1. Важно отметить, что в этом представлении все множества являются конечными. Множества A и R являются фиктивными (чисто техническими) элементами данной модели и определяются через функции. Множество V — {v0,v\, ...,vn} есть счетное множество чисел, с максимальным vmax и минимальным vmin элементами, разбитое шагом 5 на n + 1 элементов, где
vmax vmin
П =-5-
v0 — vmin
vi — vi-\ — 5, Vi — 1,n
vn = vmax
В нашей технической реализации vmin — —180, vmax — 360, 5 — 1, причем
Sector : A ^ V П [0,360] Angle : R ^ V П [—180,180]
Продолжая исследования в области способов формализации представления контурных изображений, мы пришли к выводу, что текущая модель в недостаточной мере отражает те объекты, с которыми мы работаем (символы, буквы, цифры и т. д.).
Очевидно, что, введя дополнительную характеристику в модель представления объектов, можно было бы не только расширить область распознаваемых объектов, но и в качестве бонуса получить существенные улучшения как в плане точности распознавания (количества правильно распознанных объектов), так и в плане скорости распознавания.
Выбранная характеристика должна была бы отвечать тем же требованиям, которым удовлетворяли все предыдущие свойства (градусная мера дуги, направление обхода, угол соединения дуг), а именно: устойчивость к масштабированию (с сохранением пропорций) и повороту исходного анализируемого изображения.
В качестве такой характеристики было решено взять относительную величину дуги.
В данной статье мы попытались изучить влияние новой характеристики на весь процесс анализа — от предобработки до распознавания.
2. Формализация описания плоских контурных изображений
Добавив относительную меру дуги, мы получим следующую алгебраическую систему:
M —< A, R, V, M; Sector, Angle, Metric, Relation > (2.1)
где M - множество относительных мер, Metric : A — M — функция, сопоставляющая каждой дуге ее относительную величину.
Как и множество V, множество M конечно. Однако выбор верхней границы для M не столь очевиден, так как не исключена возможность того, что разница в размерах между двумя дугами может быть весьма существенна (например, в несколько миллионов раз). Однако практика показывает, что в рамках нашей области применения (распознавание символов), когда в качестве «эталонного наблюдателя» выступает среднестатистический человек, разница что в 1000, что в 1 000 000 раз почти неразличима, и поэтому ею вполне можно пренебречь, выбрав в качестве максимального значения, например 100 000 процентов, а в качестве шага одну десятую процента. Таким образом, всякая дуга может быть как больше, так и меньше любой дуги не более чем в 1000 раз.
3. Преобразование растрового изображения
Согласно [1] переход от растрового изображения к модели (1.1), осуществляется в два этапа:
1) при помощи волновой скелетизации [2] по бинарной матрице строиться граф, который «интуитивно адекватно» соответствует символу на изображении;
2) граф особым образом разбивается на множество простых путей
w — {к ,v2 ,...,vn i)}
vj — (xj ,yj) — точка в пространстве
3) по множеству W строится множество A - дуг и R - связей дуг, однозначно определяющее данное изображение;
Определим функцию L(wi), которая вычисляет длину пути Wi.
Ui-l
L(wi) = V+i " vj1 j=i
Теперь, зная длину дуги, мы без труда можем вычислить относительный размер каждой дуги. В качестве ключевой дуги можно взять, например, первую дугу. Сопоставим каждому простому путю Wi дугу ai. Тогда функция Metric будет иметь следующий вид:
Metric(di) = С ■
L(wi)
где C - некоторая константа (в нашей реализации мы используем 1000).
Замечание 2. На практике предпочтительнее в качестве ключевой дуги использовать какую-нибудь дугу, обладающую уникальным свойством (например, количество дуг, с которыми она имеет соединения). Это позволяет избежать лишних перерасчетов относительных длин.
4. Постановка задачи анализа плоских контурных
изображений
Общую схему решения комбинаторных задач высокой сложности логико-эвристическими методами [3] можно трактовать как отображение начальной (инициальной) многоосновной алгебраической системы [4; 5].
Mint =< Ai,...,As; fi,...,fn;Pi,-,Pk > (4.1)
где Ai — основные множества, f — операции (функции) на основных множествах, pi — предикаты (отношения) на основных множествах, в конечную (финальную) Mftn, удовлетворяющую ограничениям
R1 j R2} ■■■} Rm.
Посмотрим, как ведет себя функция сложности проверки выполнимости ограничений R1, R2, ■■■, Rm на математических моделях вида (2.1) с позиции обеспечения независимости скорости проверки от числа ограничений.
В качестве составляющих элементов образцов и анализируемого изображения выступают, очевидно, дуги и связи дуг, численными характеристиками которых будут количество минимальных шагов возрастания для дуги (связи дуг) — градусные меры дуг, имеющие минимальное и максимальное значения.
Пусть многоосновные а.с.
ctor, Angle, Metric, Relation >
О Г\ПГ> А Г) П! О 1\/T&iir>>i n F?ol fit 4 ntn \
(4.2)
R1 —< Ai ,Ri, V, M; Sector, Angle, Metric, Relation > R2 —< A2,R2, V, M; Sector, Angle, Metric, Relation >
Rm —< Am, Rm, V, M; Sector, Angle, Metric, Relation >
задают искомые образцы в анализируемом изображении (2.1).
Анализ изображения (2.1) состоит в поиске всех изоморфных вложений fii,j многоосновных а.с. R1, R2,..., Rm в многоосновную а.с. M (2.1), т.е. [4; 5] изоморфное вложение ii,j : Ri — M состоит из инъективных отображений
: Ai ^ A li,j : Ri — R
таких, что:
а) если iiitj(a') — a, где a' £ Ai,a £ A и
Sector(a ) \cmin, cmax], Sector(a) — [cmin, cmaxЬ то [cmin, cmax] £ [cmin,cmax];
б) если ii,j(a') — a, где a' £ Ai,a £ A и
Metric(a ) — [cmin, cmax],
Metric(a) — [cmin ,cmax ],
то [cmin, cmax] £ [cmin,cmax];
в) если ii,j(r') — r, где r' £ Ri, r £ R и
Angle(r ) \cmin,cmax], Angle(r') — [cmin ,cmax], то [cmin, cmax] £ [cmin,cmax];
г) если Relation(r,ai,a2), где r £ Ri, ai,a2 £ Ai, то
Relation(li,j (r),li,j (ai),li,j a))
5. Оценка сложности анализа изображений
Напомним, что в [1] была рассмотрена следующая теорема, и приведено ее доказательство:
Теорема 1. Верхняя граница сложности проверки принадлежности кортежа (0,1,0,2,..., ап) отношениям Н1,Н2,..., Нк не превышает 0(п + к).
Был сформулирован аналог теоремы 1 для базовой модели представления (1.1)
Теорема 2. Пусть каждая из многоосновных а.с. ,..., име-
ет не более п дуг и представляет связное изображение. Тогда анализ связного изображения (1.1) имеет верхнюю границу сложности, не превышающую 0(((т + Ь) * т) + т), где т — количество дуг (Ь — количество связей дуг) изображения (1.1).
Определим универсум для изображений, имеющих не более п дуг, и не более к связей дуг (это ограничение ни сколько не повлияет на результат, но немного упростит нам форму записи).
Пусть Л1,Л2,..., Лт — множества дуг всех характеристик (образцов), т. е.
Л1 = (а1,1 ,а1,2,...,а1,п}',
Л2 = {а2,1 ,а2,2,...,а2,п}; (5 1)
Лт — {ат,1, ат,2, ..., ат,п };
Далее пусть К1,К2,..., Ят-1 — множества связей дуг всех характеристик, т.е.
#1 = {Г1,1 ,Г1,2, ...,Т1,к};
#2 — {Г2,1 ,Г2,2 ,...,Г2,к }, (52)
Кп-1 = {Гп-1,1,Гп-1,2, ...,Гп-1,к};
Если теперь взглянуть на дерево образцов, то может показаться, что добавление новой характеристики никак не повлияло на результат, однако это не так. Напомним, что в [1] каждому узлу мы сопоставляли значение угла дуги и, таким образом, запись первого слоя дерева (нулевой слой — корень дерева) в виде
а1,1,а2,1...а1,п
возможна, но была чуть некорректна, и все же в достаточной мере соответствовала модели.
# Значения вершин дерева
0 Корень дере n а
1 «1,1 «1,2
2 «2,1 «2,2 ■■■ «2,1 (12,2 | ■ ■ ■ «2,mi «2,1 «2,2 ■■■ «2,,гКа
Ч | "пД | «п.2 | ■ ■ ■ | «п:т„ | | «п,2 | ■ ■ ■ | «n.m„ | ■ ■ ■ | "пД | «и.2 | ■ ■ ■ | «п:т„
Рис. 1. Дерево Tree
У Ч /ч
Я] (Я/) • ■ • (гй) ■ • * (Я>)
/ \ / ч
/ Ч
г1.1) • 1 ' (Г...
Рис. 4- Первые два уровня дерева образцов (слева), и поддерево <1,
з
Теперь же каждая дуга определяется двумя параметрами, следовательно, появляется новый промежуточный слой. С точки зрения модели, этот слой не добавляет никаких новых элементов в объект изображения, поэтому мы оформим его в виде набора поддеревьев, у которых каждый узел 2-го уровня (т. е. т1,т2, ...т\м|) порождает дополнительный набор элементов связей дуг. Таким образом, наше дерево соответствует следующему декартову произведению:
Ох х М1 х V1 х С2 х М2 х V2 х ... х Уп-г х Оп х Мп (5.3)
где
О1 = {Лпд1е(а^),Лпд1е(а^2), ...,Лпд1е(а^п)}
М, = {МеЬт1е(аг,х), МеЬт1е(аг,2),..., МеЬт1е(агп)} (5.4) VI = {Sector(ri,1), Sector(ri,2), ...,Бес1ог(г^к)}
Очевидно, что (5.3) содержит все изображения, имеющие не более п дуг, и к связей дуг.
Однако работать с таким деревом не удобно, намного удобнее редуцировать третий уровень и, таким образом, вернуться к старой модели дерева («двухслойной»). Так как множества значения углов и относительных величин ограниченно, мы можем упорядочить множества дуг следующим образом:
Пусть Л = {ах,..., аи,..., ап} - множество всевозможных дуг
^весШа) = д^ 0 <г < V |, V = {до, ...,д\у-1}
МеМс(аи) = т^, 0 < ] < 1МI, М = {т0,..., т\м — }
тогда к = г * 1М | + ].
Таким образом, мы снова оперируем двумя основными множествами: множеством дуг Л и множеством связей К.
1Л1 = \VreiI * 1МI
|К| = ^аге I
Vrel, ^аге — V
# Значения вершин дерева
0 Корень дерева
1 а' 1.111,
2 <г кг 1 ■■■ к, "е|,| | ' | ■ ■ ■ | "2,^
' 1 <1 1 | - | <,: | | 1 ■■■ 1 1 ■■■ 1 <1 1 Ж 1 ■■■ 1 СГ1
Рис. 5. Дерево изображений
Получается, что мы остаемся в рамках базового представления дерева образцов, но уже с новой моделью данных. И если дерево изображений имеет следующий вид (данный переход является тривиальным):
Таким образом, можно сформулировать обобщение теоремы 2:
Теорема 3. Пусть каждая из многоосновных а.с. ,..., име-
ет не более п дуг и представляет связное изображение. Тогда анализ связного изображения (2.1) имеет верхнюю границу сложности не превышающую 0( (т + Ь) * т + т ), где т — количество дуг (Ь — количество связей дуг) изображения (2.1).
Замечание 3. Как и в случае для базовой постановки задачи, на практике универсум (схема 2) не строится, а строится только его часть, состоящая из дуг и связей дуг многоосновных а.с. ..., .
6. Заключение
1) Мы показали, что добавление новой характеристики никак не влияет на скорость распознавания. Связано это с тем, что в качестве «ключевого» отношения выступает отношение Ке1аИоп(т, а\,а2), которое обеспечивает связь двух дуг. Это отношение построено на декартовом произведении ЯхАхА. Новая характеристика никак не влияет на вычислимость отношения, а лишь увеличивает количество возможных комбинаций параметров дуг. Этот результат позволяет утверждать, что добавление любого конечного количества дополнительных характеристик как к дугам, так и к связям дуг, никак не повлияет на сложность алгоритма распознавания, хотя и существенно увеличит объем используемой памяти для хранения объектов предобработки, что, в принципе, закономерно.
2) Стоит отметить, что в данной статье не был рассмотрен случай, когда относительная мера дуги равна нулю. Очевидно, что такая ситуация означала бы отсутствие дуги как таковой в анализируемом изображении. На практике получить такое изображение невозможно.
Однако стоит отметить, что если хранить в дереве образцов значения относительных мер дуг в виде промежутков (так же как это сейчас делается для значений секторов и углов связей), можно реализовать уровни детализации образца в дереве. При таком представлении мы сможем уменьшать количество деталей в образце, отбрасывая дуги, чья относительная мера меньше некоторого порогового значения.
Один из возможных вариантов реализации такой процедуры (процедуры откидывания дуги с сохранением целостности образца) — это использование в качестве меры нулевого значения. В настоящий момент, вопрос, как поведут себя алгоритмы распознавания (как изменятся оценки) при реализации такой процедуры, остается открытым.
Автор выражает благодарность Мартьянову Владимиру Ивановичу за рекомендации по написанию статьи.
Список литературы
1. Мартьянов В. И. Комбинаторные задачи высокой сложности и анализ плоских контурных изображений / В. И. Мартьянов, М. Д. Каташевцев // Изв. Иркут. гос. ун-та. Сер. Математика. - 2013. - №4. - С. 31-47.
2. Каташевцев М. Д. Волновая скелетизация / М. Д. Каташевцев // Вестн. Иркут. гос. техн. ун-та. - 2013. - № 7. - C. 89-92.
3. Обзор приложений логико-эвристических методов решения комбинаторных задач высокой сложности / В. И. Мартьянов, В. В. Архипов, М. Д. Каташевцев, Д. В. Пахомов // Современные технологии. Системный анализ. Моделирование / ИрГУПС. - 2010. - № 4(28). - С. 61-67.
4. Гери М. Вычислительные машины и труднорешаемые задачи / М. Гери, Д. Джонсон. — М. : Мир, 1982. - 419 с.
5. Мальцев А. И. Алгебраические системы / А. И. Мальцев. - М. : Наука, 1967. - 324 с.
6. Беллман Р. Динамическое программирование / Р. Беллман. — М. : Изд-во иностр. лит., 1960. - 400 с.
Каташевцев Михаил Дмитриевич, аспирант, Иркутский государственный технический университет, 664074, г. Иркутск, Лермонтова, 83, тел.: 8-914-923-24-63 (e-mail: [email protected])
M. D. Katashevtsev
Analyse of Sketch Images with Metrics
Abstract. The article considers to the problem of analysis of sketch images within the logical-heuristic paradigm. A model representation of raster contour image as a system of
arcs and links arcs. Each arc is connected to another arc through the linked arcs relation. Arcs and arcs relations represent as primitives with a given set of properties. In the basic model the arc has two properties - degree measure of the arc and the direction of traversal (clockwise or counterclockwise). This paper introduces a new extended model of representation of raster contour image. The new model extends the concept of the arc by adding a relative arc length (relative to other arcs forming the system of arcs of the image). We are considering an algorithm for constructing a new model based on skeletizated image. We present procedure of the reduction of the samples tree for the extended model to the samples tree of the base model. Reviewed estimates of the complexity of new algorithms. Provides estimates of the complexity of the basic recognition algorithms. The results showing that the introduction of the extended model does not affect the complexity of the basic recognition algorithms. It is suggested that the addition of any finite number of features to arc concept design wont affect the complexity of recognition. Offered the new method of the reducing the number of samples in the samples tree as implementation of the detailing procedure, comprising removing from a sample the arcs whose relative size is less than some userdefined threshold.
Keywords: computer graphics, image recognition, logic-heuristic, raster, algebraic system, relative metrics.
References
1. Martyanov V.I., Katashevtsev M.D. Combinatorial problems of high complexity and analyse of sketch images [Kombinatornye zadachi vysokoj slozhnosti i analiz ploskih konturnyh izobrazhenij], Izvestija Irkutskogo Gosudarstvennogo Universiteta Ser. "Matematika 2013, no. 4, pp. 31-47.
2. Katashevtsev M.D. Wave Skeletization [Volnovaja skeletizacija], Vestnik Irkutskogo Gosudarstvennogo Tehnicheskogo Universiteta, 2013, no. 7, pp. 89-92.
3. Martyanov V.I., Arkhipov V.V., Katashevtsev M.D., Pakhomov D.V. Logical heuristic methods for solving combinatorial problems of high complexity. Applications review [Obzor prilozhenij logiko-jevristicheskih metodov reshenija kombinatornyh zadach vysokoj slozhnosti], Sovremennye tehnologii. Sistemnyj analiz. Modelirovanie. [Modern technologies. System analysis. Modeling.] IRGUPS., 2010, no. 4(28), pp. 61-67.
4. Garey M., Johnson D. Computers and Intractability [Vychislitel'nye mashiny i trudnoreshaemye zadachi]. Moscow, Mir, 1982.
5. Malcev A.I. Algebraic Systems [Algebraicheskie Sistemi]. Moscow, Nauka, 1967.
6. Bellman R. Dynamic programming [Dinamicheskoe programmirovanie]. Moscow foreign papers publishing, 1960.
Katashevtsev Mikhail Dmitrievich, Postgraduate, Irkutsk State Technical University, 83, Lermontov st., Irkutsk, 664074 tel.: 8-914-92324-63 (e-mail: [email protected])