Комбинаторные задачи высокой сложности и анализ плоских контурных изображений

Мартьянов Владимир Иванович; Каташевцев Михаил Дмитриевич

Серия «Математика»

2013. Т. 6, № 4. С. 31-46

Онлайн-доступ к журналу: http://isu.ru/izvestia

УДК 519.6

Комбинаторные задачи высокой сложности и анализ плоских контурных изображений

М. Д. Каташевцев, В. И. Мартьянов

Иркутский государственный университет

Аннотация. В статье рассмотрена задача анализа плоских контурных изображений в рамках логико-эвристической парадигмы. Введена модель представления бинарного растрового изображения в виде многоосновной алгебраической системы, построенной на множествах дуг и связей между дугами. Описаны алгоритмы распознавания изображения в рамках введенной модели, ранее успешно используемые для решения задач анализа генетического кода и составления расписания.

Ключевые слова: анализ изображений; распознавание образов; логико-эвристический; растровое изображение; алгебраические системы.

Важнейшим направлением развития современных информационных технологий (и в целом прогресса, так как невозможно представить современную науку и технику без использования компьютеров) является создание математических методов быстрого решения информационных задач.

В идеале, эти методы должны обеспечивать скорость решения ряда важных информационных задач вне зависимости от объема данных. И действительно, есть ряд важных информационных задач, где это возможно.

Наглядным (и очень важным) примером этого являются реляционные базы данных (БД), где вычислимость запросов определенных типов не зависит от объема данных, а только линейно от сложности проекта самой БД.

В основе этого лежит следующий, довольно просто доказываемый, факт — сложность проверки принадлежности кортежа (а1, а2,..., ап), где а1 е А1,а2 € А2,...,ап € Ап, отношению Н, определенному на конечных множествах А1, А2,... ,Ап, линейна от п (т.е. не зависит от числа кортежей, составляющих отношение Н).

1. Введение

При компьютерной реализации конечные множества Ai,A2,..., An являются доменами, а отношение H — таблицей реляционной БД.

Соответственно, вопрос о принадлежности кортежа (a\,a2,...,an) отношению H, сводится к проверке не пустоты курсора, полученного после выполнения данного SQL-запроса:

SELECT *

FROM H

WHERE Ai = ai AND A2 = a2 AND ... AND An = an, что, при наличии общего индекса по столбцам соответствующим Ai, выполняется со скоростью линейно зависящей от п. Если искать истоки данных результатов, то, наверное, следует обратиться к Д.Кнуту [1], где представлен древовидный способ организации данных.

Практическим подтверждением этого является скорость работы банковских систем, использующих сетевые реляционные БД, с их мировыми сетями терминалов и банкоматов, где можно проводить операции с вкладами и денежными средствами в любой точке мира за считанные секунды.

Отметим, что практически к этому классу примыкают задачи поиска данных по ключевым словам в интернет-пространстве (поисковые системы «Google» [2], «Яндекс» и др.), где скорость поиска не замедляется из-за экспоненциального роста информации в глобальной сети.

Одним из важнейших классов информационных задач являются задачи распознавания образцов (образов), где также могут быть получены результаты независимости скорости распознавания образцов от их количества [3], вернее, верхней границы сложности распознавания одного образца с добавкой только количества образцов.

Результаты работы [3] получены для простой организации данных, практически не отличающейся (если абстрагироваться от специфики предметных задач сетевого планирования) от рассмотрения проверки принадлежности кортежа (a1,a2,..., an) отношениям H1,H2,..., Hk, которые определены на конечных множествах Ai, А2An.

Для такой постановки соответствующий результат работы [3] может быть сформулирован следующим образом

Теорема 1. Верхняя граница сложности проверки принадлежности кортежа (a1,a2,..., an) отношениям H1,H2,..., Hk не превышает O(n + k).

Отметим, что другие формы организации данных для ряда предметных задач рассмотрены в [4]. В настоящей статье предложен определенный способ формального (математического) описания плоских связных контурных изображений и в рамках данной формализации доказано, что сложность распознавания образцов не превышает O(n) + O(k), где O(n) - верхняя граница сложности распознавания одного образца, k -количество образцов.

Возможно, данный результат до некоторой степени объясняет феномен мгновенного распознавания практически неограниченного количества образов зрением живых организмов.

Замечание 1. Очень важно учитывать, что графы, представляющие плоские контурные изображения, не являются произвольными, так как дуги, исходящие из одной вершины, располагаются по окружности 360 градусов и, следовательно, вполне упорядочены, а также имеют минимальный угол пересечения (т. е. количество дуг, исходящих из одной вершины графа ограничено). Да и сами дуги имеют ограниченное количество численных характеристик, см. замечание 2. Таким образом, не надо трактовать результаты статьи, как решение известных NP-полных задач для графов [5][6].

2. Формализация описания плоских контурных изображений

Составляющими элементами плоских контурных изображений будем считать дуги и связи дуг. Дуга arc основной количественной характеристикой имеет сектор окружности, измеряемый в градусах (точнее, в количестве минимальных шагов возрастания градусной меры дуги, что обеспечивает конечность количественных характеристик в некоторой шкале или масштабе).

Замечание 2. Отметим, что любые две несовпадающие точки a и b на плоскости (задающие луч аЬ) можно соединить дугой заданной градусной меры а (0 < а < 360) ровно двумя способами, в первом случае все точки дуги будут лежать справа от луча ab, будем говорить что дуга обходится по часовой стрелке, во втором случае все точки дуги будут лежать слева от луча и речь будет идти об обходе против часовой стрелки. Для дуг градусной меры а £ {0, 360} направление обхода не определено.

Связь дуг rel основной количественной характеристикой имеет угол между дугами, измеряемый в градусах (точнее, в количестве минимальных шагов возрастания углов, что обеспечивает конечность количественных характеристик в некоторой шкале или масштабе).

Основными математическими моделями для данного подхода будут трехосновные алгебраические системы [7][8] вида

M =< Arc, Rel, V; Sector, Angle, R > (2.1)

где основное множество Arc - совокупность дуг; основное множество Rel - совокупность связей дуг; основное множество V - некоторый начальный отрезок натуральных чисел (представляет сектора дуг и углы связей дуг в некоторой шкале); одноместная функция Sector :

Arc ^ V, т. е. определяет градусную меру дуги; одноместная функция Angle : Rel ^ V, т.е определяет угол связи дуг; трехместное отношение R соединяет связь дуг rel с соответствующими дугами, т. е. R -подмножество декартова произведения Rel х Arc х Arc.

Замечание 3. Для наших целей важно всегда работать только с конечными множествами, что достигается рассмотрением конечных множеств Arc, Rel, а также предположением о наличии минимального шага возрастания количественных характеристик дуг и связей дуг, т. е. конечное множество V имеет минимальное ненулевое значение, соответствующее минимальному шагу, и максимальное, соответствующее 360 градусам.

3. Преобразование растрового изображения

Построение формальной модели на основе растрового изображения состоит из двух этапов. Первый этап - волновая скелетизация. С помощью скелетезации на основе растрового изображение строится граф (скелет), который визуально адекватно соответствует исходному изображению.

Определение 1. Бинарное растровое изображение есть функция f : X х Y ^ {0,1},X £ Z,Y £ Z Определение 2. Заполненная область есть множество

F = {(x,V)\f (x,V) = 1}

Определение 3. Точку q(x1,y1) будем называть соседом точки p(x,y) если \х — x1\ < 1 и \у — y1\ < 1 и p = q. Введем отношение соседства N(p,q), которое истинно если p сосед q.

Очевидно что точка p не может иметь более 8 соседей. Обозначим через Np множество всех соседей точки p(x, у) лежащих в заполненной области F:

Np = {q\q £ F Л N(p,q)}

Далее будем считать что заполненная область F не имеет изолированных точек т.е.

Vp3q : N(p, q) p, q £ F

Замечание 4. Скелетом изображения f будем называть граф G(V, E), «интуитивно адекватно отражающий» исходное изображение.

Определение 4. Волной ш будем называть конечное множество точек {р] }.

Определение 5. Множество волн {ш\,ш2,...,шп} будем называть подволнами волны ш если:

и

Шг = Ш г=1,п

и)г П Wj = 0, = 1 ,П, %ф у,

и для любых двух точек р € , д € Ш], где г = ] верно —I N (р,д).

Введем функцию вычисляющую центр масс точек волны

р

\ш\

Опишем алгоритм построения скелета изображения f с непустой, связной заполненной областью Е

Алгоритм 1. Зададим начальные условия. В качестве начальной волны подойдет любая точка из Е. Имеем следующую начальную конфигурацию:

"00 = {р},р Є Е - начальная волна,

Ш0 = {адо0} - множество волн,

Ео = Е - состояние заполненной области,

С0(У0, Ео), У0 = {р},Е0 = 0 - начальное состояние скелета.

Определим п-й шаг итерации следующим образом. Для всякой г-й волны Шгкі-1 из Шп-1 (кг - соответствует кг-й итерации адг):

иЧк- = и \Ц1 "-'к-1 (3.1)

рЄ'Шікї~1 3<г

Если и1,..., ит есть подволны волны шгкі, тогда

ШП = {"1+1, . . .,Щ+т}

где

щ+і =Щ,І = Т/т, I = \Wn-i] + ^|И^|.

3<і

Ребра в графе образуют вектора, связывающие центры масс получен-

к1

ных подволн с центром массы "гкг 1

.М-1 .М.

К = т-\^)},з = 1,т

К = {^},3 = 1 ,т = д(ш])

Если же волна не имеет разрывов и = 0, то

№-п = {«>*}, еп = [Ы;1-'V)}, уг = к*}

Если = 0

шп = 0,Еп = 0,уп = 0

Таким образом, при вп = ^^1!:

Шп = {Шгп},1 = 1,8П Уп = Кг-1 У Уп, I = 1

г

Еп = Еп_1 У Егп, г = м„

г

Еп = Еп-1 \ Рп-Ъ

Рп-1 = [р : р € Ш,Ш € Шп-1}

Если \Еп\ =0 то алгоритм прекращает цикл итераций, а граф

О = (Уп ,Еп) является скелетом исходного изображения /.

Утверждение 1. Алгоритм «волновая скелетизация» остановится на любой заполненной области размерности ш, удовлетворяющей условиям алгоритма.

Доказательство. Пусть т = 1, тогда согласно алгоритму

\Е1\ = \Ео \{р : р € Ш,Ш € Шо}\ = \[р} \[р : р € Шо}| = \[р} \ [р}\ = 0

следовательно алгоритм прекращает свою работу а граф О = (У1, Е{) = ({р}, 0) является скелетом изображения.

Пусть т > 2 и существует такое I что для всякого к < I, \Е;\ < |Ек-1| и Е = |Ег-1|, тогда Рп-1 = 0, отсюда следует, что [р : р € ш,ш € Шп-\} = 0, а это возможно только в двух случаях:

1. если Шп-1 пусто, тогда, в силу 3.1 и в силу отсутствия изолированных точек, Еп-2 = 0, получаем противоречие с условием остановки.

2. если Уш Є Ш : |ш| =0, тогда, опять же в силу 3.1 и в силу отсутствия изолированных точек, получаем что Еп—2 = 0, снова получаем противоречие с условием остановки.

Следовательно такого I не существует, и алгоритм сходится для всякой непустой заполненной области без изолированных точек. □

Рис. 1. Схема разбиения графа «особыми» точками

Второй этап - интерполяция графа дугами. Граф разбивается на простые пути. Разбиение графа на простые пути идет по вершинам имеющих количество соседей не равное 2.

Определение 6. Будем говорить что в узле Уі меняется направление обхода простого пути

{VI, ..., Уі—і ,Уг,Уг+1, ...,Уп}

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

в окрестности є Є {2, 3,...}, если

Бгдп( Е гЬ) = Зідп( Е гіз)

3=і—ї 3=і+ї

где т\^ - расстояние со знаком от точки определяемой узлом до век-

тора образуемого точками узлов Уі и Уі—е Если соотношение выполняется для є = 2 будем говорить, что в точке Уі меняется направление обхода.

1. Для каждого простого пути выполняется:

a) Разбиение пути по точкам смены направления обхода

b) Для каждого разбиения выполнятся

I) Разбиение спиралей. Чтобы определить закручен ли путь по спирали, надо проверить пересекает ли хорда путь. Если пересечение есть, то необходимо разбить путь точками пересечения и) Для каждого разбиения выполняется:

А) Разбиение по точкам перегиба. Точками перегиба считаются образующие две дуги отклонившиеся от угла идеального соединения. Угол 7 идеального соединения двух дуг градусной меры а и в: 1 = 2п — (а + в)

2. Результатом п. 1 является множество подпутей, каждый из которых переводится в дугу. Градусная мера дуги вычисляется с использование формулы Гюйгенса. Определив наиболее удаленную точку пути от хорды стягивающей путь, и вычислив её положение относительно хорды направленной от начала к концу пути, мы определяем направление обхода. Если точка слева, то обход ведется по часовой стрелке, если точка справа — обход ведется против часовой стрелки, если же точка лежит на прямой, то верны оба утверждения.

3. Расчет связей дуг. Связь между двумя дугами существует, если пути образующие дуги имели общие вершины. Угол соединения между дугами рассчитывается, как угол между стягивающими их хордами

Замечание 5. Стоит отметить что разбиение на дуги, как правило, выполняется на интерполированном графе в котором часть узлов удаленно в силу их избыточности.

Замечание 6. Хотя разбиение и может быть использовано как есть, на практике полезнее добавлять возможность вариации параметров, например, допускать возможность некоторого отклонения от угла идеального соединения или для точек смены направления расширять область проверки на смену направления обхода.

4. Постановка задачи анализа плоских контурных

изображений

Общую схему решения комбинаторных задач высокой сложности логико-эвристическими методами [4] можно трактовать как преобразо-

вание начальной (инициальной) многоосновной алгебраической системы [6, 7] (например 2.1)

Mini =< A!,...,As; ; Pi,-,Pk > (4.1)

где Ai - основные множества, fi - операции (функции) на основных множествах, pi - предикаты (отношения) на основных множествах, в конечную (финальную) Mfin, удовлетворяющую ограничениям Ri,R2,..., Rm,.

Если искать аналоги, то последовательность таких преобразований можно считать допустимым (без оптимизации значений целевого функционала) управлением для задачи динамического программирования [9], где R1,R2,..., Rm фазовые ограничения.

При программной реализации многоосновная а.с. 4.1 становится реляционной БД, поиск последовательности преобразований для построения финальной а.с., удовлетворяющей ограничениям - комбинаторной задачей высокой сложности [4].

Для рассматриваемой здесь предметной области (анализ изображений) общая схема решения пока не может быть применена в полном объеме из-за начального этапа исследований (с точки зрения логикоэвристических методов) и отсутствия конкретных постановок прикладных задач (ближайшие планы применения логико-эвристических методов обсуждаются в заключении).

Поэтому ограничимся исследованием сложности проверки выполнимости ограничений Ri,R2,..., Rm на математических моделях вида 2.1 с позиции обеспечения независимости скорости проверки от числа ограничений.

Проверка выполнимости ограничений сводится к проверке вложи-мости обобщенных изображений (образцов) в анализируемое изображение 2.1.

Уточним формализацию описания плоских контурных изображений для данного варианта проверки выполнимости ограничений.

Составляющими элементами образцов и анализируемого изображения будут также дуги и связи дуг. Численными характеристиками которых будут количество минимальных шагов возрастания для дуги (связи дуг) - градусные меры дуг, имеющие минимальное и максимальное значения.

Таким образом, одноместная функция Sector : Arc ^ V преобразуется в одноместную же функцию Sector : Arc ^ V х V, соответственно, одноместная функция Angle : Rel V преобразуется в одноместную же функцию Angle : Rel ^ V х V.

Замечание 7. В принципиальном плане ввод минимальных и максимальных значений ничего нового не дает (от минимального до максимального всего конечное множество значений), но позволяет более

компактно задавать искомые образцы. Для упрощения технических деталей будем считать, что для анализируемых изображений функции Sector и Angle имеют одинаковое минимальное и максимальное значение

Пусть многоосновные а.с.

задают искомые образцы в анализируемом изображении 2.1.

Анализ изображения 2.1 состоит в поиске всех изоморфных вложений цг,з многоосновных а.с. Е1,Е2,..,Ет в многоосновную а.с. М 2.1, т.е. [6, 7] изоморфное вложение Лг,з : Ег ^ М состоит из инъективных отображений

такие, что:

а) если (Ат) = Лтт,где Ат е Атсг, Лтт е Ате, БесЬот(Ат) = (у\,у2), БесЬог(Агг) = (у3,у4), то у\ < у3 < у4 < у2;

б) если ,3(Ее) = Еее, где Ее е Ее1г, Еее е Ее1, Апд1е(Ее) = (у\,у2), Апд1е(Еее) = (у3,у4), то у\ < у3 < у4 < у2;

в) если Е(Ее,Ат\,Ат2), где Ее е Ее1г, Ат\ е Атсг, Ат2 е Атсг, то Е(Лг ,з (Ее),Лг,з (Ат1),Лг ,3 (Ат2)).

Для облегчения понимания идеи доказательства основного результата, рассмотрим доказательство теоремы 1. Основой его является представление декартова произведения конечных множеств

R1 =< Arc1, Rel]_, V; Sector, Angle, R > R2 =< Arc2, Rel2, V; Sector, Angle, R >

(4.2)

Rm =< Arcm, Relm, V; Sector, Angle, R >

(4.3)

5. Оценка сложности анализа изображений

A1 х A2 х ... х An

в древовидной форме Tree [1].

Определим более точно конечные множества

A1 = {a1,1,a1,2, ..., a1,mi }; A2 = {a2,1,a2,2, ..., a2,m2 };

(5.1)

Понятно, что таблица 1 является универсумом для любых таблиц реляционной БД с доменами A1, A2,..., An. Т.е представление отношения H в таблице состоит в пометке вершин n-го этажа, если путь от корня дерева до этой вершины n-го этажа, дает кортеж из отношения H.

Проверка принадлежности кортежа (a1 ,a2,...,an), где a1 £ A1, a2 £ A2,...,an £ An, отношению H производится за n шагов в таблице 1 (этот процесс в дальнейшем будем называть интерпретацией кортежа (a1 ,a2,...,an) на дереве Tree). Действительно, a1 позиционируется на 1-м этаже за 1 шаг, a2 позиционируется на 2-ом этаже за 1 шаг и так далее, an позиционируется на n-м этаже за 1 шаг, где и определяется принадлежность кортежа (a1,a2,..., an) отношению H.

Таким образом, проверка осуществляется за n шагов. Для доказательства теоремы достаточно пометить вершины n-го этажа на принадлежность отношениям H1, H2,..., Hk . Тогда в результате интерпретации кортежа (a1, a2,..., an) за n шагов на дереве Tree получим вершину n-го этажа пометки которой покажут принадлежность (или не принадлежность) отношениям H1H2,..., Hk.

Оценка O(n + к), а не O(n), получается из-за необходимости пройти по списку отметок n-го этажа, что и дает добавку О(к).

Замечание 8. Результат теоремы 1 типичный, так называемый обмен памяти на эффективность [5]. Конечно, задание декартово произведения деревом увеличивает необходимый объем памяти, но скорость выполнения операций предельно ускоряется. Следует отметить также, что на практике универсум (рис. 1) не строится, а строится только его часть, состоящая из кортежей отношений H1, H2,..., Hk. Вообще говоря, это замедляет скорость интерпретации, но незначительно не более, чем на ln(m), где m = max{m1,m2,...,mn} (это связанно с необходимостью перебора узлов «частичного» дерева, что, в силу упорядоченности, можно реализовать с помощью бинарного поиска).

Прежде, чем перейти к изложению основного результата, определим универсум для изображений, имеющих не более n дуг, и к вариантов дуг и связей дуг, т. е. множество V имеет к элементов, а минимальный сектор дуги или угол пересечения дуг равен (360/к) градусов.

# Значения вершин дерева

0 Кореш, дерева

1 “и **1,2 ^1,ГП|

2 <*2,1 | **2,2 | | **2,7712 **2,1 | <*2,2 | • • • 1 <*2,7712 <*2,1 | <*2,2 | • • • | <*2,7712

И 1 **71,1 I **71,2 1 ' ■ ■ I <*71,77I„ 1 **71,1 1 **71,2 1 • • • 1 <*71,771„ | • • • | **71,1 | **71,2 | • • • | **71,771п

Рис. 2. Дерево Tree

Пусть Arcl,Arc2, ■■■, Arcn - множества дуг всех характеристик (образцов), т.е.

Arcl = {arl,l, arl,2, ■ ■■, an,mi I;

Arc2 = {ar2,l ,ar2,2 ,■■■,ar2m1; (52)

Arcn = {arn,l, arn,2j ■■■, arn,mn 1;

Далее пусть Rell, Rel2, ■ ■■, Reln-l - множества связей дуг всех характеристик, т.е.

Rell = {rel,l,rel,2, ■■■,rel,kiI;

Rel2 = {re2,l,re2,2,:;re2,k2 I;

vi -f ■■■ (5.3)

Reln—l — \ren—l,l,rren—l,2,---,rren—l,kn — iI;

Angle(rei,j) = (j,j)

Дерево Treelmage (универсум (рис. 2) для всех изображений, имеющих не более n дуг, и k вариантов дуг и связей дуг) строится по аналогии с деревом Tree для декартова произведения

Arcl x Rell x Arc2 x Rel2 x ■■■ x Reln—l x Arcn

Соглашения по представлению элементов рис. 2 следующие:

1. для элемента - число в является позицией на этаже схемы (номер клетки в строке); является х-ым элементом из множества

Arc^ или Relм;

2. числа mi, где i - номер этажа, равны k — k; число t = k2n—l — k, отметим, что данные числа имеют чисто технический характер и уменьшают громоздкость выражений, стоящих в конце строк рис. 2.

Очевидно, что рис. 2 содержит все изображения, имеющие не более n дуг, и k вариантов дуг и связей дуг. Структуру дерева на рис. 2 будем задавать отношениями Pararc(x,y), Brotarc(x,y) для дуг, и Parrei(x,y) для связей дуг.

# Значения вершин дерева

0 Корень дерева

1 ari.i аг\л т|+*-1 аг l.mi

2 ™\л I Ге1.2 | ••* | ГС1.* ГЄЇГ l<22 I ••• I гс\\ r„m3 I rpma+l I I ге, , 1 ГЄ22 | ... | (12.к

2" -11 «г1л і «і, і... і arn.t і І і - і і •• і <11 <2 i - i «аг*

Рис. 3. Дерево Treelmage

Отношение Pararc(x, у) задает отношение «родитель - потомок» на декартовом произведении Arc х Rel, например, Pararc(ar2 ■ ,rekW-1^™), где 1 < w < к. Отношение Pararc(x, у) связывает элементы, расположенные на соседних этажах, и может быть определено строго математически, а именно, Pararc(ae^, х,вп) тогда и только тогда, когда

1. ц = Z или ц + 1 = Z

2. (в - 1)к < Z < (в - 1)к + к - 1

Отношение Brotarc(x, у) задает отношение «быть братом» на декартовом произведении Arc х Arc. Отношение Brotarc(x, у) связывает элементы, расположенные на одном этаже и связанные с одним элементом верхнего этажа отношением «родитель-потомок», и может быть определено строго математически, а именно, Brotarc(ae/1 , х,ff{- п) тогда и только тогда, когда

1. а = в;

2. ц = Z;

3. в < ( и в — ( < к, а также [в/к] > 0, где операция [] остаток от деления.

Отношение Parrei задается по аналогии, на декартовом произведении Rel х Arc.

Интерпретация £ произвольного связного изображения 2.1 (в дальнейшем термин «изображение» будет означать только «изображение, имеющие не более n дуг, и к вариантов дуг и связей дуг», если, конечно, не оговорено противное), где

Arc = {ar1 ,ar2,..., arw },w < n, Rel = {re1 ,re2,.., ret} (5.4)

на дереве Treelmage производиться по следующей схеме

Основание индукции. Пусть i = 1 и Sector(ari) = (j,j) и

Rrel1 = {rei | R(rei,Ar1,Ar2), Ar1 = ar1 V Ar2 = ar1}

Arr1 = {aari | R(rei,Ar1,Ar2), rei £ Rrel1,

(Ar1 = ar1 A Ar2 = aari) V (Ar2 = ar1 A Ar1 = aari)}.

Тогда полагаем £ (ar1) = ar{ j, £ (rei) = retfV-l1*k+u, где rei £ Rreh,

Angle(rei,) = Angle(re1,v)=v. Если aari £ Arr1, то £(aari) = ar<2'-l1*k+e, где d - позиция элемента £(rei) (т.е. d = (j — 1) * к+v, Sector(aari ) = (e, e).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Отметим, что Pararc(£(ar1 ),£(rei)), Parrel(£(rei),£(aari)), а также для любых aari и aarj из Arr1 выполняется Brotarc(£(aan),£(aarj)).

Интерпретация £ продолжается для множества дуг Arc1 = Arc \ ({ar1}^) Arr{), множества связей дуг

Rel1 = Rel \ Rrel1.

Замечание 9. Важнейшим моментом построения отношений

Pararc(x,y),Brotarc(x,y) и Parrei(x,y)

на рис. 2 является их конструктивизм (эффективная вычислимость за один шаг) и это свойство сохраняется при построении интерпретации £, как для основания индукции (так и для индукционного шага, что будет показано ниже).

Индукционный шаг. Пусть после i-го шага получены непустые множества дуг Arri = {ari1 ,ari2 ,...,ariw}, Arci = Arci-1 \ Arri, множества связей дуг Rreli, Reli = Reli-1 \ Rreli, причем по аналогии с основанием индукции, дуги из множества £(Arri) располагаются на 2 * i + 1 этаже рис. 2, связи дуг из множества £(Rreli) располагаются на 2 * i этаже рис 2.

По алгоритму основания индукции будем проводить построения для каждой дуги ara £ Arri такой, что ara не принадлежит объединению {an} U Arr1{j ... [J Arri-1. Пусть Sector(ara) = (j,j) и

Rreli+1,a = {res I R(res,Ar1,Ar), res £ Reli, Ar1 = ara V Ar2 = ara}

Arri+1,a ={aaru | R(res,An,Ar),

(Ar1 = ara A Ar2 = aaru) V (Ar2 = ara A Ar1 = aaru)}

Пусть £(ara) = are+1j. Тогда £(res) = re(+-1Vj*k+v, где res £ Rreli+1a,

Angle(res) = Angle(re(ie+_- l^*k+v) = v.

Если aaru £ Arri+1a a, то £(aaru) = arf-^^^, где d - позиция элемента £(res) (т.е. d = (в — 1) * к + v), Sector(aaru) = (e, e)

Отметим, что Pararc(£(ara),£(res)), Parrei(£(res),£(aaru)), а также для любых aari и aarj из Arri+1a выполняется Brotarc(£(aari),£(aarj)).

Полагаем множество дуг Arri+1 равным объединению всех Arri+1a, где ara произвольная дуга из множества Arri такая, что ara не принадлежит объединению {ar1} |J Arr1\_\ ... [J Arr—1, также множество связей дуг Rreli+1 полагаем равным объединению всех Rreli+1a, соответствующие произвольным дугам ara из множества Arri (смотри, выше).

Интерпретация £ продолжается для множества дуг

Arci+1 = Arci \ Arrj,,

и для множества связей дуг

Яв1г+1 = Яв1г \ Ктв1г+1.

Так как по условию интерпретируемое изображение 5.4 является связным, то процесс интерпретации £ будет закончен не более, чем за ю шагов индукции, где ю - количество дуг.

Отметим, что соответствие при построении интерпретации £ для любой дуги или связи дуг изображения 5.4 производится за один шаг, так как «связывание», соответствующего элемента рис. 2, производится вычислением одной арифметической формулы. Таким образом, доказана

Лемма 1. Верхняя граница сложности построения интерпретации £ для связного изображения 2.1 не превышает 0(ю + Ь), где ю - количество дуг, Ь - связей дуг.

Теорема 2. Пусть каждая из многоосновных а.с. Я1,Я2,.., Ят 4.2 имеет не более п дуг и представляет связное изображение. Тогда анализ связного изображения 2.1 имеет верхнюю границу сложности не превышающую 0(((ю + Ь) * ю) + т), , где ю - количество дуг (Ь - количество связей дуг) изображения 2.1, причем множества дуг и связей дуг представлены выражениями 5.4.

Доказательство. Построим интерпретации всех многоосновных а.с. К\,К2,..., Ят на универсуме рис. 2 для всех изображений, имеющих не более п дуг, и к вариантов дуг и связей дуг (сложность этой процедуры, конечно, не входит в оценку доказываемой теоремы).

Далее, пометим все вершины рис. 2 номерами многоосновных а.с., чьи элементы соответствуют этим вершинам. Каждой многоосновной

а.с. Я сопоставим пару чисел (аг,Ьг), где аг - количество помеченных вершин 2, соответствующих дугам, Ьг - количество помеченных вершин рис. 2, соответствующих связям дуг (конечно, помеченных номером г).

Построим совокупность интерпретаций £\,£2, ...,£т на рис. 2 (с помеченными вершинами), которые отличаются выбором первой дуги для основания индукции. А именно, интерпретация £1 начинается традиционно с дуги аг1 , интерпретация £2 начинается с дуги аг2 , и так далее. Последняя интерпретация £т начинается, соответственно, с дуги агт.

Введем для каждой интерпретации £г множество пар

(аг1 ,Ьг^ ), (аг2 ,Ьг2 ), ..., (агт , Ьгт ) (5.5)

где aij (Ьг..) - количество помеченных ] вершин рис. 2, соответствующих дугам (соответственно, связям дуг), полученных для интерпретации £г. Если пара (аг.,Ь.) равна паре (а^,Ь^), то, таким образом, найдено изоморфное вложение j-го изображения (образца) в анализируемое изображение .

В силу леммы 1, построение каждого отображения £г требует не более ю + Ь шагов и, таким образом, верхняя граница сложности поиска всех изоморфных вложений не более 0(((ю+Ь) *ю) + т), где «добавка» О(т) возникает из-за необходимости сравнивать пары 5.5 с парами (а^,Ьj).

□

Замечание 10. Как и в случае для базовой постановки задачи, на практике универсум (рис. 2) не строиться а строится только его часть, состоящая из дуг и связей дуг многоосновных а.с. Я, Я2,..., Ят 4.2.

6. Заключение

1. Адекватность предложенной формализации представления плоских контурных изображений общей задаче распознавания изображений, конечно, требует отдельного тщательного обсуждения, что не входит в цели данной статьи. Но отметим некоторые «генетические» достоинства данного подхода, например, устойчивость к масштабированию, гладкой деформации (растягиванию или сжатию), вращению образцов и анализируемого изображения. Наиболее популярные на сегодняшний день алгоритмы, реализованные на основе нейронных сетей [10], как правило, теряют свою работоспособность при простом масштабировании (равномерном сжатии, увеличении) или вращении изображения. Разработчики решают данную проблему, предлагая конечному пользователю в мануальном режиме повернуть, увеличить (уменьшить) изображение.

2. Следующим этапом развития данного подхода будет ввод относительных размеров дуг и проведения операций сжатия изображений, когда дуги, меньшие определенных размеров, стягиваются в точки, что «убирает» детали и позволяет проводить предварительный анализ для более простых изображений. А результаты анализа сжатых изображений могут быть использованы для анализа исходных изображений.

3. Как уже отмечалось выше, для рассматриваемой предметной области (анализ изображений) общая схема решения комбинаторных задач в логико-эвристическом подходе не используется. Предполагается ее применение при решении задач поиска «партизана и его собаки в лесу» и подобных визуальных головоломок.

Список литературы

1. Кнут Д. Искусство программирования для ЭВМ. Сортировка и поиск / Д. Кнут. - М. : Мир, 1978. - 848 с.

2. BigTable [Электронный ресурс]. — URL: http:// ru.wikipedia.org/wiki/BigTable.

3. Мартьянов В. И. Логико-эвристические методы сетевого планирования и распознавание ситуаций / В. И. Мартьянов // Труды Междунар. конф. «Проблемы управления и моделирования в сложных системах». - Самара. 2001. -С. 203-215.

4. Обзор приложений логико-эвристических методов решения комбинаторных задач высокой сложности / В. И. Мартьянов, В. В. Архипов, М. Д. Ка-ташевцев, Д. В. Пахомов // Современные технологии. Системный анализ. Моделирование / ИрГУПС. - 2010. - №4(28). - С. 61-67.

5. Лорьер Ж.-Л. Системы искусственного интеллекта / Ж.-Л. Лорьер. - М. : Мир, 1991.

6. Гери М.Вычислительные машины и труднорешаемые задачи / М. Гери, Д. Джонсон. — М. : Мир, 1982.

7. Мальцев А. И. Алгебраические системы / А. И. Мальцев. - М. : Наука, 1967. - 324 с.

8. Кокорин А. И. Вопросы разрешимости расширенных теорий / А. И. Кокорин, А. Г. Пинус // Успехи мат. наук. - 1978. - Т.33, вып.2. - С. 49-84.

9. Беллман Р. Динамическое программирование / Р. Беллман. — М. : Изд-во иностр. лит., 1960.

10. Еремин Д. М. Искусственные нейронные сети в интеллектуальных системах управления / Д. М. Еремин, И. Б. Гарцеев. — М. : МИРЭА, 2004. - 75 с.

V. I. MARTYANOV, M. D. KATASHEVTSEV

Combinatorial problems of high complexity and analyse of sketch images

Abstract. The article is dedicated to the problem of recognition of sketch images. The problem is reviewed under logic-heuristic paradigm. The model of binary raster image representation like a system of arcs and relates between arcs is reviewed. The key algorithms of recognition for images representation according to the introduced model, which were found useful at solving scheduling and genetic analyse problems, is described.

Keywords: computer graphics; image recognition; logic-heuristic; raster; algebraic system.

Мартьянов Владимир Иванович, доктор физико-математических наук, профессор кафедры автомобильных дорог, Иркутский государственный технический университет, 664074, Иркутск, Лермонтова, 83 тел.: 8-914-899-15-12 ([email protected])

Каташевцев Михаил Дмитриевич, аспирант НИ ИрГТУ Иркутский государственный технический университет, 664074, Иркутск, Лермонтова, 83 тел.: 8-914-923-24-63 ([email protected])

Martyanov Vladimir, Irkutsk State Technical University, 83, Lermontova St., Irkutsk, 664074 doctor of physical and mathematical science, professor Phone: 8-914-899-15-12 ([email protected])

Katashevtsev Mikhail, Irkutsk State Technical University, 83, Lermontova St., Irkutsk, 664074 postgraduate student, Phone: 8-914-923-24-63 ([email protected])

Комбинаторные задачи высокой сложности и анализ плоских контурных изображений Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Мартьянов Владимир Иванович, Каташевцев Михаил Дмитриевич

Похожие темы научных работ по математике , автор научной работы — Мартьянов Владимир Иванович, Каташевцев Михаил Дмитриевич

Combinatorial problems of high complexity and analyse of sketch images

Текст научной работы на тему «Комбинаторные задачи высокой сложности и анализ плоских контурных изображений»