Научная статья на тему 'Графический поиск чертежей в хранилищах данных'

Графический поиск чертежей в хранилищах данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
346
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЧЕРТЕЖ / РАСПОЗНАВАНИЕ ОБРАЗОВ / PATTERN RECOGNITION / НЕЧЕТКИЙ ГРАФ / FUZZY GRAPH / ЛУЧЕВОЙ ГРАФ / TECHNICAL DRAWING / BEAM GRAPH

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кучуганов А.В., Касимов Д.Р.

Текстовый поиск документов применяется на практике широко и довольно успешно, однако возможности средств поиска документов, содержащих графические элементы, остаются все еще ограниченными.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Graphical search of technical drawings over data warehouses

An approach to drawings (sketches) searching based on a multilevel recognition and logical analysis is presented. The approach incorporates construction and comparison of objects patterns fuzzy attribute graphs and relies on the methods and tools of structural pattern recognition, fuzzy graphs, automatic reading of drawings and 3D models as well as exploring beam graph in the recognition process. Examples are given.

Текст научной работы на тему «Графический поиск чертежей в хранилищах данных»

№ 2 (38) 2012

А. В. Кучуганов, канд. техн. наук, доцент Ижевского государственного технического университета Д. Р. Касимов, магистрант Ижевского государственного технического университета

Графический поиск чертежей в хранилищах данных1

Текстовый поиск документов применяется на практике широко и довольно успешно, однако возможности средств поиска документов, содержащих графические элементы, остаются все еще ограниченными.

Введение

При проектировании новых изделий важным является использование существующих компонентов, конструкторских решений, технологических процессов. Однако найти требуемый документ среди тысяч непросто, учитывая характер технической документации, которую образуют чертежи, 3D-модели, сканированные тексты. В настоящий момент проблема поиска графической информации решается главным образом путем анализа кодов классификации и текстовых описаний, создаваемых человеком. При этом, помимо высоких затрат ручного труда при создании и сопровождении архива, трудно формулировать запросы, в том числе из-за влияния субъективизма, когда люди описывают одну и ту же деталь по-разному, часто исходя не из геометрической формы детали, а из ее функционального предназначения. Уже появились также коммерческие и свободные для использования системы поиска (например, CADFind2, IMShape3, 3D Model Retrieval System4), использующие методы распознавания образов, но по критерию

1 Работа выполнена при поддержке РФФИ (проекты № 11 -07-00632-а, 11-07-00783-а).

2 URL: http://sketchandsearch.com/.

3 URL: http://www.intermech.ru/imshape.htm.

4 URL: http://3d.csie.ntu.edu.tw/~dynamic/.

релевантности поиска они пока значительно уступают средствам текстового поиска.

В настоящей работе рассматривается задача поиска аналогов проектируемой детали в базе документов на основе графического сопоставления. Поисковым запросом является чертеж (эскиз) детали. Формат чертежей может быть как векторным, так и растровым. Чертежи в растровом формате автоматически преобразуются в векторный вид и представляются в виде нечетких нагруженных графов (этап графической индексации). Сопоставление графических образов состоит в вычислении оценки сходства графов. Выделяются уровни грубого, точного и детального сопоставления. На разных уровнях используются различные представления чертежа.

Общая технология

Технология графического поиска чертежей в электронном архиве построена на базе структурного подхода к распознаванию образов [1] и включает следующие основные этапы:

1. Заполнение паспорта. Каждый чертеж при записи в электронный архив, как обычно, снабжается паспортом. В число текстово-числовых атрибутов паспорта входят источник документа, его автор, наименование изделия, его класс, шифр, матери-

№ 2 (38) 2012

ал, класс точности, габариты, вес и другие характеристики, комментарий, адрес двоичного графического файла. Эти атрибуты используются для стандартного атрибутивного поиска.

2. Графическая индексация.

Этап включает нижеперечисленные шаги:

2.1. Векторизация.

2.2. Выделение вспомогательных элементов чертежа.

2.3. Сегментация чертежа (разбиение на составляющие).

2.4. Распознавание составляющих (поиск типовых конфигураций).

2.5. Формирование графа образа чертежа.

Данная обработка применяется как для чертежа-запроса, так и для чертежей в архиве.

3. Поиск аналогов в архиве.

Этап включает следующие шаги:

3.1. Выбор класса деталей по текстово-числовым атрибутам (паспорту).

3.2. Сопоставление графических образов чертежа-запроса и архивного чертежа.

3.3. Оценка сходства.

3.4. Если оценка сходства выше заданной, то визуализация аналога и его конструктивных элементов, которые совпали с конструктивными элементами чертежа-запроса.

Типовые составляющие внутренних описаний хранятся в базе данных системы, могут пополняться в процессе ее эксплуатации и служат для ускорения поиска, поскольку сокращается количество графических сопоставлений.

Когнитивная модель процесса узнавания эскизов и чертежей

Тезаурус системы графического поиска чертежей включает следующие категории понятий.

1. Общие характеристики деталей, например: тело вращения, плоская деталь, штамповка, корпусная, трубчатая, крестовина и т. п.

2. Вспомогательные характеристики: ось,

разрез, сечение, количество видов и т. д. ^ 3. Контур: прямоугольник, параллело- ^ грамм, трапеция, квадрат, ромб, треугольник, звезда, круг и т. д. |

4. Стандартные детали и узлы (крепеж-

^-тТ

Рис. 1. Примеры типовых конструктивных элементов чертежа

6. Термины, характеризующие положение и связи элементов, составляющих графический образ: слева, справа, вверху, внизу, в углу, внутри и т. п.

Исходим из предположения, что сложный неизвестный объект человек мысленно раскладывает на простые знакомые конфигурации, образуя из них гештальт второго порядка (уровня). Например, домик в раннем детстве складывается из элементов «крыша», «труба», «окно» и т. д. Можно провести аналогию с механизмом восприятия текста (рис. 2).

Представленная когнитивная модель позволяет рассматривать чертеж или эскиз как многоуровневую систему наподобие языковой, в которой на нижнем уровне находятся отрезки, на лексическом уровне — примитивы, на синтаксическом уровне — объекты, на семантическом уровне — графические образы.

Таким образом, для задачи графического поиска чертежей характерно следующее:

1. Тезаурус языка описания чертежей должен быть адекватен когнитивистике восприятия зрительных образов, т. е. мы можем описать рисунок словами.

£

ные изделия и др.).

5. Типовые конструктивные элементы оа (ТКЭ) машиностроения (фаски, канавки, от- ^ верстия и др.). Некоторые ТКЭ представлены на рис. 1.

85

№ 2 (38) 2012

Рис. 2. Когнитивная модель узнавания и описания рисунков

2. Словари типовых составляющих можно пополнять автоматически, по мере появления новой конфигурации или артефакта (рис. 3).

Рис. 3. Выделение неизвестных ТКЭ

Уровни конкретизации графических образов

В системе графического поиска чертежей выделено три уровня представления визуальной информации.

1. Граф опорных точек представляет отдельный фрагмент чертежа. Опорными считаются особые стыковочные точки на множестве графических элементов: разветвления, точки излома, концы. Ребра графа порождаются только цепочками элементов (рис. 4), поскольку рассматриваются отношения между соседними опорными точками по топологии расположения.

2. Граф контуров представляет отдельную проекцию чертежа.

Первым затруднением при построении графа является сегментация чертежа

<0

Ч

&

&

со

£ 6

г *

§

Рис. 4. Отправной граф опорных точек

86

№ 2 (38) 2012

на контуры. Необходимо стремиться к экономичности и адекватности формируемого множества контуров. С этой целью применяются следующие приемы:

• достраивание линий (на одной прямой, на одной окружности, четвертой стороны у незамкнутых прямоугольников);

• ограничения на структуру контуров (выпуклые, симметричные и т. д.)

• дополнительный анализ нетиповых контуров;

• поиск минимального контурного покрытия;

• правила проекционного черчения.

Вторым затруднением при построении

графа является установление основного множества связей. В отличие от уровня опорных точек в процессе сопоставления рассматриваются отношения между произвольными контурами. При этом вместо построения полного графа контуров, в котором все узлы связаны со всеми, применяется наиболее естественная схема определения ребер графа: пространственные отношения изначально устанавливаются только между контурами,

находящимися в отношении вложенности § (рис. 5), а в процессе сопоставления — | по мере надобности. ^

Применение представленной схемы аргументируется следующими соображениями: |

• поскольку среди рассматриваемых отношений операция определения вложенности является самой ресурсоемкой, она вы- оо полняется до операции графического со- ^ поставления;

• схема соответствует концепции структурного распознавания образов, где главную роль играют иерархические структуры;

• структурная иерархия образует уровни детализации, а это позволяет варьировать точность сопоставления и сокращать анализируемое пространство параметров рисунка (рис. 6).

3. Граф конструктивных объектов представляет 3D-модель, изображенную на чертеже. Вершинами графа являются конструктивные объекты: изоморфный объект, призма, вал, кольцо. Они задаются с помощью формообразующих контуров, которые в явном виде представлены на чертеже.

Name — имя типового контура, совпавшего с данным; Orient — ориентация данного контура относительно типового; Size — размер данного контура (площадь, периметр, габариты); Туре — тип контура (профиль, сечение);

Section — в разрезе (0,1)

г" JV

<—' - / \ _I о

Orient2DV— ориентация 20-вектора, соединяющего центральные точки контуров; Nesting — вложенность (нет, содержит внутри себя, содержится в);

Contact — касание (0, 1); Covering — перекрытие (нет, перекрывает, перекрывается); Intersection — пересечение (0, 1)

Рис. 5. Отправной граф контуров

87

№ 2 (38) 2012

<0

Ч

&

&

со

£ 6

г *

§

Сегментация чертежа (выделение объектов) выполняется методом автоматического чтения чертежей и синтеза 3D-мо-делей, описанным в работе [2]. Ребрами графа служат, как и на предыдущем уровне, атрибуты ориентации и вложенности (рис. 7).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На этом уровне чертеж описывается наиболее точно. Представление на данном уровне также позволяет расширить возможности технологии, в том числе за счет дополнительного поиска 3D-моделей и использования 3D-моделей для задания запросов к базе данных. Однако чертежи зачастую содержат недостаточное количество информации для построения 3D-представле-ния без участия человека.

На всех трех уровнях узлы графов классифицируются по базе типовых составляющих (для первого уровня — типовые опорные точки, для второго — типовые контуры, для третьего — типовые конструктивные объекты). При этом задачи распознавания контуров и конструктивных объектов, а также выделения на чертеже некоторых ТКЭ,

сводятся к задаче сопоставления графов опорных точек.

Виды атрибутов

Графические образы характеризуются атрибутами, которые рассматриваются с нескольких сторон, что, в частности, необходимо для работы в условиях деформаций и аффинных преобразований (перенос, поворот, масштаб).

Количественное значение QN(x) атрибута х — это значение атрибута в базовой системе измерения. Если атрибут комплексный, его количественное значение является вектором, например, QN(форма цепочки) =

= (61, е2

еп) — список элементов, об-

разующих цепочку. Количественный уровень — это уровень исходных данных.

Относительное значение х) атрибута х:

х) = ^ х 100% — QN(b)

процент длины или площади;

88 у

№ 2 (38) 2012

Name — имя типового объекта,

совпавшего с данным;

Orient — ориентация данного объекта

относительно типового;

Size — размер данного объекта (объем,

габариты);

SetOperation — булевская операция (сложение, вычитание)

Orient3DV— ориентация ЗР-вектора, соединяющего центральные точки объектов;

Nesting — вложенность (нет, содержит внутри себя, содержится в); Contact — касание (0, 1); Intersection — пересечение (0, 1)

Рис. 7. Отправной граф конструктивных объектов

RL(х) = QN(х) - QN(b) -отклонение угла;

RL(х) = RelFunc(QN(x),QN(b)) -общий случай,

где Ь — эталонный атрибут, т. е. определяющий систему измерения, например, длина самой длинной цепочки, размер эталона, габаритная площадь детали, ориентация базового узла;

RelFunc — функция, выдающая относительное значение: процент, отклонение или качественную величину, например, RL (форма цепочки) = левая извилистая.

Использование относительных значений позволяет полностью удовлетворить потребности процесса распознавания, как при принятии решений, так и при вычислении оценки сходства. Сравнение относительных величин, а также количественных, происходит с учетом допуска (порога).

Лингвистическое представление LV( х) атрибута х — это лингвистическая перемен-

ная, комплексная модель атрибута, формализующая представление эксперта об атрибуте. Используется математическое определение из теории нечеткой логики: LV(х) = {х,Т(х),X,G,М} [3]. Поясним применение лингвистического представления на примере атрибута направление: х: «направление»;

X: [0°,360°] — все возможные значения QN (направление);

Т(х): значения «Вперед», «Влево», «Вправо», «Назад»;

G: «Вперед-», «Влево-», «Вправо-», «Назад-» — такие добавки позволяют образовывать новые значения: «Вперед-Влево», «Вправо-Назад-Вправо» и пр.; М: математическое правило, определяющее вид функции принадлежности для каждого значения из множества Т ( х), например, М(Вперед) = {0°/1,...,90° / 0,...,270° / 0,...,360°/1} (рис. 8).

Заметим, что лингвистическая переменная не хранит конкретное нечеткое значение. Лингвистическое представление позволяет

№ 2 (38) 2012

Нечеткое множество «Вперед» ц = 0,5

ц = 1

Нечеткое множество «Вправо»

ц = 0,6 ц = 0,5 = 0,4

0,4

ц = 0,5 Ц = 0,6

ц = 0,5

Рис. 8. Нечеткие значения в лингвистической модели атрибута направление

на языке, близком к естественному, задавать правила принятия решений и вычисления оценки сходства. Пример тривиального правила дан на рис. 9. Аппарат нечеткой логики позволяет интерпретировать подобные правила и получать в результате нечеткие значения, которые могут быть преобразованы в четкие числа. Заметим, что процедура преобразования нечеткого значения в четкое число является ресурсоемкой операцией.

Таким образом, один и тот же атрибут имеет несколько форм, например, длина цепочки:

1) количественное значение в пикселях или миллиметрах;

2) относительное значение в виде процента от самой длинной цепочки или размера эталона;

3) комплексная модель в виде лингвистической переменной.

Графическое сопоставление

Перечислим задачи распознавания, которые можно решать с помощью рассмотренных ранее графических образов.

1. Граф опорных точек: поиск аналога по внешнему контуру проекции, сопоставление полных проекций, поиск на чертеже заданного фрагмента (рис. 10).

<0

Ч

&

&

со

£ 6

г *

§

Рис. 9. Пример правила нечеткой логики и его выполнения

90

№ 2 (38) 2012

Рис. 10. Принцип распознавания ТКЭ на чертеже

2. Граф контуров: сопоставление проекций, поиск заданного фрагмента.

3. Граф конструктивных объектов: сопоставление 3D-моделей, поиск заданного 3D-фрагмента.

В общем случае алгоритмы сопоставления графов характеризуются большой вычислительной сложностью. В качестве более эффективного средства в работе [4] предлагается подход на основе лучевого графа (как инструмента анализа), с помощью которого строится модель картины для локального наблюдателя из произвольного узла. Инструмент поддерживает работу в условиях деформаций и проведение глубокого анализа. Пример лучевого графа по отношению вложенности представлен на рис. 11.

Результатом сопоставления является оценка сходства. Она вычисляется на основе активизированных атрибутов:

— графа как целого;

— общей части графов и частей-остатков;

— отдельных узлов и ребер.

Оценка становится более гибкой при назначении атрибутам весов.

Обобщая, отметим, что сопоставление образов заключается в рекурсивном синхронном переходе по графам объектов во все новые возможные состояния с одновременным вычислением оценки сходства. Исходное состояние соответствует базовому узлу. В каждом состоянии строится лучевой граф относительно текущего узла (точки зрения). Путем анализа лучевого графа обновляется оценка сходства и определяются следующие допустимые состояния.

Базовые узлы назначаются автоматически, поэтому для каждого чертежа базы данных желательно вести статистику по базовым узлам с целью исключения ошибочных назначений при последующих сопоставлениях. Допускается ручное указание базового узла, например, чтобы акцентировать внимание на соответствующем фрагменте запроса.

1 £ ОС

со §

1

Рис. 11. Лучевой граф контуров, видимых из заданного узла

91

№ 2 (38) 2012

с^*

о

о

о

Со

4—£

?

Г'

о

Рис. 12. Объединение цепочек в процессе сопоставления

<0 Ч

¡3 &

со

£ 6

г *

§

Рассмотренный принцип сопоставления применяется на всех уровнях. Например, на уровне опорных точек с помощью лучевого графа осуществляется поиск глобального сходства, и могут модифицироваться исходные графы (рис. 12).

Параметры поиска

В представленном подходе пользователь может осуществлять следующее:

— выбор задействованных уровней, их порядка и степени релевантности (значение ожидаемой оценки сходства);

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— контроль построения и модификацию внутреннего представления запроса, в том числе указание базового узла, выделение фрагментов путем назначения весов, что позволяет повысить качество распознавания, рассматривая запрос в качестве эталона, а не равноправного объекта;

— указание дополнительных требований (&, V, —), в частности, задаваемых с помощью выносок (рис. 13);

— уточнение сущности запроса (целое или часть);

Рис. 13. Требование наличия ТКЭ

— ввод не только чертежей, но и эскизов и 3D-моделей в качестве запроса.

Перечисленные возможности позволяют организовать гибкий режим расширенного поиска.

Заключение

На данный момент не ставилась задача измерения надежности подхода. Цель заключалась в формулировании общих принципов и определении необходимых информационных структур, апробировании алгоритмов выявления сходства и отличий с деталями-аналогами. На тех небольших выборках тестовых данных, которые использовались при проведении исследований, состоятельность представленного подхода подтверждается.

Список литературы

1. Фу К. С. Структурные методы в распознавании образов. М.: Мир, 1977. — 319 с.

2. Кучуганов В. Н, Касимов Д. Р. Лингвистический алгоритм синтеза трехмерных геометрических моделей по чертежу // Приволжский научный журнал. 2011. № 4. С. 118 - 124.

3. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976. — 165 с.

4. Кучуганов А. В. Распознавание нечетких зрительных образов с помощью лучевых графов. В кн.: Труды конгресса по интеллектуальным системам и информационным технологиям «АШТ'10». Научное издание в 4 т. М.: Физматлит, 2010. Т. 1. С. 258 - 264.

92

i Надоели баннеры? Вы всегда можете отключить рекламу.