АВТОМАТИЗАЦИЯ СИНТЕЗА ТЕХНОЛОГИЧЕСКИХ РЕШЕНИЙ И ИХ ДОКУМЕНТИРОВАНИЯ НА ОСНОВЕ ИЗВЛЕЧЕНИЯ ИНЖЕНЕРНЫХ ЗНАНИЙ
Е.В. Толкачева, И.И. Семенова
В статье рассматривается задача синтеза технологических решений и их документирования на основе извлечения инженерных знаний из базы данных электронного архива технической документации. Приводится описание разработанного алгоритма и программного обеспечения, которые решают указанную задачу на основе методов поиска ассоциативных правил и секвенциального анализа. Также приводится пример использования описанного алгоритма при автоматизированном формировании технологической документации для нового проекта в отрасли машиностроения
Ключевые слова: электронный архив технической документации, автоматизация проектирования в промышленности, автоматизация документирования, интеллектуальный анализ данных конструкторской и технологической документации
В рамках проблемы реструктуризации и обновления проектно-производственных сред на основе высоких САЬ8-технологий в условиях рыночной экономики актуальна задача комплексной автоматизации технологической подготовки производства - от проектирования технологических процессов до формирования комплекта технологической документации. Развитие современных автоматизированных систем технологической подготовки производства идет по пути интеллектуализации [1, 2 и др.]. Системы нового поколения должны не только предоставлять набор инструментов для структуризации, накопления и использования информационных ресурсов, необходимых для проектирования и документирования технологических процессов, но и выполнять функции поддержки принятия решений. В основу работы таких систем положен структурный и параметрический анализ и синтез технологических процессов с использованием алгоритмов оптимизации (алгоритмы на графах, генетические алгоритмы, нейронные сети и т.д.) и методов искусственного интеллекта (имитационное и эволюционное моделирование, построение баз знаний, деревьев решений и т.д.) [3, 4, 5 и др.].
В настоящей статье предлагается подход к автоматизации синтеза технологических решений и документирования технологических процессов на основе извлечения инженерных знаний из базы данных электронного архива технической документации (ЭАТД). В качестве при-
Толкачева Елена Викторовна - СибАДИ, аспирант, e-mail: tolkacheva_ev@mail.ru
Семенова Ирина Ивановна - СибАДИ, канд. техн. наук, доцент, e-mail: osobaii@gmail.com
мера рассматривается задача автоматизации процесса технологической подготовки производства на стадии разработки технического проекта изготовления сложных технических объектов (далее - изделий) на предприятии ОАО "Механический завод "Калачинский", специализирующемся на проектировании и производстве сельскохозяйственной техники.
В рамках реализации предлагаемого подхода можно выделить следующие подзадачи: сформировать базу данных ЭАТД; разработать алгоритм извлечения знаний из базы данных; разработать алгоритм синтеза технологических решений на основе извлеченных знаний.
Формирование базы данных электронного архива технической документации
Используемые на машиностроительных предприятиях системы автоматизации проектирования технологических процессов и разработки технологической документации включают в себя базы данных, работающие под управлением современных систем управления базами данных (СУБД) и спроектированные с учетом специфики решаемых задач. Технологические решения, разработанные с применением таких систем, хранятся в базе данных в виде взаимосвязанных наборов элементарных атрибутов, а формы технологической документации по ГОСТ генерируются автоматически как отчеты по запросам к таблицам баз данных. Однако на многих предприятиях накоплены проекты, разработанные до внедрения автоматизированных систем и хранящиеся в виде файлового архива технической документации. Поэтому актуальна задача автоматизации преобразования накоплен-
ного файлового архива технической документации в базу данных. Такая задача была решена для фрагмента файлового архива технической документации завода на производство съемного оборудования. В состав комплектов технической документации вошли следующие документы:
1) конструкторская документация: сборочные чертежи; чертежи деталей; спецификации; ведомость покупных изделий;
2) технологическая документация: ведомость материалов; операционная карта; маршрутная карта; ведомость оснастки и оборудования; ведомость специфицированных норм расхода материалов; технико-нормировочная карта.
Документация разработана в соответствии с ГОСТ (ЕСКД, ЕСТД), графические документы представлены в формате dxf, а текстовые - в формате xls. Для данного набора документов была создана база данных под управлением СУБД MS SQL Server 2005 Express Edition, включающая 52 таблицы, и разработана программа-анализатор, созданная в C++ Builder 2007, выполняющая для каждого документа из заданного набора следующие функции: определение типа документа; преобразование блоков текстовых данных в документе в упорядоченный набор строк; выделение из строк значений атомарных атрибутов и занесение их в соответствующие поля в таблицах базы данных.
Из текстовых документов данные извлекаются в полном объеме. Из графических документов извлекается код и наименование детали или сборочной единицы и данные о технических требованиях. Ввиду многообразия конструктивных особенностей деталей в автоматизированном режиме извлечь данные о конструкции детали из графического документа и систематизировать их в базе данных технически сложно. Для решения проблемы в качестве характеристики конструкции были выбраны габаритные размеры, имеющиеся у всех деталей и извлекаемые из форматов dxf, step, igs и др..
Созданная программа была протестирована на фрагменте комплекта конструкторской и технологической документации на изготовление изделия "Жатка валковая "Марья". Извлеченные из файлового архива данные в дальнейшем могут быть экспортированы в базу данных любой современной системы автоматизации проектирования технологических процессов и разработки технологической документации.
Извлечение инженерных знаний из базы данных ЭАТД
Для решения задач извлечения знаний об объектах используются методы интеллектуального анализа данных (Data Mining) [6]. Методы Data Mining применяются для решения задач
регрессии, классификации, кластеризации и поиска ассоциативных правил.
Задача поиска ассоциативных правил заключается в нахождении частых зависимостей (ассоциаций) между объектами (событиями). Найденные зависимости (закономерности) представляются в виде правил, которые позволяют предсказывать поведение объектов в будущем.
База данных ЭАТД содержит знания специалистов, выраженные в форме разработанных ими конструкторских и технологических решений. Закономерности, существующие в последовательности технологических решений, составляют полезный опыт, который может быть использован в дальнейшем при проектировании и документировании технологических процессов для новых технических проектов изделий, на которые разработаны комплекты конструкторской документации. Отыскание таких закономерностей, отражающих знания специалистов, представляет собой задачу поиска ассоциативных правил.
Обобщенная задача поиска ассоциативных правил состоит в нахождении групп объектов из некоторого множества I = {1, /2,..., гп } , часто встречающихся в большом количестве наборов объектов Б = {71, Т2, Тт} , наборы Т}- с I на-
зываются транзакциями.
Пусть Р с I - произвольный набор объектов множества I, Бр = {Т;- е Б | Р с Т^} с Б - множество транзакций, в которые входит набор Р. Отношение количества транзакций, в которые входит набор р , к общему количеству транзакций называется поддержкой набора р и обозначается 8ирр(Р) : 8ирр(Р) = |БР| /|Б| . Набор Р называется частым, если его поддержка больше некоторого заданного значения 8ирртт . Таким образом, задача поиска ассоциативных правил сводится к отысканию всех частых наборов объектов Ь = {р | 8ирр(Р) > 8ирртт }.
Поиск ассоциативных правил в упорядоченном множестве объектов называется секвенциальным анализом. Пусть на множестве объектов I задано отношение порядка. Под последовательностью понимается упорядоченное множество объектов £ с I : £ = {.., 1р,•••} , где
р < д . Говорят, что последовательность £ входит в транзакцию Т , если £ с Т и объекты, входящие в £ , входят в Т с сохранением порядка (при этом допускается, что в последовательности Т между объектами из последовательности £ могут находиться другие объекты). Последовательность называется частой, если ее поддержка превышает заданную минимальную поддержку 8ирртт . Задачей секвенциального анализа является поиск всех частых последова-
тельностей Ь = {£ | 8ирр(£) > 8ирртт } . Секвенциальный анализ применяют в случае, когда на практике имеет значение порядок следования анализируемых объектов.
Для того чтобы сформулировать задачу поиска ассоциативных правил применительно к отысканию закономерностей в последовательности конструкторских и технологических решений, прежде всего, необходимо определить множества анализируемых объектов.
Конструктивно состав изделия определяется набором входящих в него сборочных единиц, деталей, стандартных и прочих изделий и материалов. Сборочные единицы, в свою очередь имеют аналогичный состав. Пусть IСБ - множество объектов вида (патеСБ, РурвСБ), где патеСБ - наименование составляющей сборочной единицы, typeСБе {сборочная единица, деталь, изделие, материал} - тип составляющей сборочной единицы. Тогда вся совокупность сборочных единиц, данные о составе которых имеются в базе данных ЭАТД, представляет собой множество транзакций
БСБ = {Т1СБ, Т2сб,ТСБ}, где Т/Б сIСБ , N - количество сборочных единиц. Поиск частых наборов в транзакциях множества Б СБ позволит выявить конструктивные закономерности в составе изделий и сборочных единиц.
Процесс изготовления изделия подразделяется на изготовление деталей и сборочных единиц и сборку изделия. С точки зрения технологии производства каждая деталь или сборочная единица характеризуется:
- набором материалов, необходимых для изготовления или сборки, и норм расхода;
- последовательностью технологических операций (ТО), выполняемых при изготовлении или сборке, и норм времени на выполнение ТО.
Пусть Iм - множество объектов вида (патеМ, погтМ), где патеМ - наименование материала, погтМ - норма расхода материала; Iто - множество объектов вида (патеТО, погтТО), где патеТО - наименование ТО, погтТО - норма времени на выполнение ТО. Тогда, во-первых, вся совокупность деталей и сборочных единиц, данные о материалах для изготовления которых имеются в базе данных ЭАТД, представляет собой множество транзакций Бм = {Т1м, Т2м,ТМ} , где Т“ с Iм ; во-вторых, вся совокупность деталей и сборочных единиц, данные технологии изготовления которых имеются в базе данных ЭАТД, представляет собой множество транзакций
Бто = {Т1то, Т2то,Т™}, где Т™ с Iто, К - количество деталей и сборочных единиц. Поиск частых наборов в транзакциях множества Б м и
частых последовательностей множества Б то позволит выявить закономерности в технологических решениях, применяемых при изготовлении деталей и сборочных единиц.
С каждой ТО, в свою очередь, связан набор оснасток и оборудования, используемых при выполнении ТО. Пусть IоБ - множество объектов вида патеОБ, где патеОБ - наименование оснастки, оборудования. Тогда вся совокупность ТО, данные о которых имеются в базе данных ЭАТД, представляет собой множество транзакций БоБ = {Т1оБ, Т2оБ, То}, где То с IоБ , Ь -
количество сборочных единиц. Поиск частых
наборов в транзакциях множества Б оБ позволит выявить закономерности в процессах выполнения ТО.
Для извлечения инженерных знаний из базы данных ЭАТД разработан алгоритм:
1. Положить БСБ = 0.
2. Для каждой сборочной единицы:
2.1. положить ТСБ = 0;
2.2. для всех сборочных единиц, деталей, стандартных и прочих изделий добавить в множество ТСБ объект (патеСБ, уреСБ);
2.3. добавить ТСБ в множество БСБ .
3. Положить Бм =0, Бто =0.
4. Для каждой детали и сборочной единицы:
4.1. положить Тм =0;
4.2. для всех материалов, использованных при изготовлении деталей или сборке сборочной единицы, добавить в множество Тм объект
(патеМ, погтМ);
4.3. добавить Тм в множество Бм .
4.4. положить Тто =0;
4.5. для всех ТО, выполняемых при изготовлении деталей или сборке сборочной единицы, добавить в множество Тто объект (патеТО, погтТО);
4.6. добавить Тто в множество Бто .
5. Положить БоБ =0.
6. Для каждой технологической операции:
6.1. положить Т0Б =0;
6.2. для всех оснасток и оборудования, используемых при выполнении ТО, добавить в множество ТоБ объект патеОБ;
6.3. добавить ТоБ в множество БоБ .
7. Найти множество частых наборов ЬСБ объектов (патеСБ, typeСБ) и множества включающих их сборочных единиц.
8. Найти множество частых наборов Ьм объектов (патеМ, погтМ) и множества включающих их деталей и сборочных единиц.
9. Найти множество частых последовательностей Ьто объектов (патеТО, погтТО) и множества включающих их деталей и сборочных единиц.
10. Найти множество частных наборов Ь0Б объектов патеОБ и множества включающих ТО.
При выполнении шагов 7-10 вызывается алгоритм поиска множества Ь частых наборов в транзакциях множества Б = {Т1; Т2,..., Тщ} .
1. Положить Ь = 0.
2. Для всех Ti, I = 1, 2, ..., | Б | -1:
2.1. Положить М = 0.
2.2. Положить Р = Т .
2.3. Для всех Ту , у = I +1,2, ...,| Б | : если 8ирр(Р п Ту) > 8ирртт , то добавить Р п Ту в Ь , иначе если Р п Ту ф 0, то добавить Р п Ту в М .
2.4. Выполнить алгоритм поиска частых наборов в транзакциях множества М .
Алгоритм поиска множества частых последовательностей отличается от алгоритма поиска множества частых наборов только определением пересечений совокупностей объектов. Пересечение наборов определяется как пересечение множеств, а пересечение последовательностей £1 = {/'{, /2,., 1'р } и £2 = {/'{', /2, ., Iд } определяется
с учетом порядка объектов по следующему алгоритму:
1. Положить к = 1.
2. Для всех /'■, у = 1, 2,., Р :
2.1 для всех I", I = к, к +1,..., д : если ^ = I", то добавить г'у в £1 п £2 и положить к = у +1.
Величина минимальной поддержки 8ирртт задается экспертом - лицом, принимающим решения (ЛИР).
Синтез технологических решений на основе извлеченных знаний
При проектировании технологических процессов и разработке комплекта технологической документации на изготовление нового изделия для сборочных единиц, входящих в состав изделия, из базы данных выбираются типичные технологические решения, примененные ранее для сходных по составу сборочных единиц. Для каждой сборочной единицы в составе нового изделия необходимо решить следующие подзадачи:
1) найти в базе данных максимально сходные по составу сборочные единицы;
2) выбрать технологические решения;
3) сформировать шаблоны технологической документации.
Для решения сформулированных подзадач используются знания, полученные путем анализа данных в базе данных ЭАТД. Поиск для сборочной единицы сходных по составу единиц осуществляется по следующему алгоритму:
1. Из спецификации выделить набор сборочных единиц, деталей, стандартных и прочих изделий и материалов в составе сборочной единицы.
2. Сформировать для сборочной единицы множество T объектов (патеСБ, typeCE).
3. Положить MСБ = 0.
4. Среди всех частых наборов из LCE найти такой набор L, для которого максимально значение | T n L | / | T |.
5. Если max | T n L | /1T |ф 0 , то положить MСБ
L
равным множеству сборочных единиц, связанных с L , иначе среди всех наборов из множества DСБ найти добавить в множество MСБ такие наборы T;СБ, для которых | T n T^ | /1T |> kmm .
Если MСБ =0, то заданное ЛПР значение kmin можно уменьшить. При MСБ =0 для сборочных единиц из множества MСБ поиск и документирование технологических решений осуществляется по следующему алгоритму:
1. Для всех сборочных единиц M e MСБ :
1.1. найти для сборочной единицы M и входящих в ее состав деталей множества связанных с ними частых наборов LM(M) с LM и частых последовательностей LTO(M) с LTO .
1.2. Для всех ТО, связанных с последовательностями множества LTO (M), найти множество связанных с ТО частых наборов L™ (M) с L™ .
2. Из чертежей деталей в составе сборочной единицы извлечь габаритные размеры.
3. Из множеств LM(M) , L0B (M) и LTO(M) выбрать наборы и последовательности для деталей, имеющих минимальное суммарное отклонение по габаритным размерам от одноименных деталей в составе сборочной единицы и сформировать на основе выбранных данных шаблоны технологической документации.
Анализ результатов работы алгоритма Предложенные алгоритмы были реализованы в С++ Builder 2007 и протестированы на сформированной базе данных ЭАТД, содержащего конструкторскую и технологическую документацию на изготовление изделия "Жатка валковая "Марья". В процессе работы алгоритма извлечения знаний использовалось значение Suppmin = 0,1 , т.к. в базе данных ЭАТД содержится свыше ста типов разнородных по составу сборочных единиц, наборы и последовательности признавались частыми, если были обнаружены в 10 % случаев. Для тестирования алго-
ритма синтеза технологических решений использовался новый комплект конструкторской документации на сборочную единицу «Вал», в состав которого входили документы: спецификация, сборочный чертеж, три чертежа деталей. При поиске в базе данных ЭАТД сходных по составу сборочных единиц использовалось значение к т1П = 0,5, т.е. сборочная единица признавалась сходной по составу, если обнаруживалось совпадение более 50 % составных частей. Состав новой сборочной единицы совпал с одним из найденных частых наборов объектов множества IСБ : ((цапфа, деталь), (труба, деталь), (цапфа, деталь)). С деталями, вошедшими в состав данного набора, связаны найденные частые наборы множества Iто : ((отрезная, 0,150), (токарная, 0,737)), ((отрезная, 0,129), (токарная, 0,340), (сверлильная, 0,414)), ((отрезная, 0,150), (токарная, 1,262), (фрезерная, 0,318)).
Был проведен сравнительный анализ технологического решения, разработанного специалистом завода, и синтезированного технологического решения. Анализ показал, что параметры технологических процессов изготовления деталей совпадают при поиске решения по схожим сборочным единицам.
Для дальнейшего улучшения качества синтеза технологических решений планируется исследовать кроме габаритных размеров и другие конструктивные особенности деталей (наличие пазов, отверстий и т.д.), что позволит наиболее точно подобрать для деталей в составе новой сборочной единицы последовательность технологических операций для их изготовления.
Для повышения оперативности синтеза технологических решений планируется использовать классификаторы деталей и сборочных единиц. В этом случае поиск ассоциативных правил и синтез технологических решений для новых деталей и сборочных единиц потребует просмотра не всей базы данных электронного архива технической документации, а лишь фрагмента, содержащего данные, относящиеся к одной категории. В процессе работы алгоритма при поиске частых наборов внутри категории значение Suppmin необходимо будет увеличить.
Литература
1. Курейчик В. М., Тарасов В. Б. Введение в интеллектуальные системы автоматизированного проектирования // Известия Таганрогского государственного радиотехнического университета. 1997. Т. 6. № 3. С. 41-49.
2. Кондаков А.И. САПР технологических процессов. М.: Издательский дом «Академия», 2007. 272 с.
3. Курейчик В.М., Малюков С.П., Обжелянский С. А. Динамический генетический алгоритм автоматизации подбора материалов с заданными свойствами при проектировании магнитных головок // Известия Таганрогского государственного радиотехнического университета. 2004. Т. 38. № 3. С. 34-38.
4. Евгенев Г.Б. Интеллектуальные системы проектирования. М.: Изд-во МГТУ им. Баумана, 2009. 334 с.
5. Палюх Б.В., Бурдо Г. Б. Оптимизация процедур поиска технологических решений в комплексной САПР ТП - АСУ ТП // Вестник ижевского государственного технического университета. 2010. № 3(47). С. 109-112.
6. Барсегян А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP/А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. СПб.: БХВ-Петербург, 2007. 384 с.
Сибирская государственная автомобильно-дорожная академия
AUTOMATING OF SYNTHESIS TECHNOLOGICAL DECISIONS AND DOCUMENTING THEM, BASED ON EXTRACTION ENGINEERING KNOWLEDGE
E.V. Tolkacheva, I.I. Semenova
In article the problem of synthesis technological decisions and documenting them, based on extraction engineering knowledge from database of electronic archive of technical documentation is considered. The created algorithm and the software which resolves this task on the basis of the methods of sequential analysis and search for association rules. It also provides an example of using this algorithm for automating forming technological documentation for new project in the engineering industry
Key words: electronic archive of technical documentation, Computer-Aided Design in industry, automating of documenting, data mining of design and technological documentation