электронное научно-техническое издание
НАУКА и ОБРАЗОВАНИЕ
Эл № ФС 77 - 30569. Государственная регистрация №0420900025. ISSN 1994-040S
Структурный синтез как задача дискретной оптимизации # 09, сентябрь 2010 автор: Божко А. Н.
МГТУ им. Н. Э. Баумана
В технике синтезом принято называть проектную процедуру, в результате которой происходит соединение различных элементов в единое целое: систему, машину, прибор, процесс и др. Это массовая техническая задача, которую, в разных формах и постановках, приходится решать проектировщикам любых специальностей и направлений.
В технических науках экстенсионал понятия синтез принято делить на три составляющие: синтез конструкции, синтез параметров и синтез структуры. В теории автоматизированного проектирования процедуры последнего типа являются одними из самых сложных и малоисследованных.
Если абстрагироваться от назначения и принципа действия объекта проектирования, то можно предложить общую модель задачи структурного синтеза, которая на высоком уровне абстрагирования достаточно корректно описывает суть проблемы. Известна техническая функция (функциональное назначение, закон функционирования), т.е. способность объекта отвечать своему служебному назначению. Выбран элементный базис и определена система внешних ограничений. Требуется разработать структуру проекта, которая реализует заданную функцию и удовлетворяет совокупности дополнительных условий. Это описание предполагает, что синтезируемый объект представляется в виде «черного ящика». Его входами являются любые существенные воздействия среды, выходами -связи объекта со средой. В результате решения задачи «черный ящик» превращается в «белый ящик», у которого объективированы все внутренние элементы и существенные связи между ними. Развитием данной эпистемологической модели служит синтез по ориентированным гиперграфам - один из наиболее мощных и перспективных способов структурного синтеза, подробно рассматриваемый далее.
Среди множества подходов к решению задачи структурного синтеза наибольшее распространение в системах автоматизированного проектирования получили методы, назы-
ваемые комбинаторно-логическими. Эти различные по математическому аппарату и сферам применения способы решения основаны на общей комбинаторной идеологеме. Для генерации структур используется перебор и поиск новых сочетаний в массиве аналогов и прототипов.
Перечислим основные допущения, при выполнении которых подобный подход оказывается результативным и эффективным:
• Проектируемый объект, будь то техническая система или процесс, имеет развитую структуру с большим количеством элементов и связей.
• Проектируемый объект принадлежит к классу объектов, имеющих одинаковое функциональное назначение.
• Множество аналогов и прототипов обладает достаточной мощностью, для того, чтобы поиск новых сочетаний в этом комбинаторном пространстве был результативен.
• Составные части объектов класса обладают «хорошими комбинаторными способностями». Это значит, что принципы действия объектов не различаются настолько, чтобы запретить объединение разных элементов в составе нового объекта.
Структуру класса объектов, имеющих одинаковое функциональное назначение, принято называть обобщенной [4]. Обобщенная структура представляет собой «комбинаторное пространство», в котором осуществляется поиск новых сочетаний элементов. Она составляется на основе знаний о данной предметной области, анализа массива существующих решений (аналогов и прототипов) и обобщения опыта проектирования.
В качестве средств описания обобщенных структур используются табличные, алгебраические, логические и сетевые модели. Наибольшее распространение среди этих моделей получили морфологические таблицы, многодольные графы ^-дольные), альтернативные деревья (А-деревья, И-ИЛИ-деревья) и ориентированные гиперграфы [2]. Среди всех перечисленных способов описания аппарат ориентированных гиперграфов (гиперорграфов) обладает наибольшим потенциалом и перспективами. Пионером в области применения этого формализма в структурном синтезе технических объектов был профессор Г.И. Анкудинов [1].
Ориентированные гиперграфы представляют собой обобщение ориентированных графов. Они образуются из ориентированных гиперребер, которые, в общем случае, могут иметь несколько входов и несколько выходов. На рис. 1 представлен самый распространенный способ изображения гиперребер, который напоминает обычное в технической литературе представление объектов в виде черных ящиков.
Рис. 1. Изображение ориентированного гиперребра
Приведем несколько определений из теории [1]. Ориентированным гиперграфом называется пара (£,2), где £ = {51,S2,...5«) - множество вершин, а 2 = z2,...,zm}- множество гипердуг. Каждая дуга zi е 2 имеет вид (ш, ^), где ш е £ - множество вершин, из которых исходит дуга Zi (входов, истоков), а (ii е £ - множество вершин, в которые дуга Zi заходит (выходов, стоков).
Рассмотрим содержание, которое получают вершины и дуги ориентированных гиперграфов при описании обобщенных структур в задачах синтеза.
1. Гипердуги описывают структурные элементы, из которых состоит моделируемая обобщенная структура. В разных проектных ситуациях таковыми могут быть: детали, сочетания режущих поверхностей, технологические операции, панели, функциональные блоки, программные операторы, узлы, сборочные единицы и др.
2. Входы гипердуги представляют совокупность технических условий и режимов, при выполнении которых данный структурный элемент демонстрирует штатное функционирование (условия «правильного срабатывания», предусловия).
3. Выходы гипердуги описывают поведение структурного элемента в штатных условиях (последствия «правильного срабатывания», постусловия).
4. Постусловия одних элементов могут служить предусловиями для других составных частей. Это связывает множество структурных элементов в единое целое и сообщает этому множеству самостоятельный онтологический статус.
5. Множество гипердуг пополняется специальным элементом, описывающим внешнюю среду. Входами этого элемента служат постусловия объекта, его выходами -предусловия объекта.
На рис. 2 показано гиперграфовое представление небольшого фрагмента обобщенной структуры, заимствованной из реальной технологической практики. На этом рисунке представлена совокупность технологических процессов обработки плоской поверхности: z 2 - черновое фрезерование, z 4 - чистовое фрезерование, z 2 - строгание, £5 - черновое шлифование, - внешняя среда, 51 - 5 з - свойства заготовки, 5 7- 5 9 - свойства обрабо-http://technomag.edu.ru/doc/158337.html Страница 3
танной поверхности, 5 4 - 5 6 - свойства поверхности (полуфабриката) в процессе обработки.
Рис. 2. Представление обобщенной структуры ориентированным гиперграфом
Практика механосборочного производства знает множество вариантов обработки, каждый из которых состоит из последовательности технологических операций. В данном примере технологические операции служат элементами, формирующими комбинаторную избыточную структуру класса процессов. На рис. 2 операции представляются в виде гиперребер. Их входы описывают условия применения операций, выходы представляют их последствия. При обработке плоской поверхности условиями применения операций служат фиксированные значения точности, чистоты и удаляемого припуска. Реализация операции меняет эти характеристики, что дает возможность для применения других операций. Обработка считается завершенной, если на очередном этапе будут получены требуемые значения этих числовых параметров (квалитет точности, шероховатость поверхности, а также нулевой припуск).
Описанная комбинаторно-логическая модель позволяет получать новые решения за счет корректного сочетания элементов, принадлежащих реализованным решениям. Пусть, например, структура, показанная на Рис. 2, сформирована объединением двух технологических процессов: 22 ^ 24 и 2з ^ 25. За счет комбинаторики операций можно получить еще два технологически корректных процесса: 22 ^ 25 и 2з ^ 25. В данном предельно редуцированном примере приращение множества возможных альтернатив невелико. Для гиперграфов с большим числом связей и элементов комбинаторика сочетаний позволяет получить такие мощные множества вариантов, которые достаточны для решения различных задач структурной оптимизации.
Компактная и упорядоченная структура, показанная на рис. 2, дает основания считать решением некоторый гиперпуть, который ведет из множества вершин {51,52,5з} во множество {57,58,59}. Для данного простого примера это интуитивное представление является
совершенно корректным, но для структур общего вида интуиция теряет свою познавательную силу, поэтому требуется дать точное описание решения [1].
Обозначим через in(z) - входы дуги z, а через out(z) - выходы z. Любое множество гипердуг будем называть структурой и обозначать через с. Обозначим in(c) - входы структуры с, а через out(c) - ее выходы.
Будем считать, что out(c) = U out(Zi), т.е. выходы структуры - это объединение выхо-
ziec
дов всех входящих в нее гипердуг. Положим in(c) = U in( Zi )\ out (с), т.е. входами струк-
ziec
туры считаются такие входы ее элементов, которые не являются выходами структуры. Структуру будем называть гиперциклом, если для нее выполняется соотношение in(c) = 0, т.е. она имеет пустое множество входов. Гиперцикл называется неизбыточным, если yzi е c in(c \{zi}) ^ 0 . Решением задачи структурного синтеза является любой неизбыточный гиперцикл, содержащий элемент «внешняя среда» ( zi).
Это формальное определение можно подкрепить убедительными рациональными соображениями. Во-первых, любой гиперцикл представляет собой некое «самодостаточное» образование в гиперорграфе. Множество входов гиперцикла пусто, поэтому штатное функционирование всех его элементов обеспечено за счет других компонентов этой подструктуры. Во-вторых, включение элемента «внешняя среда» гарантирует глобальность гиперцикла. Это значит, что он, согласно техническому заданию, соединяет входы и выходы внешней среды, а не замыкается на некоторый локальный элемент, расположенный внутри гиперорграфа. В-третьих, неизбыточность означает, что гиперцикл не содержит лишних элементов, которые не требуются для решения поставленной задачи.
Рассмотренный формализм отличается несколькими существенными достоинствами:
1. Язык ориентированных гиперграфов более выразителен и гибок, нежели средства, которые предоставляют разработчику морфологические матрицы, многодольные графы и альтернативные деревья. Любая обобщенная структура, заданная этими средствами, может быть описана на языке гиперорграфов без потери информации. Обратное сведение в общем случае невозможно.
2. Морфологические матрицы, многодольные графы и альтернативные деревья порождают самый простой тип структур - составы. Ориентированные гиперграфы позволяют синтезировать полноценные структуры, в которых присутствуют связи между элементами.
3. Связность, комбинаторная мощность, способность описывать многофункциональные элементы - все эти свойства ориентированных гиперграфов позволяют ставить и решать задачи структурной оптимизации.
В числе недостатков описанной парадигмы следует назвать, в первую очередь, громоздкость ориентированных гиперграфов и отсутствие прямых средств для описания элементов с ограниченной сочетаемостью [2]. Способом преодоления этих недостатков может служить постановка задачи структурного синтеза в форме дискретного математического программирования.
Пусть существует некоторый класс технических объектов, а его обобщенная структура задана в виде ориентированного гиперграфа. Обозначим через 2 = {2г}, г = 1,п множество гипердуг графа, а через £ = {5/}- множество его вершин.
Для формализации задачи введем переменные:
1. 2г, г = 1, п
Г1, если дуга входит в решение;
2г =\
у 0, в противном случае.
2. уг/,,г = 1,п,/ = 1,гг, где у/ - выход элемента 2г под номером /, а гг обозначает общее количество выходов элемента 2г. Будем считать, что:
Г1, если / - ая выходная связь элемента 2г активирована;
У г/ = \
у 0, в противном случае.
3. Хгк г = 1, п, к = 1, тг, где Хгк - к-ый вход элемента 2г, а тг - общее число входов этого элемента. Положим:
Г1, если к - ая входная связь элемента 2г активирована;
Хгк = \
у 0, в противном случае.
Переменные 2г у/ Хгк представляют собой основной «строительный материал» для записи системы ограничений и целевых функций в задаче структурного синтеза на элементах с ограниченной сочетаемостью. Далее будут вводиться вспомогательные аргументы, предназначенные для стандартизации записи математических выражений или формализации дополнительных физических условий.
Напомним, что любое решение задачи структурного синтеза состоит из активированных дуг ориентированного гиперграфа. Дуга является активированной тогда и только тогда, когда активированы все ее выходы. Это условие можно записать в виде следующей системы равенств:
ГгЯг = ^ уг]1 = 1, П . (1)
1 =1
Легко проверяется, что эта система уравнений совместна, когда яг = 0 и все переменные Уу = 0 , либо Яг = 1 и все Уу = 1.
Для активирования элемента необходимо возбудить (активировать) все его входные
связи. Это значит, что яг = 1 тогда и только тогда, когда Хгк = 1, к = 1, тг. Если Зхгк = 0, то яг = 0. Для записи этого условия в алгебраической форме введем п вспомогательных переменных иг е {0,1}, г = 1,п. Рассмотрим систему неравенств:
^ Хгк - тг > -тгиг (2.1)
к=1
я -1 > -иг (2.2)
тг
^ Хгк > тгяг (2.3)
к=1
^ Хгк - тг < 1 - иг (2.4)
к=1
г = 1, п .
Пусть яг = 1. В этом случае подсистема (2.2) выполняется тривиально при любых зна-
чениях иг. Из (2.3) следует, что Хгк = 1, к = 1, тг. Подсистема (2.4) принимает вид 0 < 1 - иг откуда вытекает, что иг = 0, г = 1, п и подсистема (2.1) выполняется автоматически.
Если яг = 0, то (2.3) выполняется автоматически для любых значений аргументов в левой части. Подсистема (2.2) приводится к виду иг > 1, который имеет единственное решение иг = 1, г = 1, п . Подставим эти значения в (2.1) и в (2.4). Первая подсистема принимает
форму ^ хгк > 0, которая выполняется тривиально. Подсистема (2.4) превратиться в
к=1
тг
^ хгк < тг, которая справедлива, если хотя бы один из аргументов левой части равен ну-
к=1
лю.
Теперь формализуем условие возбудимости входов элементов обобщенной структуры. Распространение активности в гиперграфе отчасти напоминает передачу электрического сигнала электротехнической схеме. Каждый активный вход должен быть обеспечен по крайней мере одним активным выходом, который снят с другого элемента гиперграфа. Для формализации этого условия все переменные вида Хгк и уг■ упорядочим лексикогра-
фически по значениям их индексов. После этой операции каждая переменная Хгк (уг/) получит новый одиночный индекс а(г, к) ( (3(г, /)), который показывает номер переменной в лексикографическом упорядочении.
п п
Обозначим через М = ^ гг и К = ^ тг. Пусть задана прямоугольная матрица
г=1 г=1
(0,1)-матрица Р = \\р/\\ размера К хМ, в которой Г1, если вход Хг обеспечен выходом у/;
Р = и
у 0, в противном случае.
Здесь г и/ - номера переменных Хг у/ в новом лексикографическом упорядочении.
Систему неравенств, формализующих условие обеспеченности возбужденных входов, можно записать в следующем виде:
М _
^ Р/ > Хг, г = 1,к . (3)
/=1
Если Хг = 1, то в этой сумме найдется по крайней мере одно слагаемое вида 1х1. Это означает, что существует активированный выход, обеспечивающий вход Хг. Если Хг = 0, то неравенство выполняется автоматически.
Любое правильное решение задачи структурного синтеза должно выполнять поставленное техническое задание и отвечать своему функциональному назначению. В парадигме гиперграфов для этого необходимо и достаточно включить в решение элемент, обозначающий внешнюю среду. Это условие имеет лаконичную алгебраическую запись:
21 = 1. (4)
Система уравнений и неравенств (1)-(4) выражает основной «физический смысл» задачи структурного синтеза по обобщенной структуре, представленной в виде ориентированного гиперграфа. Любое решение этой системы представляет собой допустимый вариант структуры технической системы или процесса. Система является открытой, поскольку допускает включение дополнительных ограничений, описывающих особенности принятия решений в конкретной ситуации. В частности, с помощью введенных переменных можно формализовать различные условия, ограничивающие сочетаемость структурных элементов в общем решении.
Рассмотрим бинарные запреты на сочетания. Будем считать, что запрещенные комбинации структурных элементов заданы в виде матрицы инцидентности А = ||аг/| размера
п х I, где п -количество элементов обобщенной структуры, а I - число запрещенных комбинаций. Элементы этой матрицы задаются следующим выражением:
Г1, если элемент Zi входит в запрещенную комбинацию gj;
ау = \
[0, в противном случае. Запреты на сочетания можно записать в виде следующей системы неравенств:
п п _
^ аг^г < ^ ау, ] = 1,1. (5)
г=1 г =1
Легко проверить, что если все переменные запрещенной комбинации равны единице, то система становится несовместной. Она может выполняться только при отсутствии запрещенных группировок в структурном решении. Важно, что предложенная техника учета запрета описывает не только бинарные несовместности, но и запреты более высоких порядков, когда недопустимые группировки состоят из нескольких элементов.
Рассмотрим формальное описание условий принуждения. Будем считать, что существуют условия принуждения с многоместной левой частью, когда для включения некоторого элемента требуется присутствие в решении фиксированной группировки других элементов. Пусть информация о таких отношениях известна и записана в виде квадратной (0,1)-матрицы В = ¡¿гу|| порядка п, в которой
Г1, если длявыбора Ziтребуется включение Zi;
Ъу = \
[ 0, в противном случае. Введем п вспомогательных переменных Wi е {0,1},г = 1,п и рассмотрим систему:
^ЪгЯ >2>(1 - Wг), (6)
у=1 г=1
гг = (1 - Wi), г = 1, п .
Если в этой системе Wi = 1, то элемент гг в решении не участвует, поэтому неравенство
п
^Ъу2] > 0 выполняется тривиально. Если wi = 0, т.е. элемент гг выбирается, то неравен-
У=1
пп
ство ^ Ъугу > ^ Ъу может быть выполнено, если для всех единичных элементов (Ъу = 1) ь
у=1 г=1
ой строки матрицы В соответствующие элементы гг обобщенной структуры равны единице.
Система ограничений (1)-(6) описывает основные условия существования корректных структурных решений. Она может быть дополнена ограничениями, которые формализуют особенности принятия решений в разных проектных ситуациях. Например, во многих случаях требуется обязательное включение в решение «хороших» связей, элементов и
подструктур. Не менее часто встречается запрет на выбор «плохих» элементов обобщенной структуры (связей, элементов, подструктур).
Все дополнительные условия такого вида имеют простую формализацию вида:
zi = 1, Xik = 1, yij = 1 (zi = 0, Xik = 0, yij = 0). (7)
В этих уравнениях переменная принимает единичное значение, если выбор структурного элемента или связи обязателен, нулевое значение - в противном случае.
Система ограничений (1)-(7) инвариантна, поскольку ее можно использовать в сочетании с различными целевыми функциями. Приведем несколько возможных целевых функций, применение которых является обоснованным во многих проектных ситуациях.
n
Z Zi ^ min (8)
i=1
n
Z CiZi ^ min (9)
i=1
n ri
ZZ yj ^ min (10)
i=1 j=1
n mi
ZZXj ^ min (11)
i=1 j=1
n ri n mi
ZZ у1^+ZZ xj ^ min (12)
i=1 j=1 i =1 j=1
Обсудим смысл приведенных целевых функций. Функция (8) минимизирует число элементов структуры. При прочих равных условиях такие решения обладают более высокими эксплуатационными качествами и проще в изготовлении.
Функция (9) минимизирует взвешенную сумму структурных элементов. Здесь в качестве весовых коэффициентов могут быть использованы самые различные по физическому смыслу числовые характеристики и показатели. Например, это могут быть стоимости, веса и другие числовые параметры, сопоставленные элементам обобщенной структуры.
Целевые функции (10)-(12) минимизируют общее число выходов, входов, а также общее число всех связей между выбранными элементами. Опыт эксплуатации технических систем показывает, что такие решения обладают более высокими показателями надежности и меньшей стоимостью обслуживания.
Все зависимости (равенства и неравенства) приведенной системы ограничений (1-7) и целевые функции (8-12) являются линейными, а областью определения переменных служит множество {0,1}. Следовательно, поставленная задача относится к задачам линейного булевого программирования. Методы решения моделей этого типа достаточно глубоко
исследованы в многочисленных трудах по вычислительной математике и исследованию операций. Хорошая библиография по предмету содержится, например, в [4].
Подсчитаем размерность поставленной задачи. Оценка приводится без учета зависимостей (6) и (7). Условия принуждения достаточно редко встречаются на практике, а включения и запреты отдельных элементов и связей зависят от проектной ситуации. Общее количество переменных равняется Зп+К+М, а число равенств и неравенств в системе ограничений составляет 7п+К+1+1, где п - общее число элементов обобщенной структуры, К - число входных связей, М - количество выходных связей, I - число запрещенных комбинаций.
Выводы
1. Среди многочисленных методов структурного синтеза, реализующих поиск в пространстве аналогов и прототипов, наибольшими выразительными возможностями обладает подход, основанный на представлении области перебора в виде ориентированного гиперграфа.
2. Этот способ решения задачи позволяет получать «готовые к использованию» структуры со связями и дает основания для постановок различных задач структурной оптимизации.
3. Основными недостатками гиперорграфового подхода следует считать громоздкость этого языка и его неспособность описать дополнительные условия, наложенные на выбор элементов.
4. В работе предлагается способ сведения проблемы структурного синтеза к задаче дискретного линейного программирования. Формулируется система ограничений, описывающая условия выбора элементов в гиперорграфовой модели. Приводятся уравнения и неравенства, формализующие запреты на сочетания произвольной кратности и условия принуждения. Формулируются целевые функции, оптимизирующие различные структурные характеристики решений.
Список литературы
1. Анкудинов Г.И. Синтез структуры сложных объектов. Логико-комбинаторный подход. - Ленинград: Издательство Ленинградского университета, 1986.
2. Божко А.Н., Толпаров А.Ч. Структурный синтез на элементах с ограниченной сочетаемостью. - Электронное научно-техническое издание «Наука и Образование», 2004, №5.
3. Ковалев М.М. Дискретная оптимизация (целочисленное программирование). -М.: УРСС, 2003.
4. Норенков И.П. Основы автоматизированного проектирования. М.: Издательство МГТУ им. Н.Э. Баумана, 2009.