Раздел IV Автоматизация проектирования
УДК 681.323
В.М.Глушань,В*П.КЬрелин
АВТОМАТИЗАЦИЯ ОПТИМАЛЬНОГО ОТОБРАЖЕНИЯ ИНФОРМАЦИОННЫХ ГРАФОВ АЛГОРИТМОВ НА АРХИТЕКТУРУ МНОГОПРОЦЕССОРНЫХ ВЫЧИСЛИТЕЛЬНЫХ СТРУКТУР
Эффективное решение задач на МВС сильно зависит от загрузки ее процессоров, а в МВС с перестраиваемой архитектурой и от коммуникационных возможностей сети (коммутатора), связывающей процессоры между собой. В конечном счете при решении проблемы эффективного использования МВС необходимо учитывать как архитектурные их особенности,так метрические и топологические особенности ин^ормацибвных графов (ИГ) алгоритмов, которыми может быть описан любой вычислительный ал-горитм [1].
Накопленный опыт анализа вычислительных алгоритмов свидетельствует о том, что их ИГ не являются произвольными, а обладают рядом особенностей, позволяющих уменьшить трудоемкость алгоритмов при работе с такими графами. Важнейшая особенность ИГ алгоритмов состоит в том, что они имеют ^0тко выраженную последовательно-временную структуру. Такие графы в [2] называются последовательными. Это название оправдывается тем, что они могут быть развернуты во времени, предоставляя тем самым определенные возможности Для уменьшения трудоемкости алгоритмов. Поэтому остановимся на этой особенности алгоритмов более подробно.
Пусть задан ИГ алгоритма С=(У,Е). Предположим, что множество его вершин V разбито на непересекающиеся подмножества У|,...,Ук такие, что если V,, ие у, и существует дуга (у,и), т '" " том случае разбиение
называется параллельной формой алгоритма, а подмножества У|,...,Ук -ее ярусами. Число к называется высотой параллельной формы, мощность У| -шириной 1 го яруса, а максимальное из этих чисел шириной параллельной формы. Из последнего определения вытекает, что параллельная форма шириной в 1 будет строго последовательной.
Отыскание параллельной формы алгоритма по произвольно )аданной(разработчик, как правило, ИГ алгоритма сначала составляет в произвольной форме) представляет необходимый и важный шаг в общей проблеме отображения ИГ алгоритмов на МВС. Один из возможных способов преобразования горитма в параллельную форму, т>е. с выделением ярусов,описан
и Г*)1 4
Графовые модели представления вычислительных алгоритмов
/=1
Постановка задачи оптимального разбиения параллельной формы ИГ алгоритма
и выбор критериев качества
Если бы каждый ярус ИГ имел постоянную величину У|=согШ и число процессоров МВС п = р, то на каждом шаге реализации вычислительного алгоритма проблема загрузки процессоров не стояла бы вовсе. Однако в действительности либо п < р, либо У|=соп$1 и тогда даже при п р часть процессоров будет простаивать.
Возможна ситуация, когда N > п > р, где N число иершин всего ИГ алгоритма. Но и это проблему не снимает, а только переносит ее в другую плоскость. В данной статье мы ее рассматривать не будем, а рассмотрим случай, когда п < р. Тогда можно представить два варианта разбиения ИГ на части. Эти части в рассматриваемом приложении принято называть кадрами.
В первом варианте множество всех вершин У* ¡-го яруса разбиваются на подмножества (кадры) несвязанных между собой вершин. При этом коммутационная сеть связей между процессорами в МВС оказывается незадействованной, а дуги между вершинами различных ярусов будут определять адреса ячеек памяти дня занесения в них, результатов выполнения каждой операции. Таким образом, в первом варианте никак не учитываются архитектурные особенности МВС, в частности, возможности организации непосредственных связей между процессорами.
Во втором варианте в кадры включаются вершины разных ярусов.При этом связи между вершинами разных ярусов в общем случае могут быть произвольными. Поэтому возникает необходимость при переходе от кадра к кадру перестраивать структуру связей и тем самым эффективнее использовать возможности МВС с перестраиваемой архитектурой.
Как и в первом, во втором варианте, сохраняется проблема адресации результатов выполнения операций каждого кадра.
Ясно, что чем на меньшее число типов кадров будет разбит ИГ,тем меньшее число перестроек связей внутри кадров потребуется, при условии, конечно, если одинаковые кадры будут выполняться последовательно. Одинаковость кадров применительно к графовой терминологии означает их изоморфизм.
Таким образом, задача оптимального разбиения ИГ алгоритма накадры может быть сформулирована в следующем виде.
Выделить в графе в = (У.Е) множество групп Г= {Г< ,Гг Гг} изоморфных
подграфов Оц удовлетворяющих условиям:
Здесь П - ¡-е множество изоморфных подграфов, Г - число групп изоморфных
вершин^го подграфа из ¡-ой группы, п - заданное число вершин в подграфе.Такая постановка задачи является типичной для задач автоматизации конструирования
В качестве критериев оптимальности при разбиении ИГ целесообразно использовать следующие:
- число групп изоморфных подграфов. Необходимо стремиться к минимуму этого критерия, т.к. это приводит к сокращению числа типов изоморфных подграфов;
/ 4
1)
'.У
4 '*
у*1 т»1
3) Уи п Уш = 0; і=т, ¡=1,2...Г, т=1,2......1.
подграфов; ¡1 число изоморфных подграфов в ¡-ой группе; Уу множество
РЭА и ЭВА [3].
- число изоморфных под'рафов в i-й ipyrme. Максимизация этого критерия приводит к увеличению числа однотипных подграфов;
- число внешних дуг между подграфами.
Оптимизация по первым двум критериям позволяет достигать минимума числа перестроек связей в кадре. Оптимизация по третьему критерию позволяет уменьшить объем памяти, требуемый для решения задачи на МВС. Ограничением является требование включения в каждый подграф числа вершин, не превосходящее число процессоров в МВС
Сформулируем основные принципы оптимального отображения ИГ алгоритмов на МВС.
1.Представление ИГ в форме последовательного ациклического ориентированного графа.
2. Объединение множеств равноинвариантных вершин в каждом ярусе.
З.Число вершин в кадре снимала должно быть равно максимальному числу
процессоров. Если это не удается, то необходимо искать изоморфные кадры на меньшем числе вершин.
4. Поиск не полностью, и частично-изоморфных подграфов,т.е. с разным числом вершин и (или) дуг.
5. Принцип завершенности кацра. Означает что к моменту выполнения кадра все дуги, инцидентные вершинам данного кадра, не должны исходить из кадра, выполняемого позже.
6. Принцип наращиваемое! и и юморучых кадров. Заключается в последовательном включении вершин в кадры на основе анализа сияэности пар множеств равноинвариантных вершин.
На основе сформулиованных принципов были разабоганм алгоритм исоответствующая программа, с помощью которой были проведены экспериментальные исследования.
Наиболее сложной проблемой в рассматриваемой задаче является процедура поиска изоморфных подграфов. Для ее решения предложено большое число методов и алгоритмов, одно перечисление которых заняло бы большую часть данной статьи. Поэтому мы лишь отмегим, что многие из них обобщены в [4], а некоторые новые изложены в [5,6]. Для случаев относительно небольшого числа вершин графов, характерных именно для ИГ алгоритмов, можно использовать полные или частично полные переборы, ориентированные на аппаратную реализацию [7]. Именно такойподход и был принят при разработке программы.
Результаты экспериментальных исследований
С помощью разработанной программы исследовалась зависимость t(Ri) Для произвольного и для регулярного ИГ (т.е.имеющего изоморфные подграфы). В этой зависимости t - время решения задачи в секундах, Ri = N,p/NK:W., где N^. количество вершин в ИГ, 1Чкад. количество вершин в кадре, причем N»«,. принимало значения 3,4,5. В результате было получено семейство кривых t(R|), каждая из которых соответствует фиксированному значению NKW.
Исследовалась также зависимость t(R2), где R2 = P/Nrp., Р - число дуг ИГ. При этом было также получено семейство кривых временной зависимости при различных значениях параметра К = Nn.n./Nm».> где N„.,1.- количество вершин в кадре, изоморфизм для которых устанавливался полным перебором. Причем К принимало значения 0.5, 0.75 и 1.0.
Анализируя вид полученных зависимостей, был сделан основной вывод (несколько неожиданный),что при разбиении разработанным алгоритмом Регулярных ИГ временная трудоемкость имеет линейную зависимость,угол наклона которой также линейно зависит от числа вершин в кадре.При разбиении нерегулярных ИГ временная Трудоемкость, как и следовало ожидать, имеет
экспоненциальную зависимость, коэффициент перед которой также линейно зависит от числа вершин в кадре.
Анализ зависимостей t(Rj) показывает, что при К = 1, т.е. когда все вершины в кадре на изоморфизм проверяются полным перебором, она имеет явно экспоненциальную зависимость, но при уменьшении К от I до 0.5 уже при R2 = 1.5 наблюдается насыщение зависимости t(R2) и она при дальнейшем увеличении Ri практически не растет.
ЛИТЕРАТУРА
1. Воеводин В.В. , Математические модели и методы в параллельных процессах.-М.: Наука, 1986.-296 с.
2. Кофман А. Введение в прикладную комбинаторику. Изд-во Наука.-М.: 1975.-479 с.
3. Бершадский А.М. Применение графов и гиперграфов для автоматизации конструкторского проектирования РЭА и ЭВА. Изд-во Сарат.ун-та, 1983. - 128 с.
4. Алгоритмы и программы решения задач на графах и сетях/Нечепурснко М.И. и др.- Новосибирск: Наука.Сиб.отд-ние,1990.- 515 с.
5. Мелихов А.Н., Карелин В.П. Методы распознавания изоморфизма и изоморфного влэженйя четких и нечетких графов: Учебное пособие. Таганрог: ТРТУ, 1995. 90 <
6. Карели1 3.11. Г'-оркя и средства поддержки комбинаторных моделей принятия решек.1Й ь организационно-технологических системах. Дис.... докт.техн.наук. Таганрог ¡995.
7. Глушань В.М. и др. К вопросу об аппаратном определении изоморфизме
графов/Автоматиэация проектирования электронной аппаратуры:
Межвед.тематич.науч.сб.: Таганрог: ТРТИ, 1989. - Вып.6.- 122 с.
УДК 658.512
A.Y.Tetelbaum, C.-L.Wey, T.A.Bickart A performance-driven placement of standard cells
Introduction
The objective of al standard-cell placement algorithmO is to arrange a given set of standard cells of common height and variable width on the chip surface [1]. The cells are connected by agiven set of interconnections called nets. The placement has to atisfy one or more objective functions which usually model the routability of a design. As IC technology scales down to half micron, interconnect delays play an increasingly important role in the performance of chips. Gate delays are becoming the same order as path delays. Most designers now realise that timing delays on interconnects create problems for high performance yLSI chips and that many existing CAD tools cannot handle these timing problems. Some existing performance-driven standard-cell placement procedures attempt to solve the timing constraints by minimizing the total net length. However, since the performance of a design tends to be path-oriented in nature, while physical design is net-oriented [2], the minimization of total net length may not lead to the improvement of performance. Therefore, the routing space on the chip may end up with being decreased at the cost of greater than necessary of acceptable net delays on some critical paths. In addition, delays caused by the same net length may vary significantly for the paths with different driver strength and load characteristics.