Научная статья на тему 'Системное проектирование функционально- ориентированных процессоров для бортовых корреляционно-экстремальных навигационных систем'

Системное проектирование функционально- ориентированных процессоров для бортовых корреляционно-экстремальных навигационных систем Текст научной статьи по специальности «Математика»

CC BY
441
101
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КОРРЕЛЯЦИОННО-ЭКСТРЕМАЛЬНЫЕ НАВИГАЦИОННЫЕ СИСТЕМЫ / ФУНКЦИОНАЛЬНО-ОРИЕНТИРОВАННЫЕ ПРОЦЕССОРЫ / СЛОЖНОСТЬ ВЫЧИСЛЕНИЙ / ПАРАЛЛЕЛЬНАЯ ОБРАБОТКА ДАННЫХ / CORRELATION EXTREME NAVIGATION SYSTEMS / FUNCTION-ORIENTED PROCESSOR / COMPLEXITY OF COMPUTATIONS / PARALLEL DATA PROCESSING

Аннотация научной статьи по математике, автор научной работы — Лукин Николай Алексеевич

Приводятся результаты исследования по оптимальной реализации алгоритма привязки, являющегося одним из основных в комплексе алгоритмов корреляционно-экстремальных навигационных систем, использующих датчики геофизических полей. Основным результатом является методика DH-синтеза алгоритмов, позволяющего синтезировать рациональные архитектуры функционально-ориентированных процессоров (ФОП). Описывается возможная реализация алгоритма привязки на базе двумерного массива процессорных элементов в варианте СБИС-технологии. Излагаются результаты DH-синтеза в применении к ФОП на базе стандартных микропроцессоров. Приводятся результаты разработки двух поколений реальных бортовых ФОП КЭНС, которые были созданы с использованием предлагаемой методики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Лукин Николай Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SYSTEM DESIGNING OF FUNCTION-ORIENTED PROCESSORS FOR ONBOARD CORRELATION EXTREME NAVIGATION SYSTEMS

The paper presents the results of investigating optimal realization of the conjunction algorithm, one of the main ones in the complex of algorithms of correlation extreme navigation systems using sensors of geophysical fields. The main result of the investigation is the procedure of algorithm DH-synthesis which makes it possible to synthesize rational architectures of function-oriented processors (FOP). Possible implementation of the conjunction algorithm on the basis of a two-dimensional array of processor elements in VLSI technology is described. The results of DH-synthesis as applied to FOP based on standard microprocessors are presented. The results of developing two generations of actual onboard FOPs for CENSs produced with the use of the procedure proposed are given.

Текст научной работы на тему «Системное проектирование функционально- ориентированных процессоров для бортовых корреляционно-экстремальных навигационных систем»

УДК 629.7.05

СИСТЕМНОЕ ПРОЕКТИРОВАНИЕ ФУНКЦИОНАЛЬНООРИЕНТИРОВАННЫХ ПРОЦЕССОРОВ ДЛЯ БОРТОВЫХ

КОРРЕЛЯЦИОННО-ЭКСТРЕМАЛЬНЫХ НАВИГАЦИОННЫХ СИСТЕМ

© 2009 Н. А. Лукин ИМаш УрО РАН, ФГУП “НПО автоматики”, г. Екатеринбург

Приводятся результаты исследования по оптимальной реализации алгоритма привязки, являющегося одним из основных в комплексе алгоритмов корреляционно-экстремальных навигационных систем, использующих датчики геофизических полей. Основным результатом является методика БИ-синтеза алгоритмов, позволяющего синтезировать рациональные архитектуры функционально-ориентированных процессоров (ФОП). Описывается возможная реализация алгоритма привязки на базе двумерного массива процессорных элементов в варианте СБИС-технологии. Излагаются результаты БИ-синтеза в применении к ФОП на базе стандартных микропроцессоров. Приводятся результаты разработки двух поколений реальных бортовых ФОП КЭНС, которые были созданы с использованием предлагаемой методики.

Корреляционно-экстремальные навигационные системы, функционально-ориентированные процессоры, сложность вычислений, параллельная обработка данных.

Введение

Современные системы управления летательными аппаратами (СУ ЛА) должны обеспечивать высокую точность решения основных задач при высокой динамике движения. Средствами только инерциальной навигации этого обеспечить не удаётся, поэтому в состав интегрированных навигационных систем вводятся подсистемы коррекции различного типа, назначение которых состоит в выработке поправок к навигационным параметрам. Среди подобных систем выделяются корреляционно-экстремальные навигационные системы (КЭНС), принцип действия которых основан на использовании датчиков внешних геофизических полей, реализации корреляционных алгоритмов и коррекции траектории движения ЛА. Алгоритмы КЭНС отличаются повышенной вычислительной сложностью и должны реализоваться в течение минимальных временных интервалов. Как правило, для реализации алгоритмов КЭНС используются специализированные бортовые вычислители, производительность которых должна быть максимальной при жёстких ограничениях на массу, габариты и потребляемую мощность. Это требует применения системного подхода к реализации таких вычислителей. Одним из

основных системных принципов их построения является ориентация архитектуры на эффективное выполнение основных функциональных преобразований, содержащихся в алгоритмах КЭНС. Как известно, реализация такого принципа приводит к созданию функционально-ориентированных процессоров.

В настоящей работе кратко излагаются элементы общей теории архитектурного проектирования ФОП и раскрываются основные этапы системного проектирования ФОП для КЭНС ЛА. Кроме того, описываются реальные ФОП КЭНС, при разработке которых были применены предлагаемые методы.

Краткая характеристика основной задачи КЭНС как составной части СУ ЛА В составе высокоманёвренных ЛА КЭНС предназначены для обеспечения высокой точности решения основной задачи бортовой СУ за счет оперативной коррекции траектории движения аппаратов. Сама коррекция в большинстве случаев основана на решении задачи привязки местоположения аппарата к заданному участку местности и последующего уточнения траектории его движения. В свою очередь привязка формулируется как двухэтапная задача.

На первом этапе определяют корреляционную меру между двумя группами параметров геофизических полей: полученными с помощью датчиков и хранящимися в оперативной памяти бортовой цифровой вычислительной системы (БЦВС). В качестве геофизических полей используются различные характеристики (параметры) пространства, окружающего аппарат: тепловые поля, поля яркостей отраженного сигнала и т.д. [1]. Одними из наиболее распространённых полей являются поля рельефа подстилающей поверхности. Этому есть множество причин, основными из которых являются высокая информативность рельефа и его сезонная устойчивость [2]. Кроме того, информация

о наблюдаемом рельефе конкретной местности, как правило, однозначно связана с её географическими координатами, что позволяет повысить эффективность определения поправки к траектории движения аппарата. В качестве рельефометрических датчиков в КЭНС используются одно- и многоканальные радиовысотомеры, реализующие измерения высот рельефа в некоторой области пространства под ЛА. Поэтому результатом каждого сеанса измерения является в общем случае одномерный массив измеренных значений высот рельефа. Определение координат ЛА по дальности (X) и по нормали к вектору дальности (2) производится в инерци-альной навигационной системе (ИНС) ЛА с определёнными погрешностями. Поэтому измеренному в к-ом сеансе значению высоты рельефа ук соответствует окрестность некоторой точки (Х0к, 20к). Без существенного ухудшения точности решения задачи привязки предполагают, что данная окрестность представляет собой в общем случае прямоугольник с координатами вершин, равными соответственно (Х0к±8Х, 20к±82), где параметры 8Х и 82 задают размер прямоугольника и зависят от погрешностей ИНС и параметров движения ЛА. Координаты “внутренних” точек прямоугольника в географической системе координат однозначно связаны с координатами измеренных высот подстилающей поверхности. В практике проектирования КЭНС описываемый прямоугольник получил название матрицы гипотез, так как

среди множества элементов матрицы есть лишь один, наиболее достоверный, и нужно каким-либо способом, основанным на вычислении корреляции между ук и всеми элементами матрицы, найти координаты этого элемента. Для многоканальных радиовысотомеров каждому значению укт соответствует отдельная матрица (т - число каналов высотомера). Необходимо также учесть, что центр пятна засветки каждого луча высотомера практически всегда находится внутри некоторого квадрата, образованного смежными точками прямоугольника. Это требует уточнения положения ук с помощью билинейной интерполяции относительно точек указанного квадрата.

Размерность матрицы зависит от многих факторов (ошибок ИНС, требуемой точности определения местоположения ЛА, динамики движения ЛА и т.д.). Для высокоманевренных ЛА размерность матрицы может достигать порядка десятков или сотен, что требует на каждом сеансе измерений порядка сотен или тысяч сравнений для каждого канала высотомера.

Описанная процедура носит циклический характер, она повторяется в каждом цикле приема сигналов с высотомера.

На втором этапе решения задачи привязки реализуется нахождение экстремума корреляционной меры как функционала на множестве гипотез для каждой матрицы. Комбинаторная сложность алгоритма (в наихудшем случае в процессе сравнения необходимо перебрать все элементы матрицы гипотез) в задаче привязки увеличивается из-за того, что в случае многих одинаковых по величине экстремумов требуется определять расстояние каждого экстремума от центра гипотезной матрицы с учетом направления вектора продольной скорости движения ЛА. Определение экстремума корреляционной меры производится после заключительного сеанса визирования, данный алгоритм является разовым.

Координаты X и 2* найденного экстремума корреляционной меры принимаются за наиболее достоверные, после чего выдаётся соответствующее управление на исполнительные органы ЛА, совершается его ма-

невр, и реализуется следующий сеанс измерения. Обобщённо принцип работы СУ ЛА со встроенной КЭНС изображен на рис. 1.

Совместный анализ основных задач, решаемых на борту ЛА (инерциальная навигация, стабилизация, управление, контроль состояния подсистем), и задачи привязки местоположения ЛА к заданному участку местности показывает, что она имеет следующие особенности:

- задача привязки должна решаться одновременно с остальными задачами СУ ЛА;

- решение задачи привязки в течение интервала коррекции траектории имеет циклический характер;

- жёсткое ограничение на время решения задачи (как правило, порядка единиц миллисекунд);

- малое количество входных и выходных параметров (для современных рельефометрических КЭНС - порядка десятка), что обуславливает сравнительно малую связность задачи привязки с остальными задачами СУ ЛА;

- преимущественная работа с большими массивами переменных (число элементов эталонной карты местности, обрабатываемых в одном цикле решения задачи, может быть порядка тысяч), т.е. значительное количество промежуточных (внутренних) параметров.

Таким образом, с точки зрения построения всей системы алгоритмического обеспечения СУ задача привязки может быть характеризована следующими отличительны-

ми признаками - существенная автономность, ориентация математического аппарата на векторно-матричную обработку, минимальное время решения. Системный анализ задачи привязки с точки зрения её как объекта алгоритмической реализации является первым этапом системного проектирования ФОП КЭНС.

Отмеченные отличительные признаки задачи привязки непосредственно связаны с информативными характеристиками возможных алгоритмов её решения. Анализ характеристик алгоритмов важен для направленного выбора архитектур вычислительных систем реального времени.

Проектирование архитектур ФОП на основе методов ^Н-синтеза алгоритмов

Анализ вычислительных алгоритмов для систем реального времени показывает, что графы большинства из них обладают сходными признаками:

1) малое число входных/выходных и значительное число промежуточных вершин;

2) сильная связность по одному из направляющих векторов графа [3] и слабая по другим;

3) циклы в алгоритмах обусловлены в большинстве случаев не столько анализом результатов выполнения арифметико-логических операций, сколько итеративным выполнением последовательности преобразований, что связано либо с общим принципом функционирования систем реального времени (циклической работой алгоритмов),

Рис. 1. Принцип коррекции траектории ЛА при работе КЭНС

либо с анализом внешнего признака (например, с содержимым счетчика числа событий).

Это даёт основание отнести данные алгоритмы к классу потоковых и применить к ним методики направленного преобразования графов, основанные на выявлении внутреннего параллелизма (параллелизма смежных операций, параллелизма ветвей и т.д.). Одной из таких методик является ВИ-синтез потоковых алгоритмов [4], который целесообразно считать вторым этапом системного проектирования ФОП КЭНС.

Основными шагами ВИ-синтеза произвольных потоковых алгоритмов являются:

1. Преобразование исходного графа алгоритма к виду максимальной канонической ярусно-параллельной формы (ЯПФ). На этом шаге целесообразно применять процедуры эквивалентного преобразования исходных графов, например, описанных в [4]. Они позволяют максимально вскрыть внутренний параллелизм алгоритма и минимизировать число перекрёстных связей между вершинами графа в направлении, ортогональном главному направляющему вектору графа.

2. Построение верхних оценок ширины (В) и высоты (И) максимальной ЯПФ графа как функций от параметров { ак} = исходного алгоритма. В качестве параметров могут выступать число функциональных преобразований в максимальном ярусе, число ярусов, разрядность переменных, ёмкость памяти для хранения констант и коэффициентов и т.п. Функции В(а) и И(а) всегда имеют экстремумы (за исключением случаев, когда В и И - константы), и на этом этапе синтеза производится поиск локальной окрестности минимумов В(а) и И(а). Минимум В(а) однозначно связан с конкретным графом алгоритма и соответствует минимуму аппаратных затрат на вычисления, а минимум И(а) - минимуму временных затрат. При этом могут существовать варианты:

а. Функции В(а) и И(а) не монотонны. Это означает, что существуют алгоритмы, оптимальные по критерию сложности вычислений, такие что За*; В(а*)= Мш{В(а)};" а* * а* ^ В(а*) > В(а*) либо За**; И(а**) = МП{И(а)};" а** * а**^И(а**)> > И(а**). Данный вариант означает существо-

вание точки оптимума внутри интервала изменения ширины и высоты графа алгоритма. Всякая вариация параметров {aj отно-

* / **\

сительно а (а ) приводит только к увеличению затрат. Поэтому для данного варианта характерно наличие минимума одних затрат при немаксимальном значении других. Например, возможно достичь минимума времени вычисления при немаксимальном числе процессоров в системе.

b. Функции D(a) и H(a) монотонны. Это означает, что За*; D(a*) = Min {D(a)}; " а*< <а* ^ D(a*) > D(a*) Ф "а* > а* ^ D(a*) > >D(a*) либо За**; H(a**) = Min{H(a)}; " а**< <а**=>Н(а**)>Н(а**) Ф "а** > а** ^ Н(а**) > >Н(а**). Точка оптимума находится на границе интервала изменения ширины и высоты графа. Поэтому минимум одних затрат соответствует максимуму других. Например, минимальное время вычисления возможно только при максимуме числа процессоров.

Данный шаг синтеза алгоритма заканчивается построением графа, соответствующего минимуму D(a) либо минимуму H(a) в зависимости от исходной постановки задачи проектирования ФОП. Назовём такой граф D . -графом либо H . -графом.

г т min г т min г т

3. Взвешивание вершин D -графа

г min г т

(либо H^-графа) верхними оценками аппаратной и временной сложности функциональных преобразований, приписанных данным вершинам. При этом сами оценки сложности строятся в базисе схем из функциональных элементов [5]. Эти оценки служат исходным материалом для построения также верхних оценок, но уже для аппаратной Lh или временной Lt сложности вычислений алгоритма в целом. Оценки Lh (L), однознач-но связанные с D(a) и H(a), представляют собой функции от параметров алгоритмов, но они соответствуют определённому типу архитектуры ФОП - базовой архитектуре [3]. Как известно, именно базовая архитектура, обеспечивая минимум времени реализации любого алгоритма, служит отправным пунктом для процессов последующей их оптимизации и синтеза.

4. Направленное изменение ширины (D) и высоты (H) ЯПФ D -графов либо H -

\ / \ / min г т min

графов с целью достижения одного из двух

условий: Min Lt при Lh = const или Min Lh при Lt = const. Направленность изменения данных графов обеспечивается последовательными преобразованиями типа (Lh - ALh) или (Lt - ALt) с одновременным получением оценок D(a) либо H(a). Процесс изменения графа алгоритма завершается получением окончательных оценок Lh Lh, D(a), H(a), которые в совокупности соответствуют определенной архитектуре.

Таким образом, последовательность шагов DH-синтеза приводит к построению архитектуры ФОП, оптимизированной по критерию сложности вычислений. Сама архитектура ориентирована на рациональную (в ряде случаев оптимальную) реализацию выбранных алгоритмов. Если в качестве исходного алгоритма взят некоторый обобщённый алгоритм для класса задач, то архитек-

тура ориентирована уже на эффективное решения задач из этого класса.

Применим методику ОН-синтеза алгоритмов к задаче привязки.

Системное проектирование архитектуры ФОП КЭНС

На рис. 2 приведён обобщенный граф алгоритма задачи привязки для рельефометрической КЭНС.

Обозначения на рис. 2: і , і - разГ тах ^ тах Г

мерности матрицы гипотез; ^тах - число каналов радиовысотомера; к - количество сеансов связи с высотомером (количество циклов решения задачи привязки); Ах, Аі - величины дискретов перебора гипотез в матрице.

Анализ возможности применения ОН-синтеза к задаче привязки показал, что её алгоритм является потоковым, а граф при-

Ввод сигналов из радиовысотомера (фактическое значение высоты __________рельефа у„,)_______

Определение координат начального элемента матрицы гипотез (Н>кц)

Определение целой и дробной частей координат для всех гипотез матрицы:

= = ====’= = = = )AzJ

a) = rem(=j j, b) = rem(= )

Цикл по i,j

Билинейная интерполяция для всех гипотез матрицы:

hl2,j = [h(p + lq)~h( p.q)] = + h(p>q)

h34tJ = [= = # 1= # 1)—=== = 1=a= + h( p,q +1) h== (h34tJ= =2= JßjJ = =12=

Цикл по ij

Вычисление корреляционной меры:

V i,i = 0,...,imax— 1; Vj,j = 0,...,jmax—1; —— = (== - -— =

Цикл по ij

Взвешенное суммирование значений меры поц,:

.. mma -1 ..

J = =2 = =J

Вычисление математического ожидания меры: _ = ?_ 1

Vi,i = 0,...,jmax —1; ——— — 0,...Jmax-1;Jk - ———-1 J—

Цикл по m

Цикл по i,j

Нахождение экстремума меры по i,j:

V i, i = 0,..., ima— 1; V'j>j — 0,..., —= — 1; —7* = ==( ==)

Цикл по i,j

Цикл по к

Выдача в НЗ наиболее достоверных координат ЛА: i=i*, j=j*

Рис. 2. Обобщённый алгоритм решения задачи привязки для рельефометрической КЭНС

надлежит к классу гамаков. Это означает, что алгоритм обладает, прежде всего, значительным внутренним параллелизмом. Например, для самого насыщенного этапа вычислений

- вычисления корреляционной меры -

можно выполнять одновременно независимых вычислений.

Построение максимальной ЯПФ графа начинается с анализа основных математических соотношений и их упрощения и преобразования в параллельную форму. Это относится, прежде всего, к билинейной интерполяции и вычислению математического ожидания корреляционной меры.

Для параллельной реализации интерполяции применим следующее преобразование. Исходные зависимости имеют вид:

кпг] = [к(р # 1,ц) - к(р, ц)]а% # Ъ(р, ц), И341] = [И(р # 1,ц # 1) - И(р,ц # 1)]#

# И( р,ц # 1),

^ = (^34ц - к121})*" # Ь12гр

(1),

где р, ц представляют целые частные от де-х _У_

ления %х и %у, а а и Ь - соответствующие

остатки. Граф для (1) приведён на рис. 3 а. Высота графа равна 6, ширина - 2.

Следуя методике ОН-синтеза, преобразуем (1) к максимально параллельной форме:

(2),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ъг] = И(р #1, ц)+1 # И(р, д)+2 #

+к(р # 1^ # 1)+3 # И(р,ц # 1)+4,

где +1 = О+2 = (1- Щ -

+3 = 81(1-95)-+! = (1 - аЦ)(1-;7).

Как видно, для обеспечения максимально возможного параллелизма необходимо предварительно один раз вычислить четыре

алгебраические формы от остатков

и применять их для интерполяции всех гипотез матрицы. Граф, соответствующий (2), приведен на рис. 3б, из которого видно, что высота графа уменьшилась в два раза и равна 6, а ширина увеличилась и стала равна 4.

Для вычисления математического ожидания корреляционной меры применим следующие преобразования:

1 к-1 1

1 $ т1 #1 т1

к $ Тр # кк'

К р=1 К

к-1

(3)

р=1

к(р + 1-q) к(р + Ід + 1)

а) б)

Рис. 3. Графы алгоритма билинейной интерполяции: а - исходный алгоритм, б - максимально параллельный алгоритм

223

В этом случае нахождение экстремума меры на заключительном шаге алгоритма будет производиться по формуле

!i,i = 0>->imax -'!j,j =

= 0 j,„, - l;kJ* = МтЩ). (4)

Таким образом, уменьшена сложность вычислений для каждого элемента матрицы гипотез.

Следуя методике DH-синтеза, преобразуем исходный граф в максимальную каноническую ЯПФ. Этот граф изображен на рис.

4.

Анализ информационной структуры ЯПФ алгоритма задачи привязки показывает следующее:

- Вид графа - струнный гамак [4].

- Количество уровней параллелизма -два. На первом уровне имеется m независимых потоков обрабатываемых данных, внутри каждого из которых также имеется ij независимых потоков данных. На втором уровне обрабатывается ijj потоков данных.

- Количество ярусов - 7.

Определим ширину и высоту максимальной ЯПФ:

Dmax imax Jmax Dmax ’ Hmin 7 .

Высота максимальной ЯПФ есть константа, что отражает факт максимального распараллеливания вычислений.

После построения максимальной ЯПФ необходимо произвести взвешивание вершин графа верхними оценками сложности в базисе схем из функциональных элементов. Такими элементами будем считать простейшие одноразрядные сумматоры и логические элементы, реализующие произвольные булевы функции двух переменных [4]. Характеристики используемых элементов базиса приведены в табл.1.

Основными преобразованиями в алгоритме привязки являются r-разрядное суммирование и вычитание, возведение в квадрат r-разрядных чисел и поиск минимума в массиве r-разрядных чисел. Верхние оценки сложности реализации указанных преобразований в базисе функциональных элементов приведены в табл. 2.

Теперь найдём ширину и высоту графа как функции параметров алгоритма привязки с учётом функциональных преобразований предполагаемого базиса реализации. Тогда ширина и высота графа определяются следующим образом:

Dbasis imax Jmax Emax ’

Ht„„ “ 9 + \log!D\ (5)

Рис. 4. Максимальная ЯПФ графа задачи привязки 224

Таблица 1. Базис функциональных элементов и их характеристики

Наименование элемента Реализуемые функции Lt, тактов Lh, вентилей Примечание

Одноразрядный сумматор Сг#1 = йгЪг + Сг(йг + Ъг ) St = аг ® Ъг ® Сг Lf= 2g Ц= 3g L- = 6

BF(2,1) х1—-Х2 ► J = f BF (X1,X2) —► У Lf = G L{ = 1 Элемент реализует любую БФ двух переменных

Видно, что алгоритм привязки обладает логарифмической высотой. Это минимальная высота для алгоритмов подобного типа, она обеспечивается за счет максимальной ширины. Оценки высоты вида 0(log2N), где N - число входных переменных алгоритма, как известно, уменьшить не удаётся. Поэтому высота алгоритма привязки, определённая по формуле (3), является минимальной в классе базиса реализации. Таким образом, если удаётся одновременно выполнять Р двухместных операций, то реализация всего алгоритма привязки потребует не более 0(^р) тактов. Например, для размерности матрицы гипотез гтах = ]тах = 13 и числа

каналов высотомера лтах = 5 можно решить

задачу привязки (для одного цикла) всего за 18 тактов работы микропроцессора (МП), но

для этого потребуется около тысячи таких МП.

Оценки Р и Н в виде (3) представляют собой монотонные функции от 1, 7 и т, что делает возможным вариант оптимизации затрат согласно п. 2Ъ. Это означает, что возможно сокращать Р (аппаратные затраты) простым уменьшением 1, 7 или т. Это приводит к пропорциональному увеличению Н, при этом минимум Р (один процессор или процессорный элемент) достигается при максимуме Н. Таким образом, предварительный анализ характеристик графа алгоритма привязки показывает, что оптимизация вычислений носит достаточно простой характер.

На основе табл. 2 получим верхние оценки сложности вычислений для алгоритма привязки. Верхние оценки аппаратной сложности вычислений для циклической и разовых частей алгоритма привязки имеют вид:

Таблица 2. Верхние оценки сложности вычислений в базисе схем из функциональных элементов для основных преобразований алгоритма привязки

Преобразование Формула Сложность Примечание

r-разрядное сложение (вычитание) (SM) C = A ± B LSM = 3rG LShM = 6r Суммирование с последо вательным переносом

Возведение в квадрат r-разрядного числа (SQ) = C LsQ = 3(2r - 1)g LsQ = (7r - 6)r Аппаратный умножитель матричного типа

Минимум в массиве чисел (MIN) C = Min {A} i=1,...,N г LfN = (3r # 2) \logN\ g LMN = 9(N - 1)r Древовидный параллельный поиск на основе схем сравнения двух чисел

<60r2i j н

*-max J max Г max’

L(1)< 4r(l4 #\l0g2 Imax 1 )>

Lh} < 10rimaxJmax’ (6)

L2 < 4r \log2(i J )(.

t I c>2\ max J max/\

Анализ соотношений “циклической” и “разовой” составляющих сложности вычислений показывает, что

6Lh = li!)/lih2) / 6r к ,

h h h — r^max ’

JL = L(1) /1(2) ^ 14 #\l0g2 Lmax

* ( ( \log2(i J )

I 0 2^ max J max /

Кроме того,

JLt 0 1 При max{imax Jmax) 0 287 •

Видно, что циклическая часть алгоритма привязки полностью определяет архитектуру аппаратной части ФОП КЭНС, причём для размерностей матрицы гипотез, не превышающей 287x287 элементов, эта часть алгоритма будет определять ещё и принципы распараллеливания вычислений. В случае больших матриц (>287x287) при распараллеливании необходимо учитывать свойства ЯПФ графа “разовой” части алгоритма.

Данные оценки соответствуют максимальной ЯПФ графа, т.е. максимальному параллелизму вычислений. Этому варианту, в свою очередь, соответствует аппаратная реализация ФОП КЭНС. Его архитектура представляет собой двумерный массив функциональных элементов, реализующих систолический принцип обработки данных. Данный ФОП обладает максимальной производительностью для выбранного алгоритма привязки. Вид оценок подтверждает монотонность аппаратной и временной сложности как функций от i, J, m. Представляют интерес асимптотические оценки сложности вычислений для этого варианта: Lh = O( r2I), где

1 = imaxJmax1 max’ Lt = O(r l0gI) - ВВДн^ что с

увеличением размерности матрицы гипотез аппаратная сложность вычислений для максимально параллельной реализации алгоритма привязки растёт значительно быстрее, чем

временная. В случае больших размерностей матрицы это может существенно ограничить применение прямого распараллеливания вычислений для алгоритма КЭНС. В силу монотонности функций сложности L (i,J,m) и Lt(iJ,m) целесообразно данный вариант реализации считать исходным для последующей оптимизации. Это и есть базовая архитектура ФОП в смысле [3].

Следующим шагом DH-синтеза алгоритмов является направленное изменение его графа (п.4). Этот шаг необходим тогда, когда сложность реализации максимально параллельного варианта алгоритма привязки превосходит допустимые ограничения. Это может быть в случае использования менее совершенной технологии изготовления СБИС, для варианта реализации алгоритма на уровне стандартных МП и т.д. Для алгоритма привязки направленное изменение графа необходимо начинать с максимальной ЯПФ (п.4). Каждый шаг уменьшения D сопровождается некоторым пропорциональным увеличением H, причём для различных ярусов графа это увеличение будет различным. Существует множество стратегий направленного изменения графа, которые приводят к одному и тому же значению параметра H. Поэтому на каждом шаге изменения графа производится оценка параметров L t и Lh, что существенно уменьшает перебор вариантов. Математически задача направленного изменения графа алгоритма может быть сформулирована следующим образом:

!п 2 N;N 2 {N};Dn =

= Min(D, — d, );H =

l=1,..,N l u n (7)

N

= H #Min($ kldl);

l l=1

Lh = Min{ Lhi}, Lt = const, (8)

M

где l - номер яруса графа, N - количество ярусов графа, kt - коэффициент пропорционального увеличения высоты графа в l-ом ярусе при уменьшении ширины на dr вершин, M - число вариантов ЯПФ.

В общем случае !ур, р з д;ЬРр з Ьк,

что обуславливает переборный характер при построении стратегии направленного изменения Б и Н, которая одновременно обеспечивает достижение всех условий, сформулированных в (7), (8). С другой стороны, монотонность Б(а) и Н(а), характерная для рассматриваемого алгоритма, обеспечивает сходимость процесса оптимизации к условию (8). По отношению к ФОП КЭНС это означает существование однозначного решения задачи построения оптимального графа алгоритма привязки и, соответственно, оптимальной архитектуры ФОП.

Описанная процедура БН-синтеза алгоритма позволяет однозначно синтезировать архитектуру параллельного ФОП КЭНС в базисе элементарных арифметико-логических преобразований. Эта архитектура представляет собой двумерный массив функциональных элементов, ориентирована на проектирование в технологии “система-на-кри-сталле” и на реализацию в виде одного кристалла СБИС. При этом в рамках ограничений на реализацию, обусловленных степенью интеграции СБИС, предельным тепловыделением, числом внешних контактов и т. д., БН-синтез позволяет получить архитектуры ФОП с максимальной производительностью.

Использование БН-синтеза алгоритмов на основе анализа и направленного изменения его графа, вершины которого взвешены оценками временной и аппаратной сложности вычислений в базисе схем из функциональных элементов, даёт возможность реализовать процессорные архитектуры, оптимальные по критериям аппаратной либо временной сложности вычислений. Данный подход может служить основой системного проектирования ФОП КЭНС.

Подход к проектированию ФОП основан на взаимосвязи характеристик алгоритмов и параметров процессорных архитектур, и поэтому он может быть использован на любом уровне их реализации - от СБИС до стандартных МП. Выше были рассмотрены проблемы системного проектирования ФОП КЭНС для варианта СБИС-реализации, актуального для бортовых систем ближайше-

го будущего. В то же время практический интерес представляет реализация алгоритма КЭНС с помощью ФОП, который построен на базе стандартных МП, т. к. это наиболее распространённый случай в практике разработки современных КЭНС. Рассмотрим применение метода БН-синтеза алгоритмов к проектированию конкретного ФОП КЭНС на базе стандартных МП.

Системное проектирование ФОП КЭНС на базе стандартных МП Применение универсальных программируемых микропроцессоров для разработки бортовых вычислительных средств вносит специфику в распараллеливание алгоритмов. Прежде всего, это касается уровня параллелизма обработки данных. По сравнению с вариантом СБИС он существенно повышается, а это отражается на процессах направленного изменения ЯПФ, т.е. собственно на БН-синтезе. Так как любой стандартный МП представляет собой сложную микроэлектронную систему, то реализация мелкозернистого параллелизма, когда функциональное преобразование каждой вершины графа реализуется на отдельном МП, приводит к значительным величинам Ьъ и Ь

Рассмотрим пример. Пусть имеются две смежных вершины ЯПФ графа V. и у.+р что соответствует последовательному выполнению преобразований вида

V = /г(а,ъ);^+1 = М^ь).

Реализуем эти преобразования на отдельном МП. Интерфейсы большинства стандартных МП могут обеспечить лишь синхронную передачу данных. При этом частота обмена информацией по внешним выводам СБИС всегда существенно ниже, чем по внутренним межсоединениям. Поэтому последовательное задействование двух МП будет занимать значительно больше времени, чем последовательное выполнение двух микрокоманд в одном МП.

Рассмотрение различных подходов к реализации ЯПФ на основе стандартных МП с учётом особенностей обмена по их внешним интерфейсам показывает, что одним из главных принципов “покрытия” графов алгоритмов архитектурами МП является ре-

ализация всех вершин ЯПФ, расположенных на одной дуге, в одном МП. Направленное изменение графа в таком случае должно проводиться следующим образом:

1. Уменьшение высоты максимальной ЯПФ за счет объединения всех вершин, соединённых “вертикальными” дугами. Такое уменьшение Н в отличие от варианта СБИС-реализации не приводит к увеличению ширины Б.

2. Уменьшение ширины максимальной ЯПФ Б за счёт объединения дуг с пропорциональным увеличением высоты графа Н.

Математическая формулировка задачи направленного изменения ЯПФ для рассматриваемого варианта реализации соответствует (7), (8). При этом параметр Б однозначно связан с числом МП (аппаратурные затраты или ЬД а Н - с числом тактов микропрограммы в МП (временные затраты или Ь). Наличие ограничений на число МП или время реализации алгоритма так же, как и в случае с СБИС, обеспечивает однозначное определение минимума числа МП при заданном времени реализации алгоритма привязки либо минимума этого времени при заданной величине аппаратурных затрат. В то же время учет топологии архитектур параллельных ФОП как МП-систем может приводить к появлению локальных экстремумов в зависимостях Б(а), Н(а). В результате, архитектуры ФОП, оптимальные по критерию сложности вычислений для варианта СБИС-реализации, могут быть не эффективными для варианта МП, и наоборот. Таким образом, если системное проектирование архитектур ФОП КЭНС на базе СБИС требует учёта свойств графа алгоритма (связность вершин, ярусность и т.п.), то системное проектирование этих ФОП на базе стандартных МП требует учёта топологии соединений между ними (магистраль, гнездо, кольцо и т. д.). Вот почему оценка временной сложности вычислений для любого алгоритма вообще и алгоритма привязки, в частности, в случае применения МП должна включать в качестве составляющей совокупное время обменов данными, необходимыми для реализации алгоритма [3]. Кроме того, эта оценка должна включать время ввода входных

данных и вывода выходных. В случае необходимости уменьшения совокупной временной сложности вычислений время обменов требуется предельно минимизировать, для чего всю ЯПФ графа целесообразно реализовать в отдельном модуле БЦВС. Этот вариант далее будем рассматривать в качестве основного.

Итак, базовыми положениями для исследования принципов реализации алгоритмов привязки с помощью ФОП на базе стандартных МП являются следующие:

- архитектура ФОП состоит из одинаковых стандартных МП, содержащих локальную память;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- каждый МП “покрывает” целиком дугу ЯПФ (т. е. реализует все преобразования в этой дуге);

- внешний интерфейс каждого МП содержит группу входных и выходных шин, обмены между различными МП возможны только по этим шинам;

- длительность выполнения арифметико-логических операций в каждом МП равны: 14 = 1,Ц = Ц/ = Ьс°тр2Л = 2 . Длительности приведены в числе тактов.

Это простейший тип архитектуры, он соответствует варианту реализации ФОП на базе простых контроллеров. Такой ФОП отличает однородность архитектуры, что позволяет увеличивать производительность ФОП путём простого наращивания числа МП, и сравнительно малая гибкость интерфейсов.

Взяв за исходное представление алгоритма привязки в виде максимальной ЯПФ, применим пошаговый ОН-синтез с учётом особенностей направленного изменения. В результате получается значительное число вариантов алгоритма, из которых интерес представляют следующие.

А. Максимально параллельная реализация алгоритма привязки. Граф алгоритма представлен в виде максимальной ЯПФ (рис. 4). Каждая дуга ЯПФ реализуется на отдельном МП. Обобщённый вид архитектуры ФОП представлен на рис. 5.

Данная архитектура состоит из ттах кластеров, каждый из которых состоит из

МП0,(

МП1твж.1і

Кластер №1 (ml

Кластер №mmax-1 (mmax-i)

Кластер №0 (m=0)

Рис. 5. Архитектура ФОП КЭНС на базе стандартных МП с максимальным уровнем параллелизма обработки данных

i j МП, параллельно обрабатывающих

max max ? г г

данные для одного соответствующего канала высотомера. Видно, что число дуг ЯПФ соответствует числу МП. Получим верхние

оценки LÂt и LÂh, причём для Lt произведём

нормирование на величину t, что даст возможность измерять временную сложность в числе тактов.

Верхняя оценка аппаратной сложности вычислений Lh получается непосредственно из вида ЯПФ:

Lh imaxJmaxMmax .

Верхняя оценка временной сложности вычислений Lt имеет вид для циклической части алгоритма привязки:

LAt(1> = L0,Jo #2Lpq #Lht #

#L(ty-h> # L(ty-h>2 # f # Lf, (10)

где L0,Jo - время выполнения процедуры вида

ax+b, с помощью которой определяется адрес крайнего элемента матрицы гипотез;

Ljo’io = L = 1 ; 2Lpt,q - время выполнения операций деления х/ %х и z / %z , L - время выполнения билинейной интерполяции для одной гипотезы; Ц~н # L(y~h) - время вычисления корреляционной меры, оно равно двум jk

тактам; Lti - время выполнения суммирова-

ния значений меры, полученной по всем каналам высотомера; Lf - время вычисления —j

текущего значения kJkn (3). С учётом конкретных значений верхних оценок получим:

LAt(1> / omax # 12. При получении оценки (10) не учитывается время обращения к запоминающему устройству, где хранится эталонная карта местности, так как эта процедура является общей для всех рассматриваемых вариантов архитектуры ФОП и общее время реализации всех вариантов алгоритмов увеличивается на постоянную величину

Как видно, для максимально параллельной реализации алгоритма привязки размерность матрицы гипотез не определяет время вычислений, и оно зависит только от числа каналов высотомера. В то же время аппаратные затраты на реализацию максимально параллельного алгоритма весьма велики.

Наприм^ для ¡max = Jmax = 13Pmax = 5 м°-

жет потребоваться 845 МП, что неприемлемо для любых бортовых КЭНС. Поэтому целесообразно рассмотреть другой вариант алгоритма привязки.

В. Параллельная обработка данных по каналам высотомера и последовательная по элементам матрицы гипотез. Граф алгоритма представляет собой результат DH-синтеза ЯПФ в части максимального уменьшения ширины графа для каждого из mmax каналов. Это приводит к соответствующему увеличению высоты H. Взвешивая вершины графа верхними оценками аппаратной и временной

Рис. 6. Архитектура ФОП на базе стандартных МП с параллельной обработкой данных каналов высотомера

сложности отдельных функциональных преобразований, получим соответствующие оценки алгоритма в целом. Они приведены в табл. 3. Данный вариант соответствует архитектуре ФОП, в которой каждый МП реализует алгоритм привязки для “своего” канала высотомера. Можно видеть, что уменьшение числа МП в гтах]тах раз приводит к

пропорциональному увеличению времени решения задачи КЭНС. Для современных КЭНС это даёт уменьшение аппаратурных затрат более чем в 150 раз. Поэтому данный вариант является вполне практичным. Архитектура ФОП варианта В приведена на рис. 6.

С. Параллельная обработка данных по всем элементам матрицы гипотез и последовательная по каналам высотомера. Для построения графа алгоритма, соответствующего данному варианту, применим ПИ-синтез, в результате которого получим максимальную ЯПФ для каждого канала и последовательное соединение всех ттх-1 каналов. Взвесим вершины графа верхними оценка-

ми временной и аппаратной сложности. Суммарные оценки приведены в табл. 3. Архитектура ФОП, реализующего данный алгоритм привязки, аналогична приведенной на рис. 6 с той разницей, что в данном случае число МП равно і і .

А тах тах

Сравнение данного варианта с максимально параллельным по критерию эффективности показывает, что уменьшение числа МП в ттах раз не приводит к пропорциональному увеличению времени реализации алгоритма. Это говорит о большей эффективности описываемого варианта реализации по сравнению с максимально параллельным алгоритмом. Анализ процессов направленного изменения графа алгоритма в ходе ВИ-синтеза приводит к выводу о существовании баланса временных затрат, при котором затраты на вычисления равны затратам на обмен. Подробный анализ структуры временной сложности вычислений выходит за рамки данной статьи, и поэтому ограничимся рассмотрением одного из вариантов параллельной реализации алгоритма привязки, для которого достижим этот баланс.

Б. Параллельная обработка данных по одной строке матрицы гипотез и последовательная по каналам высотомера. Граф данного варианта параллельного алгоритма привязки представляет собой результат промежуточного этапа ВИ-синтеза максимальной ЯПФ. Параллельно обрабатываются все элементы одной строки матрицы гипотез, а затем осуществляется переход к следующей строке. После обработки всех строк матрицы осуществляется переход к обработке элементов матрицы гипотез для следующего

Таблица 3. Верхние оценки аппаратной и временной сложности вычислений для различных модификаций алгоритма привязки при их реализации на стандартных МП

Вариант алгоритма Ьь Ь

А ітах Хтах № тах — Vтах # 12

В тах — ^тахХтах ( T тах # 13 )

С і і тахЛ тах — 16 U тах

В і тах — 14і V — тах^тах

канала высотомера. Если матрица гипотез квадратная, то все выводы справедливы для варианта параллельной обработки по элементам столбца. Если же данная матрица прямоугольная, то в зависимости от отношения 'тах

~ следует распараллеливать обработку

]тах

элементов строки либо столбца. После построения ЯПФ необходимо взвесить все вершины графа верхними оценками сложности вычислений. Для рассматриваемого варианта алгоритма суммарные оценки сложности приведены в табл. 3. Видно, что среди рассматриваемых вариантов параллельная обработка всех элементов одной строки матрицы гипотез также обеспечивает непропорциональный рост временной сложности по отношению к максимально параллельному алгоритму. Это обусловлено достижением упомянутого баланса составляющих временных затрат. Архитектура ФОП, реализующего этот алгоритм, аналогична приведённой на рис. 6, число МП при этом равно ' .

17 А А тах

Анализ оценок временной и аппаратной составляющих сложности вычислений показывает, что максимально быстрыми являются варианты максимального распараллеливания, то есть А и С. Но значительная аппаратная сложность (соответственно

^тах^тахWmax и 'тах]тах МП) делаСТ ЭТи варианты нецелесообразными для практической реализации. Поэтому варианты В и С являются наиболее предпочтительными для разработки архитектуры ФОП. Произведём сравнение этих вариантов алгоритмов по критерию Ц, для чего составим неравенство

" ЬВ/Ц 6 1 7 ^ ^ + 131таХ 6 1 . (11)

14 Y тах

Решение неравенства имеет следующий

14z

вид: ]тх 6------та^, т.е. параллельная обра-

[тах # 13

ботка всех элементов одной строки матрицы гипотез практически всегда даёт выигрыш во времени решения задачи привязки.

Значительный теоретический интерес

представляет исследование эффективности рассмотренных вариантов параллельной реализации алгоритма привязки. Как известно [4], одним из критериев системной эффективности вычислений может служить удельный показатель Ьы = Ц х Ц. При этом большей эффективности реализации соответствует меньшее значение Ьы. Сравнение рассмотренных вариантов по критерию Ьы для квадратной матрицы гипотез показывает следующее:

- Для любой конфигурации матрицы

гипотез Ь°ы < ЬА при \тах 6 2(7 - 6).

Хтах

Если для алгоритма П принять вариант распараллеливания по меньшему размеру матрицы, то алгоритм П является всегда более эффективным, чем А для любого размера матрицы гипотез и числа каналов высотомера.

- Для алгоритма В справедливо такое же условие, решение неравенства при этом принимает вид:

Ь < Ь при Рт 6 1.

тах

- Сравнение алгоритмов С и П приводит к следующему очевидному решению:

ЬЫ < Ь1 при 8 8тах 6 7'тах . Если учесть B03-

можность выбора параметра распараллеливания в алгоритме П, то также можно сформулировать вывод о его более высокой эффективности по сравнению с алгоритмом С.

Таким образом, по критерию эффективности вычислений следует признать алгоритм параллельной обработки всех элементов одной строки матрицы гипотез наиболее предпочтительным для практической реализации. Он обеспечивает максимальную скорость обработки данных в практически важных случаях.

В течение 80-х и 90-х годов описываемый в работе подход к разработке ФОП, основанный на ПИ-синтезе, был использован для разработки реальных ФОП КЭНС. При этом был использован алгоритм варианта П.

Результаты разработки ФОП КЭНС

Подход к проектированию ФОП, основанный на ОН-синтезе, был использован при разработке двух поколений реальных бортовых ФОП КЭНС, представляющих собой различные поколения.

- ФОП первого поколения (80-е годы).

Этот ФОП разработан на основе стандартных МП. Архитектура ФОП представляет собой систему из 14 процессорных элементов (ПЭ) с общей шиной, общим ЗУ и общим микропрограммным устройством управления. В состав каждого ПЭ входит локальная сверхоперативная память на основе регистров общего назначения, число которых равно 16, что даёт возможность хранить матрицу сигналов размерностью 14x14 внутри процессоров и не затрачивать машинного времени на обращение к общему ЗУ!

В данном ФОП реализован параллелизм двух уровней - в части обработки данных (14 потоков данных) и в части формирования адресов общего ЗУ. С этой целью в архитектуру введен ещё один ПЭ для вычисления текущих адресов общего ЗУ. Адресный ПЭ преобразует адреса переменных в двухмерном массиве в адреса переменных в линейном массиве по формуле вида а + Ъс. Ра-

ботой вычислительных ПЭ и адресного ПЭ управляет общее микропрограммное устройство управления, построенное на основе ЗУ микропрограмм. Архитектура ФОП приведена на рис. 7, технические характеристики - в таблице 4.

Описываемый ФОП под названием С-6118 был разработан, изготовлен и отработан сначала на макете, а затем на этапе экспериментального образца в составе функционирующей КЭНС.

Аппаратная реализация С-6118 основана на применении КМОП БИС серий 588,537 и КМОП СИС серии 564. Параллельная архитектура дала возможность весьма эффективно сочетать применение низко -частотных КМОП - схем, что привело к низкой потребляемой мощности ФОП (6 Вт) с достаточно высокой производительностью (4 млн. эквивалентных оп/сек). Это, в свою очередь, дало возможность применить обычные конструктивно-технологические решения для бортовой аппаратуры - двухслойные печатные платы, наклеенные на каркасы из сплава А1.

Однокристальные микропроцессоры серии 588ВС2, являясь лучшими из КМОП БИС в нашей стране начала 80-х годов, по-

Л АЛУ ОЗУ

У Рг '

16

АЛУ Рг

ЛУУ

ПЭ1

АЛУ Рг

ЛУУ

ПЭ2

АЛУ Рг

ЛУУ

ПЭ14

64

ПЭ1 - процессорный элемент /

АЛУ - арифметико-логическое устр-во

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рг - регистровый файл 16x16

ЛУУ - локальное устройство управл-я

ОЗУ - оперативное ЗУ

МПУУ- микропрогр. устр-во управл-я

ком/инф/адр - шина команд/информации/

адресов (из центральной ЦВМ) ус - управляющие сигналы

Рис. 7. Архитектура ФОП КЭНС С-6118

Таблица 4. Характеристики параллельных ФОП КЭНС

Характеристики Модели ФО П

С-6118 С-9118

Разрядность, бит 16,32 16,32

Производительность, 106 экв. оп/сек 4 8

Емкость ОЗУ, Кбайт 72 112

Г абариты, ммхммхмм 295х182х84 295х182х42

Масса, кг 2,6 1,5

Мощность, Вт 6 15

Элементная база: процессор, 1824 1824

память 537 Б1617

Программное обеспечение Специализированный язык Ассемблер

Средства контроля Т есты Тесты

Средства обеспечения надежности Дублирование Дублирование

Г од разработки 1983 1989

зволили реализовать внутреннюю общую шину с минимумом затрат. Система микрокоманд 588 ВС2 была одной из наиболее развитых для схем такого класса, что позволило достичь минимальных по длине программ вычислений.

- ФОП 2 -го поколения (80-90-е годы).

Усложнение алгоритмов КЭНС и ужесточение требований на объёмно-массовые характеристики бортовой аппаратуры приве-

ло к появлению нового поколения ФОП, представляющего собой развитие архитектуры С-6118.

Анализ путей совершенствования архитектур многопроцессорных ФОП показал, что основными путями являются:

1. Введение в состав ПЭ блоков аппаратной реализации операций, более сложных, чем сложение, и, в первую очередь, умножение.

ОЗУ 32Кх16

УМН

Лок.

ОЗУ

УМН

ПЭ2 ПЭЗ

МПУУ

( 8Кх64 )

ПКЗ

КАНАЛ

В/В —

ком/ инф/ > здр ус

ПЭ1 - процессорный элемент і иР - микропроцессор УМН - умножитель ПКі - процессорный кластер і лок ОЗУ - локальное ОЗУ ОЗУ - оперативное ЗУ МПУУ - микропрогр. устр-во управл-я ком/инф/адр - шина команд/информации/

адресов (из центральной ЦВМ)

Рис. 8. Архитектура ФОП КЭНС С - 9118 233

2. Увеличение ёмкости локальных ЗУ!

3. Реализация прямой адресации локальных ЗУ как со стороны адресного ПЭ, так и со стороны “своих” ПЭ.

В результате исследования влияния алгоритмов КЭНС и решений, совершенствующих архитектуру С-6118, была смоделирована, оценена и разработана БГМБ-архитек-тура многопроцессорного ФОП с тройной иерархией ЗУ. В состав каждого ПЭ входили не только универсальные МП, но и умножители, реализующие операцию умножения за такт короткой операции (сложения). Численные эксперименты с моделью ФОП показали, что для выбранного класса задач, а также исходя из требования минимума аппаратных затрат на параллельную работу, все ПЭ должны быть объединены в группы из трёх ПЭ, соединённые с одним локальным ЗУ каждая. Все остальные архитектурные решения были подобны С-6118, в том числе вариант параллельной обработки данных.

Наличие умножителей позволило уменьшить общее число ПЭ с 14 до 9, что сократило массу всего ФОП, а производительность увеличить до 8 млн. оп/сек. Архитектура этого ФОП приведена на рис.8. Данный ФОП, разработанный в 1989 году, получил название С-9118.

Результаты разработки и испытаний бортовых ФОП КЭНС полностью подтвердили правильность принятых технических решений, особенно в части обеспечения высокой производительности при реализации алгоритмов привязки. Кроме того, сравнительный анализ возможных вариантов распараллеливания алгоритма и информации о близких по назначению процессоров показали высокую эффективность применения ОН-синтеза алгоритмов на этапе выбора основных архитектурных решений бортовых спецвычислителей.

Выводы

1. Алгоритм привязки является основным в системе алгоритмов КЭНС. Его отличает высокая вычислительная сложность, обусловленная большим количеством простых преобразований, которые необходимо выполнить за минимальное время.

2. Граф алгоритма привязки принадлежит к классу потоковых, топология графа относится к типу струнных гамаков. Поэтому целесообразно возложить реализацию алгоритма на автономный ФОП, который является модулем БЦВС.

3. Системное проектирование ФОП предполагает следующие этапы:

- Анализ алгоритма, включающий выявление внутреннего параллелизма и определение наиболее весомых с точки зрения вычислительной сложности преобразований.

- Направленное изменение графа на основе ОН-синтеза алгоритмов, начиная с максимальной ЯПФ, и построение верхних оценок её ширины и высоты.

- Взвешивание вершин графа верхними оценками аппаратной и временной сложности преобразований в базисе схем из функциональных элементов СБИС.

- Построение (синтез) взвешенного графа с минимальной высотой Н (в случае требований на реализацию ФОП с максимальной производительностью) либо с минимальной шириной О (при требованиях на реализацию ФОП с минимальными аппаратурными затратами).

- Синтез архитектуры ФОП как двумерного массива процессорных элементов, каждый из которых настроен на реализацию отдельного функционального преобразования (для варианта реализации ФОП в виде заказной СБИС), и как многопроцессорной архитектуры, состоящей из МП, реализующих в совокупности алгоритмы КЭНС (для варианта реализации ФОП на базе стандартных МП).

4. Процедуры ОН-синтеза алгоритмов обеспечивают формирование архитектур ФОП с максимальной производительностью реализации алгоритма привязки при заданных ограничениях на аппаратные затраты либо с минимальными затратами при заданных требованиях на время решения задачи.

5. Среди возможных результатов ОН-синтеза алгоритмов КЭНС выделяется вариант алгоритма параллельной обработки всех элементов одной строки матрицы гипотез и последовательной обработки данных для ка-

налов высотомера. Этот вариант обеспечивает минимальное время реализации алгоритма привязки для многопроцессорных архитектур ФОП.

Работа поддержана Программой Президиума РАН .№2 “ Интеллектуальные информационные технологии, математическое моделирование, системный анализ и автоматизация” (Направление 3. Вычислительные технологии и системы).

Библиографический список

1. Белоглазов И. Н., Тарасенко В. П. Корреляционно-экстремальные системы. -М.: Сов. Радио, 1974. - 392 с.

2. Бердышев В. И., Костоусов В. Б. Экстремальные задачи и модели навигации по геофизическим полям. - Екатеринбург : УрО РАН, 2007. - 270 с.

3. Воеводин В. В. Математические модели и методы в параллельных процессах. -М.: Наука, 1986. - 296 с.

4. Лукин Н. А. Функционально-ориентированные процессоры для систем реального времени: основные понятия, история развития, элементы теории проектирования. // Высокопроизводительные вычислитель-

ные системы// Материалы Четвертой молодежной школы. - Таганрог, Изд-во ТТИ ЮФУ, 2007. - С. 98 - 124.

5. Сэвидж Д. Э. Сложность вычислений: Пер. с англ. - М.: Факториал, 1998. -368 с.

References

1. Beloglazov I.N., Tarasenko V.P. Correlation extreme systems. Moscow: Soviet Radio, 1974. (in Russian).

2. Berdyshev V.I., Kostousov V.B. Extreme problems and models of navigation on geophysical fields. Yekaterinburg, Urals branch of RAS, 2007. (in Russian).

3. Voevodin V.V. Mathematical models and methods for parallel processes. - Мoscow, Science, 1986. (in Russian).

4. Lookin N.A. Functional-oriented processors for real-time systems: main categories, history, elements of design theory. // Highperformance computer systems// Proceedings of IVth science school. - Taganrog, TTI Publishers, 2007. - 98 - 124 pp. (in Russian).

5. Savage J.E. The Complexity of Computing. - New York, London, Sydney, Toronto: John Wiley & Sons, 1976.

SYSTEM DESIGNING OF FUNCTION-ORIENTED PROCESSORS FOR ONBOARD CORRELATION EXTREME NAVIGATION SYSTEMS

© 2009 N. A. Lukin

Institute of Machine Science, Ural department of the Russian Academy of Sciences, Science-and-Production Association of Automation, Yekaterinburg

The paper presents the results of investigating optimal realization of the conjunction algorithm, one of the main ones in the complex of algorithms of correlation extreme navigation systems using sensors of geophysical fields. The main result of the investigation is the procedure of algorithm DH-synthesis which makes it possible to synthesize rational architectures of function-oriented processors (FOP). Possible implementation of the conjunction algorithm on the basis of a two-dimensional array of processor elements in VLSI technology is described. The results of DH-synthesis as applied to FOP based on standard microprocessors are presented. The results of developing two generations of actual onboard FOPs for CENSs produced with the use of the procedure proposed are given.

Correlation extreme navigation systems, function-oriented processor, complexity of computations, parallel data processing.

Информация об авторе Лукин Николай Алексеевич, кандидат технических наук, старший научный сотруд -ник, заведующий лабораторией. Институт машиноведения Уральского отделения РАН. Область научных интересов: функционально-ориентированные процессоры, параллельные вычисления, сверхбольшие интегральные схемы, компьютерная арифметика, сложность вычислений. E-mail: nicklookin@mail.ru.

Lukin, Nikolay Alexeyevitch, head of laboratory, candidate of technical science, senior researcher, Institute of Machine Science, Ural department of the Russian Academy of Sciences. Area of research: function-oriented processors, parallel computations, very large-scale integrated circuits, computer arithmetic, complexity of computations. Е-mail: nicklookin@mail.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.