Научная статья на тему 'Общая структурная схема реконфигурируемого мультипроцессора'

Общая структурная схема реконфигурируемого мультипроцессора Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
257
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МУЛЬТИПРОЦЕССОР / ПОТОК ДАННЫХ / РЕКОНФИГУРАЦИЯ / MULTI-UNIT / THE DATA FLOW / RECONFIGURATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Титенко Е. А.

В статье определены необходимые и достаточные условия для аппаратной поддержки задач обработки символьной информации с ветвящимися процессами. Выполнен синтез структуры реконфигурируемого мультипроцессора, управляемого потоком данных и содержащего модули ассоциативной памяти и матрицу однородных устройств

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Титенко Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE GENERAL STRUCTURAL SCHEME OF RECONFIGURABLE MULTI-UNIT WITH PROGRAMMABLE STRUCTURE

The article is show the necessary and sufficient conditions for hardware support of the tasks of computing of symbolic information with branching processes. Made the synthesis of reconfigurable multiprocessor structure that control the flow of data and contains the modules of associative memory and a matrix of multi-devices.

Текст научной работы на тему «Общая структурная схема реконфигурируемого мультипроцессора»

УДК 004.031+004.328

ОБЩАЯ СТРУКТУРНАЯ СХЕМА РЕКОНФИГУРИРУЕМОГО МУЛЬТИПРОЦЕССОРА Е.А. Титенко

В статье определены необходимые и достаточные условия для аппаратной поддержки задач обработки символьной информации с ветвящимися процессами. Выполнен синтез структуры реконфигурируемого мультипроцессора, управляемого потоком данных и содержащего модули ассоциативной памяти и матрицу однородных устройств

Ключевые слова: мультипроцессор, поток данных, реконфигурация

Введение1

Одним из значимых направлений компьютерной индустрии в будущем является интеллектуализация вычислений на всем жизненном цикле реализации решения, т.е. интеллектуализация алгоритмических, программных и аппаратных средств. Переход от многопроцессорных вычислительных систем с жесткой структурой (МВС с ЖС) к МВС с гибкой программируемой структурой (МВС с ПС) [1,2,3,4] определяется необходимостью решения нового класса проблемно-поисковых задач. Данный класс задач характеризуется, во-первых, тем, собственно процессы обработки данных интегрированы с коммуникационными процессами обмена данными и сообщениями. Во-вторых, общее объединяющее свойство проблемно-поисковых задач заключается в том, что они имеют, в основном, недетерминированный метод решения и описываются динамически графом большой размерности. Массовая значимость данного класса подтверждается появлением самостоятельного списка GRAPH500 [5], альтернативного мировому списку TOP500 лучших МВС с ЖС под решение другого класса задач - вычислительно трудоемких задач с детерминированным методом решения. Третья особенность проблемнопоисковых задач связана с тем, что они предназначены для обработки знаний, имеющих преимущественно символьное представление и декларативное описание предметной области. Таким образом, решение задач основывается на моделях, методах, аппаратно-программных средствах работы с динамическими графами большой размерности, т.е. с графами, структура которых частично известна до начала вычислений.

Вместе с тем подавляющее большинство кластерных МВС с ЖС имеют организацию

Титенко Евгений Анатольевич - ЮЗГУ, канд. техн. наук, доцент, e-mail: [email protected]

[2,6], ориентированную на обработку числовой информации в вычислительно трудоемких задачах с известной структурой графа решения. МВС с ЖС основаны на фон-неймановской модели организации вычислений, использующей управление потоком команд. Тогда как распараллеливание проблемно поисковых задач недетерминированной обработки символьной информации (ОСИ) основывается на управлении потоком данных. Таким образом, создание МВС с ПС под проблемно-поисковые задачи с недетерминированным методом решения, управляемые потоком данных, представляется востребованным направлением развития компьютерной индустрии будущего.

Математический аппарат для генерации ветвящихся процессов ОСИ

С точки зрения разработчика МВС символьная информация характеризуется вариативностью представления на физическом и логическом уровнях: динамически изменяемые коллекции структур, размытые границы размера минимальной дискретной единицы обработки, множественные структурные зависимостями между элементами, иерархическое представление, комбинация локальных и глобальных процессов преобразования с учетом искажений, неполноты или избыточности символьных структур.

Главная отличительная особенность задач ОСИ основывается на доминировании параллелизма потока данных. Естественный параллелизм символьных данных характеризуется вариативностью позиций образования множественных процессов, переменным размером фрагментов данных, на которых он возникает. Кроме того, ветвящиеся вычислительные процессы имеют «мелкозернистую точку образования», привязанную к текущим элементарным операциям. Вследствие этого граф решения задач ОСИ, состоящий из ветвящихся путей, характеризуется переменными коэффициентами ветвления и сужения, которые соотносятся с большинством шагов вычислений (итераций, рекурсивных вызовов).

Исходя из особенностей задач ОСИ, наиболее подходящим аппаратом для задания параллельно выполняющихся ветвящихся процессов являются исчислительные продукционные системы. Исчислительная продукционная система (ПС) состоит из однородного по составу набора разрешительных продукций (правил), имеющих схему «условие ^ действие», и естественным образом ориентирована на параллелизм потока данных за счет недетерминированной активации продукций и их недетерминированного срабатывания. Таким образом, формат символьных данных, принципиально имеет более высокий уровень организации параллельных вычислений, чем числовой формат, что приводит к созданию модели параллельных вычислений с неединичным множеством скоординированно работающих дискретных исполнителей.

Также с точки зрения разработчика вычислительных устройств для МВС ОСИ (уровень схемотехнических решений) аппаратноориентированными должны быть следующие базовые операции символьных преобразований:

1) поиск по образцу;

2) подстановка;

3) объединение слов, объединение слов с отсечением;

4) пересечение слов;

5) символьное вычитание и др.

Базовые принципы работы реконфигурируемого мультипроцессора потока данных

Наиболее востребованным и доступным устройством с массовым параллелизмом является мультипроцессор (МП), под которым понимается вычислительная система, состоящая из набора однородных вычислительных устройств, объединенных коммутационной подсистемой между собой и общей разделяемой рабочей памятью (РП) и обладающих равными возможностями доступа к памяти [7]. МП под задачи ОСИ должен иметь встроенными средствами динамического изменения соединений под структуру графа решаемой задачи. Кроме операционной части, содержащей матрицу однородных вычислительных устройств и коммутационных узлов, в структуре МП выделяется управляющая часть, выполненная в соответствии с машинами потока данных [3,4] в виде модулей ассоциативной памяти (АП) с блоком множественного анализа конфликтных ситуаций. АП обеспечивает выполнение про-

дукций не по счетчику команд, а по готовности продукций к обработке текущих входных слов, т.е. по результатам множественного ассоциативного поиска вхождений. Если ассоциативный поиск вхождений по множеству входных слов и образцов ПС положительный, то на вход операционной части МП формируется поток обрабатываемых слов, каждое из которых дополняется настроечной информацией для коммутационных узлов о соединении устройств в пределах текущего уровня графа вывода. Введение АП и блока реконфигурации (БРК) позволяет определять количественные характеристики потока данных и управлять ветвящимися процессами на аппаратном уровне, т.е. структурно.

Для реализации параллельных вычислений устройства, аппаратно поддерживающие базовый набор символьных операций, динамически объединяются в единый вычислительный узел на время генерации текущего уровня графа с помощью распределенной коммутационной подсистемы (КС), обеспечивающей гибкую и программируемую настройку соединений под всевозможные варианты топологий между вычислительными устройствами. Организация распределенной структуры КС заключается во введении в состав вычислительного устройства входного и выходного многоканального переключателей, что приводит к вычислительнокоммутационной структуре устройства и программированию процессов получения входных данных и передаче выходных данных собственно самим устройством. В итоге, вычислительные действия включают программную настройку переключателей как естественные шаги выполнения общего алгоритма решения.

Общая организация мультипроцессора ОСИ

Итак, основу МП составляют модули АП и решающая матрица однородных продукционных вычислительных устройств (ПВУ) количеством ЫхЫ, где N - число рабочих устройств-исполнителей продукций (рис. 1). Каждое из ПВУ реализует только одну продукцию ПС, взаимодействуя с удаленными ПВУ через распределенную коммутационную структуру. N столбцов решающей матрицы предназначены для параллельной генерации до N уровней графа задачи (графа вывода).

11

21

N1

12

22

N2

Ш

2N

NN

, ^ 1 ■■■ S v}

Решающая матрица ПВУ ^^ ^^^^

Блок анализа и генерации

О„

Рис. 1. Структурная схема реконфигурируемого V - количество обрабатываемых слов, ё - количество

Заложенная структурная избыточность в МП позволяет синхронизировать работу решающей матрицы ПВУ и модулей АП. Дело в том, что работа МП основана на формировании двух взаимодействующих потоков данных. С одной стороны, цепочка «многоканальная РП - модули АП» порождает поток сопоставленных с положительным опросом слов, которые создают входной нагрузочный поток на решающую матрицу ПВУ. С другой стороны, цепочка «матрица ПВУ - многоканальная РП» порождает выходной поток обработанных слов, которые фактически являются входным нагрузочным потоком на модули АП. Сбалансированность нагрузки двух взаимодействующих однородных вычислителей операционной части достигается за счет программируемого подключения новых столбцов матрицы под вновь порождаемых уровни графа задачи.

В пределах отдельного столбца матрицы образована не завешенная структура. Не завершенность проявляется в том, что связи между ПВУ не имеют постоянного закрепления.

Они динамически настраиваются под текущее обрабатываемое слово из {« ... «Я} с учетом выявленного параллелизма данных. Определение параллелизма данных для N слов из {51 ...

«,} осуществляется в цепочке «блок анализа и

мультипроцессора: I- количество входных слов, модулей АП генерации - блок реконфигурации» и приводит к появлению третьего - управляющего - потока коммутации. Поток коммутации формируется в БРК отдельно по каждому столбцу матрицы и представляет собой вектор двоичных унитарных (невесовых) кодов [8], каждый бит (группа бит) которого управляет связью подключения ПВУ с внешними источниками или приемниками.

Основу ПВУ (рис. 2 а)) составляет символьный вычислитель, интегрированный с многоканальными переключателями - мультиплексором и демультиплексором, в которых с помощью настроечных (адресных) входов динамически (в пределах уровня) выбираются источник и приемник данных.

ПВУ как функциональное завершенное устройство, аппаратно реализующее операции поиска вхождений и подстановки, содержит собственно блок поиска, блок подстановки, входной мультиплексор на р1 входов, выходной демультиплексор на р2 выходов, управляемые настроечными значениями 01ц и 02ц. На рис. 2 б) представлена конкретизация коммутационной части четырьмя источниками и четырьмя приемниками, среди которых вторые вход и выход предназначены для соединения смежных ПВУ в составе МП ОСИ.

р1

01у отБРК

S

а)

ПВУі-Д

G2ij от БРК

к РП

ПВУі+ц

Рис.2. Организация ПВУ: . - информационный сигнал, а) - структурная схема, б) - обозначе-

ние ПВУ с четырьмя входами/выходами

На рис. 3 представлена организация одного столбца решающей матрицы с ПВУ, имеющими коммутацию 4x4. Отличительная особенность ниже представленной организации заключается в повышении гибкости связей ПВУ между собой и внешними источниками слов {«1 ... «V}.

С одной стороны, введение локальных обратных связей в ПВУ повышает автономность их работы. С другой стороны, введение общего программируемого информационных входа и соответственно выхода в каждом ПВУ обеспечивает гибкость транзитных пересылок и уменьшает непродуктивные затраты времени на маршрутизацию в пределах столбца решающей матрицы.

Наконец, важнейшей структурной единицей МП ОСИ является блок реконфигурации, формирующий поток коммутации ПВУ в единый вычислительный узел в пределах каждого столбца решающей матрицы. Поток коммутации представляет собой вектора двоичных унитарных кодов (УК) [8], каждый бит (группа бит) которого управляет связью подключения ПВУ с внешними источниками или приемниками.

БРК также имеет модульную структуру и состоит N однотипных параллельных схем обработки УК. На схемотехническом уровне основу БРК составляет функциональный узел -цифровой компрессор (с модификациями) от новосибирской научной школы (Бандман О.Л.,

Ачасова С.М., Фет Я.И. [9] и др.). Цифровой компрессор ориентирован на выполнение следующих логических операций над УК: поиск приоритетной логической «1», формирование левой/правой серии логических «1» относительно приоритетной, объединение единичных серий УК, разделение единичных серий УК и др.).

Заключение.

Современный прогресс компьютерной индустрии многопроцессорных систем ориентирован на создание «интеллектуальных» вычислительных машин и систем с автоматически настраиваемой под поисковый граф задачи структурой. Обработка знаний как самой общей информационной категории сводится к решению недетерминированных задач ОСИ, описываемых в виде графа с ветвящимися путями, имеющего переменные коэффициенты ветвления и сужения на траекториях.

Для технической поддержки параллелизма ветвящихся вычислений выбран математический аппарат исчислительных продукционных систем, для которых разработан реконфигурируемый мультипроцессор потока данных. Операционная часть мультипроцессора содержит модули ассоциативной памяти и матрицу однородную продукционных вычислительнокоммутационных устройств.

Рис. 3. Программируемая структура столбца решающей матрицы ПВУ с коммутацией 4x4 Особенность реконфигурируемого мультипроцессора заключается, во-первых, в том, что коммутационная подсистема распределена по ее структуре в виде программируемых многоканальных переключателей, что обеспечивает динамическую реконфигурацию структуры мультипроцессора под граф решения задачи с точностью до отдельного уровня. Вторая особенность мультипроцессора связана с динамически формируемым потоком коммутации на основе оригинальных схем параллельной обработки унитарных кодов.

Созданная общая структурная схема реконфигурируемого мультипроцессора позволяет объединить и координировать работу неединичного множества дискретных вычислителей (продукционных вычислительных устройств), количество, топология которых динамически изменяются в процессе вычислений.

Реконфигурируемая организация создает основу для адаптации структуры операционной части мультипроцессора под информационную структуру графа решаемой задачи. Мультипроцессор может найти применение как аппаратный акселератор вычислений в машинах баз данных, машинах баз знаний, высокопроизводительных поисковых системах, системах обработки естественно-языковой информации, интеллектуальных системах ассоциативной памяти.

Юго-Западный государственный университет, г. Курск

THE GENERAL STRUCTURAL SCHEME OF RECONFIGURABLE MULTI-UNIT WITH PROGRAMMABLE STRUCTURE E.A. Titenko

The article is show the necessary and sufficient conditions for hardware support of the tasks of computing of symbolic information with branching processes. Made the synthesis of reconfigurable multiprocessor structure that control the flow of data and contains the modules of associative memory and a matrix of multi-devices.

Key words: multi-unit, the data flow, reconfiguration

Литература

1. Дмитренко, Н.Н. Семейство многопроцессорных вычислительных системс динамически перестраиваемой структурой/ Н.Н. Дмитренко, И.А. Каляев, И.И. Левин // Вестник компьютерных и информационных технологий.

- 2009. - №6.- С. 2-8.

2. Каляев, А.В. Модульно-наращиваемые многопроцессорные системы со структурно-процедурной организацией вычислений / А.В Каляев, И.И. Левин. - М.: Янус-К, 2003. - 380 с.

3. Бурцев, В. С. Параллелизм вычислительных процессов и развитие архитектуры суперЭВМ: сб. статей / сост. В.П. Торчигин, Ю.Н. Никольская, Ю.В, Никитин. -М.: ТОРУС ПРЕСС, 2006. - 416 с.

4. Стемпковский, А. Л. Параллельная потоковая вычислительная система - дальнейшее развитие архитектуры и структурной организации вычислительной системы с автоматическим распределением ресурсов / А.Л. Стемпковский, Н.Н. Левченко, А.С. Окунев, В.В. Цветков // Информационные технологии. 2008. №10 С.2-7.

5. Эйсымонт, Л. БАРРА иНРС - дорога с экзафлопсам/ Л. Эйсымонт // Открытые системы. - 2010. - №9.

- С.12-15.

6. Воеводин, В.В. Параллельные вычисления / В.В. Воеводин, Вл. В. Воеводин // - СПб.: БХВ-Петербург, 2002. - 608 с.

7. Корнеев, В.В. Вычислительные системы / В.В. Корнеев. - М.: Гелиос АРВ, 2004. - 512 с.

8. Шевкопляс, Б.В. Микропроцессорные структуры. Инженерные решения: Справочник / Б. В. Шевкопляс -М.: Радио и связь, 1990. - 512 с.

9. Фет, Я.И. параллельные процессоры для управляющих систем / Я.И. Фет.- М.: Энергоатомиздат. - 1981.

- 160 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.