Научная статья на тему 'САМОМАРШРУТИЗИРУЕМАЯ НЕБЛОКИРУЕМАЯ СИСТЕМНАЯ СЕТЬ С ПРЯМЫМИ КАНАЛАМИ: СЛОЖНОСТЬ И БЫСТРОДЕЙСТВИЕ'

САМОМАРШРУТИЗИРУЕМАЯ НЕБЛОКИРУЕМАЯ СИСТЕМНАЯ СЕТЬ С ПРЯМЫМИ КАНАЛАМИ: СЛОЖНОСТЬ И БЫСТРОДЕЙСТВИЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
27
7
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПОЛНЫЙ КОММУТАТОР / ДУАЛЬНЫЙ КОММУТАТОР / ПАКЕТНАЯ ДУАЛЬНОСТЬ / МУЛЬТИПЛЕКСОРЫ И ДЕМУЛЬТИПЛЕКСОРЫ / МНОГОКАСКАДНЫЙ КОММУТАТОР / БЕСКОНФЛИКТНАЯ САМОМАРШРУТИЗАЦИЯ / НЕБЛОКИРУЕМЫЙ КОММУТАТОР / СТАТИЧЕСКАЯ САМОМАРШРУТИЗАЦИЯ / КВАЗИПОЛНЫЙ ОРГРАФ / КВАЗИПОЛНЫЙ ГРАФ / ИНВАРИАНТНОЕ РАСШИРЕНИЕ СЕТЕЙ / КОММУТАЦИОННЫЕ СВОЙСТВА / ПРЯМЫЕ КАНАЛЫ / МАСШТАБИРУЕМОСТЬ И БЫСТРОДЕЙСТВИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Подлазов Виктор Сергеевич

Разработана неблокируемая самомаршрутизируемая сеть с прямыми каналами, в которой конфликты пакетов разрешаются на входе в сеть посредством процедуры борьбы источников за вход в первый каскад сети, обеспечивая пакетную дуальность. Заблокированные при борьбе пакеты повторно передаются источниками с минимальными задержками. Дуальность подразумевает совместное использование шинного (с разведением во времени) и мультиплексного (с разведением по каналам) способов разрешения конфликтов пакетов. Внутри сети возникновение конфликтов предупреждается посредством ее внутреннего распараллеливания, т.е. созданием заведомо бесконфликтных путей. Сеть разработана в 2-, 4-, и 8-каскадном вариантах с масштабированием числа каналов от нескольких сот до многих миллионов при неизменном быстродействии сети. В сети возможно обеспечение 1-, или 2-канальной отказоустойчивости при сохранении ее быстродействия. Накладными затратами на достижение указанных свойств является повышенная сложность сети, которая сопоставима со сложностью теоретического неблокируемого коммутатора Клоза. Хотя его структура известна, но практическая реализация отсутствует вследствие неизвестности процедуры параллельной самомаршрутизации в нем. Практическая ориентация предложенных сетей - это системные сети с передачей маршрутной информации в заголовках пакетов с однократным использованием в каждом каскаде управляющей маршрутной информации для базового полного коммутатора. Предложенные сети выполнены в расширенном схемном базисе, состоящем из полных коммутаторов и отдельных мультиплексоров и демультиплексоров. В работе представлены характеристики построенных сетей при указанном способе представления маршрутной информации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MULTICHANNEL NON-BLOCKING SYSTEM AREA NETWORK WITH DIRECT CHANNELS

An unblockable non-blocking self-routing network with direct channels has been developed, in which packet conflicts are resolved at the entrance to the network by the procedure of connecting sources to the first cascade of the network , providing a packet duality. Packets blocked during conflict resolution are retransmitted by sources with minimal delays. Within the network, the occurrence of conflicts is prevented by means of parallelization of the network itself. The network is designed in 2-, 4- and 8-stage versions with scaling of the number of channels from several hundred to many millions, keeping the same network performance. The network can provide 1- or 2-channel fault tolerance at the same link rate. The overhead cost of achieving these properties is higher complexity of the network, that becomes comparable to the complexity of the theoretical non-blocking Clos switch, which has no known practical implementation.The purpose of the proposed networks is photonic networks with routing information transmission in packet headers represented as one-time-use binary numbers. The proposed networks are made in an extended circuit basis, consisting of switches and separate multiplexers and demultiplexers. The paper presents the characteristics of the constructed networks with the specified method of presenting routing information.

Текст научной работы на тему «САМОМАРШРУТИЗИРУЕМАЯ НЕБЛОКИРУЕМАЯ СИСТЕМНАЯ СЕТЬ С ПРЯМЫМИ КАНАЛАМИ: СЛОЖНОСТЬ И БЫСТРОДЕЙСТВИЕ»

ISSN 2079-3316 ПРОГРАММНЫЕ СИСТЕМЫ: ТЕОРИЯ И ПРИЛОЖЕНИЯ т. 13, №4(55), с. 47-76 научная статья программное и аппаратное обеспечение для суперЭВМ

УДК 004.724.2 + 004.272.43

10.25209/2079-3316-2022-13-4-47-76

Самомаршрутизируемая неблокируемая системная сеть с прямыми каналами: сложность и быстродействие

Виктор Сергеевич Подлазов

Институт проблем управления имени В. А. Трапезникова РАН, Москва, Россия

podlazov@ipu.ru (подробнее об авторе на с. 72)

Аннотация. Разработана неблокируемая самомаршрутизируемая сеть с прямыми каналами, в которой конфликты пакетов разрешаются на входе в сеть посредством процедуры борьбы источников за вход в первый каскад сети, обеспечивая пакетную дуальность. Заблокированные при борьбе пакеты повторно передаются источниками с минимальными задержками. Дуальность подразумевает совместное использование шинного (с разведением во времени) и мультиплексного (с разведением по каналам) способов разрешения конфликтов пакетов. Внутри сети возникновение конфликтов предупреждается посредством ее внутреннего распараллеливания, т.е. созданием заведомо бесконфликтных путей. Сеть разработана в 2-, 4-, и 8-каскадном вариантах с масштабированием числа каналов от нескольких сот до многих миллионов при неизменном быстродействии сети. В сети возможно обеспечение 1-, или 2-канальной отказоустойчивости при сохранении ее быстродействия. Накладными затратами на достижение указанных свойств является повышенная сложность сети, которая сопоставима со сложностью теоретического неблокируемого коммутатора Клоза. Хотя его структура известна, но практическая реализация отсутствует вследствие неизвестности процедуры параллельной самомаршрутизации в нем. Практическая ориентация предложенных сетей—это системные сети с передачей маршрутной информации в заголовках пакетов с однократным использованием в каждом каскаде управляющей маршрутной информации для базового полного коммутатора. Предложенные сети выполнены в расширенном схемном базисе, состоящем из полных коммутаторов и отдельных мультиплексоров и демультиплексоров. В работе представлены характеристики построенных сетей при указанном способе представления маршрутной информации.

(see abstract in English on p. 73)

Ключевые слова и фразы: полный коммутатор, дуальный коммутатор, пакетная дуальность, мультиплексоры и демультиплексоры, многокаскадный коммутатор, бесконфликтная самомаршрутизация, неблокируемый коммутатор, статическая самомаршрутизация, квазиполный орграф, квазиполный граф, инвариантное расширение сетей, коммутационные свойства, прямые каналы, масштабируемость и быстродействие

Для цитирования: Подлазов В. С. Самомаршрутизируемая неблокируемая системная сеть с прямыми каналами: сложность и быстродействие // Программные системы: теория и приложения. 2022. Т. 13. № 4(55). С. 47-76. http://psta.psiras.ru/read/psta2022_4_47-76.pdf

© Подлазов В. С. ИКЭИЖ

Введение

В работе решается классическая коммутационная задача построения неблокируемого самомаршрутизируемого распределенного коммутатора с децентрализованным управлением и прямыми каналами, который образует системную сеть пакетной коммутации для многопроцессорных вычислительных систем. Эта задача до сих пор не имеет полного решения оптимального по быстродействию и схемной сложности. В работе рассматривается новое решение этой задачи с некоторой оптимизацией по указанным параметрам. Прямой канал между источником и приемником, используемый для доставки пакетов, содержит только комбинационные элементы и не содержит никаких элементов памяти, используемых обычно для буферизации конфликтных пакетов, и поэтому обеспечивает наименьшее время доставки пакетов по сети. Комбинационные элементы в канале образуют р-канальные полные коммутаторы р х р, демультиплексоры 1 х р и мультиплексоры р х 1. Они осуществляют маршрутизацию пакетов на основе управляющей маршрутной информации, передаваемой в пакете вместе с данными, и делают это без тактовых задержек — на лету. Это всегда можно сделать в комбинационной схеме без использования внутренней памяти.

В рассматриваемой сети используется статическая маршрутизация пакетов, при которой каждый источник порождает маршрутную информацию, задающую путь через сеть к приемнику независимо от других источников. Эта маршрутная информация порождается для перестановочного трафика, при котором каждый источник передает пакет только одному приемнику, который мы в дальнейшем называем перестановкой пакетов. Маршрутная информация в пакете состоит из нескольких частей, которые в совокупности задают весь путь и которые используются для управления коммутаторами и демультиплексорами при прокладке пути каждого пакета независимо от других пакетов, что и реализует самомаршрутизацию пакетов. Подчеркнем, что под самомаршрутизацией в данной работе понимается «маршрутизация от источника», при которой отправитель в заголовке пакета задает его путь через сеть, а не адрес получателя, по котором выбор пути осуществляет сеть. Перестановочный трафик возникает в разных подзадачах, например при совместном выполнении БПФ произвольными абонентами при их барьерной синхронизации, сортировках, матричных операциях. Кроме того, перестановочный трафик часто имеет место в компьютерах типа Б1ЫБ или БРЫБ (отечественная

Самомаршрутизируемая иеблокируемая системная сеть

49

ПС2000). Решение коммутационной задача предполагает построение неблокируемой сети, т.е. сети с бесконфликтными каналами при перестановочном трафике. В рассматриваемой сети бесконфликтная перестановка пакетов осуществляется с некоторыми задержками, которые меньше чем в базовых работах [1,2].

В работах [1, 2] была развита методика построения неблоки-руемых отказоустойчивых дуальных фотонных системных сетей широкой масштабируемости. Изначально эти сети были ориентированы на применение в фотонных компьютерах [3], в которых требуются неблокируемые сети с прямыми каналами. Термин «фотонный» подчеркивает возможность построения сети с использованием чисто фотонных однокристальных коммутаторов и прямых каналов между источниками и приемниками без использования в каналах оптической регистровой памяти для промежуточной буферизации пакетов. Конечно, аналогичное построение электронных сетей с прямыми каналами также возможно при цифровом кодировании управляющей маршрутной информации. Такие сети являются системными сетями суперкомпьютеров, которые имеют наибольшее быстродействие.

В основе методики [1, 2] лежит применение в первом каскаде дуального коммутатора, неблокируемого на произвольном трафике. В дуальном коммутаторе сочетаются два способа разрешения конфликтов: шинный (с разведением конфликтующих сигналов во времени) и мультиплексный (с разведением сигналов по разным линиям). Это разведение применяется как к информационным сигналам, такт и к управляющим сигналам маршрутной информации, т.е. во всем частотном диапазоне. В р-канальном дуальном коммутаторе неблокиру-емость достигается посредством увеличения периода Т сигналов до р тактов, где такт задает длительность т информационного сигнала. На рисунках 1 и 2 представлены две модификации р-канального дуального коммутатора с р = 4 — первичного (ПКр) и расширенного (РКр).

В электронном дуальном коммутаторе вместо линий задержки (ЛЗ6) используются элементы задержки (ЭЗ6) равной длительности.

Эти дуальные коммутаторы состоят из пар мультиплексор-демуль-типлексор. Мультиплексор р в каждом входном канале имеет петлю обратной связи через линию задержки ЛЗ6 длительностью в 6 =1 такт. При конфликте сигналов в любом Мр один сигнал пропускается на выход, а остальные возвращаются на входы через свои ЛЗ6.

ПК4

Рисунок 1. 4-канальный первичный дуальный коммутатор ПК4 с маршрутизацией по 4 каналам

РК4

Рисунок 2. 4-канальный расширенный дуальный коммутатор РК4

Маршрутизация сигналов осуществляется демультиплексорами с использованием log2_p управляющих сигналов. В (фотонном коммутаторе управляющие сигналы передаются в одном такте с информационным сигналом на разных несущих; частотах. Е> электронном коммутаторе они передаются по разным линиям. В первичном коммутаторе ПКр разрешение кинфликтов ссуществляется только мультиплексором! шинным способом, а демультиплексор осуществляет толтко маршрутизацию сигналов. Расширенный коммутатор РКр выполняат марнфутизацию сигналов параллельно с разведением потенциально конфликтующих сигналов по разным каналам. Сетевые пакеты состоят из p-тактных разрядов. Каждош такой разряд имеет вид последовательности p отнатоктных информационных и управляющих сигналов с одинаковыми множествами последних во всех тактах, но возможно разных в одинаковых тактах в разных каналах после коммутаторов. Пусть

сигналы каждого разряда р разных пакетов поступают па разные входы дуального коммутатора синхронно в первом такте (рисунок 3). При ис-

Выходные сигналы

а

Входные сигналы

п п

п п

п п

Т I т | т т Т = 4т -

XI

XI

□ □_П П

XX

Л_О.

1 Р| I I Р

ал

(а) для ПКр

Входные сигналы

п П

п п

п и

и и

т | т | т | т

,- т = 4т -►

Выходные сигналы

^^ П-П-

п п п

а.

п-п-

г

р-р-р-р-

(б) для РКр

Рисунок 3. Распределение сигналов при р = 4

пользовании в мультиплексорах ЛЗ1 конфликтующие информационные сигналы разводятся по разным лактам вместе с сопровождающими их управляющими сигналами. Примеры возникающих распределений сиг-налос по периоду разряда на выходных линиях дуальнеео коммутатора приисдятся на рисунке 3а для П К4, а на рисунке 3б для РК4. Для ПКр имеет место разведение сигналов по всем р тактам разряда, а для РКр — толь ко по начальным тактам разряда. При этом е разных тактах для разных каналов используются разные наборы управляющих сигналов, которые при дальнейшей маршрутизации уже не участвуют.

В работах [1,2] представлена методика построения многокаскадных не блокируемых сьтей на основе рисширенного дуального коммутатора

РКр, в которых используются десятки частот для представления управляющей информации. Из них каждая порция в log2 р частот используется только однажды в своем каскаде, а передаются все они через все каскады. Таким образом, имеется большая избыточность в требуемой полосе пропускания управляющих сигналов. В работе решается задача сокращения требуемой полосы до минимума—до полосы, требуемой для передачи информационных сигналов и однократной передачи управляющих сигналов. Естественно делать это посредством передачи управляющей информации в заголовке пакета. Однако, при этом возникает принципиальная трудность привязки этой информации к номерам тактов, которые заранее неизвестны (см. рисунок 3). В работе эта трудность преодолевается посредством перехода от поразрядного представления управляющей информации к попакетному представлению, формируя пакетную дуальность.

В разделе 1 представляется метод построения пакетных дуальных коммутаторов с минимальной полосой пропускания, и рассчитываются их характеристики. В разделе 2 представляется базовый метод масштабирования числа каналов неблокируемых коммутаторов с пакетной дуальностью, и рассчитываются их характеристики. В разделе 3 рассматривается протокол маршрутизации для неблокируемых коммутаторов с пакетной дуальностью. В разделе 4 проводится сравнительный анализ характеристик разработанных коммутаторов как системных сетей. В Заключении подводится итог преобразования методики построения неблокируемых самомаршрутизируемых сетей [1,2] в проект работоспособной сети с сохранением ее исходных свойств, повышением быстродействия и радикальным сокращением полосы пропускания.

1. Пакетные дуальные коммутаторы

В неблокируемых сетях, разработанных в [1,2], в первом каскаде используется дуальный коммутатор РКр с ЛЗ1, а в остальных — обычный коммутатор с ЛЗ0. В этих сетях используется компонентная база, состоящая из дуальных коммутаторов и отдельных мультиплексоров и демультиплексоров. Для маршрутизации пакетов в такой многокаскадной сети могут использоваться десятки управляющих сигналов. При этом весь набор этих сигналов должен передаваться в одном такте с информационным сигналом в каждом разряде пакета. Иначе говоря, для маршрутизации пакетов используется широкий

Самомаршрутизируемая иеблокируемая системная сеть

53

набор управляющих сигналов, и для их передачи требуется достаточно широкая полоса пропускания. Требуемую полосу пропускания для управляющих сигналов можно существенно уменьшить, если использовать линии задержки ЛЗЗ (Э33) с длительностью пакета, где 3 = М, а М — это число разрядов каждого пакета и ТП = МТ, а Трт — длительность разряда. В этом случае весь набор управляющих сигналов можно передавать только один раз. Поэтому они могут быть переданы в заголовке каждого пакета. Такое представление управляющих сигналов существенно уменьшает необходимую полосу пропускания до величины, которая обеспечивает передачу информационных сигналов малой длительности т. При использовании длинных ЛЗТП задержка каждого конфликтного разряда пакета на р тактов заменяется на задержку каждого конфликтного пакета на время Тп. Иначе говоря, разрядный период р, выраженный в числе тактов, заменяется на пакетный период Т*, выраженный в числе повторных передач пакетов. Для дуального коммутатора ПКр разрядный период и пакетный период совпадают Т* = р, а для дуального коммутатора РКр пакетный период Т**, оказывается в среднем меньше р (см. рисунок 3)! Действительно, на произвольной перестановке пакетов их маршрутизация по разным каналам осуществляется с одинаковой частотой. Тогда среднее значение пакетных периодов Т**, полученное для РКр посредством имитационного моделирования, задается таблицей 1.

Таблица 1. Пакетные периоды для ПКр и РКр

р 2 3 4 5 6 7 8 9

Т* ПКр 2 3 4 5 6 7 8 9

Т** РКр 1,49 1,89 2,13 2,29 2,41 2,51 2,60 2,67

р 10 11 12 13 14 15 16

Т* ПКр 10 11 12 13 14 15 16

Т** РКр 2,75 2,82 2,88 2,93 2,99 3,03 3,08

Режим «пакетных» задержек требует, чтобы линии задержки в разных каналах задавались с точностью в один такт длительности т. Для длинных ЛЗТп требуемая точность может оказаться недостижимой. В этом случае неблокируемость дуальных коммутаторов можно обеспечить посредством установления соединений между процессорами-источниками пакетов и дуальным коммутатором первого каскада.

В простейшем дуальном коммутаторе по каждому входному каналу от источника необходимо иметь канал отдельный обратной связи (рисунок 4). По этому каналу передаются сигналы «свободно» и «занято». В начальный момент параллельной передачи пакетов по всем

СПК4

Рисунок 4. Простейший 4-канальный дуальный коммутатор с дополнительными каналами обратной связи (пунктир)

каналам передается «свободно». Если в мультиплексоре параллельно передаваемые пакетыпопадают в конфликт, то один из них пропускается на выход, а остальные блокируются на выходе мультиплексора. При этом по всем каналами передается «занято». Сигнал «свободно» по всем каналам обратной связи сновав передаелся после прохождения очередного пакета из мультиплексора в демультиплексор. В результате остальные источники повторно передают свои пакеты. В результате все р источников бесконфликтно передадут свои пакеты за Т* пакетных периодов. Вообще говоря, идея разрешения конфликтов посредством задержек их передачи не нова: например, она используется в методе ЯСМЛ/СБ для общего канала. Новизна данного подхода состоит в параллельномн разрешении конфликта только для небоношого числа пакетов, претендующих на передачу по сети через малые коммутаторы РКр, а не всех их как в общем канале, что существенно сокращает время разрешения конфликта. При этом время бесконфликтной передачи пакетов по сети складывается из времени разрешения конфликта и времени параллельной передачи бесконфликтных пакетов по прямым каналам.

К сожалению, разработанный ранее фотонный дуальный коммутатор [1,2] не может выдавать сигналы обратной связи без существенной своей переработки. Поэтому в дальнейшем рассматриваются только электронные коммутаторы.

В случае расширенного дуального коммутатора каждый демультиплексор для прохождения дополнительных каналов для соединений дополняется встречным мультиплексором (рисунок 5). Этот мультиплексор на выход пропускает сигналы «свободно» и «занято» только с того входа, на выход которого демультиплексор направил очередной пакет. В результате, как и в простейшем коммутаторе, все р источников бесконфликтно передадут свои пакеты через расширенный коммутатор за Т** пакетных периодов. Дополнительные схемы и каналы будут назывйться «схемами и каналамн обратной связи (ОС!)».

Будем оценивать коммутационную сложность дуальных коммутаторов в числе точек коммутации двумя характеристиками: Б для

СРК4

Рисунок 5. Расширенный 4-канальный дуальный коммутатор со схемами и каналами ОС (пунктир)

«чистых» дуальных коммутаторов, обозначаемых дальше как ДКр, не содержащих схем и каналов ОС, и ¿(* для коммутаторов СДКр, их содержащих. Тогда их коммутационная сложность задается (формулами

В методике [1,2] канальная отказоустойчивость неблокируемых сетей обеспечивается посредством использования дуальных коммутаторов с топологией квазиполных; графов— КПГ(Жх,р, а) [4]. Они строятся на основе р-канальных дуальных коммутаторов ДКр и дополнительного каскада демультиплексоров 1 х р и мультиплексоров р х 1. Дуальные коммутаторы КПГ(ИС1,р, а) имеют -Мор(_р — 1)/а + 1 каналов и являются неблокируемыми самомаршрутизируемыми коммутаторами на произвольных перестановках пакетов и обладают (а — 1)-канальной отказоустойчивостью. Для произтольных значений! р о а эти коммутаторы строятся переборными методами [4,5]. На рисунке 6 приводится пример КПГ(4, 3, 2) со схемами и каналами ОС (пунктир) для установления соединения с источниками.

К сожалению, отмеченные свойства дуальных КПГ(Жх,р, а) выполняются только для СДКр и ДКр, выполненных как коммутатор РКр. Дело в том, что коммутатор КПГ(Жх,р, а), выполненный на основе ПКр, оказывается блокируемым при ЭЗ1 на произвольных перестановках пакетов с сигналами в разных тактах разрядов [6]. Поэтому

(1):

(1)

ПКр : ¿И = 2р СПКр : X* = 3р

РКр : 5 = 3р С РКр : ¿Ь* = 3р2

СДК14

Рисунок 6. Дуальный 4-канальный коммутатор КПГ(4,3,2) со схемами и каналами ОС (штрих)

в дальнейшем рассматриваются только КПГ(Жх,р, а), выполненные на основе РКр. Предполагается, что СДКр уже оснащен схемами и каналами ОС (рисунки 4 и 5).

Кроме того, каждый внешний! демультиплексор для прохождения каналов ОС дополняется встречным мультиплексором (рисунок 6). Этот мультиплексор пропускает сигналы «свободно» и «занято» на выход только с того входа, на выход которого одноименный демультиплексор направил очередной пакет. Сигнал занято может появляться и в середине пакета, т.к. он только задерживает передачу следующего пакета. В результате, как и в дуальном коммутаторе, все р источников бесконфликтно передадут свои пакеты через расширенный коммутатор за тщ п акетных периодов.

Коммутатор КПГ(Жх ,р,а) будем также называть дуальным коммутатором СДКхЖь Дуальный СДКхЖхна базе КПГ(^,р, а) кроме канальной отказоустойчивости обеспечивает и начальное масштабирование числа каналов по сравнению с ДКр. Еще большего масштабирования числа каналов можно добиться при использовании коммутаторов с топологией квазиполных орграфов— КПОГ(ЛП,_р), где N = р2 (рисунок 7). Эти коммутаторы изоморфны двумерным обобщенным гиперкубам или двумерным обобщенным мультикольцам, и существуют при любых значениях р и не обладают канальной отказоустойчивостью.

Коммутатор на базе КПОГТЖх, р) будем также называть дуальным коммутатором СДКхЖх или ДКхЖх. Как и для КПГ(Жх,р,а),

Самомаршрутизируемая иеблокируемая системная сеть

57

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

СДК2

Рисунок 7. Дуальный 4-канальный коммутатор с топологией квазиполного орграфа КПОГ(4,2) со схемами и каналами ОС (штрих)

в дальнейшем рассматриваются только дуальные КПО Г(^,р), выполненные на основе РКр. Одинаковые обозначения на рисунках 6 и 7 означают, что их внутренняя структура в дальнейшем каскадировании коммутаторов не играет роли.

Неблокируемыь коммутаторы с -топологией квазиполных графов или орграфов в дальнейшем используются в двух форматах: уже представланный СДК^Л^ и такой! же коммутатор без схем и каналов ОС—ДКл^!. Для этих коммутаторов дополнительно к коммутационным сложностям $1 и оцениваются и канальные сложности Ь\ и выраженные в числе внутренних каналов. Они задаются формулами (2), где $ и $* — это сложности ДКр и СДКр.

(2)

ДК1^1 СДК1^1

$1 = ^(2р + $) = N1(3p + $ *)

Ь1 = N^2р Ь*1 = N12р

2. Базовое масштабирование числа каналов неблокируемых коммутаторов

Переход от коммутаторов СДКр к коммутаторам СДК^^ обеспечивает начальное масштабирование числа каналов неблокируемых коммутаторов. Дальнейшее масштабирование в методике [1,2] осуществляется базовым методом посредством построения сетей с обменными

связями и их внутренним распараллеливанием. Поясним базовый метод

Рисунок 8. Дуальный коммутатор СДКх2 на базе КПГ(2, 2, 2)

Из коммутаторов СДКх N строится 2-каскадная сеть с обменными связями СNN2 (рисунок 9), первыш каскад которой содержит N коммутаторов СДКЛ, а второй каскад— N коммутаторов ДКЛ без схем и каналов ОС.

Рисунок 9. Сеть с обменными связями СгА^г

Сеть С N2 имеет N2 Л2 каналов, но является блокируемой из-за конфликтов на отмеченны1х заливкой вылходныш мультиплексорах пурвого ксскада. На этих же мультиплексурах разрушается и канальная отказоус тойчиуость.

В сети С N2 маршрутизация пакетов осуществляется коммутаторами СДК.Л и ДКхЖ, а также демулвтиплекторами ДМЛ и МЛ1. Для этого они используют маршрутную информацию из заголовков пакетов, т.е. осуществляют снмомаршрутизацию пакетов. Протокола самомаршрутизации рассматривается в разделе 3.

Однако сеть С2 N2 можно преобразовать в неблокируемую сеть СК2^2С тем же числом каналов методом внутреннего распараллелива-ния[1,2]. В этом методе во второй каскад сети С2^ добавляется еще р—1 его копий. Все р копий нумеруются от 0 до р—1 . На рисунке 9 добавляется одна копия, т.к. в СДКЖх и ДКд^ р = 2. Затем г-й вход (0 < г < р—1) 3-го конфликтного мультиплексора (1< ] < N1) в к-ом СДКхЖх (1< к < N1) переключается к-й вход 3-го ДЦК1^21 в г-й копии второго каскада (рисунок 10). Сами же мультиплексоры перемещаются

Рисунок 10. Неблокируемый коммутатор СК2Ж2 с 1-канальной отказоустойчивостью

так, чтобы объединять одноименные выходы одноименных ДК1^ всех копий расширенного второго каскада. Все они вместе образуют неблокируемую схему первого измерения.

На входы всех неблокируемых коммутаторов ДКхЖх поступают пакеты разреженных перестановок, которые без конфликтов проходят на их выходы. При этом разные пути проходят через разные коммутаторы ДКхЖх, что обеспечивает неблокируемость и канальную отказоустойчивость всего коммутатора СК2^. В дальнейшем этот коммутатор будет использовать в двух форматах: как СК2^ (с соединительными схемами и каналами ОС) и как ^N2 (без таких схем и каналов).

Коммутатор СК2N2 мы называем 2-каскадным, т.к. он построен из двух каскадов дуальных коммутаторов с топологией квазиполных графов или орграфов. Коммутатор СК2^ содержит 4 слоя демульти-плексоров 1хр, управляющих маршрутизацией пакетов (2 внешних слоя и 2 слоя внутри дуальных коммутаторов) и 2 слоя выходных мультиплексоров р х 1. Сложности коммутаторов ^N2 и СК2^ задаются формулами (3).

^N2 : Я = N1^1 + р^Яь

¿2 = N^1 + + (р +

(3) СК2^ : Я* = +

¿2 = N1^ + р^^ + (р + 1№

Ниже в таблицах 2-4 приводятся характеристики неблокируемых коммутаторов СК2N2, рассчитанные по формулам (1)-(3).

Таблица 2. Характеристики коммутаторов СК2^ с 1-ка-нальной отказоустойчивостью

р N1 N2 N2 тг Ь*2

2 2 4 1,49 N3,70 N ,04

3 4 16 1,89 N2,69 N2!,24

4 7 49 2,13

5 11 121 2,29 ^2,2 4 N2",89

6 15 225 2,41 ^2Д9 ^84

7 21 441 2,51 N2",80

8 27 729 2,60 N1^

Масштабирование числа каналов можно продолжать описанным методом на основе уже построенных неблокируемых сетей СК2^ [2].

Таблица 3. Характеристики коммутаторов СК2Ж2 с 2-ка-нальной отказоустойчивостью

р N1 N2 N2 тт S2 ¿2

3 3 9 1,89 N2,60 N3,56

4 5 25 2,13 N2,21

5 7 49 2,29 N22,10

6 11 121 2,41 N2,77 N1,95

7 15 225 2,51 N2",89

8 19 361 2,60 ^74 Nl,86

Таблица 4. Характеристики коммутаторов СК2Ж2 без канальной отказоустойчивости

Р N1 N2 N2 тг S2 ¿2

2 4 16 1,49 N2,02

3 9 81 1,89 N!,78

4 16 256 2,13 N1^

5 25 625 2,29 N21,66

6 36 1296 2,41 N21,64

7 49 2401 2,51 ^.з1,88 N2",62

8 64 4096 2,60 мГ N!,61

Строится двухкаскадная сеть С4М1 с обменными связями, первый каскад которой состоит из N2 сетей СК2^, а второй —из N2 сетей К2^. Поэтому сеть С4^4 имеет N4' каналов. Сеть С4^4 является

блокируемой, т.к. она в первом каскаде содержит два слоя мультиплексоров р х 1, на которых возможны конфликты и разрушается канальная отказоустойчивость. Для применения метода внутреннего распараллеливания во второй каскад сети С4Ж4 добавляется р2-1 его копий. Описанным выше методом конфликтные мультиплексоры первого слоя используются для построения р неблокируемых схем первого измерения, но составленных уже из сетей СК2^ и ^N2. Конфликтные мультиплексоры второго слоя используются для их объединения в неблокируемую схему второго измерения, которая и составляет 2-й каскад неблокируемой сети СК4^, который сохраняет канальную неблокируемость исходных сетей СК2^ и ^N2. Все построения сети С4^ и доказательства ее неблокируемости и каналь-

ной отказоустойчивости приведены в [1,2]. Коммутатор СК4М1 мы называем 4-каскадным, т.к. он построен из четырех каскадов дуальных коммутаторов с топологией квазиполных графов или орграфов. Коммутатор СК4^4 содержит 8 слоев демультиплексоров 1 х р, управляющих маршрутизацией пакетов и 4 слоя выходных мультиплексоров р х 1. Сложности коммутаторов ^N4 и СК4^ задаются формулами (4).

(4)

^N4 : «4Ж2 = + р2N2^2 ^N2 = ¿2 + р2^2 + (1 + р + р2)^ СК4Ж4 : ^N2 = ^ + р2^^ ¿4N2 = Ь*2 + р2^Ь2 + (1 + р + p2)N4 Ниже в таблицах 5—7 приводятся характеристики неблокируемых коммутаторов СК4N4, рассчитанные по формулам (1)—(4).

Таблица 5. Характеристики коммутаторов СК4Ж4 с 1-ка-нальной отказоустойчивостью

р N2 N4 N2 7Т St ¿4

2 9 81 1,49

3 49 2 401 1,89 N22'04

4 169 28 561 2,13 N2'06 N21'87

5 441 194 481 2,29 N2-,96 N21'79

6 961 923 521 2,41 N2'93 N21'76

7 1 521 2 313 441 2,51 N2"'88

8 3 249 10 55 6001 2,60 м1'86 N21'70

Таблица 6. Характеристики коммутаторов СК4Ж4 с 2-ка-нальной отказоустойчивостью

р N2 N4 N2 т:* St ¿4

3 9 81 1,89 N ,31

4 25 625 2,13 N ,°б

5 49 2 401 2,29 N2'36 N21'97

6 121 14 641 2,41 <'8Б

7 225 50 625 2,51 N2 ' 23 N1'81

8 361 130 321 2,60 N2 ' 23 ^'79

Сравнение таблиц 2— 4 с таблицами 5— 7 показывает, что при квадратичном увеличении числа каналов 4-каскадных коммутаторов

Таблица 7. Характеристики коммутаторов СК4Ж4 без канальной отказоустойчивости

р N2 N4= N2 7Т St Ь4

2 16 256 1,49 N1,96 М1'82

3 81 6 561 1,89 N2"'66

4 256 65 536 2,13 N2,61

5 625 390 625 2,29

6 1 296 1 679 616 2,41 N1'™

7 2 401 5 764 801 2,51 N2'69 Ж2'66

8 4 096 16 777 216 2,60 N2"'69 N21,Б6

по сравнению с 2-каскаднми коммутаторами в них сохраняется период Т4*, канальная отказоустойчивость, но резко уменьшаются удельная коммутационная и канальная сложности. Последнее свойство впервые получено для 4-х каскадных неблокируемых самомаршрутизируемых коммутаторов. Масштабирование числа каналов можно продолжать еще дальше описанным методом на основе построенных неблокируемых сетей СК4^4. Строится двухкаскадная сеть Се N8 с обменными связями, первый каскад которой состоит из N4 сетей СК4^, а второй—из N4 сетей К4Ж4. Поэтому сеть С8Л8 имеет ЖвЖ^Ж!Ж8 каналов. Сеть является блокируемой, т.к. она в первом каскаде содержит четыре слоя мультиплексоров р х 1, на которых возможны конфликты и разрушается канальная отказоустойчивость. Для применения метода внутреннего распараллеливания во второй каскад сети С8Ж8 добавляется р4 — 1 его копий. Описанным выше методом конфликтные мультиплексоры первого слоя используются для построения р3 неблокируемых схем первого измерения, но составленных уже из сетей ^N4. Конфликтные мультиплексоры второго слоя используются для их объединения в р2 неблокируемых схем второго измерения. Конфликтные мультиплексоры третьего слоя используются для их объединения в р неблокируемых схем третьего измерения. Наконец, конфликтные мультиплексоры четвертого слоя используются для их объединения в неблокируемую схему четвертого измерения, которая и составляет второй каскад неблокируемой сете СК8^, которая сохраняет канальную неблокируе-мость исходных сетей в СК4^ и ^N4. Все построения сети С8^ и доказательства ее неблокируемости и канальной отказоустойчивости приведены в[1,2]. Коммутатор СК8^ мы называем 8-каскадным, т.к.

он построен из восьми каскадов дуальных коммутаторов с топологией квазиполных графов или орграфов. Коммутатор СК8Ж8 содержит 16 слоев демультиплексоров 1хр, управляющих маршрутизацией пакетов. Сложности коммутаторов К8Ж8 и СК8Ж8 задаются формулами (5).

СК8Ж8 : 58 = N454 + р4Ж454, (5) 8 4

ь*8 = + р4^4 + (1+ р + р2 + р3)Ж8

Ниже в таблицах 8-10 приводятся характеристики неблокируемых коммутаторов СК8N8, рассчитанные по формулам (1)-(5).

Таблица 8. Характеристики коммутаторов СК8Ж8 с 1-ка-нальной отказоустойчивостью

р N4 Мв-42 ТГ $8 ¿8

2 16 256 1,49 Ж22,48 -2,33

3 256 65 536 1,89 Ж22'03 -21,92

4 2 401 5 764 801 2,13 -2-,88 М2,79

5 14 641 2,14Е+08 2,29 -2-,82 -21,73

6 50 625 2,56Е+09 2,41 -2-,80 -2,71

7 194 481 3,78Е+10 2,51 М17 М2,68

8 531 441 2,82Е+11 2,60 ж2,7Б -21,67

Таблица 9. Характеристики коммутаторов СК8Ж8 с 2-ка-нальной отказоустойчивостью

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р N4 -8-42 Т88 $8 ¿8

3 81 6 561 1,89 -22Д4 Ж22,16

4 625 390 625 2,13 Ж2,10 Ж22,96

5 2 401 5 764 801 2,29 Ж22,09 Ж2,90

6 14 641 2,14Е+08 2,41 Ж2,00 Ж2,80

7 50 625 2,56Е+09 2,51 Ж2,98 -21,78

8 130 321 1,7Е+10 2,60 -21,97 ж2,75

Сравнение таблиц 5—7 с таблицами 8-10 показывает, что при квадратичном увеличении числа каналов 8-каскадных коммутаторов по сравнению с 4-каскаднми коммутаторами в них сохраняется период Т8 , канальная отказоустойчивость, но имеет место дальнейшее уменьшение удельной коммутационной и канальной сложностей.

Таблица 10. Характеристики коммутаторов СК8^ без канальной отказоустойчивости

р N4 N8= N4 п* ¿8

2 256 65 536 1,49 Ж1'74 N21,66

3 6 561 430 46 721 1,89 N1,65 Nl,58

4 65 536 4,29Е+09 2,13 Ж21,62 N2l,55

5 390 625 1,53Е+11 2,29 N1'61 N1'54

6 1 679 616 2,82Е+12 2,41 Nl,6o N2l,54

7 5 764 801 3,32Е+13 2,51 Nl,6o N2l,53

8 16 777 216 2,81Е+14 2,60 N2l,53

Последнее свойство впервые получено для 8-х каскадных неблокируемых самомаршрутизируемых коммутаторов.

3. Протокол передачи пакетов для дуальных неблокируемых коммутаторов с разным числом каскадов

Самомаршрутизация пакетов через коммутаторы СД-К^^или ДКхЖх с топологией КПГ(^,р, а) или КПОГ(^,р) осуществляется с использованием в заголовке пакета двух адресов А1 и А2 из log2 р-разрядных двоичных чисел. Адрес А1 используется для маршрутизации пакетов входным демультиплексором коммутаторов КПГ(^,р, а) или КПОГ(^,р). Адрес А2 используется для маршрутизации пакетов демультиплексором дуального коммутатора ДКр. Эти демультиплексоры осуществляют коммутацию пакетов по текущему адресу одновременно с его уничтожением, т.е. без дальнейшей передачи по каналам коммутатора. В результате каждый пакет покидает коммутаторы СДКхЖхили ДКх^х без адресов Ах и А2 в своем заголовке. Заголовок коммутатора СК2Ж2 содержит четыре таких адреса— Ах,1, А^, А2д, А2,2. Из них первые два используются коммутаторами СДК.^., а вторые два—коммутаторами Дй!^. Заголовок коммутатора СК4Ж4 содержит восемь таких адресов — А1;1, Ах,2, А2д, А2,2, А3д, А3,2, А4д, А4 2. Из них первые четыре используются коммутаторами СК2^, а вторые четыре —коммутаторами ^N2. Заголовок коммутатора СК8Ж8 содержит шестнадцать таких адресов— А1;1, А1;2, А2д, А2,2, Аз,1, Аз,2, А4,1, А4,2, Аб,1, Аб,2, Аб,1, Аб,2, Агд, Аг,2, А8,1, А8,2. Из них первые восемь используются коммутаторами СК4^, а вторые восемь — коммутаторами К4 N4.

4. Сравнительный анализ результатов

В построенной сети каждый разряд пакета имеет длительность в 1 сигнал-такт. Передача пакетов источниками ведется по прямым каналам за минимальное время. Возможные конфликты источников разрешаются посредством организации борьбы между ними за доступ к сети и повторных передач пакетов от источников, проигравших эту борьбу. Максимальное число повторных передач равно р, но в среднем оно значительно меньше при больших р (см. таблицу 1). Доступ к сети обеспечивается посредством организации соединений между источниками и первым каскадом сети за минимальное время. Сами конфликты возможны только в смежных группах по р источников в каждой. Внутри сети возникновение конфликтов предотвращается посредством ее внутреннего распараллеливания. В результате, произвольная перестановка реализуется бесконфликтно по сети за время последовательной передачи не более р пакетов. Близкими свойствами обладают перестраиваемые сети [8—10], в которых можно составить бесконфликтное расписание для каждой конкретной перестановки. Однако эти сети оказываются блокируемыми на произвольных перестановках.

В перестраиваемых сетях заблокированные пакеты повторно передаются после передачи бесконфликтных пакетов. В сетях с прямыми каналами повторные передачи осуществляются на основе установления соединений между источниками и приемниками и отсутствия подтверждения бесконфликтной передачи пакетов. Ожидание таких подтверждений занимает много больше времени, чем установление соединений в рассматриваемой сети. Кроме того, самих блокированных пакетов и повторных их передач может быть значительно больше вследствие возможности конфликтов не только между смежными источниками в группах. Сети с топологией обобщенных гиперкубов [11] в общем случае не являются даже перестраиваемыми сетями [12]. Однако их можно сделать перестраиваемыми посредством увеличения числа каналов в некоторых измерениях [13,14]. Кроме того, двумерные гиперкубы и мультикольца являются неблокируемыми самомаршрутизируемыми сетями [1, 2]. Они имеют топологию квазиполных орграфов в схемной базе коммутаторов р х р демультиплексоров р х 1 и мультиплексоров 1 х р. Они имеют малое число каналов N1 = р2 и коммутационную сложность больше сложности полного коммутатора, а также и существенно меньшую канальную сложность. Такую топологию имеют многоканальные коммутаторы УЛЕК и ЛО£ЕТТЛ[9,15-17]

Самомаршрутизируемая иеблокируемая системная сеть

67

в сетях Dragonfly и Slingshot. Сети с топологией квазиполных орграфов допускают масштабирование числа каналов с сохранением свойств неблокируемости и самомаршрутизируемости, но при быстро растущей схемной сложности. В частности, при одинаковом числе каналов их коммутационная сложность в несколько раз больше сложности построенных 2-каскадных сетей K2N2, на порядок больше сложности 4-каскадных сетей K4N4, и на несколько порядков больше сложности 8-каскадных сетей KsNs [2]. Близкими свойствами обладают сети с топологией квазиполных графов, изоморфных неполным уравновешенным

симметричным блок-схемам [18]. Они содержат N1 = --1)/а + 1

каналов и обладают свойством (а — 1)-канальной отказоустойчивости. Эти сети значительно хуже поддаются масштабированию [2].

В некотором смысле промежуточными свойствами обладают многокаскадные неблокируемые сети Клоза [19, 20]. Разработана их структура, но не предложено никаких процедур параллельной самомаршрутизации. Эти сети имеют элементную базу из квадратных коммутаторов N х N и трапециевидных коммутаторов N х 2N и 2N х N. Реализуем такой 5-каскадный коммутатор с использованием коммутатора YARK [9] с No = 64 каналами и коммутационной сложностью So = 642. Для реализации трапециевидного коммутатора 32 х 64 используется один коммутатор YARK, и он же используется для реализации 2-х квадратных коммутаторов 32 х 32.

В 3-каскадном варианте неблокируемого коммутатора входной и выходной каскады содержат N1 = 32 трапециевидных коммутаторов, хребет содержит 2Ni квадратных коммутаторов, все они содержат по 32 коммутатора YARK. 3-каскадный вариант имеет N3 = 1024

О дг1,86

канала и коммутационную сложность S3N3 .

В 5-каскадном варианте входной и выходной каскады содержит N3 трапециевидных коммутаторов, а хребет содержит 2Ni 3-каскадных коммутаторов. 5-каскадный вариант имеет N5 = 32—678 каналов и коммутационную сложность S5 = 2N3S0 + 2N1S3N51,6i. Таким образом, теоретический неблокируемый коммутатор Клоза при сравнимом числе каналов (см. таблицы 1 и 5) имеет сопоставимую сложность с неблоки-руемыми сетями K4N4 и К8N8 и несколько большее быстродействие. Однако он практически не реализуем из-за отсутствия процедур параллельной самомаршрутизации. Можно создать неблокируемые самомаршрутизируемые сети на любое число каналов с номинальным быстродействием. Они создаются посредством каскадирования сети

с топологией квазиполного графа (двумерного гиперкуба таблица 4). Однако эти сети имеют существенно большую коммутационную сложность. Так при одинаковом числе каналов они в несколько раз сложнее построенной 2-каскдной сети, на 1,5 порядка сложнее 4-каскадной сети и на 3 порядка сложнее 8- каскадной сети [2]. Автору не известны другие неблокируемые сети с прямыми каналами. В большинстве системных сетей передача пакетов осуществляется скачками с их буферизацией в узлах сети. Максимальное число скачков от источника до приемника задает диаметр сети. Подчеркнем, что в сетях с прямыми каналами передача пакетов осуществляется за один скачок, т.е. их диаметр равен 1. Известны сети с малым диаметром в 3 скачка. Это сети со структурой иерархии полных или квазиполных орграфов [15,16,21]. Известны простые системные сети с большими диметрами, измеряемых десятками скачков. Это сети со структурой многомерных торов [22-24], в частности это 3-мерная сеть ТО¥И с сотнями тысяч абонентов. Канальной отказоустойчивостью считается возможность сохранения полнодоступности сети при отказах каналов с сохранением ее исходных характеристик (неблокируемость сети, задержки передачи или диаметра сети). В чистом виде канальной отказоустойчивостью обладают, по-видимому, только сети с топологией квазиполных графов и построенные на них сети в [1,2].

В других сетях восстановление полнодоступности сети при отказах каналов достигается посредством ухудшения тех или них характеристик. Так, в перестраиваемой сети Клоза при отказах каналов нагрузка на оставшиеся каналы увеличивается, что увеличивает число конфликтов и увеличивает задержки передачи части пакетов. Аналогично для сетей со структурой обобщенных гиперкубов. В сетях с диаметром в 3 скачка [15-17] отказы каналов приводит к увеличению диаметра сети до 5 скачков. В сети ТОЕП обеспечение полнодоступности сети достигается посредством увеличения числа ее измерений до 6, а диаметра сети на 1 скачок. Таким образом, предложенные в данной работе сети при широкой масштабируемости обладают набором свойств, недостижимых ни в одной из известных сетей [25,26].

Заключение

В работе проведено воплощение методики построения неблокируе-мой самомаршрутизируемой сети широкой масштабируемости [1,2] в проект самой сети. В этой сети сведена к минимуму полоса пропускания, необходимая для передачи маршрутной информации. Эта

минимизации достигнута посредством перехода от разрядно-дуального способа разрешения конфликтов пакетов к пакетно-дуальному способу без изменения структуры сети. При пакетно-дуальном способе маршрутная информация передается однократно в заголовках пакетов в виде для каждого каскада в виде log2 р-разрядных двоичных чисел. При этом дуальность выражается в повторных передачах пакетов, конфликтующих в первом каскаде сети. Переход к пакетной дуальности осуществляется посредством увеличения элементов задержки в каналах обратной связи первого каскада до длины пакета данных. Трудности с реализацией длинных линий задержки с необходимой точностью привели к их исключению из сети и к реализации их функций борьбой конфликтующих источников за вход в сеть в процессе их соединения с ней. Разработана неблокируемая самомаршрутизируемая сеть широкой масштабируемости, обладающая канальной отказоустойчивостью. Она обеспечивает бесконфликтную передачу пакетов по прямым каналам при произвольных перестановках. Такая передача осуществляется после разрешения конфликтов источников в процессе их соединения с сетью за минимальное время из-за отсутствия тактовых задержек и сопровождается повторными передачами пакетов от проигравших борьбу источников. Число повторных передач не превосходит аналогичных передач в перестраиваемых сетях, но выполняется за меньшее время. Предложенная сеть выполнена в схемной базе малоканальных коммутаторов р х р, демультиплексоров 1 х р и мультиплексоров р х 1. Сеть имеет самоподобную структуру: бесконфликтная 8-каскадная сеть строится из параллельно включенных бесконфликтных 4-каскадных сетей, которые состоят из параллельно включенных бесконфликтных 2-каскадных сетей, составленных из параллельно включенных сетей с топологией квазиполных графов или орграфов. При этом во всех этих сетях возникновение повторных конфликтов предотвращается посредством их внутреннего распараллеливания. Предложенная сеть может работать в условиях любого трафика. Для этого достаточно, чтобы выходные мультиплексоры пропускали только один из входных пакетов, а остальные блокировали. При этом повторная передача блокированных пакетов должна осуществляться источниками за большее время, на основе уже следующего второго уровня соединений межу источниками и приемниками как в перестраиваемых сетях. При этом задержки передачи пакетов в построенной сети станут сопоставимыми с задержками в перестраиваемых сетях [9,10]. Характеристики построенных сетей рассчитаны для случай синхронной

передачи пакетов одинаковой длительности. Однако предложенная сеть, функционирующая на основе соединений источников с сетью, остается работоспособной и в случае асинхронных передач пакетов разной длительности . Однако возможен другой вариант функционирования предложенной сети — как распределенного вычислителя с выполнением функций АЛУ выходными мультиплексорам на основе методики вычислений в общем канале (ВОК) [27]. Построение сети с такими функциями — это следующая задача автора.

Список литературы

[1] Барабанова Е.А., Вытовтов К. А., Подлазов В. С. Неблокируемые отказоустойчивые двухкаскадные дуальные фотонные коммутаторы // Проблемы управления.-2021.-№ 4.-с. 82-92. I ' 4в 51 52 54 55 57 62 66 68

[2] В. С. Подлазов Неблокируемые отказоустойчивые дуальные фотонные коммутаторы широкой масштабируемости // Пробл. управл.- 2021.-№ 5.- С. 70-87. I ' 49 51 52 54 55 57 60 62 66 67 68

[3] Stepanenko S. Structure and Implementation Principles of a Photonic Computer jj EPJ Web of Conferences.- 2019,- Vol. 224,- 04002,- 7 pp. I 149

[4] Каравай М. Ф., Подлазов В. С. Метод инвариантного расширения системных сетей многопроцессорных вычислительных систем. Идеальная системная сеть // Автомат, и телемех.- 2010.- № 12.- с. 166-177. g] ] 55

[5] Каравай М. Ф., Подлазов В. С. Расширенные блок-схемы для идеальных

системных сетей // Пробл. управл.- 2012.- № 4.- с. 45-51. gl 55

[6] Барабанова Е. А., Вытовтов К. А., Подлазов В. С. Многокаскадные коммутаторы для оптических и электронных суперкомпьютерных систем // Материалы 8-го Национального Суперкомпьютерного Форума, НСКФ-2019 (26-29 ноября 2019 года, ИПС имени А.К. Айламазяна РАН, Переславль-Залесский, Россия). ^55

[7] Newman P. Fast 'packet switching for integrated services, A dissertation submitted for the degree of Doctor of Philosophy.- Wolfson College, University

of Cambridge.- 1988,- 159 pp. ¡uFu)t

[8] Pipenger N. On rearrangeable and non-blocking switching networks // J. Comput. Syst. Sci.- 1978,- Vol. 17,- No. 2,- pp. 145-162. I ' 66

[9] Scott S., Abts D., Kim J., Dally W. The Black Widow High-radix Clos Network // Proc. 33rd Intern. Symp. Сотр. Arch., ISCA'2006 (17-21 June 2006, Boston, MA, USA).- IEEE.- 2006,- ISBN 0-7695-2608-X.-pp. 16-28. tee 67 69

[10] Mellanox OFED for Linux User Manual, Rev 2.3-1.0.1.- Melanox Technologies, Ltd..-2014,-208 pp. URL ее 69

[11] Bhuyan L. N., Agrawal D. P. Generalized hypercube and hyperbus structures for a computer network // IEEE Trans. on Computers.- 1984.- Vol. C-33.- No. 4.-pp. 323-333. ее

[12] Lubiw A. Counterexample to a conjecture of Szymanski on hypercube routing // Inform. Proc. Let.- 1990,- Vol. 35,- No. 2,- pp. 57-61. 66

[13] Gu Q.-P., Tamaki H. Routing a permutation in hypercube by two sets of edge-disjoint paths // J. of Parallel and Distributed Comput.- 1997.- Vol. 44.-

No. 2,- pp. 147-152. 66

[14] Efe K. A variation on the hypercube with lower diameter // IEEE Trans. Computers.- 1991,- Vol. 40,- No. 11,- pp. 1312-1316. A ' 66

[15] Alverson В., Froese E., Kaplan L., Roweth D. Cray® XC™ Series Network, WP-AriesOl-1112.- Cray Inc..— 28 pp. url, ее 68

[16] Kim J., Dally W. J., Scott S., Abts D. Technology-driven, highly-scalable dragonfly topology // Proceedings of the 35th annual International Symposium on Computer Architecture, ISCA 2008 (21-25 June, 2008, Beijing, China.).-2008.- ISBN 978-0-7695-3174-8.-pp. 77-88. I ' 66 68

[17] De Sensi D., Di Girolamo S., McMahon K. H., Roweth D., Hoefler T. An

in-depth analysis of the slingshot interconnect-.- 2020.- 13 pp. arXivfeJ 2008.08886 [cs.DG] 66 68

[18] Холл М. Комбинаторика, Главы 10-12.- M.: Мир.- 1970.- 424 с. 67

[19] Clos C. A study of non-locking switching networks // Bell System Tech. J.-1953,- Vol. 32,- No. 2,- pp. 406-424. i 67

[20] Бенеш В. Э. // Математические основы теории телефонных сообщений, М.: Связь.- 1968.- с. 83-150. t67

[21] Arimili B., Arimilli R., Chung V., Clark S., Denzel W., Drerup B., Hoefler T., Joyner J., Lewis J., Li J., Ni N., Rajamony R. The PERCS high-performance interconnect // HOTI '10: Proceedings of the 2010 18th IEEE Symposium on High Performance Interconnects (18-20 August 2010, Mountain View, CA, USA).-2010.- ISBN 978-0-7695-4208-9.-pp. 75-82. J 68

[22] Alverson R., Roweth D., Kaplan L. The Gemini system interconnect // HOTI '10: Proceedings of the 2010 18th IEEE Symposium on High Performance Interconnects (18-20 August 2010, Mountain View, CA, USA).- 2010,- ISBN 978-0-7695-4208-9.- pp. 83-87. 68

[23] Stegailov V., Agarkov A., Biryukov S., Ismagilov T., Khalilov M., Kondratyuk N., Kushtanov E., Makagon D., Mukosey A., Semenov A., Simonov A., Timofeev A., Vecher V. Early performance evaluation of the hybrid cluster with torus interconnect aimed at molecular dynamics simulations // PPAM 2017: Parallel Processing and Applied Mathematics, Lecture Notes in Computer Science.- vol. 10777, Cham: Springer.- 2017.- ISBN 978-3-319-78023-8.- pp. 327-336. 68

[24] Ajima Y., Inoue T., Hiramoto Sh., Shimiz T. Tofu: Interconnect for the K computer // FUJITSU Sci. Tech. J.- 2012.- Vol. 48.- No. 3.- pp. 280-285. ®tes

[25] Flajslik M., Borch E., Parker M. A. Megafly: A topology for exascale systems // ISC High Performance 2018: High Performance Computing, Lecture Notes in Computer Science - vol. 10876, Cham: Springer - 2018.- ISBN 978-3-319-92039-9.- pp. 289-310. ^68

[26] De Sensi D., Di Girolamo S., Ashkboos S., Li Sh., Hoefler T. Flare: flexible in-network allreduce // SC '21: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (14-19 November, 2021, St. Louis, Missouri, USA), New York: ACM.- 2021.- ISBN 978-1-4503-8442-1.- 16 pp. d |68

[27] Прангишвили И. В., Подлазов В. С., Стецюра Г. Г. Локальные микропроцессорные вычислительные сети, Гл. 6.- М.: Наука.- 1984.- 175 с.

Поступила в редакцию 05.05.2022;

одобрена после рецензирования 11.07.2022;

принята к публикации 19.09.2022.

Рекомендовал к публикации д.ф.-м.н. С. A. Амелькин

Информация об авторе:

Виктор Сергеевич Подлазов Д. т.н., гл.н.с. Института проблем управления им. В.А. Трапезникова РАН, научные интересы: архитектуры интерконнекта и маршрутизация в суперкомпьютерных системах

¡ТО 0000-0002-9175-1138

e-mail: podlazov@ipu.ru

podlazov@gmail.com

Автор заявляет об отсутствии конфликта интересов.

ISSN 2079-3316 PROGRAM SYSTEMS: THEORY AND APPLICATIONS vol. 13, No4(55), pp. 47-76

Research Article hardware and software for supercomputers

UDC 004.724.2 + 004.272.43

10.25209/2079-3316-2022-13-4-47-76

Multichannel non-blocking system area network with

direct channels

Viktor Sergeevich Podlazov

V. A. Trapeznikov Institute of Control Sciences of RAS, Moscow, Russia

podlazov@ipu.ru (learn more about the author in Russian on p. 72)

Abstract. An unblockable non-blocking self-routing network with direct channels has been developed, in which packet conflicts are resolved at the entrance to the network by the procedure of connecting sources to the first cascade of the network , providing a packet duality. Packets blocked during conflict resolution are retransmitted by sources with minimal delays. Within the network, the occurrence of conflicts is prevented by means of parallelization of the network itself. The network is designed in 2-, 4- and 8-stage versions with scaling of the number of channels from several hundred to many millions, keeping the same network performance. The network can provide 1- or 2-channel fault tolerance at the same link rate. The overhead cost of achieving these properties is higher complexity of the network, that becomes comparable to the complexity of the theoretical non-blocking Clos switch, which has no known practical implementation.The purpose of the proposed networks is photonic networks with routing information transmission in packet headers represented as one-time-use binary numbers. The proposed networks are made in an extended circuit basis, consisting of switches and separate multiplexers and demultiplexers. The paper presents the characteristics of the constructed networks with the specified method of presenting routing information. (In Russian).

Key words and phrases: dual switch, packet duality, multiplexers and demultiplexers, multi-stage switch, conflict-free self-routing, non-blocking switch, static self-routing, quasi-complete digraph, quasi-complete graph, switching properties, direct channels, scalability and speed

2020 Mathematics Subject Classification: 65Y05; 68Q10

For citation: Viktor S. Podlazov. Multichannel non-blocking system area network with direct channels // Program Systems: Theory and Applications, 2022, 13:4(55), pp. 47-76. (In Russian). http://psta.psiras.ru/read/ psta2022_4_47-76.pdf

© Podlazov V. S.

2022

References

[1] E. A. Barabanova, K. A. Vytovtov, V. S. Podlazov. "Non-blocking fault-tolerant two-stage dual photon switches", Control Sciences, 2021, 110. 4, pp. 67-76. 49 51 52 54 55 57 62 66 68

[2] V. S. Podlazov. "Non-blocking fault-tolerant dual photon switches with high scalability", Control Sciences, 2021, 110. 5, pp. 61-76. i ' 49 51 52 54

55, 57, 60, 62, 66, 67, 68

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[3] S. Stepanenko. "Structure and Implementation Principles of a Photonic Computer", EPJ Web of Conferences, 224 (2019), 04002, 7 pp. I 149

[4] M. F. Karavay, V. S. Podlazov. "An invariant extension method for system area networks of multicore computational systems. An ideal

system network", Autom. Remote Control, 71:12 (2010), pp. 2644-2654.

d Î55

[5] M. F. Karavay, V. S. Podlazov. "Expanded block-diagrams for "ideal"

system area networks", Automation and Remote Control, 74:12 (2013), pp. 2180-2188. 55

[6] Ye. A. Barabanova, K. A. Vytovtov, V. S. Podlazov. "Multistage switches for optical and electronic supercomputer systems", Materialy 8-go Natsional'nogo Superkomp'yuternogo Foruma, NSKF-2019 (26-29 noyabrya 2019 goda, IPS imeni A.K. Aylamazyana RAN, Pereslavl'-Zalesskiy, Rossiya) (in Russian).^55

[7] P. Newman. Fast packet switching for integrated services, A dissertation submitted for the degree of Doctor of Philosophy, Wolfson College, University of Cambridge, 1988, 159 pp. (url)î

[8] Pipenger N.. "On rearrangeable and non-blocking switching networks", J. Comput. Syst. S ci., 17:2 (1978), pp. 145-162. ee

[9] S. Scott, D. Abts, J. Kim, W. Dally. "The Black Widow High-radix Clos Network", Proc. 33rd Intern. Symp. C'omp. Arch.., ISCA'2006 (17-21 June 2006, Boston, MA, USA), IEEE, 2006, isbn 0-7695-2608-x, pp. 16-28.

^66, 67, 69

[10] Mellanox OF ED for Linux User Manual, Rev 2.3-1.0.1, Melanox Technologies, Ltd., 2014, 208 pp. (urn) ee 69

[11] L. N. Bhuyan, D. P. Agrawal. "Generalized hypercube and hyperbus

structures for a computer network", IEEE Trans, on Computers, C-33:4 (1984), pp. 323-333. ee

[12] A. Lubiw. "Counterexample to a conjecture of Szymanski 011 hypercube routing", Inform. Proc. Let., 35:2 (1990), pp. 57-61. ee

Multichannel non-blocking system area network

75

[13] Q. -P. Gu, H. Tamaki. "Routing a permutation in hypercube by two sets of edge-disjoint paths", J. of Parallel and Distributed Com,put., 44:2 (1997), pp. 147-152. ee

[14] Efe K.. "A variation on the hypercube with lower diameter", IEEE Trans. Computers, 40:11 (1991), pp. 1312-1316. d - 6e

[15] B. Alverson, E. Froese, L. Kaplan, D. Roweth. Cray© XCl™ Series Network, WP-AriesOl-1112, Cray Inc., 28 pp. @ ee es

[16] J. Kim, W. J. Dally, S. Scott, D. Abts. "Technology-driven, highly-scalable dragonfly topology", Proceedings of the 35th annual International

Symposium on Computer Architecture, ISCA 2008 (21-25 June, 2008, Beijing, China), 2008, isbn 978-0-7695-3174-8, pp. 77-88. t66 68

[17] De Sensi D., Di Girolamo S., K. H. McMahon, D. Roweth, T. Hoefler.

An in-depth analysis of the slingshot interconnect, 2020, 13 pp. arXivji

2008.08886 [cs.DG] 66 68

[18] M. Jr. Hall. Combinatorial Theory, Blaisdell Publishing Company, Waltham-Toronto-London, 1967, isbn 978-0471315186, 310 pp. 67

[19] C. Clos. "A study of non-locking switching networks", Bell System Tech. J., 32:2 (1953), pp. 406-424. 67

[20] V. E. Benes (ed.). Mathematical Theory of Connecting Networks and Telephone Traffic, Mathematics in Science and Engineering, vol. 17, Bell Telephone Laboratories. Academic Press, New York-London, 1965, isbn 9780080955230, 319 pp.1~67

[21] B. Arimili, R. Arimilli, V. Chung, S. Clark, W. Denzel, B. Drerup, T. Hoefler, J. Joyner, J. Lewis, J. Li, N. Ni, R. Rajamony. "The PERCS high-performance interconnect", HOTI '10: Proceedings of the 2010 18th IEEE Symposium, on High. Performance Interconnects (18-20 August 2010, Mountain View, CA, USA), 2010, isbn 978-0-7695-4208-9, pp. 75-82. t68

[22] R. Alverson, D. Roweth, L. Kaplan. "The Gemini system interconnect", HOTI '10: Proceedings of the 2010 18th IEEE Symposium on High

Performance Interconnects (18-20 August 2010, Mountain View, CA, USA), 2010, isbn 978-0-7695-4208-9, pp. 83-87. 68

[23] V. Stegailov, A. Agarkov, S. Biryukov, T. Ismagilov, M. Khalilov, N. Kondratyuk, E. Kushtanov, D. Makagon, A. Mukosey, A. Semenov, A. Simonov, A. Timofeev, V. Vecher. "Early performance evaluation of the hybrid cluster with torus interconnect aimed at molecular dynamics simulations", PPAM 2017: Parallel Processing and Applied Mathematics, Lecture Notes in Computer Science, vol. 10777, Springer, Cham, 2017, ISBN 978-3-319-78023-8, pp. 327-336. 68

[24] Y. Ajima, T. Inoue, Sh. Hiramoto, T. Shimiz. "Tofu: Interconnect for the Iv computer", FUJITSU Set. Tech. J., 48:3 (2012), pp. 280-285. % es

[25] M. Flajslik, E. Borch, Parker M. A.. "Megafly: A topology for exascale systems", ISC High Performance 2018: High Performance Computing, Lecture Notes in Computer Science, vol. 10876, Springer, Cham, 2018, ISBN 978-3-319-92039-9, pp. 289-310. 68

[26] De Sensi D., Di Girolamo S., S. Ashkboos, Sh. Li, T. Hoefler. "Flare: flexible in-network allreduce", SC '21: Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (14-19 November, 2021, St. Louis, Missouri, USA), ACM, New York, 2021, ISBN 978-1-4503-8442-1, 16 pp. t68

[27] I. V. Prangishvili, V. S. Podlazov, G. G. Stetsyura. Local Microprocessor Computer Networks, Ch. 6, Nauka, M., 1984 (in Russian), 175 pp.170

i Надоели баннеры? Вы всегда можете отключить рекламу.