Оценка современных возможностей полностью оптической обработки на примере шифратора DES
Ключевые слова: Логический элемент, нелинейная волоконная оптика, полностью оптическая обработка, полупроводниковый оптический усилитель, шифратор.
Кузнецова О.В.
Сперанский В.С.
Рассматриваются вопросы создания устройств полностью оптической обработки информации. Приводится обзор элементной базы, позволяющей реализовать логические функции на основе нелинейных эффектов в веществе. В качестве модельной задачи выбран шифратор на основе алгоритма DES, так как данный алгоритм содержит несколько типов операций, позволяющих оценить эффективность вычислительной системы, а именно: стандартные логические операции, нестандартные линейные операции (перестановки) и нелинейные операции (подстановки с использованием S-блоков). Для наиболее сложной операции подстановки рассмотрено несколько способов ее реализации, позволяющих отказаться от использования запоминающих устройств, так как на сегодняшний день не существует эффективного способа реализации оптической памяти. Для всех типов операций оценка затрат на их реализацию приведена как оценка требуемого количества полупроводниковых оптических усилителей, поскольку они являются наиболее дорогостоящими элементами. Получены приблизительные оценки производительности и стоимости оптического шифратора. Для сравнения приведены приблизительные оценки производительности и стоимости одного шифратора DES, реализованного на современных ПЛИС. Рассматриваются возможные пути повышения эффективности создания оптических устройств на основе развития технологий нелинейной волоконной оптики и фотонных интегральных схем.
В той же работе приводится способ применения SOA для построения элемента AND (рис. 2).
Примеры реализации XOR на базе полупроводниковых оптических усилителей были приведены в работах [3] (рис. 3) и [4] (рис. 4).
В 2009 г. было сообщено об эксперименте [5] по реализации логической функции OR/NOR на основе перекрестной фазовой модуляции (рис. 5). Выбор режима работы (OR или NOR) осуществлялся настройкой параметров оптического фильтра и генератора дифференциальной групповой задержки.
В эксперименте 2010 г. [6], демонстрирующем функцию XOR, был использован интерферометр Маха-Цандера, в каждом из плеч которого был встроен участок SOI (Silicon-on-Insulator, кремний на диэлектрике) волновода. Также известно о применении таких волноводов для создания устройств, реализующих функции AND и NOR. Таким образом, приведенные эксперименты доказывают воз-
Введение
В последние годы большое развитие получили оптические технологии передачи информации. Уже сейчас появились средства передачи потока 100 Гбит/с на одной длине волны (в одном спектральном канале). Возможность "разместить" в одном волокне несколько десятков спектральных каналов 100 Гбит/с позволяет добиться пропускной способности в несколько Тбит/ с. Коммерческие системы DWDM, поддерживающие последовательную передачу 100-гига-битных потоков, уже предлагаются ведущими мировыми производителями телекоммуникационного оборудования, такими как Alcatel-Lucent, Ciena, Huawei, Infinera и ZTE [1].
Одновременно с этим наблюдается бурный рост исследований, направленных на существенное сокращение или полное устранение необходимости оптоэлектронного преобразования, т.е. на создание полностью оптических сетей. Это связано с появлением новых типов лазеров, усилителей, применением нанотехнологий и развитием нелинейной волоконной оптики.
Приблизительно в 2000 г. в развитии нелинейной волоконной оптики начался новый этап [2]. Были разработаны новые типы волокон с высокими нелинейными характеристиками. Исследования нелинейных эффектов позволили найти для оптических технологий много новых практических применений помимо традиционного использования их в телекоммуникациях, как например, оптическая когерентная томография, высокоточная частотная метрология и сверхбыстрая обработка сигналов.
Таким образом, сегодня появились возможности для создания не только полностью оптических сетей передачи данных, но и для полностью оптической обработки информации.
Элементная база для оптической обработки информации
В результате многих экспериментов была показана возможность реализации различных логических функций на базе полупроводниковых оптических усилителей (Semiconductor optical amplifier, SOA). В работе [3] приводится пример использования SOA для построения элемента NOR (рис. 1), являющегося функционально полной системой булевых функций. В приведенной схеме входные сигналы In0 и In1 поступают на длинах волн ^ и ^ соответственно. После прохождения усилителя результат вычисления функции NOR получен на длине волны пробного гармонического сигнала ^3.
Рис. 2. Элемент AND на базе SOA
Рис. 3. Элемент XOR на базе SOA
Рис. 5. Логический элемент с режимами работы OR/NOR можность создания базисных наборов логических функций (NAND, NOR, XOR-AND-1), а следовательно, возможность реализации на их основе любых логических функций и выполнение полностью оптической обработки информации.
Постановка задачи
Для оценки затрат на решение практических задач обработки информации при помощи оптических устройств на основе современных технологий решено было выбрать реализацию шифратора по известному алгоритму DES. DES хорошо подходит для модельных задач, позволяющих провести оценку эффективности вычислительной системы, так как содержит:
- нестандартные линейные операции (перестановки) в данную группу входят перестановки битов без изменения их количества, а также перестановки со сжатием и перестановки с расширением;
- логические операции (сложение по модулю два) данная операция выполняется дважды в каждом раунде DES, для 32 и 48 разрядов;
- нелинейные операции - подстановки с использованием S-блоков (таблиц Sk, к = 1^8.)
Для оценки затрат на реализацию операций алгоритма DES сделаем некоторые допущения:
- пусть число входов логического элемента на базе SOA равно двум,
- пусть имеется набор логических элементов AND, OR, XOR на базе SOA,
- инвертирование разряда производится при помощи SOA (например, использование функции NOR),
- пусть обработка данных производится параллельно, т.е. например, для 32 разрядного слова используется 32 отдельных оптоволокна,
- пусть обработка данных производится конвейерным способом, т.е. выход одного блока является входом для последующего.
SOA являются наиболее дорогими элементами среди используемых в экспериментах (стоимость одного такого усилителя на сегодняшний день может превышать 1000 долларов США), поэтому при оценке затрат на реализацию шифратора за основу принимается необходимое количество SOA Перестановки
Параллельная реализация алгоритма предполагает, что для передачи n битов блока используется n оптоволокон, поэтому перестановки могут быть осуществлены при помощи перестановок оптоволокон без использования полупроводниковых оптических усилителей. Сложение по модулю два
Будем считать согласно сделанным допущениям, что реализация сложения по модулю два для одноразрядных операндов потребует одного элемента XOR. Тогда для 16 раундов DES понадобится 1280 элементов XOR.
Операция подстановки с использованием S-блоков Операция подстановки является нелинейным преобразованием и представляет собой наиболее сложную часть алгоритма DES.
Суть операции подстановки состоит в том, что 48-битовый блок шифруемого текста разбивается на восемь 6-битовых блоков, каждый из которых адресует элемент соответствующей этому 6-битовому блоку таблицы! Sk,^' — 1,8 Элементы! таблиц Sk являются 4-битовы1-ми числами. Таким образом, 48-битовый блок заменяется 32 битовым.
В простейшем случае таблица Бк может рассматриваться как память, адресуемая при помощи 6-битовых слов. Однако на сегодняшний день не ро1апгег оя/мсж существует эффективного способа реализации оп-I— '"•> - тической памяти.
Будем рассматривав каждым 6-битовы1Й блок А5А4А3А2А1 Ао как сщрес. Очевидно, что существует однозначное соответствие между адресом и элементом таблицы Бк. Можно представить процесс получения значения элемента таблицы! Бк следующим образом. Пусты каждым элемент таблицу' = Д)63 , представлен набором
из четырех оптических л|-0^СО’ , постоянно передаю-
щих значение этого элемента. Каждый дискретный момент времени один из минтермов т,к функции от 6 аргументов А5А4А3А2А1А0 принимает значение "1", а все осталыныю равны! нулю:
(1)
Каждому минтерму поставлен в соответствие один из элементов таблицы Бк. Значение минтерма подается на вентиль, обеспечивая передачу на выход того элемента таблицы Бк, для которого значение минтерма оказалось равным "1".
По сути, данная схема представляет собой дешифратор, выходы! которого управляют выбором одного из элементов таблицы Бк.
Очевидно, что каждый из четырех разрядов Qjk выхода таблицы Бк может быть описан при помощи логических функций без применения запоминающих устройств:
где
А€ґ\ = п*ҐЛ » (3)
Развитием данного способа являются:
а) представление полученных логических функций в виде полинома Жегалкина;
б) использование методов минимизации.
Данная схема может быть упрощена за счет того, что каждая строка таблицы Sk содержит значения от 0ю до 15ш, отличающиеся лишь порядком. Поэтому можно рассматривать обращение к таблице Sk следующим образом: четыре адреса, конкретные для каждой из k таблиц, адресуют одно значение из диапазона 010 .. 15ю. Тогда:
(4)
(5)
(6)
где
1Vf.k = т£ + mf — — m*, h, l,s, t Є [0,63].
Можно представлять данную схему как полный дешифратор, выходы которого группируются определенным образом, собственным для каждой таблицы Sk.
Д ешифратор на базе логических элементов
Схема адресации элемента таблицы Sk при помощи дешифратора для варианта использования четырех адресов для получения одного значения из диапазона О10.. 15ig представлена на рисунке 6.
Схема содержит дешифратор адреса, выходы которого управляют переключением адресных вентилей, пропускающих или нет на выходы R,k соответствующих разрядов значений из диапазона О10.. 15іо. Разряды в соответствии со своим порядком приходят на четыре схемы OR (блок 16_ИЛИ на рисунке 6), в результате на выходе каждой схемы формируется один разряд адресуемого в таблице Sk элемента.
Таблица 1
Затраты на реализацию двух типов дешифраторов
Тип дешифратора Лиисинми Каскадный
Кол-во элементов _1*!я выполнения инверсий разрядов 6 6
Кол-во элементов для реализации схемы дешифратора 256 124
Рис. 6. Получение значения элемента таблицы Бк при помощи полного дешифратора
Таблица 2
Затраты на реализацию подстановок на базе линейного дешифратора
ЛЬ п/п Плок Количество логических элементов В одной таблице Кк Количество логических элементовНОДНОМ раунде Общее количество логических элементов в 16 раундах
1 Дешифратор адреса
1.1 Выполнение шшерсий 6 48 768
1.2 Схема дешифратора 256 2048 32768
7 16 блоков 4 ИЛИ 48 384 6144
3 Адресный вентиль 64 512 8192
4 4 блока 16 ИЛИ 60 480 7680
5 ХОК для 48 разрядов - 48 768
6 ХОК для 32 разрядов - 32 512
Итого в 16 раундах 56832
Таблица 3
Затраты на реализацию подстановок на базе каскадного дешифратора
Разновидностями дешифраторов являются линейные и каскадные дешифраторы. На входы логических элементов линейного дешифратора подаются все возможные комбинации прямых и инверсных значений разрядов входного слова.
Если разрядность входного слова больше максимально возможного числа входов логического элемента используемой элементной базы, то реализуется каскадная схема [7]. На каждом уровне каскада вычисляются частичные выходные значения как конъюнкции частичных выходных значений предыдущего уровня каскада и одного из разрядов, не участвовавших в образовании предыдущих частичных значений.
Затраты на реализацию каждого типа дешифраторов соответственно приведены в таблице 1.
Так как четыре адреса соответствуют одному из шестнадцати значений таблицы Бк, необходимо провести "упрощение" схемы, т.е. сгруппировать четыре адреса, соответствующие одному значению из диапазона 0іо .. 1510 при помощи 4-входовы1х элементов ОР (блок 4_ИЛИ на рисунке 7). На рисунке 7 такое преобразование адресов представлено для таблицы Б1.
Реализация 4-входового блока 4_ИЛИ выполняется при помощи трех двухвходовых элементов ОР на базе БОА.
Для реализации одного адресного вентиля потребуется четыре элемента АЫР и 64 элемента АЫР для всех значений таблицы Бк.
Блок16_ИЛИ потребует 15 элементов ОР, соответственно, для таблицы! Бк потребуется 60 элементов ОР.
Количество БОА, требуемое для реализации подстановки на базе двух типов дешифраторов приведено в таблицах 2 и 3.
Полиномы Жегалкина
Согласно теореме Жегалкина любая булева функция от п аргументов может быть представлена в виде канонического полинома Жегалкина, имеющего вид:
где коэффициенты! А = {, ■ .
Затраты на получение значения элементов таблиц Бк на основе полиномов Жегалкина как функций от шести аргументов приведены в таблице 4.
Следует отметить, что многие коэффициенты для таблиц Бк будут равны нулю, поэтому реальная схема должна быть значительно проще.
Использование техники "ВИзііее ОЕЭ"
Одним из способов минимизации функций является метод каскадов. Он заключается в том, что любая функция f от п аргументов может быть представлена как:
(8)
Продолжая преобразования, можно прийти к функциям двух аргументов.
Используя минимизацию при помощи метода каскадов, можно значительно сократить количество логических элементов, необходимое для реализации. Идея
данного метода лежит в основе т.н. реализации РЕБ на основе техники "ВЫюе". Результаты одной из наилучших реализаций "ВЫюв РЕБ" [8] приведены в таблице 5.
Следует отметить, что данные цифры приведены для некоторого общего понятия "логический элемент", так как в данном случае логическим элементом может являться, например, ХОР с одним инверсным входом и т.п. Автор называет их "нестандартными" вентилями.
Количество логических элементов, требуемое для реализации таких "нестандартных" логических элементов в традиционных базисах, приведено в таблице 6 для всех восьми таблиц Б.
Выводы
На сегодняшний день эксперименты по созданию логических элементов на базе БОА позволяют достичь скорости десятков гигабит в секунду (например, приведенный в работе [5] эксперимент показал достижимость скорости в 40 Гбит/с). Однако стоимость оптических устройств остается высокой. Можно оценить верхнюю границу производительности оптической реализации шифратора РЕБ в 2560 Гбит/с с учетом 64 разрядных обрабатываемых блоков, тогда как минимальная стоимость такого устройства составит около 11 млн долларов США.
Современные микросхемы ПЛИС позволяют реализовать аналогичный конвейерный шифратор РЕБ, способный работать с производительностью в десятки гигабит в секунду. Например, в работе [9] полученная производительность достигла 4,25 Гбит/с. Как показывает практика, в одной ПЛИС можно разместить около 25 конвейеров РЕБ (ПЛИС с большим объемом логических ресурсов, такие как У1г1ех-5 1-ХТ330 фирмы ХАгх), что позволит получить производительность более 100 Гбит/с (оценка для рассмотренного в [9] семейства Браг1ап-!!е), а с учетом возможности работы на более высоких частотах в новых семействах У^ех-5 и выше производительность одной ПЛИС может достигать 150 Гбит/с. Стоимость одной ПЛИС с большим объемом логических ресурсов составляет порядка 10-15 тыс. долларов США. Таким образом, на один шифратор РЕБ с производительностью 5-6 Гбит/с приходится в среднем 500 долларов США.
Заключение
Бурный рост исследований в области создания полностью оптических устройств обработки информации, а также достижения и новые открытия в нелинейной волоконной оптике позволяют говорить о том, что в перспективе возможен частичный отказ от оптоэлектронного преобразования при выполнении некоторых операций. На сегодняшний день стоимость полностью оптических устройств обработки получается слишком высокой по сравнению с цифровыми вычислительными средствами.
Однако скорости передачи данных по оптоволокну значительно превышают скорости электрических интерфейсов, а с развитием технологий волоконной оптики и использованием спектрального уплотнения стали достижимыми скорости передачи уровня терабит в секунду.
Оценка затрат на создание оптического шифратора в данной работе выполнена на основе БОА, которые на сегодняшний день являются достаточно дорогими элементами. С учетом развития технологий фотонных интегральных схем, позволяющих интегрировать различные оптические компоненты, такие как усилители, ла-
Таблица
Рис. 7. Блок преобразования адресов
Таблица 4
Затраты на реализацию операции подстановки при помощи полиномов Жегалкина
Таблица 5
Количество логических элементов при реализации "Bitslice DES"
Количество логических элементов
S1
56
S2
50
S3
S4
39
56
S6
53
S7
SK
50
Таблица 6
Реализация DES на основе техники "bit slice" в традиционных базисах
Базис NAND NOR XOR-AND
Количество логических элементов по типам 1454 1613 455 XOR, 221 AND
Количество логических элементов в одном раунде 1454 1613 676
Общее количество логических элементов в 16 раундах 23264 25808 10816
T-Comm, #8-2012
ЗЗ
зеры, модуляторы, поляризаторы и др., можно ожидать, что цена на них будет меньше, чем на отдельные элементы.
С развитием фотонных технологий происходит и совершенствование самой элементной базы. В работах последних лет применяется оптоволокно на основе БОІ, имеющее высокие нелинейные характеристики и позволяющее достигать скоростей уже не десятков, а сотен гигабит в секунду. Эффективность устройств на их основе, т.е. соотношение цены и производительности, должна быть значительно выше.
Литература
1. Барсков А. После сорока // "Журнал сетевых решений / Телеком. — №3. — 2011.
2. Агравал Г.П. Применение нелинейной волоконной оптики / Перевод В.И. Кузина; под ред. И.Ю. Денисюка: Учебное пособие. — СПб.: Изда-
тельство "Лань", 2011. — 592 с.: ил.
3. Connelly MJ. Semiconductor Optical Amplifiers. — Kluwer Academic Publishers, 2002.
4. Dutton HJ.R. Understanding Optical Communications, IBM Corporation, 1998.
5. Feng Y., Zhao X., Wang L., Lou C High-performance all-optical OR/NOR ogic gate in a single semiconductor optical amplifier with delay interference filtering // Applied optics. — Vol.48. — No.14. — 2009. — P2638-2641.
6. Wu J.W., Sarma A.K. Ultrafast all-optical XOR logic gate based on a symmetrical Mach Zehnder interferometer employng SOI waveguides // Optics Communications. — 2010. — P2914-2917.
7. Каган Б.М., Каневский М.М. Цифровые вычислительные машины и системы / Изд. 2 е, перераб. Учебное пособие для вузов. — М.: "Энергия", 1974. — 680 с.: ил.
8. Kwan M. Reducing the Gate Count of Bitslice DES // Электронный ресурс. — Режим доступа: http://darkside.com.au. — 2006.
9. Баркалов А.А, Красичков АА, Кузьменко В.О. Реализация алгоритма шифрования DES на базе FPGA //
ESTIMATE OF THE STATE-OF-THE-ART ALL-OPTICAL TECHNOLOGY BY THE USE OF DES ENCODER Kuznetsova O.V., Speransky V.S.
Abstract: This article describes questions of all-optical data processing applications. All-optical logic gates based on nonlinearities in materials are shown. We discussed the DES encoder as a model problem by reason of the algorithm contains three kinds of operations which can be useful for analysis computing efficiency, namely: logical functions, nonstandard linear operations (bit rearrangement) and non-linear operations (replacement using S-boxes). Some means not using memory devices for S-boxes are discussed because ex'sting examples of memory devices aren't effective. Resource estimate for each kind of operations is given by the amount of SOAs, because a SOA is the most expensive element. We got estimated throughput and cost for all-optical DES encoder and for similar DES encoder implemented using FPGA. We mentioned some possible courses of technological development such as nonlinear fiber optic and photonic integrated circuits which can be used for increasing efficiency of all-optical processing.
Keywords: Logic gate, nonlinear fiber optic, all-optical processing, semiconductor optical amplifier, encoder.
З4
T-Comm, #8-2012