Научная статья на тему 'Семейство ПЛИС Virtex-5 FXT с встроенным процессорным ядром PowerPC 440'

Семейство ПЛИС Virtex-5 FXT с встроенным процессорным ядром PowerPC 440 Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
170
47
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Тарасов Илья

В статье дается краткий обзор характеристик последней из заявленных к выпуску платформ высокопроизводительных ПЛИС семейства Virtex-5. Несколько задержав выпуск полнофункциональной FPGA с аппаратным процессорным ядром, фирма Xilinx существенно улучшила характеристики новой платформы, перейдя к более мощному встроенному ядру PowerPC 440 и улучшив высокоскоростные приемопередатчики.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Семейство ПЛИС Virtex-5 FXT с встроенным процессорным ядром PowerPC 440»

74 I компоненты

Илья ТАРАСОВ, к. т. н.

tile@kc.ru

Характеристики ПЛИС новой платформы

Virtex-5 FXT — последняя платформа в семействе высокопроизводительных FPGA фирмы Xilinx, выполненных с технологическими нормами 65 нм. Начиная с предыдущего поколения FPGA Xilinx использует модульную архитектуру высокопроизводительных FPGA, названную ASMBL (Advanced Silicon Modular Block), что позволило в рамках одного семейства Virtex-4 выпустить сразу три платформы ПЛИС, различавшихся соотношением основных ресурсов — логических ячеек, блоков цифровой обработки, памяти и специализированных модулей (процессорных ядер и высокоскоростных приемопередатчиков). Широкие функциональные возможности в приложениях коммуникации, которые предоставили аппаратные приемопередатчики, привели к тому, что в Virtex-5 такие устройства были размещены и в ПЛИС без аппаратных процессорных ядер — LXT и SXT. Теперь же, правда, с некоторой задержкой относительно выхода предыдущих платформ, появились устройства Virtex-5 FXT, содержащие как приемопередатчики (на что указывает буква T в обозначении), так и аппаратные ядра процессора PowerPC. Характеристики этих ПЛИС приведены в таблице 1.

Ячейка Virtex-5 содержит четыре секции, так что для определения количества триггеров и логических генераторов необходимо умножить на 4 количество ячеек, указанное в таблице. Легко заметить, что получающиеся цифры меньше, чем величины, приведенные в обозначении ПЛИС. Это связано с тем, что Xilinx проводит оценку емкости в «стандартных ячейках», содержащих триггер и 4-входовый логический генератор, тогда как в Virtex-5 LUT имеют шесть входов.

В последней колонке приведено количество скоростных приемопередатчиков Rocket IO GTX, которые отличают данное семейство да-

ПЛИС

Семейство ПЛИС УіПех-Б РХТ

с встроенным процессорным ядром PowerPC 440

В статье дается краткий обзор характеристик последней из заявленных к выпуску платформ высокопроизводительных ПЛИС семейства Уіггех-Б. Несколько задержав выпуск полнофункциональной РРвД с аппаратным процессорным ядром, фирма Хіііпх существенно улучшила характеристики новой платформы, перейдя к более мощному встроенному ядру PowerPC 440 и улучшив высокоскоростные приемопередатчики.

Таблица 1. Характеристики ПЛИС новой платформы

Устройство Ячеек DSP48E Блоков памяти Итого памяти, кбайт CMT PPC PCI-Express endpoint Ethernet MAC Rocket IO GTX

XC5VFX30T 5120 64 68 2448 8

XC5VFX70T 11 200 128 148 5328 16

XC5VFX100T 16 000 256 228 8208 16

XC5VFX130T 20 480 320 298 10 728 20

XC5VFX200T 30 720 384 456 16 416 24

же от других платформ Virtex-5 с приемопередатчиками (LXT, SXT). В них используются модули Rocket IO GTP, способные осуществлять обмен данными со скоростями 100-3750 Мбит/с, тогда как у ядер GTX возможные значения скоростей составляют 150-6500 Мбит/с.

Важной частью таблицы является колонка, обозначенная как PPC. В этой колонке приведено количество процессорных ядер PowerPC 440, которые заменили уже применявшиеся в предыдущих поколениях ПЛИС Xilinx ядра PowerPC 405. Основные сравнительные характеристики этих ядер приведе-

ны в таблице 2, а структурное изображение процессорного ядра PowerPC 440 и сопутствующих элементов показано на рис. 1.

Таблица 2. Основные сравнительные характеристики новых ядер

PowerPC 405 PowerPC 440

Конвейер,стадий 7, out-of-order

Тактовая частота, МГц 450 550

Максимальная производительность, 0М1РБ 700 1100

Кэш инструкций/данных 16/16 кбайт, 2-way 32/32 кбайт, 64-way

Crossbar

| PowerPC APU В 440 I Processor

w

DCR

эс

PLBSIvO

Memory l/F

PLB Master

PLBSIvl

Рис. 1. Блок процессора PowerPC 440, встраиваемый в ПЛИС Virtex-З FXT

На рис. 1 можно видеть, что обмен данными с основными накристальными устройствами происходит через устройство коммутации (crossbar). Это устройство позволяет разгрузить основную шину процессора PLB, поскольку к ней в проектах на базе ПЛИС оказываются подключенными сразу несколько устройств с большим трафиком. Например, при одновременном подключении высокоскоростной внешней памяти и контроллера Ethernet каждое из этих устройств само по себе обладает неплохими характеристиками, но их присутствие на одной и той же шине сразу снижает максимальные скорости обмена данными. Пример системы, использующей несколько скоростных интерфейсов, показан на рис. 2. На нем можно видеть, что такие требовательные к ресурсам системной шины устройства, как внешняя память, EMAC, PCIe, имеют собственные подключения к коммутатору, что позволяет перераспределять потоки данных (например, выполнять прямой доступ в память).

Ядро PowerPC 440 имеет 7-уровневый конвейер и позволяет запускать исполнение двух команд одновременно (наподобие первого поколения процессоров Intel Pentium, имеющих U- и V-конвейеры). Дополнительно используется технология переупорядочива-ния команд (out-of-order execution), которая на аппаратном уровне пытается уменьшить взаимозависимость команд по данным, если это возможно. Итоговая производительность ядра оценивается в 1100 DMIPS (два ядра в старших ПЛИС дадут уже 2200 DMIPS). Подобный уровень производительности более чем достаточен для запуска современных операционных систем, и такие продукты, как uLinux, Linux, VxWorks, QNX, заняли прочное место среди тестовых примеров, предлагаемых для ПЛИС верхнего уровня. Что важно, разработчик при этом получает ОС, если и не полностью «из коробки», то, по крайней мере, с просматриваемым путем

установки и запуска ее на собственной аппаратной платформе.

Отладочная плата ML507 на основе Virtex-5 FXT

Для ознакомления с ПЛИС Virtex-5 FXT фирма Xilinx выпустила стартовый набор ML-507. Эта плата имеет тот же набор периферии, что и ML-505 на базе LXT, и ML-506 на базе SXT, и ту же топологию печатных проводников, что позволяет разработчику в процессе проектирования оперативно переходить к ПЛИС с другим соотношением ресурсов без необходимости заново проектировать контроллеры периферийных устройств. Практически, эти платы заменяют по своему назначению довольно популярную серию плат ML-401/402/403. Внешний вид ML-507 показан на рис. 3. Несмотря на то, что плата выполнена как плата расширения для PC и может быть вставлена в слот PCI-Express, возможна и автономная работа при условии подачи внешнего питания.

На плате (рис. 3) установлена микросхема XC5VFX70TFFG1136, а также следующие устройства.

1. Память и средства загрузки:

- DDR2 SODIMM (256 Mбайт),

- ZBT SRAM ( 1 Mбайт),

- Linear Flash ( 32 Mбайт),

- System ACE CF technology (CompactFlash),

- Platform Flash,

- SPI Flash,

- JTAG.

2. Интерфейсы на базе GTP:

- MII, GMII, RGMII и SGMII Ethernet PHY,

- краевой разъем PCI Express (x1 Endpoint),

- GTP: SFP (1000Base-X),

- GTP: SMA (дифференциальные пары RX и TX),

- GTP: SGMII,

- GTP: PCIe,

- GTP: SATA (сдвоенный хост),

- микросхема генератора тактовых сигналов для GTP.

3. Прочие интерфейсы:

- разъемы для внешних тактовых сигналов (2 дифференциальные пары),

- USB (2),

- PS/2 (2) — клавиатура, мышь,

- RJ-45 — 10/100/1000 Мбит/с,

- RS-232 (Male) — последовательный порт,

- Audio In (2) — линейный вход, микрофон,

- Audio Out (2) — линейный выход, SPDIF, пьезодинамик,

- вращающийся энкодер,

- видеовход,

- видеовыход (DVI/VGA),

- однопроводные и дифференциальные разъемы общего назначения.

Плата поддержана САПР EDK 10.1 SP1, с помощью которой можно быстро создать систему на кристалле под управлением PowerPC или Microblaze. Большое внимание в версии 10.1 линейки САПР Xilinx уделено ускорению вычислений в системах на базе аппаратных процессорных ядер и софт-процессоров. Для PowerPC доступно подключение модулей расширения системы команд с помощью ячеек ПЛИС (APU — Auxiliary Processor Unit). Сопроцессор для выполнения операций с плавающей точкой наконец-то прочно занял позицию среди таких устройств, и по сравнению с предыдущими версиями технические ограничения на его использование были существенно уменьшены. В частности, расширен частотный диапазон и соотношение частот процессора и системной шины, при которых FPU работоспособен. Для аппаратных приемопередатчиков существует возможность простого подключения к локальной шине процессора, и, таким образом, система на кристалле сразу получает доступ к накристальному оборудованию, в том числе под управлением языков высокого уровня. Примеры проектов, предлагаемые Xilinx для ML-507, включают в себя и средства обмена данными с помощью аппаратных приемопередатчиков.

Выводы

Платформа УШех-5 БХТ завершила линейку высокопроизводительных БРОЛ фирмы ХШпх, выполненных с технологическими нормами 65 нм. Представление на рынке всех анонсированных ранее устройств нового семейства формально открывает для ХШпх путь к освоению следующего поколения БРОЛ верхнего уровня, хотя следует при-

знать, что платформа БХТ несколько задержалась как относительно прочих представителей семейства УіЛех-5, так и в сравнении с ситуацией на рынке. С другой стороны, в последнее время Хіііпх придерживается политики представления информации только об уже готовых к заказу микросхемах, и УіГ:ех-5 БХТ в этом плане не является исключением. Теперь следующей важной вехой должен стать переход к технологичес-

ким нормам 45 нм, и отказ ХШпх от ранних анонсов семейств с низкой степенью готовности создает определенную интригу. Если учесть, что У1Лех-5 прекрасно отразили принципиальные улучшения, внесенные в микроэлектронику 65-нм техпроцессом, можно только догадываться, что ожидает разработчиков аппаратуры на базе ПЛИС от возможного следующего поколения продуктов ХШпх. ■

i Надоели баннеры? Вы всегда можете отключить рекламу.