Компоненты и технологии, № 8'2004
«Горячие темы» EDA-индустрии
по материалам новостей портала DACafe.com
Среди представляемых в этом номере «горячих тем»: развитие FPGA, MATLAB и Simulink, SystemC и SystemVerilog, PCI Express.
Михаил Долинский
1. Куда развиваются FPGA?
1.1. Первичное сравнение рынков FPGA uASIC
Как хорошо известно, FPGA (Field Programming Gate Arrays) и ASIC (Application Specific Integrated Circuits) по своим базовым характеристикам занимают противоположные полюса на рынке цифровых систем.
Эти характеристики делают каждый подход более привлекательным для разных видов приложений. Массовые и низкобюджетные устройства предпочтительнее выполнять на ASIC, а продукцию с малым объемом производства и ограниченным временем выхода на рынок выгоднее создавать на FPGA.
Многие фирмы используют FPGA на ранней стадии проектирования и подготовки к производству, переключаясь позднее на ASIC для массового выпуска. Для устройств, коммерческий успех которых трудно спрогнозировать, FPGA предлагают меньший риск. Некоторые фирмы используют FPGA для того, чтобы зафиксировать свой приоритет на новом рынке, попутно получая преимущества первого производителя, когда цена на такие устройства еще не является доминирующим фактором для потребителей. С ростом NRE (невозвращаемых) затрат для ASIC и сокращением плановых сроков времени выхода на рынок, особенно в сфере потребительской электроники, FPGA становятся все более и более привлекательными. По данным DataQuest, в 2003 году количество начатых для FPGA проектов было около 80 тыс. против 3,8 тыс. проектов для ASIC.
Компания Xilinx, промышленный лидер в FPGA, оценивает рынок цифровых устройств в $57 млрд, где $31,5 млрд составляет ASSP, $14 млрд — ASIC, $2,8 млрд — FPGA, $0,5 млрд — CPLD и $8,5 млрд — прочие устройства.
В то же время и Xilinx, и ее соперники ищут пути расширения рынка FPGA. Наблюдается два главных подхода. Первый — сокращать стоимость FPGA на единицу продукции, второй — увеличивать производительность и емкость, чтобы конкурировать с высокопроизводительными DSP для устройств с высокоскоростным вводом-выводом и встроенной обработкой сигналов следующих по-
колений. Цена единицы продукции может быть сокращена с переходом на технологию 90 нм и подложку 300 мм, а также с выпуском FPGA с широким диапазоном производительности, памяти, количеством логических ячеек и т. д.
1.2. Главные участники рынка FPGA
1.2.1. Xilinx
Компания Xilinx была основана в 1984 году, а в 1985 выпустила первый коммерческий продукт. Сегодня в Xilinx работает 2600 человек и, по заявлениям представителей фирмы, продукцией Xilinx пользуется более 7500 разработчиков, а на базе FPGA от Xilinx выполнено свыше 50 тыс. проектов. Это более половины всех мировых потребностей в FPGA.
Как fabless-поставщик, Xilinx сотрудничает с ведущими производителями чипов, такими, как IBM Microelectronics, UMC (United Microelectronics Corporation) и Seiko. С марта 2002 года в результате соглашения с IBM разработано семейство Xilinx FPGA Virtex-II Pro, включающее процессоры IBM PowerPC, в результате чего создана конкурентная микросхема для использования в приложениях потребительской электроники. Сегодня микросхемы Xilinx выпускаются по технологиям 90 и 130 нм на подложках диаметром 300 мм. Virtex-II Pro интегрирует программируемую логику, до четырех высокопроизводительных процессоров PowerPC и трансиверы RocketIO, обеспечивающие последовательный ввод-вывод с производительностью 3,125 Гбит/с.
В декабре 2003 года Xilinx заявила новую архитектуру Application Specific Modular Block (ASMBL, произносится как assemble). ASMBL представляет собой модульную среду кремниевых подсистем, которая обеспечивает новую методологию разработки FPGA для быстрой и эффективной по цене разработки платформ, ориентированных на различные сферы приложений. Платформа создается компоновкой в нужных пропорциях логики, памяти, DSP, высокоскоростных средств ввода-вывода.
В июне 2004 года Xilinx раскрыла подробности
о своем четвертом поколении семейства Virtex, названном Virtex-4 Platform FPGA. Семейство Virtex-4 основано на архитектуре ASMBL и изначально включает три платформы: Virtex-4 LX для логики,
Компоненты и технологии, № 8'2004
Virtex-4 SX для высокопроизводительной обработки сигналов и Virtex-4 FX для встроенных приложений с производительной обработкой и скоростной последовательной передачей информации. Каждая платформа представляет несколько разновидностей устройств.
Не успев начать выпуск устройств на базе новой архитектуры ASMBL, Xilinx изменила ее расшифровку, теперь ASMBL обозначает Advanced Silicon Modular Block.
В апреле 2003 года Xilinx выпустила FPGA Spartan-3 — как развитие семейства Spartan-IIE для области дешевых приложений. Семейство Spartan-3 включает 8 устройств емкостью от 50К до 5М системных вентилей, с памятью на чипе до 1,8 Мбит.
В массовых партиях цена устройств Spartan-3 емкостью до 400К системных вентилей — менее $6,5, а устройств с емкостью 1М вентилей — $12. Для измерения и сравнения стоимости устройств Xilinx определила две метрики: первая — CPL (Cost per Logic Cell), вторая — CPI (Cost per IO). В середине июня 2004 года Xilinx заявила о продаже дешевых чипов семейства Spartan на общую сумму $750 млн с момента начала их выпуска в 1998 году. Всего продано более 80 миллионов устройств 13 тыс. пользователей.
1.2.2. Altera Corporation
Altera была основана в 1983 году. Первое перепрограммируемое логическое устройств (EP300) было разработано в 1984 году.
В 1988 году Altera начала выпускать FPGA на базе архитектуры MAX, а в 1992 году — FPGA архитектуры FLEX (на базе LUT — look up table). Altera первой выпустила SoPC (system-on-a-programmable-chip), а недавно сделала очередной шаг в этом направлении, выпустив систему разработки Quartus II, включающую широкий спектр коммерчески распространяемых IP-компонентов.
В феврале 2004 года Altera анонсировала семейство FPGA Stratix-II. Это семейство обеспечивает удвоение плотности, увеличение производительности на 50% и сокращение потребляемой энергии на 40% по сравнению с FPGA семейства Stratix. Stratix-II созданы на базе новой архитектуры, основывающейся на адаптивных логических модулях (ALM). Каждый ALM содержит две ALUT (adaptive look-up table), до 8 логических входов, и потому может реализовать до двух независимых логических функций с разным количеством аргументов. Такая оптимизация существенно повышает эффективность использования системных вентилей. Микросхемы Stratix-II содержат также блоки DSP, AES (advanced encryption standard) и память TriMatrix. Цена FPGA Stratix-II — от $125 в партиях по 25 тыс. штук.
Altera выпустила свои дешевые FPGA семейства Cyclone в декабре 2002 года и с тех пор продала 3 млн штук более чем 3 тыс. пользователей. В июне 2004 года Altera выпустила Cyclone II — второе поколение своих дешевых FPGA. Они на 30% дешевле и в три раза более емкие, чем микросхемы первого поколения. Cyclone II выпускаются по технологии 90 нм (в то время как Cyclone — по технологии 130 нм). Cyclone-II имеют также и большую функциональность, в том
числе встроенные умножители, поддержку большего числа стандартов ввода-вывода, интерфейсы с новыми устройствами памяти. Семейство Cyclone II состоит из 6 членов с емкостью от 4608 до 68416 логических элементов, до 150 встроенных умножителей 18x18, до 1,1 Мбит встроенной памяти в различных конфигурациях, включая двухпортовую и однопортовую RAM, ROM и FIFO. Предполагаемая цена — $22 в партиях по 250 тыс. штук. Для семейства Cyclone II оптимизировано уже более 40 IP-компонентов от Altera и AMPP (Altera Megafunction Partners Program).
Другой подход к снижению цены устройств, предлагаемый Altera, — миграция от FPGA к Structured ASIC. Выпускаемые Altera устройства HardCopy — это структурированные ASIC, которые имеют завершенные базовые слои и два-три слоя, программируемые пользователем. В результате получается устройство на 60-70% меньшее, чем исходная FPGA, потребляющее существенно меньше энергии и сравнимое по производительности с традиционными ASIC.
Вместе Xilinx и Altera держат 86% рынка программируемых логических устройств.
1.3. Средства разработки проектов наFPGA
И Xilinx, и Altera предлагают разнообразные средства разработки от бесплатных до комплектов с ценой в несколько тысяч долларов.
Среда разработки Xilinx ISE поставляется в четырех модификациях: ISE Foundation (с ценой $2495), Alliance ($1495), Base X ($695) и WebPack, распространяемой бесплатно.
ISE Foundation включает продвинутые возможности ввода, верификации и синтеза проекта. Менее дорогие модификации имеют меньше функциональных возможностей и поддерживают только чипы с маленькими емкостями.
Для отладки систем на базе Xilinx FPGA предлагаются также ChipScope Pro ($695) и EDK (Embedded Development Kit, $495). ChipScope Pro встраивает в пользовательский проект специальную тестовую логику, которая позволяет видеть все внутренние сигналы проекта. EDK поддерживает проектирование процессорных подсистем на базе IBM PowerPC и Xilinx MicroBlaze.
Xilinx ISE Alliance позволяет интегрировать в процесс проектирования средства ввода, верификации и синтеза от разных производителей.
Altera предлагает Quartus II для разработки своих SOPC. Quartus II обеспечивает унифицированный поток проектирования для FPGA, CPLD и Structured ASIC. Quartus II поддерживает разработку встроенного программного обеспечения, синтез, размещение и трассировку, верификацию и программирование устройств.
Altera Subscription Program включает Quartus II, ModelSim, библиотеку IP-компонентов MegaCore, встроенный процессор Nios (оценочную версию). Цена на год — $2000 за фиксированную единичную лицензию.
Бесплатно распространяемый Quartus II Web Edition обеспечивает все необходимое для разработки последних семейств дешевых FPGA и CPLD и устройств с малой емкостью высокопроизводительных FPGA.
Еще Altera распространяет SOPC Builder для разработки сложных систем. SOPC Builder имеет интерфейсы для интеграции с MATLAB и Simulink.
Наконец, Altera ведет большую работу по поддержке и развитию средств разработки для своих FPGA/CPLD от сторонних производителей в рамках программы ACCESS (Altera Commitment to Cooperative Engineering Solutions).
2. MATLAB и Simulink
MATLAB и Simulink фирмы MathWorks предназначены для разработки и симуляции алгоритмов функционирования сложных систем на ранних стадиях разработки.
MathWorks была основана в 1984 году, сегодня на нее работают более 1000 человек по всему миру. Она занимается разработкой программного обеспечения для технических вычислений и моделирования, ориентированного на инженеров, ученых, математиков и исследователей в самых различных прикладных областях. Годовой доход фирмы в 2003 году составил более $240 млн. По заявлениям представителей MathWorks, у нее свыше
1 млн пользователей в более чем 100 странах мира. Продукты MathWorks используются в 3500 университетах.
Два главных продукта MatWorks — это MATLAB и Simulink. MATLAB используется для выполнения математических вычислений, анализа и визуализации данных, программной реализации новых возможностей в среде MATLAB. Simulink используется для моделирования сложных динамических систем. Кроме того, MathWorks разрабатывает множество дополнительных продуктов, ориентированных на специфические вертикальные рынки.
Наличие в среде MATLAB высокоуровневого языка технических вычислений и интерактивных возможностей разработки алгоритмов обеспечивает эффективное использование MATLAB в широком спектре приложений, включая обработку сигналов и образов, коммуникации, проектирование управления, тестирование и оценочные измерения, финансовое моделирование, исследование биологических систем. Коллекции дополнительных функций MATLAB, поставляемые отдельно (add-on toolboxes) расширяют среду MATLAB для решения конкретных классов проблем в различных прикладных областях. В частности, могут быть поставлены коллекции функций: Statistics and Data Analysis, Control System Design and Analysis, Signal Processing and Communications, Image Processing, Test & Measurement, Financial Modeling & Analysis. Язык MATLAB обеспечивает поддержку векторных и матричных операций, не требует объявления переменных и управления памятью, имеет встроенные средства визуализации — двумерную и трехмерную графику.
Компоненты и технологии, № 8'2004
Имеются интерфейсы для интеграции в MATLAB функций, разработанных на внешних языках программирования, в том числе C/C++, Fortran, Java, а также в COM-объектах. MATLAB может считывать данные популярных файловых форматов, например, таких, как Microsoft Excel, ASCII-файлы, двоичные файлы образов, звука, видео. MATLAB может также получать данные непосредственно от аппаратного обеспечения.
Simulink — это платформа для симуляции и основанного на моделировании проектирования динамических систем в различных прикладных областях. Simulink обеспечивает интерактивную графическую среду и управляемые (пополняемые) пользователями библиотеки стандартных компонентов, которые позволяют легко проектировать, симулировать и тестировать самые разнообразные системы. С помощью симуляции можно убедиться, что система выполняет необходимые функции, исследовать проектное пространство, находя оптимальные параметры для достижения целевых установок проекта.
Simulink поддерживает графическое интерактивное создание схем с помощью технологии «drag&drop». Поддерживается моделирование аналоговых, цифровых и смешанных систем. Real-Time Workshop может сгенерировать и C-текст, исполняющий разработанные в Simulink алгоритмы. Полученный код может использоваться для многих приложений реального времени, а также для ускорения симуляции, быстрого прототипирования и совместного моделирования программного и аппаратного обеспечения.
В июне 2004 года выпущены новые версии ПО: MATLAB 7 и Simulink 6 для Windows, UNIX/Linux и Macintosh. Цена MATLAB 7 — от $1900, цена Simulink 6 — от $2800.
В октябре 2003 года MathWorks и Mentor Graphics выпустили совместный продукт Link for ModelSim, с помощью которого можно интегрировать MATLAB и Simulink непосредственно в цикл проектирования аппаратного обеспечения для FPGA и ASIC. Link for ModelSim обеспечивает двустороннюю передачу информации между MATLAB или Simulink и симулятором HDL-описаний ModelSim, в результате чего стала возможной симуляция RTL-описаний непосредственно в среде MATLAB/Simulink.
Специальные коллекции функций для MATLAB/Simulink разработали и такие фирмы, как Altera, Xilinx, Accel, Synplicity и начинающая компания Catalytic.
Xilinx System Generator for DSP помогает разрабатывать высокопроизводительные системы для Xilinx FPGA. Инженеры могут проектировать и симулировать систему, используя MATLAB, Simulink и библиотеку моделей, разработанных Xilinx, адекватных на уровне битов и циклов (bit/cycle-true models). Затем можно автоматически сгенерировать синтезируемое HDL (Hardware Description Language) — описание для отлаженной системы. Поддерживается реализация для семейств Virtex II-Pro и Spartan IIE. Как следствие, разработчики могут содавать абстрактные представления на системном
уровне и легко трансформировать их в соответствующие представления на вентильном уровне. Дополнительно автоматически генерируются и тесты, которые могут использоваться уже при верификации аппаратной реализации. Поддерживается также оценка занимаемых в FPGA ресурсов непосредственно из Simulink.
AccelChip разработала собственные средства перехода от MATLAB к FPGA/ASIC для DSP-приложений, также генерирующие по созданным в MATLAB алгоритмам соответствующие синтезируемые описания rnVHDL или Verilog. AccelChip использует Resource Description Language (RDL) для оптимизации генерируемых RTL-описаний. Язык RDL позволяет описывать ресурсы, доступные в целевой FPGA.
Altera DSP Builder связывает среду MATLAB/ Simulink со средой Quartus II. Разработчики могут использовать блоки библиотеки DSP Builder, которые покрывают основные арифметические операции над вещественными и целыми числами, а также некоторые более сложные функции, включая FEC (forward error correction) и фильтрацию. Компонент SignalCompiler среды DSP Builder может считывать файлы моделей Simulink (.mdl) и строить их VHDL-реализации и скрипты синтеза для FPGA семейств APEX II, APEX E, FLEX 10K, FLEX 6000, Mercury.
Catalytic разработала продукт, который позволяет алгоритмы, разработанные в MATLAB для вещественных чисел, конвертировать в аналогичные алгоритмы, обрабатывающие целые числа.
Synplify DSP автоматизирует реализацию RTL из Simulink-спецификаций. При этом библиотека компонентов, поставляемая Synplify DSP, включает такие блоки, как фильтры (FIR, IIR), математические функции и преобразования, память и управляющая логика.
Надо отметить также основного конкурента MATLAB — продукт Mathematica от Wolfram Research. Mathematica интегрирует числовые и символьные вычисления, графическую подсистему, язык программирования, средства документирования и продвинутые средства взаимодействия с другими приложениями. Mathematica была выпущена в 1988 году и теперь у нее более миллиона пользователей. Mathematica используется во всех компаниях из списка «Fortune 50», во всех 15 главных департаментах правительства США и в 50 крупнейших университетах мира.
3. SystemC и SystemVerilog
Сегодня поведенческий синтез основывается на языках SystemC и SystemVerilog. Организации, ответственные за разработку этих языков, — Open SystemC Initiative (OSCI) и Accellera. Когда имеется два стандартных «перекрывающихся» языка, можно ожидать, что сторонники разных языков будут находиться в состоянии «войны». Тем удивительнее было то, что Гидо Арноут, президент Open SystemC Initiative и Деннис Брофи, председатель Accellera, рассыпали друг другу
комплименты на панельной дискуссии DAC «SystemC and SystemVerilog Designing SoC Together». В совместно подготовленной презентации они представили каждый язык в терминах другого. Ниже приведено краткое сравнение языков.
SystemC получил три звезды в архитектурном проектировании, архитектурной верификации, совместной верификации программного и аппаратного обеспечения и одну звезду в верификации RTL-to-Gates.
SystemVerilog получил три звезды за проектирование и верификацию RTL-to-gates, а также одну звезду за ранние стадии проектирования и верификации.
Как следствие — оба языка необходимы при разработке сложных систем от концепции к реализации.
Accellera сообщила, что она утвердила стандарт SystemVerilog 3.1a для верификации проектов. Версия 3.1a имеет следующие улучшения: расширение возможностей моделирования сложных подсистем памяти, перегрузка операторов для упрощения выражений и др.
4. PCI Express
4.1. PCI
Прежде чем описывать стандарт PCI Express, вспомним, что такое PCI, которому на смену и пришел PCI Express.
В 1992 году была сформирована PCI-SIG (Peripheral Component Interconnect Special Interest Group) для разработки промышленного стандарта на развитие шины PCI, которая использовалась для передачи данных между CPU и периферийными устройствами. В настоящее время PCI-SIG объединяет более 800 компаний. Первоначальная реализация шины PCI была 32-битная, 33-мегагерцевая, а теоретический пик ее производительности составлял 133 Мбайт/с. Затем последовала 64-битная 66-мегагерцевая реализация с пиковой производительностью 512 Мбайт/с.
PCI-X 1.0 имела пиковую частоту 133 МГц, а PCI-X 2.0 расширяла частотный диапазон до 266 и 533 МГц и включала некоторые дополнительные возможности, например, ECC и AGP.
Спецификация AGP (Accelerated Graphic Port) определяла высокоскоростную PCI-шину специально для графических операций. Шина AGP разгружала трафик на системной PCI-шине, создавая тем самым потенциал для других операций ввода-вывода. Начальная версия AGP была 32-битной с частотой 66 МГц и пиковой производительностью 266 Мбайт/с. Затем появились спецификации AGP2, AGP4, AGP8. AGP8 может обеспечивать передачу до 2,134 Гбайт/с. Недавно Intel добавила в свой южный мост (southbridge) интерфейсы USB 2.0 и Serial ATA, что еще больше разгружает системную шину PCI.
Заметим, что мост хоста (host bridge) часто называется северным мостом (northbridge), в то время как мост ввода-вывода называется южным мостом (southbridge). Северный мост соединяет быстрые устройства — центральный процессор, память и графические
Компоненты и технологии, № 8'2004
ускорители. Южный мост управляет трафиком различных устройств ввода-вывода, таких, как жесткие диски, USB-порты, Ethernet-порты и т. д. Поскольку шина PCI недостаточно быстра для некоторых устройств, возникла тенденция добавить дополнительные интерфейсы (SATA, USB) непосредственно к южному мосту. Так получилось, что в одной системе мы имеем набор специализированных шин с различными протоколами и различной производительностью.
Требования к современным системам по производительности обработки и передачи инфромации превышают возможности традиционной 32-битной 33-мегагерцевой шины PCI.
Технические инновации, такие, как 10-ги-гагерцевые процессоры, быстрая память, высокоскоростные графические акселераторы, гигабитная сетевая обработка и другие, требуют более высокой производительности внутренней шины. В настоящее время созрело понимание того, что PCI и AGP достигли своих пределов производительности. Кроме того, PCI не может просто масштабироваться по частоте и уровню напряжения питания. В PCI не заложены возможности динамического управления напряжением питания и включения-выключения периферийных устройств во время функционирования. Наконец, шина PCI однонаправленная, в каждый момент времени информация передается по ней только в одном направлении (прием или передача).
4.2. PCI Express
PCI-SIG определила PCI Express так: «открытая спецификация, изначально спроектированная на широкий круг нынешних и будущих требований к системным соединениям в устройствах для сетевой обработ-
ки. Архитектура PCI Express определяет гибкий, масштабируемый, высокоскоростной, последовательный типа “точка-точка” интерфейс, программно совместимый с PCI и обеспечивающий включение и выключение на лету».
PCI Express определяет пакетный протокол и архитектуру загрузки-сохранения. Многослойная архитектура PCI Express обеспечивает применение в медных, оптических и новых разрабатываемых средах передачи сигналов. PCI Express использует встроенную схему измерения времени, которая упрощает масштабирование рабочей частоты и переход на платы с новыми размерами (форм-факторами). Шина PCI Express может использоваться для межсоединения чипа с чипом или включения карт адаптеров в материнскую плату, для таких устройств, как графические акселераторы, USB-, InfiniBand- или Ethernet-устройства.
Для обеспечения соединения между множеством точек в топологию системы ввода-вывода вводится новый элемент — свич (switch). Свич обеспечивает межосединение типа «точка-точка» для множества пар точек. И такой трафик не перенаправляется к хост-мосту.
Линк (link) PCI Express состоит из двух простых каналов для одновременной передачи сигналов в обоих направлениях. Каждый канал включает пару сигналов (данные и время). Производительность передачи — от 2,5 до 10 Гбит/с.
4.3. Физический уровень PCI Express
Пропускная способность линка PCI EXpress может линейно масштабироваться добавлением сигнальных пар для формирования «lanes». Физический уровень поддерживает x1, x2, x4, x8, x12, x16 и x32. Каждый байт передается с использованием схемы кодирования 8b/10b по соответствующему «lane». Данные
«расщепляются» и «собираются» на физическом уровне прозрачно для других уровней.
Группа ASI SIG (Advanced Switching Interconnect Special Interest Group) сконцен-тировалась на разработке стандарта на множественные межсоединения (свичи).
Advanced Switching — это архитектура, которая базируется на PCI Express и обеспечивает межсоединение множества компонентов и системных плат. Advanced Switching использует те же самые слои, что и PCI Express, для обеспечения интеоперабельности этих двух технологий.
PCMCIA (Personal Computer Memory Card International Association) — это международная ассоциация, основанная в 1989 году с целью выработки и внедрения стандарта на чип-карты для обеспечения взаимозаменяемости компьютерных систем. В сентябре 2003 года PCMCIA ввела стандарт ExpressCard (кодовое имя NEWCARD) для сменяемых «на лету» модулей с целью заменить стандарт CardBus. ExpressCard поддерживает пиковую производительность передачи данных 250 Мбайт/с вместо 132 Мбайт/с стандарта PC Card.
Имеется два стандартных формата модулей ExpressCard: ExpressCard/34 (шириной 34 мм) и ExpressCard/54 (шириной 54 мм). Оба модуля имеют длину 75 мм и высоту 5 мм и оба имеют 26 внешних контактов (сравните с 68 контактами модуля, который они заменяют). Оба модуля потребляют энергии меньше чем 1,3 Вт. Объединяя интерфейсы USB и PCI Express на одной плате, можно значительно упростить расширение возможностей системы без вскрытия корпуса ПК.
IP-компоненты PCI Express поставляются ведущими поставщиками (Cadence, Synopsis. Mentor и др.) для встраивания в пользовательские SoC.