Радиолокационные системы
УДК 621.396
Обеспечение синтеза РЛИ высокого разрешения
на борту космического аппарата при маршрутном режиме съемки
Антонов А.Ю.
В работе получена структурная схема вычислительной системы синтеза РЛИ метрового разрешения на борту низкоорбитального космического аппарата при маршрутном режиме съемки.
Ключевые слова: радиолокатор с синтезированной апертурой, космический аппарат, радиолокационное изображение, синтез, маршрутный режим съемки.
Введение
Получение радиолокационного изображения (РЛИ) сопряжено с большими вычислительными затратами, что требует быстродействующей аппаратуры. Это требование особенно критично для систем, работающих в режиме реального времени. Жесткие условия космического пространства, в частности радиационные воздействия, ограничивают возможности применяемых вычислительных средств, поэтому радиоголограммы передаются непосредственно на землю, где происходит их обработка. Однако пропускной способности радиолиний, как правило, недостаточно для передачи информации, что приводит к периодичности работы радиолокатора с синтезированной апертурой (РСА), либо ухудшению пространственного разрешения. Применение адаптивного квантования и сжатия данных не позволяют полностью решить эту проблему. Растущая актуальность оперативного наблюдения и развитие технологий приводит к мысли о переносе вычислителя на борт космического аппарата. Это позволит получать изображение в режиме реального времени и максимально использовать возможности РСА.
Цель данной работы - разработка структурной схемы вычислительной системы для обеспечения синтеза РЛИ метрового разрешения на борту низкоорбитального космиче-
ского аппарата при маршрутном режиме съемки.
Алгоритм формирования РЛИ
Рассмотрим требования по быстродействию вычислительной системы при маршрутном режиме съемки. В [1] для синтеза РЛИ используется алгоритм, приведенный на рис. 1. Он совмещает в себе алгоритмы быстрой свертки и ЛЧМ-масштабирования для коррекции искажений. В фигурных скобках указаны номера производимых операций. Вычисление опорной функции по дальности и её дальнейшее преобразование по алгоритму БПФ {6} происходит в момент синтеза зондирующего сигнала и на защитном интервале. Вычисление опорной функции по азимуту и её дальнейшее преобразование по алгоритму БПФ {10} происходит до начала обработки радиоголограммы, остальные функции в процессе обработки не изменяются. Таким образом, все необходимые для синтеза данные хранятся в ОЗУ.
Обработка сигналов по данным алгоритмам сводится к следующему. Сначала происходит загрузка комплексных данных из АЦП в ОЗУ {1}. Далее производится умножение на весовую функцию подавления боковых лепестков {2} с последующим БПФ по азимуту {3}. Далее производится обработка по строкам дальности: БПФ {5}, умножение на
опорную функцию {6} и весовую функцию подавления боковых лепестков {7}, ОБПФ {8}. После чего снова производится обработка по азимуту: коррекция фазы ЛЧМ-масштабирования {9}, умножение на опорную функцию {10} и ОБПФ {11}.
{1)
{2}
Входная 20 радиоголограмма
{3}
{4} {5} {6} {7} {8} {9} {10} {11}
{12} Выходное комплексное радиолокационное
изображение Рис.1. Алгоритм обработки РЛИ в маршрутном режиме
Результатом вычислений является комплексное радиолокационное изображение {12}, готовое для конечной обработки и передачи на Землю потребителям. При этом в алгоритме можно выделить три этапа, операции в которых выполняются последовательно:
1) операции {2} - {4} обработка по азимуту;
2) операции {5} - {8} обработка по дальности;
3) операции {9} - {11} обработка по азимуту.
Особенность алгоритма в том, что последующий этап не может начаться после полного завершения предыдущего, это связано с переходом обработки по азимуту к обработке по дальности и наоборот. Поэтому в данном случае последовательное выполнение операций увеличивает требование к быстродействию системы и скорости производимых вычислений.
Аппаратная реализация вычислительных операций
Перейдем к выбору аппаратной реализации операций. Поскольку необходимо обеспечить максимальное быстродействие БПФ целесообразно выполнить на программируемых логических интегральных схемах (ПЛИС). Они обладают явным преимуществом во времени преобразования по сравнению с процессорами цифровой обработки сигналов (ПЦОС). Кроме того, ПЛИС позволяют создавать несколько вычислительных блоков внутри одной микросхемы, что улучшает массогабаритные показатели. Остальные операции (имеющие в своей основе комплексное умножение) лучше реализовать на ПЦОС, так как они приспособлены для последовательных вычислений: обладают многоступенчатым конвейером, поддерживают 81МБ режим, могут содержать несколько Б8Р-ядер и значительно проще в написании программы обработки.
Возможно также совместное использование ПЛИС и ПЦОС в рамках одного вычислительного кластера. Некоторые вопросы совместной работы ПЛИС и ПЦОС при решении задач обработки сигналов гидролокатора рассматривались в [2].
Выбор архитектуры вычислителей по алгоритму БПФ
Существует множество вариантов реализации блока БПФ (ОБПФ) на ПЛИС. Однако по своей сути они имеют сходные механиз-
мы функционирования и управления. Рассмотрим архитектуры вычислителей по алгоритму БПФ, предлагаемые фирмой Altera: streaming, variablestreaming, bufferedburst, burst. Они способны выполнять как прямое, так и обратное БПФ. В [3] приведены основные параметры и особенности функционирования.
Сравним данные архитектуры. По количеству используемых логических ячеек, DSP-блоков и производительности архитектуры, streaming и variablestreaming имеют явное преимущество, особенно первая. Единственное преимущество архитектур bufferedburst и burst - снижение объема используемой памяти. Так для архитектуры burst объем требуемой памяти в 2 раза меньше по сравнению с остальными. Однако по всем другим параметрам архитектуры bufferedburst и burst проигрывают, поэтому в дальнейшем рассматриваться не будут. Несмотря на универсальность архитектуры variablestreaming, она требует более сложного управления, имеет худшее время преобразования и большое расширение потока данных - 2,5 бита на каждую ступень БПФ (по основанию бабочки-4). Таким образом, наиболее подходящей для реализации является архитектура streaming.
Этапы обработки сигналов в вычислительных блоках
В соответствии с этапами алгоритма, выбранной архитектурой БПФ и аппаратной реализацией получаем следующий механизм обработки сигналов (рис. 2). Считаем, что разные блоки БПФ реализованы в отдельных ПЛИС. Поскольку один блок может выполнять как прямое, так и обратное БПФ, на этапе 2 возможно два варианта реализации:
а) этап разбивается на два подэтапа (общее количество этапов становится равным 4), однако требуется всего одна ПЛИС, которая выполняет сначала прямое БПФ, затем обратное; пунктиром на рис. 2 показано прохождение сигнала на втором подэтапе, при этом ПЦОС не задействованы;
б) количество этапов не меняется, но требуется две ПЛИС: одна для прямого БПФ, другая - для обратного.
Рис.2. Обработка сигналов и формирование РЛИ в вычислительных блоках
С точки зрения максимального быстродействия вариант а) менее предпочтителен, так как требует более высоких тактовых частот примерно на 30% и на втором подэтапе не задействует ПЦОС. Поэтому дальнейшие расчеты ориентированы на вариант б).
Расчет производительности системы
Типовое значение полосы съемки низкоорбитального спутника в маршрутном режиме съемки составляет 30 км. При разрешении порядка 1 м количество отсчетов дальности составит около 30 тысяч, а количество отсчетов азимута - около 6 тысяч. За исходные данные примем следующие значения:
• разрядность данных (мнимой и действительной части): 2 байта;
• основание БПФ по дальности: N^=32768;
• основание БПФ по азимуту: Ых = 8192;
• время синтеза: = 1 с.
Общее количество комплексных отсчетов N, обрабатываемых за время синтеза, составляет 805,3 миллиона. Время обработки одного отсчета 1,25 нс. Полученное быстродействие пока недостижимо для радиационно-стойких компонентов, поэтому необходима параллельная обработка в пределах этапа. Радиационно-стойкая ПЛИС Virtex-5QV фирмы Xilinx способна работать на частотах до 450 МГц [4], соответственно необходимо 2 вычислителя БПФ по основанию 8К и 4 вычислителя БПФ по основанию 32К (2 для прямого и 2 для обратного БПФ).
Рассмотрим возможность применения в качестве ПЦОС процессора семейства «Мультикор» МС-0226 (1892ВМ5Я), который содержит в себе 1 RISC и 2 DSP процессора. При максимальной тактовой частоте 100 МГц, 2 DSP-ядрах, 2SIMD режиме и представлении данных 1 байтом он выполняет 400 млн. комплексных умножений в секунду [5]. Соответственно на каждом этапе требуется 4 ПЦОС.
Расчет потоков данных и выбор интерфейса обмена
На основе полученных результатов рассчитаем скорость потока данных при обработке. Ширина спектра зондирующего сигнала при пространственном разрешении 1 м должна составлять 300 МГц. Частота дискретизации АЦП в РСА космического базирования выбирается на 10...11 % больше верхней частоты спектра и составляет 330 МГц. При представлении отсчета 4 байтами поток данных на выходе АЦП составит 1320 Мбайт/с. В процессе обработки поток данных составит 3200 Мбайт/с.
Перейдем к выбору интерфейса обмена. Передачу данных от АЦП к вычислительной системе способен обеспечить интерфейс RapidIO или RocketlO. При обработке обмен данными между вычислительными блоками (ПЛИС и ПЦОС) в 2,4 раза превышает поток входных. Такую пропускную способность также может обеспечить интерфейс
RapidЮили RocketIO (приемопередатчики RocketlOGTX содержатся в ПЛИС Virtex-5QV). Однако встроенные в МС-0226 Link порты способны пропустить 70.80 Мбайт/с (итого 280.320 Мбайт/с), а SpaceWire порты 50 Мбайт/с (итого 100 Мбайт/с), что явно недостаточно. Поэтому вопрос о выборе ПЦОС остается открытым.
Требования к ОЗУ
Проведем ориентировочную оценку затрат оперативной памяти:
• хранение комплексных данных исходного кадра размером 32Кх8К: 32Кх8Кх4 байта = 1 Гбайт;
• хранение 100 весовых функций подавления боковых лепестков по азимуту: 8Кх4 байтах 100 = 3200 Кбайт;
• хранение 2000 коэффициентов оператора ЛЧМ-масштабирования: 8Кх4 бай-тах2000= 64 Мбайта;
• хранение комплексных коэффициентов спектра копии сигнала (4 байта на 1 комплексный коэффициент) для реализации сжатия сигнала по дальности при количестве полиномов 100: 32Кх4 байтах100 = 12,8 Мбайт;
• хранение 100 весовых функций подавления боковых лепестков по дальности: 32Кх4 байтах100 = 12,8 Мбайт;
• хранение промежуточных данных на чтение/запись: 2х32Кх8Кх4 байта = 2 Гбайт;
• хранение 2000 коэффициентов коррекции фазы ЛЧМ-масштабирования: 8Кх4 бай-тах2000 = 64 Мбайта;
• хранение комплексных отсчетов спектра опорной функции для сжатия азимута при количестве опорных функций 100: 8Кх4 байтах 100 = 3200 Кбайт;
• хранение комплексных данных выходного кадра: 32Кх8Кх4 байта = 1 Гбайт.
Общий объем требуемой памяти составляет примерно 4256 Мбайт. Данное значение превышает типовое 4096 Мбайт на 160 Мбайт, однако следует отметить, что
Рис.3. Структурная схема вычислительной системы для обеспечения синтеза РЛИ
приБПФ размер входного кадра дополняется нулями до ближайшего большего основания. После преобразования эти значения отбрасываются (-2000 отсчетов). Таким образом, исходный кадр размером 30К*6К занимает 30К*6К*4 байта = 720 Мбайт, что экономит 304 Мбайта и позволяет применить типовое значение 4 Гбайта.
Поскольку все данные проходят через ОЗУ, к нему предъявляются повышенные требования по скорости обмена. Условно она состоит из 5 областей для следующих операций:
• запись исходного кадра (1320 Мбайт/с);
• чтение выходного обработанного кадра (1320 Мбайт/с);
• чтение/запись промежуточных данных (3200 Мбайт/с);
• чтение/запись коэффициентов (160 Мбайт/с).
Частично коэффициенты загружаются в ОЗУ при инициализации системы. Суммарная скорость запись/чтение составляет 4680 Мбайт/с.
Структурная схема вычислительной системы
Структурная схема вычислительной системы для обеспечения синтеза РЛИ представлена на рис. 3.
Яар1ёЮ (ЯоскеНО) коммутатор обеспечивает обмен данными между вычислительными блоками. Также он обеспечивает прием
данных входной радиоголограммы от АЦП и передачу выходного сформированного РЛИ на радиопередающее устройство (РПдУ) спутниковой радиорелейной линии связи.
Что касается элементной базы, то отечественные процессоры способны обеспечить требуемую производительность, однако их слабым местом являются интерфейсы обмена, что затрудняет создание многопроцессорных систем. Хотя отечественная промышленность не выпускает радиационно-стойких ПЛИС с большим числом логических элементов, на основе проектов можно создать базовые матричные кристаллы (БМК), производство которых освоено в России.
Большое количество отдельных блоков системы не способствуют ее быстродействию, поэтому стремятся к созданию систем на кристалле (СнК). В свете этого предлагается структурная схема (рис. 4), где ПЛИС используется в качестве сопроцессора, а ПЦОС имеет несколько DSP ядер и RISC процессор.
Рис.4. Структурная схема СнК
Такое решение обладает рядом преимуществ по сравнению с вышеизложенным вариантом:
• меньшее количество блоков - как следствие лучшие массогабаритные показатели;
• меньшее количество соединений между блоками позволяет улучшить электромагнитную совместимость устройств и более плотно расположить компоненты;
• отсутствие RapidIO (ЯоекеНО) коммутатора, поскольку его реализация занимает значительные ресурсы; однако RapidIO ^оскеНО) интерфейс может использоваться для связи с ПЛИС;
• использование одного ОЗУ вместо нескольких распределенных для каждого процессора - позволяет упростить хранение данных и доступ к ним.
Заключение
Таким образом, рассмотренная структурная схема вычислительной системы на основе ПЦОС и ПЛИС позволяет реализовать обработку РЛИ метрового разрешения. Данное решение обладает гибкостью и позволяет распределять вычислительную нагрузку
Поступила 18 января 2012 г.
между ПЦОС и ПЛИС для получения максимального быстродействия. Также даны рекомендации по оптимизации и увеличению быстродействия вычислительной системы. Кроме того, в процессе разработки выявлены направления совершенствования элементной базы: создание интерфейсов обмена с большой пропускной способностью.
Литература
1. Верба, В.С., Радиолокационные системы землеобзора космического базирования/ В. С. Верба, Л.Б. Неронский, И.Г. Осипов, В.Э. Турук - М.: Радиотехника, 2010. - 676 с.
2. Юдинцев, В., Янакова, Е. Цифровая обработка сигнала в гидролокаторах. Современные решения/ В. Юдинцев, Е. Янакова // Электроника: НТБ. 2010. №5. С.68-75.
3. FFT megacore function. User guide.v.11.1. Altera, 2011.
4. Space-grade Virtex-5QV FPGA / XILINX. -Режим доступа: http://www.xilinx.com/ products/silicon-devices/fpga/virtex-5qv/index.htm
5. DSP-технологии. Платформа "МУЛЬТИ-КОР" / 1892ВМ5Я (МС-0226). -Режим доступа: http://multicore.ru/index.php?id=46
The block diagramme of the computer system of synthesis radar image of the one meter resolution is in-process gained onboard the low orbit space vehicle at a stripmap mode.
Key words: SAR, space basing, synthesis radar image, stripmap mode.
Антонов Александр Юрьевич - студент Муромского института (филиала) ФГБОУ ВПО «Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых».
E-mail: aleksandr_uran@mail.ru.