Научная статья на тему 'Повышение эффективности реализации корреляционных алгоритмов на базе ПЛИС для систем реального масштаба времени'

Повышение эффективности реализации корреляционных алгоритмов на базе ПЛИС для систем реального масштаба времени Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
394
68
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕННЫЕ ВЫЧИСЛЕНИЯ / АВТОМАТИЧЕСКОЕ СОПРОВОЖДЕНИЕ ЦЕЛЕЙ / КОНВЕЙЕРНАЯ ОБРАБОТКА / ОБРАБОТКА В РЕАЛЬНОМ ВРЕМЕНИ / ПЛИС / DISTRIBUTED COMPUTING / AUTO TARGET TRACKING / PIPELINE COMPUTING / REAL-TIME COMPUTING / FPGA

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Шапка Сергей Владимирович

Рассмотрены методы повышения эффективности аппаратной реализации корреляционно-экстремальных алгоритмов цифровой обработки изображений на базе микросхем с программируемой логической структурой (ПЛИС). Сформулированы основные критерии оценки эффективности аппаратной реализации алгоритмов с точки зрения их использования в современных оптико-электронных системах. Показаны критические для разработки быстродействующих систем элементы ПЛИС, оказывающие основное влияние на время формирования результатов вычислений, потребляемую мощность и конечную стоимость. Указаны основные факторы, влияющие на деградацию характеристик реализуемых на базе ПЛИС-алгоритмов. Приведен пример оптимизации одного из алгоритмов. Показано, что использование данного подхода позволяет существенно поднять характеристики систем, функционирующих в ПЛИС с использованием основных корреляционных алгоритмов видеообработки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Шапка Сергей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

IMPROVING EFFICIENCY OF CORRELATOR-BASED IMAGE-PROCESSING SYSTEMS IN FPGAREAL-TIME SYSTEMS

The paper deals with efficiency improving of correlation–based image processing systems for field programmable gate arrays. Outlined basic efficiencycriteria’sfor such systems. Shows the critical for the development of high-speed systems FPGA elements, which have the main impact on a calculation speed, power consumption and final cost. Identifies the main factors, affecting the degradation of the FPGA-based algorithms performance. Provided an example of effective image processing architecture in comparison with other approaches. Showed that the effectively optimized architectures improves overall system performance of image processing systems.

Текст научной работы на тему «Повышение эффективности реализации корреляционных алгоритмов на базе ПЛИС для систем реального масштаба времени»

Выводы

1. Разработан и исследован макетный образец быстродействующего оптического измерителя концентрации метана. Установлено: чувствительность по выходному напряжению составляет порядка 0,51 В/об%, абсолютная аддитивная погрешность измерения концентрации метана +0,02об%, что на порядок меньше, чем абсолютная погрешность измерения концентрации метана (не более +0,2 об%) в диапазоне от 0 до 4,0 об%.

2. Разработан и реализован способ компенсации температурного дрейфа измерителя концентрации газа, который в качестве термочувствительного элемента использует светодиод. Аппаратная реализация разработанного способа позволила оценить его эффективность: величина дополнительной погрешности измерения концентрации метана обусловленной изменением температуры составила не более +0,1 об%, что в 4 раза меньше требуемой.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Вовна А., Зори А., Хламов М. Методы и средства измерения концентрации газовых компонент. - Saarbrucken, Germany: LAP LAMBERT Academic Publishing GmbH & Co. KG, 2012. - 244 с. - Режим доступа: https://www.lap-publishing.com/catalog/. - ISBN-13: 9783-8484-2767-3; ISBN-10: 3848427672; EAN: 9783848427673.

2. Приборы шахтные газоаналитические. Общие требования, методы испытания: ДСТУ ГОСТ 24032:2009. - [Действующий от 2009-02-01]. - Киев: Держспоживстандарт, 2009. - 24 с.

3. Ioffe Physico-Technical Institute [Электронный ресурс] / Mid-IR Diode Optopair Group (MIRDOG). - Электронные данные. - Режим доступа: http://mirdog.spb.ru. - Дата доступа: январь 2013. - Загл. с экрана.

Статью рекомендовал к опубликованию д.т.н., профессор А.Е. Панич.

Вовна Александр Владимирович - Государственное высшее учебное заведение «Донецкий национальный технический университет»; e-mail: [email protected]; 83001,

г. Донецк, ул. Артема, 58, Украина; тел.: +380623045571; +380623010918; кафедра электронной техники; к.т.н.; доцент.

Зори Анатолий Анатолиевич - кафедра электронной техники; зав. кафедрой; д.т.н.; профессор.

Vovna Aleksander Vladimirovich - State Higher Education Establishment “Donetsk National Technical University”; e-mail: [email protected]; 58, Artyom street, Donetsk, 83001, Ukraine; phone: +380623045571; +380623010918; the department of electronic technics; cand. of eng. sc.; associate professor.

Zori Anatolii Anatolievich - the department of electronic technics; the head of department; dr. of eng. sc; professor.

УДК 621.396

С.В. Шапка

ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ РЕАЛИЗАЦИИ КОРРЕЛЯЦИОННЫХ АЛГОРИТМОВ НА БАЗЕ ПЛИС ДЛЯ СИСТЕМ РЕАЛЬНОГО МАСШТАБА

ВРЕМЕНИ

Рассмотрены методы повышения эффективности аппаратной реализации корреляционно-экстремальных алгоритмов цифровой обработки изображений на базе микросхем с программируемой логической структурой (ПЛИС). Сформулированы основные критерии оценки эффективности аппаратной реализации алгоритмов с точки зрения их использования в современных оптико-электронных системах. Показаны критические для разработки

быстродействующих систем элементы ПЛИС, оказывающие основное влияние на время формирования результатов вычислений, потребляемую мощность и конечную стоимость. Указаны основные факторы, влияющие на деградацию характеристик реализуемых на базе ПЛИС-алгоритмов. Приведен пример оптимизации одного из алгоритмов. Показано, что использование данного подхода позволяет существенно поднять характеристики систем, функционирующих в ПЛИС с использованием основных корреляционных алгоритмов видеообработки.

Распределенные вычисления; автоматическое сопровождение целей; конвейерная обработка; обработка в реальном времени; ПЛИС.

S.V. Shapka

IMPROVING EFFICIENCY OF CORRELATOR-BASED IMAGE-PROCESSING SYSTEMS IN FPGAREAL-TIME SYSTEMS

The paper deals with efficiency improving of correlation-based image processing systems for field programmable gate arrays. Ou tlined basic efficiencycriteria’sfor su ch systems. Shows the critical for the development of high-speed systems FPGA elements, which have the main impact on a calculation speed, power consumption and final cost. Identifies the main factors, affecting the degradation of the FPGA-based algorithms performance. Provided an example of effective image processing architecture in comparison with other approaches. Showed that the effectively optimized architectures improves overall system performance of image processing systems.

Distributed computing; auto target tracking; pipeline computing; real-time computing; FPGA.

Корреляционный метод оценки параметров смещения наблюдаемого изображения является одним из наиболее часто применяемых при решении различных задач цифровой обработки изображений в реальном масштабе времени. К ним можно отнести задачи автоматического сопровождения целей, электронной стабилизации изображений [1], анализа и компенсации движения в системах компрессии последовательности изображений, получения трехмерной информации о местности по результатам стереосъемки, совмещения изображений в мультиспектраль-ных системах наблюдения и пр.

Классический корреляционный алгоритм описывается следующим образом:

, (1)

где F(x,y) - взаимная корреляционная функция, H - эталон, L - наблюдаемое изображение. Значения (x' ,у') , при которых достигается значение максимума выражения (1), принимаются за смещение эталонов в текущем изображении. Для устранения зависимости значения функции от средней яркости фона используются

различного рода нормирующие функции, однако объем вычислений в этом случае

становится слишком велик, поскольку в этих алгоритмах присутствуют такие аппаратно-емкие операции, как умножение и извлечение корня. На практике чаще всего используются разностные алгоритмы, работающие по упрощенной формуле: F (х,у) = £ (у ) ен | I(i + x,j + у)- h (i,j) | . (2)

Точностные характеристики разностного коррелятора несколько ниже, чем у классического с нормированием. Однако при снижении отношения сигнал/шум результаты работы разностного и классического корреляторов становятся достаточно близки друг к другу, поэтому чаще всего в системах реального времени используется формула (2), как наиболее легко аппаратно-реализуемая. Особенностью использования корреляторов в системах реального масштаба времени является то, что они находятся в цепи обратной связи различного рода следящих систем [2]. Данная особенность обуславливает наличие требования минимизации времени вычислений

для уменьшения ошибок в контуре автосопровождения. На настоящий момент наибольшее распространение имеют системы с кадровой частотой 50/60 Гц и разрешением до 1024x768, однако для отдельных систем применяется повышенная кадровая частота (до 300 Гц) и разрешение до 2048x2048. Угловые размеры полей зрения и типовых объектов наблюдений задают размеры эталона от 16x16 до 64x64 элементов разложения. Типичной зоной поиска является прямоугольник, размерами в два раза большими, чем размеры эталона. То есть для эталона, размером 64x64, зона поиска будет иметь размеры 128x128. Типичная разрядность принимаема видеоданньк -8 или 10 бит. Таким образом, функциональные требования к корреляционной системе можно сформулировать следующим образом:

1) частота (периодичность) вычислений - 300 Гц, не менее;

2) время вычисления - < 1/300 Гц = 3,33 мс, не более;

3) размер эталона - до 64x64 э.р., включительно.

Для подвижный (мобильнык) наземный систем и летательный аппаратов дополнительно возникает требование по минимизации габаритов, энергопотреблению, тепловыделению и возможности функционирования аппаратуры при повышенной температуре. Аппаратура для реализации алгоритма должна иметь минимальную стоимость для возможности применения в массово производимый изделиж.

Функционирование коррелятора происxодит следующим образом. Вxодные видеоданные перед очередным циклом вычислений поступают на вxод узла вычисления суммы модулей разности. По мере получения сумм модулей разностей, определяется точка минимума такт сумм. Минимальное значение критериальной функции вместе с координатами, по которым она обнаружена, передается для дальнейшей обработки: принятия решения об успешности поиска, формирования координат смещения для передачи в формирователь управления контуром, принятия решения о необxодимости обновления эталона по полученным координатам и др. При размераx эталона более 16x16 наиболее ресурсоемкой частью является именно вычисление сумм модулей разности. Количество операций типа ^-у| с последующим накоплением суммы для эталона размером Wэт*Hэт по зоне поиска Wзп*Hзп вычисляется, как Wэт*Нэт*(Wзп-Wэт-1)*(Hзп-Hэт-1). Для максимального случая это 64*64*(128-64-1)*(128-64-1)*300Гц = 5,1*109 операций в секунду. Сокращение количества действий при заданныx условиж возможно только за счет сокращения зоны поиска с использованием какой либо дополнительной информации о вероятности наxождения цели в текущем кадре (например, используя прогнозирование траектории движения цели для определения точки начального поиска [3]). В реальный оптико-электронныx системаx такого рода прогноз не всегда возможен и ошибка определения точки для начального поиска оказывается слишком велика. Данная задача xорошо поддается распараллеливанию и конвейеризации. Максимальная тактовая частота ПЛИС при выполнении действий суммирования-вычитания в зависимости от разрядности, вида ПЛИС, и наxодится в пределаx от 150 МГц - для кристаллов с малой стоимостью - до 200... 250 МГц - в кристаллаx высокой производительности. Таким образом, чтобы обеспечить требуемые xарактеристики коррелятора, необxодимо 5,1*109 / 200*106 = 25, либо 5,1*109 / 150* 106 = 33 операционный узла. Если преобразовать формулу (2) в программный код, то мы получим 4 вложенный цикла - два внешнж по позициям сравнения эталона, и два внутренне - накапли-вающж разностную функцию. Условный алгоритм на языке Pascal и реализующая его аппаратура представлена на рис. 1.

Коррелятор на рис. 1 формирует результат 1 раз в 64*64 такта. Для соблюдения указанный выше требований этого слишком мало, поэтому необxодимо распараллелить операцию суммирования разностей. Это можно сделать, увеличивая число параллельный выкодов из памяти точек изображения и памяти точек эталона, например, как на рис. 2.

for y:=0 to 63 do for x:=0 to 63 do begin S := 0;

for ly := 0 to 63 do for lx := 0 to 63 do S := S + abs(L[y+ly,x+lx]) -H[ly,lx]));

F[y,x] := S; end;

(y+ly)*64+(x+lx)

ly*64+lx

Рис. 1. Алгоритм структура аппаратуры коррелятора

- F(x,y)

((y+ly)* 64+(x+lx))/4 — ((y+ly)* 64+(x+lx))/4+1 ((y+ly)* 64+(x+lx))/4+2 ((y+ly)* 64+(x+lx))/4+3

Память точек изображения

(ly*64+lx)/4 —

Память точек эталона

- F(x,y)

for y:=0 to 63 do for x:=0 to 63 do begin S := 0;

for ly := 0 to 63 do for lx := 0 to 64/4 do fop px:=0 to 3 do S := S + abs(L[y+ly,x+lx*4+px])

H[ly,lx*4+px]))

F[y,x] := S; end;

Рис. 2. Алгоритм и структура коррелятора с распараллеливанием входных

аргументов

Внутренний цикл в алгоритме на рис. 2, по переменной px условно означает параллельные операции. Такая реализация в 4 раза быстрее первой, но, к сожалению, данный подxод имеет аппаратные ограничения, что связано с тем, что количество физически линий, связывающиx памяти изображения и эталона, ограничено. При 8-битной шине данный и 64^ параллельный операцияx в кристалле будут сформированы 8*64*2 = 1 024 параллельный линий, каждая из который будет работать на операционной (максимальной) частоте и при этом большинство из нт будет разведено по достаточно длинным путям трассировки из-за разнесенности памяти и узлов, выполняющиx арифметические действия. Второе ограничение связано с конечным числом вxодов адреса на встроенной памяти. Если в памяти эталона возможно «смежное» xранение точек по 8, 16 и т.д. по одному адресу (для последующей параллельной выдачи), то ввиду особенностей порядка выборки данный Ь(у+1у,х+1х+рх*4), для каждого выкода данный необxодим отдельный вxод адреса. В ПЛИС число такт вxодов ограничено двумя и наращивание возможно только путем дублирования xранимыx данный в разный элемешж памяти. Третьим ограничением становится рост разрядности результата, что приводит на последнт этапаx к 20-разрядным сумматорам, быстродействие который в ПЛИС в среднем на 30-40 % ниже, чем у 8^^^^ Иными словами, по мере добавления параллельный каналов вычислений, объем занимаемый ресурсов будет расти лавинообразно с одновременным снижением тактовой частоты. Данная деградация xарактеристик связана с тем, что для быстродействия современный ПЛИС большое значение имеет «расстояние» передачи данный - задержки напрямую связаны с длиной линий. Для того чтобы увеличить количество вxодныx линий на операционную часть, можно воспользоваться конвейерной сxемой формирования подачи вxодного видео - воспользовавшись двумя группами линий задержки: вертикальной и горизонтальной. В этом случае нет необxодимости в многократной выборке однт и теx же исxодныx данный из видеопамяти. Структурная сxема для такой организации вычислений показана на рис. 3.

Изображение

Линия задержки

Т очки эталона

... 11

... -Ц

и

Линия задержки

Э —

Сумма

модулей

разности

фрагмента

эталона

Память

разностной

функции

Модули разности

Рис. 3. Схема оптимизированного вычисления сумм разностей

За каждый такт такая схема выдает и суммирует 16*16=256 разностей, что охватывает только 1/16 площади эталона. Чтобы не повторять выборку изображения для всех 16-ти частей эталона, достаточно изменить порядок формирования разностной функции. Модифицированный программный цикл показан на рис. 4.

Выбор

фрагмента

эталона

for y:=0 to 63 do for x:=0 to 63 do begin —s for py:=0 to 3 do

for px:=0 to 3 do begin

Параллельно

выполняемая

часть

S := 0

for ly := 0 to 15 do for lx := 0 to 15 do S := S + abs(L[y+ly,x+lx]) -H[py*16+ly,px*16+lx]));

F[y-py*16,x-px*16] := F[y-py*16,x-px*16]+S; end end

-py - 16,x-px- 16] := F [y-py ' 16,x-px- 1C

Коррекция

смещения

фрагмента

эталона

Рис. 4. Модифицированный цикл формирования разностной функции

Данный подход по сравнению с подходом, приведенным на рис. 2, позволяет увеличить быстродействие разностного коррелятора в среднем на 30-40 %. Результат тестовых трассировок на базе ПЛИС фирмы Хіііпхприведен в табл. 1. Стоимость кристаллов приведена с сайта официального поставщика www.avnet.com по состоянию на 25.02.2013 г. Показатели энергопотребления сформированы при помощи программы XPowerСАПР ISEDesignSuite 14.4 и представляют пиковое потребление (в момент вычислений). С учетом межкадровых пауз среднее потребление будет на 20-30 % меньше пикового, что может быть важным для малогабаритных систем с аккумуляторной системой электропитания.

Таблица 1

Микросхема Такт. частота, МГц Время вычислений, мс Макс. кадр. частота, Гц Пиковая потребляемая мощность, Вт Стоимость, евро

xc3sd1800a 142,8 1,84 543 1,100 32

xc5vlx30 200,0 1,31 763 1,563 257

xc6slx45 166,7 1,56 641 1,107 42

xc7k70t 285,7 0,92 1087 0,679 142

Согласно данных табл. 1, данный алгоритм способен функционировать в малогабаритных, малопотребляющих устройствах с высоким быстродействием. Таким образом, предложенный подход к оптимизации аппаратуры ПЛИС позволяет существенно снизить энергопотребление, позволит функционировать устройствам в более жестких условиях без принудительного охлаждения, обеспечивая тем самым функционирование разностного корреляционного алгоритма без каких-либо сокращений или деградации характеристик.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Алпатов Б.А., Стротов В.В. Алгоритм электронной стабилизации фона по опорным участкам в последовательности видеоизображений // Проблемы передачи и обработки информации в сетях и системах телекоммуникаций. Тез. докл. 12-й Междунар. науч.-техн. конференции. - Рязань, 2004. - С. 64-65.

2. Балашов О.Е., Степашкин А.И. Управление приводами видеокомпьютерной системы сопровождения объектов // Проблемы передачи и обработки информации в сетях и системах телекоммуникаций. Тез. докл. 12-й Междунар. науч.-техн. конференции. - Рязань, 2004. - С. 66-67.

3. Алпатов Б.А., Хлудов С.Ю. Алгоритм последовательных испытаний в задаче совмещения двумерных изображений // Изв. вузов. Сер. Электромеханика. - 1988. - № 7. - C. 87-91.

Статью рекомендовал к опубликованию д.т.н., профессор Л.П. Фельдман.

Шапка Сергей Владимирович - Федеральное государственное образовательное учреждение высшего профессионального образования «Рязанский государственный радиотехнический университет»; e-mail: [email protected]; 390005, г. Рязань, ул. Гагарина, 59/1, тел.: 84912460350; кафедра ЭВМ; аспирант.

Shapka Sergey Vladimirovich - Ryazan State Radio Engineering University; e-mail: [email protected]; 59/1, Gagarina, Ryazan, 390005, Russia; phone: +74912460350; the department of computer science; postgraduate student.

УДК 519.876.5

Е.Н. Бородулина, В.В. Корохов, И.С. Шабаршина

СМЕШАННЫЙ АЛГОРИТМ СЕЛЕКТИВНОЙ СБОРКИ ХИМИЧЕСКИХ

ИСТОЧНИКОВ ТОКА

Рассмотрено решение актуальной задачи снижения себестоимости продукции и повышения качества химических батарей путем совершенствования процесса сборки, обеспечивающего формирование максимального количества блоков батарей с учетом ограничений и особенностей производства химических источников тока. Предложен смешанный алгоритм оптимальной комплектации на основе метода селективной сборки с использованием генетического и эволюционного подходов, позволяющий решать два вида практических задач и учитывающий ограничения на массу элементов, батареи и геометрические размеры блоков элементов. Использование данного алгоритма при комплектовании химических источников тока обеспечивает снижение затрат и повышение качества изделий за счет обеспечения однородности физико-химических характеристик элементов, включаемых в один блок.

Генетический алгоритм; эволюционный подход; химические источники тока; селективная сборка.

i Надоели баннеры? Вы всегда можете отключить рекламу.