К. В. Овчинников, В. В. Сергеев
АППАРАТНАЯ РЕАЛИЗАЦИЯ ДВУМЕРНОГО ПАРАЛЛЕЛЬНО-РЕКУРСИВНОГО КИХ-ФИЛЬТРА
Двумерные параллельно-рекурсивные фильтры с конечной импульсной характеристикой (далее - ПРФ) могут эффективно применяться в различных задачах обработки изображений [1, 2]. Из рассмотренных в [2] ПРФ с различными базисами наименьшей оценкой сложности при равных показателях качества обладает ПРФ с прямоугольным базисом [3]. Несмотря на значительный выигрыш в сложности по сравнению с обычными КИХ-фильтрами, реализуемыми прямой сверткой, применение ПРФ в системах обработки изображений наиболее эффективным может быть при создании соответствующих аппаратных средств. Очевидна возможность реализации ПРФ различными многопроцессорными устройствами, однако возможности микропроцессоров по набору команд являются в данном случае избыточными, а по быстродействию -недостаточными. Высокая производительность ПРФ может быть обеспечена за счет использования специализированных вычислительных устройств с жесткой логикой, ориентированных только на выполнение данного алгоритма. Рассмотрим более подробно проблемы, связанные с разработкой устройства,
реализующего алгоритм ПРФ.
Далее везде будет подразумеваться устройство, реализующее ПРФ с прямоугольным базисом [2]. Соответствие между входными и выходными отсчетами в таком ПРФ задается выражением
К-1
,,/„ _ ч = т а ЕЕ х (п - ш , п - ш ),
У(П1«П2) к = 0 к (ю^ , т2)е°к
(1)
где у(п , п ) - отсчет выходного изображения в точке с координатами
(П1' V '
1 2
- прямоугольная область суммирования для к-го параллельного звена фильтра;
К - число параллельных звеньев.
Рекурсивная организация суммирования по областям Ок подразумевает, что устройство должно работать как часть конвейерной вычислительной системы обработки изображений (например, такой, какая описана в [4]). Отсчеты входного изображения подаются на вход устройства последовательно, и на каждый поступивший отсчет вычисляется одно значение выходного изображения.
Реализуемый таким образом ПРФ может содержать К структурно идентичных устройств, вычисляющих суммы по областям Ък (параллельные звенья), и арифметический блок, выполняющий взвешенное суммирование выходных отсчетов пар&лелльных звеньев. Арифметический блок, в свою очередь, состоит из К умножителей на весовые коэффициенты и сумматора на К входов. Структурная схема такого ПРФ изображена на рис.1.
Рис. 1. Структурная схема параллельно-рекурсивного фильтра.
Обозначения: 1 - рстура—ыв звенья; 2 - умвожжтелв им коэффяшкят; 3 - сумматор
Умножители на весовые коэффициенты и сумматор являются известными
устройствами, описание их реализации можно найти, например, в [5. 6].
Поэтому подробно следует остановиться лишь на структуре устройств, реализующих параллельные звенья фильтра. Как показано в [2], суммирование
по прямоугольным областям Бк выполняется рекурсивно, раздельно, в два этапа:
2к(П,П2) - 2к(П - 1.П2) + Х(Пг + - X(П^ + 1<3\п2Ь (2)
вк(пг,п2) - ак(п,п2 - 1) + гк(п1,п2 + 1|[2)) - ^(п^ч- (3)
где гк - промежуточная сумма отсчетов исходного изображения по координате г^?
8к(п . п ) - выходной отсчет звена ПРФ;
^к*' ^к2''^к3>'координаты границ к - окна суммирования (рис.2).
Г
Рис. 2. Пример расположения к - окна суммирования
В конвейерной вычислительной системе на вход устройства подается одномерная последовательность отсчетов, полученная построчной разверткой исходного изображения. Пусть длина строки развертки равна Ь отсчетов, тогда выражения (2) и (3) принимают следующий вид:
гк(т\) = гк(п - Ь) + х(п + Ь) - х(п + • Ь).
зк(п) + зк(п - 1) + гк(п + - 2к(п +
(4)
(5)
где 2к(п), зк(п) - текущие значения сумм по области Ок> Выражениями (4) и (5) определяется структура вычислительного устройства, изображенная на рис.3. Оно содержит четыре элемента задержки, два сумматора и регистр. Первым сумматором вычисляются отсчеты г^, вторым - отсчеты ек. Элемент задержки 4 обеспечивает подачу на вход сумматора 1 отсчетов входной
• _ _ ..(1) .(3).
последовательности с индексами, различающимися на величину - 1к ),
Рис. 3. Структурная схема звена ПРФ. Обозначения: 1, 2 - сумматоры; 3,4, 5, 6 - элементы задержки; 7 - регистр
а элемент задержки 5 - отсчетов последовательности задержанных на
строку. Аналогично элемент задержки 6 обеспечивает подачу на вход второго
, . (2)
сумматора отсчетов г^ с индексами, различающимися на величину (1 к~ Д-^4'). а регистр выполняет задержку последовательности на один такт. Для согласования работы звеньев во времени, т. е. для одновременного получения отсчетов с одинаковыми номерами на выходах звеньев, введен элемент задержки 3, который обеспечивает запаздывание сигнала х(п) на величину
Р = 1-Ь + Л" - 1(1)-Ь - 1<2\ к к
где 1,3 - соответственно максимальные значения величин з.(1,} з.<2) (к = = 0____К - 1). к
При разработке ПРФ с изменяемыми параметрами следует предусмотреть
возможность регулировки величины задержек в элементах 3, 4, 6, а также
загрузку величин весовых коэффициентов в умножители.
Элементы с изменяемой величиной основе оперативного запоминающего использованием интегральных микросхем возможной реализации элемента задержк:
задержки могут быть выполнены на устройства (ОЗУ), например, с статического ОЗУ. Структурная схема приведена на рис. 4.
1 ОЗУ
№7 К
- >
Рис. 4. Структурная схема элемента задержки. Обозначения: I - блок оту; 2. з - регистр; 4 - сумматор; 5 - ключ; б - одно вибратор; 7 - счетчик
Важным достоинством звена ПРФ с прямоугольным базисом является возможность выполнять все вычисления в формате с фиксированной точкой. При этом не требуется округлять результаты арифметических операций, и все вычисления могут быть выполнены без погрешностей. Однако при использовании Формата с фиксированной точкой возникает опасность переполнения разрядной сетки сумматоров, что недопустимо из-за значительных искажений выходного сигнала. Оценим длину разрядной сетки первого и второго сумматоров, требуемую для исключения переполнения. Пусть отсчеты входного изображения
представлены Ь-разряднынх двоичными числами, а размер окна суммирования не превышает М х N отсчетов.
Максимальное значение входного сигнала в этом случае равно 5-(2ь-1),
где 6 - шаг квантования. Максимальные значения сигналов и s^ равны соответственно
5(2ь-1)-М и 5(2b-l)-M-N.
Для их представления необходимо соответственно
b = b + < log М > (6)
1 ^2
Ь2 = Ь + < 1од2М-К > двоичных разрядов, (7)
где знак <С> означает в данном случае ближайшее целое, не меньшее С. Длина разрядного слова данных, хранимых в элементах задержки 3 и 4 (см. рис.3), равна Ь, для элементов задержки 5 и 6 требуемая разрядность определяется согласно (6), а для регистра 7 - согласно (7).
Сложность аппаратной реализации звена ПРФ, при прочих равных условиях, определяется разрядностью обрабатываемых данных. Объемы ОЗУ, необходимых для реализации элементов задержки 3, 4 и 5, 6, соответственно пропорциональны величинам Ь и Ь^ Сложность сумматоров также связана с разрядностью слагаемых. Несколько уменьшить сложность аппаратуры можно, выполняя усечение разрядной сетки в различных точках на пути прохождения данных в фильтре. Следует отметить, что в конвейерных системах обработки изображений обычно используется представление данных в одном формате на входе и выходе модулей, что также делает необходимым усечение разрядной сетки данных. В ПРФ усечение длины чисел может быть выполнено по крайней мере в четырех точках: на входе ПРФ, на выходе первого или второго сумматоров звеньев ПРФ и на выходе фильтра. Усечение разрядной сетки на выходе ПРФ не дает какой-либо экономии аппаратных средств и далее не рассматривается.
Очевидно, что любое усечение разрядной сетки данных приодит к появлению погрешности в выходном сигнале ПРФ, которую принято считать аддитивным белым шумом, вносимым в сигнал и имеющим дисперсию [7, 8]:
а2 =-|1. (8)
где 6 - шаг квантования. Для случая, когда уже квантованный сигнал
подвергается усечению разрядной сетки, дисперсия дополнительной ошибки оценивается выражением
акв = ТТ ' (9)
где q - количество усекаемых разрядов;
61 - шаг квантования сигнала до усечения разрядной сетки. При квантовании данных на входе ПРФ оценка погрешности на его выходе может быть получена согласно выражению
°лшакв'11 ь2(т1'т2Ь (10)
(т , т )€Р 1 2
где Ь(ш1>т2) - отсчеты импульсной характеристики фильтра;
- дисперсия ошибки, внесенной квантованием на входе ПРФ и оцениваемой по формуле (8).
При квантовании на входе или выходе вторых сумматоров звеньев ПРФ ошибки, вносимые в сигналы звеньев, можно считать независимыми. поэтому для оценки погрешности на выходе ПРФ воспользуемся выражениями
X2
а2 - -д--г '.(2 г- 1). I оРЛ.
к * О
(12)
« 2 ✓ 1 2'(Ч2>Ч1) | 24
'э - ТГ'2 ■ 2 - 1
К"1
I
к = О
2 2
где а2 и аз - дисперсии ошибок, вносимых усечением разрядной сетки соответственно на входе и выходе вторых сумматоров звеньев ПРФ; б1 - шаг квантования сигнала на входе ПРФ;
Ч2» с^ - величина усечения разрядной сетки соответственно на входе ПРФ, на входе и выходе второго сумматора звеньев;
<Эк - весовые коэффициенты согласно выражению (1) ;
- размер к - окна суммирования по координате п . Задаваясь допустимыми значениями а2 погрешности (или отношением сигнал - шум при известных статистических характеристиках обрабатываемых изображений), из выражений (8-12) можно определить допустимое усечение разрядной сетки в различных точках ПРФ. Распределение усечений разрядной сетки в структуре ПРФ следует выполнять, исходя из требования наибольшей экономии аппаратных средств. При условии, что сумматоры, счетчики, регистры и схемы управления могут быть выполнены на основе технологии заказных и полузаказных СБИС, экономия аппаратных средств будет определяться, в основном, уменьшением числа БИС ОЗУ, необходимых для построения устройств задержки. Считая, что на каждый бит слова данных в элементах задержки приходится одна БИС ОЗУ, получим оценку сложности ПРФ:
V = 2-Ь-К + 2 •Ь1 ■К, (13)
где величины Ь и Ь - разрядность данных в элементах задержки 3.4 и 5,6 соответственно.
Рассмотрим в качестве примера ПРФ, предназначенный для восстановления изображений. Выберем из [3] модель наблюдения с импульсной характеристикой искажающей системы вида «Гаусс» и отношением дисперсий ошибки и изображения О, 01.
Реализации ПРФ с разным числом параллельных звеньев обеспечивают различные величины относительной ошибки восстановления. Выбрав в качестве точки отсчета погрешность восстановления с помощью КИХ-фильтра, реализуемого прямой сверткой, в окне размером 9x9 отсчетов, определим необходимую разрядность данных в ПРФ, не уступающих по точности КИХ-фильтру. Оценки погрешности, приведенные в [3], получены для неквантованного представления отсчетов изображения. Применение в ПРФ арифметических устройст в с конечной длиной разрядной сетки вызовет дополнительные ошибки в выходном сигнале. При расчете погрешностей воспользуемся формулами (9), (10). Дисперсию ошибки, вносимую квантованием, будем оценивать по формуле
<г2 -.• »' , (14)
КВ 12 • 2гВ
где и - размах квантуемого сигнала;
В - число разрядов в слове данных.
Полагая, что входной сигнал имеет нормальный закон распределения, выразим размах сигнала через дисперсию изображения и получим из (14) выражение для относительной ошибки, вносимой квантованием:
а2
КВ - 3 (15)
2 2В
% 2
В таблицу сведены рассчитанные с учетом выражений (9), (10) и (15) допустимые значения длины разрядной сетки на входе ПРФ. Величина относительной ошибки, вносимой квантованием, определялась как разность между оценками ошибки для КИХ-фильтра, реализуемого прямой сверткой в окне 9x9 отсчетов, и оценками ошибки для ПРФ, взятыми из [3]. Оценки сложности вычислены по формуле (13) с учетом того, что максимальный размер окна суммирования не превышает 15 х 15 отсчетов, и величина Ьг должна быть, согласно выражению (6), больше, чем Ь, на 4.
Наименьшей сложностью обладает ПРФ с 5 рекурсивными звеньями, хотя теоретически достаточную точность обеспечивает ПРФ, имеющий 4 звена. Применение в ПРФ обычного для систем обработки изображений представления данных 8-разрядными словами позволяет считать погрешности, вызываемые квантованием, пренебрежимо малыми.
С целью проверки работоспособности ПРФ с разработанной структурой (см. схемы на рисунках 1, 3, 4) был изготовлен макетный образец фильтра. РекуР"
Параметры параллельно-рекурсивного фильтра для восстановления изображений
К <г2 /<г2 кв' и В V
4 0 00 00
5 0, 0014 6 160
6 0,0018 5 168
7 0,0019 5 196
8 0,0020 5 224
9 0,0022 5 252
10 0,0022 5 280
сивное звено ПРФ при реализации на микросхемах средней степени интеграции занимает одну плату в стандарте КЛМЛК (около 70 микросхем). Испытания макета показали его работоспособность и высокую производительность.
Литература
1. Ярославский П.П. Цифровая обработка сигналов в оптике и голографии: введение в цифровую оптику. М. : Радио и связь. 1987. - 296 с.
2. Сергеев В. В. Параллельно-рекурсивные КИХ-фильтры для обработки изображений. - В наст, сборнике.
3. Мурызин С. А., Сергеев В. В., Фролова Л.Г. Исследование эффективности параллельно-рекурсивных КИХ-фильтров. - В наст, сборнике.
4. Арефьев Е.Ю., Овчинников К. В., Сергеев В. В., Сойфер В. А. Нагистрально-модульные средства обработки изображений. - В сб. : Пета научно-техническа конференция «Телевизионна техника-89», Резюмета. НРБ, София, 19-20 октября 1989 г. , с. 4-7.
5. Опубликованная заявка ЕПВ номер 0189943, 1986 г.
6. Berger R.W. VLSI structures for real-time image convolution. - «IEEE Proc. of International Conference on Cybernetics and Society. Tuscon, Ariz., Nov. 12-15, 1985», New York, 1985, p. 676-679.
7. Введение в цифровую фильтрацию / Под. ред. Р. Богнера и А. Констандиниса. М.: Мир, 1976. - 216 с.
8. Капеллини В., Констандинис А., Эмилиани П. Цифровые фильтры и их применение. М. : Энергоатомиздат, 1983. - 360 с.