[ее]
http://dx.doi.org/10.35596/1729-7648-2021-19-6-14-22
Оригинальная статья Original paper
УДК 004.934.2+534.784
ИССЛЕДОВАНИЕ ПРИМЕНИМОСТИ ДПФ-МОДУЛИРОВАННОГО БАНКА ФИЛЬТРОВ В СИСТЕМАХ СО ЗНАЧИТЕЛЬНЫМ УСИЛЕНИЕМ СПЕКТРАЛЬНЫХ СОСТАВЛЯЮЩИХ
© Белорусский государственный университет информатики и радиоэлектроники, 2021
Аннотация. Целью работы является исследование применимости ДПФ-модулированного банка фильтров в системах, требующих значительного усиления спектральных составляющих, таких как слуховой аппарат. Приведено описание метода анализа / синтеза звукового сигнала на основе кратковременного преобразования Фурье (КВПФ), используемого в большинстве систем обработки речевой информации. Показано, что ДПФ-модулированный банк фильтров является обобщением метода обработки на основе КВПФ. В системе анализ / синтез на основе ДПФ-модулированного банка фильтров входной сигнал разделяется на субполосы, проходя через банк фильтров анализа, далее происходит усиление сигнала в каждой субполосе, конечным этапом является восстановление сигнала с помощью банка фильтров синтеза. Однако в цифровых системах со значительным усилением спектральных составляющих из-за разницы в коэффициентах усиления для каждой субполосы результирующий сигнал после восстановления имеет искажения. В работе приводятся выражения для функции искажений и функции спектрального наложения, позволяющие оценить величину искажений, возникающих в системе анализ / синтез ДПФ-модулированного банка фильтров. Также предложены эффективные алгоритмы расчета функции искажений и функции спектральных наложений. В дальнейшем планируется разработка процедуры оптимизации ДПФ-модулированного банка фильтров, основанной на предложенных эффективных алгоритмах расчета функций искажений и спектральных наложений банка фильтров.
Ключевые слова: ДПФ-модулированный банк фильтров, усиление, КВПФ, слуховой аппарат.
Конфликт интересов. Авторы заявляют об отсутствии конфликта интересов.
Для цитирования. Санько Н.С., Вашкевич М.И. Исследование применимости ДПФ-модулированного банка фильтров в системах со значительным усилением спектральных составляющих. Доклады БГУИР. 2021; 19(6): 14-22.
Н С. САНЬКО, М.И. ВАШКЕВИЧ
Белорусский государственный университет информатики и радиоэлектроники (г. Минск, Республика Беларусь)
Поступила в редакцию 22 марта 2021
RESEARCH OF APPLICATION OF DFT-MODULATED FILTER BANK IN SYSTEMS WITH SIGNIFICANT SPECTRAL COMPONENT AMPLIFICATION
NIKITA S. SANKO, MAXIM I. VASHKEVICH
Belorussian State University of Informatics and Radioelectronics (Minsk, Republic of Belarus)
Submitted 22 March 2021
© Belarusian State University of Informatics and Radioelectronics, 2021
Abstract. The purpose of this article is to investigate the application of DFT-modulated filter bank in systems with significant spectral component amplification like hearing aid. There is a description of analysis / synthesis method based on short-time Fourier transform (STFT), which is used in most systems of speech information processing. It is shown that DFT-modulated filter bank is a generalization of STFT-method. In analysis / synthesis system based on DFT-modulated filter bank, the input signal is divided into subbands, passing through the analysis filter bank then each subband is amplified and the last step is to reconstruct the signal with synthesis filter bank. However, in digital systems with significant spectral component amplification, the resulting signal is distorted after reconstruction because of amplification factor difference in each subband. The article provides expressions for the distortion and the aliasing functions, allowing to estimate the distortion value, which appears in analysis / synthesis system of DFT-modulated filter bank. Efficient algorithms for calculating the distortion and the aliasing functions are also offered. In future it is planning to develop a procedure for optimizing the DFT-modulated filter bank based on the proposed efficient algorithms for calculating distortion and spectral aliasing in the filter bank.
Keywords: DFT-modulated filter bank, gain, STFT, hearing aid.
Conflict of interests. The authors declare no conflict of interests.
For citation. Sanko N.S., Vashkevich M.I. Research of application of DFT-modulated filter bank in systems with significant spectral component amplification. Doklady BGUIR. 2021; 19(6): 14-22.
Введение
Одной из важных задач обработки речевых сигналов является создание систем повышения разборчивости речи для людей с тугоухостью. Как правило, для обработки сигнала в таких системах применяется метод анализа / синтеза с использованием банка фильтров [1-3]. Банк фильтров является цифровой системой, состоящей из секций анализа и синтеза [2] (рис. 1). Операции, выполняемые при синтезе сигнала, являются обратными операциями, выполняемыми при анализе [4]. При использовании в слуховых аппаратах в субполосах могут использоваться коэффициенты усиления (^к) достаточно высокого уровня (до 60 дБ) [2-3], что может вносить искажения при синтезе (восстановлении) сигнала.
Банк фильтров анализа
Коэффициенты усиления
Банк фильтров синтеза
(и) h„(n) |L xod) , ¡5» UD TL grin)
m ,
h,(n) |L x,([) , 4f TL gl(n)
'S
Ui^
,(п)
IL
XM-IU)
XM-I(I)
TL
gM-l(n)
Рис. 1. Банк фильтров с применением коэффициентов усиления Fig. 1. Filter bank using gain coefficients
В данной работе ставилась задача оценить эффективность использования ДПФ-модулированного банка фильтров в системах со значительным усилением спектральных составляющих. Для этого вначале показана связь ДПФ-модулированного банка фильтров с широко
используемым методом обработки сигнала на основе кратковременного преобразования Фурье. Приводятся теоретические обоснования метода расчета оконных функций для анализа и синтеза сигнала, позволяющих получить систему анализ / синтез с полным восстановлением (англ. perfect reconstruction). Для ДПФ-модулированного банка фильтров получающиеся оконные функции анализа и синтеза представляют собой фильтры-прототипы для секции анализа и синтеза соответственно. Далее в работе производится анализ функции искажений и функции спектральных наложений системы анализ / синтез на основе ДПФ-модулированного банка фильтров. Даются практические рекомендации по снижению уровня искажений в восстановленном сигнале.
Кратковременное преобразование Фурье
Кратковременное преобразование Фурье (КВПФ) (англ. STFT - short-time Fourier transform) широко используется для анализа, модификации и синтеза звуковых сигналов [4-5]. КВПФ можно рассматривать как преобразование со скользящим окном, которое имеет вид [5]
X (k, l) = £ h(n) х (n + IL )e-jat", (1)
n=0
где x(t) - входной сигнал, h(n) - ограниченная во времени оконная функция, а rak = 2%k/M, k = 0,1,...M — 1 - частотный индекс, L - временной шаг анализа (расстояние между соседними фреймами), l - номер фрейма анализа. Легко заметить, что (1) является вычислением дискретного преобразования Фурье (ДПФ) для сигнала h(n)x(n + lL) . Таким образом, представление X(k, l), получающееся в результате КВПФ, является последовательностью локализованных во времени спектров.
Выражение (1) представляет собой операцию анализа. Чтобы выполнять модификацию сигнала на основе КВПФ, необходимо иметь выражение и для синтеза сигнала. В идеальном случае синтез должен приводить к полному восстановлению сигнала (при условии, что спектральные составляющие остаются неизменными). Для восстановления необходимо использовать операцию обратного ДПФ (ОДПФ):
х,(n) = IDFT{X(k,l)} = h(n)x(n + lL), 0 < n < N — 1. (2)
Это выражение записано относительно внутрифреймового индекса n, его можно переписать относительно глобального времени t = n + lL :
х,(t — lL) = h(t — lL)x(t),lL < t < lL + N — 1, (3)
Процесс восстановления сигнала производится методом перекрытия с суммированием (от англ. OLA - overlap-add), с применением синтезирующего окна g(n) [5]:
х (t) = Xg(t — lL) • IDFT{X(k,l)} = ^g(t — lL)h(t — lL)x(t). (4)
l l
Таким образом, для восстановления всего сигнала х (t) каждый фрейм, сгенерированный ОДПФ, взвешивается на синтезирующее окно и добавляется к соседним окнам с перекрытием во времени [5]. В выражении (4) x(t) может быть вынесен за скобки:
х, (0 = х^) - ЩИ{г - ¡Ь) j . (5)
Значит, полное восстановление достигается, если к(п) и g(п) удовлетворяют ограничению
X g (г - ¡ьт - ¡Ь)=1. (6)
Рассмотрим один из подходов к получению окон, удовлетворяющих условию (6). Пусть есть окно кт (п), удовлетворяющее условию полного восстановления, т. е.
X ^ - ¡Ь) = 1. (7)
Тогда для анализа может быть выбрана произвольная оконная функция ^п) , а синтезирующее окно должно вычисляться следующим образом:
hpR(п)
g(n) =-
h(n)
(8)
Известно, что свойству (7) отвечает треугольное окно, окна семейства Блэкмена -Харриса, Хэмминга и Ханна. Рассмотрим пример, когда в качестве окна (п) выбирается окно Ханна. Для того чтобы избежать нулевых отсчетов в начале и конце, сгенерируем окно длины N + 2, а затем отбросим первый и последний отсчеты:
hPR (n) = 0,5 - 0,5cos
2nn
n = 1,2,...N.
N + 2,
В качестве окна анализа h(n) возьмем окно Хэмминга 2т
h(n) = 0,54 - 0,46cos
N
n = 0,1,...N -1.
(9)
(10)
Окно синтеза g(п) рассчитывается по выражению (8). На рис. 2 показаны полученные окна анализа и синтеза для значений параметров L = 256, N = 2L .
1 1
0.5
Временная область
Частотная область
^ ""у' X «_.
* / \ \
f й \
f 1 \
/ \
1 1 J \
1 / Окно ана.шм, hin) \ 1
1/ — — Окно сиггтсча. g(ti)
t , 1 1 1 1 1 г г
0 200 400
Номер отсчета, п
Рис. 2. Окна анализа и синтеза во временной и частотной областях Fig. 2. Analysis and synthesis windows in time and frequency domain
Амплитудно-частотная характеристика (АЧХ) анализирующего окна имеет типичный вид. В свою очередь, синтезирующее окно характеризуется довольно значительным уровнем первого бокового лепестка; при этом наблюдается постоянный наклон спада боковых лепестков.
Для иллюстрации обработки сигнала в системе анализ / синтез на основе КВПФ (M = N = 64, L = 32) использовался тестовый синусоидальный сигнал с частотой 500 Гц (длительность 0,25 с, частота дискретизации 8 кГц, см. рис. 3). Перекрытие фреймов в 50% процентов выбрано как наиболее выгодное с точки зрения минимизации вычислительных затрат.
В левой части рис. 3 изображена спектрограмма и временное представление синусоиды, подававшейся на вход системы анализ / синтез. По центру изображен восстановленный сигнал без внесения усиления, а справа показан восстановленный сигнал после субполосного усиления. В третьей, четвертой и пятой субполосах (центральные частоты 250, 500 и 750 Гц) были применены коэффициенты усиления, равные 10, 25 и 10 соответственно. На последнем графике рис. 3 наблюдаются искажения на частотах 250, 750, 1000 и 1250 Гц.
Анализируя приведенные графики, можно сделать вывод, что метод обработки сигнала на основе КВПФ вносит существенные нелинейные искажения при значительной модификации спектра сигнала. Чтобы оценить данные искажения, необходимо перейти к интерпретации метода КВПФ как банка фильтров.
Рис. 3. Синусоидальный сигнал, проходящий через систему анализ / синтез с субполосным усилением Fig. 3. Sinusoidal signal passing through the analysis / synthesis system with subband amplification
ДПФ-модулированный банк фильтров
Если в выражении (1) ввести обозначение
\ (г) = ь(-1 у^,
то выражение примет вид (для простоты примем Ь = 1)
X (к, l) = £ h(n) x( n +1 )e-= £ ht (-n) x( n +1) =
r = n +1
= £ x(r)ht (l - r) = Л (l).
(11)
(12)
Таким образом, (12) показывает, что представление X (к, l) можно рассматривать как результат свертки входного сигнала с импульсными характеристиками банка фильтров (11).
Аналогичным образом синтезирующая часть схемы (см. выражение (4)) также может быть представлена в виде свертки субполосных сигналов с импульсными характеристиками банка фильтров синтеза [5]:
gk (') = g (t )eJm"'. (13)
В результате КВПФ можно представить в виде структуры ДПФ-модулированного банка фильтров, для которого окно анализа h(t) играет роль фильтра-прототипа. Если H (eJm) Фурье-образ фильтра-прототипа h(t), тогда по свойству частотного сдвига выражение (11) в частотной области примет вид
Hk j = H * (ej(o3-% >)
= H *
С i 2nk
J\ т-~П e 1 M
J
(14)
Таким образом, банк фильтров состоит из сдвинутых по частоте версий фильтра-прототипа. На рис. 4 представлены АЧХ банка фильтров анализа и синтеза (фильтры-прототипы получены по выражениям (8) - (10) для значений параметров М = N = 64).
АЧХ банка фильтров анализа
АЧХ банка фильтров синтеза
^ -30 --40:
-50 ■fj
0
I М Р.:Щтrw-M 5 til" Щ :}■
0.4 0.6 0.8 1 0 0.2 0.4 0.6
со со
Рис. 4. АЧХ банка фильтров анализа и синтеза Fig. 4. Frequency response of analysis and synthesis filter bank
0.8
Расчет функций искажения и спектрального наложения для системы анализ / синтез
Рассмотрим вопрос оценки искажений, возникающих в системе анализ / синтез (рис. 1), на основе ДПФ-модулированного банка фильтров (см. выражения (11) и (13)). Для этого перейдем к описанию банка фильтров в г-области. Пусть Н (г) и О (г) представляют собой ^-преобразования фильтров-прототипов для секции анализа и синтеза. В этом случае фильтры анализа и синтеза описываются как
Hk(z)=H(zWkM), Gk(z) = G(zWM), к = 0,1,..M-1,
' M
2n
'M
(15)
где Жм = е
Выражение для субполосных сигналов, с учетом выражения (15) и процесса децимации, имеют следующий вид:
1 ь-1 ( Л ( Л
X, (г) = - £ Н г^Ж? X гЬЖ^ . (16)
Ь т=0 V У V У
Учитывая процесс интерполяции (повышения частоты дискретизации) в сочетании с выражениями (15) и (16), выходной сигнал банка фильтров представляется как [3]
м-1 1 ь-1 Г м-1 1
7(г) = £ О (гЖМ %Хк (гь ) = - £ £ $кО(М )Н (гЖ^ ) X (гЖьт ), (17)
ь,
к=0
к=0
где ^к - коэффициент усиления.
Разделим внешнее суммирование в выражении (17) для представления передаточных функций. При т = 0 и г = е]П данное выражение будет представлять функцию искажений системы анализ / синтез:
1 M-1
T(e'n) = M 2 *G
M к = 0
2п > Л
H
2i, > Л
(18)
Во всех остальных случаях при т = 1,... Ь — 1 данное выражение будет являться функцией расчета спектрального наложения:
A(e'°) = L 2
L m=1
2 * kG
(
к=0
' Q-T7к
2п П i
H
/I Q--к--m
1ML
(19)
Непосредственный расчет выражений (18) и (19) является вычислительно затратой операцией, поэтому в работе предлагается эффективный алгоритм расчета Т(е]П) и А(е]а). В алгоритме используется процедура БПФ (быстрого преобразования Фурье) для вычисления спектров фильтров-прототипов И(п) и g(п) .
Предполагается, что функции T(ejn) и A(ejn) будут оцениваться на регулярной частотной сетке, состоящей из Npt точек в диапазоне Q е [0, 2л] с шагом 2njNpt . Число Npt
должно быть кратным числу каналов банка фильтров M . В этом случае вычисление функций T(ejn) и A(ejn) будет производиться согласно следующим алгоритмам.
Алгоритм 1. Расчет функции искажений T (ejn) системы анализ / синтез банка фильтров. Вход: h = [h(n)]0<n<N - вектор коэффициентов фильтра-прототипа (секция анализа);
g = [g(и)]0<и<N - вектор коэффициентов фильтра-прототипа (секция синтеза); Выход: T = [T(ejn" )]0<v<Nt - вектор-строка значений функции искажений в точках частотной сетки = 2nvjNpt; Начало:
1. Дополнить нулями вектора h и g до длины Npt.
2. Вычислить Фурье-образы фильтров прототипов при помощи БПФ:
БПФ(М = H = [Hо (ejn" )]о<„<Npt ,
БПФ{g} = G = [Go(ejn" )]о <v< np1 .
3. Создать вектор T размера Npt состоящий из нулей.
4. Выполнить следующий цикл: for v = 0,1,...,Npt -1
for k = 0,1,...,M -1
T(v) = T(v) + £k • G ((v -1 • Npt/M)Nt ) • H ((v -1 • Npt/M)h endfor
endfor
5. Сформировать вектор T следующим образом: T = 1/ L • T .
Конец
Алгоритм 2. Расчет функции A(ejn) спектрального наложения системы анализ / синтез ДПФ-модулированного банка фильтров. Вход: аналогично Алгоритму 1.
Выход: A = [ A(ejn" )]0<v < N - вектор-строка значений функции спектрального наложения в точках частотной сетки Qv = 2nv/Npt; Начало:
1-2. Аналогично Алгоритму 1.
3. Создать вектор A размера Npt, состоящий из нулей.
4. Выполнить следующий цикл: for v = 0,1,...,Npt -1
for m = 1,2...,L -1
for k = 0,1,.,M -1
A(v) = A(v) + £k • G ((v - k • NJm)^ ) • H ((v - k • Npt/M - m • NJl)^ ) endfor
endfor
endfor
5. Сформировать вектор A следующим образом: A = 1/L • A .
Конец
В алгоритмах выражения вида означает операцию нахождения остатка от деления
а на Ь.
Результаты и их обсуждение
При прохождении сигнала через систему анализ / синтез на основе банка фильтров (M = 64, L = 32) в восстановленном сигнале наблюдаются искажения (см. рис. 3). Искажения появляются в результате процесса децимации / интерполяции (происходит неполное подавление компонент наложения спектров). Используя разработанные алгоритмы 1 и 2, были оценены функций искажения и спектрального наложения. На рис. 5 представлен график, на котором изображены искажения, вносимые банком фильтров, с использованием усиления и без него.
ш ■в 20
"Ъ 10 £
о
¡§ 0
^-20 "Ь -40 2-60
Функция искажения без усиления
1000
2000 П
■ I 1
3000
-1-г
4000
Функция спектрального наложения
:
-1 wwwwvwwwwvwwwwvww\ 1—I—I—I—I—г-1—I—I—I—I—1—I—1—I—г-1—I—I—I—I
1000
2000 il
3000
Функция искажения с усилением
1000
2000 ft
3000
4000
я о -d
7=5-20 'Т> 40
Функция спектрального наложения с усилением
4000
1000
2000 Ü
■ I ■
3000
4000
Рис. 5. Функции искажения и спектрального наложения без и с применением коэффициентов усиления
Fig. 5. Distortion and aliasing functions without and with amplification factor
Из приведенных графиков видно, что искажения, возникающие в системе, без использования коэффициентов усиления имеют достаточно малый уровень. Однако при использовании усиления появляются существенные искажения и наложения спектров, из-за чего в сигнале появляются паразитные компоненты. Для уменьшения искажений необходимо уменьшать коэффициент децимации / интерполяции банка фильтров L. Дополнительно требуется разработка подхода к расчету фильтров-прототипов ДПФ-модулированного банка фильтров для систем со значительным спектральным усилением.
Заключение
В работе проанализирована применимость ДПФ-модулированного банка фильтров в системах со значительным усилением спектральных компонент звукового сигнала. Было выявлено, что при использовании метода расчета фильтров-прототипов секций анализа и синтеза на основе оконных функций, позволяющих получить полное восстановление сигнала, наблюдаются достаточно высокие искажения в восстановленном сигнале. Экспериментальные результаты исследования наглядно демонстрируют, что при использовании значительных коэффициентов усиления субполосных сигналов на определенных частотах возникают паразитные компоненты. Таким образом, требуется минимизация искажений, которую возможно достичь разработкой специализированных фильтров-прототипов либо сокращением коэффициентов децимации / интерполяции в системе анализ / синтез на основе банка фильтров.
Список литературы
1. Вашкевич М.И., Азаров И.С., Петровский А.А. Цифровые банки фильтров для современных задач обработки звуковых сигналов. Доклады БГУИР. 2019; 2:100-111.
2. Schasse A., Gerkmann T., Martin R. Two-stage filter-bank system for improved single-channel noise reduction in hearing aids. IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2014;23(2):383-393.
3. Kurbiel T., Gockler H. G., Alfsmann D. A Novel Approach to the Design of Oversampling Low-Delay Complex-Modulated Filter Bank Pairs. EURASIP Journal on Advances in Signal Processing. 2009: 1-13. DOI: 10.1155/2009/692861.
4. Клионский Д.М., Куприянов М.С., Орешко Н.И. Модели и алгоритмы обработки вибрационных сигналов и мониторинга широкого частотного диапазона. Известия СПбГЭТУЛЭТИ. 2016;5:25-41.
5. Goodwin M.M. The STFT, Sinusoidal Models, and Speech Modification. Springer Handbook of Speech Processing. 2008;229-258. DOI: 10.1007/978-3-540-49127-9-12.
References
1. Vashkevich M.I., Azarov I.S., Petrovsky A.A. [Digital filter banks for modern audiosignal processing tasks]. Doklady BGUIR = Doklady BGUIR. 2019;(2):100-111. (In Russ)
2. Schasse A., Gerkmann T., Martin R. Two-stage filter-bank system for improved single-channel noise reduction in hearing aids. IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2014;23(2):383-393.
3. Kurbiel T., Gockler H. G., Alfsmann D. A Novel Approach to the Design of Oversampling Low-Delay Complex-Modulated Filter Bank Pairs. EURASIP Journal on Advances in Signal Processing. 2009: 1-13. DOI: 10.1155/2009/692861.
4. Klionskiy D.M., Kupriyanov M.S., Oreshko N.I.. [Models and algorithms of vibrational signal processing and wideband monitoring]. Izvestiya SPbGETULKTI. 2016;5:25-41. (In Russ)
5. Goodwin M.M. The STFT, Sinusoidal Models, and Speech Modification. Springer Handbook of Speech Processing; 2008;229-258. DOI: 10.1007/978-3-540-49127-9-12.
Вклад авторов / Authors' contribution
Санько Н.С. разработал алгоритмы расчета функций искажения и спектрального наложения ДПФ-модулированного банка фильтров, провел экспериментальные исследования.
Вашкевич М.И. определил задачи исследования, принимал участие в подготовке текста статьи и интерпретации результатов экспериментов. /
Sanko N.S. developed algorithms for evaluation of the distortion and aliasing functions of the DFT-modulated filter bank and conducted experiments.
Vashkevich M.I. defined the objectives of the research, took part in the preparation of the text of the article and the interpretation of the results of the experiments.
Сведения об авторах Information about the authors
Санько Н.С., ассистент кафедры электронных вычислительных средств Белорусского государственного университета информатики и радиоэлектроники.
Вашкевич М.И., к.т.н., доцент, доцент кафедры электронных вычислительных средств Белорусского государственного университета информатики и радиоэлектроники.
Адрес для корреспонденции
220013, Республика Беларусь,
г. Минск, ул. П. Бровки, 6,
Белорусский государственный университет
информатики и радиоэлектроники;
тел. +375-17-293-84-78;
e-mail: sanko@bsuir.by
Санько Никита Сергеевич
Sanko N.S., Assistant Lecturer at the Department of Computer Engineering of the Belarusian State University of Informatics and Radioelectronics.
Vashkevich M.I., PhD, Associate Professor, Associate Professor at the Department of Computer Engineering of the Belarusian State University of Informatics and Radioelectronics.
Address for correspondence
220013, Republic of Belarus, Minsk, P. Brovki str., 6, Belarusian State University of Informatics and Radioelectronics; tel. +375-17-293-84-78; e-mail: sanko@bsuir.by Sanko Nikita Sergeevich