Научная статья на тему 'Сравнительный анализ пространственных характеристик двухэлементных микрофонных решеток'

Сравнительный анализ пространственных характеристик двухэлементных микрофонных решеток Текст научной статьи по специальности «Физика»

CC BY
143
31
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДВУХЭЛЕМЕНТНЫЕ МИКРОФОННЫЕ РЕШЕТКИ / ДИАГРАММА НАПРАВЛЕННОСТИ / ПРОСТРАНСТВЕННЫЙ ОТКЛИК / ДИФФЕРЕНЦИАЛЬНЫЕ МИКРОФОННЫЕ РЕШЕТКИ / КОЭФФИЦИЕНТ НАПРАВЛЕННОСТИ / DUAL-MICROPHONE ARRAYS / DIRECTIONAL PATTERN / SPATIAL RESPONSE / DIFFERENTIAL MICROPHONE ARRAYS / DIRECTIVITY INDEX

Аннотация научной статьи по физике, автор научной работы — Столбов М.Б., Тхе Куан Чонг

Предмет исследования. Рассмотрены пространственные и частотные характеристики микрофонных решеток с продольной и поперечной архитектурой с двумя всенаправленными микрофонами и различными алгоритмами обработки. Методы. Исследование алгоритмов задержки и суммирования и дифференциальных алгоритмов выполнено с использованием и известных, и полученных аналитических выражений для передаточных функций и коэффициентов направленности. Основные результаты. Показано существенное преимущество дифференциальных алгоритмов по сравнению с алгоритмами задержки и суммирования при выделении целевых сигналов как в изотропном поле шума, так и в присутствии когерентных помех точечных источников. Практическая значимость. Полученные результаты могут быть использованы при разработке компактных микрофонных решеток, а также микрофонных решеток с большим числом элементов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Comparative study of spatial characteristics of dual microphone arrays

Subject of Research. The paper considers spatial and frequency characteristics of broadside and end-fire microphone arrays with two omnidirectional microphones and various processing algorithms. Methods. The study of delay and sum algorithms and differential algorithms is performed using known and obtained analytical expressions for transfer functions and directivity coefficients of microphone arrays. Main Results. It is shown that the differential algorithms have substantial advantage as compared with delay-and-sum algorithms in noise attenuating both from point and spatially distributed sources. Practical Relevance. The results may be used in the design of compact microphone arrays and microphone arrays with a large number of microphones.

Текст научной работы на тему «Сравнительный анализ пространственных характеристик двухэлементных микрофонных решеток»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ январь-февраль 2019 Том 20 № 1 ISSN 2226-1494 http://ntv.itmo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTCS January-February 2020 Vol. 20 No 1 ISSN 2226-1494 http://ntv.itmo.ru/en/

HHIIIDPMAIlHDHHhlX ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ

УДК 621.391.8 doi: 10.17586/2226-1494-2020-20-1-147-154

СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПРОСТРАНСТВЕННЫХ ХАРАКТЕРИСТИК ДВУХЭЛЕМЕНТНЫХ МИКРОФОННЫХ РЕШЕТОК М.Б. Столбов, Куан Чонг Тхе

Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация Адрес для переписки: stolbov@speechpro.com Информация о статье

Поступила в редакцию 30.12.19, принята к печати 20.01.20 Язык статьи — русский

Ссылка для цитирования: Столбов М.Б., Куан Чонг Тхе. Сравнительный анализ пространственных характеристик двухэлементных микрофонных решеток // Научно-технический вестник информационных технологий, механики и оптики. 2020. Т. 1. № 1. С. 147-154. doi: 10.17586/2226-1494-2020-20-1-147-154

Аннотация

Предмет исследования. Рассмотрены пространственные и частотные характеристики микрофонных решеток с продольной и поперечной архитектурой с двумя всенаправленными микрофонами и различными алгоритмами обработки. Методы. Исследование алгоритмов задержки и суммирования и дифференциальных алгоритмов выполнено с использованием и известных, и полученных аналитических выражений для передаточных функций и коэффициентов направленности. Основные результаты. Показано существенное преимущество дифференциальных алгоритмов по сравнению с алгоритмами задержки и суммирования при выделении целевых сигналов как в изотропном поле шума, так и в присутствии когерентных помех точечных источников. Практическая значимость. Полученные результаты могут быть использованы при разработке компактных микрофонных решеток, а также микрофонных решеток с большим числом элементов. Ключевые слова

двухэлементные микрофонные решетки, диаграмма направленности, пространственный отклик, дифференциальные микрофонные решетки, коэффициент направленности

doi: 10.17586/2226-1494-2020-20-1-147-154

COMPARATIVE STUDY OF SPATIAL CHARACTERISTICS OF DUAL MICROPHONE ARRAYS M.B. Stolbov, Quan Trong The

ITMO University, Saint Petersburg, 197101, Russian Federation Corresponding author: stolbov@speechpro.com Article info

Received 30.12.19, accepted 20.01.20 Article in Russian

For citation: Stolbov M.B., Quan Trong The. Comparative study of spatial characteristics of dual microphone arrays. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2020, vol. 20, no. 1, pp. 147-154 (in Russian). doi: 10.17586/2226-1494-2020-20-1-147-154

Abstract

Subject of Research. The paper considers spatial and frequency characteristics of broadside and end-fire microphone arrays with two omnidirectional microphones and various processing algorithms. Methods. The study of delay and sum algorithms and differential algorithms is performed using known and obtained analytical expressions for transfer functions and directivity coefficients of microphone arrays. Main Results. It is shown that the differential algorithms have substantial advantage as compared with delay-and-sum algorithms in noise attenuating both from point and spatially distributed sources. Practical Relevance. The results may be used in the design of compact microphone arrays and microphone arrays with a large number of microphones. Keywords

dual-microphone arrays, directional pattern, spatial response, differential microphone arrays, directivity index

Введение

За последние три десятилетия микрофонные решетки (МР) получили широкое применение из-за возможности выделять речевые сигналы в нестационарном шумовом окружении. Большое число методов выделения речи с использованием микрофонных решеток описаны в работах [1-6].

Компактные МР с небольшим (2-7) числом микрофонов используются чаще других благодаря удобству размещения и относительно хорошей пространственной избирательности [7, 8]. Простейшими МР являются двухэлементные микрофонные решетки (МР2). Свойства МР в значительной степени основываются на характеристиках МР2, поэтому рассмотрение этих характеристик представляется важной задачей.

Алгоритмы обработки сигналов МР2 рассмотрены в большом числе работ. При этом алгоритмы могут быть разделены на следующие основные группы [9]:

— алгоритмы формирования диаграммы направленности с фиксированными параметрами;

— адаптивные алгоритмы;

— алгоритмы пост-фильтрации.

Среди алгоритмов формирования диаграммы направленности можно выделить следующие:

— алгоритмы задержки и суммирования (delay-and-sum, DAS);

— дифференциальные алгоритмы (differential, DIF);

— алгоритмы сверхнаправленности (superdirective beamformers, SDB).

Данная работа посвящена исследованию алгоритмов DAS и DIF для МР2 с продольной и поперечной архитектурой. Алгоритмы SDB для МР2 в данной работе не рассматриваются, информация о них содержится, например, в работах [10-12].

Пространственные характеристики МР2 обычно рассматривают для двух основных сценариев шумового окружения: когерентный и диффузный шум [13]. В случае когерентного шума основной пространственной характеристикой является диаграмма направленности, описывающая подавление когерентного шума в зависимости от направления его прихода [1, 13]. В случае диффузного шума основной пространственной характеристикой является индекс направленности, характеризующий среднее подавление шума, поступающего со всех направлений, по отношению к звуку целевого источника, приходящему с главного направления [1, 13]. Другие пространственные характеристики МР описаны, например в [1].

Пространственные характеристики МР2 с алгоритмами DAS и DIF рассмотрены в ряде работ. Наиболее детально пространственные характеристики МР2 проанализированы для алгоритмов DIF [2-6].

В работе [14] дано сравнение характеристик МР2 для частных вариантов алгоритмов DAS и DIF. Однако приведенные результаты носят в основном качественный характер.

В работе [15] приведены некоторые характеристики микрофонных решеток с поперечной и продольной архитектурой для алгоритма DAS. Однако в указанной работе не описаны аналитические модели микрофонных решеток, что затрудняет проверку достоверности полученных результатов.

Наиболее полный анализ пространственных и частотных характеристик алгоритмов DIF на основе аналитической модели МР2 приведен в работе [16]. В работе рассмотрены характеристики алгоритмов DIF для сценариев когерентного и изотропного поля шума.

В работе [17] на основе аналитической модели МР2 рассмотрены свойства алгоритмов DAS и DIF для сценария когерентного шума.

Целью данной работы является анализ пространственных и частотных характеристик алгоритмов DIF и DAS на основе общих аналитических моделей МР2.

Алгоритмы формирования диаграммы направленности двухэлементных микрофонных решеток

Двухэлементные микрофонные решетки состоят из двух ненаправленных микрофонов, разнесенных на расстояние d.

Рассмотрим свойства МР2 с двумя основными группами алгоритмов обработки сигналов DIF и DAS. На рис. 1 представлены схемы обработки сигналов для этих групп алгоритмов. Символами и 9V обозначены углы прихода целевого речевого сигнала и помехи.

Основными параметрами МР2 являются расстояние между микрофонами и временная задержка т одного из сигналов микрофонов. Пусть с направления 9 на МР2 поступает сигнал S(®, к) с плоским волновым фронтом. На микрофоны плоская волна поступит с временным сдвигом x0cos(9). При этом в частотном представлении сигналы микрофонов будут сдвинуты по фазе:

,ndcos9 ,mxcos9

Xj(q, к) = S(®, к)еJ х = S(®, k)ej 2 ,

Рис. 1. Схемы обработки сигналов микрофонных решеток: с алгоритмами задержки и суммирования (а);

дифференциальными алгоритмами (б)

.ndcos0 .mxcosQ

Х2(ю, k) = S(®, k)e-j x = S(®, k)e-j 2 ,

где X — длина волны; 0 — угол относительно оси МР2 (угол зенита); ю — радиальная частота; k — индекс кадра; х0 = d/c — время прохождения звука между микрофонами; c — скорость звука; j = V-1.

В алгоритмах DAS фазы сигналов микрофонов выравниваются с помощью временной задержки одного из сигналов относительно направления прихода целевого сигнала и суммируются, формируя «луч» в направлении 0S источника целевого сигнала. Выходной сигнал МР2 с учетом временной задержки т будет следующим:

w®, k) = у «(ю, k) + Х2(ю, k)e—ют).

Передаточная функция равна отношению выходного сигнала Ydas(®, k) к входному S(ю, k). Можно показать, что для алгоритма DAS она следующая:

. nd / d Т \

HDAS(ro, 0) = e- х cos n—(cos(0) - —)) = V X т0 f

s(n^(cos(0) - r)j

= e-

eJ 2 cos

(1)

где r --

Т0

Значения параметра r определяют различные типы МР2: поперечную (broadside, BS) (r = 0), продольную (endfire, EF) (r = 1).

В алгоритмах DIF фазы сигналов микрофонов выравниваются относительно направления 0V прихода помехи и вычитаются, формируя «ноль» в направлении источника помехи. Таким образом, дифференциальные алгоритмы можно определить как алгоритмы задержки и вычитания [12]. Выходной сигнал МР2 с учетом временной задержки т будет следующим:

Ydif(w, к) = 2 (^(ю, к) + Х2(ю, k)e-jBT).

Тогда передаточная функция имеет следующий вид [16]:

. nd I d т \

HDn(m, 0) = je- x sinn—(— + cos(0)) = V X т0 /

. шТо / шт \

=je- T sin^n—+ cos(0))j.

Значения параметра r определяют различные типы дифференциальных МР2: диполь (r = 0), гиперкардиоида (r = 0,34), суперкардиоида (r = 0,57), кардиоида (r = 1) [16].

Используя выражения (1), (2) передаточных функций, проанализируем пространственные и частотные свойства микрофонных решеток.

Частотные характеристики микрофонных решеток

Пространственные и частотные свойства МР описываются диаграммой направленности В(ю, 0), равной квадрату амплитуды передаточной функции:

В(ю, 0) = |Я(ю, 0)|2.

В табл. 1 приведены соотношения для диаграмм направленности и частотных откликов МР2 в целевом направлении.

Из приведенных в табл. 1 формул следует, что частотные характеристики для алгоритмов DAS и DIF существенно отличаются.

В алгоритмах DAS частотный отклик в целевом направлении является равномерным и равен единице. Однако, если направление задано неточно, то частотная характеристика неравномерна, возникает эффект модуляции частотной характеристики.

В алгоритмах DIF частотная характеристика существенно неравномерна. В диапазоне низких частот отклик близок к нулю (сигналы подавлены), с ростом частоты отклик увеличивается и на частоте fc достигает единичного значения (первого максимума), далее колеблется от единицы до нуля. Частота первого максимума (частота отсечки) определяется выражением:

(3)

(2)

В табл. 2 приведены значения частоты отсечки для основных алгоритмов DIF.

Как следует из формулы (3) рабочий диапазон частот дифференциальных МР2 существенно зависит от расстояния между микрофонами. На рис. 2 для разных расстояний между микрофонами показаны графики частотных характеристик DIF в целевом направлении.

Таблица 1. Частотные характеристики МР2

Тип МР2

Диаграмма направленности

Частотный отклик МР2 в целевом направлении 0 = 0S

DAS (формула (1))

^das(o>. 6) =

/ют0 \ cos^-(г - cos(0))J

5das(®, 0 = 0.) =1

EF DAS

ÄEF(ra, 9) =

/што

cos^—-(1 - cos(0))

BEF(ffl, 0 = 0°) =1

BS DAS

I /®Т0 \ 5BS(ca, 0) = |cos^-cos(0)J

BBs(ffl, 0 = 90°) =1

DIF (формула (2))

I /fflT0

5DIF(m, 0) = jsiri^—^—1

(cos(0) +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5DIF(o,0=Oo) =

Т

Таблица 2. Частота отсечки дифференциальных МР2

Тип МР2 r d = 1,25 см d = 2,5 см d = 5 см

f^ кГц

Диполь 0 13,6 6,8 3,4

Гиперкардиоида 0,34 10,14 5,07 2,53

Суперкардиоида 0,57 8,64 4,32 2,16

Кардиоида (CAR) 1 6,8 3,4 1,7

Для выравнивания частотных характеристик дифференциальных МР2 в диапазоне низких частот (/ < /С) применяют эквалайзер (eq). Для направления = 0° эквалайзер имеет следующую частотную характеристику [16]:

1

/</с

tfeq(/)=j sin(7l/T0(r+ 1)) 1

f>fc

Следует отметить, что большие значения передаточной функции эквалайзера могут привести к значительному усилению сигналов, особенно независимых шумов (собственные шумы микрофонов, шум ветра и пр.). Степень усиления шумов описывается характеристикой, называемой коэффициентом усиления белого шума (White Noise Gain, WGN) [1]. Ограничение величины WGN является одним из требований при разработке алгоритмов обработки сигналов МР. Простым способом ограничения WGN является ограничение максимального значения передаточной функции эквалайзера.

Поскольку в диапазоне частот f > 2fc диаграмма направленности DIF становится многолепестковой, то можно ограничить рабочий диапазон частот для алгоритмов DIF значением 2fC.

В общем случае частотную характеристику DIF с эквалайзером, выравнивающим (без учета ограничений) отклик в направлении можно представить:

s

COZr,

sin -(r + cos(0))

CÖTn

sin -(г + cos(0?))

BmF(co, 0)

При этом максимальный отклик МР2 по-прежнему будет располагаться вдоль оси.

Пространственные характеристики микрофонных решеток

В алгоритмах DAS временная задержка х

r= —(|r| < 1) управляет направлением максимальной то

чувствительности («луча») МР2: r = cos(9s). С учетом этого диаграмма направленности принимает вид:

5das(®> 0)

ютп

COS -(cos(0) - cos(0s))

/Гц

Рис. 2. Графики частотных характеристик дифференциальных МР2 ^=1,25; 2,5; 5,0 см, 0^ = 0°,

частота дискретизации 16 кГц)

Из данного соотношения следует, что максимальный отклик микрофонных решеток DAS достигается в направлении 0 = 0S. Такую МР2 называют продольной, а ее диаграмма направленности описывается выражением:

ВЕF(ü), 0):

сот0

cosl -y (cos(0) - 1)

Если направление максимальной чувствительности близко нормали МР2 (0, = 90°), микрофонную решетку называют поперечной. В этом случае передаточная функция:

SBs(®> 0)= COS

ютп

(cos(0)

Таким образом, различие между продольной и поперечной МР2 с алгоритмом DAS целиком определяется величиной задержки.

В алгоритмах DIF временная задержка одного из сигналов микрофонов задает направление r = -cos(0v) нулей (±0v) диаграммы направленности [4]. Диаграмма направленности DIF может быть представлена в виде:

•®dif(®> 0) =

ютп

sin( — (г + cos(0))

<DTn

sin I -у— (cos(0) - cos(0v))

Частотную характеристику DIF с эквалайзером, выравнивающим (без учета ограничений) отклик в направлении 0, можно представить [17]:

5dif(CO, 0) =

сотп

sin -(cos(0) - cos(0v))

COTn

sin -(cos(0s) - cos(0v))

(4)

Из формулы (4) следует, что направление максимальной чувствительности (целевое направление) 0, у микрофонных решеток DIF всегда совпадает с направлением оси. Если |0У| > 90° (ео8(0у) < 0), то 0У = 0°. Если |0У| < 90° (соб(0у) > 0), то 0, = 180°. Таким образом, DIF являются микрофонными решетками с продольной архитектурой, а максимальный отклик находится в полусфере, противоположной полусфере нулей.

Диаграмма направленности описывает степень подавления когерентных сигналов (помех), приходящих с направления 0. Обычно когерентные помехи формируются точечными источниками, находящимися на небольшом расстоянии от микрофонной решетки. Отдельные когерентные помехи можно подавить, сформировав ноль диаграммы направленности в направлении источника помехи.

Другим сценарием работы является изотропный шум, равномерно поступающий на МР2 с различных направлений. Такие шумы формируются удаленными или пространственно-распределенными источниками. Например, это может быть речь сторонних дикторов в помещении, шумы в автомобиле и другом транспорте,

формируемые вибрацией. В этих случаях эффективность МР характеризуется коэффициентом направленности (directivity factor, DF), значение которого равно отношению отклика решетки в целевом направлении к усредненному отклику решетки на сигналы, поступающие со всех направлений. Величина коэффициента направленности определяется следующим выражением [1]:

т ю,0,)=

1 2л я

— I J |Я(с>, 0, <p)|2sin(0)iförf(p 4л о о

(5)

где 0,, ф, — углы направления на целевой источник (угол зенита и азимута соответственно).

Углы зенита и азимута являются независимыми, и поскольку диаграмма направленности МР2 симметрична относительно оси (для разных углов ф), то с учетом

271

/<Лр = 2к формулу (5) можно представить:

DF( св,е,) =

—||я(ю, eXsinOi/e

2 о

(6)

Формулы коэффициента направленности, как правило, записывают для направления 0S максимального отклика как DF(ro). Индекс направленности (directivity index, DI) рассчитывается как коэффициент направленности в децибелах:

DI(ro) = 10log10{DF(ro)}.

Обозначим спектр мощности целевого сигнала, поступающего с направления 0S как Pss(a>), а спектр мощности изотропного шума, поступающего из окружающего пространства, как Рии(ю). Среднее отношение сигнал-шум (signal-to-noise ratio, SNR) на микрофоне равно:

.л»/'

SNRJ, ffl)=101og10

Из (6) следует, что применение эквалайзера не изменяет величину коэффициента направленности. С учетом (5)-(6) значение отношение сигнал-шум в деци-беллах на выходе микрофонной решетки будет равно:

SNRout(ro) = SNRm(ro) + DI(ro).

В табл. 3 приведены формулы коэффициента направленности для различных алгоритмов МР2.

Графики индекса направленности для алгоритмов DAS(EF, BS) и DIF(кардиоида) в зависимости от частоты представлены на рис. 3.

Из приведенных графиков следует значительное преимущество в диапазоне низких частот решеток DIF по сравнению с DAS по критерию направленности. Однако это преимущество следует рассматривать с учетом значительного ослабления сигналов в низкочастотной области.

Помимо индекса направленности для различных сценариев применения МР используются другие пространственные характеристики [1, 2]:

— отношение чувствительности МР в фронтальной и тыльной полусферах (Front to Back Ratio, FBR);

Таблица 3. Коэффициенты направленности двухэлементных микрофонных решеток

Тип МР2 Коэффициент направленности

DAS DF(a>) 1 + cos(ö)Tq (cos(95) - r)) 1 + sinc((DI0)cOs(mx)

EF DAS DF(<ß) 2 1 + sinc(cüT0)cos(coT0)

BS DAS DF( со) 2 1 + sinc(<m;0)

DIF [16] 2Wf?(i+r))i

DF(<Ü) \ \ z // 1 - sinc((dt0)cOS((DT0)

1

— BS DAS — EF DAS — CAR

\......

4 / V / \ \ /

T\ / V / \ / } / / fy —*! / \ \ \

V \ 1 / j > 1 \ \ i /

У ^ У У у \ \ j j t \ \ i 1 i

2000

4000 /Гц

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6000

8000

Рис. 3. Зависимость индекса направленности от частоты (с1 = 5 см, частота дискретизации 16 кГц)

— подавление звука с направления, обратного направлению на целевой источник (Rear rejection, RR).

В случае решеток DIF эти характеристики существенно зависят от параметра задержки r. В табл. 4 приведены характеристики основных дифференциальных решеток (использованы данные из работы [2]).

Каждая из указанных в табл. 4 микрофонных решеток обладает максимальным значением по одному из критериев:

— всенаправленный микрофон — одинаковая чувствительность во всех направлениях;

— кардиоида — один ноль на 180°;

— суперкардиоида — максимум FBR;

— гиперкардиоида — максимум DI в диапазоне низких частот;

— диполь — максимальная чувствительность на 0°/180°, наибольшая частота отсечки.

Одним из ограничений решеток DIF является необходимость нацеливания оси МР2 на источник целевого сигнала, положение которого может быть неизвестным или меняться в процессе наблюдения. Это ограничение частично преодолевается в трехэлементных микрофонных решетках [18].

Зависимость характеристик микрофонных

решеток от расстояния между микрофонами

Степень направленности МР2 зависит от расстояния между микрофонами. С увеличением расстояния диаграмма направленности становится многолепестковой (пространственный отклик колеблется от нуля до единицы). При этом в алгоритмах DAS значение индекса направленности приближается к значению 3 дБ.

Обычно расстояние между микрофонами ограничено следующим соотношением:

С Чш

d<

Уш

или

d 1

— < —

к 2

Зависимость индекса направленности от отношения (d/X) показана на рис. 4.

Зависимость индекса направленности для алгоритма DAS (продольная архитектура МР2) и алгоритма DIF (кардиоида) от частоты и расстояния между микрофонами показана на рис. 5.

Из рис. 5 и других аналогичных расчетов следует, что расстояние между микрофонами, при котором достигается максимальное значение индекса направлен-

н

BS DAS EF DAS CAR

j \ / \ / X ____

F f \ л 1

/1 / i \

¡У

0,4

0,8 1,2 Отношение dfk

1,6

Рис. 4. Зависимость индекса направленности двухэлементных микрофонных решеток от отношения (й?/Х)

Таблица 4. Характеристики дифференциальных микрофонных решеток

Тип МР2 r DI f = 0 Гц) FBR RR Нули Частота отсечки

Микрофон 0 дБ 1,0 0 дБ — —

Диполь 0 4,7 дБ 1,0 0 дБ ±90° 1/То

Кардиоида 1 4,8 дБ 8,4 25 дБ 180° 0,5/т0

Гиперкардиоида 0,34 6,0 дБ 8,4 6 дБ ±110° 0,67/т0

Суперкардиоида 0,57 5,7 дБ 11,4 12 дБ ±126° 0,78/т0

/Гц /, Гц

Рис. 5. Зависимость индекса направленности двухэлементных микрофонных решеток от частоты: алгоритм задержки и суммирования (продольная решетка) (а); дифференциальный алгоритм (кардиоида) (б)

Таблица 5. Сравнение МР2 с поперечной и продольной архитектурой

МР2 Достоинства Недостатки

Broadside DAS плоская геометрия; возможность управлять направлением луча меньшее подавление вне оси МР; малое расстояние между микрофонами и их большое число необходимо, чтобы предотвратить пространственную утечку

Endfire DAS лучшее подавление вне оси, чем Broadside; меньший общий размер, чем Broadside неплоская (объемная) геометрия; направление на источник целевого сигнала должно совпадать с осью МР

DIF лучшая направленность в диапазоне низких частот; лучшее подавление вне оси; меньший общий размер неплоская (объемная) геометрия; направление на источник полезного сигнала должно совпадать с осью МР; более сложная обработка (эквалайзер); подавление целевого сигнала в диапазоне низких частот

ности, минимально для алгоритма DIF и больше для алгоритмов DAS.

Для алгоритмов DAS малая дистанция между микрофонами приводит к малой направленности в диапазоне низких частот, где фазовый сдвиг между сигналами микрофонов мал. При увеличении дистанции в диапазоне высоких частот длина волны становится малой по сравнению с расстоянием между микрофонами, диаграмма направленности становится многолепестковой, появляется пространственная утечка.

Для алгоритмов DIF малая дистанция между микрофонами соответствует максимальной направленности МР2 во всем диапазоне частот. Однако малая дистанция становится проблемой, поскольку приводит к увеличению чувствительности МР2 к ошибкам расположения микрофонов, разбросу их характеристик и шуму [19]. Таким образом, при выборе дистанции между микрофонами необходимо обеспечить компромисс между высокой направленностью в широком интервале частот и другими факторами.

В табл. 5 представлена сравнительная характеристика двухэлементных микрофонных решеток (использованы данные из работы [14]).

Заключение

При одинаковой архитектуре двухэлементных микрофонных решеток различные алгоритмы обработки придают им существенно разные свойства. Микрофонные решетки с дифференциальными алгоритмами являются более компактными и обеспечивают большее подавление шумов в низкочастотном диапазоне, чем решетки с алгоритмами задержки и суммирования. Однако частотная характеристика микрофонных решеток с дифференциальными алгоритмами является существенно более неравномерной, чем с алгоритмами задержки и суммирования. В зависимости от сценария применения микрофонных решеток предпочтительными могут оказаться различные критерии эффективности и различные алгоритмы обработки. Рассмотренные свойства двухэлементных микрофонных решеток следует учитывать при реализации других алгоритмов обработки сигналов микрофонных решеток, в том числе в алгоритмах обработки сигналов МР с большим числом элементов.

Литература

1. Microphone Arrays / ed. by M.Brandstein, D.Ward. Heidelberg, Germany: Springer-Verlag, 2001. XVIII, 398 p. doi: 10.1007/978-3-662-04619-7

2. Vary P., Martin R. Digital Speech Transmission: Enhancement, Coding and Error Concealment. John Wiley & Sons, 2006. 644 p.

3. Benesty J., Chen J. Huang Y. Microphone Array Signal Processing. Berlin, Germany: Springer-Verlag, 2008. 240 p. doi: 10.1007/978-3-540-78612-2

4. Benesty J., Chen J. Study and Design of Differential Microphone Arrays. Berlin, Germany: Springer-Verlag, 2012. 184 p. doi: 10.1007/978-3-642-33753-6

5. Benesty J., Chen J., Pan C. Fundaments of Differential Beamforming. Springer, 2016. 122 p. doi: 10.1007/978-981-10-1046-0

6. Benesty J., Cohen I., Chen J. Fundamentals of Signal Enhancement and Array Signal Processing. Wiley, IEEE Press, 2017. 440 p.

7. Buck M., Wolff T., Haulick T., Schmidt G. A compact microphone array system with spatial post-filtering for automotive applications // Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009). 2009. P. 221-224. doi: 10.1109/ICASSP.2009.4959560

8. Zhang H., Fu Q., Yan Y. A frequency domain approach for speech enhancement with directionality using compact microphone array // Proc. 9th Annual Conference of the International Speech Communication Association (INTERSPEECH 2008). 2008. P. 447-450.

9. Fischer S., Simmer K. An adaptive microphone array for hands-free communication // Proc. IWAENC-95. 1995. P. 1-4.

10. Bitzer J., Simmer K.U., Kammeyer K.-D. Multi-microphone noise reduction techniques for hands-free speech recognition - a comparative study // Proc. of Workshop on Robust Methods for Speech Recognition in Adverse Conditions (ROBUST 99). 1999. P. 171-174.

11. Bitzer J., Kammeyer K., Simmer K. An alternative implementation of the superdirective beamformer // Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPLAA'99). 1999. P. 7-9. doi: 10.1109/ASPAA.1999.810836

12. Lotter T., Vary P. Dual-channel speech enhancement by superdirective beamforming // Eurasip Journal on Applied Signal Processing. 2006. P. 1-14. doi: 10.1155/ASP/2006/63297

13. McCowan I.A. Microphone Arrays: A Tutorial [Электронный ресурс]. URL: http://www.aplu.ch/home/download/microphone_array. pdf (дата обращения: 13.01.2020).

14. Microphone Array Beamforming. Application Note AN-1140 [Электронный ресурс]. URL: http://www.invensense.com/wp-content/uploads/2015/02/Microphone-Array-Beamforming.pdf, свободный. Яз. англ. (дата обращения: 20.12.2019).

15. Designed Optimized Microphone Beamformers [Электронный ресурс]. URL: https://dspconcepts.com/sites/default/files/voice_ui_ part2.pdf (дата обращения: 13.01.2020).

16. Buck M., RoBler M. First order differential microphone arrays for automotive applications // Proc. 7th International Workshop on Acoustic Echo and Noise Control, IWAENC. 2001. P. 19-22.

17. Столбов М.Б., Перелыгин С.В. Алгоритмы двухэлементной микрофонной решетки для выделения речевых сигналов в присутствии когерентных помех // Цифровая обработка сигналов. 2017. № 4. С. 34-39.

18. Elko G.W., Pong A.-T.N. A steerable and variable first-order differential microphone array // Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP). 1997. P. 223226. doi: 10.1109/ICASSP.1997.599609

19. Buck M. Aspects of first-order differential microphone arrays in the presence of sensor imperfections // European Transactions on Telecommunications. 2002. V. 13. N 2. P. 115-122. doi: 10.1002/ett.4460130206

References

1. Microphone Arrays. Ed. by M.Brandstein, D.Ward. Heidelberg, Germany, Springer-Verlag, 2001, XVIII, 398 p. doi: 10.1007/978-3-662-04619-7

2. Vary P., Martin R. Digital Speech Transmission: Enhancement, Coding and Error Concealment. John Wiley & Sons, 2006, 644 p.

3. Benesty J., Chen J. Huang Y. Microphone Array Signal Processing. Berlin, Germany, Springer-Verlag, 2008, 240 p. doi: 10.1007/978-3-540-78612-2

4. Benesty J., Chen J. Study and Design of Differential Microphone Arrays. Berlin, Germany, Springer-Verlag, 2012, 184 p. doi: 10.1007/978-3-642-33753-6

5. Benesty J., Chen J., Pan C. Fundaments of Differential Beamforming. Springer, 2016, 122 p. doi: 10.1007/978-981-10-1046-0

6. Benesty J., Cohen I., Chen J. Fundamentals of Signal Enhancement and Array Signal Processing, Wiley, IEEE Press, 2017, 440 p.

7. Buck M., Wolff T., Haulick T., Schmidt G. A compact microphone array system with spatial post-filtering for automotive applications. Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP 2009), 2009, pp. 221-224. doi: 10.1109/ICASSP.2009.4959560

8. Zhang H., Fu Q., Yan Y. A frequency domain approach for speech enhancement with directionality using compact microphone array. Proc. 9th Annual Conference ofthe International Speech Communication Association (INTERSPEECH 2008), 2008, pp. 447-450.

9. Fischer S., Simmer K. An adaptive microphone array for hands-free communication. Proc. IWAENC-95, 1995, pp. 1-4.

10. Bitzer J., Simmer K.U., Kammeyer K.-D. Multi-microphone noise reduction techniques for hands-free speech recognition — a comparative study. Proc. of Workshop on Robust Methods for Speech Recognition in Adverse Conditions (ROBUST99), 1999, pp. 171-174.

11. Bitzer J., Kammeyer K., Simmer K. An alternative implementation of the superdirective beamformer. Proc. IEEE Workshop on Applications of Signal Processing to Audio and Acoustics (WASPLAA'99), 1999, pp. 7-9. doi: 10.1109/ASPAA.1999.810836

12. Lotter T., Vary P. Dual-channel speech enhancement by superdirective beamforming. Eurasip Journal on Applied Signal Processing, 2006, pp. 1-14. doi: 10.1155/ASP/2006/63297

13. McCowan I.A. Microphone Arrays: A Tutorial. Available at: http:// www.aplu.ch/home/download/microphone_array.pdf (accessed: 13.01.2020).

14. Microphone Array Beamforming. Application Note AN-1140. Available at: http://www.invensense.com/wp-content/uploads/2015/02/ Microphone-Array-Beamforming.pdf (accessed: 20.12.2019).

15. Designed Optimized Microphone Beamformers. Available at: https:// dspconcepts.com/sites/default/files/voice_ui_part2.pdf (accessed: 13.01.2020).

16. Buck M., RôBler M. First order differential microphone arrays for automotive applications. Proc. 7th International Workshop on Acoustic Echo and Noise Control, IWAENC, 2001, pp. 19-22.

17. Stolbov M.B., Perelygin S.V. Algorithms of a two-element microphone array for speech enhancement in presence of coherent interference. Digital Signal Processing, 2017, no. 4, pp. 34-39. (in Russain)

18. Elko G.W., Pong A.-T.N. A steerable and variable first-order differential microphone array. Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), 1997, pp. 223-226. doi: 10.1109/ICASSP.1997.599609

19. Buck M. Aspects of first-order differential microphone arrays in the presence of sensor imperfections. European Transactions on Telecommunications, 2002, vol. 13, no 2, pp. 115-122. doi: 10.1002/ett.4460130206

Авторы

Столбов Михаил Борисович — кандидат технических наук, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, Scopus ID: 56566801600, ORCID ID: 0000-0002-3848-4763, stolbov@speechpro.com

Куан Чонг Тхе — аспирант, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, Scopus ID: 57203964397, ORCID ID: 0000-0002-2456-9598, quantrongthe@corp.ifmo.ru

Authors

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Mikhail B. Stolbov — PhD, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, Scopus ID: 56566801600, ORCID ID: 0000-0002-3848-4763, stolbov@speechpro.com Quan Trong The — Postgraduate, ITMO University, Saint Petersburg, 197101, Russian Federation, Scopus ID: 57203964397, ORCID ID: 0000-0002-2456-9598, quantrongthe@corp.ifmo.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.