Научная статья на тему 'Прием речевых сигналов в шумовой обстановке с использованием двухэлементных микрофонных решеток'

Прием речевых сигналов в шумовой обстановке с использованием двухэлементных микрофонных решеток Текст научной статьи по специальности «Физика»

CC BY
334
94
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОСТРАНСТВЕННАЯ ФИЛЬТРАЦИЯ / ДИАГРАММА НАПРАВЛЕННОСТИ / ДВУХЭЛЕМЕНТНЫЕ МИКРОФОННЫЕ РЕШЕТКИ / ЧАСТОТНОЙ ОТКЛИК / ПРОСТРАНСТВЕННЫЙ ОТКЛИК / SPATIAL FILTERING / BEAMPATTERN / DUAL MICROPHONE ARRAYS / FREQUENCY RESPONSE / SPATIAL RESPONSE

Аннотация научной статьи по физике, автор научной работы — Столбов М.Б., Чонг Тхе Куан

Предмет исследования. Рассмотрены практические вопросы дистанционного приема речевых сигналов в сложной шумовой обстановке с использованием двухэлементных микрофонных решеток (МР2). К настоящему времени теория МР2 хорошо разработана, однако применение МР2 в конкретных условиях требует специального рассмотрения. Методы. Выполнен сравнительный анализ алгоритма суммирования и дифференциального алгоритма обработки сигналов МР2 в частотной области. Основные свойства МР2 с алгоритмом суммирования и дифференциальными алгоритмами исследованы на основе использования аналитических моделей. Проведены экспериментальные исследования алгоритмов на записях, сделанных в безэховой камере и в натурных условиях. Рассмотрены сценарии точечного когерентного источника и распределенного источников шума. Основные результаты. Результаты экспериментальных исследований показали существенное преимущество дифференциальных алгоритмов обработки сигналов по сравнению с алгоритмом суммирования. Для различных вариантов дифференциальных алгоритмов достигнуто подавление уличного шума 10-12 дБ. Дополнительным преимуществом дифференциальных алгоритмов является возможность формирования нуля в направлении точечного источника помехи. Практическая значимость. Полученные результаты могут быть применены при проектировании систем голосового управления, в оборудовании видеокамер, в портативных системах звукозаписи, в системах акустического мониторинга. Результаты анализа алгоритмов МР2 также могут быть использованы при разработке компактных микрофонных решеток, а также микрофонных решеток с большим числом элементов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Speech acquisition in noisy environments using dual microphone arrays

Subject of Research. The paper deals with the practical aspects of distant speech acquisition in complex noisy environments using dual microphone arrays (MA2). The non-adaptive frequency-domain algorithms are described. The theory of MA2 is well developed so far, but the application of MA2 in specific conditions requires special consideration. The scenarios of point coherent interference and spatially distributed noise are studied. Methods. The comparison of differential algorithms and delay-and-sum algorithm is presented. The main properties of MA2 with summation algorithm and differential algorithms are researched on the basis of analytical models. Algorithms were tested on anechoic chamber recordings. The efficiency of the algorithms has been studied on recordings made near the street with intensive traffic. Main Results. The experimental results show the advantage of differential algorithms over delay-and-sum algorithm of both noise and interference suppression. For different variants of differential algorithms, street noise suppression about 10-12 dB is achieved. An additional advantage of differential algorithms is the possibility of forming in the direction of a point source of interference. Practical Relevance. The results obtained may be used in hands free communication devices, camera equipment, portable recording devices, in acoustic monitoring systems. The results of the analysis of MA2 algorithms can also be used in the development of compact microphone arrays, as well as microphone arrays with a large number of elements.

Текст научной работы на тему «Прием речевых сигналов в шумовой обстановке с использованием двухэлементных микрофонных решеток»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ сентябрь-октябрь 2018 Том 18 № 5 ISSN 2226-1494 http://ntv.i1mo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS September-October 2018 Vol. 18 No 5 ISSN 2226-1494 http://ntv.ifmo.ru/en

УДК 621.391.8

ПРИЕМ РЕЧЕВЫХ СИГНАЛОВ В ШУМОВОЙ ОБСТАНОВКЕ С ИСПОЛЬЗОВАНИЕМ ДВУХЭЛЕМЕ НТНЫХ МИКРОФОННЫХ РЕШЕТОК

М.Б. Столбов", Тхе Куан Чонг"

a Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация Адрес для переписки: stolbov@speechpro.com Информация о статье

Поступила в редакцию 06.07.18, принята к печати 26.08.18 doi: 10.17586/2226-1494-2018-18-5-850-857 Язык статьи - русский

Ссылка для цитирования: Столбов М.Б., Тхе Куан Чонг. Прием речевых сигналов в шумовой обстановке с использованием двухэлементных микрофонных решеток // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18. № 5. С. 850-857. doi: 10.17586/2226-1494-2018-18-5-850-857

Аннотация

Предмет исследования. Рассмотрены практические вопросы дистанционного приема речевых сигналов в сложной шумовой обстановке с использованием двухэлементных микрофонных решеток (МР2). К настоящему времени теория МР2 хорошо разработана, однако применение МР2 в конкретных условиях требует специального рассмотрения. Методы. Выполнен сравнительный анализ алгоритма суммирования и дифференциального алгоритма обработки сигналов МР2 в частотной области. Основные свойства МР2 с алгоритмом суммирования и дифференциальными алгоритмами исследованы на основе использования аналитических моделей. Проведены экспериментальные исследования алгоритмов на записях, сделанных в безэховой камере и в натурных условиях. Рассмотрены сценарии точечного когерентного источника и распределенного источников шума. Основные результаты. Результаты экспериментальных исследований показали существенное преимущество дифференциальных алгоритмов обработки сигналов по сравнению с алгоритмом суммирования. Для различных вариантов дифференциальных алгоритмов достигнуто подавление уличного шума 10-12 дБ. Дополнительным преимуществом дифференциальных алгоритмов является возможность формирования нуля в направлении точечного источника помехи. Практическая значимость. Полученные результаты могут быть применены при проектировании систем голосового управления, в оборудовании видеокамер, в портативных системах звукозаписи, в системах акустического мониторинга. Результаты анализа алгоритмов МР2 также могут быть использованы при разработке компактных микрофонных решеток, а также микрофонных решеток с большим числом элементов. Ключевые слова

пространственная фильтрация, диаграмма направленности, двухэлементные микрофонные решетки, частотной

отклик, пространственный отклик

Благодарности

Работа выполнена при государственной финансовой поддержке ведущих университетов Российской Федерации (субсидия 08-08).

SPEECH ACQUISITION IN NOISY ENVIRONMENTS USING DUAL

MICROPHONE ARRAYS M.B. Stolbov", The Quan Trong"

a ITMO University, Saint Petersburg, 197101, Russian Federation Corresponding author: stolbov@speechpro.com Article info

Received 06.07.18, accepted 26.08.18 doi: 10.17586/2226-1494-2018-18-5-850-857 Article in Russian

For citation: Stolbov M.B., The Quan Trong. Speech acquisition in noisy environments using dual microphone arrays. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2018, vol. 18, no. 5, pp. 850-857 (in Russian). doi: 10.17586/2226-1494-2018-185-850-857

Abstract

Subject of Research. The paper deals with the practical aspects of distant speech acquisition in complex noisy environments using dual microphone arrays (MA2). The non-adaptive frequency-domain algorithms are described. The theory of MA2 is well developed so far, but the application of MA2 in specific conditions requires special consideration. The scenarios of point coherent interference and spatially distributed noise are studied. Methods. The comparison of differential algorithms and delay-and-sum algorithm is presented. The main properties of MA2 with summation algorithm and differential algorithms are researched on the basis of analytical models. Algorithms were tested on anechoic chamber recordings. The efficiency of the algorithms has been studied on recordings made near the street with intensive traffic. Main Results. The experimental results show the advantage of differential algorithms over delay-and-sum algorithm of both noise and interference suppression. For different variants of differential algorithms, street noise suppression about 10-12 dB is achieved. An additional advantage of differential algorithms is the possibility of null forming in the direction of a point source of interference. Practical Relevance. The results obtained may be used in hands free communication devices, camera equipment, portable recording devices, in acoustic monitoring systems. The results of the analysis of MA2 algorithms can also be used in the development of compact microphone arrays, as well as microphone arrays with a large number of elements. Keywords

spatial filtering, beampattern, dual microphone arrays, frequency response, spatial response

Acknowledgements

This work was financially supported by the Government of the Russian Federation, Grant 08-08.

Введение

Выделение речи в сложной шумовой обстановке является актуальной задачей для ряда практических приложений, таких как акустический мониторинг в городе, системы телеконференций, акустическая разведка, системы голосового доступа и самообслуживания, системы голосового оповещения и многих других.

В сложной шумовой обстановке системы с одним микрофоном имеют ограниченные возможности выделения речевых сигналов (РС) из-за высокого уровня шума и его изменчивости. В таких условиях эффективным методом выделения РС является пространственная фильтрация, реализуемая с применением микрофонных решеток (МР). Микрофонные решетки позволяют ослабить как нестационарный шум окружения, так и реверберацию. Простейшими МР являются двухэлементные решетки (МР2). Рассматриваемые МР2 состоят из двух ненаправленных микрофонов, разнесенных на расстояние d. Благодаря простоте и компактности МР2 нашли применение в решении различных задач, в том числе для подавления реверберации и шума в системах дистанционного распознавания речи [1-4]. В настоящее время выпускаются как сами МР2, так и схемы для обработки сигналов МР21,2,3,4 .

Теория МР2 хорошо разработана [5-11]. Предложено большое число алгоритмов обработки сигналов МР2. Однако общие модели, как правило, не учитывают частные особенности акустической обстановки. Кроме того, обычно рассматривается применение МР2 для выделения речи близкого диктора и подавления шума удаленных источников. Применению МР2 для выделения речи удаленных дикторов и дистанционного распознавания речи посвящено относительно небольшое число работ [например, 12]. Данная работа посвящена исследованию применения МР2 для дистанционного приема РС в сложной шумовой обстановке.

Речевые сигналы являются широкополосными (занимают несколько октав), при этом свойства как самих РС, так и шумов окружения могут существенно различаться в разных диапазонах частот. Чтобы иметь возможность выполнять оптимальную обработку в разных диапазонах, ее целесообразно проводить в частотной области. В этом случае сигналы микрофонов xt (п) сегментируются на кадры, взвешиваются временными окнами и трансформируются с помощью кратковременного дискретного преобразования Фурье (ДПФ, DFT) в последовательность спектров:

Xi(n)^ DFT ^ Xi(f,k), где f,k - индексы частоты и кадра, i=1, 2 - индекс номера микрофона.

После всех преобразований сигналов формируется последовательность спектров выходного сигнала Y(f,k), которая с помощью обратного преобразования Фурье (ОДПФ) преобразуется в последовательность кадров выходного сигнала Y(k) и далее с помощью алгоритма накопления и суммирования [5] преобразуется в выходной сигнал. Общая схема обработки сигналов МР2 приведена на рис. 1. На рис. 1 символами 0S, Qv обозначены углы прихода целевого сигнала и помехи, символом d - расстояние между микрофонами.

1 http://www.andreaelectronics.com/array-microphone // SuperBeam stereo Array Microphone.

2 http://www.ti.com/lit/ds/symlink/lmv1090.pdf. LMV1090. Dual Input, Far Field Noise Suppression Microphone Amplifier. System Description // Texas Instruments, 2013.

3 https://www.synaptics.com//CX20921 - Two-Microphone Far-Field Voice DSP Processor SoC.

4 High Performance, Low Noise Studio Microphone with MEMS Microphones, Analog Beamforming, and Power Management // Application note. AN-1328, Analog Devices, www.analog.com.

Принято различать два типа архитектуры МР - broadside (поперечная) и endfire (продольная) [5]. В случае поперечной архитектуры целевой РС может поступать на МР с произвольного угла и МР формирует луч в направлении источника сигнала. В случае продольной архитектуры МР обыкновенно предполагается, что целевой сигнал приходит с направления, близкого к оси МР, проходящей через микрофоны (рис. 1).

Целевой сигнал Мик. 1 0s

ev

Помеха Мик. 2

xi(t) d x2(t)

ДПФ ДПФ

Xi(fk)

0s

dv

Обработка сигнала

ВД)

вд

Накопление и суммирование

t Y(t) Выходной сигнал

Рис. 1. Схема обработки сигналов двухэлементной микрофонной решетки в частотной области

Целью представленной работы является анализ и сопоставление алгоритмов пространственной фильтрации двухэлементных МР для выделения речи в шумовой обстановке. Рассмотрены алгоритмы обработки сигналов МР2 с поперечной и продольной архитектурой.

Модель микрофонной решетки с алгоритмом задержки и суммирования

В МР2 временные задержки сигналов микрофонов позволяют управлять направлением наилучшего приема целевого сигнала (луча МР2). Сигнал X0(f,k) с направления 0Ж (угол от оси МР) формирует вектор сигналов микрофонов:

X(f,k) = [X1(f,k),X2(f,k)]T = X0(f,k)D(f,4>x), где ()т - символ транспонирования, D(f,<Px) = Dx(f) = [е~^Фх,е+^Фх]т - вектор фазовых сдвигов сигналов микрофонов относительно центральной точки между микрофонами.

ФХ(П = ndcos(0x)/X = n/Tocos(0x), где d - расстояние между микрофонами; с - скорость звука в воздухе; т0 = d/c временная задержка прохождения звука между микрофонами.

Диаграмма направленности (ДН) характеризует отклик МР на когерентные сигналы, поступающие с направлений 0Ж (0-360°), и описывает МР2 как пространственный фильтр. Формирование луча в направлении целевого источника 0S осуществляется выравниванием временных задержек сигналов микрофонов относительно направления 0S и последующего суммирования этих сигналов (алгоритм задержки и суммирования, Delay-And-Sum, DAS). В этом случае отклик МР2 на сигнал, поступающий с произвольного направления 0Ж, будет следующим [11]:

Y(f,k,Qx)=-2DsH(f)X(f,k) = 1-DsH(/)Dx(f)X0(f,k), где ()и- символ сопряжения Эрмита.

Пространственно-частотный отклик характеризуется передаточной функцией между сигналом Xo(f,k) и выходом МР2. При формировании луча МР2 в направлении 0S пространственно-частотный отклик описывается следующей формулой [13]:

lH(f,0)l = lY(f,k,0)/Xo(f,k,0)l = lcos(nfTo(cos(0)-cos(0s)))l (1)

На рис. 2 показаны пространственные отклики МР2 для различных направлений луча.

Свойства МР2 с алгоритмом суммирования:

1. пространственный отклик симметричен относительно оси МР2;

2. из (1) и рис. 2 следует, что диапазоне низких частот f < d/c) МР2 имеет слабую пространственную избирательность;

3. МР2 не может подавлять широкополосные когерентные помехи точечных источников.

120

90

150

180

210

120

90

90

150

300

120

1

150

180

210

0 180

210

0,:

0,6 30

0,4

0,2 0

270 а

270 б

V.;

240

300 270

в

Рис. 2. Пространственные отклики поперечной двухэлементной микрофонной решетки: б =5 см, f = 1000 Гц для алгоритма задержки и суммирования: луч 0Х = 0° (а); луч 0Х = 90° (б); луч 0Х = 45° (в)

Модель микрофонной решетки с дифференциальным алгоритмом

Ограничения МР2 с алгоритмом задержки и суммирования частично преодолеваются в дифференциальной микрофонной решетке (ДМР2). В дифференциальных алгоритмах (ОГР) сигнал одного из микрофонов задерживается на величину т и вычитается из сигнала другого микрофона (рис. 3) [5].

Л

Т

й Л

У

X

I

Рис. 3. Схема двухэлементной дифференциальной микрофонной решетки

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сигнал от удаленного источника с направления 9 попадает на микрофоны с временным сдвигом т0 0080, формируя на микрофонах сдвинутые по фазе сигналы: Х1(/,к) = Х0(/,к)ехр (]пГт0созв) Х2(/,к) = Х0(/,к)ехр (-Мт0созв), где Х0 ([, к) - сигнал в средней точке между микрофонами; т0 = й/с - временная задержка прохождения звука между микрофонами; с = 344 м/с - скорость звука в воздухе.

После задержки т сигнала второго микрофона выход ДМР2 будет следующим: ¥(/, к) = -2 (Х1(/, к) - Х2(Г, к)е~^).

Тогда функция пространственно-частотного отклика описывается следующей формулой:

1н(Г,в)1 = 1У(г,к)/х0(г,к)1 =

Б1П

п[т0 + ШБ0

))

(2)

Передаточная функция ДМР2 зависит от временных сдвигов т, т0.

Рассмотрим условие формирования нуля ДН в направлении 0„ источника помехи:

1Н([, 0„)| = - = -соб(0Д ( |0„| < 90° ~ т < 0).

то

Отрицательная задержка сигнала второго микрофона эквивалентна положительной задержке сигнала первого микрофона.

В общем случае можно сформировать ДН с нулем в заданном направлении, что позволяет подавлять широкополосную когерентную помеху, поступающую с этого направления. При условии (|0У| > 90°) пространственный отклик ДМР2 имеет основной лепесток (максимальный пространственный отклик) в направлении целевого источника (0Х = 0°). В случае (|0У| < 90°) ДМР2 формирует основной лепесток в противоположном направлении (0Х = 180°).

На рис. 4 показаны пространственные отклики ДМР2 с различными направлениями нуля.

90

150

180

210

270

180

210

0 18'

330

270 б

240

270 в

300

Рис. 4. Пространственные отклики двухэлементной дифференциальной микрофонной решетки: б = 5 см, f = 1000 Гц для разных направлений формирования нуля: 9^=135° (а); 9^=90° (б); 9^=45° (в)

В диапазоне низких частот ДМР2 имеет один или два лепестка, что характеризует ее хорошую пространственную избирательность. На высоких частотах ДН становится многолепестковой, и ДМР2 утрачивает пространственную избирательность. По этой причине принято ограничивать рабочий диапазон частот ДМР2 [11].

ДН характеризует отклик МР на когерентные сигналы, поступающий с различных направлений. Для других сценариев акустической обстановки используются другие характеристики. В случае диффузного поля шума используют индекс направленности (Directivity Index, DI). В случае пространственно-протяженной области шума используют отношение чувствительности ДМР в прямом и обратном направлениях (Front-to-Back Ratio, FBR), а также ширину основного лепестка [5].

Параметры ДМР2 для наиболее интересных случаев приведены в табл. 1 [9]. На рис. 5 представлены пространственные отклики соответствующих ДМР2 (d = 4,25 см, f= 500 Гц) для разных величин задержки т (формула (2)):

120

90

0,4

150 180

П 210

0,3 0,2 0,1

60

120 -900105,2 60

30

150

i г

330

300

0 180

■7

0,15 0,1 .—-.0,05

30 30

150

120 90 0,3 60 120 0,2 60

90

0 18

уЩ -п.., /71 Ч;- УмГ/

210

240

270

240

270 б

330

300

210

240

270 в

0,1 30 0

330

300

180

\

210

240

270

300

Рис. 5. Пространственные отклики двухэлементной дифференциальной микрофонной решетки б = 4,25 см, f = 500 Гц для разных величин задержки т: кардиоида (т = т0) (а); диполь (т = 0) (б); гиперкардиоида

(т = 0,34 т0) (в), суперкардиоида (т = 0,57 т0) (г)

а

а

г

Тип ДМР2 тДо Средний DI, дБ FBR 3 дБ ширина луча, ° Нули ДН, °

Диполь 0 4,7 0,00 90,00 ±90

Кардиоида 1 4,8 8,45 131,06 180

Гиперкардиоида 0,34 6,0 8,45 104,90 ±109

Суперкардиоида 0,57 5,7 11,44 114,90 ±125

Таблица 1. Характеристики ДМР2

Свойства ДМР2:

1. пространственный отклик симметричен относительно оси МР2, максимальный пространственный отклик расположен по оси МР2;

2. индекс направленности ДМР2 в диапазоне низких частот существенно выше, чем у МР2 с алгоритмом задержки и суммирования [11];

3. Пространственные отклики обычно существенно различны в противоположных направлениях оси МР2. Максимальный лепесток ДН расположен по оси МР2 в направлении, противоположном положению нулей.

Обработка сигналов двухэлементных микрофонных решеток

Формирование сигнала микрофонной решетки реализуется с помощью умножения кратковременных спектров сигналов микрофонов на комплексные коэффициенты: Y(f,k) = WH(f)X(f,k) = X0(f,k)WH(f)D(f,Q) ^f(f) = [W1(f), W2(f)]T, где W¿ - весовые комплексные коэффициенты.

Значения комплексных коэффициентов могут быть получены решением системы уравнений из условий формирования пространственно-частотных откликов МР2 в направлении источника сигнала и помехи [2]:

WH(f)Dv(f) = 0 WH(f)Ds(f) = 1.

Из этой системы уравнений могут быть получены следующие значения весовых коэффициентов

[13]:

wí(f) = Heq(f)V2 W2(f) = -Heq(f)V2 е^фр Heq(f) = Isin cosQs-cosQv))l~1 , где Heq(f) - коэффициент, обеспечивающий в направлении 9S величину частотного отклика МР2 на частоте f равную единице.

При обработке сигналов коэффициент Heq (f) можно интерпретировать как частотный эквалайзер. Комплексные весовые коэффициенты формируют ноль в направлении Qv. При этом основной лепесток ДН всегда расположен по оси МР2. Эквалайзер выравнивает (делает равным единице) частотный отклик в направлении 0S. В качестве направления выравнивания обычно задают 0S = 0.

Вблизи нулевой частоты частотный отклик ДМР2 близок к нулю, и эквалайзер имеет максимальное усиление. Задаваясь максимально допустимым усилением Hmax, получим соотношение для минимальной рабочей частоты:

frnin = c/(nd Нтах х(1- cos (6V)). (3)

Верхнюю рабочую частоту Fmax нередко ограничивают значением, при котором частотный отклик ДМР2 впервые достигает максимального (равного единице) значения. В этом случае передаточная функция эквалайзера также равна единице, из чего следует, что

Fmax = 0,5 c/(d х(1- cos (Qv)). (4)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Из (3) и (4) следует, что частотный диапазон ДМР2 обратно пропорционален дистанции между микрофонами, которая обычно задается в интервале 1-4 см.

Несмотря на то, что ДМР2 формирует пространственный ноль, использование его для подавления помехи от точечного источника затруднительно. Во-первых, потому, что наиболее вероятным является сценарий перемещения источника помехи. Во-вторых, в присутствии отражающих поверхностей помеха точечного источника может поступать с разных направлений. В-третьих, в различных диапазонах частот источники помехи могут занимать разное положение.

Более вероятным является сценарий с приблизительно известным положением целевого диктора и пространственной области источников шума.

Эксперименты

Целью экспериментов было сравнение алгоритмов обработки МР2 с продольной и поперечной архитектурой для дистанционного приема речевого сигнала в натурных условиях. Оценка эффективности применения МР2 для дистанционного приема речи в шумовой обстановке проводилась на открытом воздухе вблизи трассы с интенсивным транспортным потоком. Схема экспериментов приведена на рис. 6 (n обозначает нормаль к оси МР2).

Макеты микрофонных решеток были реализованы с использованием двух электретных микрофонов Knowles EK23024, размещенных на платформе с расстоянием d = 4,25 см между микрофонами. Сигналы микрофонов оцифровывались с частотой Fs = 16 кГц. Для записи сигналов использовался цифровой диктофон «Гном 2М» (производство ООО «Центр речевых технологий»). Обработка сигналов проводилась в частотной области кадрами размером Ж=512, окном Ханна, пересечением 50%. Алгоритмы обработки сигналов были предварительно протестированы на сигналах, записанных в безэховой камере. Результаты показали невысокую пространственную избирательность алгоритма суммирования, а также ограниченную степень подавления когерентной помехи (до 18 дБ).

шш

о о

6v

n Ls

п

б

Рис. 6. Схема эксперимента дистанционного приема речевых сигналов: поперечная микрофонная решетка

(а); продольная микрофонная решетка (б)

МР2 размещалась на расстоянии Lv (приблизительно 75 м) от трассы. Шум транспорта поступал из полусферы, обращенной к трассе (прямой звук от проезжей части и отраженный звук от окружающих зданий). Дикторы располагались на расстоянии Ls (приблизительно 4,5 м) от микрофонной решетки. Общий уровень шума составлял порядка 66-69 дБА. Отношение сигнал/шум составляло от -7 до -8 дБ. Для контроля уровня сигналов с целевого направления использовался метроном, генерирующий периодический широкополосный импульсный сигнал.

В первой группе экспериментов исследовалась МР2 с поперечной архитектурой и с разным размером апертуры, ориентированная нормалью на диктора. Угол между нормалью и направлением на трассу составлял 0V = 60°. Обработка выполнялась в одном случае с использованием алгоритма задержки и суммирования (DAS, луч в направлении диктора, 0S = 90°), в другом случае с дополнлительным использованием дифференциального алгоритма (DIF, ноль 0V = -30°).

Во второй группе экспериментов исследовались дифференциальные алгоритмы обработки сигналов МР2 с продольной архитектурой (сравнивались ДМР2 с разными диаграммами направленности). Дикторы располагались с фронтальной стороны по оси ДМР2 (0S = 0°), а область источников шума находилась с тыльной стороны (0V =- 30°). На рис. 7 представлены графики среднеквадратических значений сигналов с(&), с окном усреднения 30 мс на микрофоне и на выходе МР2.

ст(а-), дБ -5

иоида суперкардиоида

I ' I I I I I I

и | 111 I 111 11 [ 111 11 11 I 11 11 I I 111 1111 I 11 11 I 1111 111 I 111 I I I 1111 111 I 11 11 I I I

0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 Г, с

Рис. 7. Среднеквадратические значения сигналов: микрофона (коричневый); выхода микрофонной решетки - кардиоида (фиолетовый); суперкардиоида (зеленый); гиперкардиоида (синий)

Обобщенные результаты проведенных экспериментов приведены в табл. 2.

Поперечная МР2 Продольная МР2

DAS DIF Кардиоида Гиперкардиоида Суперкардиоида

0,5-1,5 12 10 12 12

Таблица 2. Степень подавления шума в МР2 для различных алгоритмов, дБ

L

L

v

V

0

v

Ls

а

Заключение

В работе исследованы алгоритмы обработки сигналов МР2 с продольной и поперечной архитектурой. Экспериментальные исследования проведены на записях, сделанных вблизи трассы с интенсивным движением транспорта. Результаты экспериментальных исследований показали существенное преимущество дифференциальных алгоритмов обработки сигналов по сравнению с алгоритмом задержки и суммирования. Для различных вариантов дифференциальных алгоритмов достигнуто подавление уличного шума 10-12 дБ. Использование эквалайзеров в условиях открытого пространства нецелесообразно, поскольку может привести к значительному усилению шумов окружения (например, ветра). Основным недостатком ДМР2 является чувствительность к низкочастотным шумам.

Дальнейшая работа будет направлена на исследование возможностей адаптивных алгоритмов обработки сигналов МР2 для выделения речи в сложной шумовой обстановке.

Литература

1. Guerin A., Le Bouquin-Jeannes R., Faucon G. A two-sensor noise reduction system: applications for hands-free car kit // EURASIP Journal on Applied Signal Processing. 2003. V. 11. P. 1125-1134. doi: 10.1155/S1110865703305098

2. Heng Z., Qiang F., Yonghong Y. Speech enhancement using compact microphone array and applications in distant speech acquisition // Chinese Journal of Electronics. 2009. V. 18. N 3. P. 481-486.

3. Goldsworthy R.L., Delhorne L.A., Desloge J.G., Braida L.D. Two-microphone spatial filtering provides speech reception benefits for cochlear implant users in difficult acoustic environments // Journal of the Acoustical Society of America. 2014. V. 136. N 2. P. 867-876. doi: 10.1121/1.4887453

4. Кривошейкин А.В., Перелыгин С.В. Микрофонная решетка для реализации направленной акустической антенны // Изв. вузов. Приборостроение. 2015. Т. 58. № 3. С. 221-225. doi: 10.17586/0021-3454-2015-58-3-221-225

5. Microphone Arrays. Signal Processing Techniques and Applications / Eds. M. Brandstein, D. Ward. Springer-Verlag, 2001. 402 p.

6. Benesty J., Chen J. Study and Design of Differential Microphone Arrays. Springer, 2013. 184 p.

7. Benesty J., Chen J., Pan C. Fundamentals of Differential Beamforming. Springer, 2016. 129 p.

8. Benesty J., Cohen I., Chen J. Fundamentals of Signal Enhancement and Array Signal Processing. Wiley-IEEE Press, 2017. 440 p.

9. Vary P., Martin R. Digital Speech Transmission: Enhancement, Coding and Error Concealment. Wiley, 2006. 644 p.

10. Buck M., Wolff T., Haulick T., Schmidt G. A compact microphone array system with spatial post-filtering for automotive applications // Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing. Taipei, Taiwan, 2009. P. 221-224.

11. Buck M., RoBler M. First order differential microphone arrays for automotive applications // Proc. 7th Int. Workshop on Acoustic Echo and Noise Control (IWAENC). Darmstadt, Germany, 2001. P. 19-22.

12. Олейников А.Н., Бородавка А.В. Основные направления совершенствования средств акустической разведки // Радиотехника. 2017. № 189. С. 189-194.

13. Столбов М.Б., Перелыгин С.В. Алгоритмы двухэлементной микрофонной решетки для выделения речевых сигналов в присутствии когерентных помех // Цифровая обработка сигналов. 2017. № 4. С. 34-39.

References

1. Guerin A., Le Bouquin-Jeannes R., Faucon G. A two-sensor noise reduction system: applications for hands-free car kit. EURASIP Journal on Applied Signal Processing, 2003, vol. 11, pp. 1125-1134. doi: 10.1155/S1110865703305098

2. Heng Z., Qiang F., Yonghong Y. Speech enhancement using compact microphone array and applications in distant speech acquisition. Chinese Journal of Electronics, 2009, vol. 18, no. 3, pp. 481-486.

3. Goldsworthy R.L., Delhorne L.A., Desloge J.G., Braida L.D. Two-microphone spatial filtering provides speech reception benefits for cochlear implant users in difficult acoustic environments. Journal of the Acoustical Society of America, 2014, vol. 136, no. 2, pp. 867-876. doi: 10.1121/1.4887453

4. Krivosheikin A.V., Perelygin S.V. Microphone array for directional acoustic antenna implementation. Izv. vuzov. Priborostroenie, 2015, vol. 58, no. 3, pp. 221-225. (in Russian) doi: 10.17586/0021-3454-2015-58-3-221-225

5. Microphone Arrays. Signal Processing Techniques and Applications. Eds. M. Brandstein, D. Ward. Springer-Verlag, 2001, 402 p.

6. Benesty J., Chen J. Study and Design of Differential Microphone Arrays. Springer, 2013, 184 p.

7. Benesty J., Chen J., Pan C. Fundamentals of Differential Beamforming. Springer, 2016, 129 p.

8. Benesty J., Cohen I., Chen J. Fundamentals of Signal Enhancement and Array Signal Processing. Wiley-IEEE Press, 2017, 440 p.

9. Vary P., Martin R. Digital Speech Transmission: Enhancement, Coding and Error Concealment. Wiley, 2006, 644 p.

10. Buck M., Wolff T., Haulick T., Schmidt G. A compact microphone array system with spatial post-filtering for automotive applications. Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing. Taipei, Taiwan, 2009, pp. 221-224.

11. Buck M., RoBler M. First order differential microphone arrays for automotive applications. Proc. 7th Int. Workshop on Acoustic Echo and Noise Control, IWAENC. Darmstadt, Germany, 2001, pp. 19-22.

12. Oleinikov A.N., Borodavka A.V. Main directions of improving the means of acoustic reconnaissance. Radiotekhnika, 2017, no. 189, pp. 189-194. (in Russian)

13. Stolbov M.B., Perelygin S.V. Algorithms of a two-element microphone array for the isolation of speech signals in the presence of coherent interference. Digital Signal Processing, 2017, no. 4, pp. 34-39. (in Russian)

Авторы

Столбов Михаил Борисович - кандидат технических наук, доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, ОЯСГО ГО: 0000-0002-3848-4763, stolbov@speechpro.com

Тхе Куан Чонг - аспирант, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, ОЯСГО ГО: 00000002-2456-9598, quantrongthe@corp.ifmo.ru

Authors

Mikhail B. Stolbov - PhD, Associate Professor, ITMO University, Saint Petersburg, 197101, Russian Federation, ORCID ID: 00000002-3848-4763, stolbov@speechpro.com

The Quan Trong - postgraduate, ITMO University, Saint Petersburg, 197101, Russian Federation, ORCID ID: 0000-00022456-9598, quantrongthe@corp.ifmo.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.