Научная статья на тему 'Применение микрофонных решеток для дистанционного сбора речевой информации'

Применение микрофонных решеток для дистанционного сбора речевой информации Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
2828
456
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МИКРОФОННЫЕ РЕШЕТКИ / MICROPHONE ARRAYS / ГЕОМЕТРИЯ МИКРОФОННЫХ РЕШЕТОК / ARRAY GEOMETRY / ДИАГРАММА НАПРАВЛЕННОСТИ / АЛГОРИТМЫ ОБРАБОТКИ СИГНАЛОВ МИКРОФОННЫХ РЕШЕТОК / DIGITAL SIGNAL PROCESSING ALGORITHMS FOR MICROPHONE ARRAYS / ДИСТАНЦИОННЫЙ СБОР РЕЧЕВОЙ ИНФОРМАЦИИ / DISTANT SPEECH CAPTURE / BEAMFORMING / DIRECTIVITY PATTERN

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Столбов М.Б.

Применение микрофонных решеток для сбора речевой информации имеет значительные преимущества по сравнению с системами, использующими один микрофон. Обзор посвящен системам, использующим микрофонные решетки для дистанционного сбора речевой информации. Материал статьи основан на анализе публикаций по применению микрофонных решеток для задач сбора речевой информации, а также опыте разработки и практического применения планарных микрофонных решеток. Рассмотрены основные этапы развития систем дистанционного сбора аудиоинформации. Перечислены основные области применения микрофонных решеток. Рассмотрены базовые типы микрофонных решеток и их особенности. Основной материал обзора посвящен работе с планарными микрофонными решетками. Проанализированы особенности работы микрофонных решеток в различной акустической обстановке. Рассмотрены основные соотношения для расчета базовых параметров эквидистантных планарных решеток. Перечислены некоторые методы (приведен список литературы) проектирования неэквидистанных решеток. Дан перечень основных алгоритмов цифровой обработки сигналов планарных микрофонных решеток. Приведен список литературы по алгоритмам обработки в частотной области. Приведен перечень зарубежных компаний, предлагающих системы на основе микрофонных решеток для решения широкого круга задач, связанных с обработкой речевых и аудиосигналов. Описаны некоторые современные системы сбора речевой информации на основе микрофонных решеток. В заключении перечислены перспективные направления развития систем сбора речевой информации с использованием микрофонных решеток. Материалы обзора могут быть использованы при проектировании микрофонных решеток для конкретных практических применений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of microphone arrays for distant speech capture

Application of microphone arrays and beamforming techniques for speech information collection has significant advantages compared to systems operating with a single microphone. This paper presents a brief overview of microphone array systems for collecting distant speech information. The paper is based on an analysis of publications on the use of microphone arrays for speech information collection tasks, as well as on the author’s experience in the development and practical application of planar microphone arrays. The paper describes the main stages of the development of systems for remote capture of audio information. It provides a review of the main applications of microphone arrays, the basic types of microphone arrays and their features. The bulk of the paper deals with planar microphone arrays. We analyze the work of microphone arrays in different acoustic environments. The paper contains the basic equations for calculating the parameters of equidistant planar microphone arrays. Some methods of designing non-equidistant arrays are also mentioned (a list of references is included). We also provide a list of basic digital signal processing algorithms for planar microphone arrays, as well as a list of references on processing algorithms in the frequency domain. The paper includes a list of foreign companies offering systems based on microphone arrays for a wide range of tasks associated with the processing of speech and audio signals. We describe some state-of-the-art speech information collection systems based on microphone arrays. Some promising directions for the development of speech information collection systems using microphone arrays are described in conclusion. The material of the review is usable in designing of microphone arrays for specific practical applications.

Текст научной работы на тему «Применение микрофонных решеток для дистанционного сбора речевой информации»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ июль-август 2015 Том 15 № 4 ISSN 2226-1494 http://ntv.i1mo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS July-August 2015 Vol. 15 No 4 ISSN 2226-1494 http://ntv.ifmo.ru/en

УДК 621.396

ПРИМЕНЕНИЕ МИКРОФОННЫХ РЕШЕТОК ДЛЯ ДИСТАНЦИОННОГО СБОРА РЕЧЕВОЙ ИНФОРМАЦИИ

М.Б. Столбовa, b

a ООО ЦРТ-инновации, Санкт-Петербург, 196084, Российская Федерация b Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация Адрес для переписки: stolbov@speechpro.com Информация о статье

Поступила в редакцию 22.04.15, принята к печати 19.05.15

doi:10.17586/2226-1494-2015-15-4-661-675

Язык статьи - русский

Ссылка для цитирования: Столбов М.Б. Применение микрофонных решеток для дистанционного сбора речевой информации // Научно-технический вестник информационных технологий, механики и оптики. 2015. Т. 15. № 4. С. 661-675.

Аннотация

Применение микрофонных решеток для сбора речевой информации имеет значительные преимущества по сравнению с системами, использующими один микрофон. Обзор посвящен системам, использующим микрофонные решетки для дистанционного сбора речевой информации. Материал статьи основан на анализе публикаций по применению микрофонных решеток для задач сбора речевой информации, а также опыте разработки и практического применения планарных микрофонных решеток. Рассмотрены основные этапы развития систем дистанционного сбора аудиоинформации. Перечислены основные области применения микрофонных решеток. Рассмотрены базовые типы микрофонных решеток и их особенности. Основной материал обзора посвящен работе с планарными микрофонными решетками. Проанализированы особенности работы микрофонных решеток в различной акустической обстановке. Рассмотрены основные соотношения для расчета базовых параметров эквидистантных планарных решеток. Перечислены некоторые методы (приведен список литературы) проектирования неэквидистанных решеток. Дан перечень основных алгоритмов цифровой обработки сигналов планарных микрофонных решеток. Приведен список литературы по алгоритмам обработки в частотной области. Приведен перечень зарубежных компаний, предлагающих системы на основе микрофонных решеток для решения широкого круга задач, связанных с обработкой речевых и аудиосигналов. Описаны некоторые современные системы сбора речевой информации на основе микрофонных решеток. В заключении перечислены перспективные направления развития систем сбора речевой информации с использованием микрофонных решеток. Материалы обзора могут быть использованы при проектировании микрофонных решеток для конкретных практических применений. Ключевые слова

микрофонные решетки, геометрия микрофонных решеток, диаграмма направленности, алгоритмы обработки

сигналов микрофонных решеток, дистанционный сбор речевой информации.

Благодарности

Работа выполнена при государственной финансовой поддержке ведущих университетов Российской Федерации (субсидия 074-U01).

APPLICATION OF MICROPHONE ARRAYS FOR DISTANT SPEECH CAPTURE

M.B. Stolbova' b

a STC-innovations Ltd, Saint Petersburg, 196084, Russian Federation b ITMO University, Saint Petersburg, 197101, Russian Federation Corresponding author: stolbov@speechpro.com Article info

Received 22.04.15, accepted 19.05.15 doi:10.17586/2226-1494-2015-15-4-661-675 Article in Russian

For citation: Stolbov M.B. Application of microphone arrays for distant speech capture. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2015, vol.15, no. 4, pp. 661-675.

Abstract

Application of microphone arrays and beamforming techniques for speech information collection has significant advantages compared to systems operating with a single microphone. This paper presents a brief overview of microphone array systems for collecting distant speech information. The paper is based on an analysis of publications on the use of microphone arrays for speech information collection tasks, as well as on the author's experience in the development and practical application of planar microphone arrays. The paper describes the main stages of the development of systems for remote capture of audio

information. It provides a review of the main applications of microphone arrays, the basic types of microphone arrays and their features. The bulk of the paper deals with planar microphone arrays. We analyze the work of microphone arrays in different acoustic environments. The paper contains the basic equations for calculating the parameters of equidistant planar microphone arrays. Some methods of designing non-equidistant arrays are also mentioned (a list of references is included). We also provide a list of basic digital signal processing algorithms for planar microphone arrays, as well as a list of references on processing algorithms in the frequency domain. The paper includes a list of foreign companies offering systems based on microphone arrays for a wide range of tasks associated with the processing of speech and audio signals. We describe some state-of-the-art speech information collection systems based on microphone arrays. Some promising directions for the development of speech information collection systems using microphone arrays are described in conclusion. The material of the review is usable in designing of microphone arrays for specific practical applications. Keywords

microphone arrays, beamforming, array geometry, directivity pattern, digital signal processing algorithms for microphone

arrays, distant speech capture.

Acknowledgements

This work has been partially financially supported by the Government of the Russian Federation (grant 074-U01).

Введение

Дистанционный сбор речевой информации (ДСРИ) имеет важное значение в сфере телекоммуникаций, технологий автоматического распознавания речи, в работе правоохранительных органов и во многих других приложениях.

Вопросы использования средств дистанционного сбора речевой информации достаточно подробно освещены в обзоре [1]. Значительная их часть основывается на приеме звуковых акустических колебаний микрофонами с последующим усилением (в 103-104 раз). Однако такие системы (наподобие «кибер-уха») не способны в городских условиях привести к существенному увеличению дистанций сбора речевой информации, поскольку вместе с усилением речевого сигнала (РС) усиливается и шум окружения, являющийся одной из основных причин снижения разборчивости и качества речи.

В тихой местности действительно можно принимать РС с расстояний порядка 100 м, однако там вступают в силу другие факторы (многолучевое распространение звука, рассеивание высокочастотных компонент звука, ветер и др.), что также ограничивает дистанцию приема речевой информации [2]. Эти ограничения в значительной степени преодолеваются в системах ДСРИ на основе микрофонных решеток (МР). МР хорошо известны специалистам в данной области. В настоящее время тематика МР представляет собой обширное направление в области цифровой обработки сигналов. Детальное описание принципов конструирования и алгоритмов обработки сигналов МР представлено в ряде фундаментальных работ [3-11].

Настоящий обзор содержит краткие сведения по основным аспектам конструирования и применения МР в задачах ДСРИ. Материалы обзора могут представлять интерес для инженеров, преподавателей и студентов, использующих методы цифровой обработки аудиосигналов.

Основные этапы развития средств дистанционного сбора аудиоинформации

Современные успехи в области применения МР опираются на результаты, которые были достигнуты в области дистанционного сбора аудиоинформации (ДСАИ) в течение XX века.

Рассмотрим вкратце основные этапы развития средств ДСАИ.

Первые системы дистанционного приема аудиоинформации были разработаны в начале XX века. Историю дистанционного сбора аудиоинформации весьма условно можно разделить на три этапа: этап зарождения или «механический» этап, этап аналоговой обработки и этап цифровой обработки сигналов.

На начальном этапе (в ходе первой мировой войны) дистанционный прием звука применялся для обнаружения летательных аппаратов и определения положения артиллерийских батарей [12]. Эти методы и средства развивались вплоть до Второй мировой войны, после которой уступили место средствам радиолокации. Вторым этапом развития ДСАИ стали средства аналоговой обработки сигналов. На этом этапе стали применяться усилители сигналов направленных микрофонов, позволившие использовать средства ДСАИ для дистанционного сбора речевой информации (ДСРИ). Был разработан ряд систем, детальный обзор которых дан в работах [1, 2]. В обзоре [1] приводится информация о возможности ДСРИ с использованием направленных микрофонов на дистанциях до 100 м.

Основными типами ДСРИ на втором этапе стали системы с параболическим отражателем и трубчатые микрофоны. На этом же этапе были разработаны первые МР, однако они обладали ограниченными возможностями и весьма сложной реализацией [13]. Кроме того на данном этапе были разработаны основы обработки сигналов антенных решеток [14-21]. В дальнейшем эти идеи получили развитие в алгоритмах обработки сигналов МР.

Наконец, третьим этапом развития ДСРИ (начиная с 90-х годов) стало применение средств цифровой обработки сигналов (ЦОС).

С развитием ЦОС МР стали применяться для решения широкого круга задач, связанных с обработкой речевых сигналов:

- выделение речи (повышение разборчивости) целевого диктора в шумах;

- дистанционный сбор речевой информации;

- дистанционное распознавание речи (например, для голосового управления устройствами);

- дистанционная идентификация дикторов;

- разделение речи дикторов, выделение речи целевого диктора в голосовом коктейле;

- определение положения и трассировка положения источников звука;

- анализ акустической эмиссии источников звука;

- системы автоматического распознавания речи и речевого управления в автомобиле;

- информационные киоски с речевым сервисом в общественных местах;

- слуховые аппараты.

Отметим основные особенности МР:

- они работают с цифровым звуком (дискретизированным по амплитуде, времени и пространству);

- в них в цифровой форме воспроизводятся основные методы аналоговой обработки РС (фокусировка звука и др.);

- в них реализовано большое число преобразований сигналов, недоступных аналоговым системам.

Мощным дополнительным импульсом к расширению сферы применения МР явилась разработка и серийный выпуск цифровых MEMS микрофонов [22] (в русской транскрипции МЭМС - общее название микроэлектромеханических систем).

Все технологии извлечения речевой информации в МР неразрывно связаны с алгоритмами ЦОС. Применение ЦОС значительно расширяет функциональные возможности средств дистанционного сбора аудиоинформации. В дальнейшем под МР мы будем подразумевать как саму систему микрофонов, так и алгоритмы обработки их сигналов.

Ограничения одномикрофонных систем

Звук, который человек слышит в шумном или реверберирующем окружении, значительно отличается от того же звука, записанного через микрофон и воспроизводимого с помощью акустической колонки или наушников. Это объясняется тем, что мы слышим пространственный звук, который в процессе восприятия человеком подвергается сложной обработке. Например, мы легко можем сфокусировать наше внимание на речи одного человека и «не замечать» речи другого. При записи и воспроизведении звука его пространственные свойства во многом утрачиваются, и мы также утрачиваем возможность осуществлять сложную фильтрацию аудиоинформации.

С другой стороны, в шумном и реверберирующем помещении речь других людей также утрачивает разборчивость. Даже человеческий слух не позволяет воспринимать разборчивую речь в зашумленном помещении или на городской улице на расстоянии более 5 м.

Таким образом, возникает задача обработки аудиоинформации, обеспечивающей разборчивость речи, на дистанциях, на которых речь не является разборчивой.

Оценим приблизительную дальность разборчивой речи в различных условиях, исходя из известных оценок громкости нормальной речи и уровня шума [23]. В качестве приблизительного критерия разборчивости примем отношение сигнал/шум (ОСШ): ОСШ (дБ) = Нормальная речь (дБ) - Шум (дБ).

В качестве оценки предельной дальности разборчивой речи можно рассматривать дистанцию, на которой уровень шума превышает уровень РС, т.е. ОСШ менее 0 дБ.

При увеличении дистанции между диктором и микрофоном в 2 раза интенсивность звука речи на микрофоне уменьшается на 6 дБ, в то время как уровень окружающих шумов остается постоянным. При этом ОСШ снижается до критических для разборчивости речи значений 0-6 дБ.

В табл. 1 приведены оценки значений ОСШ для нормальной речи в различных условиях. В основу расчета положены оценки интенсивности нормальной речи (порядка 90 дБ) при телефонном разговоре (микрофон телефона на расстоянии 3 см) или интенсивности нормальной речи 60 дБ на расстоянии около 1 м. Приведенные оценки показывают, что критические для разборчивости речи значения ОСШ достигаются даже в тихом учреждении на расстояниях 8-19 м, а в шумном окружении - на расстояниях всего 0,5-1 м.

Иногда для увеличения дистанции восприятия речи предлагаются так называемые «усилители слуха», обеспечивающие за счет усиления сигнала микрофона увеличение дальности слышимости во много раз - как утверждается, до 50 м. Однако в реальности вместе с РС во столько же раз будут усилены шум и реверберация (нестационарный шум, порождаемый самим РС в результате многократных переотражений в замкнутых помещениях). Таким образом, практически никакого увеличения дальности разборчивого восприятия речи не произойдет. Тем не менее, для обеспечения нормальной слышимости речи на больших дистанциях необходимо, чтобы ее интенсивность составляла 40-60 дБ. Для этого звук с дистанций более 10 м должен быть усилен.

Одним из путей преодоления ограничений восприятия разборчивой речи в различной шумовой обстановке является применение МР, которое дает следующие преимущества:

- направленность приема звука;

- подавление шумов точечных источников;

- подавление нестационарных шумов окружения и достижение больших ОСШ;

- частичное ослабление реверберации;

- возможность пространственной локализации звука целевого диктора;

- возможность сопровождения двигающегося диктора и точечного источника шума.

Условия Дистанция диктор-микрофон, м

0,03 0,12 0,50 1 2 4 8 16 32

Свободное пространство, 0 дБ 90 78 66 60 54 48 42 36 30

Тихая местность, 20 дБ 70 58 46 40 34 28 22 16 10

Тихая квартира, 35 дБ 55 43 31 25 19 13 7 1 -5

Тихое учреждение, 40 дБ 50 38 26 20 14 6 2 -4

Шумное учреждение, улица со средним движением, 55 дБ 35 23 11 5 -1 -7

Улица с интенсивным движением, (60-80) дБ 30 18 6 0 -6

Таблица 1. Зависимость ОСШ (дБ) для нормальной речи от дистанции между диктором и микрофоном

и уровня шума окружения

Принципы работы микрофонных решеток

В случае, когда микрофоны, составляющие МР, являются всенаправленными, они принимают звуки со всех направлений. Иначе говоря, электрические сигналы каждого из микрофонов содержат информацию о звуках, приходящих со всех направлений. Совместная обработка этих сигналов позволяет выделить звук, приходящий с заданного направления.

Полезный сигнал

Endfire

> Р Р Р Р

ГТ -»-i-»-*—

Блок обработки

Выходной сигнал

Broadside

Полезный сигнал

Рис. 1. Базовые структуры микрофонных решеток

Структура МР Достоинства Недостатки

Broadside Плоская геометрия Простая реализация обработки Возможность управления направлением луча Меньшее подавление вне оси МР Малое расстояние между микрофонами и их большое число необходимо, чтобы предотвратить пространственную утечку

Endfire Лучшее подавление вне оси Меньший общий размер Неплоская (объемная) геометрия Более сложная обработка Подавление полезного сигнала в диапазоне низких частот (НЧ) Направление на источник полезного сигнала должно совпадать с осью МР Для двумерных решеток формирование луча возможно только в горизонтальном направлении (плоскости решетки)

Таблица 2. Сравнительные характеристики Broadside и Endfire микрофонных решеток

Таким образом, МР выделяют звук с заданного направления не сами по себе, а путем обработки многоканального сигнала. Задавая разные параметры обработки многоканального сигнала МР или многоканальной фонограммы, можно выделить речь разных дикторов.

Базовыми структурами МР являются так называемые Broadside array и Endfire array [8]. В определенном смысле это аналоги микрофонов с параболическими отражателями и трубчатых направленных микрофонов. Схемы этих базовых структур МР представлены на рис. 1 [24], а их сравнительные характеристики - в табл. 2 [25].

При решении задач ДСРИ наибольшее распространение получили МР типа Broadside, поэтому далее будем рассматривать МР именно этой структуры.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Базовый алгоритм формирования диаграммы направленности

Обычно сигнал целевого диктора предполагается когерентным сигналом точечного источника, шум же в зависимости от акустической обстановки представляет собой акустическое поле с различными пространственными характеристиками.

Для выделения прямого звука диктора основным (базовым) алгоритмом обработки сигналов МР является алгоритм формирования диаграммы направленности (ДН), вариантами которого являются алгоритмы задержки и суммирования (delay-and-sum) и фильтрации и суммирования (filter-and-sum) [8]. Смысл этих алгоритмов состоит в том, что сигналы микрофонов складываются с разными задержками (разным сдвигом фаз), выравнивая для каждой частоты фазы сигналов, приходящих с выбранного направления (целевого диктора). В этом случае алгоритм формирования ДН позволяет усилить сигналы, формируемые звуком, приходящим с выбранного направления, т.е. осуществляет своеобразную «фокусировку» звуков. Сдвиг фаз может задаваться исходя из приближения «дальнего поля», для которого звуковые волны считаются плоскими, или «ближнего поля», для которого звуковые волны считаются сферическими. Дистанции, для которых справедливо приближение «дальнего поля», определяются следующим соотношением [26]:

L > 2 D2 Д ,

где L - дистанция от источника до МР; D - линейный размер (апертура) МР; X - длина звуковой волны.

Например, для микрофонной решетки с апертурой 35 см на частоте 5 кГц приближение «дальнего поля» выполняется для дистанций L > 3,6 м. С увеличением апертуры МР дистанция «дальнего поля» быстро увеличивается.

Основной характеристикой МР является диаграмма направленности, описывающая избирательность МР. Диаграмма направленности отображает пространственную зависимость передаточной функции МР, ориентированной в заданном направлении, от угла прихода сигнала и, таким образом, характеризует эффективность выделения сигнала от целевого диктора и подавления когерентных помех.

Диаграмма направленности зависит от геометрии МР (числа и расположения микрофонов) и алгоритмов обработки сигналов. На рис. 2 приведены диаграммы направленности эквидистантной восьми-элементной микрофонной линейки с апертурой 35 см, d = 5 см для 1, 2, 4 кГц. Горизонтальная ось - угол прихода акустического сигнала, вертикальная - амплитуда выходного сигнала МР в линейном масштабе.

Наиболее важными параметрами ДН являются ширина основного лепестка (по уровню 3 дБ), уровень боковых лепестков (либо отношение уровня основного лепестка к уровню боковых) и так называемый «индекс направленности», характеризующий способность МР подавлять изотропный шум, приходящий со всех направлений. Все характеристики МР зависят от частоты сигнала. В табл. 3 приведена зависимость ширины основного лепестка от частоты сигнала для восьмиэлементной микрофонной линейки (8^5 см).

Частота, кГц 1 кГц 2 кГц 3 кГц 4 кГц 5 кГц 6 кГц 8 кГц

Ширина луча ±30° ±15° ±10° ±7,5° ±6° ±5° ±3,75°

Таблица 3. Ширина основного лепестка ДН в зависимости от частоты

Угловое разрешение МР зависит от апертуры (линейного размера МР), длины волны (частоты сигнала), направления луча и метода обработки сигнала [27]: Да = 1,22/со8(а) х X/Б,

где Да - угловое разрешение (радиан); Б - апертура; 1 - длина волны; а - угол направления луча.

Пространственное разрешение в плоскости, находящейся на дистанции Ь, зависит от угла направления луча следующим образом [3]:

ДТ (а) = 1,22/^3 (а) х ХЬ/Б .

В табл. 4 приведена зависимость пространственного разрешения от угла направления луча и частоты сигнала для 8-элементной микрофонной линейки (8*5 см) в плоскости, расположенной на расстоянии 10 м от линейки.

D(0) 1

2

0,4

3

),2

-90 -70 -50 -30 0 30 50 70 90

Угол прихода сигнала 6

Рис. 2. Зависимость диаграммы направленности эквидистантной восьмиэлементной микрофонной линейки с апертурой 35 см, б = 5 см от частоты сигнала: 1 -1 кГц, 2 - 2 кГц, 3 - 4 кГц

Частота, кГц Угол направления луча

0° 10° 20° 30° 40° 50° 60°

1 11,86 12,10 14,23 18,26 26,33 44,59 94,88

2 5,93 6,05 7,11 9,13 13,16 22,39 47,44

4 2,97 3,02 3,56 4,56 6,58 11,15 23,72

6 1,98 2,02 2,37 3,04 4,39 7,43 15,81

Таблица 4. Пространственное разрешение (м) в плоскости, расположенной на расстоянии 10 м от микрофонной линейки

Комментарии:

- ошибка нацеливания 6° (sin 6° = 0,104) соответствует на дистанции 10 м ошибке положения 1,04 м, что может привести к искажению в сигнале микрофонной решетки звука речи диктора на частотах выше 5 кГц;

- в диапазоне НЧ ширина ДН намного больше, чем на высоких частотах, что приводит к искажению спектра речевых сигналов;

- существенное ухудшение пространственного разрешения с ростом угла направления луча приводит к необходимости ограничения рабочего диапазона углов луча МР.

Работа микрофонной решетки в различной шумовой акустической обстановке

Эффективность подавления шума в МР зависит от типа шумовой акустической обстановки (акустического поля шума).

Для МР различают три основных типа шумовых полей - когерентное, изотропное и диффузное [26]. Эти поля могут быть охарактеризованы степенью пространственной корреляции шума. Мерой про-

I Р

странственной корреляции является функция когерентности 0 < rj( Л < 1, которая определяется как нормализованная мера кросс-спектров сигналов в точках пространства i иj:

Г„( f) = Sj (f)/|S,( f) Sjj (f )|2, где S¡:¡ (f) - кросс-спектр сигналов в точках i и j; f - частота сигналов. Рассмотрим работу МР в этих разных условиях.

Когерентное поле формируется точечными источниками в свободном пространстве или помещениях с низким уровнем реверберации. Этому полю соответствует прямой звук от источников помех к микро-I |2

фонам. При этом rj( Л и 1. В этих условиях помехи, приходящие на МР с направлений, отличных от

направления на диктора, ослабляются потому, что для разных микрофонов они складываются не в фазе. Тем не менее, часть помех попадает на выход МР через боковые лепестки ДН или через широкий основной лепесток в области НЧ. Таким образом, эффективность подавления когерентных помех в этом случае целиком определяется формой ДН.

Некогерентное изотропное поле формируется распределенными некогерентными источниками акустического шума и представляет собой независимые для разных микрофонов сигналы. При этом

|Г, (/) и 0. Некогерентное изотропное поле также называют пространственным белым шумом, поскольку оно не зависит от ориентации микрофонной решетки (т.е. является изотропным).

В условиях некогерентного изотропного поля МР теряет свойства направленности по отношению к шумам, поскольку шум на отдельных микрофонах не является когерентным. Однако благодаря сложению независимых для отдельных микрофонов шумов мощность шума на выходе МР уменьшается, в то время как мощность речевого сигнала остается прежней. В этом случае МР ослабляет шум и увеличивает ОСШ на 10 1о§10(М дБ, где М - число микрофонов МР.

В табл. 5 приведена степень подавления шума дБ) в зависимости от числа микрофонов в МР.

M 10 20 40 80 160 320

NR, дБ 10 13 16 19 22 25

Таблица 5. Степень подавления некогерентного шума в зависимости от числа микрофонов

Например, МР с количеством приемников 320 позволяет при изотропном пространственном шуме увеличить ОСШ по сравнению с одиночным микрофоном на 25 дБ и обеспечить сбор речевой информации на расстоянии до 150-200 м [13].

В рамках модели некогерентного поля для увеличения дистанции сбора речевой информации в 2 раза (увеличения ОСШ на 6 дБ) необходимо увеличить число микрофонов в 4 раза. Увеличение числа микрофонов в 4 раза требует увеличения апертуры двумерной МР в 2 раза. При этом невозможно достичь выигрыша ОСШ в пределах линейного размера апертуры с помощью уменьшения расстояний между микрофонами.

Однако данная модель справедлива лишь в случае, если шум окружения на микрофонах действительно является независимым. Это обстоятельство становится очевидным в рамках более реалистичной третьей модели шума - модели диффузного поля.

Диффузное поле - поле в реверберирующем помещении от точечных (когерентных) источников, дистанция до которых от МР много больше радиуса реверберации. При этом сигналы поступают на микрофоны одновременно со всех направлений, сохраняя частичную когерентность. Функция когерентности диффузного реверберационного поля между двумя точками (микрофонами) описывается следующим соотношением:

|Г..(f )|2 = sinc(27i/Dj/c) = sinc(2^DjX), где c - скорость звука; D. - расстояние между микрофонами; X - длина волны; f- частота сигнала.

Таким образом, радиус когерентности (расстояние между точками, на котором функция когерентности становится равной нулю) диффузного поля соизмерим с длиной волны р ~ X. Диффузное поле является некогерентным для разнесенных микрофонов в диапазоне высоких частот, когда расстояние между микрофонами превышает соответствующую длину волны, и когерентным в области низких частот, когда длина волны превышает размеры МР.

В условиях диффузного поля шум поступает на МР со всех сторон, однако когерентность сигналов микрофонов уменьшается с ростом частоты и увеличением расстояния между микрофонами. В диапазоне НЧ, когда длина волны соизмерима с размерами МР, шум на всех микрофонах является когерентным. В этих условиях шум со всех направлений поступает на выход МР как через боковые лепестки, так и через основной лепесток ДН, поскольку ширина основного лепестка ДН в этой области велика. Таким образом, классический алгоритм формирования ДН не способен обеспечить в диапазоне НЧ хорошую пространственную избирательность. Для сужения основного лепестка ДН в 2 раза необходимо увеличить апертуру МР также в 2 раза.

В диапазоне высоких частот (ВЧ) когерентными являются лишь сигналы соседних микрофонов, для остальных выполняются условия некогерентного диффузного поля. В связи с этим в области ВЧ эффективность МР возрастает с увеличением числа микрофонов и размеров апертуры.

Геометрические характеристики эквидистантных микрофонных решеток

Под геометрией МР понимается число и расположение микрофонов. Геометрия МР определяет ее характеристики и является основой алгоритмов обработки сигналов.

Эквидистантные планарные broadside МР (с постоянным расстоянием между микрофонами по каждому измерению) довольно широко распространены благодаря простоте расчета характеристик. Рассчитанные параметры могут быть положены в основу конструирования МР с более сложной архитектурой.

Основные геометрические параметры МР - шаг между микрофонами и размер апертуры МР. Эти параметры определяют частотный диапазон работы МР, общее число микрофонов и пространственную разрешающую способность МР.

Основные соотношения для эквидистантных планарных broadside МР:

- формирование пространственной ДН может быть интерпретировано как выделение плоских волн из звукового поля;

- ширина основного лепестка ДФ(а) ~ X/D х (1/cos а), где а - угол направления луча;

- пространственное разрешение R(a) = 1,22L X/D х (1/cos а); где L - дистанция до источника;

- шаг между микрофонами, обеспечивающий отсутствие паразитных боковых лепестков, d ^X^/2, где Xmin - минимальная длина волны сигнала рабочего диапазона МР;

- удвоение числа микрофонов приводит к увеличению ОСШ на 3дБ;

- удвоение линейного размера апертуры двумерной решетки приводит к увеличению ОСШ на 6 дБ;

- удвоение дистанции до диктора приводит к уменьшению ОСШ на 6 дБ;

- удвоение линейного размера апертуры двумерной решетки приводит к увеличению дистанции вдвое и уменьшению ширины основного лепестка вдвое;

- частотный диапазон [Fmin, Fmax] МР зависит от числа M микрофонов по каждой из координат:

F /F ■ «M

L max'А mm

Ниже приведены основные зависимости между геометрией эквидистантных планарных МР и их характеристиками [28].

- Больше апертура ^ выше пространственное разрешение.

- Больше частота сигнала ^ выше пространственное разрешение.

- Меньше дистанция от решетки до объекта ^ выше пространственное разрешение.

- Меньше расстояние между микрофонами ^ выше верхняя частота рабочего диапазона МР (без пространственной утечки).

- Увеличение числа микрофонов при фиксированной апертуре ^ расширение частотного диапазона, диаграмма направленности меняется незначительно.

На рис. 3 приведены диаграммы направленности решеток с фиксированной апертурой 35 см и разным количеством микрофонов M для сигнала с частотой 2 кГц (горизонтальная ось - угол прихода акустического сигнала, вертикальная - амплитуда выходного сигнала МР в линейном масштабе). Из рисунка видно, что увеличение числа микрофонов (и уменьшение шага между ними) влияют на ДН в незначительной степени.

D(6) 1

i /

Л 9

,6

0 ,4

0,2

-90 -70 -50 -30 0 30 50 70 Угол прихода сигнала 6

1 2 3

90

Рис. 3. Зависимость диаграммы направленности микрофонных решеток с фиксированной апертурой 35 от числа микрофонов М: 1 - М = 8, 2 - М = 16, 3 - М = 1024

Расчет планарных эквидистантных микрофонных линеек

Основными геометрическими характеристиками эквидистантных планарных МР являются общий линейный размер (апертура) решетки и шаг между микрофонами. При проектировании эквидистантных решеток можно задаваться частотным диапазоном сигналов [^ш;п, ^шах] (соответственно [Хшах, Xш;п]), или, наоборот, определять частотный диапазон МР, исходя из апертуры Б и шага ё на основе следующих соотношений. Наименьшая длина волны рабочего диапазона (верхняя граница частот) определяет шаг между микрофонами: ё < Хш!п. Наибольшая длина волны рабочего диапазона (нижняя граница частот) определяет минимальный линейный размер (апертуру): Бшп > Хшах. Частотный диапазон (отношение максимальной и минимальной частоты) определяет количество микрофонов: М > ^шах / . Например,

для линейки с десятью микрофонами и шагом С = 5 см максимальная частота /тах = 3,4 кГц, минимальная частота = 340 Гц.

Основные проблемы эквидистантных микрофонных решеток

Речь является широкополосным сигналом, и эквидистантная МР не обеспечивает частотно-инвариантной диаграммы направленности, что приводит к искажению спектра речи (частотный отклик эквидистантной МР зависит от угла луча и в общем случае не является плоским). Среди основных проблем эквидистантных МР можно также указать следующие.

— Для формирования узкого основного лепестка ДН в области НЧ (ниже 1 кГц, где сосредоточена большая часть шумов) требуется решетка больших размеров (более метра) с большим числом микрофонов.

— Для приема речи в широком диапазоне частот требуется большое количество микрофонов, что увеличивает объем аппаратных и вычислительных затрат.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— На высоких частотах решетка имеет слишком узкий основной лепесток ДН, что может привести при неточной фокусировке к потере звука диктора на частотах выше 5 кГц (например, при ошибке наведения 6° ошибка положения на дистанции 10 м составляет приблизительно 1 м).

— С ростом углов луча МР основной лепесток расширяется, что ухудшает направленность, и появляются боковые лепестки, через которые поступает шум окружения.

— Высок уровень боковых лепестков.

— Ряд алгоритмов обработки сигналов МР (исключая базовый алгоритмы формирования диаграммы направленности) очень чувствителен к геометрии МР и требует хорошей калибровки.

Для решения проблем эквидистантных МР предложено большое число различных подходов. Основные вопросы, с которыми связана разработка МР, - размер апертуры, размещение и количество микрофонов, возможность работы в реальном масштабе времени, пространственное разрешение.

Одним из наиболее эффективных решений оказалось неравномерное по апертуре расположение микрофонов, так называемые неэквидистантные (неравномерные) МР [26-29].

Неэквидистантные микрофонные решетки

Концепция неэквидистантных микрофонных решеток заключается в разбиении МР на подрешетки и обработке сигналов подрешеток в разных частотных диапазонах (полосах).

Рис. 4. Схема четырехполосной микрофонной линейки с 9 микрофонами

Основная идея состоит в том, что по мере уменьшения частот сигнала апертура МР и расстояние между микрофонами возрастают, а по мере увеличения частот - уменьшаются. Кроме того, неравномерное расположение микрофонов сформирует при синфазном сложении главный лепесток, но боковые будут меньше, поскольку интерференция сигналов микрофонов будет меньше, чем у эквидистантных решеток.

Пример геометрии неэквидистантной четырехполосной микрофонной линейки с 9 микрофонами (В = 80 см, С = 5 см) приведен на рис. 4 [26]. Для полос 2, 3, 4 используется по 5 микрофонов, для полосы 1 (НЧ) - 3 микрофона. Аналогичные решения используются для двумерных линеек.

Вопросам оптимизации геометрии планарных решеток МР посвящена обширная литература, например [29-38]. При этом учитываются различные критерии оптимизации: постоянство ширины основного лепестка ДН в широком диапазоне частот, сокращение общего количества микрофонов МР, уменьшение уровня боковых лепестков, максимизация индекса направленности и др.

Алгоритмы обработки сигналов микрофонных решеток

Далеко не все прикладные задачи могут быть решены с помощью алгоритмов формирования фиксированной диаграммы направленности. МР нашли применение в решении широкого круга задач, прежде всего благодаря многообразию алгоритмов обработки. Выбор алгоритмов обработки обусловлен во многом сценариями применения МР, к которым можно отнести следующие:

— обработка в реальном масштабе времени (оп Ипе)/пост обработка (ой" Ипе);

— сценарии близкого/удаленного диктора;

— сценарии стационарной/динамической (меняющейся) акустической обстановки

Алгоритмы Фиксированный/ адаптивный Шумовое поле Конфигурация МР

Задержки и суммирования Фиксированный Некогерентное broadside

Задержки и суммирования в подрешетках Фиксированный Некогерентное broadside

Сверхнаправленности Фиксированный Диффузное endfire

вЯС Адаптивный Когерентное broadside

Пост-фильтрации Винера Адаптивный Диффузное endfire или broadside

Таблица 6. Свойства некоторых алгоритмов формирования ДН

Алгоритмы Достоинства Недостатки

Задержки и суммирования Простота реализации Пригоден только для узкополосных сигналов

Фильтрации и суммирования Пригоден для широкополосных сигналов

Задержки и суммирования в подрешетках Пригоден для широкополосных сигналов; уменьшает общее количество микрофонов в МР

Сверхнаправленности Оптимизирует передаточную функцию МР Работает в диффузном поле

вЯС Адаптируется к шумовой обстановке, минимизирует мощность шума на выходе при ограничении подавления целевого сигнала Может искажать целевой сигнал

Пост-фильтрации Винера Адаптируется к шумовой обстановке, улучшает выходной сигнал Может искажать целевой сигнал

Таблица 7. Достоинства и недостатки некоторых алгоритмов обработки сигналов МР

\

Для разных сценариев предложено большое число разных алгоритмов обработки сигналов, которым посвящена обширная литература (например, [3-11]). В рамках настоящего обзора не представляется возможным описать данные алгоритмы сколько-нибудь подробно. Перечислим лишь группы алгоритмов, получивших наибольшее распространение [26, 39-42].

— алгоритм задержки и суммирования;

— алгоритмы фильтрации и суммирования;

— алгоритмы обработки сигналов подрешеток;

— алгоритмы сверхнаправленности;

— алгоритмы формирования пространственного нуля;

— алгоритмы минимума дисперсии шума (ту^);

— алгоритмы подавления боковых лепестков (в8С);

— алгоритмы дереверберации;

— алгоритмы пост-фильтрации Винера;

— алгоритмы локализации и трассировки акустических источников;

— алгоритмы разделения акустических источников.

Помимо алгоритмов, специфических для обработки сигналов МР, значительный дополнительный эффект для выделения речи могут дать классические одноканальные алгоритмы обработки РС (эквалайзеры, динамические фильтры, фильтры коррелированных помех и др.) [43]. Полезными также являются алгоритмы визуализации акустического поля, алгоритмы трассировки (отслеживания положения) дикторов и другие вспомогательные алгоритмы [3].

В общем случае можно выделить две группы алгоритмов: адаптивные и неадаптивные. Для обработки сигналов в условиях меняющейся акустической обстановки необходимо использовать адаптивные алгоритмы. В табл. 6, 7 приведены свойства различных групп алгоритмов [26].

Обзор микрофонных решеток зарубежных компаний

В данном разделе рассматриваются МР, предлагаемые зарубежными компаниями для различных задач дистанционного приема РС. Обзор патентной информации по акустическим системам, использующим МР, дан в работе [44]. К настоящему моменту ряд зарубежных компаний, например, Майкрософт Корпорэйшн (Ц^), защитили свои решения российскими патентами [45].

В табл. 8 приведен перечень компаний, разрабатывающих МР для дистанционного сбора речевой информации.

Компания Наименование продукта/системы/технологии

ClearOne Inc http://www.clearone.com/ 24-элементная МР и технологии для конференц-залов

Squarehead Technology http://www.sqhead.com Для стадионов. Большая МР, 345 микрофонов Дальность - несколько десятков метров

Acoustic Magic Inc. http://www.acousticmagic.com Voice Tracker ™ security monitoring Voice Tracker I, Voice Tracker II 8-элементная микрофонная решетка Поле зрения 360°, дистанция до 9 м

Phoenix audio technologies http://www.phnxaudio.com Настольная микрофонная система, адаптивно формирующая луч в направлении диктора

Vocal Technologies Ltd http://www.vocal.com Большой набор адаптивных алгоритмов обработки

griffcomm http://www.griffcomm.com МР для правоохранительных органов 5^4 микрофонов, дистанция 2-10 м

Norsonic http://www.norsonic.com 128 микрофонов, апертура 0,4 м, вес 2,5 кг 256 микрофонов, апертура 1 м, вес 11 кг 384 микрофонов, апертура 1,6 м + Камера в центре

PKI http://www.pki Супернаправленный микрофон. Усиление до 80 дБ. Дальность до 100 м

Таблица 8. Системы ДСРИ на основе МР и компании, их выпускающие

Микрофонные решетки компаний Nordsonic и SquareHead

Одними из наиболее интересных являются семейства МР компаний Nordsonic и SquareHead, воплотившие в себе идеи неравномерного расположения микрофонов и обработки сигналов подрешеток в разных частотных полосах [46, 47]. Решетки построены на основе MEMS микрофонов и реализуют много интересных конструктивных решений.

Компания Norsonic выпускает МР для решения задач технической диагностики, в частности, для построения карт акустических температур. Компания SquareHead дополнила эти МР своими собственными алгоритмами обработки и применила для решения задач дистанционного сбора речевой информации.

В табл. 9 приведены некоторые характеристики (апертура D, частотный диапазон [Fmin, Fmax], число микрофонов M) МР обеих компаний.

D = 0,4 м D = 1 м D = 1,6 м

Norsonic M = 128 M = 256 M = 384

F = 316 Гц-15 кГц F = 125 Гц-15 кГц F = 80 Гц-15 кГц

SquareHead D = 0,5 м D = 1,05 м D = 1,55 м D = 2,12 м

M = 105 M = 225 M = 285 M = 345

Таблица 9. Параметры микрофонных решеток компаний Norsonic и SquareHead

Вид МР компании Norsonic представлен на рис. 5.

Рис. 5. Фотография МР компании Norsonic

МР компании SquareHead ЛМБ285 имеет диаметр апертуры 1,55 м, содержит 285 микрофонов и обеспечивает в диапазоне 800-5000 Гц ширину главного лепестка приблизительно 20°. По данным экспериментов, эта решетка обеспечивает прием разборчивой речи с расстояния до 30 м. Вид МР ЛМБ285 представлен на рис. 6.

Рис. 6. Фотография МР АМ0285 компании ЭриагеНеас! Пример размещения МР компании SquareHead в конференц-зале представлен на рис. 7.

Рис. 7. Размещение МР компании SquareHead в конференц-зале Микрофонные решетки компании GriffCom

Существенным недостатком рассмотренных МР является большой размер МР, не позволяющий применять их для мобильных приложений. Одной из систем, предназначенных для решения задач мобильного мониторинга, являются МР компании вгШСот, которые строятся (в зависимости от решаемой задачи) из отдельных малоразмерных решеток 5*4 микрофонов, обеспечивающих прием РС с дистанций до 10 м. При необходимости они объединяются в большую решетку, обеспечивая прием РС с дистанций до 64 м.

Перспективы применения микрофонных решеток (тенденции развития области)

Направление дистанционного сбора РС с использованием МР в настоящее время продолжает активно развиваться. К настоящему моменту сформировался ряд перспективных направлений развития систем ДСРИ на основе МР:

- Применение компактных МР на основе комбинированных broadside & endfire архитектур [48].

- Настройка алгоритмов обработки на конкретное помещение (использование априорной информации об акустических характеристиках помещения).

- Дополнение алгоритмов обработки МР алгоритмами одноканальной обработки (подавления стационарного широкополосного шума, реверберации и др.).

- Психоакустические алгоритмы обработки сигналов МР [49].

- Использование распределенных МР [50].

- Комбинация МР с системами видеомониторинга расширяет область применения МР [51].

Заключение

В настоящее время микрофонные решетки находят все большее применение в различных системах обработки речевой информации, в частности, дистанционного сбора речевой информации. Функциональные возможности микрофонных решеток определяются их геометрией и алгоритмами цифровой обработки сигналов. Базовые принципы работы микрофонных решеток и алгоритмы обработки их сигналов изложены в ряде монографий, однако данное направление продолжает активно развиваться. Оптимизация геометрии микрофонных решеток выполняется на основе статистического моделирования, аналитическое решение задачи отсутствует. Оптимизация геометрии микрофонных решеток по различным критериям приводит к различным структурам с неэквидистантным расположением микрофонов. Ряд зарубежных компаний предлагают системы на основе микрофонных решеток для решения широкого круга задач, связанных с обработкой речевых и аудиосигналов. Эффективность практического применения микрофонных решеток в значительной степени определяется методическими материалами, обобщающими опыт их практического применения.

Литература

1. Хорев А.А. Средства акустической разведки: направленные микрофоны и лазерные акустические системы разведки // Спецтехника и связь. 2008. № 3. С. 34-43.

2. Гатчин Ю.А., Карпик А.П., Ткачев К.О., Чиков К.Н., Шлишевский В.Б. Теоретические основы защиты информации от утечки по акустическим каналам. Учеб. пособие. Новосибирск: СГГА, 2008. 194 с.

3. Microphone Arrays. Signal Processing Techniques and Applications / Eds. M. Brandstein, D. Ward. SpringerVerlag, 2001. 402 p.

4. Van Trees H.L. Detection, Estimation and Modulation Theory, Part IV: Optimum Array Processing. NY: Wiley, 2002. 1470 p.

5. Johnson D.H., Dudgeon D.E. Array Signal Processing. Concepts and Techniques. Prentice Hall, 1993. 537 p.

6. Rayburn R.A. Eargle's Microphone Book: From Mono to Stereo to Surround. A Guide to Microphone Design and Application. 3rd ed. Focal Press, 2012. 480 p.

7. Benesty J., Chen J., Huang Y. Microphone Array Signal Processing. Springer, 2008. 240 p.

8. Springer Handbook of Speech Processing / Eds. J. Benesty, M.M. Sondhi, Y. Huang. Springer, 2008. 1159 p.

9. Tashev I.J. Sound Capture and Processing: Practical Approaches. Wiley, 2009. 388 p.

10. Speech Enhancement / Eds. J. Benesty, S. Makino, J. Chen. Berlin: Springer, 2010. 415 p.

11. Benesty J., Chen J. Study and Design of Differential Microphone Arrays. Springer, 2013. 184 p.

12. Звукометрия. Пособие для артиллерийских училищ РККА. Москва, государственное военное издательство Наркомата обороны СССР, 1938. 222 с.

13. Науменко И., Кизима В. Узконаправленная фазированная антенная решетка для дистанционного прослушивания источников речевой информации [Электронный ресурс]. Режим доступа: http://www.bnti.ru/dbtexts/ipks/old/analmat/1/fazresh.pdf, свободный. Яз. рус. (дата обращения 20.04.2015).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14. Schelkunoff S.A. A mathematical theory of linear arrays // Bell System Technical Journal. 1943. V. 22. P. 80107.

15. Frost O.L. An algorithm for linearly constrained adaptive array processing // Proceedings of the IEEE. 1972. V. 60. N 8. P. 926-935. doi: 10.1109/PR0C.1972.8817

16. Ma M.T. Theory and Application of Antenna Arrays. NY: Wiley, 1974. 430 p.

17. Applebaum S. Adaptive arrays // IEEE Transactions on Antennas Propagation. 1976. V. AP-24. N 5. P. 585598.

18. Griffiths L.J., Jim C.W. Alternative approach to linearly constrained adaptive beamforming // IEEE Transactions on Antennas and Propagation. 1982. V. AP-30. N 1. P. 27-34.

19. Даджион Д., Мерсеро Р. Цифровая обработка многомерных сигналов. М.: Мир, 1988. 488 с.

20. Монзинго Р. А., Миллер Т.У Адаптивные антенные решетки. М.: Радио и связь, 1986. 448 c.

21. Уидроу Б., Стирнз С. Адаптивная обработка сигналов. М.: Радио и связь, 1989. 440 c.

22. Lewis J. Analog and Digital MEMS Microphone Design Considerations. Technical Article MS-2472. Analog Devices, 2013, 4 p.

23. Тэйлор Р. Шум. М.: Мир, 1978. 308 с.

24. Dillon H. Hearing Aid Technology and the Future [Электронный ресурс]. Режим доступа: http://www.nal.gov.au/pdf/HD-CPD-in-Victoria.pdf, свободный. Яз. англ. (дата обращения 20.04.2015).

25. Microphone Array Beamforming. Application Note AN-1140 [Электронный ресурс]. Режим доступа: http://www.invensense.com/wp-content/uploads/2015/02/Microphone-Array-Beamforming.pdf, свободный. Яз. англ. (дата обращения 20.04.2015).

26. McCowan I.A. Microphone Arrays: A Tutorial [Электронный ресурс]. Режим доступа: https://www.idiap.ch/~mccowan/arrays/tutorial.pdf, свободный. Яз. англ. (дата обращения 20.04.2015).

27. Peral-Orts R., Velasco-Sanchez E., Campillo-Davo N., Camello-Vicente H. Using microphone arrays to detect moving vehicle velocity // Archives of Acoustics. 2013. V 38. N 3. P. 407-415. doi: 10.2478/aoa-2013-0048

28. Array Technology and Beamforming [Электронный ресурс]. Режим доступа: https://www.head-acoustics.de/downloads/eng/head_visor/Array_Beamforming_07_09e.pdf, свободный. Яз. англ. (дата обращения 20.04.2015).

29. Grythe J. Acoustic Camera and Beampattern [Электронный ресурс]. Norsonic Application Note, 2014, 8 p. Режим доступа: http://www.norsonic.com/filestore/PDF-filer/Application_Notes/ANacousticcameraandbeampattern.pdf, свободный. Яз. англ. (дата обращения 20.04.2015).

30. Mьо Ти Ха. Использование микрофонных решеток для улучшения качества записываемого сигнала в условиях сильного шума // Научная сессия МИФИ. 2007. Т. 1. С. 153-154.

31. Kodrasi I., Rohdenburg Т., Doclo S. Microphone position optimization for planar superdirective beamforming // Proc. IEEE Int. Conf. on Acoustic, Speech and Signal Processing (ICASSP). Prague, Czech Republic, 2011. P. 109-112. doi: 10.1109/ICASSP.2011.5946340

32. Christensen J.J., Hald J. Beamforming // Brüel & Kjsr Technical Review. 2004. N 1. P. 1-48.

33. Perrodin F., Nikolic J., Busset J., Siegwart R. Design and calibration of large microphone arrays for robotic applications // Proc. IEEE International Conference on Intelligent Robots and Systems. Vilamoura, Algarve, Portugal, 2012. P. 4596-4601. doi: 10.1109/IR0S.2012.6385985

34. Quaranta V., Dimino I., D'Altrui G. Acoustic antenna design general guidelines for beamforming noise source localization // Proc. 14th International Congress on Sound and Vibration, ICSV14. Australia, 2007. V. 5. P. 4172-4179.

35. Rabinkin D., Renomeron R., French J., Flanagan J.L. Optimum sensor placement for array sound capture // Proceedings of SPIE. 1997. V. 3162. P. 227-239. doi: 10.1117/12.284187

36. Hodjat F., Hovahessian S.A. Nonuniformly spaced linear and planar array antennas for sidelobe reduction // IEEE Transactions on Antennas and Propagation. 1978. V. AP-26. N 2. P. 198-204.

37. Steinberg B. Principles of Aperture and Array System Design: Including Random and Adaptive Arrays. NY: Wiley, 1976. 77 p.

38. Shanan S.S., Pomalaza-Raez C.A. The use of nonuniform element spacing in array processing algorithms // Journal of Acoustical Society of America. 1989. V. 86. N 4. P. 1416-1418.

39. Gaokar R., Cheeran A. Performance analysis of beamforming algorithms // International Journal of Electronics and Communication Technology. 2011. V. 2. N 1. P. 43-48.

40. Singh H., Jha R.M. Trends in Adaptive Array Processing // International Journal of Antennas and Propagation. 2012. V. 2012. Art. 361768. doi: 10.1155/2012/361768

41. Кривошейкин А.В., Перелыгин С.В. Микрофонная решетка для реализации направленной акустической антенны // Изв. вузов. Приборостроение. 2015. Т. 58. № 3. С. 221-225.

42. Кривошейкин А.В., Перелыгин С.В. Моделирование микрофонной антенной решётки // Мир техники кино. 2015. №1 (35). C. 22-26.

43. Столбов М.Б., Зубов Г.Н. Программные средства шумоочистки записей речи // Речевые технологии. 2014. №1-2. С. 103-113.

44. Mьо ^ Ха. Современное состояние и перспективы развития микрофонных решеток // Научная сессия МИФИ. 2007. Т. 17. С. 81-82.

45. Мальвар Э., Ташев И. Система и способ для формирования луча с использованием микрофонной решетки. Патент РФ №2369042. Бюл. 2009. №27.

46. Norsonic [Электронный ресурс]. Режим доступа: http://www.norsonic.com, свободный. Яз. англ. (дата обращения 20.04.2015).

47. Squarehead Technology [Электронный ресурс]. Режим доступа: http://www.sqhead.com, свободный. Яз. англ. (дата обращения 20.04.2015).

48. Buck M., Rófiler M. First order differential microphone arrays for automotive applications // Proc. 7th International Workshop on Acoustic Echo and Noise Control, IWAENC. Darmstadt, Germany, 2001. P. 19-22.

49. Borowicz A., Petrovsky A. Incorporating auditory properties into generalised sidelobe canceller // Proc. 20th European Signal Processing Conference. Bucharest, Romania, 2012. P. 589-593.

50. Bertrand A. Applications and trends in wireless acoustic sensor networks: a signal processing perspective // Proc. 18th IEEE Symposium on Communications and Vehicular Technology in the Benelux (SCVT 2011). Ghent, Belgium, 2011. Art. 6101302. doi: 10.1109/SCVT.2011.6101302

51. McCowan I.A., Krishna M.H. Gatica-Perez D., Moore D., Ba S. Speech acquisition in meetings with an audio-visual sensor array // Proc. IEEE International Conference on Multimedia and Expo (ICME 2005). Amsterdam, 2005. P. 1382-1385. doi: 10.1109/ICME.2005.1521688

Столбов Михаил Борисович — кандидат технических наук, старший научный сотрудник, ООО

ЦРТ-инновации, Санкт-Петербург, 196084, Российская Федерация; доцент, Университет ИТМО, Санкт-Петербург, 197101, Российская Федерация, stolbov@speechpro.com

Mikhail B. Stolbov — PhD, Senior scientific researcher, STC-innovations Ltd, Saint

Petersburg, 196084, Russian Federation: Associate professor, ITMO University, Saint Petersburg, 197101, Russian Federation, stolbov@speechpro.com

i Надоели баннеры? Вы всегда можете отключить рекламу.