Научная статья на тему 'Влияние неидентичности микрофонов на характеристики микрофонных решеток'

Влияние неидентичности микрофонов на характеристики микрофонных решеток Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
249
86
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МИКРОФОННАЯ РЕШЕТКА / СТЕПЕНЬ ПОДАВЛЕНИЯ МЕШАЮЩЕГО СИГНАЛА / СТЕПЕНЬ НЕИДЕНТИЧНОСТИ МИКРОФОНОВ / MICROPHONE ARRAY / DEGREE OF INTERFERING SIGNAL SUPPRESSION / DEGREE OF MICROPHONES NON-IDENTITY

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Перелыгин С. В., Кривошейкин А. В.

Предмет исследования. Рассмотрены способы обеспечения идентичности каналов микрофонов, используемых в микрофонных решетках. Разработана методика расчета разницы чувствительностей микрофонов, влияющей на степень подавления мешающего сигнала, применительно к задаче пространственного разделения широкополосных речевых сигналов. Методы. Теоретические и экспериментальные исследования базируются на использовании аппарата дискретного преобразования Фурье, методов вычислительной математики, математического моделирования. Основные результаты. Представлены аналитические выражения в замкнутой форме, получены теоретические зависимости, связывающие степень подавления мешающего сигнала с разницей в чувствительностях микрофонов. Моделирование, выполненное в среде MATLAB (версия 7), подтвердило справедливость полученных теоретических результатов. В ходе моделирования получена экспериментальная зависимость степени подавления мешающего сигнала от разницы в чувствительностях микрофонов. Эта зависимость позволяет определить допуск на отличие амплитудно-частотных характеристик микрофонов, при котором будет гарантировано требуемое подавление мешающего сигнала при выделении полезного сигнала. Практическая значимость. Результаты работы могут найти применение при проектировании устройства выделения речи целевого диктора из шумов из смеси голосов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Effect of microphones non-identity on the microphone arrays characteristics

Subject of Research. The paper deals with known methods that ensure microphone channels matching in a microphone arrays. The authors have developed the new calculation method of the sensitivities difference of the microphones having an effect on interfering signal suppression in the problem of broadband signals spatial separation. Methods. Theoretical and experimental studies are based on the use of the discrete Fourier transform apparatus, methods of computational mathematics, mathematical modeling. Main Results. We have proposed analytical expressions in a closed form and theoretical dependences, linking the degree of the interfering signal suppression with the microphones sensitivities difference. Simulation, performed in MATLAB environment (version 7), has confirmed the validity of theoretical results. In the course of modeling the authors have obtained experimental dependence of the interfering signal suppression on the microphones sensitivities difference. This dependence gives the possibility to define a tolerance on a difference between microphones frequency responses, which guarantees the required interfering signal suppression at the useful signal selection. Practical Significance. The results can be applied in the design of the device which separates target speaker's speech from noise of a mixture of voices.

Текст научной работы на тему «Влияние неидентичности микрофонов на характеристики микрофонных решеток»

НАУЧНО-ТЕХНИЧЕСКИИ ВЕСТНИК ИНФОРМАЦИОННЫХ ТЕХНОЛОГИИ, МЕХАНИКИ И ОПТИКИ январь-февраль 2016 Том 16 № 1 ISSN 2226-1494 http://ntv.i1mo.ru/

SCIENTIFIC AND TECHNICAL JOURNAL OF INFORMATION TECHNOLOGIES, MECHANICS AND OPTICS January-February 2016 Vol. 16 No 1 ISSN 2226-1494 http://ntv.ifmo.ru/en

УДК 621.391.84

влияние неидентичности микрофонов на характеристики

микрофонных решеток:

С.В. Перелыгина, А.В. Кривошейкина

a Санкт-Петербургский государственный институт кино и телевидения, Санкт-Петербург, 191119, Российская Федерация

Адрес для переписки: [email protected] Информация о статье

Поступила в редакцию 10.11.15, принята к печати 11.12.15 doi:10.17586/2226-1494-2016-16-1-133-138 Язык статьи - русский

Ссылка для цитирования: Перелыгин С.В., Кривошейкин А.В. Влияние неидентичности микрофонов на характеристики микрофонных решеток // Научно-технический вестник информационных технологий, механики и оптики. 2016. Т. 16. № 1. С. 133-138.

Аннотация

Предмет исследования. Рассмотрены способы обеспечения идентичности каналов микрофонов, используемых в микрофонных решетках. Разработана методика расчета разницы чувствительностей микрофонов, влияющей на степень подавления мешающего сигнала, применительно к задаче пространственного разделения широкополосных речевых сигналов. Методы. Теоретические и экспериментальные исследования базируются на использовании аппарата дискретного преобразования Фурье, методов вычислительной математики, математического моделирования. Основные результаты. Представлены аналитические выражения в замкнутой форме, получены теоретические зависимости, связывающие степень подавления мешающего сигнала с разницей в чувствительностях микрофонов. Моделирование, выполненное в среде MATLAB (версия 7), подтвердило справедливость полученных теоретических результатов. В ходе моделирования получена экспериментальная зависимость степени подавления мешающего сигнала от разницы в чувствительностях микрофонов. Эта зависимость позволяет определить допуск на отличие амплитудно-частотных характеристик микрофонов, при котором будет гарантировано требуемое подавление мешающего сигнала при выделении полезного сигнала. Практическая значимость. Результаты работы могут найти применение при проектировании устройства выделения речи целевого диктора из шумов из смеси голосов. Ключевые слова

микрофонная решетка, степень подавления мешающего сигнала, степень неидентичности микрофонов

effect of microphones non-identity on the microphone arrays characteristics

S.V. Perelygina, A.V. Krivosheikina

a Saint Petersburg State University of Film and Television, Saint Petersburg, 191119, Russian Federation Corresponding author: [email protected] Article info

Received 10.11.15, accepted 11.12.15 doi:10.17586/2226-1494-2016-16-1-133-138 Article in Russian

For citation: Perelygin S.V., Krivosheikin A.V. Effect of microphones non-identity on the microphone arrays characteristics. Scientific and Technical Journal of Information Technologies, Mechanics and Optics, 2016, vol. 16, no. 1, pp. 133-138.

Abstract

Subject of Research. The paper deals with known methods that ensure microphone channels matching in a microphone arrays. The authors have developed the new calculation method of the sensitivities difference of the microphones having an effect on interfering signal suppression in the problem of broadband signals spatial separation. Methods. Theoretical and experimental studies are based on the use of the discrete Fourier transform apparatus, methods of computational mathematics, mathematical modeling. Main Results. We have proposed analytical expressions in a closed form and theoretical dependences, linking the degree of the interfering signal suppression with the microphones sensitivities difference. Simulation, performed in MATLAB environment (version 7), has confirmed the validity of theoretical results. In the course of modeling the authors have obtained experimental dependence of the interfering signal suppression on the microphones sensitivities difference. This dependence gives the possibility to define a tolerance on a difference between microphones frequency responses, which guarantees the required interfering signal suppression at the useful signal selection. Practical Significance. The results can be applied in the design of the device which separates target speaker's speech from noise of a mixture of voices. Keywords

microphone array, degree of interfering signal suppression, degree of microphones non-identity

Введение

В задаче приема и обработки речевых сигналов используются микрофонные решетки - акустические антенны, приемными элементами которых являются микрофоны. Наличие большого количества приемников сигнала в микрофонной решетке позволяет сформировать заданную диаграмму направленности акустической антенны. Преимущества микрофонных решеток по сравнению с системами сбора речевой информации с одним микрофоном состоят в направленности приема звука, подавлении шумов точечных источников, подавлении нестационарных шумов окружения и достижении большего отношения сигнал/шум, частичном ослаблении реверберации, возможности пространственной локализации звука целевого диктора, возможности сопровождения двигающегося диктора и точечного источника шума [1].

Одна из главных проблем в достижении и обеспечении требуемых параметров микрофонной решетки - несоответствие между характеристиками каналов, вызванное разбросами допусков микрофонов. Алгоритмы формирования диаграммы направленности микрофонной решетки подразумевают согласованность (идентичность) каналов микрофонов [2, 3]. Даже для простейшего алгоритма задержки и суммирования при неидентичности каналов снижается эффективность обработки сигнала [4].

Обеспечение согласованности каналов является сложной и дорогой процедурой, особенно при обработке широкополосного сигнала. Известны следующие способы обеспечения идентичности каналов: калибровка каждой пары микрофон-предусилитель [5], выбор микрофонов с близкими по значению параметрами, калибровка с помощью программного обеспечения [6-8], в том числе процедура автокалибровки в режиме реального времени [9].

В [4] предлагается методология расчета и результаты анализа чувствительности параметров формирователя диаграммы направленности к конструкционным допускам, применяемым при производстве микрофонов. В частности, имитируются отклики микрофонов с различными параметрами на тестовый сигнал с применением метода Монте-Карло, исследуется ослабление собственного шума решетки в зависимости от различий в амплитудно-частотных характеристиках (АЧХ) и фазо-частотных характеристиках микрофонов.

В настоящей работе будет рассмотрена проблема неидентичности каналов применительно к задаче пространственного разделения двух сигналов, т.е. подавления мешающего сигнала при выделении полезного сигнала.

Вывод аналитических соотношений

Как показано в [10, 11], уже при наличии двух идентичных ненаправленных микрофонов (случай вырожденной микрофонной решетки) можно осуществить пространственное разделение двух широкополосных сигналов, источники которых образуют углы ф' и ф" относительно нормали к решетке (рис. 1).

Плоская волна (первый источник)

Плоская волна (второй источник)

X

б

Рис. 1. Схема, поясняющая принцип работы решетки: звуковая волна от первого источника (а); звуковая волна от второго источника (б); б - расстояние между центрами микрофонов

Для решения задачи применяется взвешенное суммирование принятых сигналов в частотной области и оговаривается, что воздействующие на решетку сигналы занимают одинаковый диапазон частот и имеют плоский волновой фронт. Сигнал на выходе настроенной решетки находится из соотношения [11, 12]:

£('ю) = м ('ю) • ('ю) + м ('ю) 5 ('ю),

(1)

где 5('ю), £!('ю), 52('ю) - спектральные плотности выходного сигнала, сигнала на выходе первого микрофона и сигнала на выходе второго микрофона соответственно; 'ю), м2('ю) - частотно-зависимые весовые коэффициенты, рассчитываемые по следующим формулам [11]:

а

о

а

w(j'ro) =-7—тт-—"—i—гл ' (2)

( d • (sin rn"-sin rn')

1 - exp I jro----z-

l с

d • sin ф"

- expI jra

w2( ja) =-г—1-----r-, (3)

( . d • (sin ф"- sin ф') 1 - exp I jra-

с

где с - скорость распространения звуковой волны; d - расстояние между микрофонами; ф' - угол прихода полезного сигнала; ф" - угол прихода мешающего сигнала; ю - циклическая частота; j - мнимая единица. В [13] описаны результаты моделирования вырожденной микрофонной решетки и требования к расчету весовых коэффициентов (2)-(3), гарантирующие минимальные искажения полезного сигнала. В [10, 11, 13] микрофоны считаются одинаковыми по своим характеристикам, т.е. не вносят амплитудных и фазовых искажений в принимаемый сигнал. Исходя из этого, как следует из [11], применение взвешенного суммирования (1) с весовыми коэффициентами, рассчитанными по (2)-(3), гарантирует полное подавление мешающего сигнала при выделении полезного сигнала.

Выведем зависимость степени подавления мешающего сигнала при использовании неодинаковых микрофонов, т.е. имеющих различные чувствительности.

Рассмотрим процесс прохождения мешающего широкополосного сигнала с плоским волновым фронтом через микрофонную решетку, состоящую из двух микрофонов (рис. 1, б). Источник полезного

сигнала, находящийся под углом ф', считаем выключенным. • •

Пусть Xj"(jю) и X2"(ja) - спектральные плотности сигналов от источника мешающего сигнала

на выходах первого и второго микрофонов соответственно. Запишем следующие соотношения для принятой модели сигналов и геометрии их распространения:

- если микрофоны идентичны [11], то

X"(ja) = X"(ja) • expja • "

- если микрофоны неидентичны, то

X"(ja) = P( jю, ф") • X"(jю) • exp jю •d'si"ф"j , (4)

где P(ja, ф") - отношение спектральных плотностей чувствительностей микрофонов, т.е. степень их неидентичности.

В результате взвешенного суммирования (1) спектральных плотностей мешающего сигнала с выхода каждого микрофона получим спектральную плотность X"(ja) отклика решетки на сигнал мешающего источника:

X"(ja) = w.( ja) • X "(ja) + w2 (ja) • X "(ja). (5)

При подстановке (4) в (5) получим

X"(ja) = Wj(ja) • X "(ja) + w2(ja) • P(ja,ф") • X "(ja) • exp(-ja • d' ф"j . (6)

Подстановка выражений для расчета весовых коэффициентов (2)-(3) в (6) дает

X"(ja) =-7-1-т • X,"(ja) -

( . d • (sin ф"- sin ф') 1 - exp I ja------т

I с

í. d • sin ф" ^ . (7)

expI jro--I ^ .

I с - . • . ( . d • sin ф"

• P(ja, ф") • X/'Ora) • exp I - ja •-

, . d • (sin ф"- sin ф')

1 - exp I ja--^ ^

с

После преобразований в (7) имеем:

X = X •(w •[■ -цм ФП] . (8)

( . d • (sin ф"- sin ф')

1 - exp I ja---—

Из (8) выразим комплексный коэффициент передачи мешающего сигнала: X "(уш) _ 1 - в (М у ")

А"(уш) _

ХДуш) 1 - ехр (уш-а •(51П^ ™У ^ )

При проведении расчетов далее используем выраженную в децибелах величину степени подавления мешающего сигнала, обратную коэффициенту передачи:

ААдБ " _ -20 • 1

1 - в ((ш, У")

1 -ехрI уш

d • фп у"-зт у')

(9)

Из (8) и (9) следует, что в частном случае, при полной идентичности микрофонов, т.е. при выполнении условия в(уш,У") _ 1, отклик решетки на мешающий сигнал будет равен нулю (степень подавления мешающего сигнала стремится к бесконечности). В остальных случаях отклик настроенной решетки будет содержать не только полезный, но и ненулевой мешающий сигнал. Если считать, что неидентичность микрофонов определяется реальными возможностями технологии их изготовления с допуском 0,01% (в = 0,9999), то максимально возможное значение степени подавления мешающего сигнала будет равно 80 дБ.

Заметим, что если и полезный, и мешающий сигналы, воздействующие на решетку, имеют одинаковые мощности, то степень подавления мешающего сигнала, т.е. отношение мощности мешающего сигнала на входе решетки к мощности мешающего сигнала на выходе решетки, можно интерпретировать как выходное отношение мощностей полезного и мешающего сигналов.

Оценим количественно теоретический диапазон значений величины ААдБ". Поскольку нас интересует степень подавления мешающего сигнала как функции неидентичности микрофонов ААдБ "(в), то для упрощения расчетов будем считать, что степень неидентичности в не зависит от частоты ш и угла прихода мешающего сигнала у" .

Верхний диапазон значений ААдБ "(в) соответствует случаю, когда знаменатель в (9) принимает по абсолютной величине наибольшее значение, равное 2:

1 - в (*, У")

АА,

" _ -20 •

2

-20 • 1я|1 - в| + 6.

Нижний диапазон значений ААдБ "(в) соответствует случаю, когда знаменатель в (9) принимает по

абсолютной величине очень малые значения. Как следует из наложения пороговых ограничений на весовые коэффициенты [13], минимально возможное значение знаменателя равно 0,67. С учетом найденного значения запишем выражение (9) в виде

1 - в (ш, у")

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ААБ . " _ -20 • 1

дБ шт

0,67

>-20 • 1д|1 - в - 3,5.

Моделирование

Для исследования влияния разницы в чувствительностях микрофонов на степень подавления мешающего сигнала проведено моделирование в среде МЛТЬЛБ (версия 7). В качестве мешающего сигнала создан речевой сигнал в формате звукового файла <^ау» со следующими параметрами: длительность 25 с, частота дискретизации 48 кГц, разрядность 16 бит на отсчет. Задавались разные значения разности чувствительностей микрофонов в в дБ и относительных единицах. С учетом неидентичности микрофонов имитировался процесс воздействия этого сигнала на вырожденную микрофонную решетку под углом у" _ 40°. Было выбрано расстояние между микрофонами d = 0,05 м, скорость звука с _ 340 м/с . Далее выполнялось взвешенное суммирование спектров сигналов с выходов имитированных микрофонов. Для перехода в частотную область был применен метод выборок (окно Ханна, 2048 отсчетов, перекрытие 50%, временной период 42,7 мс) и использовано дискретное преобразование Фурье (частота дискретизации 48 кГц, шаг по частоте 23,4 Гц). При расчете весовых коэффициентов в (2)-(3), помимо угла у" _ 40° был произвольно задан угол прихода фиктивного полезного сигнала у' _ -40°.

Для случая в _ 1 при заданных углах прихода сигналов обеспечивается полное подавление мешающего сигнала, приходящего по направлению у" _ 40°, и выделение полезного сигнала с минимальными искажениями, приходящего по направлению у' _ -40°. Но, поскольку при проведении моделиро-

вания отсутствовал полезный сигнал, то выполнялось только подавление мешающего сигнала. В этой связи степень подавления мешающего сигнала рассчитывалась как отношение энергий воздействующего на решетку и прошедшего обработку сигналов для каждого значения в .

ДАдв" 60

1 |

50 I

,'В Г\

40 V

........./7Г 1

1 30

¡/ / ......... 3

___________ -------------- 20 2 -----------

2 ■—

10

-----"

-2,5

-2

-1,5

-1 -0,5

0

Рдв

0,5

1,5

2,5

Рис. 2. Границы теоретического диапазона значений степени подавления мешающего сигнала, соответствующие максимальному (1) и минимальному (2) абсолютным значениям Л4дВ "(Р);

экспериментальная зависимость степени подавления мешающего сигнала от разницы в чувствительностях микрофонов (3)

В соответствии с рис. 2, экспериментальная кривая 3 попадает в теоретический диапазон значений, границы которых определяются кривыми 1 и 2. По кривой 3, исходя из требований психоакустики [14, 15] к степени подавления мешающего сигнала, может быть определена допустимая степень неидентичности микрофонов. Микрофонная решетка должна быть укомплектована микрофонами, удовлетво -ряющими требованиям к рассчитанной степени неидентичности.

Заключение

В работе представлена новая методика расчета степени подавления мешающего сигнала при разных значениях неидентичности микрофонов применительно к задаче пространственного разделения сигналов. Полное подавление мешающего сигнала обеспечивается абсолютной идентичностью параметров микрофонов. Конечное значение степени подавления мешающего сигнала обеспечивается реальными возможностями технологии изготовления микрофонов. Моделирование, имитирующее прохождение сигналов через микрофоны с различными амплитудно-частотными характеристиками, подтвердило справедливость полученных теоретических результатов. Экспериментальная зависимость степени подавления мешающего сигнала от неидентичности микрофонов позволяет определить допуск на отличие амплитудно-частотных характеристик микрофонов, при котором будет гарантировано требуемое подавление мешающего сигнала при выделении полезного сигнала. Результаты исследования могут быть полезны при разработке устройства выделения речи целевого источника из шумов и смеси голосов.

Литература

1. Столбов М.В. Применение микрофонных решеток для дистанционного сбора речевой информации // Научно-технический вестник информационных технологий, механики и оптики. 2015. Т. 15. № 4. С. 661-675. doi: 10.17586/2226-1494-2015-15-4-661-675

2. McCowan I. A. Microphone Arrays: A Tutorial [Электронный ресурс]. Режим доступа: https://www.idiap.ch/~mccowan/arrays/tutorial.pdf, свободный. Яз. англ. (дата обращения 11.10.2015).

3. Singh H., Jha R.M. Trends in adaptive array processing // International Journal of Antennas and Propagation. 2012. V. 2012. Art. 361768. doi: 10.1155/2012/361768

4. Tashev I. Beamformer sensitivity to microphone manufacturing tolerances // Proc. 19th Int. Conf. on Systems for Automation of Engineering and Research (SAER-2005). Sofia, Bulgaria, 2005. P. 132-136.

5. AIP Hand-book of Condenser Microphones: Theory, Calibration, and Measurements / Eds. G.S.K. Wong, T.F.W. Embleton. NY: American Institute of Physics, 1995. 322 p.

6. Nordholm S., Claesson I., Dahl M. Adaptive microphone array employing calibration signals: an analytical evaluation // IEEE Trans. on Speech and Audio Processing. 1996. V. 7. N 3. P. 241-252. doi: 10.1109/89.759030

7. Seltzer M., Raj B. Calibration of microphone arrays for improved speech recognition // Mitsubishi Research Laboratories, TR-2002-43.

1

2

8. Wu H., Jia Y., Bao Z. Direction finding and array calibration based on maximal set of nonredundant cumulants // Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, ICASSP. Atlanta, USA, 1996. V. 5. P. 2626-2629.

9. Tashev I. Gain self-calibration procedure for microphone arrays // Proc. IEEE Int. Conf. on Multimedia and Expo (ICME). Taipei, Taiwan, 2004. V. 2. P. 983-986.

10. Кривошейкин А.В., Перелыгин С.В. Принципы настройки микрофонных антенных решеток // Материалы X Международной научно-практической конференции «Прикладные научные разработки - 2014». Прага, Чехия, 2014. С. 14-17.

11. Кривошейкин А.В., Перелыгин С.В. Микрофонная решетка для реализации направленной акустической антенны // Изв. вузов. Приборостроение. 2015. Т. 58. № 3. С. 221-225. doi: 10.17586/0021-3454-2015-58-3-221-225

12. Монзинго Р. А., Миллер Т.У Адаптивные антенные решетки. М.: Радио и связь, 1986. 448 c.

13. Кривошейкин А.В., Перелыгин С.В. Моделирование микрофонной антенной решетки // Мир техники кино. 2015. №1 (35). C. 22-26.

14. Вахитов Ш.Я., Ковалгин Ю.А., Фадеев А.А., Щевьев Ю.П. Акустика: учебник для вузов. М.: Горячая линия-Телеком, 2009. 660 с.

15. Вахитов Я.Ш. Слух и речь. Л.: ЛИКИ, 1973. 124 с.

Перелыгин Сергей Васильевич

Кривошейкин Анатолий Валентинович

аспирант, инженер, Санкт-Петербургский государственный институт кино и телевидения, Санкт-Петербург, 191119, Российская Федерация, [email protected]

доктор технических наук, профессор, профессор, Санкт-Петербургский государственный институт кино и телевидения, Санкт-Петербург, 191119, Российская Федерация, [email protected]

Sergey V Perelygin

Anatoly V Krivosheikin

postgraduate, engineer, Saint Petersburg State University of Film and Television, Saint Petersburg, 191119, Russian Federation, [email protected]

D.Sc., Professor, Professor, Saint Petersburg State University of Film and Television, Saint Petersburg, 191119, Russian Federation, [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.