Научная статья на тему 'Применение цифрового гребенчатого фильтра в устройствах шумоподавления речевых сигналов'

Применение цифрового гребенчатого фильтра в устройствах шумоподавления речевых сигналов Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
931
73
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ / DIGITAL SIGNAL PROCESSING / ГРЕБЕНЧАТЫЙ ФИЛЬТР / COMB FILTER / ИНТЕРПОЛЯЦИОННЫЙ ПОЛИНОМ / POLYNOMIAL INTERPOLATION / МНОГОЧЛЕН ЛАГРАНЖА / LAGRANGE POLYNOMIAL / ПЕРИОДИЧЕСКИЙ СИГНАЛ / PERIODIC SIGNAL

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Чесноков Михаил Александрович

Устройства шумоподавления речевых сигналов предназначены для повышения разборчивости речи в системах распознавания и в устройствах индивидуальной слухокоррекции слуховых аппаратах. В звукотехнических системах широкое распространение получила технология Noise Gate. Технология Noise Gate, являясь инвариантной к виду спектра входного сигнала, не учитывает особенностей речевого сигнала, что ограничивает возможности ее применения. Эта особенность состоит в том, что в спектре речевого сигнала присутствуют кратные, т.е. периодические составляющие для вокализированных участков речи. Периодичность речевого сигнала позволяет использовать согласованный гребенчатый фильтр для выделения сигнала из смеси с шумами. Данная статья посвящена разработке метода реализации цифрового гребенчатого фильтра (ГФ) для подавления шумов в речевом сигнале.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Чесноков Михаил Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Digital comb filter in the devices of noise reduction of speech signals

Device noise reduction of speech signals are designed to improve speech recognition systems and hearing aids. In Acoustic sound system technology has spread widely Noise Gate. Technology Noise Gate, being invariant to mean spectrum of the input signal does not include the features of the speech signal, which limits its application. This feature consists that the spectrum of the speech signal has periodic components for the voiced parts of speech. The frequency of the speech signal allows the use of an agreed comb filter to separate the signal from the mixture with noise. This paper focuses on the development of the method of the digital comb filter (СF) for noise suppression in speech signal.

Текст научной работы на тему «Применение цифрового гребенчатого фильтра в устройствах шумоподавления речевых сигналов»

-►

Проблемы передачи и обработки информации

УДК 62-533.4

М.А. Чесноков

цифровой гребенчатый фильтр с линией задержки продолжительностью в дробное число отсчетов

M.A. Chesnokov

DIGITAL COMB FILTER IN THE DEVICES OF NOISE REDuCTION

of speech SIGNALS

Устройства шумоподавления речевых сигналов предназначены для повышения разборчивости речи в системах распознавания и в устройствах индивидуальной слухокоррекции — слуховых аппаратах. В звукотехнических системах широкое распространение получила технология Noise Gate. Технология Noise Gate, являясь инвариантной к виду спектра входного сигнала, не учитывает особенностей речевого сигнала, что ограничивает возможности ее применения. Эта особенность состоит в том, что в спектре речевого сигнала присутствуют кратные, т. е. периодические составляющие для вокализированных участков речи. Периодичность речевого сигнала позволяет использовать согласованный гребенчатый фильтр для выделения сигнала из смеси с шумами. Данная статья посвящена разработке метода реализации цифрового гребенчатого фильтра (ГФ) для подавления шумов в речевом сигнале.

ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ. ГРЕБЕНЧАТЫЙ ФИЛЬТР. ИНТЕРПОЛЯЦИОННЫЙ ПОЛИНОМ. МНОГОЧЛЕН ЛАГРАНЖА. ПЕРИОДИЧЕСКИЙ СИГНАЛ.

Device noise reduction of speech signals are designed to improve speech recognition systems and hearing aids. In Acoustic sound system technology has spread widely Noise Gate. Technology Noise Gate, being invariant to mean spectrum of the input signal does not include the features of the speech signal, which limits its application. This feature consists that the spectrum of the speech signal has periodic components for the voiced parts of speech. The frequency of the speech signal allows the use of an agreed comb filter to separate the signal from the mixture with noise. This paper focuses on the development of the method of the digital comb filter (CF) for noise suppression in speech signal.

DIGITAL SIGNAL PROCESSING. COMB FILTER. POLYNOMIAL INTERPOLATION. LAGRANGE POLYNOMIAL. PERIODIC SIGNAL.

Устройства шумоподавления речевых сигналов предназначены для повышения разборчивости речи в системах распознавания и в устройствах индивидуальной слухокоррекции — слуховых аппаратах [1—4]. В настоящее время широкое распространение получила технология Noise Gate [5—7], применение которой направлено на шумоподавление речевого сигнала. Эта техноло-

гия основана на выделении в энергетическом спектре речевого сигнала частотных полос, энергия которых выше заданного порогового уровня. При установлении величины порогового уровня используются неоднозначные субъективные критерии, зависящие от вида шумовой помехи. Технология Noise Gate, являясь инвариантной к виду спектра входного сигнала, не учиты-

вает особенность речевого сигнала, состоящую в том, что в спектре речевого сигнала присутствуют кратные, т. е. периодические, составляющие для вокализированных участков речи. Между тем в ряде технических приложений на базе принципа активной локации используется периодичность спектра источника сигнала для выделения информации о свойствах источника [8], о его местоположении [9].

Периодичность речевого сигнала позволяет использовать для шумоподавления речевых сигналов методы приема сигналов, применяемые в системах активной локации. Для этого необходимо решить практическую задачу адаптации этих методов и, в частности, метода построения согласованного гребенчатого фильтра [7, 10] с целью повышения разборчивости речи в системах распознавания и в устройствах индивидуальной слухокоррекции.

Актуальность решения этой задачи для систем распознавании речи определяется актуальностью использования самих систем в задачах общего и специального назначения. Что касается индивидуальных устройств слухокоррекции, то актуальность решения задачи вызвана необходимостью увеличения разборчивости речи в условиях постоянно увеличивающегося уровня шума окружающей среды за счет работы механизмов и наличия стационарного шума при большом скоплении людей.

Данная статья посвящена разработке метода реализации цифрового гребенчатого фильтра (ГФ) в составе цифрового слухового аппарата для подавления шумов в речевом сигнале.

Постановка задачи

Выходной сигнал ГФ формируется как сумма входного сигнала и выходного сигнала, задержанного линией задержки на время т и умноженного на коэффициент обратной связи g < 1. Гребенчатый фильтр является многополосным полосовым фильтром (ПФ), амплитудно-частотная характеристика (АЧХ) которого достигает максимумов на частотах 0, 1/т, 2/т, ..., и/т, где п — натуральное число, соответствующее номеру полосы пропускания ГФ. Гребенчатый

фильтр используется в качестве фильтра, согласованного с периодическим сигналом, при этом частоты максимумов в спектре сигнала совпадают с частотами максимумов АЧХ ГФ. При цифровой реализации ГФ линию задержки можно представить как область памяти, например, в виде регистра сдвига. Тогда находящиеся в нем числа представляют собой выборки значений выходного сигнала, а соседние значения разделяются интервалом времени, равным периоду дискретизации системы Дт. Таким образом, сигнал на выходе линии задержки ГФ может быть задержан относительно сигнала на выходе ГФ только на интервалы времени, кратные периоду дискретизации системы. Если это условие не выполняется, то есть т ф и*Дт, где п — натуральное число, то частоты максимумов АЧХ ГФ не совпадают с частотами максимумов в спектре сигнала. Более того, гребенчатый фильтр вместо подавления помех начинает выделять спектральные составляющие помех, отсутствующих в полезном сигнале.

Проиллюстрируем этот факт на примере работы цифрового ГФ с частотой дискретизации / = 8 кГц и периодом дискретизации Дт =1// = 0,125 мс. Пусть на вход подается синтетический речеподобный сигнал, состоящий из ряда гармоник с разными амплитудами и частотой основного тона (ОТ) /от = 355 Гц, что соответствует верхнему порогу частоты оТ для женского голоса [4]. Период ОТ равен Дтот = 1//от = 2,8 мс, и выраженный в периодах дискретизации нормированный период ОТ приблизительно равен иот = Дтот/Дт « 22,5.

При округлении нормированного периода до ближайшего целого как в меньшую сторону п1 = 22 (частота первого пика АЧХ / = 363,6 Гц), так и в большую сторону и2 = 23 (/ = 347,8 Гц) максимумы АЧХ фильтра сместятся.

На рис. 1 представлены результаты моделирования гребенчатого фильтра в среде МаНаЪ, иллюстрирующие процесс смещения АЧХ фильтра относительно максимумов спектральной плотности тестового входного сигнала при отсутствии кратности между периодом основного тона и периодом дискретизации.

О 500 1000 1500 £ Гц

Рис. 1. Результаты моделирования гребенчатого фильтра в среде МаНаЪ:

(-) — нормированная спектральная плотность тестового входного сигнала;

(-) — нормированная АЧХ ГФ при округлении задержки фильтра до 22 периодов дискретизации; (-----) — нормированная АЧХ ГФ при округлении задержки

фильтра до 23 периодов дискретизации

Как видно из графиков, приведенных на рисунке, при любом способе округления максимумы АЧХ ГФ уже на второй и последующих гармониках достаточно сильно отстоят от максимумов спектрального распределения входного сигнала. Это означает, что на этих гармониках полезный сигнал не выделяется, а подавляется. Более того, выделяются спектральные составляющие помех в окрестности гармонических составляющих. В реальном сигнале частота основного тона меняется во времени и, следовательно, простая модель цифрового ГФ оказывается неэффективной.

Сформулируем следующую задачу. Пусть необходимо разработать цифровой ГФ, согласованный с сигналом, дискретный спектр которого состоит из ряда гармоник с частотами / = / / = 2f, /3 = 3/, ... . Значение частоты дискретизации / не кратно частотам гармоник, включая частоту основного тона /.

Интерполяционный алгоритм

Решим данную задачу, используя процедуру интерполяции. На рис. 2 представлена структурная схема интерполяционного цифрового ГФ, включающего в себя: линию задержки (ЛЗ) с двумя отводами на время задержки, соответственно т1, т2; интерполятор (ИНТ); усилитель с коэффициентом

передачи g и сумматор. Интерполятор реализует процедуру интерполяции, т. е. нахождения сигнала у(т), являющегося оценкой выходного сигнала на выходе линии задержки при задержке т, по дискретным значениям задержки на отводах лЗ, ближайшим к значению т = 1// на временной оси. Полученная оценка у(т) направляется в сумматор.

С целью интерполяции необходимо использовать два ближайших к т значения времени задержки т1 и т2, кратных периоду дискретизации Дт, то есть т1 < т < т2, т2 = т1 + Дт.

Искомая интерполяционная функция записывается в виде у(т) = а0 + а1 • т. Для точек сигнала, соответствующих временам т1 и т2, можно записать систему уравнений

Рис. 2. Структурная схема гребенчатого фильтра с интерполятором по двум отсчетам

[Ж) = а0 + а1 • Т

[ У(Т2) = а + й1 • Т2 Решение системы имеет вид У (-О - У (т 2)

а =

т То

ао = У(т2) - У(^ - У(^ -

Интерполируемый сигнал в точке, соответствующей времени т, находится по формуле:

У(т) = У(Т1)С + У(Т2)(1 - С).

Удостоверимся в том, что полученная таким образом оценка действительно с большой точностью обеспечивает совпадение частот экстремумов АЧХ ГФ и частот экстремумов сигнала. Запишем уравнение непрерывности для системы ГФ, использующей интерполятор,

иВЫх( / ю) = ивх( / ю) +

+g(Uвых(/ю)е-,/'шТ1 С + ивых(/ю)е/1 - С)),

У(т) = У(Т2) -

У СО - У(Т2)

и (/ю)=

вых V«/ /

ивх( / ю)

(3)

+ У(т1) - У(т2) •т

(1)

Для удобства дальнейших преобразований обозначим

1 - gCe-/шТ1С - g(1 - С)е-^

из (3) находим передаточную функцию гребенчатого фильтра (ГФ): и (/ю)

вых '

Т( /ю) =

ивх( / ю) 1

С =

Хл То

(2)

и подставим (2) в (1)

Т( /ю)\ =

1 - gCe-/"Ч - ^(1 - С)е^2

Выражение для расчета модуля передаточной функции имеет вид:

1

1 - gC С08(ют1) + jgC 81п(ют1) - g(1 - С) С08(ют2) + jg(1 - С) 8т(ют2)

1

]] 1 - gC С08(ют1) - jgC 81п(ют1) - g(1 - С) С08(ют2) - jg(1 - С) 8т(ют2 )

_1_

- 2gC С08(ют1) - 2g(1 - С) С08(ют2) + g2С2 + 2g2С(1 - С) С08(ют1)е08(ют2) +

1

(4)

+2g2С(1 - С) 8т(ют1) з1п(ют2)

Подставляем (2) в (4): | Т(/ю) |= -=

1 - 2 g

т - т2

008(ют1) - 2g I —-— I 008(ют2) + g

т - т2

X

1

+2g I -— II —- I 008(ют1) 008(ют2) + 2g I -— II —- I 8!п(ют1)81п(ют2)

1Т1 Т2 ЛТ1 Т2 ) 1Т1 Т2 ЛТ1 Т2 )

Найдем точки экстремума функции ций | Т(/ю) | и | Т(/ю) |2 совпадают, то рас-Т(/ю) |. Так как точки экстремума функ- смотрим выражение для квадрата модуля:

1

| Т(/ю) |2 =

1 - 2g I I 008(юТ1) - 2g I I 008(юТ2) + g21 I +

+2 g2

т — т.

со8(ют1)со8(ют2) + 2g2

Обратимся к производной и приравняем ее к нулю:

¿\Т (У ю)|2 =

ё ю

= \т (у ю)4

( ,Л т1 — т

2g

(( Т Т \

т — т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

— т2 У

8!п(ют1) +

8т(ют2)

(5)

= 0.

Из (5) следует, что точками экстремума функции | Т(ую) | являются корни уравнения:

(

т — т

Л

81п(ют1) +

(т—т^

з1п(ют2) = 0. (6)

Ввиду отсутствия аналитического решения его корни могут быть найдены численными методами.

В качестве примера рассмотрим интерполяционный цифровой ГФ со следующими параметрами: частота дискретизации / = 8 кГц; т1 = 2,7 мс (22 отсчета сигнала — /1 = 363,6 Гц); т2 = 2,9 мс (23 отсчета сигнала — / = 347,8 Гц); т = 2,8 мс (22,5 отсчета сигнала — / = 355,5 Гц); коэффициент обратной связи g = 0,7. На рис. 3 представлены результаты моделирования в среде МаНаЪ в виде трех нормированных АЧХ.

Из графиков на рисунке видно, что положение экстремума на частотной оси ин-

т — т.

з1п(ют1) 8т(ют2)

терполяционного ГФ совпадают с заданным значением / = 1/т. Это же значение получено при расчете по формуле (6).

Рассмотренный алгоритм построения интерполяционного цифрового ГФ по двум точкам интерполяции распространяется на общий случай нескольких точек с использованием интерполяционного полинома Лагранжа [11].

Сравнительный анализ результатов

Все способы оценки эффективности методов шумоподавления разделяются на две группы: объективные и субъективные. Степень эффективности в объективном методе может оцениваться коэффициентом улучшения отношения сигнал/шум на выходе системы по сравнению с этим отношением на ее входе [12]. Субъективные методы основаны на экспертных оценках разборчивости речи в результате проведения большого количества артикуляционных испытаний с участием экспертов [12, 13]. Для сравнительной оценки эффективности обратимся к объективному методу, используя сравнение коэффициентов улучшения.

В рамках предлагаемой методики было проведено моделирование в среде МаНаЪ схемы, приведенной на рис. 2. На вход схе-

200

300

400

500

/,Гц

Рис. 3. Результаты моделирования в среде МаНаЪ:

(..........) — АЧХ интерполяционного цифрового ГФ с задержкой т1;

(-) — АЧХ ГФ с задержкой т2; (-) — АЧХ ГФ с задержкой т

4

Зависимость улучшения ОСШ от коэффициента обратной связи ГФ g

g 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9

ОСШ , дБ ул' ^ 0,89 1,74 2,84 3,85 5,07 6,35 8,26 10,6 14,6

мы подавался синтетический речеподобный сигнал, состоящий из ряда гармоник с разными амплитудами, и частотой основного тона (ОТ) /от = 355 Гц в смеси с белым шумом. В таблице приведены коэффициенты улучшения, полученные в результате моделирования, для различных значений коэффициентов обратной связи фильтра.

Величина квазистационарныж интервалов в вокализированной речи [4] и время переходный: процессов фильтра [10] не допускают применение коэффициентов обратной связи g больше 0,6. По этой причине среднее улучшение ОСШ при тестировании ГФ на обработке сигнала в аддитивной смеси с белым шумом ограничивается 6 дБ. Как справедливо отмечено в [12], приведенные значения носят условный характер, т. к. «отсутствуют методы и способы объективной оценки эффективности различныж методов шумоочистки». Тем не менее, по мнению автора [12], разброс коэффициентов улучшения при использовании современных цифровых процедур обработки речи может составлять от 4 до 10 дБ, что соответствует приведенным в таблице результатам. следует отметить, что

методы, рассмотренные в данной статье, и методы в рамках технологии Noise Gate не имеют конкурирующего характера, а являются скорее взаимодополняющими.

Цифровая реализация гребенчатого фильтра, используемого в качестве приемника, согласованного с периодическим сигналом, требует решения проблемы дискретности линии задержки, приводящей к отклонению АЧХ сигнала от АЧХ гребенчатого фильтра. В статье предложен метод интерполяции, основанный на использовании дискретных значений отсчетов сигнала, ближайших к заданному значению. Приведен пример цифровой реализации гребенчатого фильтра с интерполяцией по двум отсчетам для задачи шумоподавления вокализированных участков речи.

Рассмотренный в статье метод шумоподавления с использованием периодичности речевого сигнала основан на применении интерполяционного цифрового гребенчатого фильтра. Этот метод является дополняющим к известным методам шумоподавления речевых сигналов в устройствах индивидуальной слухокоррекции.

СПИСОК ЛИТЕРАТУРЫ

1. Рабинер, Р. Цифровая обработка речевых сигналов [Текст] / Р. Рабинер, Р. Шафер; Пер. с англ. —М.: Радио и связь, 1981.

2. Weiss, M. Noise Reduction in Hearing Aids [Text] / M. Weiss, A.C. Newman; Jn Studebaker G.A., Hochberg I. (eds) // Acoustical Factors Affecting Hearing Aid Perfomance. —Boston: Allyn and Baccon, 1993.

3. Ashby, Michael. Introducing Phonetic Science [Text] / Ashby Michael, John Maidment. -Cambridge: CUP, 2005.

4. Королёва, И.В. Введение в аудиологию и слухопротезирование [Текст] / И.В. Королёва. -СПб.: Каро, 2012.

5. White, Paul. Noise-reduction Tools & Techniques [Text] / Paul White // Sound on sound. -2012. - № 1. -P. 138-142.

6. Lawrence, T. Hagen. Portable System For Programming Hearing Aids (P) [Text] / Ha-

gen Lawrence T. // J. Acoust. Soc. Am. —2010. -Vol. 130. -Iss. 4. -P. 2311-2311.

7. King, Brian. Enhancing Single-Channel Speech in Wind Noise Using Coherent Modulation Comb Filtering [Text] / Brian King // MSEE Thesis. -University of Washington, 2008.

8. Рассказов, И.Ю. Особенности регистрации и обработки данных геоакустического контроля массива горных пород на действующем руднике [Текст] / И.Ю. Рассказов, А.Ю. Искра, Г.А. Калинов [и др.] // Горный информационно-аналитический бюллетень. - 2011. - № 7. -C. 212-218.

9. Бакулев, П.А. Радиолокационные системы [Текст] / П.А. Бакулев. -М.: Радиотехника, 2004.

10. Баскаков, С.И. Радиотехнические цепи и сигналы [Текст] / С.И. Баскаков. -М.: Высш. школа, 2000.

11. Березин, И.С. Методы вычислений [Текст] / И.С. Березин, Н.П. Жидков. —М.: Наука, 1966. - Т. 1.

12. Козлачков, С.Б. Методические аспекты оценки защищенности речевой информа-

ции [Текст] / С.Б. Козлачков // Спецтехника и связь. -2011. - № 2. -С. 44-47.

13. Покровский, Н.Б. Расчет и измерение разборчивости речи [Текст] / Н.Б. Покровский. -М.: Связьиздат, 1962.

REFERENCES

1. Rabiner R., Shafer R. Tsifrovaia obrabotka rechevykh signalov; Per. s angl. —Moscow: Radio i sviaz', 1981. (rus)

2. Weiss M., Newman A.C. Noise Reduction in Hearing Aids. Jn Studebaker G.A., Hochberg I. (eds). Acoustical Factors Affecting Hearing Aid Per-fomance. —Boston: Allyn and Baccon, 1993.

3. Michael Ashby, Maidment John. Introducing Phonetic Science. —Cambridge: CUP, 2005.

4. Koroleva I.V. Vvedenie v audiologiiu i sluk-hoprotezirovanie. —St.-Petersburg: Karo, 2012. (rus)

5. White Paul. Noise-reduction Tools & Techniques / Sound on sound. —2012. -№ 1. -P. 138-142.

6. Hagen Lawrence T. Portable System For Programming Hearing Aids (P) J. Acoust. Soc. Am. -2010. -Vol. 130. -Iss. 4. -P. 2311-2311.

7. King Brian. Enhancing Single-Channel Speech in Wind Noise Using Soherent Modula-

tion Comb Filtering / MSEE Thesis. —University of Washington, 2008.

8. Rasskazov I.Iu., Iskra A.Iu., Kalinov G.A.

i dr. Osobennosti registratsii i obrabotki dannykh geoakusticheskogo kontrolia massiva gornykh po-rod na deistvuiushchem rudnike / Gornyi infor-matsionno-analiticheskii biulleten'. — 2011. — № 7. -S. 212-218. (rus)

9. Bakulev P.A. Radiolokatsionnye sistemy. -Moscow: Radiotekhnika, 2004. (rus)

10. Baskakov S.I. Radiotekhnicheskie tsepi i signaly. -Moscow: Vyssh. shkola, 2000. (rus)

11. Berezin I.S., Zhidkov N.P. Metody vy-chislenii. -Moscow: Nauka, 1966. -T. 1. (rus)

12. Kozlachkov S.B. Metodicheskie aspekty otsenki zashchishchennosti rechevoi informatsii/ Spetstekhnika i sviaz'. -2011. -№ 2. -S. 44-47. (rus)

13. Pokrovskii N.B. Raschet i izmerenie raz-borchivosti rechi. -Moscow: Sviaz'izdat, 1962. (rus)

ЧЕСНОКОВ Михаил Александрович — аспирант Санкт-Петербургского государственного университета кино и телевидения.

191119, Россия, Санкт-Петербург, ул. Правды, д. 13. E-mail: [email protected]

СHESNOKOV, Michael A. St. Petersburg State University of Film and Television. 191119, Pravdy Str 13, St.-Petersburg, Russia. E-mail: [email protected]

© Санкт-Петербургский государственный политехнический университет, 2013

i Надоели баннеры? Вы всегда можете отключить рекламу.