Научная статья на тему 'Динамическая фильтрация элементов речевых сигналов и сигналов с непериодическим линейчатым спектром'

Динамическая фильтрация элементов речевых сигналов и сигналов с непериодическим линейчатым спектром Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
88
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
АДАПТИВНАЯ ФИЛЬТРАЦИЯ / МОДЕЛИРОВАНИЕ / РЕЧЬ / СЛУХОВОЙ АППАРАТ / ОСНОВНОЙ ТОН

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Кривошейкин Анатолий Валентинович, Молчанов Александр Павлович, Чесноков Михаил Александрович

Предложена и исследована система адаптивной фильтрации аддитивной смеси шума и речевого сигнала с периодическим и непериодическим спектром.I

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Кривошейкин Анатолий Валентинович, Молчанов Александр Павлович, Чесноков Михаил Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n clause systems of adaptive filtering of additively combining of noise and speech signal both with periodic and with nonperiodic spectrum was presented and investigated.

Текст научной работы на тему «Динамическая фильтрация элементов речевых сигналов и сигналов с непериодическим линейчатым спектром»

Математическое моделирование: методы, алгоритмы, технологии

если жилье первичное. Здесь вероятно влияние степени готовности квартиры для заселения и наличие необходимых для проживания бытовых условий.

Таким образом, в статье рассмотрена поквартальная динамика изменения цен на первичном и вторичном рынках жилой недвижимости Пензенской области за период с 2002 по 2009 г. и дана сравнительная оценка динамики цен на рынке недвижимости в регионах Приволжского ФО.

СПИСОК Л

1. Российский статистический ежегодник 2011: Стат. сб. [Текст] / Росстат. -М., 2011.

2. Статистика: Учебник [Текст] / Под ред. В.С. Мхитаряна. -М.: Экономиста, 2006. -671с.

Построены математические модели зависимости цены за квадратный метр жилья в зависимости от времени, модель с переменной структурой ввода в эксплуатацию жилья в Пензенской области, получены прогнозные оценки на 2012 г. Методом пошагового регрессионного анализа выявлены факторы, оказывающие существенное влияние на стоимость квартир на первичном и вторичном рынках недвижимости. Результаты прогноза могут использоваться для принятия управленческих решений на региональном уровне.

ГЕРАТУРЫ

3. Деркаченко, В.Н. Методы социально-экономического прогнозирования: Учебник [Текст] / В.Н. Деркаченко, А.Ф. Зубков. -Пенза: Изд-во ПГТА, 2008. -С.156-184.

УДК 62-533.4

А.В. Кривошейкин, А.П. Молчанов, М.А. Чесноков

ДИНАМИЧЕСКАЯ ФИЛЬТРАЦИЯ ЭЛЕМЕНТОВ РЕЧЕВЫХ СИГНАЛОВ И СИГНАЛОВ С НЕПЕРИОДИЧЕСКИМ ЛИНЕЙЧАТЫМ СПЕКТРОМ

Постановка задачи

В системах радио- и гидролокации используются сигналы с периодическим спектром. Для оптимального приема таких сигналов применяются гребенчатые фильтры, выделяющие сигнал из аддитивной смеси с шумами [1]. При этом период спектра считается заранее известным и неизменным в процессе приема.

Речевой сигнал характеризуется присутствием в нем основного тона, т. е. сигнала с периодическим спектром, о наличии которого на приемной стороне заранее неизвестно, как неизвестен и его период. Поэтому приемник речевого сигнала должен решать две задачи: поиск сигнала основного тона и при его обнаружении реализацию оптимального приема сигнала.

В [2] предложен алгоритм выделения сигнала основного тона, определения его периода и оптимального приема на основе непрерывно подстраиваемого гребенчатого фильтра в условиях непрерывно изменяющегося периода основного тона. Реализация этого алгоритма при точной

настройке гребенчатого фильтра и при наличии всех гармоник - обертонов основного тона значительно увеличивает отношение сигнал/шум на выходе приемника.

Однако неизбежно существующая погрешность настройки, а также отсутствие некоторых обертонов в реальном сигнале и наличие шумов приводят при реализации алгоритма к подчеркиванию спектральных составляющих, которых нет в обрабатываемом исходном сигнале. Это существенно изменяет тембр голоса при воспроизведении звука и уменьшает его разборчивость.

В статье предложена и исследована система фильтрации аддитивной смеси шума и речевого сигнала с периодическим и непериодическим спектром.

Алгоритм работы системы фильтрации

Как известно из [3], слуховой аппарат здорового человека способен воспринимать речевую информацию при отрицательных уровнях отношения сигнал/шум, например мощность шума превосходит мощность речевого сигнала на

Rt.Tvnn

Рис. 1. Структурная схема системы фильтрации

10-12 дБ. Поэтому рассматривается принцип построения системы фильтрации, основанный на сочетании метода построения гребенчатого фильтра и модели Фланагана [4], описывающей процесс прохождения звукового сигнала в слуховом аппарате человека и использующей понятие формант-ной области частот [5]. В этой области находится некоторое количество гармоник основного тона, производимого голосовыми связками и усиленного вследствие резонанса в полости рта. Таким образом, область звуковых частот может быть разделена на формантные области, в которых достигаются максимумы спектральной характеристики звукового сигнала. На рис. 1 представлена структурная схема системы фильтрации.

Входной сигнал через сумматор поступает на линию задержки (ЛЗ), к отводам которой подключены канальные полосовые фильтры. Число отводов N равно числу формантных областей. Сигналы обратной связи каждого из каналов через ключи и

Щп)

усилители поступают на входы каналов обратной связи сумматора. Длительность задержки на каждом отводе равна половине периода составляющей сигнала, частота которого совпадает с центральной частотой полосового фильтра. Выполнение этого условия, а также отрицательность значений коэффициентов передачи усилителей обеспечивает наличие положительной обратной связи (ОС), лежащее в основе работы гребенчатых фильтров.

Ключи управляются сигналами, вырабатываемыми блоком решающего правила (РП), задачей которого является определение номеров каналов, подлежащих включению в цепь положительной обратной связи, а также определение значений коэффициентов передачи усилителей в выбранных каналах. Из блока ПФ на канальные входы блока РП поступает N сигналов. В каждом из каналов определяется мощность сигнала Щ(п), попавшего в полосу пропускания ПФ канала, где п - номер канала.

0,8 0,6 0,4 0,2

I I I ! I I ! ! 1 А [

и

.... Д........ / п _______J, J________

J |- I г / 1 "i ■ V. 1 -----1

10

20

30

40

50

60

70

80

90

100 П

Рис. 2. Нормированное энергетическое распределение Щ(п) между каналами для гласной «а»

Математическое моделирование: методы, алгоритмы, технологии

Рис. 3. Нормированное распределение п(п) между каналами для гласной «а»

На рис. 2 в качестве примера представлена нормированная функция Ж(п) распределения мощности сигнала по каналам для гласного звука «а», полученная в результате моделирования в среде МА^АВ. В цепь ОС включаются только те каналы, которые соответствуют максимумам дискретной функции Ж(п).

Рассмотрим алгоритм работы блока РП. Предполагая, что функция Ж(п) может быть аппроксимирована функцией Гаусса, воспользуемся тем обстоятельством, что в точке максимума функции Гаусса ее вторая производная имеет минимум. Поэтому для поиска максимума дискретной функции Ж(п) используется дискретная функция п(п), являющаяся второй производной, вычисленной через вторые конечные разности функции Ж(п):

Ж (п+) + Ж(п ) - 2Ж (п)

П(п)=-

2-А2

где п - дискретное значение аргумента, в котором вычисляется функция п(п); А - шаг дискретизации; п , п+ - соответственно предыдущее и последующее значения аргумента, отстоящие от значения аргумента п на один шаг дискретизации.

На рис. 3 представлено нормированное распределение п(п) для звука гласной «а», полученное в результате моделирования в среде МА^АВ.

Поиск аргумента п, доставляющего минимум функции п(п), произведем простым перебором. В окрестности искомого значения п в процессе перебора аргумента п функция п(п) переходит от положительного значения к отрицательному и далее после перехода точки п функция п(п) изменяется от отрицательного значения к положи-

тельному. Таким образом, существуют точки п~ и п+, в которых функция п(п) принимает близкие к нулю значения.

Не все номера каналов, т. е. значения частот, на которых расположены локальные максимумы в спектре звукового сигнала, соответствуют центральным частотам формантных областей. Они могут возникнуть за счет выделения шума голосовым аппаратом, имеющим максимумы на амплитудно-частотной характеристике. Спектральные максимумы, появившиеся в результате присутствия шума в исходном сигнале, будем считать ложными. Для исключения ложных максимумов используется разность между значениями пк+ и п~ и вводится понятие относительной ширины формантной области:

п

Б = -

п+ - п-

Значение параметра Б должно быть сопоставлено с некоторым пороговым значением. Данное пороговое значение было получено экспериментально для фрагмента речи, гласного звука «а». Из ряда опытов была замечена корреляция между положением естественных, не ложных, максимумов распределения Ж(п) и длины частотной полосы, занимаемой отрицательными значениями распределения п(п) в окрестностях ее минимума. Пороговое значение зависит от возможной зашумленности сигнала, поэтому решение о его значении принимается из следующего условия: при определенном входном ОСШ должны быть выявлены алгоритмом первые две формантные области гласного звука «а», без появления ложных, что также определяет диапазон рабочих зна-

Таблица значений ОСШ выходного сигнала

Тип сигнала Естественный речевой Синтезированный

ОСШ вх. сигнала, дБ ОСШ вых. сигнала, дБ ОСШ вых. сигнала, дБ

-24 -21,7 -20,5

-18 -15,5 -13,2

-12 -5,7 -5,4

-6 1,4 1,7

0 7,1 7,5

6 13,6 14,1

чений ОСШ входного сигнала. Если рассчитанное значение D меньше порогового, то блок РП рассматривает максимум в спектре звукового сигнала как ложный, и соответствующий ему канал под номером nk исключается из цепи обратной связи. Алгоритм переходит к оценке следующего максимума. Для тех максимумов, которые удовлетворяют требованиям к формантной области, блок РП замыкает ключи и включает соответствующие каналы в цепь ОС. Предложенный алгоритм заложен в основу математической модели системы фильтрации и реализован в среде MATLAB. Проведено компьютерное моделирование с использованием аудиофайлов формата wave.

Моделирование производилась для двух типов сигналов:

синтезированного входного сигнала в виде суммы двух синусоид с некратными частотами и отстоящих друг от друга не менее чем на 50 Гц;

естественного, представленного вокализированными фрагментами человеческого голоса.

В обоих случаях использовалась модель с частотой дискретизации 32 кГц, в качестве по-

СПИСОКЛ

1. Финкельштейн, М.И. Гребенчатые фильтры [Текст] / М.И. Финкельштейн. -М.: Сов. радио, 1969. -320 с.

2. Бабкина, Л.Н. Способ адаптивной фильтрации речевых сигналов в слуховых аппаратах [Текст] / Л.Н. Бабкина, А.П. Молчанов // Патент RU-2047946 от 10.11.95.

3. Молчанов, А.П. Электрические модели улитки

мехи использовался белый шум. Производилась оценка относительного увеличения отношения сигнал/шум (ОСШ). Результаты моделирования приведены в таблице.

Как видно из таблицы, использование предложенной системы фильтрации при ОСШ на входе системы от -12 дБ и выше приводит к увеличению ОСШ приблизительно на 6 дБ на выходе системы.

Предложенные в статье структура устройства и алгоритм обработки речевого сигнала используются при выделении речевого сигнала из смеси с шумами. Учет особенностей обработки сигнала слуховым аппаратом человека позволяет увеличить отношение сигнал/шум даже в условиях, когда мощность сигнала значительно меньше мощности шума.

Результаты проведенного моделирования могут использоваться при построении вокодеров, в системах глубоководной связи водолазов при работе на грунте, а также при построении слуховых аппаратов.

ГЕРАТУРЫ

органа слуха [Текст] / А.П. Молчанов, Л.Н. Бабкина. -Л.: Наука, 1978. -181 с.

4. Фланаган, Л. Анализ, синтез и восприятие речи [Текст] / Л. Фланаган; пер. с англ. А.А. Пирогова. -М.: Связь,1968. -397 с.

5. Бондарко, Л.В. Основы общей фонетики [Текст] / Л.В. Бондарко, Л.А. Вербицкая, М. Гордина. -4-е изд. -СПб.: Академия, 2004. -160 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.