Научная статья на тему 'Исследование влияния шума на речевой сигнал'

Исследование влияния шума на речевой сигнал Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
452
93
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВАЯ ОБРАБОТКА СИГНАЛОВ / ТЕОРИЯ АКТИВНОГО ВОСПРИЯТИЯ / ОТНОШЕНИЕ СИГНАЛ / ШУМ / DIGITAL SIGNAL PROCESSING / THEORY OF ACTIVE PERCEPTION / SIGNAL-TO-NOISE RATIO

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гай Василий Евгеньевич

Исследуется возможность использования теории активного восприятия для оценки степени искажения речевого сигнала.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

INVESTIGATION OF NOISE INFLUENCE ON SPEECH SIGNAL

The possibility to use the theory of active perception in evaluating the distortion degree of a speech signal is in-vestigated.

Текст научной работы на тему «Исследование влияния шума на речевой сигнал»

Информационные технологии Вестник Нижегородского университета им. Н.И. Лобачевского, 2011, № 2 (1), с. 197-200

УДК 534.87

ИССЛЕДОВАНИЕ ВЛИЯНИЯ ШУМА НА РЕЧЕВОЙ СИГНАЛ © 2011 г. В.Е. Гай

Нижегородский государственный технический университет им. Р.Е. Алексеева

iamuser@inbox. ru

Поступила в редакцию 07.02.2011

Исследуется возможность использования теории активного восприятия для оценки степени искажения речевого сигнала.

Ключевые слова: цифровая обработка сигналов,

шум.

Введение

Одна из задач обработки речевых сигналов -оценка уровня искажения сигнала. Задача оценки качества сигнала обычно возникает при тестировании алгоритмов кодирования речевого сигнала, исследовании разнообразных передающих систем.

Целью работы является разработка метода оценки качества искажённого сигнала на основе теории активного восприятия [1, 2].

Постановка задачи

Процесс искажения сигнала может быть записан в виде:

g = DEG [ f ], где f - исходный сигнал, g - искажённый сигнал, DEG [ • ] - оператор, вносящий искажение.

К методу оценки качества можно предъявить следующие требования:

1) значение вычисляемого показателя должно изменяться с изменением уровня искажения сигнала;

2) оценка значения показателя должна выполняться за приемлемое время (определяется решаемой задачей).

Одним из используемых методов оценки уровня искажений сигнала является вычисление отношения сигнал / шум (signal-to-noise ration, SNR) [3]:

SNR = lOlog.ofc *2 («)/£>2 („)),

где 5 - исходный сигнал, v - шум, Ns и Nv - количество отсчётов в исходном и шумовом сигналах. Для использования данного отношения должна быть доступна информация о сигнале и шуме.

теория активного восприятия, отношение сигнал /

Предлагаемый алгоритм

1) Построение спектрального представления сигнала с использованием ^-преобразования для одномерных сигналов [1, 2, 4, 5]. Результат применения алгоритма к исходному сигналу -набор из M мгновенных спектров, где M - число сегментов сигнала. Каждый спектр представляет собой набор коэффициентов M = {m1, ..., mN}, N - число фильтров, используемых при формировании спектра. Спектр вычисляется по отрезку сигнала длиной len отсчётов.

Фильтры Уолша системы Хармута [4, 5], используемые при реализации алгоритма, показаны на рис. 1.

2) Поиск похожих цепочек спектров:

2.1) из M выбираются ранее не использованные цепочки спектров Li и Lj (i Ф j) Li = {M i, ..., Mi+C^ }, где Mi - i-й спектр набора M, clen -

длина цепочки спектров;

2.2) если абсолютная величина разности между соответствующими спектрами, входящими в L1 и L2, меньше некоторой пороговой величины (thr), считается, что эти две цепочки похожи, после чего цепочка L2 отмечается как использованная (повторяющаяся) и в дальнейших сравнениях участия не принимает;

2.3) подсчитывается количество повторяющихся (d) и уникальных (неповторяющихся) (nd) цепочек спектров сигнала.

3) Вычисляется показатель, характеризующий искажение сигнала.

Для оценки степени искажения сигнала могут использоваться два величины:

1) отношение числа удалённых спектров к числу спектров в сигнале:

err1 = d / (nd + d), где err1 є [0; 1);

fo

-1

fi

-1

1

1

f2

f3

J__________L

I I

Рис. 1. Фильтры Уолша системы Хармута

1

1

1

1

2) отношение числа удалённых спектров к числу удалённых спектров в том же сигнале, но без шума:

err 2 = d / dwn, где dwn - количество удалённых спектров после обработки сигнала без шума, err2 є [0; 1).

В обоих случаях меньшие значения показателя соответствуют большему уровню искажения сигнала.

При оценке степени искажения предпочтительнее использовать второй показатель, так как он позволяет учитывать особенности исходного сигнала. Недостатком данного способа является то, что исходный (незашумленный) сигнал не всегда доступен. В результатах экспериментов для сравнения приведены результаты вычисления обоих показателей.

Вычислительный эксперимент

При проведении эксперимента используются следующие шумы:

1) аддитивный нормальный шум;

2) аддитивный равномерный шум;

3) аддитивный коррелированный шум;

4) мультипликативный шум.

Тестовые сигналы:

1) записи речи 10 дикторов, амплитуда каждой записи нормализована на отрезке [0; 1]. Если не выполнить указанную нормализацию, шум будет по-разному оказывать влияние на сигнал и сравнивать результаты работы алгоритма для разных сигналов будет нельзя;

2) синус с частотой 50 Гц.

Результаты исследования предложенного метода:

1) Существует минимальная длина сигнала lenf > len, необходимая для выполнения оценки качества сигнала. Если анализируемый сигнал не отвечает указанному условию, то вычисляемое значение показателя вне зависимости от

уровня искажения всегда будет равно 0. Как показывают эксперименты, для речевого сигнала, в среднем, lenf составляет 0.5 с.

2) Допустим, имеются два искажённых сигнала gi и g2, каждый из которых получен на основе сигнала f с помощью оператора DEG [ • ]. Для формирования g1 и g2 использовался один и тот же шум, но с разным среднеквадратическим отклонением (СКО, о1 < о2). Применяя предложенный алгоритм к каждому сигналу, получим оценки степени искажения каждого сигнала errg1 и errg2, причём errg1 > errg2.

3) При тестировании алгоритма использовались различные сочетания значений параметров. В результате экспериментов для практического использования алгоритма предлагаются следующие значения параметров: cien = 1, N = 4, thr = 0.1, len = 32.

Длина обрабатываемого сегмента (len) выбрана равной 32 отсчётам, так как слуховая система оценивает изменения в звуковом импульсе, происходящие на интервале времени меньше

1 мс [6], а при частоте дискретизации 16 кГц

2 мс соответствуют 32 отсчётам.

Длина анализируемого сигнала (clen) может меняться в зависимости от требуемой точности оценки степени искажения.

4) Для всех видов шумов, описанных выше, получено, что значение показателя err1 (err2) уменьшается с увеличением дисперсии шума, искажающего сигнал.

5) Время вычисления показателя зависит от длины сигнала и выбранных значений параметров. При рекомендуемых параметрах для сигнала длиной 50000 отсчётов время оценки составляет 54 секунды.

На рис. 2а показан периодический сигнал (SNR = 15 дБ), искажённый нормальным шумом, на рис. 2б - результат его восстановления с помощью метода, описанного в [7, 8].

СКО шума 0.034 | 0.063 | 0.109 0.199 0.340 | 0.609

Искажённый сигнал

дБ 25 20 15 10 5 0

егг1 0.303 0.090 0.026 0.012 0.001 0

егг2 0.305 0.091 0.027 0.013 0.001 0

Восстановленный сигнал

дБ 26.850 22.348 16.301 12.853 7.811 1.947

егг1 0.419 0.182 0.106 0.054 0.042 0.028

егг2 0.422 0.183 0.107 0.055 0.043 0.029

дБ

Рис. 3. Зависимость значения показателя егг1 от уровня искажения сигнала

Рис. 4. Зависимость значений показателей егг1 и егг2 от уровня искажения сигнала

В табл. 1 приведены результаты вычисления показателей егг1 и егг2 для искажённого и восстановленного периодического сигнала (см. рис. 3). В табл. 2 можно видеть результаты исследования речевого сигнала до и после искажения (см. рис. 4).

На графике (см. рис. 3) по оси ОХ отложено отношение сигнал / шум (в дБ), по оси ОУ -уровень искажений, вычисленный в соответствии с предложенным алгоритмом.

Таким образом, предлагаемый метод в действительности демонстрирует снижение уровня

искажения сигнала после выполнения фильтрации, что согласуется с результатами визуальной оценки (см. табл. 1 и 2).

Значения показателей егг1 и егг2 демонстрируют одинаковое поведение, поэтому при практическом применении данного алгоритма должен использоваться показатель егг 1, так как для его расчёта не требуется наличие информации о незашум-ленном сигнале. Значения показателей уровня искажения сигнала, вычисленные на основе предложенного метода, согласуются со значениями отношения сигнал / шум для тех же сигналов.

Таблица 2

Речевой сигнал, равномерный шум

СКО шума 0.012 0.024 0.040 0.069 0.121 0.222

Искажённый сигнал

дБ 25 20 15 10 5 0

erri 0.345 0.257 0.175 0.079 0.024 0.007

err2 0.952 0.710 0.484 0.219 0.067 0.021

Восстановленный сигнал

дБ 30.321 25.483 18.278 14.495 5.966 1.618

errj 0.361 0.304 0.224 0.119 0.060 0.033

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

err2 0.994 0.837 0.538 0.330 0.166 0.091

Выводы

В данной работе описан алгоритм оценки степени искажения сигнала. Результаты исследования подтверждают возможность его использования для решения поставленной задачи.

Достоинствами предложенного алгоритма являются низкая вычислительная сложность, простота реализации, а также возможность оценки уровень искажений только на основе имеющегося сигнала.

Дальнейшее направление исследований -доработка предложенного метода при решении задачи разборчивости речи.

Список литературы

1. Утробин В.А. Информационные модели системы зрительного восприятия для задач компьютерной

обработки изображений. Н. Новгород: НГТУ, 2001. 234 с.

2. Утробин В.А. Компьютерная обработка изображений. Принятие решений в пространстве эталонов. Н. Новгород: НГТУ, 2004. 221 с.

3. Рабинер Л., Гоулд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1978. 860 с.

4. Хармут Х.Ф. Применение методов теории информации в физике: Пер. с англ. М.: Мир, 1989. 344 с.

5. Хармут Х.Ф. Передача информации ортогональными функциями: Пер. с англ. М.: Связь, 1975. 272 с.

6. Элементы теории биологических анализаторов / Под ред. Н.В. Позина. М.: Наука. Главная редакция физико-математической литературы, 1978. 360 с.

7. Donoho D.L. De-noising by soft-thresholding // IEEE Transactions on Information Theory. 1995. Vol. 41, No. 3. P. 613-627.

8. Donoho D.L., Johnstone I. M. Ideal denoising in an orthonormal basis chosen from a library of bases // C.R.A.S. Paris. 1996. T. 319. Ser. I. P. 1317-1322.

INVESTIGATION OF NOISE INFLUENCE ON SPEECH SIGNAL

V.E. Gai

The possibility to use the theory of active perception in evaluating the distortion degree of a speech signal is investigated.

Keywords: digital signal processing, theory of active perception, signal-to-noise ratio.

i Надоели баннеры? Вы всегда можете отключить рекламу.