Научная статья на тему 'О различиях частотных свойств информационных и неинформационных звуковых сигналов речевого диапазона'

О различиях частотных свойств информационных и неинформационных звуковых сигналов речевого диапазона Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
153
45
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
частотные представления / базис фурье / информационные звуковые сигналы / неинформационные звуковые сигналы
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Белов С. П., Белов А. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «О различиях частотных свойств информационных и неинформационных звуковых сигналов речевого диапазона»

УДК 621.391

О РАЗЛИЧИЯХ ЧАСТОТНЫХ СВОЙСТВ ИНФОРМАЦИОННЫХ И НЕИНФОРМАЦИОННЫХ ЗВУКОВЫХ СИГНАЛОВ РЕЧЕВОГО ДИАПАЗОНА

С.П. Белов 11 А.С. Белов 21

2) Белгородский государственный университет e-mail: Belov_as@bsu.edu.ru

1> Белгородский государственный университет e-mail: Belov@bsu.edu.ru

В статье представлена классификация информационных звуковых сигналов и неинформационных помех с позиции их информативности. Классификация проводится на основе различия в распределении долей энергии рассматриваемых информационных звуковых сигналов и неинформационных помех в выбранных частотных интервалах. При этом используется метод вычисления точных значений долей энергии.

Ключевые слова: частотные представления, базис Фурье, информационные звуковые сигналы, неинформационные звуковые сигналы.

Достаточно часто в различных задачах, связанных с обработкой звуковых сигналов, возникает необходимость различения информационных и неинформационных звуковых сигналов речевого диапазона.

В данной статье рассматривается один из подходов к различению информационных звуковых сигналов от неинформационных с позиции идентификации сигнала человеком, т.е. соотнесение воспринимаемого звука с окружающими объектами. Информационный звуковой сигнал обладает определённой регулярностью (квазипериодичностью), в то время как неинформационный таким свойством не обладает и по своей структуре близок к характеристикам белого шума. Уместно отметить, что в этом случае целесообразно различение таких сигналов производить с позиций частотных представлений.

Анализ речевой информации на основе частотных представлений обладает рядом преимуществ. Во-первых, акустический анализ механизма речеобразования показывает, что распределение нулей и полюсов коэффициента передачи дает достаточно четкое описание звуков речи. Во-вторых, совершенно очевидно, что в начальной стадии процесса восприятия ухо производит некоторый грубый частотный анализ. Таким образом, характерные особенности, которые проявляются в результате анализа на основе частотных представлений, играют важную роль в процессах восприятия и воспроизведения.

Наибольшее распространение получило разложение по базису Фурье, где произвольная непрерывная функция ^) для которой выполняется условие конечности энергии

где фпЮ — система ортогональных непрерывных функций, Сп — коэффициенты ряда.

Для непериодических сигналов конечной длительности ^), какими и являются речевые сигналы, используется форма разложения, при которой дискретность или шаг вычисления спектра стремится по величине к нулю и дискретный ряд Фурье переходит в интеграл Фурье или преобразование Фурье:

t2

{||f (tdt <ад

может быть абсолютно точно представлена в виде бесконечной суммы ряда:

/ о)=со%о)+с о)+с2р2(ї)+...+спрп о)+...,

Это выражение представляет непериодическую функцию ^), как бесконечную сумму экспоненциальных функций ехри) с частотами на интервале (-ж<и<ж) и весами, определяемыми для каждой частоты величиной Х(и).

При реализации процедуры различения информационных звуковых сигналов от неинформационных очень важным является знание особенностей распределения их энергии в частотной области. Для этого используется равенство Парсеваля, которое в математическом виде может быть записано следующим образом:

N 1 “

=£ *2 = х И2 ‘и

2

так что

1 , ,2 Рг (х) = — (| X (и)2 Си

2п иЕУг

представляет собой долю энергии отрезка сигнала (евклидовой нормы вектора), соответствующую г-ому частотному интервалу.

Математические основы

В настоящее время, в задачах частотной обработки для обеспечения высокой скорости получения конечных результатов, широко используются алгоритмы быстрого преобразования Фурье (БПФ). Однако, наряду с преимуществами в скорости вычислений БПФ обладает рядом недостатков по сравнению с дискретным преобразованием Фурье, главный из которых — возможная потеря информации из-за дискретизации области определения трансформанты Фурье [1].

Исходя из этого, в статье классификация информационных звуковых сигналов и неинформационных помех проводится на основе применения метода вычисления точных значений долей энергии в выбранных частотных интервалах, изложенного в [2]. Суть данного метода состоит в следующем.

Пусть компоненты вектора х = (х1з...,xN)т представляют собой значения некоторого звукового сигнала (функции времени), которые соответствуют значениям аргумента /Ж, т.е.

= х(/Д^), / = 1,..., N, (1)

где Д1 - интервал дискретизации по времени.

Положим далее

N

X(и) = £х„е1к—г>и , (2)

к=1

т.е. X (и) представляет собой трансформанту Фурье (амплитудный частотный спектр (АМС)) отрезка отсчетов сигнала (вектора), в качестве области определения которой естественно рассматривать (нормированная частота)

— п < и < п, (3)

так что имеет место обратное преобразование (справедливо представление)

1 п

х, = — | X(и>у(г-1)иСи . (4)

—п

Отсюда нетрудно получить равенство Парсеваля

N 1 —

= У x; = — (| х (и)2- do,

k=\ ——

(5)

так что

\ , ,2 P, (x) = — (I X (и)2 do

2— иє Vr

(б)

представляет собой долю энергии отрезка сигнала (евклидовой нормы вектора), соответствующую частотному интервалу

V = [— и,—и )и и ,и).

(7)

Подстановка определения (2) в интеграл (6) позволяет получить выражение

вида:

Pr (x) = xTArx,

(8)

где Ar = {ak }

sin [o2 (i — k)]— sin [o\(i — k)] .

—(i — k)

rr o 2 — °1

к

i = k

(9)

Таким образом, данный метод позволяет осуществить точное вычисление долей энергии анализируемых сигналов в частотной области. Следовательно, его применение обеспечит максимальную достоверность различения информационных и неинформационных звуковых сигналов речевого диапазона на основе учета различия в распределении их энергии в выбранных частотных интервалах.

2

Результаты вычислительных экспериментов

Экспериментальные исследования проводятся с целью выявления закономерностей сосредоточенности энергий в частотных интервалах в звуках речи и стандартных шумовых обстановках.

В качестве меры сосредоточенности энергии предлагается использовать отношение

r*a

У P

/ J sort k

S = ^-------> К, r = 1,...., R;

УРг

1

Здесь: R — общее количество частотных интервалов;

Рг — значение доли энергии сосредоточенной в r -том частотном интервале;

Рson к — сумма долей энергии в (10*а)% частотных интервалов имеющее максимальное значение (значения энергии в частотных интервалах заранее отсортировываются по убыванию);

ha — порог, удовлетворяющий условию

В качестве эмпирических данных были использованы отрезки звуковых файлов записанных на диктофон в стандартных обстановках (в аудитории на лекции, в лифте, на улице) с параметрами: частота дискретизации 8000 и 16000 Гц, количество разрядов квантования 16.

Длина анализируемого отрезка выбрана равной N=256, 512.

Область определения трансформант Фурье дискретных сигналов [0,^] разбивается на R одинаковых частотных интервалов, таких что v2r — v1r = Av = const, причем такие R, что М является целым числом (N=MR).

В ходе экспериментов для всех значений N используется различное разбиение оси частот на R частотных интервалов, а именно:

При N=256 R=16, 32, 64.

При N=512 R=16, 32, 64.

Длина анализируемых сигналов варьирует от 2000 до 3000 отсчетов. В таблицах 1-4 приведены основные результаты экспериментальных исследований: какая доля энергии анализируемого отрезка сигнала (в процентах) сконцентрирована в каком количестве частотных интервалов (в долях) для различных отрезков букв, с числом отсчетов N, указанных в заголовках таблиц.

Таблица1

Концентрация энергии в доле частотных интервалов в звуках речи и стандартных шумовых обстановках при частоте дискретизации 16000 Гц, с N=256, R=16

256_16

90% 95% 99%

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

а 0,19 0,13 0,13 0,13 0,13 0,13 0,13 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,25 0,31 0,31 0,31 0,38

б 0,06 0,06 0,06 0,13 0,13 0,13 0,06 0,13 0,13 0,13 0,13 0,13 0,13 0,06 0,25 0,19 0,19 0,13 0,13 0,13 0,13

в 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,13 0,06 0,06 0,06 0,06 0,13 0,19 0,25 0,19 0,13 0,19 0,06

г 0,06 0,06 0,06 0,06 0,13 0,13 0,13 0,06 0,06 0,06 0,06 0,19 0,13 0,13 0,13 0,13 0,06 0,06 0,25 0,19 0,25

д 0,06 0,06 0,06 0,06 0,06 0,06 0,13 0,06 0,06 0,06 0,06 0,06 0,06 0,13 0,13 0,13 0,06 0,13 0,13 0,13 0,13

е 0,06 0,06 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,19 0,19 0,13 0,13 0,13 0,19 0,25 0,38 0,31 0,25 0,25 0,13

ё 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,19 0,13 0,13 0,13 0,25 0,13 0,19 0,25 0,25 0,19 0,13

ж 0,06 0,19 0,19 0,19 0,19 0,19 0,19 0,13 0,31 0,25 0,25 0,31 0,25 0,31 0,44 0,44 0,44 0,44 0,50 0,50 0,50

з 0,06 0,13 0,06 0,06 0,13 0,13 0,13 0,13 0,19 0,06 0,13 0,13 0,19 0,19 0,31 0,44 0,19 0,19 0,19 0,25 0,25

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,13 0,13 0,13 0,13 0,13 0,13 0,31 0,31 0,31 0,25 0,31 0,31 0,38

й 0,06 0,06 0,06 0,06 0,06 0,06 0,13 0,06 0,06 0,06 0,06 0,13 0,13 0,13 0,13 0,06 0,19 0,06 0,38 0,38 0,31

к 0,06 0,06 0,13 0,06 0,13 0,13 0,13 0,19 0,13 0,19 0,19 0,19 0,19 0,19 0,44 0,31 0,25 0,31 0,31 0,31 0,31

л 0,06 0,06 0,13 0,06 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,19 0,19 0,19 0,19 0,19 0,19 0,19

м 0,06 0,06 0,06 0,06 0,06 0,13 0,13 0,06 0,06 0,06 0,06 0,06 0,13 0,13 0,13 0,13 0,19 0,13 0,13 0,13 0,13

н 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,13 0,13 0,13 0,19 0,19 0,19 0,19 0,25 0,31 0,31

о 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13

п 0,13 0,06 0,13 0,06 0,06 0,06 0,06 0,19 0,13 0,19 0,13 0,13 0,13 0,13 0,31 0,31 0,50 0,38 0,38 0,38 0,38

р 0,13 0,19 0,13 0,13 0,19 0,19 0,19 0,19 0,19 0,19 0,19 0,25 0,25 0,25 0,25 0,31 0,31 0,38 0,38 0,31 0,31

с 0,13 0,13 0,13 0,13 0,06 0,13 0,13 0,19 0,19 0,19 0,25 0,13 0,25 0,31 0,44 0,44 0,38 0,44 0,38 0,44 0,44

т 0,13 0,25 0,25 0,06 0,13 0,13 0,19 0,25 0,31 0,31 0,06 0,13 0,13 0,19 0,44 0,50 0,44 0,25 0,31 0,31 0,38

у 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13

ф 0,19 0,19 0,13 0,13 0,13 0,13 0,13 0,31 0,25 0,19 0,19 0,19 0,19 0,19 0,44 0,38 0,19 0,31 0,31 0,31 0,31

х 0,13 0,19 0,19 0,13 0,06 0,13 0,13 0,19 0,25 0,19 0,13 0,06 0,13 0,13 0,25 0,31 0,31 0,31 0,13 0,13 0,13

продолжение _ табл. 1

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

ц 0,06 0,06 0,13 0,13 0,19 0,25 0,25 0,13 0,19 0,19 0,25 0,25 0,31 0,31 0,06 0,06 0,13 0,13 0,19 0,25 0,25

ч 0,25 0,31 0,31 0,31 0,31 0,31 0,31 0,38 0,38 0,38 0,38 0,38 0,38 0,38 0,25 0,31 0,31 0,31 0,31 0,31 0,31

ш 0,06 0,38 0,38 0,38 0,38 0,38 0,38 0,13 0,44 0,44 0,44 0,44 0,44 0,44 0,06 0,38 0,38 0,38 0,38 0,38 0,38

щ 0,25 0,25 0,25 0,25 0,25 0,25 0,25 0,31 0,31 0,25 0,31 0,25 0,31 0,31 0,25 0,25 0,25 0,25 0,25 0,25 0,25

ы 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13

э 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,19 0,19 0,19 0,13 0,19 0,19 0,19 0,13 0,13 0,13 0,13 0,13 0,13 0,13

ю 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,13 0,13 0,13 0,06 0,06 0,13 0,06 0,06 0,06 0,06 0,06 0,06 0,06

я 0,06 0,06 0,06 0,13 0,13 0,13 0,13 0,06 0,06 0,13 0,13 0,19 0,19 0,19 0,06 0,06 0,06 0,13 0,13 0,13 0,13

п1 0,38 0,38 0,31 0,31 0,31 0,31 0,31 0,44 0,44 0,44 0,44 0,38 0,38 0,38 0,38 0,38 0,31 0,31 0,31 0,31 0,31

п2 0,13 0,06 0,25 0,06 0,44 0,44 0,44 0,25 0,19 0,31 0,19 0,44 0,69 0,75 0,13 0,06 0,25 0,06 0,44 0,44 0,44

пз 0,31 0,31 0,31 0,38 0,38 0,38 0,38 0,38 0,38 0,38 0,38 0,38 0,44 0,44 0,31 0,31 0,31 0,38 0,38 0,38 0,38

п1, п2, пз - участки сигнала принадлежащего к паузе

Таблица 2

Концентрация энергии в доле частотных интервалов в звуках речи и стандартных шумовых обстановках при частоте дискретизации 16000 Гц, с N=256, К=32

256_32

90% 95% 99%

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

а 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,13 0,16 0,16 0,16 0,16 0,16 0,16 0,16 0,19 0,22 0,28 0,28 0,28 0,28

б 0,06 0,06 0,06 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,22 0,19 0,19 0,13 0,13 0,13 0,13

в 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,09 0,06 0,06 0,06 0,06 0,09 0,13 0,19 0,16 0,13 0,16 0,16

г 0,06 0,06 0,06 0,06 0,09 0,06 0,09 0,06 0,06 0,06 0,06 0,16 0,09 0,13 0,09 0,09 0,06 0,06 0,25 0,19 0,22

д 0,06 0,03 0,03 0,03 0,03 0,03 0,03 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,09 0,09 0,06 0,09 0,09 0,09 0,09

е 0,06 0,06 0,13 0,13 0,13 0,13 0,13 0,06 0,09 0,16 0,16 0,13 0,13 0,13 0,16 0,22 0,34 0,31 0,22 0,22 0,22

ё 0,09 0,09 0,09 0,13 0,13 0,09 0,09 0,09 0,09 0,09 0,16 0,13 0,13 0,13 0,22 0,13 0,16 0,22 0,22 0,16 0,09

ж 0,06 0,19 0,16 0,16 0,16 0,16 0,16 0,13 0,25 0,22 0,19 0,25 0,25 0,25 0,34 0,44 0,41 0,38 0,44 0,34 0,34

з 0,06 0,09 0,06 0,06 0,09 0,09 0,09 0,09 0,16 0,06 0,09 0,09 0,13 0,13 0,28 0,41 0,19 0,16 0,16 0,22 0,44

и 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,09 0,09 0,09 0,09 0,09 0,09 0,28 0,28 0,25 0,25 0,25 0,28 0,44

й 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,09 0,09 0,09 0,13 0,06 0,16 0,06 0,38 0,38 0,31

к 0,06 0,06 0,09 0,06 0,06 0,06 0,06 0,13 0,09 0,13 0,13 0,13 0,13 0,13 0,41 0,28 0,22 0,31 0,44 0,44 0,44

л 0,06 0,06 0,09 0,06 0,09 0,09 0,09 0,06 0,09 0,13 0,09 0,13 0,13 0,13 0,16 0,13 0,16 0,16 0,16 0,34 0,44

м 0,03 0,06 0,06 0,06 0,06 0,09 0,09 0,06 0,06 0,06 0,06 0,06 0,09 0,09 0,13 0,09 0,16 0,13 0,13 0,13 0,13

н 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,09 0,09 0,09 0,16 0,16 0,16 0,16 0,25 0,28 0,44

о 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,13 0,13 0,09 0,09 0,09 0,09 0,09 0,13 0,13 0,13 0,13 0,13 0,38 0,38

п 0,09 0,06 0,09 0,06 0,06 0,06 0,06 0,16 0,09 0,19 0,09 0,09 0,09 0,09 0,31 0,31 0,44 0,34 0,34 0,38 0,38

р 0,13 0,16 0,13 0,13 0,16 0,16 0,16 0,13 0,19 0,16 0,19 0,22 0,22 0,22 0,22 0,31 0,28 0,31 0,34 0,41 0,38

с 0,09 0,06 0,09 0,09 0,03 0,13 0,13 0,19 0,16 0,13 0,19 0,13 0,22 0,22 0,44 0,38 0,38 0,41 0,34 0,41 0,38

т 0,09 0,19 0,19 0,06 0,06 0,06 0,06 0,22 0,28 0,28 0,06 0,06 0,06 0,06 0,41 0,44 0,41 0,19 0,19 0,22 0,22

у 0,09 0,09 0,06 0,09 0,06 0,06 0,06 0,09 0,09 0,09 0,09 0,09 0,09 0,09 1,03 0,09 0,09 0,13 0,09 0,09 0,13

ф 0,19 0,13 0,09 0,09 0,09 0,09 0,09 0,25 0,22 0,16 0,16 0,16 0,16 0,16 0,41 0,34 0,19 0,28 0,25 0,28 0,28

х 0,13 0,16 0,16 0,13 0,06 0,06 0,06 0,16 0,22 0,19 0,13 0,06 0,06 0,06 0,22 0,31 0,28 0,25 0,13 0,13 0,13

ц 0,03 0,06 0,06 0,13 0,16 0,16 0,16 0,13 0,16 0,19 0,25 0,22 0,22 0,22 0,38 0,38 0,38 0,41 0,41 0,41 0,44

ч 0,25 0,25 0,28 0,25 0,25 0,25 0,25 0,34 0,34 0,31 0,31 0,34 0,34 0,34 0,47 0,47 0,47 0,44 0,44 0,44 0,50

ш 0,06 0,31 0,34 0,34 0,34 0,38 0,34 0,09 0,38 0,41 0,44 0,44 0,44 0,47 0,22 0,47 0,50 0,56 0,56 0,53 0,53

продолжение табл. 2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

щ 0,16 0,16 0,19 0,19 0,16 0,16 0,16 0,25 0,25 0,25 0,25 0,22 0,25 0,22 0,44 0,41 0,44 0,41 0,38 0,44 0,41

ы 0,09 0,09 0,09 0,06 0,06 0,06 0,06 0,09 0,09 0,09 0,09 0,09 0,09 0,09 0,19 0,22 0,31 0,16 0,16 0,16 0,16

э 0,13 0,09 0,09 0,09 0,09 0,09 0,09 0,19 0,16 0,13 0,13 0,13 0,13 0,13 0,25 0,25 0,25 0,25 0,25 0,28 0,28

ю 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,06 0,09 0,09 0,09 0,06 0,06 0,06 0,09 0,22 0,22 0,19 0,13 0,13 0,16

я 0,06 0,06 0,06 0,09 0,09 0,13 0,13 0,06 0,06 0,09 0,09 0,19 0,16 0,19 0,13 0,06 0,22 0,22 0,31 0,31 0,34

п1 0,34 0,31 0,31 0,31 0,31 0,28 0,25 0,41 0,38 0,38 0,38 0,38 0,34 0,34 0,47 0,47 0,50 0,47 0,44 0,41 0,44

п2 0,09 0,03 0,22 0,03 0,34 0,38 0,38 0,22 0,16 0,31 0,16 0,41 0,41 0,41 0,38 0,34 0,47 0,34 0,47 0,47 0,47

пз 0,31 0,28 0,28 0,28 0,31 0,31 0,34 0,34 0,31 0,34 0,34 0,34 0,38 0,38 0,41 0,41 0,38 0,41 0,41 0,41 0,41

п1, п2, пз - участки сигнала принадлежащего к паузе

Таблица 3

Концентрация энергии в доле частотных интервалов в звуках речи и стандартных шумовых обстановках при частоте дискретизации 16000 Гц, с N=256, 6=64

256 64

90% 95% 99%

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

а 0,09 0,09 0,09 0,09 0,08 0,08 0,09 0,11 0,11 0,13 0,13 0,11 0,13 0,13 0,14 0,14 0,22 0,28 0,28 0,25 0,27

б 0,06 0,05 0,06 0,08 0,06 0,08 0,08 0,09 0,08 0,08 0,08 0,08 0,08 0,09 0,20 0,19 0,17 0,11 0,11 0,14 0,17

в 0,05 0,05 0,05 0,05 0,05 0,06 0,05 0,06 0,06 0,08 0,06 0,06 0,06 0,06 0,09 0,11 0,19 0,13 0,11 0,16 0,14

г 0,03 0,03 0,03 0,03 0,09 0,05 0,06 0,05 0,05 0,05 0,05 0,14 0,09 0,09 0,08 0,08 0,06 0,06 0,22 0,19 0,19

д 0,05 0,03 0,03 0,03 0,03 0,05 0,05 0,05 0,05 0,05 0,05 0,05 0,05 0,06 0,06 0,08 0,05 0,08 0,08 0,08 0,06

е 0,05 0,06 0,09 0,09 0,08 0,08 0,08 0,06 0,09 0,14 0,13 0,11 0,11 0,13 0,13 0,20 0,31 0,30 0,20 0,20 0,20

ё 0,06 0,06 0,06 0,09 0,08 0,08 0,08 0,08 0,06 0,09 0,13 0,11 0,09 0,09 0,20 0,13 0,16 0,22 0,20 0,16 0,17

ж 0,06 0,16 0,13 0,13 0,16 0,16 0,13 0,11 0,23 0,20 0,19 0,25 0,23 0,22 0,33 0,39 0,38 0,34 0,41 0,38 0,36

з 0,06 0,08 0,05 0,06 0,08 0,09 0,09 0,08 0,14 0,06 0,08 0,08 0,11 0,08 0,27 0,41 0,19 0,14 0,14 0,22 0,22

и 0,05 0,05 0,05 0,05 0,06 0,05 0,05 0,06 0,08 0,08 0,08 0,08 0,08 0,08 0,27 0,27 0,20 0,23 0,23 0,27 0,25

й 0,05 0,05 0,05 0,05 0,06 0,06 0,06 0,05 0,05 0,06 0,05 0,08 0,09 0,08 0,13 0,06 0,16 0,06 0,36 0,36 0,27

к 0,06 0,05 0,08 0,06 0,08 0,06 0,06 0,13 0,08 0,11 0,13 0,16 0,14 0,08 0,39 0,27 0,19 0,30 0,27 0,27 0,22

л 0,06 0,05 0,06 0,05 0,06 0,06 0,06 0,06 0,08 0,09 0,08 0,08 0,08 0,08 0,14 0,13 0,16 0,14 0,14 0,14 0,16

м 0,03 0,03 0,03 0,03 0,05 0,06 0,06 0,05 0,05 0,06 0,06 0,06 0,08 0,08 0,09 0,09 0,16 0,13 0,11 0,11 0,11

н 0,03 0,03 0,03 0,05 0,06 0,06 0,06 0,06 0,06 0,05 0,06 0,08 0,08 0,08 0,13 0,14 0,13 0,14 0,22 0,28 0,27

о 0,08 0,08 0,06 0,06 0,06 0,06 0,06 0,09 0,09 0,08 0,08 0,06 0,08 0,06 0,13 0,13 0,11 0,09 0,11 0,13 0,13

п 0,08 0,06 0,09 0,06 0,06 0,06 0,08 0,14 0,08 0,17 0,08 0,08 0,08 0,06 0,31 0,30 0,42 0,31 0,33 0,36 0,34

р 0,09 0,13 0,09 0,11 0,14 0,14 0,13 0,13 0,17 0,14 0,16 0,20 0,19 0,17 0,22 0,28 0,25 0,28 0,33 0,31 0,30

с 0,08 0,06 0,08 0,09 0,03 0,09 0,08 0,17 0,14 0,13 0,19 0,11 0,19 0,17 0,41 0,36 0,36 0,39 0,30 0,38 0,34

т 0,09 0,17 0,17 0,05 0,06 0,06 0,05 0,19 0,27 0,27 0,06 0,06 0,08 0,09 0,38 0,44 0,39 0,19 0,22 0,20 0,20

у 0,06 0,06 0,06 0,06 0,06 0,06 0,05 0,08 0,08 0,08 0,08 0,08 0,08 0,06 0,09 0,09 0,09 0,11 0,09 0,09 0,09

ф 0,17 0,13 0,09 0,09 0,11 0,13 0,11 0,23 0,19 0,13 0,14 0,13 0,14 0,14 0,38 0,34 0,19 0,28 0,34 0,36 0,38

х 0,13 0,16 0,13 0,09 0,03 0,09 0,11 0,14 0,20 0,17 0,11 0,05 0,06 0,13 0,22 0,28 0,28 0,23 0,13 0,11 0,17

ц 0,03 0,05 0,06 0,11 0,13 0,09 0,11 0,09 0,14 0,16 0,19 0,20 0,20 0,19 0,33 0,36 0,38 0,39 0,39 0,39 0,41

ч 0,23 0,22 0,22 0,20 0,20 0,23 0,23 0,31 0,31 0,28 0,30 0,28 0,30 0,31 0,47 0,45 0,44 0,42 0,45 0,44 0,41

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ш 0,05 0,28 0,31 0,34 0,36 0,42 0,41 0,08 0,36 0,38 0,41 0,39 0,39 0,38 0,20 0,47 0,48 0,56 0,55 0,55 0,53

щ 0,16 0,14 0,14 0,16 0,14 0,16 0,14 0,22 0,22 0,20 0,22 0,17 0,23 0,20 0,39 0,36 0,39 0,38 0,34 0,41 0,42

ы 0,06 0,06 0,06 0,05 0,05 0,06 0,06 0,08 0,08 0,09 0,08 0,08 0,08 0,08 0,16 0,20 0,30 0,14 0,25 0,27 0,30

э 0,09 0,06 0,08 0,08 0,08 0,08 0,09 0,16 0,13 0,13 0,13 0,13 0,13 0,14 0,23 0,22 0,22 0,22 0,22 0,22 0,20

ю 0,05 0,06 0,06 0,05 0,06 0,06 0,08 0,06 0,08 0,08 0,08 0,06 0,06 0,08 0,08 0,20 0,22 0,17 0,11 0,17 0,23

продолжение^ табл.3

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

я 0,05 0,06 0,06 0,06 0,09 0,09 0,09 0,06 0,06 0,08 0,08 0,14 0,13 0,13 0,13 0,06 0,20 0,19 0,30 0,28 0,27

п1 0,31 0,28 0,30 0,28 0,27 0,25 0,25 0,38 0,34 0,36 0,36 0,34 0,31 0,33 0,45 0,45 0,47 0,45 0,42 0,39 0,42

п2 0,08 0,03 0,19 0,03 0,31 0,34 0,42 0,17 0,11 0,28 0,13 0,38 0,39 0,44 0,34 0,30 0,44 0,33 0,45 0,48 0,47

пз 0,27 0,25 0,28 0,27 0,28 0,28 0,28 0,33 0,30 0,31 0,31 0,33 0,31 0,34 0,39 0,38 0,38 0,38 0,38 0,39 0,42

п1, п2, пз - участки сигнала принадлежащего к паузе

Таблица 4

Концентрация энергии в доле частотных интервалов в звуках речи и стандартных шумовых обстановках при частоте дискретизации 8000 Гц, с N=512, R=16, 32, 64

512 16 2 3 1 2 51 512_64

90% 95% 99% 90% 95% 99% 90% 95% 99%

а 0,25 0,31 0,38 0,19 0,22 0,31 0,11 0,16 0,25

б 0,13 0,13 0,25 0,09 0,13 0,22 0,06 0,09 0,20

в 0,13 0,13 0,25 0,06 0,09 0,22 0,05 0,06 0,17

г 0,06 0,13 0,13 0,03 0,06 0,13 0,02 0,06 0,11

д 0,06 0,13 0,13 0,06 0,09 0,13 0,05 0,08 0,11

е 0,19 0,25 0,50 0,16 0,19 0,44 0,11 0,16 0,41

ё 0,19 0,19 0,31 0,09 0,16 0,28 0,05 0,11 0,23

ж 0,25 0,38 0,75 0,19 0,31 0,66 0,16 0,30 0,63

з 0,13 0,13 0,31 0,09 0,13 0,28 0,08 0,11 0,27

и 0,13 0,13 0,25 0,06 0,09 0,22 0,03 0,08 0,20

й 0,13 0,13 0,13 0,09 0,09 0,13 0,06 0,08 0,11

к 0,13 0,13 0,31 0,09 0,13 0,28 0,08 0,11 0,25

л 0,13 0,13 0,25 0,09 0,13 0,22 0,06 0,09 0,19

м 0,06 0,06 0,19 0,03 0,06 0,16 0,02 0,05 0,13

н 0,06 0,13 0,19 0,03 0,09 0,19 0,02 0,06 0,16

о 0,19 0,19 0,25 0,13 0,16 0,19 0,06 0,08 0,16

п 0,13 0,19 0,50 0,13 0,19 0,50 0,13 0,17 0,48

р 0,25 0,31 0,50 0,19 0,28 0,47 0,16 0,25 0,44

с 0,13 0,25 0,69 0,09 0,22 0,69 0,08 0,22 0,64

т 0,13 0,19 0,69 0,09 0,19 0,66 0,09 0,19 0,63

у 0,13 0,19 0,19 0,13 0,16 0,19 0,08 0,11 0,16

ф 0,19 0,25 0,50 0,16 0,22 0,44 0,16 0,20 0,44

х 0,25 0,31 0,50 0,25 0,31 0,47 0,23 0,30 0,45

ц 0,13 0,38 0,75 0,09 0,31 0,75 0,09 0,27 0,70

ч 0,50 0,63 0,88 0,47 0,59 0,84 0,44 0,58 0,81

ш 0,50 0,63 0,88 0,41 0,56 0,81 0,36 0,50 0,80

щ 0,31 0,50 0,81 0,31 0,44 0,75 0,25 0,39 0,72

ы 0,19 0,19 0,25 0,13 0,16 0,22 0,06 0,08 0,20

э 0,19 0,31 0,50 0,09 0,19 0,41 0,06 0,13 0,31

ю 0,13 0,13 0,31 0,13 0,13 0,31 0,09 0,13 0,28

я 0,13 0,19 0,38 0,13 0,16 0,34 0,11 0,13 0,30

п1 0,69 0,81 0,94 0,63 0,75 0,94 0,58 0,72 0,89

п2 0,13 0,38 0,75 0,09 0,34 0,72 0,09 0,31 0,69

пз 0,63 0,69 0,81 0,56 0,66 0,75 0,53 0,61 0,73

п1, п2, пз - участки сигнала принадлежащего к паузе

Как видно из результатов экспериментальных исследований энергия речевых сигналов сосредоточена в малом количестве частотных интервалов, тогда как энергия шумов довольно равномерно распределена по всей оси частот. Следовательно, применение алгоритмов, разработанных на базе нового метода вычисления точных долей энергии, позволяет обеспечить максимальную достоверность различения информационных и неинформационных звуковых сигналов речевого диапазона на основе учета различия в распределении долей их энергии в выбранных частотных интервалах.

Литература

1. Жиляков, Е.Г. Вариационные методы анализа и построения функций по эмпирическим данным: моногр./ Е.Г. Жиляков. — Белгород: Изд-во БелГУ, 2007.-160 с.

2. Жиляков, Е.Г. Вариационные методы частотного анализа звуковых сигналов [Текст] / Е.Г. Жиляков, С.П.Белов, Е.И. Прохоренко / / Труды учебных заведений связи. — СПб, 2006. вып. 174. — с. 163-172

3. Жиляков, Е.Г. Уменьшение объема битового представления речевых данных на основе нового метода удаления пауз [Текст] / Е.Г. Жиляков, С.П.Белов, Е.И. Прохоренко // Вопросы радиоэлектроники. Серия «Электронная вычислительная техника (ЭВТ)». — М., 2007. — вып. 2. — с. 82-92

3. Белов С. П., Белов А. С., Жиляков Е.Г., Прохоренко Е.И. Способ обнаружения пауз в речевых сигналах и устройство его реализующее. Патент России № 2317595 от 20 февраля 2008 года 69

4. Михайлов, В.Г. Измерение параметров речи [Текст] / В.Г.Михайлов, Л.В.Златоустова; под ред. М.А. Сапожкова. — М.: Радио и связь, 1987. — 168 с.: ил.

5. Калинцев, Ю.К. Разборчивость речи в цифровых вокодерах. / Ю.К. Калинцев. — М.: Радио и связь, 1991. — 220 с.: ил.

6. Гельфанд, С.А. Слух: Введение в психологическую и физиологическую акустику [Текст] / С.А. Гельфанд. — М.: Медицина, 1984. — 350 с.

ABOUT DISTINCTIONS OF FREQUENCY PROPERTIES OF INFORMATIVE AND UNINFORMATIVE VOICE SIGNALS OF VOCAL RANGE

In the article classification of informative voice signals and uninformative hindrances is presented from position of their informing. Classification is conducted on the basis of distinction in distributing refill energies of the examined informative voice signals and uninformative hindrances in the chosen frequency intervals. The method of calculation of the exact meanings is thus utillized refill energies.

Keywords: frequency presentations, base of Fur'e, informative voice signals, uninformative hindrances.

S.P. Belov 1)

A.S. Belov 2)

1) Belgorod state university e-mail: Belov@bsu.edu.ru

2) Belgorod state university e-mail: Belov_as@bsu.edu.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.