Научная статья на тему 'Математическое моделирование искажений спектра акустического сигнала при голосовой идентификации личности'

Математическое моделирование искажений спектра акустического сигнала при голосовой идентификации личности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
204
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИДЕНТИФИКАЦИЯ ЛИЧНОСТИ / ИСКАЖЕНИЯ СИГНАЛА / МАТЕМАТИЧЕСКАЯ МОДЕЛЬ / ПРОЕКЦИОННЫЕ МЕТОДЫ / CRYPTOGRAPHIC PROTOCOL / AUTHENTICATION / MODEL CHECKING / LINEAR TEMPORAL LOGIC / AUTOMATIC VERIFICATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Малинин Петр Владимирович, Поляков Виктор Владимирович

Предложена математическая модель искажений голосового сигнала, имитирующая влияние психофизиологических особенностей и факторов, вносимых техническими средствами записи и передачи акустических сигналов. С помощью проекционного метода главных компонент проведены количественные оценки влияния искажений на голосовую идентификацию личности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Малинин Петр Владимирович, Поляков Виктор Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Simulation of Distortion of the Speech Signal for Voice Identification

A mathematical model of the distortion of the voice signal. The analysis of the spectrum of the distorted voice signal. Quantitative assessment of the impact of distortion on the speaker identification.

Текст научной работы на тему «Математическое моделирование искажений спектра акустического сигнала при голосовой идентификации личности»

УДК 681.3.07

П. В. Малинин, В. В. Поляков

Математическое моделирование искажений спектра акустического сигнала при голосовой идентификации личности

P.V. Malinin, V. V. Polyakov

Simulation of Distortion of the Speech Signal for Voice Identification

Предложена математическая модель искажений голосового сигнала, имитирующая влияние психофизиологических особенностей и факторов, вносимых техническими средствами записи и передачи акустических сигналов. С помощью проекционного метода главных компонент проведены количественные оценки влияния искажений на голосовую идентификацию личности.

Ключевые слова: идентификация личности, искажения сигнала, математическая модель, проекционные методы.

A mathematical model of the distortion of the voice signal. The analysis of the spectrum of the distorted voice signal. Quantitative assessment of the impact of distortion on the speaker identification.

Key words: cryptographic protocol, authentication,

model checking, linear temporal logic, automatic verification.

Введение. Одним из методов биометрической идентификации личности является метод, основанный на использовании индивидуальных голосовых данных. Достоверность получаемых при этом результатов в определенной степени зависит от такого фактора, как психофизиологическое состояние человека, вносящее искажения в индивидуальные амплитудно-частотные характеристики голоса. Кроме того, искажения исходных акустических сигналов могут быть вызваны использованием различных технических средств при записи или передаче речи, а также в случае применения технических средств обработки голосовой информации [1]. Указанные обстоятельства требуют оценки надежности методов, применяемых при голосовой идентификации личности. В настоящей работе предлагается подход, позволяющий проводить такую оценку путем математического моделирования искажений в спектральном разложении голосового акустического сигнала.

1. Моделирование искажений спектра голосового сигнала. Для математического моделирования искажения голосовых сигналов был применен алгоритм передискретизации, основанный на использовании дискретного преобразования Фурье и позволявший повышать частоту дискретизации сигнала в задаваемое целое или дробное число раз [2].

Моделирование конкретного искажения осуществлялось следующим образом. Пусть исходный сигнал характеризовался конечным числом отсчетов Хп. На первом шаге алгоритма проводилось вычисление коэффициентов Хк прямого преобразования Фурье:

N-1 -'■2Ж-« , л,

X • е N, - = 0, 1, 2,...,N-1.

n=0

На втором шаге в область возле отсчета с номером N/2 спектра вставлялись нулевые компоненты, количество которых задавалось значениями начального числа отсчетов N и числа отсчетов в передис-кретизованном сигнале M. Коэффициенты Yj пере-дискретизованного спектра в случае четных чисел N определялись формулами

N +1

Т7 Г\ N + 1 і ^ / N +1 ,, Л,

Y = 0, --------------------------+1 < і <-----------------------------+ M - N

Y = X

N+1

i-M+N,

+ M - N +1 < i < M

УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА

в случае нечетных N - формулами

N

Y=X i < i < —

г i- 2

X

Y =-

N+i 2_____

Y' = f i 2

X

Y =-

N+i 2

Y = X

i-M + N,

N

i =---+1

N

2 < i < —+ M - N 2

N

i = _ + M-N +1 2

N + M - N + 2 < i < M

1 m -i

= MM Z Y •

M k=0

_ k -i 2n—m ? M

м = 0, 1, 2, М-1,

K =

- XY2

m*-f

j=i

- X X2

Для апробации подхода в качестве исходных сигналов использовались записи голоса диктора, представлявшие из себя фразу «один два три четыре пять шесть семь восемь девять», с частотой дискретизации 8 кГц и разрядностью 16 бит. Искажения в исходный сигнал вносились по описанному в предыдущем разделе алгоритму и заключались в добавлении узкого участка спектра с отсчетами, имевшими равную нулю амплитуду. В качестве графической иллюстрации на рисунке 1 приведены участки передискретизованных спектров, подвергавшихся искажениям, соответствовавшим коэффициентам К = 0,15; 0,20; 0,25; 0,30.

На заключительном шаге алгоритма вычислялись отсчеты ут обратного дискретного преобразования Фурье с нормировкой:

ш

4 я

5

I-

S

с

с

£

<

-50

-100

-150

-200

-250

I I I I

I I

• « 2 ■ з

♦ -♦4

на этом формирование искаженного сигнала заканчивалось.

В качестве величины, количественно характеризующей искажения, был использован коэффициент нелинейных искажений К, который вводился как отношение среднеквадратичной суммы спектральных компонентов выходного сигнала, отсутствующих в спектре входного сигнала, к среднеквадратичной сумме спектральных компонентов входного сигнала:

Искажения генерировались таким образом, что частота дискретизации ¥,

¥ = м/г

(здесь г - длительность исходного сигнала) увеличивалась за счет изменения количества отчетов от N до М, при этом для каждого искаженного сигнала рассчитывался коэффициент нелинейных искажений К.

2. Влияние искажений голосового сигнала на идентификацию личности. Исходный и искаженные акустические сигналы подвергались процедуре идентификации, описанной в работах [3, 4] и основанной на применении проекционных методов анализа многомерных данных. Полученные при расчетах данные представлялись в виде графиков счетов в пространстве первых главных компонент [5], позволявших наглядно интерпретировать результат идентификации.

3950 3960 3970 3980 3990 4000

Частота, Гц

Рис. 1. Участок акустического спектра голосовых сигналов с искажениями:

1 - исходный сигнал, искаженные сигналы с коэффициентом искажения; 2 - К = 0,15;

3 - К = 0,20; 4 - К = 0,25; 5 - К = 0,30

Рассчитанный для исходного и искаженных сигналов график счетов представлен на рисунке 2. Здесь отдельная точка соответствует одной голосовой записи, исходные сигналы (использовавшиеся в качестве калибровочного набора) изображены незалитыми точками I, искаженные сигналы с разными значениями коэффициента искажения К - залитыми точками II (точка 1 - К = 0,15; 2 - К = 0,20; 3 - К = 0,25; 4 - К = 0,30).

Главная компонента 1

Рис. 2. Влияние искажений голосового сигнала на идентификацию. I - исходные сигналы,

II - искаженные сигналы. Коэффициент искажения:

1 - К = 0,15; 2 - К = 0,20; 3 - К = 0,25; 4 - К = 0,30

m

z=1

Все исходные (неискаженные) сигналы представлены компактной областью, выделенной эллипсом, который строился по максимальному разбросу соответствующих точек согласно [3]. Попадание точек, описывавших искаженные сигналы, в выделенную область означало правильную идентификацию диктора. Случаи, отвечавшие точкам вне выделенной области, означали, что диктор воспринимался как «чужой», т.е. искажения сигнала оказывались настолько значительными, что идентификация не достигалась. Из рисунка 2 видно, что при коэффициентах искажения К = 0,15 и К = 0,20 (точки 1 и 2) диктор, несмотря на искажения сигнала, идентифицировался правильно.

При коэффициентах К = 0,25 и К = 0,30 (точки 3 и

4, расположенные вне эллипса) идентификация уже не достигалась.

Заключение. Предложен подход к оценке надежности голосовой идентификации личности, основанный на математическом моделировании искажений амлитудно-частотных характеристик акустического спектра голосового сигнала. Результаты расчетов показали возможность количественной оценки величины искажений, при которых возможна правильная идентификация личности. Развитый подход может быть применен для анализа надежности методов голосовой идентификации.

Библиографический список

1. Галяшина Е.И. Прикладные основы фоноскопической экспертизы // Теория и практика судебной экспертизы. - СПб., 2003.

2. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов / под ред. М.В. Назарова, Ю.Н. Прохорова. - М., 1981.

3. Малинин П.В., Поляков В.В. Иерархический подход в задаче идентификации личности по голосу с помо-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

щью проекционных методов классификации многомерных данных // Доклады ТУСУР. - 2010. - Ч. 1.

4. Малинин П.В., Поляков В.В. Исследование влияния шума на идентификацию личности по голосу // Проблемы информационной безопасности государства, общества и личности, безопасность нанотехнологий. - Томск, 2012.

5. Эсбенсен К. Анализ многомерных данных. Избранные главы / пер. с англ. С.В. Кучерявского; под ред. О.Е. Родионовой. - Черноголовка, 2005.

i Надоели баннеры? Вы всегда можете отключить рекламу.