Научная статья на тему 'Модель управляемых линейных скрытых процессов авторегрессии'

Модель управляемых линейных скрытых процессов авторегрессии Текст научной статьи по специальности «Математика»

CC BY
40
10
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Леднов Д. А.

Сделано предположение, что существует скрытая от непосредственного наблюдения функция управления речевым трактом. Цель управления поддержание инвариантных отношений между спектральными параметрами произносимого звука. Способ управления является уникальной характеристикой диктора. Построена математическая модель, позволяющая находить такую функцию управления. В основу модели положены процессы авторегрессии первого порядка.I

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

n the preset paper a control vocal tract function, hidden from direct observation is assumed to exist. The goal of control is to form invariant ratio between spectral components of speech signal. A method of control is a unique characteristic of human being's voice. A mathematic model allowing to find the control function is created. The mathematic model based on approach first order for autoregression random processes.

Текст научной работы на тему «Модель управляемых линейных скрытых процессов авторегрессии»

Литература

1. Кузнецов В.М., Труфанов Н.В. // ФТПРПИ. 1984. № 1. С. 16-20.

2. Адушкин В.В., Зыков В.Я., Либин В.Я. // ФТПРПИ. 1988. № 4. С. 35-39.

3. Камалян Р.З. // ФТПРПИ. 1990. № 4. С. 84-89.

4. Адушкин В.В., Камалян Р.З. // ФГВ. 1992. № 4. С. 127-129.

5. Кузнецов В.М. Математические модели взрывного дела. Новосибирск, 1977.

6. Кузнецов В.М. // ФТПРПИ. 1974. № 3. С. 44-47.

7. Кузнецов В.М. // Некоторые проблемы математики и механики. Л., 1970. С. 171-181.

Кубанский государственный университет 16 мая 2005 г.

УДК 621.391

МОДЕЛЬ УПРАВЛЯЕМЫХ ЛИНЕЙНЫХ СКРЫТЫХ ПРОЦЕССОВ

АВТОРЕГРЕССИИ

© 2006 г. Д.А. Леднов

In the preset paper a control vocal tract function, hidden from direct observation is assumed to exist. The goal of control is to form invariant ratio between spectral components of speech signal. A method of control is a unique characteristic of human being's voice.

A mathematic model allowing to find the control function is created. The mathematic model based on approach first order for autoregression random processes.

Введение

Рассмотрим некоторые представления о механизмах речеобразования и речевосприятия. Представим общую схему взаимодействия механизмов генерации, восприятия и обработки речи человеком, которая показана на рисунке.

Блок-схема взаимодействия механизмов генерации, восприятия и обработки речи

В процессе восприятия речи участвуют слуховой анализатор и нервная система, где происходят преобразования акустического сигнала, в конеч-

ном итоге обеспечивающие понимание смысла речевого сообщения. Процесс организован по принципу иерархии [1]: выделение слухом спектральных и временных особенностей сигнала, являющихся различительными признаками звуков речи; фонетический анализ, обеспечивающий преобразование потока признаков сигнала в последовательность дискретных элементов сообщения (фонем или слогов); анализ синтаксиса и семантики сообщения.

В процессе генерации речи слуховой анализатор создает шаблон фразы, необходимой для произнесения, которая с помощью моторного центра речи (центра Брока) преобразуется в последовательность движений артикуляционных органов. Динамика движений артикуляционных органов не является устойчивой из-за их инерции. Коррекция этой динамики осуществляется за счет обратной связи, которая образуется на основе прослушивания сказанного.

Идея, которая легла в основу настоящей работы, основана на указанной обратной связи. Пусть имеется скрытый от непосредственного наблюдения управляемый сознанием физиологический процесс (динамика легких, поведение голосовых складок и т.п.), кроме этого существует множество наблюдаемых случайных процессов (под этими процессами подразумевается поведение спектральных компонент речевого сигнала). Динамика наблюдаемых случайных процессов зависит от скрытого физиологического процесса. Предположим, что цель скрытого случайного процесса состоит в поддержании определенных, строгих отношений между компонентами наблюдаемых процессов в процессе произнесения того или иного речевого элемента (фонемы, трифона и т.п.).

Возникают несколько вопросов:

- можем ли мы, основываясь на сделанных выше предположениях, установить способ управления;

- насколько данные о способе управления физиологическим процессом характеризуют диктора, произносящего то или иное высказывание?

Постановка задачи

Допустим, что скрытый процесс авторегрессии имеет вид

У( = У(-1 + 4 ^ (!)

с определенным начальным условием у0 = 0. В (1) еу - случайный процесс, имеющий нормальную плотность распределения вероятности с математическим ожиданием т{у) и дисперсией о{у\ Этот процесс соответствует ненаблюдаемому физиологическому.

Допустим, что исследуемые наблюдаемые процессы можно представить в форме

Кл =М, (-1 + С1У-1 +еи ^

= № (2)

= в2Ь2,(-1 + с2уг-1 + е2,г ,

при начальных условиях t10 = 0, t2,0 = 0. В (2) e\t' и e2t - случайные процессы, имеющие нормальные плотности распределения вероятности с математическими ожиданиями т[й),m2h) и дисперсиями о"1(А),ст2(А) соответственно. Они моделируют поведение какой-либо пары спектральных компонент.

Необходимо найти оптимальную функцию управления at скрытым процессом yt такую, чтобы выполнялось условие

i(/(ti,t, tt2,t) -ö)2 ^ min, (3)

t=i

где в - некоторая неизвестная константа, а функцияfh1t, t2,t) задает инвариантное отношение между наблюдаемыми процессами, если даны выборки случайных процессов h1t, t2,t.

Описание модели Допустим, что инвариантное отношение задано в линейной форме

f(hi,t, h2,t) = + Ф2кхь (4)

где ф1, ф2 - некоторые неизвестные константы, между которыми существует связь q\ +q>\ = 1.

Для поиска неизвестных параметров процессов (2) предположим, что yt не влияет на процессы h1t, t2 t, т.е. константы c1, c2 равны нулю. Тогда согласно методу наименьших квадратов (МНК) параметры (2), т.е. величины <r1(t),т[А),ст^й),m2h),ß,ß2, необходимо искать, минимизируя функционал^!

T^h - i (( - ßAt-i - m(h)) min, i = 1,2, (5)

t=1

где T - длительность наблюдаемой реализации.

Дифференцируя (5) и решая систему линейных уравнений, получим значения искомых параметров:

T hi,t T hi,t-i- ТT KAj-1 T hi,t-1 T hi,thi,t-i hu T h5-i

ß = t=1 t=1_t=1_ m = i=1_t=1_t=1 t=1_

Pi ~ , ч 2 ' i ~ , ч 2 '

x T у T ( t Л2 T 2

Iit,t-i I -tia5-i (iti,t-i I --t2-i

V t=i у t=i V t=i у t=i

1 T 2

о = —- i ((- ßti,t-i- m) .

T - 1 t =1

Далее проверим справедливость гипотезы об отсутствии влияния скрытых процессов с помощью метода хи-квадрат, предложенного К. Пирсоном [2]. По сути, предположение о независимости равносильно тому, что наблюдаемый процесс описывается плотностью распределения вероятности вида

Р, (h) =

rexp ■!

( -ßAt-1- m )2 j-

Критерий хи-квадрат можно записать в виде

2 M (п, - np} )2

ж2 = £———,

1=1 пР-

(6)

(7)

где п - количество наблюдаемых данных; п - количество наблюдаемых данных, попавших в]-й интервал при условии разбиения генеральной совокупности на М интервалов; pj - вероятность попадания наблюдаемых данных в j-й интервал при условии справедливости гипотетического распределения (6), т.е.

Р, =

i gj+i ш I i 2 I

-=- J dxt J dxt-iexp— (x -ßxt-i - m) j. v2ncr g. -ш I 2а- I

Для выбранного уровня значимости ф необходимо провести сравнение (7) с заданными таблично квантилями Х\-ф(к-1). Причем, если X —

- х1ф(к -1), то гипотеза о справедливости предположения не принимается.

Если гипотеза справедлива, то дальнейшие вычисления не проводятся и считается, что процессы (2) независимы. Интересен случай, когда гипотеза отклоняется для обоих наблюдаемых процессов. Используя МНК второй раз, опираясь на функционал

F (p,p,ö) = £ (,t + p2 h2,t -ö)2 + 4p2 +^22 -1), t=1

(8)

найдем параметры инвариантного отношения, заданного выражениями (3), (4). При построении функционала использован метод Лагранжа, позволяющий учесть определенную ранее связь между весовыми коэффициентами компонент. Символ X в (8) - множитель Лагранжа.

Дифференцируя (8) по неизвестным параметрам, в том числе множителю Лагранжа, получим систему нелинейных уравнений + $ =1

т т

РХ +$2 X ^21 =в

t=1 t=1

I т 2 I т т -

p I £ h1,t + 2^I + P2 £ h1,th2,t = ö£ h1,t

V t=i J t=i t=i

T (т 2 I T

P £ h1,th2,t + P2 I £ h2,t + 2Л1= ö£ h2,t

t=i Vt=i J t=i

Далее становится возможным приступить к поиску параметров управ-

Су)

ления скрытым процессом у( и характеристик случайного процесса е^ , порождающего процесс у.

В явном виде скрытый процесс уг можно выразить через отсчеты по-

следовательности е

(у)

, t-i

yt = Seeу) п a,.

(9)

г=1 ]=1

Подстановка (9) в каждый из наблюдаемых процессов и их преобразование к явному виду приводят к выражениям

h

t-i

(

(1,2)t = S ß(1,2) k=1

t-k-2 , J-k-2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

'(i,2) i e<y) П a, +e(h)

i=i ]=i

\

(1,2)t-k

Несложно вычислить отношения между параметрами сь с2, задающими величину связи между наблюдаемыми и скрытым процессами. Для этого с помощью (2) выразим процесс у( через наблюдаемый процесс к1л и вычислим математическое ожидание от получившегося выражения. Для отношения параметров с1, с2 получим с2/с1 = (1 - в2)/(1 - $).

Еще раз применим МНК, используя функционал вида

i

t=1

t-1 , ( t - k -2 k Ci i

9\iß

k=1

V

i=1

e\y)t ]fl2a1 +ei(,h-k^

+V2 2 ßß

k=1

t-k-2

c2 i ei i=1

( y)

1 =i t -k - 2

/

П aj +e2?t-k 1=i

^ min,

(10)

который позволяет искать функцию оптимального управления на всем интервале наблюдения за случайными процессами к1л, к2л. Однако, как уже обсуждалось во введении, в соответствии с рисунком предполагается, что слуховой анализатор проводит текущую коррекцию речевого тракта по результатам прослушивания произнесенного. Рассмотрим метод вычисления поправок по текущему состоянию.

Пусть найдена оптимальная функция управления на интервале [0, Т] с помощью функционала

F (T) = i

t=1

k=1

t-1 i \t-k-2 t-К-2

^(ißi +^2C2ß2k) i e\y) П a, -ö

k=1 i=1 j=i

ч t-k-2

1=i

где по отношению к функционалу (10) для удобства дальнейших вычислений суммы внутри скобок перегруппированы и вычислено его значение в точке минимума. Пусть это значение будет д.

На интервале [0, Т + 1] для поиска функции управления будет справедлив функционал вида

T+1

F (T +1) = 2

t=1

2 ((h - k+V2ßi4ik)+ k=1 v 7

t-1 / k k ч t-k-2 t-k-2

^(/ß +^2C2ß2k) 2 P*) П -t

k=1 i=1 j=i

Очевидно, что последнее выражение можно представить в виде

T -1 T -2 2

F (T +1) = 8 +

E(T) +«т -1 (ß +^2 cß ff P П a

i=1 j=i

(11)

где

E(T) = 2 (PT+1-k + ^2}+1-k ) + k=1

-2 (ßß +^2 C2ß2k ) llaj -ö.

к=2 ' 1=1 ]=1 Дифференцируя (11) по неизвестному параметру аТ-1, найдем его значение

Е(Т)

T -1

(в+Ъв )У П

1=1 ]=г

Таким образом, получен рекуррентный способ вычисления функции управления скрытого случайного процесса для случая, если необходимо поддерживать инвариантные отношения (3).

Отметим, что для их расчета необходимо знать значения случайных

,(h) c(h)

последовательностей ^27 , е\7 и е . На практике мы лишь можем предполагать, что эти последовательности заданы фиксированными распределениями плотности вероятностей. Этот факт заставляет использовать генераторы случайных последовательностей с заданными свойствами.

Фактически метод вычисления параметров управления скрытыми случайными процессами сходен с методом адаптивной фильтрации [3], когда на один из входов фильтра подается шум, наличие которого предполагается в исходном сигнале.

Литература

1. Потапова Р.К. Речь: коммуникация, информация, кибернетика: Учеб. пособие. 2-е изд., доп. М., 2001.

2. Вероятностные разделы математики Учеб. для бакалавров технических направлений / Под ред. Ю.Д. Максимова. СПб., 2001.

3. Грант П.М. и др. Адаптивные фильтры: Пер. с англ / Под ред. К.Ф.Н. Коуэна, П.М. Гранта. М., 1988.

ФГНУ НИИ «Спецвузавтоматика», г. Ростов н/Д

13 декабря 2005 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.