Евразийский Союз Ученых (ЕСУ) # 8 (17), 2015 | ТЕХНИЧЕСКИЕ НАУКИ
111
Н.С. Пичкурова//Вест. РААСН. - 2008.- Т. 1, №13, С. 222 - 227.
3. Михайлова, Н.С. Экспериментальные исследования железобетонных балок без трещин и с заранее намеченной трещиной / Н.С. Михайлова // Изв. вузов. Строительство. - 2007. - № 4. - С. 117 - 120.
4. Пичкурова, Н.С. Напряженно-деформированное состояние железобетонных балок с организованными трещинами /В.М. Митасов, В.В. Адищев,
5. Пичкурова, Н.С. Трещиностойкость железобетонных конструкций/ В.М. Митасов, В.В. Адищев, Н.С. Пичкурова//Проблемы современного бетона и железобетона: сб. тр. Ч.1. Бетонные и железобетонные конструкции. - Минск: Минсктиппроект, 2009. - С. 267-276.
МЕТОД РАСЧЕТА КОРНЕЙ СИСТЕМНОЙ ФУНКЦИИ ФИЛЬТРА ПРЕДСКАЗАТЕЛЯ РЕЧЕВОГО СИГНАЛА ПО КОЭФФИЦИЕНТАМ ЛИНЕЙНОГО ПРОГНОЗА
Санников Владимир Григорьевич
Канд. тех. наук, доцент, профессор, Московского технического университета связи и информатики, г. Москва
Корольков Алексей Алексеевич Аспирант, Московского технического университета связи и информатики, г. Москва
АННОТАЦИЯ
Цель данного исследования - получение цифрового алгоритма взаимосвязи коэффициентов линейного прогноза с линейными спектральными парами при обработке речевого сигнала. Эта цель достигается путем анализа фазо-частотной характеристики фильтра предсказателя. В результате впервые получена система линейных алгебраических уравнений, показывающая явную взаимосвязь коэффициентов линейного прогноза с линейными спектральными парами и легко программируемая на ЭВМ. Результаты теоретического расчета подтверждаются экспериментально. Оценки коэффициентов линейного прогноза и линейных спектральных пар вычисляются с высокой точностью.
ABSTRACT
Objective of this research - deriving of digital algorithm of interrelation offactors linear prediction coefficients with line spectrum vapors at speech signal call handling. This purpose is attained by the analysis ofphase-frequency characteristic of the predictor filter. As a result for the first time the system of the linear algebraic equations showing explicit interrelation offactors linear prediction coefficients with line spectrum vapors and easily programmed on a computer is gained. Outcomes of theoretical calculation prove to be true experimentally. Estimations of factors linear prediction coefficients with line spectrum vapors couples are computed with a split-hair accuracy.
Ключевые слова: Речевой сигнал, фильтр предсказатель, фазо-частотная характеристика, коэффициенты линейного прогноза, линейные спектральные пары.
Keywords: Speech signal, predictor filter, phase-frequency characteristic, linear prediction coefficients, line spectrum
vapors.
Введение. В современных системах речевой связи и распознавания речи для эффективного кодирования речевых сигналов очень часто применяется метод линейного предсказания [1-2, 5-9]. Согласно этому методу речевой
s(t)
сигнал 47 в дискретном времени представляется авторегрессионной моделью:
p
sk = Z aisk-i + %=spk + ek
i=1
sk = s(tk = ш)
(i)
где Л v Л y - отсчеты речевого сигнала в дис-
кретные моменты времени, кратные интервалу дискрети-
\t sk-i i
зации , k i, - задержанные отсчеты сигнала на 1
тактов дискретизации
sp ,k
i
1 p p
- порядок модели (1), p ,k - отсчеты сигнала предсказания, формируемого по
sk ■, i = 1, p
задержанным отсчетам k i Г с учетом вектора
a = (ai, «2,...,a,...,)
параметров модели
назы-
e
ваемых коэффициентами линейного прогноза (КЛП), k отсчеты погрешности предсказания.
В системах эффективного кодирования речи с линейным предсказанием в канал связи передаются не кодовые эквиваленты последовательности { k }, как это происходит в системах с импульсно-кодовой модуляцией [3], но кодовые эквиваленты вектора a и последовательности e
{ k }. При отсутствии ошибок в канале связи такой метод кодирования обеспечивает снижение скорости цифровой передачи речи с 64 кбит/с до 32 кбит/с и менее при сохранении высокого качества синтезируемой на приеме речи.
При наличии ошибок в канале связи и грубом квантовании КЛП качество синтезируемого на приеме речевого сигнала значительно снижается, что не всегда допустимо. Поэтому актуальной является задача исследования таких параметров линейного предсказания, связанными с КЛП, которые допускали бы эффективное кодирование речи с низкой битовой скоростью, но обладали лучшей помехоустойчивостью.
Установлено [5, 6], что наиболее приспособлены для этих целей коэффициенты линейных спектральных пар (ЛСП), которые ищутся как нули полинома следующего вида:
A( z)=1- Z aiz~-
i =1
(2)
112
Евразийский Союз Ученых (ЕСУ) # 8 (17), 2015 | ТЕХНИЧЕСКИЕ НАУКИ
A( z)
Здесь v ' - есть системная функция фильтра предсказателя, определяемая на основе модели речевого
сигнала (1). Действительно, если последовательность {
} известна, то отсчеты
e
к
погрешности предсказания p
ek = sk - sp,k = sk -E aisk-i
определяются так:
i=1
Применяя прямое z -преобразование к правой и левой частям этого равенства имеем:
sk E(z)=(1 -E aizi)S(z)=A(z)S(z)
где
E(z) „ S(z)
e.
z -преобразования последовательностей { ek } и { Sk }, а
A(z) - есть системная функция вида (2). Сравним два метода вычисления ЛСП и КЛП.
Первый метод или метод Итакуры. На основе полинома (2) строятся еще два полинома [5]:
H+ (z) = A(z) + z-(p+1) A(z-1), H_ (z) = A(z) - z-(p+1) A(z-1)
Полиномы H+(z) и H- (z) имеют тривиальные
z0+=-1 z0-= 1
корни ’ и ’ , соответственно. Чтобы
освободиться от них переходят к полиномам:
H1(z) = H+ (z)/(1 + z-1) и H2(z) = H_ (z)/(1 - z-1)
p/2
D1( x)=E dn
p / 2
x
D2( X) =E Cn
x
n=0
n=0
(3)
. (4)
Здесь x z +z 2 COS"At. Вычислив
корни полиномов (4), приравнивая их нулю, определяют
, порядки которых равны порядку p исходного полинома искомые коэффициенты ЛСП в виде:
A( z)
' 4 . Теперь для нахождения ЛСП в полученные поли-
z _ e‘"A
номы подставляют переменную ^ с . После чего переходят к алгебраическим полиномам [5]:
" 1At = arccos(xi 1 / 2), coi2 At = arccos(xi 2 / 2), i = 1,2, ... ,p /2. H1(z) и H2 (z)
(5)
Согласно (5) корни полиномов определяются так:
zi,1 = e
‘"•■'a, zi2 = e‘"'A, i = 1, p/2
ляцией, с которыми связаны ЛСП в (6), более помехоустойчивы, чем методы передачи с амплитудной модуляцией, с которыми связаны КЛП в (1).
Обратная задача состоит в восстановлении КЛП
т.е. корни лежат на единичной окружности z-плоскости и соответственно отражаются на частотную " или фазовую "At
первого полинома следует корень второго. Частоты ношениям:
по рассчитанным и переданным по каналу связи величи-
множества ЛСП
(6) нам ЛСП.
Так, для заданного
ш = {",®2,...,"n,...," p }At
n p , в работе [6] вели-
ось. Данные корни чередуются, т.е. за корнем чины КЛП предлагается вычислять по следующим соот-
"i,1, "i,2 , "i,1At, "i,2 At
или фазы называют линей-
ными спектральными корнями или линейными спектральными парами (ЛСП). Их лучшая помехозащищенность от аддитивных помех определяется известным из общей теории связи положением: методы передачи с фазовой моду-
A( z) = 1 -±a,z-i = !^(z) -1] + Q z) -1]
i=1
2
(7)
где полиномы в правой части (7) определяются так:
P(z) =(1 -z_1) П(1 + xkz-1 + z~2X Q(z) =(1 + z_1) П(1 + xkz-1 + z_2)
где
что
так,
k=2,4,...
xk = -2cos"kAt, k = 1, p, x-1 = -z_1 1 + x_ 1 z 1 + z 2 = 1
Сложность данного метода состоит в вычислении
A( x) D2( x) nnr[
1 v 7 и 2 v 7 при определении ЛСП и
P( z ) Q( z)
полиномов v ' и ^v 7 при определении КЛП. Кроме того, не видна явная зависимость между этими параметрами.
Рассмотрим метод, свободный от этих недостатков.
k =1,3,.
(8)
Второй или фазовый метод. В современных кодеках речи вместо аналитических вычислений, требуемых при реализации метода Итакуры, для расчета КЛП и ЛСП применяется цифровая обработка. Поэтому в полиномах
H + (z) и H- (z)
полиномов
в (3) можно сразу перейти к дискрет-
ному представлению их аргумента:
_ J"nAt _ JVn „ _
zn = e
eJ
n = 0, N -1.
(9)
i=1
Евразийский Союз Ученых (ЕСУ) # 8 (17), 2015 | ТЕХНИЧЕСКИЕ НАУКИ
113
где
fd = 1/At
f 2n
co„ At = 2nfn At = 2m—At = — n = pn
n Jn N N
частота дискретизации,
Pn
Tn - дискретная лучаем:
фаза, изменяемая в пределах от 0 до 2 n , N - число выборок фазы.
Подставляя (9) в (3), после ряда преобразований по-
H+ (eJPn) = 2| Л(в]Рп) | cos[[ (pn) + Pn (p + 1)/2]e
- JPn ( p+1)/2
H_(ePn ) = 2J 1 A(ePn ) 1 sin[A(Pn) + Pn(P + 1)/2]e
_ JPn ( P+1)/2
(10а)
(10б)
| A(ejanAt )| A(z) [л (®nAt) = [a (Pn)
где 14 71 - модуль системной функции 4 7
_ ajmnAt
фильтра предсказателя при z = e , или его ампли-
(АЧХ), а
ристика (ФЧХ).
его фазо-частотная характе-
тудно -частотная
характеристика
Л(Z) (H+ (z) + H_ (z)
v/=( + v 7 + v 7 )/2, то после
Так как ~~v 7=(“ + v 7 + ряда преобразований получаем:
Л( z = j ) =l A(ePn ) 1 |c°s[A (Pn ) + Pn (p + 1 ] + j sin[A (Pn ) + Pn (P + ^ ]}e J
Pn ( P+1) 2
2
И nn A(eJPn)
Из (11) следует, что нули полинома v 7 при
p P = Pn
произвольном аргументе ~ , в том числе и при т т n, совпадают с нулями следующих важных равенств:
2 , (ii)
1 cos[A (P) + P(P + 1)/2] = 0|p=p,m, m=1pT2,
2. sin[[A (P) + P(P + 1)/2] = 0p=ps m, m=l(P72,p.0- (12)
Так как нули синуса (кроме первого при P 0) расположены правее нулей косинуса, то они образуют чередующиеся ЛСП вида:
(a>c1At,a>s1At,..., юс , P/2 At,®s, P 72At) = (Pc,1 ,ps1,...,pc, P/2,ps, P/2)
■, P/2
Итак, показано, что ЛСП определяются только формой ФЧХ Pa (®At) фильтра предсказателя.
Решая уравнения (12) приходим к равенствам:
1. [Л (p) + p( P +1)72 = (2m _ 1)n/2,
2. [Л (p) + p(P +1) / 2 = mn, m = 1, P/2,
(14)
или с учетом равномерного чередования правых частей в (14) получаем единственное уравнение для нахождения ЛСП:
f ч (P +1) n _ z--
[л (p) + 2 p_ m - = 0 m =1 p.
(15)
(13)
Первый компонент левой части этого равенства есть ФЧХ фильтра предсказателя, нелинейная функция своего аргумента; второй компонент - линейная зависи-
_(p +1)/2
мость с крутизной, равной , зависящей от по-
рядка модели (1); третий компонент - постоянная, определяющая порог принятия решения об m -ой величине ЛСП
At pm, m 1 p . Отдельные компоненты век-
тора ЛСП в (13) находятся как корни решения равенства
(15) при изменении m от 1 до P .
Графически ЛСП находятся как точки пересечения функции в левой части (15) с нулем. Эта задача легко решается при цифровой обработке. Для этого в начале, фиксируя m , находим знаковую функцию вида:
c(p,pm) = signum
В точке p=pm =®mAt
[Л (p) +
(p+1)
2
c(pp)
m m функция m
имеет скачек от -1 до +1. Теперь, дифференцируя
c(p pm ) , этот скачек реализуется в импульс, который при дискретизации фазовой шкалы p представляется в
виде: 1 p ) = 2Sn
где
8„ „ = 1, n = m,
и
p_ m
n
2
1 +1,
Sn_m = a n * m
pm <P<n, 0 ^p<pm.
(16)
- символ Кронекера (единичный им-
пульс).
Результаты моделирования данного метода показаны на рисунке 1.
Здесь приведены графики зависимости функции (15) для случая фильтра предсказателя шестого порядка с
КЛП вида:
а1 = 2,293 -10-1
а2 = 1,699 -10-1
114
Евразийский Союз Ученых (ЕСУ) # 8 (17), 2015 | ТЕХНИЧЕСКИЕ НАУКИ
а3 = 1,377 • 10
-1
а = 7,299 • 10-
а5 = 5,206 • 10-3 а6 = 7,858 •lO-3 „
55 , 65 . Два верхних
ж ¥а (ф) + 0,5(p +1)ф
графика - это зависимости: r AV^y ? /г
(нелинейная, сплошная) и 0,5(p +1)ф (линейная, штрих-пунктирная). Остальные шесть гафиков - это зависимости:
¥а (Ф) + 0,5(Р +1ф- 0,5т^ т =1,6. Импульсная последовательность 1Ф ) = ^-т , где фт . есть ЛСП в радианах, соответственно, равные:
ф = 0,3068 ф2 = 0,80994 ф3 = 1,3254
Ф4 = 1,7917’ ф5 = 2,2335 ф6 = 2,6998
2
0 0.5 1 1.5 2 2.5 3
текущая фаза в радианах
Рисунок 1 - Графики зависимости фазовых характеристик фильтра предсказателя шестого порядка и импульсы
в точках с координатами ЛСП
Расчет КЛП по принятым ЛСП. В эффективном де- (1). Для этого по принятым ЛСП необходимо восстано-кодере системы речевой связи требуется решить задачу вить КЛП. Решим эту задачу для рассмотренного выше синтеза (восстановления) речевого сигнала по алгоритму фазового метода.
Преобразуем системную функцию фильтра предсказателя (2) к виду:
A(z = ejaAt = е]ф) =1 - £аке-}фк =1 - £ак С08ф • к) + j£ак sin(> • к)
к=1 к=1 к =1 . (17)
Находим величину тангенса от ФЧХ фильтра предсказателя:
p ( p ^
tg[^A (Ф)] = £ ак 8ш(ф• к) /I 1 -£ак С08(ф • к) I
к=1 \ к=1 /. (18)
ф m = 1 p
Подставляя в (18) ЛСП ^m’ ’ , и вводя
обозначение tg[^A (фт)] Пт, после несложных
преобразований этого соотношения приходим к системе линейных алгебраических уравнений вида:
£ ак \Пт С0*(Фт • к) + ^(Фт ' к)] = Пт , т = 1, Р, Пт = ^[¥A (Фт )]
к=1 . (19)
Данное соотношение получено впервые; оно показывает явную связь КЛП с ЛСП и легко программируется на ЭВМ.
Экспериментальная проверка данного метода осуществлена при обработке стандартной речевой фразы: «Эти жирные сазаны ушли под палубу». Частота дискретизации 8 кГц, N = 256. На рисунке 2 показаны временные зависимости КЛП и соответствующие им ЛСП. По оси абсцисс - время в мс. По оси ординат: верхний график - значения КЛП, нижний график - значения ЛСП
(фт = т• 2^/N) в числе отсчетов т е[1,N/2].
Заключение. В работе на основе анализа фазо-частотной характеристики системной функции фильтра предсказателя впервые получена система линейных алгебраических уравнений, показывающая явную взаимосвязь коэффициентов линейного прогноза с линейными спектральными парами и легко программируемая на ЭВМ при обработке речевого сигнала в голосовом кодеке с линейным предсказанием. Результаты теоретического расчета с высокой точностью подтверждаются экспериментальными исследованиями на ЭВМ.
Евразийский Союз Ученых (ЕСУ) # 8 (17), 2015 | ТЕХНИЧЕСКИЕ НАУКИ
115
□ 0 0 0 0 (□ □ )
□ 0 0 0 0 (0 0 )
Рисунок 2 - Графики временной зависимости КЛП и ЛСП при обработке речевого сигнала с использованием фильтра
предсказателя шестого порядка
Список литературы
1. Орищенко В.И., Санников В.Г., Свириденко В.А. Сжатие данных в системах сбора и передачи информации / Под ред. В.А. Свириденко. - М.: Радио и связь. - 1985.
2. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи. - М.: Радио и связь, 2000. -456 с.
3. CCITT. Recommendation G.711. Red Book,VIII.3. 64 kbps PCM. - 1993.
4. Cox R.V. Draft Recommendation G.723.1 - Dual Rate Speech Coder for Multimedia Telecommunication Transmitting at 5,3 and 6,4 kbps. - ITU, Telecomm. Standardization Sector, LBC95- 085, 1995. - P. 1-24.
5. Itakura F. Minimumre prediction residual applied to speech recognition // IEEE Trans Acoustics, Speech, Signal Proc. ASSP-23(1), February. - 1975. - P. 67-72.
6. Kim H.K., Rose R.C. Speech recognition over mobile Networks // Automatic speech recognition on mobile devices and over communication networks. - Springer. - 2008.
7. Levinson S.E. Mathematical models for speech technology. - John Wiley & Sons. - 2005.
8. Markel J.D., Gray Jr. Linear Prediction of Speech. -New York.: Springer-Verlag. - 1976.
9. Rabiner L.R., Schafer R.W. Digital proceeding of speech signals. - New Jersy.: Prentice-Hall, Inc., Englewood Cliffs. - 1978.
УСТАНОВЛЕНИЕ МАКСИМАЛЬНОЙ ТОЧНОСТИ ИЗГОТОВЛЕНИЯ МОДУЛЕЙ ПО-ВЕРХНОЧТЕЙ ДЕТАЛЕЙ ПО НОРМАМ ГЕОМЕТРИЧЕСКОЙ ТОЧНОСТИ СТАНКА
Сахаров Александр Владимирович
Науч. сотр., ИМАШ РАН, г. Москва Арзыбаев Алмазбек Момунович Ст. науч. сотр., ИМАШ РАН, г. Москва Родионова Наталья Анатольевна
Науч. сотр., ИМАШ РАН, г. Москва
АННОТАЦИЯ
Рассмотрен вопрос определения максимальной точности изготовления модулей поверхностей деталей по нормам геометрической точности на примере токарно-карусельного станка.
ABSTRACT
The paper deals with determining the maximum precision manufacturing modules surfaces of the parts according to the norms of geometric accuracy on the example lathes.