Научная статья на тему 'Обоснование выбора материнского вейвлета непрерывного вейвлет-преобразования для анализа речевых сигналов'

Обоснование выбора материнского вейвлета непрерывного вейвлет-преобразования для анализа речевых сигналов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
962
282
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РЕЧЕВОЙ СИГНАЛ / ВЕЙВЛЕТ-АНАЛИЗ / НЕПРЕРЫВНОЕ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ / КРАТКОВРЕМЕННОЕ ПРЕОБРАЗОВАНИЕ ФУРЬЕ / ЧАСТОТНО-ВРЕМЕННЫЕ РАЗРЕШАЮЩИЕ СПОСОБНОСТИ / SPEECH SIGNAL / WAVELET ANALYSIS / CONTINUOUS WAVELET TRANSFORM / SHORT-TERM FOURIER TRANSFORM / TIME-FREQUENCY RESOLUTIONS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Голубинский Андрей Николаевич, Асташов Роман Анатольевич

The basic mother wavelets, time-frequency parameters for the continuous wavelet transform are given. The analysis of the mother wavelets regard to the processing of speech signals is performed.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Голубинский Андрей Николаевич, Асташов Роман Анатольевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

JUSTIFICATION OF THE CHOICE OF THE CONTINUOUS WAVELET TRANSFORM MOTHER WAVELET USED IN ANALYSIS OF SPEECH SIGNALS

The basic mother wavelets, time-frequency parameters for the continuous wavelet transform are given. The analysis of the mother wavelets regard to the processing of speech signals is performed.

Текст научной работы на тему «Обоснование выбора материнского вейвлета непрерывного вейвлет-преобразования для анализа речевых сигналов»

Р.Л. Асташов,

ОАО «Концерн «Созвездие»

Л.Н. Г олубинский,

доктор технических наук

ОБОСНОВАНИЕ ВЫБОРА МАТЕРИНСКОГО ВЕЙВЛЕТА НЕПРЕРЫВНОГО ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ ДЛЯ АНАЛИЗА

РЕЧЕВЫХ СИГНАЛОВ

JUSTIFICATION OF THE CHOICE OF THE CONTINUOUS WAVELET TRANSFORM MOTHER WAVELET USED IN ANALYSIS

OF SPEECH SIGNALS

Приведены основные материнские вейвлеты, частотно-временные параметры для непрерывного вейвлет-преобразования. Проведён анализ материнских вейвлетов применительно к обработке речевых сигналов.

The basic mother wavelets, time-frequency parameters for the continuous wavelet transform are given. The analysis of the mother wavelets regard to the processing of speech signals is performed.

Обработка сложных нестационарных сигналов на сегодняшний день находит широкое применение при анализе временных рядов, Интернет-трафика, биржевых котировок, данных дистанционного геофизического зондирования, распознавании образов и речевых сигналов, задачах связи, теоретической физики и математики, медицины, сжатии изображений и мультимедиа-информации и т.д. При этом решение ряда задач, связанных с обработкой нестационарных сигналов, параметры которых (например, частота) изменяются во времени, оказывается неэффективным или невозможным в рамках традиционного преобразования Фурье.

При оконном (кратковременном) преобразовании Фурье сигнал делится на отрезки («окна»), в пределах которых его можно считать стационарным. Для этого к сигналу применяется оконная функция, ширина которой должна быть равной ширине окна. В данном случае окно как бы скользит, перемещаясь с некоторым сдвигом по всей временной оси сигнала. Однако данное частотно-временное представление сигнала имеет существенный недостаток — чем уже временное окно, тем лучше временное разрешение, но хуже частотное, и наоборот. Проблема оконного преобразования Фурье имеет свои корни в явлении, которое называется принципом частотно-временной неоп-ределённости Гейзенберга. Таким образом, применительно к обработке сложных сигналов проблема оконного преобразования Фурье состоит в том, что приходится выбирать окно «раз и навсегда», то есть для анализа всего сигнала. Однако разные его участки могут требовать применения разных окон. Например, если сигнал состоит из далеко отстоящих друг от друга частотных компонент, то можно пожертвовать частотным разрешением в пользу временного, и наоборот.

Вейвлет- преобразование относительно оконного преобразования Фурье обладает лучшей частотно-временной локализацией для коротких высокочастотных и протяжённых низкочастотных составляющих сложных сигналов, которые в подавляющем большинстве случаев существуют в природе. Данное преимущество возникает вследствие переменного разрешения вейвлета по частоте и по времени. В результате при уве-

личении масштаба (или уменьшении частоты) в плоскости время-частота окно будет расширяться по временной шкале, и сужаться по частотной шкале. При уменьшении масштаба — наоборот.

Основная идея вейвлет-преобразования отвечает специфике многих сигналов, демонстрирующих эволюцию во времени своих основных характеристик - среднего значения, дисперсии, периодов, амплитуд и фаз гармонических компонент. Подавляющее большинство процессов, изучаемых в различных областях знаний, характеризуются, как раз, нестационарными сигналами.

Таким образом, перспективным математическим аппаратом для обработки речевого сигнала является непрерывный вейвлет-анализ, позволяющий вычислить частотно-временные характеристики речевого сигнала с удовлетворительным разрешением по времени и частоте, выявив существенные особенности в анализируемом сложном нестационарном сигнале. Непрерывное вейвлет-преобразование (НВП) является одним из эффективных альтернативных методов частотно-временного анализа, и позволяет проводить анализ на произвольно выбираемых частотах с корректировкой размера окна преобразования под анализируемую частоту. Следует отметить, что некоторые материнские вейвлеты НВП в ряде случаев непосредственно соответствуют конкретному физическому процессу, что определяет потенциально более высокую точность описания соответствующих сигналов.

К сожалению, в литературных источниках уделено мало внимания сравнительному анализу материнских вейвлетов, оценке параметров частотно-временного разрешения, в том числе применительно к обработке речевых сигналов.

Цель работы — аналитический обзор материнских вейвлетов для непрерывного вейвлет-преобразования, а также обоснованный выбор материнского вейвлета для анализа речевых сигналов.

Для определения наилучшего в некотором смысле вейвлета, позволяющего с необходимой точностью решать задачи анализа и синтеза речи, требуется задаться параметрами вейвлета, которые дают возможность количественно охарактеризовать его свойства. Рассмотрим основную характеристику материнского вейвлета — частотновременное разрешение, т.е. потенциальную способность селектировать частотные и временные компоненты исследуемого сигнала. Основными параметрами материнских вейвлетов, которые позволяют характеризовать его разрешающие способности по времени и частоте, являются [1—8]:

1) эффективный радиус (размер) временного окна материнского вейвлета, At:

(1)

где t0 — среднее значение материнского вейвлета во временной области:

(2)

|| ^|| — норма материнского вейвлета (во временной области):

¥

—¥

2) эффективный радиус (размер) частотного окна материнского вейвлета Д„:

А

'\

¥

J J-J J2 |Y(J 2dj

IIyJ2 -L

где Y(J — преобразование Фурье от материнского вейвлета:

¥

Y(J = Jy(t)• e- jJt dt,

(4)

(5)

7 = л/-Г ; в формуле (4): — среднее значение материнского вейвлета в частотной об-

ласти:

1 Г 2

J=--------2 Jj |y(J| d

J =J=----------T J|YJ| dw,

' J|| —¥

IYJ — норма материнского вейвлета в частотной области:

(6)

IIYJ 2 = J1 Y(J 2 d J;

(7)

3) эффективная площадь частотно-временного окна материнского вейвлета:

Яш = А -А*- (8)

На основе анализа литературных источников приведём наиболее часто используемые материнские вейвлеты НВП:

1) Морле (Morlet) [2, 3]: 1

y(t)=

ejXt e 2s2

s2(X-J)2

Y J) = 424^'[а e 2

A S

А t =T2

0,707;

А t

s=1

S

= 0,707;

s=1

2) WAVE (гауссов первого порядка, получается однократным дифференцированием функции Гаусса) [1, 6, 10];

3) MHAT — «мексиканская шляпа» (гауссов второго порядка, получается двукратным дифференцированием функции Гаусса) [4, 6, 11];

4) DOG (Difference of Gaussians) — разность двух гауссианов [6, 9, 10].

Следует отметить, что в ряде случаев для анализа нестационарных сигналов

также предлагается использовать различные виды материнских вейвлетов НВП:

- Гауссов n-го порядка [1];

- FHAT — «французская шляпа» [1, 9];

- HAAR [1, 11];

- Шеннона [5, 9, 10];

- LP-Litllewood& Paley [1];

- Пауля (Paul) [1];

- Коши [9].

В работе [8] в систематизированном виде приведены данные материнские вейвлеты, их преобразования Фурье, там же указаны и их основные параметры, характеризующие частотно-временное разрешение.

Заметим, что материнские вейвлеты Пауля (9) и Коши (10), являются комплексными вейвлетами:

—со

¥

¥

— ¥

2

t

1

y(t)=—-Г(n + 1 , n = 1,2,... (9)

2p (1- j . t)n+1

y(t)=! . Г(n + 1) , n> 0. (10)

2p (1 - j. t)n+15

где Г(x) — гамма-функция (по свойству гамма-функции для целых положительных n выполняется равенство: Г(n +1) = n!), т.е. вейвлет Коши является обобщённым случаем вейвлета Пауля для любых положительных n.

Данные вейвлеты удобно использовать для анализа квазипериодических по своей структуре сигналов (к которым, например, относятся речевые сигналы). Удобство заключается в том, что модуль НВП, при использовании комплексных материнских вейвлетов, соответствует аналогу амплитудного спектра вейвлет-преобразования (по аналогии с преобразованием Фурье, ядром которого является комплексная экспонента), а аргумент НВП характеризует аналог фазовых составляющих спектра.

Анализ литературных источников показал, что в настоящее время не уделено внимания исследованию разрешающей способности вейвлетов Пауля и Коши по частоте и времени. В связи с этим представляет научный и практический интерес исследование частотно-временных разрешающих способностей вейвлетов Пауля и Коши, а также их сравнительный анализ с характеристиками материнского вейвлета Морле.

К сожалению, в литературе не приводятся выражения для эффективных радиусов временного окна (At) и частотного окна (Д„) материнских вейвлетов Пауля и Коши, позволяющие оценить их потенциальные частотно-временные разрешающие способности. Приведём полученные параметры (1), (4), (8), характеризующие частотновременные разрешающие способности вейвлетов Пауля и Коши, причем указанные характеристики справедливы, как для вейвлета Пауля, так и вейвлета Коши для соответствующих значений порядка вейвлета (n).

Вычисление соответствующих интегралов для расчёта параметров (1)—(8) вейвлетов Коши и Пауля (при целых положительных n, т.е. n=1,2,...), в итоге даёт следующие выражения:

1) эффективный радиус временного окна материнского вейвлета:

A, =-j=^, (11)

V2n-1

где соответствующие параметры:

t0 = 0; Iff =л/р-Г(2п + 1)-2-n;

2) эффективный радиус частотного окна материнского вейвлета:

V 2n +1

Aw = 2 , (12)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где соответствующие параметры:

___1

Y(w) = W - e~ws(w); w0 = 2n+1; 1Ы=л/Г(2п +1) - 2 2,

0 2

здесь а(х) — сигма- функция Хевисайда;

3) эффективная площадь частотно-временного окна материнского вейвлета:

^ (13)

Рассмотрим подробнее зависимость площади частотно-временного окна материнского вейвлета (£„ t) от значения n (рисунок).

Для вейвлета Коши при п е (1/2; 1] резко возрастает площадь частотно временного окна Swt, асимптотически приближаясь к бесконечности при п ® 1/2. Та-

ким образом, указанный интервал не представляет практического интереса для анализа при использовании вейвлета Коши. Из анализа зависимостей Дt (п), Да (п) и £„ t (п) — соответственно формулы (11), (12) и (13), очевидно, что параметр вейвлета Коши п, следует брать: п > 1.

Заметим, что при возрастании п, как следует из формулы (13), площадь частотно-временного окна уменьшается (рисунок), в пределе

Таким образом, при n ® ¥ достигается нижняя граница значения размера частотно-временного окна материнских вейвлетов Пауля и Коши, равная 0,5. Функциональная зависимость материнских вейвлетов Пауля и Коши от времени находит практическое применение в квантовой механике, так как они хорошо приспособлены для анализа процессов, подчиняющихся принципу причинности (не создают паразитной интерференции между прошлым и будущим) [9]. Также данные вейвлеты применяются для анализа сейсмических сигналов потому, что хорошо аппроксимируют всплески (соответствующие сейсмической активности) и позволяют раздельно анализировать информацию об амплитудах и фазах колебаний. Это обусловлено, для указанных практических примеров, адекватными математическими моделями в виде данных материнских вейвлетов для исследуемых физических процессов.

Заметим, что потенциально возможное наименьшее значение площади частотновременного разрешения (inf [Swt] = 0,5) обеспечено для материнского вейвлета Морле

[1—4]. Данное обстоятельство априори указывает на преимущество материнского вейвлета Морле относительно вейвлетов Пауля и Коши, в смысле выигрыша по частотно-временному разрешению (минимальной площади частотно-временного окна S„ t ).

Sat(n)

0,6

0,8

0,7

0,5

l

2

З

4

5

6

7

8

9

n

Зависимость эффективной площади частотно-временного окна материнского вейвлета от n

Таким образом, применительно к описанию речевых сигналов целесообразно ис-

пользовать материнский вейвлет Морле, к достоинствам которого следует отнести наличие параметров: а— параметр масштаба, влияющий на ширину окна, и X— доминантная частота, позволяющая варьировать избирательность базиса. Варьируя данные параметры можно добиться: 1) приемлемой для решаемой задачи ширины частотного и временного окон при вариации параметра а; 2) высокой точности аппроксимации речевых сегментов, используя небольшое количество коэффициентов вейвлет-преобразования — вследствие резонанса сигнала с вейвлетом при вариации параметра X.

Следует отметить, что человеческое ухо устроено так, что при обработке звукового сигнала результирующее преобразование сигнала будет с точностью до константы совпадать с непрерывным вейвлет- преобразованием [4]. При этом материнский вейвлет Морле имеет частотно- временные характеристики аналогичные характеристикам базилярной мембраны [4, 8]. Это обусловлено тем, что материнский вейвлет Морле задан гармонической функцией в виде комплексной экспоненты модулированной гауссовой кривой, в связи с этим вейвлет Морле находит широкое применение для анализа нестационарных сигналов.

Таким образом, так как вокализованные и невокализованные сегменты речи адекватно моделируются с достаточно высокой точностью полигармоническими сигналами [12], рационально в качестве материнского вейвлета использовать вейвлет Морле, применяемый для обработки сложных сигналов, в том числе состоящих из квазиперио-дических составляющих, при этом априори гарантируется наилучшее (по сравнению с рассмотренными выше материнскими вейвлетами) частотно-временное разрешение.

ЛИТЕРАТУРА

1. Короновский А. А., Храмов А.Е. Непрерывный вейвлетный анализ и его приложения. — М.: ФИЗМАТЛИТ, 2003. — 176 с.

2. Бурнаев Е.В. Применение вейвлет преобразования для анализа сигналов. — М.: МФТИ, 2007. — 138 с.

3. Витязев В.В. Вейвлет- анализ временных рядов. — СПб.: Изд-во С.-Петербург. ун-та, 2001. — 58 с.

4. Добеши И. Десять лекций по вейвлетам. — Ижевск: Регулярная и хаотическая динамика, 2001. — 464 с.

5. Мала С. Вейвлеты в обработке сигналов. — М.: Мир, 2005. — 671 с.

6. Новиков Л.В. Основы вейвлет- анализа сигналов. — СПб.: МОДУС+, 1999. —

152 с.

7. Павлов А.Н. Методы анализа сложных сигналов. — Саратов: Научная книга, 2008. — 120 с.

8. Асташов Р.А., Голубинский А.Н. О материнском вейвлете непрерывного вейвлет-преобразования для задач анализа и синтеза речи // Наука и современность: сборник материалов XIX Международной научно-практической конференции. — Ч. 2.

— Новосибирск, 2012. — С. 12—19.

9. Фарков Ю. А. Ряды Фурье и основы вейвлет-анализа. — М.: РГГРУ, 2007. —

111 с.

10. Юдин М.Н., Фарков Ю.А., Филатов Д.М. Введение в вейвлет-анализ. — М.: Моск. геологоразв. акад., 2001. — 72 с.

11. Штарк Г.Г. Применение вейвлетов для цифровой обработки сигналов. — М.: Техносфера, 2007. — 192 с.

12. Голубинский А. Н., Булгаков О.М. Математические модели речевых сигналов для верификации и идентификации личности по голосу. — Воронеж: Издательско-полиграфический центр Воронежского государственного университета, 2010. — 364 с.

REFERENCES

1. Koronovskiy A.A., Hramov A.E. Nepreryivnyiy veyvletnyiy analiz i ego priloz-heniya. — M.: FIZMATLIT, 2003. — 176 s.

2. Burnaev E.V. Primenenie veyvlet preobrazovaniya dlya analiza signalov / E.V. Burnaev. - M.: MFTI, 2007. - 138 s.

3. Vityazev V.V. Veyvlet-analiz vremennyih ryadov. - SPb.: Izd-vo S.-Peterburg. un-ta, 2001. - 58 s.

4. Dobeshi I. Desyat lektsiy po veyvletam. - Izhevsk: Regulyarnaya i haoticheskaya di-namika, 2001. - 464 s.

5. Mala S. Veyvletyi v obrabotke signalov. - M.: Mir, 2005. - 671 s.

6. Novikov L.V. Osnovyi veyvlet-analiza signalov. - SPb.: MODUS+, 1999. - 152 s.

7. Pavlov A.N. Metodyi analiza slozhnyih signalov. - Saratov: Nauchnaya kniga, 2008.

- 120 s.

8. Astashov R.A., Golubinskiy A.N. O materinskom veyvlete nepreryivnogo veyvlet-preobrazovaniya dlya zadach analiza i sinteza rechi // XIX Mezhdunarodnaya nauchno-prakticheskaya konferentsiya “Nauka i sovremennost”: Sbornik materialov. - Ch. 2. - Novosibirsk, 2012. - S. 12-19.

9. Farkov Yu.A. Ryadyi Fure i osnovyi veyvlet-analiza. - M.: RGGRU, 2007. - 111 s.

10. Yudin M.N., Farkov Yu.A. Vvedenie v veyvlet-analiz / D.M. Filatov. - M.: Mosk. geologorazv. akad., 2001. - 72 s.

11. Shtark G.G. Primenenie veyvletov dlya tsifrovoy obrabotki signalov. - M.: Tehnos-fera, 2007. - 192 s.

12. Golubinskiy A.N., Bulgakov O.M. Matematicheskie modeli rechevyih signalov dlya verifikatsii i identifikatsii lichnosti po golosu — Voronezh: Izdatelsko-poligraficheskiy tsentr Voronezhskogo gosudarstvennogo universiteta, 2010. - 364 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.