Научная статья на тему 'Сравнительная характеристика программных комплексов для анализа и обработки речевых сигналов с использованием вейвлетов'

Сравнительная характеристика программных комплексов для анализа и обработки речевых сигналов с использованием вейвлетов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
146
14
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОБРАБОТКА РЕЧЕВЫХ СИГНАЛОВ / АЛГОРИТМЫ ОБРАБОТКИ РЕЧИ / ТЕОРИЯ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЯ / ВЕЙВЛЕТ-АНАЛИЗ РЕЧЕВЫХ СИГНАЛОВ / ПРОГРАММНЫЕ КОМПЛЕКСЫ ДЛЯ ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ / SPEECH SIGNAL PROCESSING / SPEECH PROCESSING ALGORITHMS / WAVELET TRANSFORM THEORY / WAVELET ANALYSIS OF SPEECH SIGNALS / SOFTWARE SYSTEMS FOR SPEECH SIGNAL PROCESSING

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Довгаль Виктор Митрофанович, Хеин Мин Зо

Данная статья посвящена проблеме обработки и анализа речевых сигналов на основе ставшего одним из наиболее актуальных в последнее время метода вейвлет-преобразования. Метод. Растущая актуальность и несомненная практическая ценность стала причиной появления большого количества программных комплексов, позволяющих осуществлять обработку речевых сигналов на базе данного метода. Однако каждый из этих комплексов имеет существенные различия в интерфейсе, предоставляемых инструментах обработки, функциях, обладает рядом достоинств и недостатков. На данный момент написано большое количество пособий и рекомендаций по работе с конкретными программными комплексами, но эти материалы носят разрозненный и бессистемный характер. Результат. Предпринята попытка систематизации теоретического материала и описания сходств и различий, достоинств и недостатков трёх наиболее популярных программных комплексов: 1) Пакет расширения систем MATLAB 6.0/6.1/6.5 Wavelet Toolbox 2/2.1/2.2; 2) Программный комплекс Mathcad; 3) Wavelet Explorer системы Mathematica. Вывод. Данная статья будет полезна специалистам, занимающимся проблемой обработки речевых сигналов с использованием метода вейвлет-преобразования, так как содержит материал, имеющий практическую ценность, а также позволит в определенной мере облегчить работу специалиста, связанную с выбором оптимального для реализации конкретной задачи программного комплекса.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARATIVE CHARACTERISTICS OF SOFTWARE SYSTEMS FOR ANALYSIS AND PROCESSING OF SPEECH SIGNALS USING WAVELETS

This article is devoted to the problem of processing and analysis of speech signals on the basis of the wavelet transform method, which has become one of the most relevant in recent years. Method. The growing relevance and undoubted practical value became the reason for the emergence of a large number of software systems that allow the processing of speech signals on the basis of this method. However, each of these systems has significant differences in the interface provided by the processing tools, functions, has a number of advantages and disadvantages. At the moment, a large number of manuals and recommendations for specific software packages have been written, but these materials are fragmented and unsystematic. Result. This article attempts to systematize the theoretical material and describe the similarities and differences, advantages and disadvantages of the three most popular software systems: 1) MATLAB 6.0/6.1/6.5 Wavelet Toolbox 2/2.1/2.2; 2) Mathcad; 3) Wavelet Explorer of Mathematica. Conclusion. This article will be useful for specialists dealing with the problem of speech signal processing using the wavelet transform method, as it contains material that has practical value, and will allow to facilitate the work of a specialist related to the selection of the optimal for the implementation of a specific task of the software complex.

Текст научной работы на тему «Сравнительная характеристика программных комплексов для анализа и обработки речевых сигналов с использованием вейвлетов»

Вестник Дагестанского государственного технического университета. Технические науки. Том 45, №3, 2018 Heraldof Daghestan State Technical University.TechnicalSciences. Vol.45, No.3, 2018 _http://vestnik.dgtu.ru/ISSN (Print) 2073-6185 ISSN (On-line) 2542-095Х_

Для цитирования: Довгаль В.М., Хеин Мин Зо. Сравнительная характеристика программных комплексов для анализа и обработки речевых сигналов с использованием вейвлетов. Вестник Дагестанского государственного технического университета. Технические науки. 2018;45(3):103-113. D0I:10.21822/2073-6185-2018-45-3-103-113 For citation: Dovgal V.M., Hein Min Zo. Comparative characteristics of software systems for analysis and processing of speech signals using wavelets. Herald of Daghestan State Technical University. Technical Sciences. 2018; 45(3):103-113. (In Russ.) D0I:10.21822/2073-6185-2018-45-3-103-113

ТЕХНИЧЕСКИЕ НАУКИ ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

УДК 681.3.067

DOI: 10.21822/2073-6185-2018-45-3-103-113

СРАВНИТЕЛЬНАЯ ХАРАКТЕРИСТИКА ПРОГРАММНЫХ КОМПЛЕКСОВ ДЛЯ АНАЛИЗА И ОБРАБОТКИ РЕЧЕВЫХ СИГНАЛОВ С ИСПОЛЬЗОВАНИЕМ

ВЕЙВЛЕТОВ

Довгаль В.М.1, Хеин Мин Зо2

1-2Курский государственный университет,

1-2305000, Курская область, г.Курск, ул. Радищева, 33, Россия,

1e-mail: [email protected], 2e-mail: [email protected]

Резюме. Цель. Данная статья посвящена проблеме обработки и анализа речевых сигналов на основе ставшего одним из наиболее актуальных в последнее время метода вейвлет-пре-образования. Метод. Растущая актуальность и несомненная практическая ценность стала причиной появления большого количества программных комплексов, позволяющих осуществлять обработку речевых сигналов на базе данного метода. Однако каждый из этих комплексов имеет существенные различия в интерфейсе, предоставляемых инструментах обработки, функциях, обладает рядом достоинств и недостатков. На данный момент написано большое количество пособий и рекомендаций по работе с конкретными программными комплексами, но эти материалы носят разрозненный и бессистемный характер. Результат. Предпринята попытка систематизации теоретического материала и описания сходств и различий, достоинств и недостатков трёх наиболее популярных программных комплексов: 1) Пакет расширения системMATLAB 6.0/6.1/6.5 Wavelet Toolbox 2/2.1/2.2; 2) Программный комплексMathcad; 3) Wavelet Explorer системы Mathematica. Вывод. Данная статья будет полезна специалистам, занимающимся проблемой обработки речевых сигналов с использованием метода вейвлет-пре-образования, так как содержит материал, имеющий практическую ценность, а также позволит в определенной мере облегчить работу специалиста, связанную с выбором оптимального для реализации конкретной задачи программного комплекса.

Ключевые слова: обработка речевых сигналов, алгоритмы обработки речи, теория вейвлет-преобразования, вейвлет-анализ речевых сигналов, программные комплексы для обработки речевых сигналов

TECHNICAL SCIENCE COMPUTER SCIENCE, COMPUTER ENGINEERING AND MANAGEMENT

COMPARATIVE CHARACTERISTICS OF SOFTWARE SYSTEMS FOR ANALYSIS AND PROCESSING OF SPEECH SIGNALS USING WAVELETS

Victor M. Dovgal1, Hein Min Zo2

1,2Kursk State University,

1,233 Radishcheva Str., Kursk 305000, Russia,

1e-mail: [email protected], 2e-mail:[email protected]

Abstract. Objectives This article is devoted to the problem of processing and analysis of speech signals on the basis of the wavelet transform method, which has become one of the most relevant in recent years. Method. The growing relevance and undoubted practical value became the reason for the emergence of a large number of software systems that allow the processing of speech signals on the basis of this method. However, each of these systems has significant differences in the interface provided by the processing tools, functions, has a number of advantages and disadvantages. At the moment, a large number of manuals and recommendations for specific software packages have been written, but these materials are fragmented and unsystematic. Result. This article attempts to systematize the theoretical material and describe the similarities and differences, advantages and disadvantages of the three most popular software systems: 1) MATLAB 6.0/6.1/6.5 Wavelet Toolbox 2/2.1/2.2; 2) Mathcad; 3) Wavelet Explorer of Mathematica. Conclusion. This article will be useful for specialists dealing with the problem of speech signal processing using the wavelet transform method, as it contains material that has practical value, and will allow to facilitate the work of a specialist related to the selection of the optimal for the implementation of a specific task of the software complex.

Keywords: speech signal processing, speech processing algorithms, wavelet transform theory, wavelet analysis of speech signals, software systems for speech signal processing

Введение. В последние годы стало очевидно, что традиционный аппарат представления произвольных функций и сигналов, в том числе речевых, в виде рядов Фурье (или фурье-представлений) оказывается малоэффективным для функций с локальными особенностями, в частности для импульсных и цифровых сигналов, получивших весьма широкое распространение. Это связано с тем, что базисная функция рядов Фурье представляет собой синусоиду, которая по своей природе является гладкой и строго периодической функцией. Как об этом давно говорили критики рядов Фурье, такая функция на практике (в условиях ограничения числа членов ряда или спектра разложения) принципиально не способна описывать произвольные сигналы и функции. Иными словами, ни один из известных методов представления сигналов и функций не мог считаться эффективным для представления импульсных, нестационарных сигналов.

Решением данной проблемы стало изобретение метода вейвлет-анализа. В первую очередь следует отметить, что вейвлеты по существу являются новыми математическими понятиями и объектами, в связи с этим они весьма перспективны в решении многих математических задач приближения (интерполяции, аппроксимации, регрессии и т. д.) функций и сигналов.

Постановка задачи. Вейвлет-обработка сигналов обеспечивает возможность весьма эффективного сжатия сигналов, в том числе и речевых, и их восстановления с малыми потерями информации, а также решение задач фильтрации сигналов. Таким образом, вейвлеты существенно пополняют набор традиционных средств обработки сигналов и изображений.

Методы исследования. Основные методы теории вейвлетов базируются на работах классиков математической науки: А.Н. Колмогорова, А. Лебега, А. Хаара, К. Шеннона. Значительный вклад в развитие теории вейвлет-преобразования в начале ХХ века внес А. Хаар, впервые наглядно показавший, что в приложении к практическим задачам вейвлеты во многом более удобны, нежели применявшиеся до этого преобразования Фурье.

Вейвлеты применялись на практике еще в 50-е годы прошлого века при фильтрации сигналов, но расцвет теории вейвлетов приходится на 80 - 90-е годы ХХ века. Именно в этот период были получены законченные теоретические результаты и разработаны эффективные методы их практического применения.

Конец ХХ века ознаменовался работами таких блестящих исследователей, как Гроссман, Гуппилауд и Морле, в 1982 г. сформулировавших основные идеи непрерывного вейвлет-преоб-разования. Нельзя не отметить вклад Ингрид Добеши, разработавшей в 1988 г. вейвлеты с компактным носителем. Ее монография «Десять лекций по вейвлетам» стала классической. Наибольшее внимание к данной теории было уделено в США.

До России информация о теории вейвлетов добралась с опозданием на 8 - 10 лет. В 1999 г. появились первые работы по теории вейвлетов на русском языке, в 2001 г. свет увидели переводы «Десяти лекций по вейвлетам» И. Добеши и «Введения в вейвлеты» Чарльза К. Чуи. Одним из первых русских ученых, заинтересовавшихся данной проблемой, стал С.Б. Стечкин. Он и его ученики стали работать над теорией вейвлетов, позже к ним присоединились математики из Петербурга и Новосибирска [1].

К основным достоинствам вейвлетов, ставших причиной их растущей популярности, как было отмечено выше, можно отнести их принципиальную возможность представлять нестационарные сигналы, например, состоящие из разных компонент, действующих в разные промежутки времени, модулированные сигналы и т.д. Такие сигналы в наше время находят куда более широкое применение, чем стационарные или квазистационарные (искусственно сводящиеся к стационарным) сигналы, а также процессы и системы, их порождающие. Как известно, ряды и преобразования Фурье в классическом виде принципиально непригодны для представления нестационарных сигналов, процессов и систем. Поэтому возможность их представления вейвлетами трудно переоценить.

В настоящее время существует огромное количество работ, посвященных теории вейвле-тов, написанных учеными из самых разных стран мира. Появились инструментальные средства по вейвлетам в системах Matlab, Mathcad и Mathematica, что, безусловно, упрощает прикладные расчеты. Таким образом, можно говорить о растущей популярности теории вейвлет-преобразо-ваний, о чем свидетельствует большое количество работ, посвященной этой теме.

Обсуждение результатов. Рассмотрим 3 наиболее популярных и актуальных на данный момент программных комплекса, которые целесообразно использовать в процессе анализа и обработки речевых сигналов, компрессии, очистке от шума или реконструкции в частности:

1) Пакет расширения систем MATLAB 6.0/6.1/6.5 Wavelet Toolbox 2/2.1/2.2;

2) Программный комплекс Mathcad;

3) Wavelet Explorer системы Mathematica.

Однако, несмотря на то, что каждый из данных программных комплексов, обладает широким функционалом для работы с речевыми сигналами, можно говорить о том, что они всё же имеют отличительные черты, а также обладают видимыми отличиями в инструментарии и визуальном оформлении. Рассмотрим каждый из перечисленных комплексов более подробно, отметим его основные особенности.

Несмотря на то, что существует немало работ и практических пособий, иллюстрирующих принципы работы данных программных комплексов, однако ни в одной из работ на данный момент не изложена кратко и четко специфика каждого из комплексов, а также его основные отличия. Именно поэтому, на наш взгляд, было необходимо провести анализ имеющейся литературы, касающейся проблемы вейвлет-преобразования, структурировать имеющийся материал и кратко изложить в рамках одной статьи основные особенности каждого из программных комплексов, с тем чтобы исследователь, целью которого является обработка речевого сигнала методом вейвлет-преобразования, смог выбрать наиболее оптимальный программный комплекс, исходя из удобства его интерфейса, функциональности и простоты использования..

Пакет расширения систем MATLAB 6.0/6.1/6.5 Wavelet Toolbox 2/2.1/2.2 —одно из новейших и мощных инструментальных средств для изучения, создания и применения вейвлетов и

проведения вейвлет-преобразований. Пакет представляет пользователю обширные и одновременно уникальные возможности для работы с вейвлетами, причем как в командном режиме, так и с помощью специальных средств графического интерфейса пользователя (GUI) данного пакета.

По обилию типов вейвлетов и функций для обработки сигналов, а также по числу весьма поучительных и наглядных примеров в фирменном описании этот пакет является лучшим среди пакетов расширения для СКМ в этой области (пакеты расширения по вейвлетам есть и в новых реализациях СКМ Mathcad и Mathematica) [1].

Пакет Wavelet Toolbox предоставляет:

• инструментальные средства для вейвлет-анализа и синтеза сигналов и изображений;

• множество уже встроенных вейвлетов разного типа, в том числе пакетных;

• возможность задания своего вейвлета с заданными свойствами;

• средства обработки сигналов и изображений;

• средства для непрерывного и дискретного вейвлет-анализа;

• средства очистки сигналов от шума и специальной обработки;

• средства обработки и компрессии сигналов изображений;

• мощные средства визуализации вейвлетов и всех операций с ними.

Указанные средства предоставляются как на уровне функций, выполняемых из командной строки или программных модулей, так и на уровне хорошо проработанного и удобного графического интерфейса пользователя (GUI). Продемонстрируем на конкретном примере возможности данного программного комплекса.

Рис. 1. показывает возможности вейвлет-обработки сигнала с шумом с помощью средств программного комплекса Wavelet Toolbox. Для обработки используются одномерные дискретные вейвлеты (wavemenu ► File. ► Wavelet 1-D) Сверху панели управления можно сменить тип вейвлета и с помощью кнопки анализа Analyze выполнить разложение для выбранного типа вейвлета.

fie £ а* v«e~ Ins«« Toot» Wndov» Qphon: Me *>

"ipiffww1 1 к 'ifT4IHI B^m^* 11 UM« ftirtl | ncuitMnt (I024| 1 | ».

llBBl 'HHWIF'V'WMi ДмЦм

В—— S4Mki | CoMptfii

iMovwi | Dt^oiM

В»Д 1,_ . . .1

H ШмД 1 '«о«У« Mode • j More Смс(аг Optant

WUFIPI ^'"H H' Щ HBflÉÉhjHbjmiJrfild E®

PlPlIF^HWir Mttfeuwjjta

штт 'llPf Million Hrïttf

КЪ СЫггл jJ J Л

Пкмо |

Рис. 1. Анализ и обработка речевого сигнала в программе Wavelet Toolbox Fig. 1. Analysis and processing of the speech signal in the program Wavelet Toolbox

Под кнопкой анализа расположены еще 4 важные кнопки:

— Statistics — вывод окна с данными статистики;

— Histograms — вывод окна с гистограммами;

— Comptess — вывод окна компрессии сигнала;

— De-noise — вывод окна очистки сигнала от шума.

Следует также обратить внимание на кнопку More Display Options (дополнительные параметры дисплея). Она открывает панель параметров дисплея, которая позволяет уточнить многочисленные настройки дисплея.

Щелчок мышью на кнопке De-noise открывает окно очистки сигналов от шума — рис. 2. Это окно во многом напоминает окно компрессии сигналов. И это естественно — как компрессия, так и очистка сигналов реализуются в сущности одними и теми же методами и подчас общими функциями.

В этом окне мы найдем все возможности и методы очистки сигналов от шума. Так, на рис. 2 установлен мягкий тип порога soft, при котором на передаточной характеристике имеется горизонтальная ступень. В окне можно найти выпадающий список типов шумового обрамления сигналов и ползунковые регуляторы для индивидуального задания порогов каждого из вейвлет-коэффициентов.

пшш

Рис. 2. Окно настройки очистки речевого сигнала от шума в режиме «Soft» Fig. 2. Window for setting up speech signal cleaning in the "Soft" mode

Итак, первый из программных комплексов, как было отмечено ранее, является наиболее полным в плане представления вейвлетов разных семейств, а значит представляет для пользователя возможность выбора оптимального для анализа данного речевого сигнала вейвлета, что значительно позволяет облегчить исследователю процесс анализа и обработки. Как известно, выбор оптимального вейвлета базируется на простом принципе: вейвлет должен по форме походить на структуру анализируемого речевого сигнала, иными словами, для каждого сигнала представляется целесообразным выбрать наиболее подходящий тип вейвлета [2]. А чем больше набор типов в том или ином программном комплексе, тем выше возможность выбора именно того типа вейвлета, который будет наиболее подходящим для конкретного анализируемого сигнала.

Итак, большой набор вейвлетов, представленных в данном программном комплексе, можно считать одним из основных его преимуществ.

Еще одним достоинством программного комплекса следует считать относительно простой и понятный для любого пользователя интерфейс. Структура интерфейса представляет собой окно с набором вкладок, переключающих режим работы с вейвлетом, а также расположенных справа кнопок, каждая из которых отвечает за ту или иную функцию преобразования вейвлета, таких, как декомпозиция, очистка от шума, компрессия и т.д. Иными словами, исследователь, имеющий конкретную цель работы с анализируемым сигналом, может нажатием той или кнопки осуществить требующуюся операцию и просмотреть результаты операции в том же окне на графиках, располагающихся слева и по центру рабочего экрана. При этом дополнительные сведения

о математическом представлении того или иного типа вейвлета в виде функции не требуются, что может значительно облегчить работу специалиста.

Обратимся к рассмотрению второго программного комплекса. Он, на наш взгляд, обладает более сложным интерфейсом и требует от специалиста особых навыков работы с ним. Так, основной особенностью данного комплекса является математическое представление вейвлетов в виде функций. Имея представление о специфике изображения речевых сигналов виде функций в зависимости от особенностей сигнала и выбранного типа вейвлета, пользователь имеет возможность произвести требующиеся операции по анализу и обработке речевых сигналов с использованием данного программного комплекса. Однако, та же сама особенность программы затрудняет или замедляет процесс ее использования менее квалифицированному пользователю.

Разработчики данного программного комплекса - системы Mathcad одними из первых ввели в нее средства для работы с вейвлетами. В ядре системы имеются всего две функции такого рода — для прямого и обратного вейвлет-преобразований с вейвлетами Добеши DB4. Остальные средства сосредоточены в пакетах расширения системы, которые поставляются отдельно и перед использованием нуждаются в обычной инсталляции их. Вместе с пакетами расширения инсталлируются и становятся доступными электронные книги по ним. Пакет расширения системы Mathcad для реализации численных расчетов Numeric Recipes содержит восемь функций для вейвлет-преобразований [3].

Рассмотрим особенности интерфейса системы на примере алгоритма очистки речевого сигнала от шума. Примером эффектной очистки реальных сигналов от шума является обработка данных с установки для исследования ядерно-магнитного резонанса (ЯМР). Данные ее работы представлены в векторе nmr. На графике (рис. 3.) отчетливо видна заметная шумовая компонента данных.

Рис. 3. Пример обработки данных от установки для исследования ядерно-магнитного резонанса Fig. 3. An example of data processing from the installation for the study of nuclear magnetic resonance

Рис. 4. Программный модуль функции Waveshrink Fig. 4. The program module of the Waveshrink function

С помощью функции Waveshrink (y,filter), использующей для фильтрации ограничения детализирующих коэффициентов в описываемом программном комплексе, можно существенно уменьшить уровень шумов, сохранив достаточно сложный характер сигнала от установки.

Более сложные методы обработки сигнала могут базироваться на адаптивных алгоритмах, предусматривающих выбор наилучшего базиса и отсечение части детализирующих коэффициентов в соответствии с особенностями сигнала. При этом возможно задание различных типов порогов для отсечения вейвлет-коэффициентов [4]. Они представлены на рис. 5. своими передаточными характеристиками._

Типы порогов для отсечения вейвлет-коэффициентов

&hard(K'c) := H < С'М »êpOO := TT ^softM := И < c,Ü,sign(x)-(|x| - с)]

x:= -1,-.S>9.. 1

1 W^OH-03 к 0 1_

л J л л л * ** г ф

# -# * л X л I1 J X " л л

1 -0.5 0 0.5 1

X

Рис. 5. Типы порогов для отсечения вейвлет-коэффициентов Fig. 5. Types of thresholds for cutting off Wavelet coefficients

Задание сложного сигнала bumps и его прлмое вейвлет-преобразование

чТ

bumps

.= (453 4 5 4.2 2.1 4.3 3.1 5.1 4.2)

Pbumps := С 1 13 .15 .23 .25 .4 .44 .05 .76 .78 .81)

^burnps

(.005 .005 .006 .01 .01 .03 .01 .01 .005 .OOS .005)

10

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

bumps(x) := ^

JÜ = 0

^burnps

JJ

1 +

|x PbuinpSjjl

'bump s

N := 1024 x. := .001 i

i := 0 . N - 1

y. := bumps^xj

Л /

Yi

2.5

1

л. { IJ Ii J L W rl

J := MaxDWTLeveli» 10

0.2 0.4

filter := coiflet^ö)

0.6

0.8 1 1.2 'Ьшчвз := dwt<y, J, filter)

limps.

-10

MLiltli 11 ■ Л "t л

fTpn fl 4 м 1 "1

200

400

600

800

1000

Рис. 6. Задание сложного сигнала и его вейвлет-преобразование Fig. 6. The task of a complex signal and its Wavelet transform

Таким образом, к достоинствам данного комплекса можно отнести математическое представление вейвлета и его трансформаций в виде функции, наглядно иллюстрирующих квалифицированному специалисту особенности проведенных с вейвлетом операций, эту же особенность можно считать одновременно и недостатком комплекса, если работать с ним требуется менее квалифицированному в некоторых областях специалисту. Помимо общей концепции организации и интерфейса программы в числе недостатков также более узкий набор вейвлетов, представленный исключительно вейвлетами семейства Добеши, по сравнению с выше проанализированным комплексом, предоставляющим широкий выбор типов вейвлетов.

Наконец, обратимся к рассмотрению третьего программного комплекса. Его главной особенностью является представление операций по обработке речевых сигналов в виде команд для командой строки. Данную особенность можно считать или достоинством, или недостатком программы, в зависимости от уровня подготовки специалиста, с ней работающего. Отметим, что существует большое число пособий, обучающих работе с данным программным комплексом, с конкретным описанием команд, необходимых для обработки того или иного речевого сигнала, что, на наш взгляд, не является существенным препятствием для использования данного программного комплекса.

Система компьютерной математики Mathematica 4/5 является мировым лидером среди систем символьной математики (компьютерной алгебры) и разделяет это лидерство с другой системой этого же класса Maple 8/9. Последние версии Mathematica 4 и особенно Mathematica 5 содержат значительно усовершенствованные алгоритмы численных вычислений, что сделало их подлинно универсальными математическими системами, одинаково пригодными для выполнения аналитических вычислений и численных расчетов.

Для систем Mathematica 4/4.1/5 разработано свыше двух десятков внешних пакетов расширения, среди которых видное место занимает пакет Wavelet Explorer, содержащий средства вейвлет-технологии обработки сигналов и изображений. Этот пакет выполнен как документ системы Mathematica и хранится в виде файла Wavelets.m в директории MathApps. После инсталляции пакета все его функции становятся определенными и доступными, а в справочной базе

данных формируется раздел, соответствующий этому пакету расширения и представляющий собой типичную электронную книгу c «живыми» примерами [5].

Рассмотрим специфику функционирования данного программного комплекса также на примере процесса очистки сигналов от шума. Как отмечалось ранее, технически она реализуется подобно операции компрессии — т.е. применением того или иного алгоритма удаления части вейвлет-коэффициентов. Эта операция основана на общеизвестном факте, что шумы имеют высокочастотные компоненты спектра, которые и удаляются при очистке сигналов от шума. Ниже иллюстрируется решение данной задачи в нескольких вариантах на базе данного программного комплекса.

В данном программном комплексе удобнее задавать алгоритмы работы с речевыми сигналами в виде команд, вводимых в командной строке. Покажем на конкретных примерах, какие программы отвечают за тот или иной процесс обработки сигнала.

Прежде всего, подготовим сигнал с шумом, подвергающийся в дальнейшем очистке. В состав пакета Wavelet Explorer входит файл shocknoi.dat с записью дискретных отсчетов зашум-ленного сигнала. Приведенные ниже команды считывают этот файл, создают массив data зашум-ленного сигнала и строят его график в виде графика функции и(х):

data = Get[ToFileName[{"Wavelets", "Data"},"shocknoi.dat"]];

ListPlot[data, PlotJoined -> True, AxesLabel -> {"x", "u(x)"}]

График обрабатываемого сигнала представлен на рис. 6.

Для очистки сигнала зададим сплайновый фильтр s4 порядка, выполним прямое вейвлет-преобразование массива data с компрессией на основе адаптируемого порога с начальным значением 1.5 и затем обратное преобразование. Все это реализуется приведенными ниже командами [6]:

(s4 = SplineFilter[4, 8]; wtdata = WaveletTransform[data, s4];)

Compress[Rest[wtdata]f 1.5, Shrinking -> True];

InverseWaveletTransform[Join[{wtdata[[1]]}, %], s4];

ListPlot[%, PlotJoined -> True, AxesLabel -> {"x", "u(x)")]

Очищенный от шума сигнал представлен на рис. 7. Нетрудно заметить, что шумовая компонента сигнала практически исчезла, а детальность сигнала осталась достаточно хорошей.

Рис. 7. График зашумленного сигнала Рис. 8. График сигнала, очищенного Fig. 7. Schedule noisy Figure от шума методом с адаптивным порогом

Fig. 8. Signal graph with adaptive threshold Noise-free signal

Таким образом, по нашему мнению, наиболее совершенным, полным в плане набора функций обработки речевых сигналов с использованием вейвлетов, а также наглядным и относительно простым в использовании можно считать первый программный комплекс.

Вывод. В заключении отметим, что имеющиеся пособия по обработке сигналов с использованием вейвлетов разного типа позволяют освоить функционал любой из вышеназванных программ. Однако, немаловажным фактором является сфера применения вейвлет-анализа речевого

сигнала. Так, если самоцелью анализа речевого сигнала является выявление его особенностей, которые можно изобразить в виде математической формулы или графика и оставить в таком виде, то использование второго и третьего программного комплекса является оптимальным.

Если же из вейвлет-анализа требуется извлечь дополнительную информацию, напрямую следующую из особенностей полученного изображения графика вейвлета, предпочтителен выбор программы с наиболее простым и понятным интерфейсом, позволяющим осуществить преобразования быстрее и проще, как в рамках первого программного комплекса. Например, если целью вейвлет-анализа речевого сигнала является идентификация личности говорящего, оценка его эмоционального состояния, оценка подлинности фонограммы (что требуется, например, в сфере судмедэкспертизы), на наш взгляд, целесообразнее воспользоваться первым программным комплексом для анализа и обработки сигнала с последующей его визуализацией и представлением его в виде сонограммы.

Библиографический список:

1. Малла С. Вейвлеты в обработке сигналов. - М: Мир. 2005. - С. 92-98.

2. Штарк Г. Применение вейвлетов для ЦОС. - М: Техносфера, 2007. - С. 78-81.

3. Смоленцев Н.К. Основы теории вейвлетов. Вейвлеты в MATLAB. - М.: ДМК-Пресс. - 2005. - С. 45-46.

4. Дьяконов В.П. Вейвлеты. - М: Солон-Р, 2010. - С. 32-36.

5. Дворянкин С.В., Клочкова Е.Н., Калужин Р.В. Маскирование речевых сообщений на основе современных компьютерных технологий. // М.: Специальная техника, 2001. - № 3. С. 92-94.

6. Дьяконов В.П. Вейвлеты. От теории к практике. - М.: СОЛОН-Р, 2002. - С. 18-28.

7. T. Aach. New criteria for shift variance and wide-sense cyclostationarity in multirate filter banks. In Proc. IEEE Int. Workshop on Spectral Methods and Multirate Signal Proc., pages 7-13, Florence, Italy, 2006.

8. T. Aach. Comparative analysis of shift variance and cyclostationarity in multirate filter banks. IEEE Trans. Circ. and Syst., 54(5):1077-1087, May 2007.

9. N. I. Akhiezer and I. M. Glazman. Theory of Linear Operators in Hilbert Spaces, volume 1. Frederick Ungar Publishing, 1966.

10. S. Akkarakaran and P. P. Vaidyanathan. Bifrequency and bispectrum maps: A new look at multirate systems with stochastic inputs. IEEE Trans. Signal Proc., 48(3):723-736, March 2000.

11. M. Antonini, M. Barlaud, P. Mathieu, and I. Daubechies. Image coding using wavelet transform. IEEE Trans. Image Proc., 1(2):205-220, April 1992.

12. P. Auscher. Wavelets: Mathematics and Applications, chapter Remarks on the local Fourier bases, pages 203-218. CRC Press, 1994

13. M. G. Bellanger and J. L. Daguet. TDM-FDM transmultiplexer: Digital polyphase and FFT. IEEE Trans. Commun., 22(9):1199-1204, September 1974.

14. J. J. Benedetto and M. C. Fickus. Finite normalized tight frames. Adv. Comp. Math., sp. iss. Frames, 18:357-385, 2003.

15. B. G. Bodmann, P. G. Casazza, and G. Kutyniok. A quantitative notion of redundancy for finite frames. In Journ. Appl. and Comput. Harmonic Analysis, 2010.

16. C. Herley and M. Vetterli. Biorthogonal bases of symmetric compactly supported wavelets. In M. Farge and et al., editors, Proc. Wavelets, Fractals and Fourier Transforms. Oxford Univ. Press, 1991.

17. C. Herley and M. Vetterli. Wavelets and recursive filter banks. IEEE Trans. Signal Proc., August 1993.

18. C. Herley and M. Vetterli. Orthogonal time-varying filter banks and wavelet packets. IEEE Trans. Signal Proc., 42(10):2650-2663, October 1994.

References:

1. Malla S. Veyvlety v obrabotke signalov. - M: Mir. 2005. - S. 92-98. [Malla S. Wavelets in signal processing. - M: Peace. 2005. pp. 92-98. (In Russ)]

2. Shtark G. Primeneniye veyvletov dlya TSOS. - M: Tekhnosfera, 2007. - S. 78-81. [Stark G. Application of wavelets for DSP. - M: Technosphere, 2007. - p. 78-81. (In Russ)]

3. Smolentsev N.K. Osnovy teorii veyvletov. Veyvlety v MATLAB. - M.: DMK-Press. - 2005. - S. 45-46. [Smo-lentsev N.K. Fundamentals of the theory of wavelets. Wavelets in matlab. - M .: DMK-Press. - 2005. - pp. 45-46. (In Russ)]

4. D'yakonov V.P. Veyvlety. - M: Solon-R, 2010. - S. 32-36. [Dyakonov V.P. Wavelets - M: Solon-R, 2010. - p. 3236. (In Russ)]

5. Dvoryankin S.V., Klochkova Ye.N., Kaluzhin R.V. Maskirovaniye rechevykh soobshche-niy na osnove sovremennykh komp'yuternykh tekhnologiy. // M.: Spetsial'naya tekhnika, 2001. - № 3. S. 92-94. [Dvoryankin S.V., Klochkova E.N., Kaluzhin R.V. Masking of speech communications on the basis of modern computer technologies. // M .: Special equipment, 2001. - № 3. S. 92-94. (In Russ)]

6. D'yakonov V.P. Veyvlety. Ot teorii k praktike. - M.: SOLON-R, 2002. - S. 18-28. [Dyakonov V.P. Wavelets From theory to practice. - M .: SOLON-R, 2002. - p. 18-28. (In Russ)]

7. T. Aach. New criteria for shift variance and wide-sense cyclostationarity in multirate filter banks. In Proc. IEEE Int. Workshop on Spectral Methods and Multirate Signal Proc., pages 7-13, Florence, Italy, 2006.

8. T. Aach. Comparative analysis of shift variance and cyclostationarity in multirate filter banks. IEEE Trans. Circ. and Syst., 54(5):1077-1087, May 2007.

9. N. I. Akhiezer and I. M. Glazman. Theory of Linear Operators in Hilbert Spaces, volume 1. Frederick Ungar Publishing, 1966.

10. S. Akkarakaran and P. P. Vaidyanathan. Bifrequency and bispectrum maps: A new look at multirate systems with stochastic inputs. IEEE Trans. Signal Proc., 48(3):723-736, March 2000.

11. M. Antonini, M. Barlaud, P. Mathieu, and I. Daubechies. Image coding using wavelet transform. IEEE Trans. Image Proc., 1(2):205-220, April 1992.

12. P. Auscher. Wavelets: Mathematics and Applications, chapter Remarks on the local Fourier bases, pages 203-218. CRC Press, 1994

13. M. G. Bellanger and J. L. Daguet. TDM-FDM transmultiplexer: Digital polyphase and FFT. IEEE Trans. Commun., 22(9):1199-1204, September 1974.

14. J. J. Benedetto and M. C. Fickus. Finite normalized tight frames. Adv. Comp. Math., sp. iss. Frames, 18:357-385, 2003.

15. B. G. Bodmann, P. G. Casazza, and G. Kutyniok. A quantitative notion of redundancy for finite frames. In Journ. Appl. and Comput. Harmonic Analysis, 2010.

16. C. Herley and M. Vetterli. Biorthogonal bases of symmetric compactly supported wavelets. In M. Farge and et al., editors, Proc. Wavelets, Fractals and Fourier Transforms. Oxford Univ. Press, 1991.

17. C. Herley and M. Vetterli. Wavelets and recursive filter banks. IEEE Trans. Signal Proc., August 1993.

18. C. Herley and M. Vetterli. Orthogonal time-varying filter banks and wavelet packets. IEEE Trans. Signal Proc., 42(10):2650-2663, October 1994.

Сведения об авторах:

Довгаль Виктор Митрофанович - доктор технических наук, профессор, кафедра программного обеспечения и администрирования информационных систем.

Хеин Мин Зо - аспирант, кафедра программного обеспечения и администрирования информационных систем.

Information about the authors.

Victor M. Dovgal - Dr. Sci. (Technical), Prof., Software department and administration information systems.

Hein Min Zoh - Graduate student, Software department and administration information systems.

Конфликт интересов. Conflict of interest.

Авторы заявляют об отсутствии конфликта интересов. The authors declare no conflict of interest.

Поступила в редакцию 23.07.2018. Received 23.07.2018.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Принята в печать 01.09.2018. Accepted for publication 01.09.2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.