Научная статья на тему 'Применение нейро-нечеткой технологии ANFIS в задачах фильтрации звуковых сигналов'

Применение нейро-нечеткой технологии ANFIS в задачах фильтрации звуковых сигналов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
6228
564
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Применение нейро-нечеткой технологии ANFIS в задачах фильтрации звуковых сигналов»

- диагностика психофизического потенциала пациента;

- профессиональный отбор;

- ;

- регистрация измененных состояний сознания.

Исследования различных жидкостей, веществ и материалов:

- ;

- ;

- энергетические свойства растений, камней и минералов.

В настоящее время разработан ряд модификаций программно-аппаратных комплексов для исследования параметров газоразрядного свечения объектов раз. -Петербургских клиниках обследовано более 2000 пациентов. Работы ведутся на базе СПб гос. Института Точной Механики и Оптики, Института Биохимии АН РФ, СПб гос. Медицинского Университета им. ИЛ. Павлова, СПб Военно-, , ,

, .

УДК 621.3.06

Г.Н. Метан

ПРИМЕНЕНИЕ НЕЙРО-НЕЧЕТКОЙ ТЕХНОЛОГИИ ЛЭТК В ЗАДАЧАХ ФИЛЬТРАЦИИ ЗВУКОВЫХ СИГНАЛОВ*

.

(пластинка, магнитная лента) к цифровым (компакт-диск и др.), а также эволюция , -вой реставрации звука - восстановлении старых записей и переиздании их на современных носителях. Основная работа реставратора - подавление шипения и щелчков и (по возможности) восстановление исходного звука. В данной работе под фильтрацией подразумевается подавление шумов, т.е. задача реставрации решается только в первой ее части.

Сегодня широко распространены средства реставрации на базе метода спектрального анализа (основной алгоритм - быстрое дискретное преобразование Фу). -( ), конкретного поступающего сигнала в два этапа:

а) распознавание сигнала (с помощью аппарата нейросетей);

б) реакция на сигнал по нечетким правилам, заложенным разработчиком. Дальнейшая эволюция средств реставрации должна привести, на наш взгляд,

к появлению в будущем активных цифровых средств (программных агентов). Это ,

использованием определенной стратегии и опирающиеся на гибридные интеллектуальные технологии [Тарасов, 2001]. Такие устройства уже нельзя будет отнести собственно к фильтрам, скорее их можно назвать автоматизированными системами

*Работа выполнена при финансовой поддержке РФФИ по совместному гранту РФФИ-БРФФИ, проект № 02-01-81037

нелинейного звукового монтажа, способными при необходимости работать в автономном режиме (без участия человека).

1. Обоснование необходимости разработки новых средств шумоподавления. Теоретической основой фильтров, реализованных программным путем в составе звуковых редакторов, служит спектральный анализ. Этот подход развивается уже более 50 лет и является классическим. Здесь алгоритмическую основу форми-

( ). -

- . -жат продукты фирм Steinberg (www.steinberg.de), Sonic Foundry (www.sonicfoundry.com), difitec (www.difitec.de) и множество дополнительно подключаемых звуковых модулей третьих фирм.

, , -сматривается с точки зрения электротехники, а его обработка проводится с помо-

( ). -пе не могут содержать знания об элементарных свойствах звука, в частности, волновой природе звука, тембре, гармониках и пр. Поэтому их эффективность в решении задачи подавления шумов весьма ограничена. А ведь есть и более сложные задачи. К тому же такие средства принципиально не дают возможность осуществлять автоматизацию деятельности человека. Применение спектрального анализа требует аккуратной настройки множества параметров в зависимости от конкретной задачи и специфики анализируемых сигналов, а для правильной интерпретации результатов нужен некоторый практический опыт.

В работе предложен новый нейро-нечеткий подход к реставрации звуков, опирающийся на современные достижения искусственного интеллекта и направленный на повышение эффективности фильтрации.

2. Основы нейро-нечеткого подхода. Ключевым преимуществом нечеткой логики является ее способность описывать желаемое поведение системы простыми «если-то»-правилами [Заде, 1976]. При этом можно использовать все доступные инженерные ноу-хау, для непосредственного улучшения системы. Во многих приложениях это дает более простое решение за меньшее время. Однако, во многих

, , , -. « - »-

вручную. Большие объемы данных требуют больших вычислений. В этом случае хорошо подходит методология нейронных сетей, которые обучаются на наборах .

Для объединения сильных сторон обоих подходов создаются гибридные методологии и соответствующие инструментальные системы. Одну из них - ANFIS (Adaptive Network Based Fuzzy Inference System) [Ярушкина, 2001] - мы взяли на вооружение. В новой постановке задачи речь идет о создании адаптивного фильтра, который сначала обучается распознавать звуковой образ шума, а затем, получая на вход смесь полезного сигнала и шума, распознает шум и вычитает его (здесь используются операции нечеткой арифметики [Дюбуа и Прад, 1990]).

Общая методика создания нейро-нечетких моделей включает следующие шаги:

1) .

, .

2) .

, .

3) . -

,

должны изменяться правила и функции принадлежности.

4) Собственно обучение.

5) Оптимизация и проверка.

3. Алгоритм обучения. Обучение нейронной сети производится методом обратного распространения ошибки. Это наиболее известный метод обучения многослойной нейросети без обратных связей. Он является итеративным градиентным алгоритмом. Его суть - распространение сигналов ошибки от выходов нейронной сети к ее входам в направлении, обратном прямому распространению сигналов в обычном режиме работы [Короткий, 2000]. При обучении ставится задача минимизации ошибки нейронной сети, которая определяется методом наименьших квадратов. Для сети с одним выходом (как в нашем случае) ошибка определяется соот-:

Е -^)2, (1)

2 м

где у; - значение выхода нейросети для каждого компонента входного вектора (дискретных звуковых отсчетов в нашем случае), а ^ - желаемое значение вы.

Полный алгоритм обучения нейронной сети с помощью процедуры обратного распространения строится так:

1)

функционирования нейронной сети, когда сигналы распространяются от входов к выходам, рассчитать значения последних. Напомним, что выход нейросети рассчитывается по формуле

м

= Е у!" ■ К'- (2)

I=0

где М - число нейронов в слое п-1 с учетом нейрона с постоянным выходным состоянием +1, задающего смещение;

у;(п-1)=Ху(п) - ьй вход нейрона >го слоя п;

у^п) = ^(п)), где Ю - функция активации нейрона;

уч(0)=1ч, где 1ч - компонента вектора входного образа;

2) для выходного слоя (слоя N

8(( ы) = — ■ ^ = (у\^ - й,) ■ ^. (3)

дуг ^ Ж,

3) Рассчитать изменения весов Дw(N) слоя N.

Д»(") = -ц^\") ■ уг("-1), (4)

У ] ~ ‘

где П - коэффициент скорости обучения, 0<П<1.

4) Рассчитать по формулам (3) и (4) соответственно $п> и Д\4п) для всех остальных слоев, п = N-1,...,!.

5)

-1) + Д»(?(1), (5)

где I - номер текущей итерации, п - номер слоя.

6) -тигло заданного предела, то перейти к шагу 1. В противном случае - конец.

4. Описание э ксперимента. В нашей работе адаптивный фильтр был построен на основе нейронечеткой архитектуры ANFIS с использованием модуля Fuzzy Logic Toolbox в среде MATLAB 6.1. Для построения графиков использованы команды из Signal Processing Toolbox.

Порядок обработки звука таким фильтром следующий:

1) Подготовить в виде файла исходный материал.

2) Выбрать тип удаляемого шума: шипение или щелчки.

3) Обучить фильтр на небольшом (0.1..0.5 сек) участке.

4) Подать на вход фильтра весь исходный материал.

5) Результат записать в новый файл (при необходимости контроля прослу-

).

На первом этапе исследования для выбранного типа полезного сигнала и шума выявлялось, как влияет изменение структуры и параметров простого адаптивного фильтра, построенного по гибридной методологии ANFIS, на качество фильтрации. Ключевые особенности: шкала времени - дискретная, шкала значений - не.

источнике шума и структуре ANFIS. Новый тип полезного сигнала - волновой пакет. Ключевые особенности: сигнал ограничен во времени и по частоте. Ниже рассмотрим подробнее формулировку задачи.

. x0 -

вале времени от 0 до 6 секунд с частотой дискретизации Fs 1000 Гц. По теореме Котельникова, максимально возможная частота - Fs/2, т.е. 500 Гц. Таким образом, 6 0,5 20 .

- ( ). -димостью определить эффективность фильтрации в широком диапазоне частот.

Пусть также имеется источник шума: псевдослучайные числа с нормальным распределением. Такой шум называется широкополосным или белым. Параметры

: - 0, -

- 1.

n1 = randn(time). (6)

Шум накладывается на источник по сложному нелинейному закону:

n2 = 4 • sin(n1d0 )• n1d 1 , (7)

1 + n1d 12

где: n1d0 - сигнал в момент времени i, n1d1 - сигнал в момент времени i-1 ( ).

( ) :

m = x0 + n2. (8)

Этот сигнал поступает на вход адаптивного фильтра на основе ANFIS. Будем полагать, что полезный сигнал n2 "загрязнен" сигналом x0. Иными словами, на входе ANFIS имеем сигнал n1, а на выходе - сигнал m. Обучение ставит целью научить ANFIS воспроизводить функцию n2(n1). Тогда предполагаемый вид сигнала xf можно получить из соотношения (8):

Xf = m — n2(n1)f, (9)

где n2(n1)f - предполагаемый вид сигнала ошибки - результат обучения

нейро-нечеткой модели (предполагается, что порядок нелинейности сигнала шума известен и составляет 2).

Создаем модель ANFIS с двумя входами для n1d0 и n1d1 соответственно (рис.1). На каждый вход назначаются по две колоколообразные функции принадлежности.

Рис.1.Структура модели ANFIS

Обучение производится по алгоритму обратного распространения ошибки. Параметры этого алгоритма: количество эпох (итераций алгоритма) - 10; целевая функция - минимизация ошибки. Начальный размер шага обучения установим равным 0.2.

Теперь можно начинать фильтрацию сигнала. Результат выполнения фильтрации обученным фильтром приведен на рис.2 и 3. Самый лучший способ определить эффективность алгоритма шумоподавления - это прослушать результаты. За отсутствием такой возможности приводятся результаты, полученные двумя способами, общепринятыми в сфере анализа электроакустических сигналов: временное представление и периодограмма. Можно предоставить файлы формата wav в ответ на запрос по электронной почте, а также исходники программ MATLAB.

При увеличении начального шага обучения до 0.5 улучшений не произошло. Увеличение периодов обучения с 10 до 30 привело к некоторому улучшению качества распознавания (но и к увеличению времени). Оставив число периодов обучения 10, увеличим количество функций принадлежности на каждый вход с 2 до 4. Полученный результат лучше предыдущего и гораздо лучше первоначального. Од-

12 220 .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0 1 2 3 4 5 6

Seconds

Рис.2. Сигналы: входной (m) [0..3 c], выходной (x) [3..6 c]

Рис.3. Спектральная плотность мощности сигналов в зависимости от частоты (периодограмма)

Второй этап. Короткий синусо идальный импульс, модулированный функцией Г аусса (частота дискретизации - 44100 Г ц, амплитуда - 1, основная частота - 50 Г ц, полоса пропускания - 50%, усечение происходит ниже 40 дБ), загрязнен тем же типом шума. После обучения фильтра и фильтрации сигнала, амплитуда шума уменьшилась на =10 дБ, что видно на рис.4 и 5.

1.5 I---[-----1-----1-----1----1-----1-----1-----1----1-----

-0.05 -0.04 -0.03 -0.02 -0.01 0 0.01 0.02 0.03 0.04 0.05

ЭесопЬэ

Рис.4. Сигналы: входной (ш) [-0.05..0 с], выходной (х) [0..+0.05 с]

Periodogram PSD Estimate

Рис.5. Спектральная плотность мощности сигналов в зависимости от частоты (периодогра.мма)

Заключение. Фильтр действительно является адаптивным, поскольку обучается на каждом подаваемом сигнале. Для обоих случаев тестового сигнала видно, что фильтр значительно приближает сигнал к оригиналу, а также существенно уменьшает разброс значений. Эффективность фильтрации зависит от качества обучения, которое напрямую связано с вычислительными затратами. Процедура обучения занимает 96% общего времени, т.е. обучение требует на порядок больше времени, чем режим исполнения (фильтрации). Всего на обработку фрагмента размером 6000 отсчетов тратилось 12±2 секунд процессорного времени на компьютере с процессором Intel Pentium II и частотой 233 МГ ц. Обучение на длинных фраг-,

затраты времени вырастают до неприемлемых значений. Лучше обучать на небольшом фрагменте 5..10 секунд), а затем проводить нечеткие вычисления на полноразмерном фрагменте (любой длины - вплоть до нескольких часов). Однако, установление приемлемого компромисса между качеством обучения и количеством затраченного времени остается прерогативой исследователя. Низкая производительность обусловлена применением интерпретируемых программ MATLAB. При использовании оптимизированных библиотек (например, Intel Signal Processing Library и Recognition Primitives Library) или решений на основе DSP возможна обработка в реальном времени.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Дюбуа Д., Прад А. Теория возможностей. Приложения к представлению знаний в информатике: Пер. с франц. М.: Радио и связь, 1990.

2. . -женных решений: Пер. с англ. М.: Мир, 1976.

3. Короткий СТ. Нейронные сети: алгоритм обратного распространения // BYTE Россия.

2000. №21. С.26-29.

4. Тарасов В.Б Синергетические проблемы в искусственном интеллекте // Труды Международной научно-практической конференции «Знание - диалог - решение». Т.2 (KDS-

2001, Санкт-Петербург, 19-22 июня 2001 г.). СПб: Лань, 2001. С.594-602.

5. Ярушкина Н.Г. Нечеткие нейронные сети. 4.1 // Новости ИИ. 2001. №2-3. С.47-51.

i Надоели баннеры? Вы всегда можете отключить рекламу.