Научная статья на тему 'Применение нейро-нечеткой технологии ANFIS в задачах фильтрации звуковых сигналов'

Применение нейро-нечеткой технологии ANFIS в задачах фильтрации звуковых сигналов Текст научной статьи по специальности «Кибернетика»

1158
132
Поделиться

Похожие темы научных работ по кибернетике , автор научной работы — Метан Г.Н.,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Текст научной работы на тему «Применение нейро-нечеткой технологии ANFIS в задачах фильтрации звуковых сигналов»

- диагностика психофизического потенциала пациента;

- профессиональный отбор;

- ;

- регистрация измененных состояний сознания.

Исследования различных жидкостей, веществ и материалов:

- ;

- ;

- энергетические свойства растений, камней и минералов.

В настоящее время разработан ряд модификаций программно-аппаратных комплексов для исследования параметров газоразрядного свечения объектов раз. -Петербургских клиниках обследовано более 2000 пациентов. Работы ведутся на базе СПб гос. Института Точной Механики и Оптики, Института Биохимии АН РФ, СПб гос. Медицинского Университета им. ИЛ. Павлова, СПб Военно-, , ,

, .

УДК 621.3.06

Г.Н. Метан

ПРИМЕНЕНИЕ НЕЙРО-НЕЧЕТКОЙ ТЕХНОЛОГИИ ЛЭТК В ЗАДАЧАХ ФИЛЬТРАЦИИ ЗВУКОВЫХ СИГНАЛОВ*

.

(пластинка, магнитная лента) к цифровым (компакт-диск и др.), а также эволюция , -вой реставрации звука - восстановлении старых записей и переиздании их на современных носителях. Основная работа реставратора - подавление шипения и щелчков и (по возможности) восстановление исходного звука. В данной работе под фильтрацией подразумевается подавление шумов, т.е. задача реставрации решается только в первой ее части.

Сегодня широко распространены средства реставрации на базе метода спектрального анализа (основной алгоритм - быстрое дискретное преобразование Фу). -( ), конкретного поступающего сигнала в два этапа:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

а) распознавание сигнала (с помощью аппарата нейросетей);

б) реакция на сигнал по нечетким правилам, заложенным разработчиком. Дальнейшая эволюция средств реставрации должна привести, на наш взгляд,

к появлению в будущем активных цифровых средств (программных агентов). Это ,

использованием определенной стратегии и опирающиеся на гибридные интеллектуальные технологии [Тарасов, 2001]. Такие устройства уже нельзя будет отнести собственно к фильтрам, скорее их можно назвать автоматизированными системами

*Работа выполнена при финансовой поддержке РФФИ по совместному гранту РФФИ-БРФФИ, проект № 02-01-81037

нелинейного звукового монтажа, способными при необходимости работать в автономном режиме (без участия человека).

1. Обоснование необходимости разработки новых средств шумоподавления. Теоретической основой фильтров, реализованных программным путем в составе звуковых редакторов, служит спектральный анализ. Этот подход развивается уже более 50 лет и является классическим. Здесь алгоритмическую основу форми-

( ). -

- . -жат продукты фирм Steinberg (www.steinberg.de), Sonic Foundry (www.sonicfoundry.com), difitec (www.difitec.de) и множество дополнительно подключаемых звуковых модулей третьих фирм.

, , -сматривается с точки зрения электротехники, а его обработка проводится с помо-

( ). -пе не могут содержать знания об элементарных свойствах звука, в частности, волновой природе звука, тембре, гармониках и пр. Поэтому их эффективность в решении задачи подавления шумов весьма ограничена. А ведь есть и более сложные задачи. К тому же такие средства принципиально не дают возможность осуществлять автоматизацию деятельности человека. Применение спектрального анализа требует аккуратной настройки множества параметров в зависимости от конкретной задачи и специфики анализируемых сигналов, а для правильной интерпретации результатов нужен некоторый практический опыт.

В работе предложен новый нейро-нечеткий подход к реставрации звуков, опирающийся на современные достижения искусственного интеллекта и направленный на повышение эффективности фильтрации.

2. Основы нейро-нечеткого подхода. Ключевым преимуществом нечеткой логики является ее способность описывать желаемое поведение системы простыми «если-то»-правилами [Заде, 1976]. При этом можно использовать все доступные инженерные ноу-хау, для непосредственного улучшения системы. Во многих приложениях это дает более простое решение за меньшее время. Однако, во многих

, , , -. « - »-

вручную. Большие объемы данных требуют больших вычислений. В этом случае хорошо подходит методология нейронных сетей, которые обучаются на наборах .

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для объединения сильных сторон обоих подходов создаются гибридные методологии и соответствующие инструментальные системы. Одну из них - ANFIS (Adaptive Network Based Fuzzy Inference System) [Ярушкина, 2001] - мы взяли на вооружение. В новой постановке задачи речь идет о создании адаптивного фильтра, который сначала обучается распознавать звуковой образ шума, а затем, получая на вход смесь полезного сигнала и шума, распознает шум и вычитает его (здесь используются операции нечеткой арифметики [Дюбуа и Прад, 1990]).

Общая методика создания нейро-нечетких моделей включает следующие шаги:

1) .

, .

2) .

, .

3) . -

,

должны изменяться правила и функции принадлежности.

4) Собственно обучение.

5) Оптимизация и проверка.

3. Алгоритм обучения. Обучение нейронной сети производится методом обратного распространения ошибки. Это наиболее известный метод обучения многослойной нейросети без обратных связей. Он является итеративным градиентным алгоритмом. Его суть - распространение сигналов ошибки от выходов нейронной сети к ее входам в направлении, обратном прямому распространению сигналов в обычном режиме работы [Короткий, 2000]. При обучении ставится задача минимизации ошибки нейронной сети, которая определяется методом наименьших квадратов. Для сети с одним выходом (как в нашем случае) ошибка определяется соот-:

Е -^)2, (1)

2 м

где у; - значение выхода нейросети для каждого компонента входного вектора (дискретных звуковых отсчетов в нашем случае), а ^ - желаемое значение вы.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Полный алгоритм обучения нейронной сети с помощью процедуры обратного распространения строится так:

1)

функционирования нейронной сети, когда сигналы распространяются от входов к выходам, рассчитать значения последних. Напомним, что выход нейросети рассчитывается по формуле

м

= Е у!" ■ К'- (2)

I=0

где М - число нейронов в слое п-1 с учетом нейрона с постоянным выходным состоянием +1, задающего смещение;

у;(п-1)=Ху(п) - ьй вход нейрона >го слоя п;

у^п) = ^(п)), где Ю - функция активации нейрона;

уч(0)=1ч, где 1ч - компонента вектора входного образа;

2) для выходного слоя (слоя N

8(( ы) = — ■ ^ = (у\^ - й,) ■ ^. (3)

дуг ^ Ж,

3) Рассчитать изменения весов Дw(N) слоя N.

Д»(") = -ц^\") ■ уг("-1), (4)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

У ] ~ ‘

где П - коэффициент скорости обучения, 0<П<1.

4) Рассчитать по формулам (3) и (4) соответственно $п> и Д\4п) для всех остальных слоев, п = N-1,...,!.

5)

-1) + Д»(?(1), (5)

где I - номер текущей итерации, п - номер слоя.

6) -тигло заданного предела, то перейти к шагу 1. В противном случае - конец.

4. Описание э ксперимента. В нашей работе адаптивный фильтр был построен на основе нейронечеткой архитектуры ANFIS с использованием модуля Fuzzy Logic Toolbox в среде MATLAB 6.1. Для построения графиков использованы команды из Signal Processing Toolbox.

Порядок обработки звука таким фильтром следующий:

1) Подготовить в виде файла исходный материал.

2) Выбрать тип удаляемого шума: шипение или щелчки.

3) Обучить фильтр на небольшом (0.1..0.5 сек) участке.

4) Подать на вход фильтра весь исходный материал.

5) Результат записать в новый файл (при необходимости контроля прослу-

).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

На первом этапе исследования для выбранного типа полезного сигнала и шума выявлялось, как влияет изменение структуры и параметров простого адаптивного фильтра, построенного по гибридной методологии ANFIS, на качество фильтрации. Ключевые особенности: шкала времени - дискретная, шкала значений - не.

источнике шума и структуре ANFIS. Новый тип полезного сигнала - волновой пакет. Ключевые особенности: сигнал ограничен во времени и по частоте. Ниже рассмотрим подробнее формулировку задачи.

. x0 -

вале времени от 0 до 6 секунд с частотой дискретизации Fs 1000 Гц. По теореме Котельникова, максимально возможная частота - Fs/2, т.е. 500 Гц. Таким образом, 6 0,5 20 .

- ( ). -димостью определить эффективность фильтрации в широком диапазоне частот.

Пусть также имеется источник шума: псевдослучайные числа с нормальным распределением. Такой шум называется широкополосным или белым. Параметры

: - 0, -

- 1.

n1 = randn(time). (6)

Шум накладывается на источник по сложному нелинейному закону:

n2 = 4 • sin(n1d0 )• n1d 1 , (7)

1 + n1d 12

где: n1d0 - сигнал в момент времени i, n1d1 - сигнал в момент времени i-1 ( ).

( ) :

m = x0 + n2. (8)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Этот сигнал поступает на вход адаптивного фильтра на основе ANFIS. Будем полагать, что полезный сигнал n2 "загрязнен" сигналом x0. Иными словами, на входе ANFIS имеем сигнал n1, а на выходе - сигнал m. Обучение ставит целью научить ANFIS воспроизводить функцию n2(n1). Тогда предполагаемый вид сигнала xf можно получить из соотношения (8):

Xf = m — n2(n1)f, (9)

где n2(n1)f - предполагаемый вид сигнала ошибки - результат обучения

нейро-нечеткой модели (предполагается, что порядок нелинейности сигнала шума известен и составляет 2).

Создаем модель ANFIS с двумя входами для n1d0 и n1d1 соответственно (рис.1). На каждый вход назначаются по две колоколообразные функции принадлежности.

Рис.1.Структура модели ANFIS

Обучение производится по алгоритму обратного распространения ошибки. Параметры этого алгоритма: количество эпох (итераций алгоритма) - 10; целевая функция - минимизация ошибки. Начальный размер шага обучения установим равным 0.2.

Теперь можно начинать фильтрацию сигнала. Результат выполнения фильтрации обученным фильтром приведен на рис.2 и 3. Самый лучший способ определить эффективность алгоритма шумоподавления - это прослушать результаты. За отсутствием такой возможности приводятся результаты, полученные двумя способами, общепринятыми в сфере анализа электроакустических сигналов: временное представление и периодограмма. Можно предоставить файлы формата wav в ответ на запрос по электронной почте, а также исходники программ MATLAB.

При увеличении начального шага обучения до 0.5 улучшений не произошло. Увеличение периодов обучения с 10 до 30 привело к некоторому улучшению качества распознавания (но и к увеличению времени). Оставив число периодов обучения 10, увеличим количество функций принадлежности на каждый вход с 2 до 4. Полученный результат лучше предыдущего и гораздо лучше первоначального. Од-

12 220 .

0 1 2 3 4 5 6

Seconds

Рис.2. Сигналы: входной (m) [0..3 c], выходной (x) [3..6 c]

Рис.3. Спектральная плотность мощности сигналов в зависимости от частоты (периодограмма)

Второй этап. Короткий синусо идальный импульс, модулированный функцией Г аусса (частота дискретизации - 44100 Г ц, амплитуда - 1, основная частота - 50 Г ц, полоса пропускания - 50%, усечение происходит ниже 40 дБ), загрязнен тем же типом шума. После обучения фильтра и фильтрации сигнала, амплитуда шума уменьшилась на =10 дБ, что видно на рис.4 и 5.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1.5 I---[-----1-----1-----1----1-----1-----1-----1----1-----

-0.05 -0.04 -0.03 -0.02 -0.01 0 0.01 0.02 0.03 0.04 0.05

ЭесопЬэ

Рис.4. Сигналы: входной (ш) [-0.05..0 с], выходной (х) [0..+0.05 с]

Periodogram PSD Estimate

Рис.5. Спектральная плотность мощности сигналов в зависимости от частоты (периодогра.мма)

Заключение. Фильтр действительно является адаптивным, поскольку обучается на каждом подаваемом сигнале. Для обоих случаев тестового сигнала видно, что фильтр значительно приближает сигнал к оригиналу, а также существенно уменьшает разброс значений. Эффективность фильтрации зависит от качества обучения, которое напрямую связано с вычислительными затратами. Процедура обучения занимает 96% общего времени, т.е. обучение требует на порядок больше времени, чем режим исполнения (фильтрации). Всего на обработку фрагмента размером 6000 отсчетов тратилось 12±2 секунд процессорного времени на компьютере с процессором Intel Pentium II и частотой 233 МГ ц. Обучение на длинных фраг-,

затраты времени вырастают до неприемлемых значений. Лучше обучать на небольшом фрагменте 5..10 секунд), а затем проводить нечеткие вычисления на полноразмерном фрагменте (любой длины - вплоть до нескольких часов). Однако, установление приемлемого компромисса между качеством обучения и количеством затраченного времени остается прерогативой исследователя. Низкая производительность обусловлена применением интерпретируемых программ MATLAB. При использовании оптимизированных библиотек (например, Intel Signal Processing Library и Recognition Primitives Library) или решений на основе DSP возможна обработка в реальном времени.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Дюбуа Д., Прад А. Теория возможностей. Приложения к представлению знаний в информатике: Пер. с франц. М.: Радио и связь, 1990.

2. . -женных решений: Пер. с англ. М.: Мир, 1976.

3. Короткий СТ. Нейронные сети: алгоритм обратного распространения // BYTE Россия.

2000. №21. С.26-29.

4. Тарасов В.Б Синергетические проблемы в искусственном интеллекте // Труды Международной научно-практической конференции «Знание - диалог - решение». Т.2 (KDS-

2001, Санкт-Петербург, 19-22 июня 2001 г.). СПб: Лань, 2001. С.594-602.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Ярушкина Н.Г. Нечеткие нейронные сети. 4.1 // Новости ИИ. 2001. №2-3. С.47-51.