- диагностика психофизического потенциала пациента;
- профессиональный отбор;
- ;
- регистрация измененных состояний сознания.
Исследования различных жидкостей, веществ и материалов:
- ;
- ;
- энергетические свойства растений, камней и минералов.
В настоящее время разработан ряд модификаций программно-аппаратных комплексов для исследования параметров газоразрядного свечения объектов раз. -Петербургских клиниках обследовано более 2000 пациентов. Работы ведутся на базе СПб гос. Института Точной Механики и Оптики, Института Биохимии АН РФ, СПб гос. Медицинского Университета им. ИЛ. Павлова, СПб Военно-, , ,
, .
УДК 621.3.06
Г.Н. Метан
ПРИМЕНЕНИЕ НЕЙРО-НЕЧЕТКОЙ ТЕХНОЛОГИИ ЛЭТК В ЗАДАЧАХ ФИЛЬТРАЦИИ ЗВУКОВЫХ СИГНАЛОВ*
.
(пластинка, магнитная лента) к цифровым (компакт-диск и др.), а также эволюция , -вой реставрации звука - восстановлении старых записей и переиздании их на современных носителях. Основная работа реставратора - подавление шипения и щелчков и (по возможности) восстановление исходного звука. В данной работе под фильтрацией подразумевается подавление шумов, т.е. задача реставрации решается только в первой ее части.
Сегодня широко распространены средства реставрации на базе метода спектрального анализа (основной алгоритм - быстрое дискретное преобразование Фу). -( ), конкретного поступающего сигнала в два этапа:
а) распознавание сигнала (с помощью аппарата нейросетей);
б) реакция на сигнал по нечетким правилам, заложенным разработчиком. Дальнейшая эволюция средств реставрации должна привести, на наш взгляд,
к появлению в будущем активных цифровых средств (программных агентов). Это ,
использованием определенной стратегии и опирающиеся на гибридные интеллектуальные технологии [Тарасов, 2001]. Такие устройства уже нельзя будет отнести собственно к фильтрам, скорее их можно назвать автоматизированными системами
*Работа выполнена при финансовой поддержке РФФИ по совместному гранту РФФИ-БРФФИ, проект № 02-01-81037
нелинейного звукового монтажа, способными при необходимости работать в автономном режиме (без участия человека).
1. Обоснование необходимости разработки новых средств шумоподавления. Теоретической основой фильтров, реализованных программным путем в составе звуковых редакторов, служит спектральный анализ. Этот подход развивается уже более 50 лет и является классическим. Здесь алгоритмическую основу форми-
( ). -
- . -жат продукты фирм Steinberg (www.steinberg.de), Sonic Foundry (www.sonicfoundry.com), difitec (www.difitec.de) и множество дополнительно подключаемых звуковых модулей третьих фирм.
, , -сматривается с точки зрения электротехники, а его обработка проводится с помо-
( ). -пе не могут содержать знания об элементарных свойствах звука, в частности, волновой природе звука, тембре, гармониках и пр. Поэтому их эффективность в решении задачи подавления шумов весьма ограничена. А ведь есть и более сложные задачи. К тому же такие средства принципиально не дают возможность осуществлять автоматизацию деятельности человека. Применение спектрального анализа требует аккуратной настройки множества параметров в зависимости от конкретной задачи и специфики анализируемых сигналов, а для правильной интерпретации результатов нужен некоторый практический опыт.
В работе предложен новый нейро-нечеткий подход к реставрации звуков, опирающийся на современные достижения искусственного интеллекта и направленный на повышение эффективности фильтрации.
2. Основы нейро-нечеткого подхода. Ключевым преимуществом нечеткой логики является ее способность описывать желаемое поведение системы простыми «если-то»-правилами [Заде, 1976]. При этом можно использовать все доступные инженерные ноу-хау, для непосредственного улучшения системы. Во многих приложениях это дает более простое решение за меньшее время. Однако, во многих
, , , -. « - »-
вручную. Большие объемы данных требуют больших вычислений. В этом случае хорошо подходит методология нейронных сетей, которые обучаются на наборах .
Для объединения сильных сторон обоих подходов создаются гибридные методологии и соответствующие инструментальные системы. Одну из них - ANFIS (Adaptive Network Based Fuzzy Inference System) [Ярушкина, 2001] - мы взяли на вооружение. В новой постановке задачи речь идет о создании адаптивного фильтра, который сначала обучается распознавать звуковой образ шума, а затем, получая на вход смесь полезного сигнала и шума, распознает шум и вычитает его (здесь используются операции нечеткой арифметики [Дюбуа и Прад, 1990]).
Общая методика создания нейро-нечетких моделей включает следующие шаги:
1) .
, .
2) .
, .
3) . -
,
должны изменяться правила и функции принадлежности.
4) Собственно обучение.
5) Оптимизация и проверка.
3. Алгоритм обучения. Обучение нейронной сети производится методом обратного распространения ошибки. Это наиболее известный метод обучения многослойной нейросети без обратных связей. Он является итеративным градиентным алгоритмом. Его суть - распространение сигналов ошибки от выходов нейронной сети к ее входам в направлении, обратном прямому распространению сигналов в обычном режиме работы [Короткий, 2000]. При обучении ставится задача минимизации ошибки нейронной сети, которая определяется методом наименьших квадратов. Для сети с одним выходом (как в нашем случае) ошибка определяется соот-:
Е -^)2, (1)
2 м
где у; - значение выхода нейросети для каждого компонента входного вектора (дискретных звуковых отсчетов в нашем случае), а ^ - желаемое значение вы.
Полный алгоритм обучения нейронной сети с помощью процедуры обратного распространения строится так:
1)
функционирования нейронной сети, когда сигналы распространяются от входов к выходам, рассчитать значения последних. Напомним, что выход нейросети рассчитывается по формуле
м
= Е у!" ■ К'- (2)
I=0
где М - число нейронов в слое п-1 с учетом нейрона с постоянным выходным состоянием +1, задающего смещение;
у;(п-1)=Ху(п) - ьй вход нейрона >го слоя п;
у^п) = ^(п)), где Ю - функция активации нейрона;
уч(0)=1ч, где 1ч - компонента вектора входного образа;
2) для выходного слоя (слоя N
8(( ы) = — ■ ^ = (у\^ - й,) ■ ^. (3)
дуг ^ Ж,
3) Рассчитать изменения весов Дw(N) слоя N.
Д»(") = -ц^\") ■ уг("-1), (4)
У ] ~ ‘
где П - коэффициент скорости обучения, 0<П<1.
4) Рассчитать по формулам (3) и (4) соответственно $п> и Д\4п) для всех остальных слоев, п = N-1,...,!.
5)
-1) + Д»(?(1), (5)
где I - номер текущей итерации, п - номер слоя.
6) -тигло заданного предела, то перейти к шагу 1. В противном случае - конец.
4. Описание э ксперимента. В нашей работе адаптивный фильтр был построен на основе нейронечеткой архитектуры ANFIS с использованием модуля Fuzzy Logic Toolbox в среде MATLAB 6.1. Для построения графиков использованы команды из Signal Processing Toolbox.
Порядок обработки звука таким фильтром следующий:
1) Подготовить в виде файла исходный материал.
2) Выбрать тип удаляемого шума: шипение или щелчки.
3) Обучить фильтр на небольшом (0.1..0.5 сек) участке.
4) Подать на вход фильтра весь исходный материал.
5) Результат записать в новый файл (при необходимости контроля прослу-
).
На первом этапе исследования для выбранного типа полезного сигнала и шума выявлялось, как влияет изменение структуры и параметров простого адаптивного фильтра, построенного по гибридной методологии ANFIS, на качество фильтрации. Ключевые особенности: шкала времени - дискретная, шкала значений - не.
источнике шума и структуре ANFIS. Новый тип полезного сигнала - волновой пакет. Ключевые особенности: сигнал ограничен во времени и по частоте. Ниже рассмотрим подробнее формулировку задачи.
. x0 -
вале времени от 0 до 6 секунд с частотой дискретизации Fs 1000 Гц. По теореме Котельникова, максимально возможная частота - Fs/2, т.е. 500 Гц. Таким образом, 6 0,5 20 .
- ( ). -димостью определить эффективность фильтрации в широком диапазоне частот.
Пусть также имеется источник шума: псевдослучайные числа с нормальным распределением. Такой шум называется широкополосным или белым. Параметры
: - 0, -
- 1.
n1 = randn(time). (6)
Шум накладывается на источник по сложному нелинейному закону:
n2 = 4 • sin(n1d0 )• n1d 1 , (7)
1 + n1d 12
где: n1d0 - сигнал в момент времени i, n1d1 - сигнал в момент времени i-1 ( ).
( ) :
m = x0 + n2. (8)
Этот сигнал поступает на вход адаптивного фильтра на основе ANFIS. Будем полагать, что полезный сигнал n2 "загрязнен" сигналом x0. Иными словами, на входе ANFIS имеем сигнал n1, а на выходе - сигнал m. Обучение ставит целью научить ANFIS воспроизводить функцию n2(n1). Тогда предполагаемый вид сигнала xf можно получить из соотношения (8):
Xf = m — n2(n1)f, (9)
где n2(n1)f - предполагаемый вид сигнала ошибки - результат обучения
нейро-нечеткой модели (предполагается, что порядок нелинейности сигнала шума известен и составляет 2).
Создаем модель ANFIS с двумя входами для n1d0 и n1d1 соответственно (рис.1). На каждый вход назначаются по две колоколообразные функции принадлежности.
Рис.1.Структура модели ANFIS
Обучение производится по алгоритму обратного распространения ошибки. Параметры этого алгоритма: количество эпох (итераций алгоритма) - 10; целевая функция - минимизация ошибки. Начальный размер шага обучения установим равным 0.2.
Теперь можно начинать фильтрацию сигнала. Результат выполнения фильтрации обученным фильтром приведен на рис.2 и 3. Самый лучший способ определить эффективность алгоритма шумоподавления - это прослушать результаты. За отсутствием такой возможности приводятся результаты, полученные двумя способами, общепринятыми в сфере анализа электроакустических сигналов: временное представление и периодограмма. Можно предоставить файлы формата wav в ответ на запрос по электронной почте, а также исходники программ MATLAB.
При увеличении начального шага обучения до 0.5 улучшений не произошло. Увеличение периодов обучения с 10 до 30 привело к некоторому улучшению качества распознавания (но и к увеличению времени). Оставив число периодов обучения 10, увеличим количество функций принадлежности на каждый вход с 2 до 4. Полученный результат лучше предыдущего и гораздо лучше первоначального. Од-
12 220 .
0 1 2 3 4 5 6
Seconds
Рис.2. Сигналы: входной (m) [0..3 c], выходной (x) [3..6 c]
Рис.3. Спектральная плотность мощности сигналов в зависимости от частоты (периодограмма)
Второй этап. Короткий синусо идальный импульс, модулированный функцией Г аусса (частота дискретизации - 44100 Г ц, амплитуда - 1, основная частота - 50 Г ц, полоса пропускания - 50%, усечение происходит ниже 40 дБ), загрязнен тем же типом шума. После обучения фильтра и фильтрации сигнала, амплитуда шума уменьшилась на =10 дБ, что видно на рис.4 и 5.
1.5 I---[-----1-----1-----1----1-----1-----1-----1----1-----
-0.05 -0.04 -0.03 -0.02 -0.01 0 0.01 0.02 0.03 0.04 0.05
ЭесопЬэ
Рис.4. Сигналы: входной (ш) [-0.05..0 с], выходной (х) [0..+0.05 с]
Periodogram PSD Estimate
Рис.5. Спектральная плотность мощности сигналов в зависимости от частоты (периодогра.мма)
Заключение. Фильтр действительно является адаптивным, поскольку обучается на каждом подаваемом сигнале. Для обоих случаев тестового сигнала видно, что фильтр значительно приближает сигнал к оригиналу, а также существенно уменьшает разброс значений. Эффективность фильтрации зависит от качества обучения, которое напрямую связано с вычислительными затратами. Процедура обучения занимает 96% общего времени, т.е. обучение требует на порядок больше времени, чем режим исполнения (фильтрации). Всего на обработку фрагмента размером 6000 отсчетов тратилось 12±2 секунд процессорного времени на компьютере с процессором Intel Pentium II и частотой 233 МГ ц. Обучение на длинных фраг-,
затраты времени вырастают до неприемлемых значений. Лучше обучать на небольшом фрагменте 5..10 секунд), а затем проводить нечеткие вычисления на полноразмерном фрагменте (любой длины - вплоть до нескольких часов). Однако, установление приемлемого компромисса между качеством обучения и количеством затраченного времени остается прерогативой исследователя. Низкая производительность обусловлена применением интерпретируемых программ MATLAB. При использовании оптимизированных библиотек (например, Intel Signal Processing Library и Recognition Primitives Library) или решений на основе DSP возможна обработка в реальном времени.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Дюбуа Д., Прад А. Теория возможностей. Приложения к представлению знаний в информатике: Пер. с франц. М.: Радио и связь, 1990.
2. . -женных решений: Пер. с англ. М.: Мир, 1976.
3. Короткий СТ. Нейронные сети: алгоритм обратного распространения // BYTE Россия.
2000. №21. С.26-29.
4. Тарасов В.Б Синергетические проблемы в искусственном интеллекте // Труды Международной научно-практической конференции «Знание - диалог - решение». Т.2 (KDS-
2001, Санкт-Петербург, 19-22 июня 2001 г.). СПб: Лань, 2001. С.594-602.
5. Ярушкина Н.Г. Нечеткие нейронные сети. 4.1 // Новости ИИ. 2001. №2-3. С.47-51.