ISSN 0868-5886
НАУЧНОЕ ПРИБОРОСТРОЕНИЕ, 2007, том 17, № 1, c. 115-120
= ОБРАБОТКА И АНАЛИЗ СИГНАЛОВ
УДК 621.384.8
© И. В. Заруцкий, В. В. Манойлов
ПРЕДВАРИТЕЛЬНАЯ ОЧИСТКА МАСС-СПЕКТРОМЕТРИЧЕСКИХ СИГНАЛОВ ОТ ШУМОВ С ПОМОЩЬЮ ВЕЙВЛЕТ-ФИЛЬТРОВ
Рассмотрены возможности прямого и обратного вейвлет-преобразований для очистки масс-спектрометрических сигналов от шумов. Использовано многоуровневое преобразование исходного сигнала с целью установления оптимальной полосы низкочастотного фильтра при сохранении разрешения. Критерием оптимальности выбран уровень энтропии, который быстро уменьшается на первых этапах аппроксимации и детализации, а затем его уменьшение сильно замедляется. Приведены примеры фильтрации реального масс-спектрометрического сигнала предлагаемым методом.
ПОСТАНОВА ЗАДАЧИ
Одной из причин, затрудняющих анализ любого сигнала, является наличие шумов. Существует несколько общепринятых методов удаления помех из исходного сигнала: применение оконного Фурье-преобразования [1, 2], полиномиальное сглаживание и относительно недавно появившийся метод, основанный на использовании вейвлет-преобразования. По сравнению с другими методами вейвлет-очистка сигналов имеет ряд преимуществ, заключающихся, в первую очередь, в оптимальной частотно-временной локализации, что позволяет удалять помеху вблизи некоторой точки I, не искажая при этом самого сигнала. Строгое математическое обоснование метода очистки сигнала от шумов с помощью вейвлетов и сравнение его с другими методами было рассмотрено в работе [3].
Основная идея очистки сигнала от шума заключается в разложении сигнала на вейвлеты, идентификации компонент шума и восстановлении сигнала без этих компонент.
лет-преобразования. На рис. 1 представлено разделение исходного сигнала на части с помощью высокочастотного и низкочастотного фильтров.
Сигнал
Л
Низких частот
Фильтры
I_£
Высоких частот
A
D
Рис. 1. Разделение исходного сигнала на две части
ФИЛЬТРАЦИЯ МАСС-СПЕКТРОМЕТРИЧЕСКИХ СИГНАЛОВ МЕТОДОМ ПРЯМОГО И ОБРАТНОГО ДИСКРЕТНОГО ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЙ
Первый этап фильтрации: аппроксимация и детализация. Для большинства масс-спектро-метрических сигналов низкочастотная составляющая анализируемого сигнала является наиболее важной. Это то, что дает возможность идентифицировать сигнал. Высокочастотная составляющая — это шум. В вейвлет-анализе говорят об аппроксимации и деталях. Аппроксимация является высокой шкалой — низкочастотной составляющей сигнала. Детализация — это низкая шкала, высокочастотная составляющая. Рассмотрим основные черты фильтрации с помощью двух частей вейв-
S I
АЛА
1000 точек сигнала
cD (высокие частоты)
500 DWT-коэффициентов cA (низкие частоты)
~500 DWT-коэффициентов
Рис. 2. Получение из 1000 точек исходного сигнала двух частей из 500 точек для низкочастотной и высокочастотной составляющих при дискретном вейвлет-преобразовании (DWT)
1'
rbJ . CD1
¡4±J. cDd
еДз| cDJ
Рис. 3. Вейвлет-декомпозиционное дерево
Рис. 4. Реконструкция сигнала из вейвлет коэффициентов после декомпозиции.
Ф
означает увеличение количества точек за счет добавления в выборку дополнительных нулей; Н' и Ь' — соответственно реконструкционные фильтры верхних и нижних частот
Пусть исходный сигнал содержит 1000 точек. Такой сигнал проходит через два дополнительных фильтра, и появляются два сигнала. При дискретном вейвлет-преобразовании из 1000 точек в каждой части появляется 500 точек соответственно сА и сБ (рис. 2).
МНОГОУРОВНЕВОЕ ВЕЙВЛЕТ-ПРЕОБРАЗОВАНИЕ
Процесс представления исходного сигнала с помощью вейвлет-коэффициентов при разделении на низкочастотную и высокочастотную части называют декомпозицией. Процесс декомпозиции может быть итеративным. Такой процесс называют вейвлет-декомпозиционным деревом (рис. 3).
ВЕЙВЛЕТ-РЕКОНСТРУКЦИЯ
Выше был рассмотрен процесс использования дискретного вейвлет-преобразования для анализа или декомпозиции сигнала. Другая составляющая обработки сигнала состоит в том, как полученные при декомпозиции составляющие сигнала могут быть обратно соединены вместе для получения исходного сигнала без потери информации. Этот процесс называется реконструкцией или синтезом. Комплекс математических операций, который выполняет процесс синтеза, называется обратным дискретным вейвлет-преобразованием (рис. 4).
Вейвлет-анализ (декомпозиция) производит фильтрацию и уменьшает количество точек в каждой из отфильтрованных частей (downsampling). Процесс вейвлет-реконструкции (синтеза) состоит из процедуры увеличения количества точек (up-sampling) и фильтрации. Синтез исходного сигнала осуществляется из вейвлет-коэффициентов, полученных по результатам анализа. Upsampling — это процесс увеличения количества точек сигнала путем введения нулей между отсчетами.
РЕКОНСТРУКЦИОННЫЕ ФИЛЬТРЫ
Правильный выбор реконструкционного фильтра является решающим моментом в достижении наименьшей разности между исходным и синтезируемым сигналами [4]. Низкочастотный и высокочастотные декомпозиционные фильтры (L и H), а также связанные с ними реконструкционные фильтры (L' и H') образуют систему, которая называется квадратурными зеркальными фильтрами (рис. 5).
ВЫБОР ОПТИМАЛЬНОГО КОЛИЧЕСТВА УРОВНЕЙ ДЕКОМПОЗИЦИИ
Выбор оптимального количества уровней декомпозиции основан на свойствах данного ортогонального вейвлета, с помощью которого было произведено разложение исходного сигнала.
Н1 и
Декомпозиция Реконструкция
Рис. 5. Квадратурные зеркальные фильтры
Исходный сигнал длиной N = 2Ь может быть а -"растянут" различными путями (где а — количество бинарных ярусов полного бинарного дерева глубиной Ь). В результате а < 2^2 [6]. Это число может быть очень большим, и поэтому конечное количество вычислений может быть неуправляемым. В связи с этим важным является установить критерий эффективности алгоритма при установлении оптимального количества уровней декомпозиции. Обычно ищется минимум функционала. Для решения данной задачи хорошо подходят классические критерии, основанные на минимуме энтропии. Энтропия является общей концепцией во многих областях знаний, главным образом в обработке сигналов [7]. В соответствии с описанными в [5] свойствами энтропии для сигналов, представляемых в виде ортогональных разложений, справедливо следующее выражение для энтропии сигнала ^:
Е(5) = Х Е(), (1)
где si — коэффициенты разложения сигнала 5 в ортонормированном базисе.
В [5] приведен список из четырех типов энтропии для коэффициентов разложения сигнала по ортонормированному базису.
1 тип. Ненормированная энтропия по Шеннону:
E1(si) = — 21О8(* 2,) (2)
и поэтому
Е1( 5) = Х ^ 21О8( ^2,) (3)
при соглашении для 0 — 1о8(0) = 0.
2 тип. Концентрация по норме р при р< 1 (в данной работе р = 0.5):
Е 2(5) = ^ (4)
и поэтому
Е2(5) = £М =|\4Р . (5)
3 тип. Логарифм "энергии" энтропии:
Е 3(^) = 1О8(^2) (6)
и поэтому
Е 3( 5) = Х, 1О§( 2) (7)
при соглашении для 0 — 1о8(0) = 0.
4 тип. Пороговая энтропия:
Е4(5,.) = 1, если >£ ; Е 4(5) = К,
где К — количество раз превышения коэффициентами вейвлет-разложения порогового уровня е .
Произведем оценку количества уровней декомпозиции для масс-спектра, представленного на рис. 6. Количество отсчетов этого сигнала N = = 6000. В работе [2] описан алгоритм фильтрации того же сигнала, который представлен на рис. 6. Тот алгоритм основан на фильтре нижних частот Чебышева, поэтому возможно сравнение методов.
Результаты вычисления энтропии для различных уровней декомпозиции сведены в таблицу. В качестве материнских вейвлет-функций использовались функции Добеши [3]. Приведем примеры различных уровней вейвлет-де-композиции для исходного сигнала (рис. 6).
Рис. 6. Исходный сигнал в нормализованном виде
Значения различных типов энтропии при декомпозиции масс-спектра (рис. 6)
Уровень декомпо- Энтропия типа 1 Энтропия типа 2 Энтропия типа 3
зиции (Шеннон) (концентрация по (логарифм
норме, р = 0.5) "энергии")
Нулевой (исходный
сигнал) 73.12 92 -4.8е4
Первый 36.63 47 -2.38е4
Второй 16.85 23 -1.27е4
Третий 7.14 12 -7.99е3
Четвертый 3.58 7 -4.06е3
Пятый 1.64 4 -2.06е3
Шестой 1.50 4 -1.04е3
Седьмой 1.05 2 -559
first level dwt
"О 500 1000 1500 2000 2500 3000 3500
Рис. 7. Первый уровень DWT сигнала в нормализованном виде (образовано N12 точек)
second level dwt
1 ! i
i !
i !
............i............ ! .............
"...........i............ i !
i T Au^u
"0 200 40Q В00 800 100Q 1200 1400 160Q
Рис. 8. Второй уровень DWT сигнала в нормализованном виде (образовано N/4 точек и повысилось отношение сигнал/шум)
third level dwt
__________;____________
............ ............ ............. ............
............ ............ ............. ............ ..........
Jîtu*..-.. i
Рис. 9. Третий уровень DWT сигнала в нормализованном виде (образовано N/8 точек и повысилось отношение сигнал/шум)
Рис. 10. Четвертый уровень DWT сигнала в нормализованном виде (образовано N/16 точек и повысилось отношение сигнал/шум)
fivth level dwt
1 1 I
! ! ! ; ! ! ; i
I I 1 i i i ■ ;
: : ! !
..........!..........i......... i i ..........i.........].......... i i 1
i 1 ___ :
'О 20 40 60 00 100 120 140 160 100 200
Рис. 11. Пятый уровень DWT сигнала в нормализованном виде (образовано N/32 точек и повысилось отношение сигнал/шум, ухудшилось разрешение)
¡lath level dwt
! ! i i ! i i........-
....... : :
: : i i i i Г"" : : ----------i----------;---------;----------i----------;---------;----------i: : : : i i i i : 1 ;--------- i
: ; ; i ii i i ; __________i__________i_________i__________i ________i_________i__________L.
A- i
'0 10 20 30 40 50 ВО 70 ВО 90 100
Рис. 12. Шестой уровень DWT сигнала в нормализованном виде (образовано N/64 точек, повысилось отношение сигнал/шум, но и сильно ухудшилось разрешение)
seventh level dwt
..........i..........1......... ..........1.........
! ! i i .......... ! i ..........
! ! i i !
i : i i ..........i..........■......... i i i ..........I.........
i i ..........i..........r......... AJ .......... i ■Д......г......... .......... 1 1 ........J J
j_I_I_I_I_I_I_I_I_I_
"0 5 10 15 20 25 3B 35 40 45 50
Рис. 13. Седьмой уровень DWT сигнала в нормализованном виде (образовано N/128 точек, повысилось отношение сигнал/шум, но и очень сильно ухудшилось разрешение)
entropy level dwt
0-1-1-1-1- 1 1
1 2 3 A 5 6 7 В
Рис. 14. Уменьшение энтропии по Шеннону в зависимости от уровня вейвлет-декомпозиции
Иначе говоря, представим вейвлет-декомпози-ционное дерево. На рис. 7-13 представлены аппроксимирующие части различных уровней вейв-лет-декомпозиции.
Как видно из рис. 10 и 11, наиболее приемлемыми уровнями вейвлет-декомпозиции являются уровни 4 и 5, т. к они дают максимальное отношение сигнал/шум и не искажают разрешающую способность. Этот же вывод можно сделать из характера уменьшения энтропии, представленного в таблице и на рис. 14. Исходя из этих данных, видно, что после 5-го уровня энтропия падает значительно медленнее, чем в промежутке от 1-го до 5-го уровня.
Сравнение результатов данной работы и рабо-
ты [2] дает основание сделать заключение, представленное ниже.
ЗАКЛЮЧЕНИЕ
На основе минимизации уровня энтропии предложен алгоритм выбора оптимального количества уровней декомпозиции ортогонального вейвлет-преобразования. Оптимальный уровень декомпозиции дает максимальное отношение сигнал/шум, и в обрабатываемом сигнале не искажается разрешающая способность. Сравнение качества фильтрации масс-спектрометрических сигналов с помощью фильтров Чебышева и с помощью вейвлет-декомпозиции показывает, что
оба метода фильтрации дают примерно равные результаты в смысле отношения сигнал/шум. Преимуществом вейвлет-декомпозиции при установлении с помощью минимума энтропии уровня декомпозиции является минимизация количества вычислений по сравнению с количеством вычислений, требуемых для реализации фильтров Че-бышева применительно ко всему массиву данных.
СПИСОК ЛИТЕРАТУРЫ
ская динамика", 2001. 464 с.
4. Strang, G., Nguyen T. Wavelets and filter banks. Wellesley-Cambridge Press., 1996. 240 p.
5. Coifman R.R., Wickerhauser M.V. Entropy-basedalgorithms for best basis selection // IEEE Trans. on Inform. Theory. 1992. V. 38, N 2. P.713-718.
6. Mallat S. A wavelet tour of signal processing. Academic Press, 2000. 637 р.
7. Dohodo D. // IEEE Trans. on Inform. Theory. 1995.V41. P.613-627.
1. Макс Ж. Теория и техника обработки сигналов при физических измерениях. Т. 1. М.: Мир, 1983. 280 с.
2. Заруцкий И.В., .Манойлов В.В. Аппаратно-
программный комплекс транспортабельного Институт аналитического приборостроения РАН, хромато-масс-спектрометра ТХМС // Научное Санкт-Петербург приборостроение. 2003. Т. 13, № 4. С. 47-54.
3. Добеши И. Десять лекций по вейвлетам (пер. Материал поступил в редакцию 18.10.2006. с англ.). Ижевск: НИЦ "Регулярная и хаотиче-
PRELIMINARY ELIMINATION OF NOISE FROM MASS SPECTRA
BY WAVELET FILTERS
I. V. Zarutsky, V. V. Manoilov
Institute for Analytical Instrumentation RAS, Saint-Petersburg
The paper analyzes applicability of the direct and inverse transformations to the problem of removing noises from mass spectra. To find the low-frequency filter band that ensure optimal results while the resolution remains constant, a multilevel conversion of initial signal is used. As the optimality criterion, an entropy level was taken, which quickly decreases on the early stages of approximation and detailing and decreases much slower on the later stages. The paper presents the cases of filtering an actual mass spectrum by the method suggested.