Вестник КРАУНЦ. Физ.-мат. науки. 2014. № 2(9). C. 59-67. ISSN 2079-6641
ИНФОРМАЦИОННЫЕ И ВЫЧИСЛИТЕЛЬНЫЕ
ТЕХНОЛОГИИ
УДК 519.246.87+519.688
СРАВНЕНИЕ МЕТОДОВ РАЗРЕЖЕННОЙ АППРОКСИМАЦИИ НА ПРИМЕРЕ СИГНАЛОВ ГЕОАКУСТИЧЕСКОЙ ЭМИССИИ
О.О. Луковенкова1, 2
1 Институт космофизических исследований и распространения радиоволн ДВО РАН, 684034, Камчатский край, п. Паратунка, ул. Мирная, 7
2 Камчатский государственный университет имени Витуса Беринга, 683032, г. Петропавловск-Камчатский, ул. Пограничная, 4
E-mail: [email protected]
^атья посвящена сравнительному анализу алгоритмов разреженной аппроксимации. В первой части статьи описаны общая задача разреженной аппроксимации и два основных подхода к ее решению. Приведена классификация алгоритмов преследования. Рассмотрены особенности применения конкретных методов к сигналам геоакустической эмиссии. Различные алгоритмы преследования сравниваются по разреженности, точности и времени выполнения.
Ключевые слова: согласованное преследование, преследование базиса, геоакустическая эмиссия
© Луковенкова О.О., 2014
INFORMATION AND COMPUTATION TECHNOLOGIES
MSC 65C20
COMPARISON OF THE SPARSE APPROXIMATION METHODS BASED ON ITS USE TO GEOACOUSTIC EMISSION SIGNALS
O.O. Lukovenkova1, 2
1 Institute of Cosmophysical Researches and Radio Wave Propagation Far-Eastern Branch, Russian Academy of Sciences, 684034, Kamchatskiy Kray, Paratunka, Mirnaya st., 7, Russia
2 Vitus Bering Kamchatka State University, 683031, Petropavlovsk-Kamchatsky, Pogranichnaya st., 4, Russia
E-mail: [email protected]
The paper is devoted to the comparative analysis of some sparse approximation methods. The first part of the paper describes general sparse approximation problem and two main approaches solved it. Classification of testing pursuit algorithm is illustrated. Features of the methods application to geoacoustic emission signals are considered in the second part. The sparseness, accuracy and runtime of described pursuit algorithms are compared.
Key words: matching pursuit, basis pursuit, geoacoustic emission
© Lukovenkova O.O., 2014
Введение
С 1999 года ИКИР ДВО РАН ведется изучения сигналов геоакустической эмиссии (ГАЭ) на различных стадиях сейсмической активности. Типичный сигнал ГАЭ представляет собой серию релаксационных импульсов с ударным возбуждением, амплитудой 0.1 - 1 Па, заполняющей частотой от единиц до первых десятков кГц (рис. 1) [1].
0.15-1-1-1-1-1-
0.1
0 2 4 6 6 10 12
t, мс
Рис. 1. Сигнал ГАЭ
Регистрация сигналов осуществляется непрерывно с частотой дискретизации 48 кГц, что не позволяет проводить ручную обработку данных. Как правило, для анализа сигналов импульсной природы используются классические методы частотно-временного анализа, однако в последние годы все более популярными становятся методы разреженной аппроксимации. В представленной статье проведено сравнение алгоритмов разреженной аппроксимации по точности, разреженности полученного решения и времени выполнения на примере сигналов ГАЭ.
Разрешенная аппроксимация
Под аппроксимацией сигнала понимается задача разложения сигнала по некоторому набору функций (словарь функций):
N -1
f (t) = £ amgm(t) + Rn, ||RnII ^ min,
m=0
где f (t) - исследуемый сигнал, gm(t)- элемент (атом) словаря D = {gm(t), ||gm|| = 1}, am - коэффициенты разложения, N - количество элементов разложения, Rn - ошибка аппроксимации.
Разреженная аппроксимация предполагает построение модели сигнала, содержащей наименьшее число элементов, т.е.
N-1
f (t) = £ amgm(t) + Rn, ||RnII ^ min, ||a||0 ^ min,
m=0
где II -1о - псевдонорма (Lo-норма), равная числу ненулевых членов вектора.
Одним из главных преимуществ разреженной аппроксимации является возможность построения разложения сигнала, одновременно содержащего наименьшее количество элементов и минимизирующего ошибку, по избыточному, в общем случае неортогональному словарю. Под избыточным понимается словарь, содержащий количество атомов, много большее размерности исходного сигнала. Однако такого рода задача поиска оптимального базиса разложения обладает большой вычислительной сложностью и неразрешима за полиномиальное время.
Существует два различных подхода к разреженной аппроксимации сигналов. Оба позволяют уменьшить вычислительную сложность поставленной задачи и найти эффективное, но не оптимальное решение:
1) Преследование базиса (Basis Pursuit, BP). Суть данного подхода, предложенного Chen S.S. и Donoho D.L. [2], сводится к замене вычислительно сложной задачи Lo-аппроксимации более легкой задачей Li-аппроксимации.
D ■ a = f, II a 11 ^ min,
где
N-1
11 a 11 = £ |am|.
m=0
Минимизация Li-нормы уничтожает рассеяние энергии f по атомам словаря D, тем самым сокращая количество элементов искомого разложения.
Задача преследования базиса может быть упрощена заменой минимизации Li-нормы ее ограничением [2].
N-1
f (t) = £ amgm(t)+ Rn, ||RnII ^ min, ||a|1 < Я.
m=0
Следует отметить, что преследование базиса - это оптимизационный принцип, а не конкретный алгоритм решения задачи. Задачу преследования базиса можно решить сведением к задаче линейного программирования [2] или одним из оптимизационных методов [3]-[4], уточняющих на каждой итерации заданное начальное приближение.
1) Согласованное преследование (Matching Pursuit, MP), предложенное Mallat S. и Zhang Z. [5]. Суть алгоритма сводится к итеративному процессу поиска элементов словаря, минимизирующих на каждом шаге ошибку аппроксимации.
R0f = f
s = arg min К gm, RNf) I .
m 1 1
RN+1 f = RNf - (g„ RNf) gs
На основе метода согласованного преследования был разработан метод ортогонального согласованного преследования (Orthogonal Matching Pursuit, OMP), главным отличием которого от классической реализации стало построение ортогонального базиса, минимизурующего ошибку аппроксимации [6].
U = 0
gm, RNf
R f = f,
s = arg min
\_m(/U
U = U Us •
aN = D+f
RV+1 f = f - D. aN
Классификация алгоритмов аппроксимации сигналов, протестированных на сигналах ГАЭ, представлена на рис. 2.
Рис. 2. Классификация алгоритмов аппроксимации сигналов
Сравнение методов разреженной аппроксимации на сигналах ГАЭ
Для сравнения алгоритмов разреженной аппроксимации была сформирована выборка, содержащая 100 выделенных из сигналов ГАЭ наиболее явных импульсов с амплитудой 0.02 - 0.05 Па, заполняющей частотой 5-10 кГц (рис. 3), длительностью 8 мс. Предварительная обработка сигналов включала фильтрацию по частотному диапазону 1-24 кГц и нормирование по амплитуде.
Выбор словаря Б является важной задачей, от которой зависит качество дальнейшего анализа. Предыдущие работы показали, что наиболее эффективным словарем для аппроксимации геоакустических сигналов является словарь, сформированный из модулированных функций Берлаге, поскольку импульсы Берлаге обладают схожей структурой с элементарными импульсами геоакустической эмиссии [7]-[9]. В ходе серии экспериментов был подобран словарь, обеспечивающий подходящую точность аппроксимации. Словарь, использованный в проведенном эксперименте, содержит 2460 функций Берлаге со следующими параметрами: длительность 3.8 мс,
Рис. 3. Спектр выбранных импульсов
положение максимума огибающей на 0.152 - 0.95 мс от начала импульса, частота заполняющей синусоиды от 4,5 до 10,5 кГц (рис. 4).
0.5 0 Л А /\s-~~-_
i i i i i i i
01 234567В
0
vVv"- - i i i i i i i
01 234567В
0 Л л л - -
V V v i i i i i i i
01 234567В
0 Л Л Л л А/^л_
vyVVv " i i i i i i i
01 234567В
0 Л Л Л л а/^л_
vyVVv " i i i i i i i
01 234567В
0 05
\/у- - ■ i i i i i i i
01 2345678
Рис. 4. Примеры атомов словаря
Для каждого из исследуемых сигналов была построена классическая аппроксимация (в разложение сигнала входят все атомы словаря), полученная решением задачи Ь2-оптимизации. В результате анализа векторов коэффициентов полученных разложений выяснилось, что в каждом из 100 решений все 2460 коэффициентов ненулевые, однако в среднем всего 991 коэффициент в разложении имеет значения, превосходящие 1% от максимума, и лишь 294 коэффициента превосходят порог в 5% (рис. 5), таким образом корреляция более половины атомов словаря с сигналом незначительна, поэтому полученное разложение избыточно. Избыточности представ-
ления можно избежать, выполнив разреженную аппроксимацию имеющихся данных по заданному словарю.
Не равно 0 Превосходят 1 % от МАХ Превосходят 5% от МАХ
Рис. 5. Результаты Ь2 оптимизации
Используя методы разреженной аппроксимации, важно помнить, что в отличие от согласованного преследования в алгоритмах преследования базиса невозможно задавать четкое ограничение на Lo-норму искомого вектора коэффициентов, и степень разреженности регулируется управляющим параметром д, чем больше его значение, тем меньше Lo-норма коэффициентов разложения и выше ошибка [4].
1 2
Д IIaП1 + 2 ||RN/1| ^ min.
Выбор подходящих значений управляющего параметра и шага алгоритма, обеспечивающих требуемое соотношение «разреженность - ошибка», является трудоемкой задачей, решаемой лишь методом экспериментального подбора.
Рис. 6. Влияние параметра д на решение задачи преследования базиса
В большинстве алгоритмов согласованного преследования, за исключением StOMP и SWOMP, Ьо-норма вектора коэффициентов либо зависит от числа итераций (в случае МР и ОМР совпадает), либо непосредственно указывается в качестве входного параметра алгоритма (Сс^аМР), что удобнее для исследователя, если в приоритете именно разреженность решения.
На рис. 7 представлены графики зависимости средней ошибки аппроксимации исследуемых сигналов от среднего значения Lo-нормы вектора коэффициентов для различных алгоритмов разреженной аппроксимации. В качестве управляющего параметра д алгоритмов преследования базиса экспериментально подобраны значения 0.5 и 0.7, обеспечивающие подходящие уровень ошибки и разреженность решения. Алгоритм преследования TwIST используется для словарей, удовлетворяющих условию 0 < k < Amin(DTD) < 1, у заданного словаря Ami_n(DTD) < 0, поэтому данный алгоритм был исключен из списка тестируемых.
Рис. 7. Зависимость спада ошибки от разреженности решения
Из графиков, представленных на рис.7а и 7б, видны различия в динамике спада ошибки аппроксимации методов согласованного преследования и преследования базиса. В первом случае ошибка плавно спадает с увеличением количества элементов разложения, во втором - с уменьшением количества элементов.
Если представить каждый алгоритм эллипсом с полуосями, соответствующими доверительным интервалам средних значений итоговых Lo-нормы и ошибки, то по расположению данного эллипса на координатной плоскости можно оценить эффективность применения алгоритма для исследуемых сигналов и заданного словаря (рис.8).
В таблице 1 представлены средние по 100 импульсам время выполнения 20 итераций алгоритма, разреженность и ошибка. Все вычисления проводились на персональном компьютере с характеристиками: процессор Intel Core i5-3210M 2.50 ГГц, размер оперативной памяти 4 Гб.
О CGIST
О CGIST0 ([1=0.5)
О CGIST0 (ц=0.7)
• IST (ц=0.5)
□ IST (ц=0.7)
□ Fl STA (ц=0.5)
□ Fl STA ([1=0.7) Д MP
Д OMP
Л gOMP (ЮМР)
A SWOMP (80%)
О SWOMP (95%)
О StOMP (a=4)
О CoSaMP
довер. интервалы
0 20 40 60 80 100 120 140 160 180
Ц^-норма
Рис. 8. Соотношение «разреженность-ошибка» алгоритмов разреженной аппроксимации
Таблица
Характеристики алгоритмов преследования
Метод Время выполнения 20 ит., сек Итог. Lo Итог. ошибка
OMP 0.8644 15 20%
MP 0.7927 15 21%
gOMP (rOMP) время зависит от параметров 10 ит. по 2 атома: 0.4693 (0.5191) 4 ит. по 5 атомов 0.2423 (0.2832) 2 ит. по 10 атомов 0.1651 (0.2119) 15 23%
FISTA (д=0.5) 1.3582 16 29%
SWOMP (95%) 0.9770 26 21%
CoSaMP 0.1310 15 32%
FISTA (д=0.7) 1.3582 12 33%
CGIST0 (д=0.7) 15.6585 17 33%
CGIST (д=0.5) 27.8995 30 29%
CGIST0 (д=0.5) 15.6585 31 30%
IST (д=0.7) 1.3509 27 35%
IST (д=0.5) 1.3509 38 30%
SWOMP (80%) 2.0469 146 20%
StOMP (а=4) 1.3351 168 13%
Согласно графику, представленному на рис.8, и данным таблицы 1 наиболее эффективными по соотношению "разреженность - ошибка" являются методы согласованного преследования МР, ОМР, £ОМР. В процессе тестирования гОМР выяснилось, что для исследуемых сигналов множество выбранных на каждой итерации
атомов уже является регулярным, поэтому аппроксимационные решения, полученные rOMP и gOMP, идентичны. Из методов преследования базиса лучшие результаты показал FISTA. Сравнение времени выполнения алгоритмов показало, что алгоритмы согласованного преследования выполняются на порядок быстрее алгоритмов преследования базиса, т.к. на практике, чтобы добиться оптимального результата требуется 15-20 итераций алгоритма согласованного преследования и 50-70 итераций алгоритма преследования базиса.
Наибольшую эффективность при анализе сигналов ГАЭ показали алгоритмы OMP, MP и gOMP. Выбор между этими тремя алгоритмами определяется требованиями исследователя: самый быстрый алгоритм - gOMP, самое точное решение предоставляет OMP, MP - «золотая середина».
В результате проделанной работы можно заключить, что решения, полученные алгоритмами согласованного преследования MP, OMP и gOMP, обладают лучшей разреженностью и большей точностью по сравнению с решениями, полученными остальными рассмотренными алгоритмами, сами алгоритмы требуют меньше вычислительных затрат, и следовательно, их использование в системах анализа сигналов ГАЭ является целесообразным и эффективным.
Библиографический список
1. Марапулец Ю.В., Шевцов Б.М. Мезомасштабная акустическая эмиссия. Владивосток: Дальнаука, 2012.
2. Chen S. S., Donoho D. L., Saunders M. A. Atomic decomposition by basis pursuit // SIAM Journal on Scientic Computing. 1998. Vol. 20. №. 1. pp. 33-61.
3. Beck A. and Teboulle M. A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems // Siam J. Imaging Sciences. 2009. Vol. 2. №. 1. pp. 183-202.
4. Goldstein T., Setzer S. High-order methods for basis pursuit. Preprint University of California. Los Angeles, 2010.
5. Mallat S., Zhang Z. Matching pursuits with time-frequency dictionaries // IEEE Transactions on Signal Processing. 1993. 41(12). pp. 3397-3415.
6. Tropp J. A. and Gilbert A. C. Signal recovery from random measurements via orthogonal matching pursuit // IEEE Transactions Information Theory. 2007. Vol. 53. №. 12. pp. 4655-4666.
7. Марапулец Ю.В., Тристанов А.Б. Применение метода разреженной аппроксимации в задачах анализа сигналов геоакустической эмиссии // Цифровая обработка сигналов. 2011. №2. С.13-17.
8. Марапулец Ю.В., Тристанов А.Б. Разреженная аппроксимация акустических временных рядов с использованием частотно-временного словаря Берлаге // Труды Российского научно-технического общества радиотехники, электроники и связи им. А.С. Попова. Серия: Цифровая обработка сигналов и её применение. 2012. Выпуск: XIV; Том 1. С. 91-94.
9. Афанасьева А.А., Луковенкова О.О. Методы обнаружения импульсов геоакустической эмиссии на основе алгоритмов разреженной аппроксимации и кластеризации // Вестник КРАУНЦ. Физико-математические науки. 2013. №2(7). С.68-73.
Поступила в редакцию / Original article submitted: 29.11.2014