Научная статья на тему 'Выбор меры подобия цифровых сигналов для стохастического расчета оптимальных параметров цифрового фильтра'

Выбор меры подобия цифровых сигналов для стохастического расчета оптимальных параметров цифрового фильтра Текст научной статьи по специальности «Электротехника, электронная техника, информационные технологии»

CC BY
412
204
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по электротехнике, электронной технике, информационным технологиям, автор научной работы — Рогоза Валерий Станиславович, Сергеев-Горчинский Алексей Александрович

Рассматривается вопрос выбора меры подобия сигналов для расчета оптимального порядка фильтра нижних частот, который предназначен для выделения низкочастотной составляющей стационарного сигнала, представленного набором дискретных зашумленных значений. Описываются эксперименты по генерированию сигналов с различными характеристиками. Выбранная мера позволяет повысить вероятность стохастического расчета оптимального порядка фильтрации стационарных сигналов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по электротехнике, электронной технике, информационным технологиям , автор научной работы — Рогоза Валерий Станиславович, Сергеев-Горчинский Алексей Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Choise of similarity measures for digital signals stochastic optimal parameters calculation digital filter

The question of the choice of a similarity measure to calculate the optimal signal -order low-pass filter , which is designed to isolate the low-frequency component of the stationary signal, represented by a set of discrete values noisy. Describes experiments to generate signals with different characteristics. Selected measure helps increase the probability of stochastic calculation of the optimal order of the filtering stationary signals.

Текст научной работы на тему «Выбор меры подобия цифровых сигналов для стохастического расчета оптимальных параметров цифрового фильтра»

УДК 681.326:519.713

В.С. РОГОЗА, А.А. СЕРГЕЕВ-ГОРЧИНСКИЙ

ВЫБОР МЕРЫ ПОДОБИЯ ЦИФРОВЫХ СИГНАЛОВ ДЛЯ СТОХАСТИЧЕСКОГО РАСЧЕТА ОПТИМАЛЬНЫХ ПАРАМЕТРОВ ЦИФРОВОГО ФИЛЬТРА

Рассматривается вопрос выбора меры подобия сигналов для расчета оптимального порядка фильтра нижних частот, который предназначен для выделения низкочастотной составляющей стационарного сигнала, представленного набором дискретных зашумленных значений. Описываются эксперименты по генерированию сигналов с различными характеристиками. Выбранная мера позволяет повысить вероятность стохастического расчета оптимального порядка фильтрации стационарных сигналов.

1. Введение

В различных технических задачах требуется сравнение данных, которые в общем случае могут иметь различное представление. Одной из моделей является представление данных в виде временных рядов. В цифровой обработке сигналов при проектировании адаптивных фильтров, осуществляющих подстройку по образцовым сигналам, требуется расчет меры подобия временных рядов, составленных из дискретных значений сигналов [1].

В статье [2] расчет параметров фильтра осуществлялся при сравнении сглаженного и аппроксимированного временных рядов. Для оценки подобия временных рядов было использовано значение среднеквадратичной ошибки (СКО). Следует отметить, что в прикладных методах анализа данных применяются и другие численные показатели подобия временных рядов, которые называются «мерами подобия» [3] либо «мерами близости» [4].

Чтобы проверить целесообразность использования СКО для оценки оптимальности фильтрации [2], была создана программная библиотека для цифровой обработки сигналов. Для оценки подобия были сгенерированы исходные сигналы различной формы и их модифицированные копии, полученные путем добавления к исходным сигналам случайных составляющих (шума) и последующего их сглаживания. Информация о модулях, вошедших в разработанную программную библиотеку, приведена в разделе 2.

В разделе 3 описаны выбранные математические отношения, которые определяют меру подобия двух временных рядов.

В разделе 4 описаны эксперименты, которые были проведены в целях выбора меры, позволяющей повысить вероятность стохастического расчета оптимального порядка фильтрации стационарных сигналов.

В разделе 5 авторы обобщают результаты, полученные в разделе 4.

2. Создание тестовой среды

В процессе исследований была создана библиотека программ для генерирования цифровых сигналов с различными характеристиками и обработки сгенерированных сигналов. Структура библиотеки изображена на рис. 1.

Функции основных модулей библиотеки программ следующие. «Модуль генерирования сигнала» предназначен для генерирования стационарных сигналов и включает генерирование сигнала и шумовой составляющей.

«Модуль генерирования сигнала по функции» реализует программное генерирование сигналов следующих форм: синусоидального, прямоугольного, пилообразного, треугольного. Программная реализация (программный метод) предоставляет возможность настройки амплитуды, частоты и фазы сигнала.

«Модуль генерирования шумовой составляющей» добавлен для приближения формы сигнала к форме возникающей в реальных (естественных) условиях передачи. В модуле реализован метод генерирования случайных чисел с нормальным распределением и

50

возможностью задания значений математического ожидания и среднеквадратичного отклонения.

Рис. 1. Структура созданной библиотеки для цифровой обработки сигналов

Для минимизации шума был создан «Модуль нерекурсивной фильтрации сигнала». В модуле реализован программный метод фильтрации простым скользящим средним (ПСС), который используют для фильтрации шума с нормальным распределением [5]. В фильтре ПСС обработанное значение y(t) в момент времени t определяется соотношением [2]:

I n

y(t)=-• Zx(t - ї), (і)

xi і=і

где n — порядок фильтрации (количество предыдущих исходных значений сигнала, принятых для расчета выходного сигнала в текущей временной точке); x(t-i) - значение исходного сигнала в момент (точка) времени дискретизации t-i; y(t) - сигнал на выходе фильтра в текущий момент времени.

В компоненте «Модуль оценки фильтрации» были реализованы программные методы оценки подобия сигналов (меры подобия): коэффициент корреляции Пирсона, расстояние Евклида, косинусная мера, среднеквадратичная ошибка. Перечисленные методы были объединены в «Модуль оценки подобия сигналов». Для дополнительной оценки значений числовых последовательностей был реализован «Модуль статистической оценки».

Созданная программная библиотека была использована для формирования зашумленных сигналов и их последующей цифровой обработки. Цель выполненных экспериментов была направлена на определение меры подобия сигналов, которая позволяла бы повысить вероятность стохастического расчета оптимального порядка фильтрации стационарных сигналов.

3. Выбор мер подобия

Как было отмечено во введении, при решении технических задач часто возникает необходимость сравнения временных рядов в целях определения степени их близости. Такая близость может быть оценена на основе использования тех или иных мер подобия анализируемых сигналов. Например, к задачам, при решении которых применяются упомянутые меры близости, относятся задачи адаптивной фильтрации, классификации по образцу, обучения по образцу и некоторые другие.

51

В публикациях, касающихся обсуждаемой в данной статье тематики, предложены различные математические соотношения для расчета меры подобия числовых последовательностей, которые можно разделить на такие группы: меры расстояния, угловые меры, корреляционные меры.

Для каждой из трех упомянутых групп мер существует множество вариантов расчета, из которых авторами были выбраны следующие [6, 7]:

1. Коэффициент корреляции Пирсона (Pearson Correlation Coefficient)

2. Расстояние Евклида (Euclidean Distance)

3. Косинусная мера (Cosine Similarity)

4. Среднеквадратичная ошибка (Mean Square Error)

Математические соотношения для перечисленных мер приведены в табл. 1. Все из перечисленных выше мер подобия были реализованы программно.

Расчет математического ожидания для последовательностей значений x(t), y(t) может быть выполнен с использованием следующих соотношений:

X

n

Z x(t),

t=1

1

(2)

Y

n

Z y(),

t=1

1

(3)

где t - момент (точка) времени дискретизации; n - общее количество точек дискретизации сигналов X, Y.

Таблица 1. Математические соотношения для расчета мер подобия двух числовых последовательностей (временных рядов)

Коэффициент корреляции Пирсона Z ((t)-X)y(t)- Y) C(x Y)- t=1 (4)

'-'vS 1 ) і і JZ (x(t)-X) JZ (y(t)-Y)2

Расстояние Евклида D(X,Y)= Z (x(t)-y(t))2 V t=i (5)

Косинусная мера Zx (t ) y(t) S(x Y)= t-1 (6)

I ) . #x(t)2 JZy(t)2

Среднеквадратичная ошибка E(X,Y)-!• Z (x(t)-y(t))2 n t-1 (7)

С помощью разработанной программной библиотеки был сгенерирован тестовый зашумленный синусоидальный сигнал. В табл. 2 приведены характеристики тестового сигнала.

52

Таблица 2

Характеристики тестового сигнала

Форма сигнала Cинусоида

Амплитуда сигнала 3

Частота сигнала 0.1

Распределение шумовой составляющей Нормальное

Среднеквадратичное отклонение 5

Частота дискретизации 0.025

Продолжительность регистрации сигнала 20 с

Отношение сигнал-шум для сгенерированного сигнала было равным 7.809 дБ. Сгенерированный сигнал был сглажен с помощью фильтра ПСС для порядка фильтра n, принимающего значение от 1 до N = 800, где N - выбранное в экспериментах максимальное количество отсчетов (моментов времени дискретизации) зашумленного сигнала. Были рассчитаны значения мер подобия для двух временных рядов (проведено N сравнений): временных рядов исходного незашумленного сигнала и временных рядов зашумленного сглаженного сигнала (при n от 1 до N = 800).

Поскольку косинусная мера и коэффициенты Пирсона принимают значения на отрезке [-1, 1], а значения расстояния Евклида и среднеквадратичной ошибки лежат вне отрезка [-1, 1], для приведения всех мер к одному диапазону значений, к мерам расстояния Евклида и среднеквадратичной ошибки было применено деление на максимальное значение (из возможных) для каждой меры подобия.

Значения нормированных мер подобия изображены на рис. 2. По оси абсцисс отложены значения порядков фильтрации п, по оси ординат - значения мер подобия (рассчитанные при сравнении исходного незашумленного и зашумленного сглаженного временных рядов).

О ■■■!■■ ........ ЦІЦІ Г" Mil nil ЧИ' ' гм- .......... : .........-ITW1 I.HHT-1|"IH——1Г--пг—чиї. ...........— I-nil -..... ....І1І.ІЧТП.1

і Я) ії 4Д М Е£ £> Щ lie L?a 1ЛС 1І2 ШІ76 LSEiM 2І2 224 І36М8 Ж0772 гм зіззгс ззгшзе 35аЗвОЭ9г«4Д16Ч2а«ОЙ2 46Д«е J-33aM51i524 5jCMa5Kl£!2iJJ ще Ивиаб12«4ЬИКЗ£аЭ В??04 П£ 7:а 7М752 1Ы 7ГЄ тва І U Ж й ЕО 6J І» ® « 110ШШ U6l£S170U31W»til8a0AJ»4 27І ili 32« &SB0 ИЗ І7и йбЗМІКрШШшбдЕІ Д?0<ІІ2«4 W6 Е19ІІ0 ЦІ И* E4S EJ6S»«7«114І6 ОІ 6Е'>Є63Ш«6 6М 710 ??: Ш 7І6 7ЇЄ770 7*7 «І

Порядок фильтрации

— — Коэффициент корреляции Пирсона

Расстояние Евклида

Косинусная мера

— Среднеквадратичная ошибка

Рис. 2. Значения мер подобия сигналов (ось ординат) для разных порядков фильтрации (п от 1 до N=

800) (ось абсцисс)

53

Поскольку среди мер, анализируемых в экспериментах, было использовано расстояние Евклида, для которого оптимальным является наименьшее значение, то за основу было принято следующее общее условие оптимума: для выбранных мер подобия оптимальным является минимальное возможное значение. Для того чтобы привести все меры к одному условию оптимума, значения меры корреляции Пирсона (допустимые на отрезке [-1, 1]) и косинусной меры (допустимые на отрезке [-1, 1]) вычитались из единицы.

После приведения мер к общему условию оптимума и выполнения необходимых расчетов были построены графики, отображающие нормированные значения мер подобия сигналов (рис. 3). По оси абсцисс отложены значения порядков фильтрации п, по оси ординат -нормированные значения мер.

Рис. 3. Значения мер подобия сигналов (ось ординат) для разных порядков фильтрации (п от 1 до N=

800) (ось абсцисс)

Из рис. 3 видно, что значения выбранных мер подобия имеют по одному глобальному оптимуму, т. е. могут быть рассмотрены в качестве целевых функций.

На рис. 4 изображены гистограммы, которые построены для количества порядков фильтрации из рис. 3. По оси абсцисс отложены значения нормированных мер подобия [0, 1], а по оси ординат - количества порядков фильтрации, при которых было получено значение меры.

Из рис. 4 видно, что отношение оптимальных и неоптимальных порядков фильтрации ПСС варьируется для разных мер подобия.

Для оценки распределения последовательности значений в теории вероятностей используется мера эксцесса, определяемая вторым из приведенных ниже соотношений:

__ 1 N

M = N • LM("). (8)

N __

N • Z (M(n)-M)4

ЄЛ = -^--------------, (9)

(Z (M(n)-M))

n=1

где N - общее количество моментов времени дискретизации исходного (сгенерированного) сигнала; M( n ) - значение меры подобия для порядка фильтрации n.

54

Рис. 4. Количество порядков фильтрации (n от 1 до N = 800) (ось ординат) с равным значением мер

подобия (ось абсцисс)

Эксцесс позволяет измерить остроту пика распределения значений ряда, а в нашем случае - значений мер подобия для порядков фильтрации от 1 до N = 800.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В [2] при расчете оптимальных параметров цифрового фильтра были выделены два лучших алгоритма: рой частиц и генетический алгоритм. В обоих алгоритмах поиск начинался с генерирования заданного количества начальных значений n (порядка фильтрации) и m (порядка аппроксимации). В контексте текущей статьи может быть выбрано 800 значений n (порядка фильтрации), каждое с вероятностью 0.00125.

Как отмечено выше, эксцесс позволяет численно определить остроту пика распределения значений порядков фильтрации. Можно сделать вывод, что при увеличении значения эксцесса будет увеличиваться количество порядков фильтрации с одинаковым значением меры подобия (их вероятность будет увеличиваться), при этом вероятность нахождения глобального оптимума будет уменьшаться.

Приведем далее результаты вычисления значений эксцесса для сигналов разной формы и разных уровней шумовой составляющей.

4. Сравнение мер подобия

Выше мы предложили использовать значение эксцесса для оценки мер подобия при разных порядках n фильтрации. Рассмотрим этот вопрос более внимательно. В результате выполненных нами экспериментов были сгенерированы сигналы имеющие шумовую составляющую с различной величиной среднеквадратичного отклонения о . На рис. 5 приведены значения эксцесса мер подобия сигналов: исходного незашумленного и зашумленного сглаженного (для значений о, выбранных в пределах от 1 до 50). По оси абсцисс отложены значения о, по оси ординат - значения эксцесса мер подобия для разных порядков фильтрации от 1 до N = 800.

В целях полноты экспериментов количество форм тестовых сигналов было расширено до четырех: синусоидального, прямоугольного, треугольного и пилообразного. Для всех этих форм сигналов в табл. 3 приведены значения математического ожидания эксцесса для мер подобия сигналов: исходного незашумленного и зашумленного сглаженного (о = 1 ... 50).

55

45

0 -I-р-1-1-1-1-1--1-1-1--1-1-1--1-1-1--1-1-1--1-1-1--1-1-1--1-1--1-1-1--1-1-1--1-1-1--■-1-1--1---1--1-1-«--1-1-1--1-

L 2 3 4 5 6 7 Є 9 1C 11 12 1Ї 14 15 16 17 IS 23 21 22 23 24 ffi 25 27 2S 29 30 31 32 33 34 35 36 37 30 39 40 41 *2 43 44 45 41 47 43 43 50

Значение среднеквадратичного отклонения

— Коэффициент корреляции Пирсона

Расстояние Евклида

Косинусная мера

Среднеквадратичная ошибка

Рис. 5. Значения эксцесса (ось ординат) для мер подобия сигналов: исходного незашумленного и зашумленного сглаженного (О = 1... 50) - ось абсцисс

Таблица 3

Значения математического ожидание эксцесса для мер подобия сигналов

Форма сигнала

Мера подобия Синусоидальная Прямоугольная Треугольная Пилообразная

Коэффициент корреляции Пирсона 25.73 22.69 28.71 26.51

Расстояние Евклида 3.98 4.18 4.11 4.01

Косинусная мера 26.16 25.03 27.34 28.31

Среднеквадратичная ошибка 3.77 4.03 3.73 3.85

Оценив средние значения эксцесса для мер подобия, приведенные в таблице 2 и на рис. 5 , можно сделать следующие выводы:

1. Среднеквадратичная ошибка как мера подобия сигналов имеет наименьшее среднее значение эксцесса, следовательно, позволяет повысить вероятность стохастического расчета оптимального порядка фильтрации.

2. По среднему значению эксцесса рассмотренные меры подобия можно разделить на две группы:

расстояние Евклида и среднеквадратичная ошибка; коэффициент корреляции Пирсона и косинусная мера.

5. Выводы

Сравнение сигналов требуется при решении различных технических задач, в том числе при проектировании адаптивных цифровых фильтров. Формальной оценкой степени близости сигналов может служить мера подобия, определенная тем или иным способом. От выбора меры подобия зависит то, насколько оптимальным будет решение вопроса о порядке фильтра.

Для того чтобы исследовать данный вопрос, была создана тестовая среда (программная библиотека), включающая в себя модули, генерирующие сигналы разной формы, и модули анализирующие эти сигналы. Основными компонентами библиотеки являются: модуль генерирования сигнала (генерирования сигнала по функции, генерирования шумовой

56

составляющей), модуль нерекурсивной фильтрации, модуль оценки качества фильтрации (оценки подобия сигналов и статистической оценки).

Для оценки изменения значений мер подобия для разных сигналов с помощью разработанной библиотеки были сгенерированы сигналы следующих форм: синусоидальный, прямоугольный, треугольный и пилообразный. К сгенерированным значениям была добавлена случайная составляющая (шум), после чего полученный сигнал был сглажен с помощью нерекурсивного фильтра. Показано, что применяя к зашумленному сигналу фильтрацию с разным порядком, можно найти порядок, при котором мера подобия принимает наименьшее значение (при этих условиях порядок фильтрации можно считать оптимальным).

Для сравнения мер подобия предложено использовать эксцесс. В результате оценки значений эксцесса при различных уровнях шума было установлено, что: 1) рассмотренные меры по среднему значению эксцесса можно разделить на две группы; 2) мера среднеквадратичной ошибки имеет наименьшее значение эксцесса. Кроме того, из результатов экспериментов следует, что среднеквадратичная ошибка позволяет повысить вероятность стохастического расчета оптимального порядка фильтрации стационарных сигналов.

Реализованная библиотека может быть использована для экспериментальной обработки цифровых сигналов в различных технических задачах.

Список литературы: 1. Сергиенко А. Цифровая обработка сигналов. Санкт-Петербург: БХВ-Петер-бург, 2011. С. 593-595. 2. Rogoza V., Sergeev A. The Comparison of the Stochastic Algorithms for the Filter Parameters Calculation, Springer, Advances in Systems Science. Switzerland, 2014. Vol. 240. Р. 241-250. 3. Cha S., Comprehensive Survey on Distance / Similarity Measures between Probability Density Functions, M3AS, Issue 4. Singapore, 2007. Vol. 1. Р. 300-307. 4. Загоруйко Н. Прикладные методы анализа данных и знаний. Новосибирск, 1999. С. 195-199. 5. Wang D., Ronsin J., Veronique H. Compared performances of morphological, median type and running mean filters, SPIE, Vol. 1818, 1992. Р. 384-391. 6.XuR., WunschD. Survey of Clustering Algorithms, IEEE Transactions on Neural Networks. 2005. Vol. 16. No. 3. Р. 645-678. 7. Окунь Я. Факторный анализ. Москва, 1974. С. 52-57. 8. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики. М.: Наука, 1969. С. 85-94.

Поступила в редколлегию 20.10.2013

Рогоза Валерий Станиславович, д-р техн. наук, профессор кафедры системного проектирования института прикладного системного анализа НТУУ “КПИ”. Адрес: Украина, 03056, Киев, ул. Панаса Мирного, 19, тел./факс: +380688100428. E-mail: alexey. horchynskyi@yahoo.com.

Сергеев-Г орчинский Алексей Александрович, аспирант кафедры системного проектирования института прикладного системного анализа НТУУ “КПИ”. Адрес: Украина, 03056, Киев, ул. Панаса Мирного, 19. E-mail: alexey.horchynskyi@yahoo.com.

57

i Надоели баннеры? Вы всегда можете отключить рекламу.