Научная статья на тему 'Методика и алгоритм автоматической классификации сигналов'

Методика и алгоритм автоматической классификации сигналов Текст научной статьи по специальности «Математика»

CC BY
202
59
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Кошеков Кайрат Темирбаевич

Предлагаются методика и алгоритм автоматической классификации сигналов, предназначенные для использования в интеллектуальных средствах измерения, контроля, управления и диагностики. Разделение множества сигналов проводится по идентификационным параметрам распределений, в результате чего образуются группы, объединенные отношениями вида «периодические сигналы с большим или малым разрешением», «смеси с большим и малым отношением сигнал-шум» и «случайные сигналы с ограниченными и неограниченными распределениями».

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методика и алгоритм автоматической классификации сигналов»

УДК 621.317.3(024)

К.Т. Кошеков

МЕТОДИКА И АЛГОРИТМ АВТОМАТИЧЕСКОЙ КЛАССИФИКАЦИИ

СИГНАЛОВ

Предлагаются методика и алгоритм автоматической классификации сигналов, предназначенные для использования в интеллектуальных средствах измерения, контроля, управления и диагностики. Разделение множества сигналов проводится по идентификационным параметрам распределений, в результате чего образуются группы, объединенные отношениями вида «периодические сигналы с большим или малым разрешением», «смеси с большим и малым отношением сигнал-шум» и «случайные сигналы с ограниченными и неограниченными распределениями».

Интеллектуальные средства измерения, классификации сигналов

K.T. Koshekov

SIGNALS AUTOMATIC CLASSIFICATION METHODOLOGY AND ALGORITHM

The article presents methodology and algorithm of signals’ automatic classification intended for using them in intellectual measuring means, control, operation and diagnostics. Separation of great number of signals are held according to distribution of parameters, as a result groups united with the relation like «periodic signals with great and little solution», «compound with great and little relation of signal-noise» and «casual signals with limited and unlimited distribution» are formed.

Intellectual measuring instrumentation, signal classification

При разработке интеллектуальных средств измерения, контроля и диагностики возникает необходимость в автоматическом разделении исходной группы сигналов на некоторое количество классов, объединяющих попавшие в них реализации по определенному качественному признаку. Для примера можно привести задачу кардиологического обследования пациентов, при котором требуется классифицировать кардиограммы по 4-5 диагностическим признакам, описывающим различные состояния человека из диапазона понятий «здоровый - больной». Подобная ситуация имеет место и при технической диагностике, например, подшипников колесно-моторных пар и редукторов.

В настоящее время наиболее распространенным методом анализа диагностических сигналов является спектральный анализ. При этом вполне обоснованно предполагается, что между состояниями объекта диагностики и формой спектральной характеристики сигнала существует логическая связь, используя которую, можно сформировать количественные критерии, описывающие изменения состояния. Однако спектральному

анализу присущ ряд недостатков общеметодического и специального характера, к которым, в частности, относится отсутствие инструментов непосредственного измерения формы спектра, в результате чего приходится измерять множество частных спектральных параметров и связывать их оценки с исследуемым свойством сложными логическими построениями.

В последние годы успешно развивается подход, связанный с анализом фрактальных свойств сигналов во временной области. При этом в качестве интегральной числовой характеристики качественного состояния объекта выступает так называемая фрактальная размерность. Классификационная мощность этого понятия доказана рядом исследований [1]. Однако фрактальный анализ, в его классической постановке по Херсту - Мандельброту, не различает периодических и стационарных случайных сигналов и их смесей. Поэтому приходится искать новые, более универсальные пути решения задачи классификации сигналов и, соответственно, свойств объектов, которые эти сигналы представляют.

В данной работе описаны методика и алгоритм автоматической классификации сигналов, основанные на теории идентификационных шкал. Эта теория является альтернативой спектрального и развитием фрактального анализа.

Теория идентификационных шкал обосновывает возможность построения порядковых шкал как для распределений мгновенных значений (РМЗ) [2, 3] сигналов, так и для распределений их временных интервалов (РВИ) [4, 5].

Идентификационные шкалы (ИШ) с математической точки зрения отображают множество чисел, например, временной ряд наблюдений, объема К, в одно число -идентификационный параметр (ЫР), с присоединением к нему (посредством логического вывода) качественной характеристики в виде имени распределения (I).

Имена распределений и связанные с ними численные оценки идентификационных параметров образуют реляционную базу данных (БД). Управление такой БД состоит в пересортировке первоначального списка имен и их фильтрации. При упорядочивании чисел (ЫР) автоматически ранжируются имена (I) и, соответственно, те свойства объекта или процесса, которые эти имена и числа представляют.

Таким образом, в ИШ происходит объединение технологии измерения и технологии БД для решения задач распознавания образов.

Предлагаемый алгоритм (см. рисунок) классификации сигналов использует идентификационные параметры, математические модели и физический смысл которых представлены в табл. 1.

На основе данных моделей был разработан виртуальный прибор (ВП), в котором исходный, непрерывный во времени сигнал Х(^) после аналого-цифрового преобразования представляется в виде дискретной выборочной реализации объема N и записывается в файловом формате в память компьютера. Все необходимые для определения идентификационных параметров вычислительные операции реализуются на программном уровне.

Таблица 1

Модели идентификационных параметров

№ п/п Имя IdP Обозн. IdP Физический смысл ИР Математическая модель

1 Виртуальный объем NF Измерение формы распределения мгновенных значений сигнала Х(/) NF — (Xmax Xmin) 1 _ D ’ где Xmax — max{X(Ob Xmin — min{X(0! . D — -N Y (X - X0)2 - выборочная диперсия, (Xmax - Xmin) - размах сигнала,

N - объем выборки

2 Коэффициент вариабельности К-1 Измерение среднего значения относительной скорости сигнала к = - ьх (і) X (і )|

3 Коэффициент вариабельности К-2 Измерение среднего значения относительного ускорения сигнала К =- Д[ДХ (1)] |Д[ X (І )]|

4 Коэффициент связи М Вычисляемый ИР, характеризирующий связь между частотновременными распределениями скорости и ускорения ^ 1 г4 II

Базовый алгоритм классификации сигналов

Процедура классификации выполняется логическим анализатором (ЛА). В структурном отношении ЛА представляет собой обычную реляционную БД, записями которой являются имена файлов выборочных реализаций сигналов, а полями - имена идентификационных параметров (КБ, К1, К2, М). В ячейки БД (на пересечении строк и столбцов) записываются численные оценки идентификационных параметров. Анализ сочетаний значений идентификационных параметров позволяет определить - по какому из 9 направлений (Р1, Р2, Р3, Р4, С1, С2, С3, Ю, Я2) фильтруется данная запись. Каждое направление имеет свой собственный адрес. Адрес образуется путем перечисления единиц и нулей, соответствующих выполнению условий (Да ^ «1», Нет ^ «0») при прохождении алгоритма (см. рисунок) от входа до выхода. Разрядность адреса определяет «длину пути» прохождения анализа. Чем больше разрядность адреса, тем более «точно» определяется

некоторое свойство сигнала, например, в том смысле, что увеличивается число различимых градаций интенсивности проявления данного свойства. Если разрядность адресов всех выходных направлений одинакова, то подобный алгоритм будем называть алгоритмом с равномерной дискретизацией (квантованием) свойств.

Если в БД имеется множество записей, идентификационные параметры которых полностью покрывают диапазоны возможных значений ИР{4<№'<2К; 0<(К1, К2)<2}, то такую БД будем называть представительной. Сигналы, на основе анализа которых формируется представительная БД, называются эталонами БД. Подразумевается, что для эталонов известны не только оценки их идентификационных параметров, но также другие характеристики, в том числе и качественные.

Чтобы проиллюстрировать основные особенности предлагаемого алгоритма, рассмотрим технологию его использования, состоящую из двух этапов.

Первый этап заключается в создании эталонной БД и фиксации фильтрующих свойств принятого алгоритма. Для этого формируется эталонная БД, состоящая из списка сигналов, состояние которых охватывает максимально возможный диапазон в направлении эволюции этих сигналов - от периодических до случайных. Затем, путем применения стандартных операций упорядочения и фильтрации записей по идентификационным параметрам, выявляются закономерности в структуре созданной БД. В табл. 2 для примера показан фрагмент БД, соответствующий реализации двух условий (К1<1 ^ Да, №<=4 ^ Да, адрес направления Р1 ^ 11) алгоритма.

Второй этап состоит в распознавании образцов сигналов, которые отсутствуют в начальной БД. В этом случае измеряются идентификационные параметры исследуемого образца сигнала и прослеживается адрес, по которому этот сигнал будет отфильтрован алгоритмом. Желательно, чтобы исследуемый сигнал принадлежал той же предметной области, что и эталонные, тогда ему приписываются, полностью или частично, свойства тех эталонных сигналов, которые фильтруются по этому же направлению.

Таблица 2

Фрагмент сортированной по параметру М БД (первые 4 столбца) и список имен сигналов (вторые 4 столбца), отфильтрованных алгоритмом по направлению Р1

№ FileName ^1 ^2 № FileName ^1 ^2

17 squ-1 0,00002 1,00002 48 ^і 1 0,00008 0,00004

34 sin 1 0,000063 0,000063 34 sin 1 0,000063 0,000063

47 cos 1 0,000063 0,000063 47 cos 1 0,000063 0,000063

48 ^ 1 0,00008 0,00004 49 ^ 10 0,0008 0,0004

61 saw 1 0,00008 1,00002 35 sin 10 0,000628 0,000628

18 squ-10 0,00038 1,900038 46 cos 10 0,000628 0,000628

35 sin 10 0,000628 0,000628 50 ^100 0,008 0,004

46 cos 10 0,000628 0,000628 36 sin100 0,006283 0,006283

49 ^ 10 0,0008 0,0004 45 cos100 0,006283 0,006283

60 saw 10 0,0008 1,00011 51 ^1000 0,08 0,040001

19 squ-100 0,00398 1,99004 44 cos1000 0,062853 0,062789

74 gaus+squ-100-500 0,006237 1,901749 37 sin1000 0,062852 0,062792

36 sin 100 0,006283 0,006283 52 ^ 10000 0,666665 0,50001

45 cos100 0,006283 0,006283 43 cos10000 0,618037 0,618026

75 gaus+squ-100-400 0,006801 1,887415 38 sin10000 0,618031 0,618042

73 lapl+squ-100-500 0,006975 1,887164 89 gaus+tri-100-500 0,008399 0,934698

76 gaus+squ-100-300 0,007743 1,868228 17 squ-1 0,00002 1,00002

59 saw100 0,007992 1,001011 61 saw 1 0,00008 1,00002

50 ^і100 0,008 0,004 60 saw 10 0,0008 1,00011

89 gaus+tri-100-500 0,008399 0,934698 59 Saw100 0,007992 1,001011

90 gaus+tri-100-400 0,008909 1,100704 58 saw1000 0,079197 1,010111

72 lapl+squ-100-300 0,00897 1,853853 90 gaus+tri-100-400 0,008909 1,100704

102 gaus+saw-100-500 0,009592 1,649344 57 saw10000 0,720003 1,111123

77 gaus+squ-100-200 0,009625 1,840981 91 gaus+tri-100-300 0,010086 1,296536

Анализ выходного состояния БД (табл. 2) показывает, что:

• По направлению Р1 фильтруются исключительно периодические сигналы прямоугольной (Squ) формы с числом периодов от 1 до 25000, что соответствует разрешению г>=4 (N=100000). Эта часть БД представляет идеальное (желаемое) ее состояние.

• Отклонения от идеальности проявляются в наличии «посторонних» записей, представляющих сигналы смесей типа §аш+Ш-100-(500-400-300), где первое число 100 определяет количество периодов сигнала, а числа в скобках - отношение сигнал-шум (ОСШ). Данную ситуацию можно интерпретировать таким образом, что классификационная система при таких больших значениях 0СШ>=300, нечувствительна к наличию шумовой компоненты и воспринимает эти смеси как чисто периодические сигналы треугольной формы. Следовательно, указанную оценку ОСШ можно интерпретировать как критерий перехода сигнала из класса смесей в класс периодических сигналов.

• Возможность фильтрации «посторонних» записей связана с введением дополнительного условия по идентификационному параметру, отличному от К1, К2. Введение дополнительных условий на выходах алгоритма позволяет увеличить количество направлений и, соответственно, провести более детальную классификацию сигналов.

Величины К1, К2 можно рассматривать как проекции двухкомпонентного идентификационного вектора на плоскости Х0У и, следовательно, использовать для решения задач идентификации векторные понятия модуля и фазы. Соответственно, частотные зависимости модуля и фазы будут являться аналогами амплитудо- и фазочастотных характеристик (АЧХ и ФЧХ) исследуемых сигналов. Например, для синусоидального и прямоугольного (типа меандр) сигналов идентификационные векторы описываются, соответственно, уравнениями:

г 2^р2Р

К(мп) = К5т ехрС/ф^) = к—— ехр(уп/4);

N (1)

К^и) = Кщи ехр О'ф^ ) = — ехр (7'п / 2),

4Р N

где Б>1 - число периодов на интервале наблюдения N. Из (1), в частности, можно оценить максимальное число периодов сигнала, укладывающихся на интервале наблюдения К, при котором сигнал переходит из класса регулярных в класс хаотических. Этому условию

N N

отвечает равенство: К=1, и тогда ^шах =—, Д^и = —. Соответственно, разрешение будет

составлять для синусоидального сигнала примерно 7 отсчетов, а для прямоугольного - 4 отсчета на периоде.

Интересно, что для случайных сигналов фазовая характеристика варьируется в зависимости от формы распределения в диапазоне от 48 до 64 градусов, а модуль примерно одинаков и близок по значению к ->/5 ^2,236 (за исключением распределения

Коши, для которого модуль примерно равен л/7 ^2,646). Таким образом, если необходимо, то можно с помощью данных идентификационных параметров разделять случайные сигналы по форме их распределений вероятности.

В табл. 3 представлено описание всех выходных направлений алгоритма. Расположение направлений и симметрия структуры алгоритма позволяют выделить общее направление (при движении слева - направо) эволюции сигналов от чисто периодических

к случайным. В качестве упорядочивающего фактора выступает отношение сигнал-шум для смесей или разрешение для периодических сигналов.

Предложенный алгоритм имеет иерархическую классификационную структуру, отличающуюся от известных подобных построений тем, что она допускает «послойную» детализацию с делением групп на подгруппы, причем внутри каждого слоя наблюдается упорядоченность описаний по «горизонтали». Дальнейшая детализация производится введением дополнительных условий по идентификационным параметрам (К1,К2 или их комбинаций, например, в форме отношения К2/К1) на входах направлений.

Если иерархичность классификационной структуры отражает взаимосвязь ее компонент, то «горизонтальная» упорядоченность служит подтверждением фундаментальной закономерности - эволюции сигналов в направлении от детерминированности (периодические сигналы) к хаосу (стационарные случайные сигналы).

Таблица 3

Классификационные характеристики сигналов, отфильтрованных алгоритмом

№ п/п Имя направления и количество сигналов Адрес направл ения Имена переключателей и их параметры Качественная характеристика сигналов

1 P1; (24) 11 K1<1;K2<=1,34 Периодические сигналы синусоидальной (sin), треугольной (tri) и пилообразной (saw) формы с разрешением r>=10

2 C1; (46) 100 K1<1;K2>1,34 AND K2<1,9 Cмеси c ОСШ>1

3 P2; (7) 101 K1<1;K2>=1,9 Периодические сигналы прямоугольной формы (squ) с разрешением r>=4

4 P3; (8) 01 K1>=1; K2=<1,34 Периодические сигналы синусоидальной (sin), треугольной (tri) и пилообразной (saw) формы низкого разрешения (r<=5)

5 R1; C2;(27) 000 K1>=1; K2>1,34 AND K2<1,9 Случайные сигналы с немодальными распределениями аркс, равн, симп, норм, лапл, формы, а также смеси случайных сигналов, смеси случайных и периодических сигналов с ОСШ<1

6 R2; (2) 001 K1>=1;K2>=1,9 Случайные сигналы с модальными распределениями вида 2мод и Коши формы

Поскольку классификационные признаки алгоритма являются измеримыми величинами, то и вся модель становится объективной и относительно независимой от интуитивных соображений создателей других подобных классификаторов.

Практическое применение предложенного алгоритма связано с созданием «интеллектуальных» виртуальных приборов (ВП), автоматически выбирающих (в зависимости от формы входного сигнала) алгоритмы обработки. Подобные ВП обладают свойством адаптивности не только в отношении количественных изменений параметров сдвига, масштаба и частоты сигнала, но и в отношении его интегральных, качественных характеристик.

ЛИТЕРАТУРА

1. Федер Е. Фракталы / Е. Федер. М.: Мир, 1991. 231 с.

2. Кликушин Ю.Н. Нечеткая идентификация формы распределения вероятностей / Ю.Н. Кликушин // Измерительная техника. 1992. № 9. С. 4-7.

3. Кликушин Ю.Н. Классификационные шкалы для распределений вероятности: Интернет-статья / Ю.Н. Кликушин // Радиоэлектроника. 2000. № 11 (ноябрь). С. 16-25.

4. Гуменюк А.С. Виртуальный прибор для исследования эволюции аддитивной смеси сигнал-шум / А.С. Гуменюк, Р.В. Данилюк, Ю.Н. Кликушин // Динамика систем, механизмов и машин: материалы 5-й Междунар. науч.-техн. конф.: в 2 кн. Омск: ОмГТУ, 2004. Кн. 1. С. 373-376.

5. Кликушин Ю. Н. Модель роста популяции в задаче автоматической классификации сигналов / Ю.Н. Кликушин, К.Т. Кошеков // Омский научный вестник. Омск: ОмГТУ, 2005. № 4(33). С. 160-163.

Кошеков Кайрат Темирбаевич -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

кандидат технических наук, доцент,

декан факультета энергетики и машиностроения

Северо-Казахстанского государственного университета им. М. Козыбаева, г. Петропавловск

Статья поступила в редакцию 26.02.08, принята к опубликованию 25.04.08

i Надоели баннеры? Вы всегда можете отключить рекламу.