Классификация и распознавание сигналов систем радиосвязи
при помощи самоорганизующихся карт Кохонена с различными топологиями выходного слоя и алгоритмами обучения
ПРИ МОНИТОРИНГЕ СИСТЕМ РАДИОСВЯЗИ (СР) БОЛЬШУЮ АКТУАЛЬНОСТЬ ИМЕЕТ ЗАДАЧА КЛАССИФИКАЦИИ СИГНАЛОВ ОТ РАЗЛИЧНЫХ ИСТОЧНИКОВ С ЦЕЛЬЮ ВЫЯВЛЕНИЯ РЕДКИХ, НЕТИПИЧНЫХ ИСТОЧНИКОВ РАДИОИЗЛУЧЕНИЙ И ПРЕДОТВРАЩЕНИЯ НЕСАНКЦИОНИРОВАННОГО ЗАНЯТИЯ ЭФИРА. ЗАДАЧА КЛАССИФИКАЦИИ СИГНАЛОВ СР СОСТОИТ В РАЗЛИЧЕНИИ СИГНАЛОВ ОТ РАЗЛИЧНЫХ ИСТОЧНИКОВ.
скорости [1, 2]. К структурно-временным параметрам относятся длительность и вид синхропреамбулы и завершающего участка сигнала.
В настоящей работе был проведен эксперимент по классификации и распознаванию сигналов СР. Типичный вид частотно-детектированного сигнала исследуемой СР представлен на рис. 1.
Сигнал состоит из следующих структурных составляющих: начального участка немо-дулированной несущей, информационного участка и сквелч-окончания.
У некоторых сигналов отсутствуют определенные структурные составляющие, например, начальный участок немодулированной несущей (см. рис. 2).
В начале некоторых сигналов может наблюдаться выраженный переходный процесс (см. рис. 3).
В качестве входных параметров для алгоритма классификации были использованы длительности начального и конечного участков сигналов и средние значения девиации частоты, поскольку в ходе предварительных экспериментов было выяснено, что данные параметры сигналов исследуемой СР содержат в себе индивидуальные идентификационные признаки источников этих сигналов. Данные параметры сигналов определялись с помощью СПО регистрации и обработки радиоизлучений [6].
Для решения задачи классификации сигналов СР по совокупности параметров, раз-
Терешонок М.В.,
МТУСИ
Смодулированная несущая
В качестве идентификационных признаков сигналов СР могут использоваться как частотные, так и структурно-временные параметры, зависящие от параметров конкретных радиостанций, излучающих данные сигналы. К частотным параметрам требуемого типа относится точное значение модуляционной
Сквелч-окончание
Информационный сигнал
Рис. 1. Вид частотно-детектированного сигнала СР
Информационный сигнал
Сквелччжончание
Рис. 2. Сигнал без участка несущей
Информационный сигнал
Сквелч-окончаиие
Рис. 3. Сигнал с переходным процессом
личных по своей природе, удобно использовать математический аппарат искусственных нейронных сетей [3].
При использовании нейронных сетей, обучающихся с учителем (РБФ-сети, многослойного перцептрона) возникает необходимость экспертной классификации сигналов, использующихся для обучения многослойного перцептрона и построения РБФ-сети [4]. Процедура экспертной классификации производится вручную, что снижает степень автоматизации процесса обучения нейронной сети. Необходимость экспертной классификации сигналов отпадает при использовании нейросетей, обучающихся без учителя, — самоорганизующихся карт Кохонена [5].
Самоорганизующиеся карты Кохонена (КК) [5] являются одной из разновидностей нейросетевых структур. Особенностью КК является то, что данный вид искусственных нейронных сетей (ИНС) обучается без учителя, то есть не требует формирования обучающей выборки с априорной привязкой сигналов к целевым классам объектов. Основой функционирования КК является алгоритм самоорганизующихся карт (Self Organizing Maps, SOM), который представляет собой один из вариантов кластеризации многомерных векторов [8].
Алгоритм SOM состоит из последовательной коррекции векторов, представляющих собой нейроны следующим образом:
1. Выбирается один из векторов обучающей выборки х случайным образом.
2. Определяется нейрон-победитель wc.
с = argmin(||x(t) — w,(
H (t) = h (rc — r\, t )a(t),
где г — определяет положение нейрона в сетке,
^ > *) = е () — функция расстояния,
а(А — радиус обучения, ¿(/, с) = || гс - г/|| —
расстояние между нейроном победителем и ным нейроном, а(А — функция скорости обучения.
Как видно из написанного выше, эффективность работы алгоритма определяется выбором функций изменения скорости обучения а(() и радиуса обучения а^). Радиус и скорость обучения в зависимости от номера цикла f обучения меняются следующим образом:
a(t + \)=а (t) Sa, Sa< I,
a(t + 1)=a(t) Sa, Sa< 1,
(9)
(10)
обычно значения констант §а и 8а выбираются равными 0,9999.
На рис. 4 представлена зависимость функции расстояния Ь/ от номера цикла / обучения при следующих значениях: = 2,
а(0) = 4, 5а = 0,9999, I = 1...10000.
(1)
где і — номер нейрона, Г — номер цикла обучения.
3. Производится корректировка весов КК по формуле:
м>.(/ +1) = + Н(/) • (х(Р, - ы (/)), (2)
где f — номер эпохи. Функция Н($ называется функцией соседства нейронов, которую можно разделить на функцию расстояния и функцию скорости обучения, и определяется
Развитием метода обучения SOM является метод PLSOM (Parameter-Less SOM). Идея метода PLSOM [7] заключается в том, что скорость и радиус обучения должны изменять свое значение не в зависимости от номера цикла обучения, а в зависимости от того, насколько хорошо КК описывает пространство входных векторов. В качестве меры, определяющей, насколько хорошо КК описывает пространство входных векторов, используется функция:
(11)
(8)
E(t)= ,
pit)
где p(t) = max (||x(t) - wc(t)||, p(t - 1)), а p(0) = |х(0) - wc(0) ||. Значение данной функции характеризует, насколько большая коррекция требуется весам нейрона-победителя на шаге t по сравнению с предыдущим шагом обучения t - 1. При большом значении E(t) требуется значительная реорганизация КК (коррекция весов большого количества нейронов карты), а малое значение E(t) говорит о том, что КК достаточно хорошо описывает пространство входных векторов.
Алгоритм PLSOM использует при обучении предопределенный радиус обучения a(t),
то есть е(А = еоп$1У I. Таким образом, функция расстояния для /-го нейрона КК определяется следующим образом:
h (d, t ) = exp
—d (i, c )2 ®(t )2
(12)
где 0(0 = а(0 • є(А, при 0(г) > 0тіп, 0тіп — минимальный радиус обучения (обычно равный 1). Коррекция весов при алгоритме обучения PLSOM происходит в следующем порядке:
wt (t +1) = w,-(t) + є(t) ■ h( t) x
x( x(t) — wi(t)).
(13)
Как видно из выражения (13), вместо параметра скорости обучения a(t) алгоритм обучения PLSOM использует параметр E(t).
Анализ алгоритма PLSOM показывает, что работа данного алгоритма аналогична работе алгоритма обучения нейронных сетей, реализующего метод сопряженных градиентов Флетчера-Ривса [8]. Общим в работе этих алгоритмов является то, что для нахождения нового направления поиска (в методе сопряженных градиентов) или определения окрестности обучения (в алгоритме PLSOM) вычисляется переменная от t, являющаяся отношением искомого параметра (направление поиска или размер окрестности обучения) на данной итерации к искомому параметру на предыдущей итерации. Анализ работ по использованию метода сопряженных градиентов Флетчера-Ривса для обучения искусственных нейронных сетей показал, что выбор тактики обучения с учетом предыдущих итераций обучения позволяет проводить обучение более эффективно и качественно, чем при методах, не учитывающих предыдущие итерации. Таким образом, можно предположить, что алгоритм обучения КК PLSOM окажется эффективнее стандартного алгоритма SOM.
Подход к решению задачи классификации сигналов СР при помощи самоорганизующейся карты Кохонена можно сформулировать следующим образом:
1. Определить перечисленные выше параметры каждого сигнала.
2. По совокупности измеренных параметров сформировать для каждого сигнала вектор признаков.
3. Построить и обучить карту Кохонена, используя для обучения векторы признаков для всех сигналов.
4. Классифицировать сигналы при помощи обученной карты Кохонена.
Оценка применимости и сравнительный анализ эффективности вышеописанных мето-
дов обучения КК проводился в условиях следующих исходных данных:
• количество классов радиосигналов —11;
• количество признаков радиосигнала —5;
• количество сигналов в выборке — 64;
• минимальное количество сигналов в одном классе — 2.
Анализировались четыре варианты карт Кохонена:
• одномерная карта Кохонена с алгоритмом обучения SOM;
• двухмерная тетрагональная КК с алгоритмом обучения SOM;
• двухмерная гексагональная КК с алгоритмом обучения SOM;
• одномерная карта Кохонена с алгоритмом обучения PLSOM.
Исследованию подверглись КК с различным количеством нейронов и при различном количестве циклов обучения. Оценка правильности кластеризации проводилась путем сравнения результатов кластерной классификации тестовых данных при помощи карты Кохонена с результатами экспертной классификации тестовых данных. Эксперимент проводился с помощью СПО интеллектуального анализа данных
[9].
В целом результат проведённой в ходе эксперимента классификации сигналов СР при помощи карты Кохонена с высокой степенью достоверности (более 95%) совпадает с экспертной оценкой исследуемых сигналов. Сигналы, отнесённые экспертом к одному классу, карта Кохонена также помещает в один кластер (или в близкие кластеры), при этом сигналы, отнесенные экспертом к разным классам, карта Кохонена помещает в разные кластеры. Достигнутая в ходе эксперимента скорость обучения КК позволяет использовать аппарат карт Кохонена в системах реального времени выполнения.
При сравнительном анализе эффективности различных топологий и алгоритмов обучения карты Кохонена были выявлены следующие закономерности. Анализ результатов кластеризации сигналов одномерной КК по алгоритму SOM показал, что при всех поставленных экспериментах в среднем в двух кластерах наблюдается смешение сигналов разных классов. Увеличение числа нейронов КК на 10% и количества циклов обучения на порядок не обеспечивает повышения качества кластеризации.
При кластеризации сигналов двумерной тетрагональной КК с размером 10х10 ней-
ронов и 1500 циклами обучения наблюдалось смешение классов сигналов в 1-3 кластерах сети, увеличение количество циклов обучения в 10 раз количество кластеров со смешанными классами уменьшилось до 1-2. Увеличение количества нейронов в КК на 44% (размер КК 12х12 нейронов) уменьшило ошибку до одного кластера со смешанными сигналами (30% — 40% случаев), в остальных случаях кластеризация сигналов была проведена правильно. Увеличение количества циклов обучения для КК 12х12 в 10 раз к улучшению результатов не привело. Безошибочная кластеризация сигналов была достигнута с помощью двумерной тетрагональной КК с размерами 14х14 при 1500 циклах обучения.
В случае кластеризации сигналов двумерной тетрагональной КК безошибочная кластеризация не была достигнута при всех перебранных вариантах КК с размерами от 10х10 до 16х16 нейронов. Поиск оптимальной структуры двумерной тетрагональной КК является одним из дальнейших направлений исследования.
Результаты исследования КК с алгоритмом функционирования SOM показали, что одномерная КК является малоэффективным средством кластеризации сигналов по структурно-временным признакам, а при кластеризации сигналов с использованием двумерных КК наиболее существенное влияние на качество кластеризации оказывает количество нейронов в карте. Недостатком
двумерных карт Кохонена является большое количество нейронов в карте, необходимое для правильной кластеризации. Эмпирически установлено, что в случае двумерной гексагональной КК для правильной кластеризации количество нейронов в карте должно превышать количество классов сигналов в 10 раз.
При кластеризации сигналов по структурно-временным признакам с использованием одномерной КК размером в 20 нейронов, функционирующей по алгоритму PLSOM, при проведенных 30 экспериментах была получена 100% правильная кластеризация. При уменьшении количества нейронов в КК наблюдалась аналогичная картина — 100% правильная кластеризация. Минимальное количество нейронов, при котором возможна правильная кластеризация выбранных сигналов, равно 14.
Таким образом, анализ эффективности применения алгоритмов функционирования КК SOM и PLSOM показал, что алгоритм PLSOM обеспечивает правильную кластеризацию сигналов по структурно-временным признакам при гораздо меньшем количестве нейронов, в рассмотренных случаях потребовалось в 14 раз меньше нейронов (14 и 196 нейронов соответственно).
Самоорганизующиеся карты Кохонена обладают одной важной особенностью — наличием зависимости между количеством кластеров, находимых картой в выборке, и количеством нейронов в карте. Наиболее
80
0 1----1---1---1---1----1---1---1----1---1---1----1---1---1----1---1---1----1---1---1---1----Г-
<■? I? <<? Л? <!?
Количество нейронов
♦ - Одномерная КК с алгоритмом SOM а Одномерная КК с алгоритмом PLSOM
Рис. 5. Зависимость количества найденньх кластеров от количества нейронов в карте Кохонена
Рис. 6. Зависимость количества найденньх кластеров от количества нейронов в карте Кохонена
корректный алгоритм обучения карт Кохо-нена должен минимизировать эту зависимость.
Проведём сравнительное исследование алгоритмов SOM и PLSOM с точки зрения минимизации зависимости между количеством кластеров, находимых картой в выборке, и количеством нейронов в карте. Под мерой оценки качества работы КК при избыточном количестве нейронов в карте будем понимать близость количества найденных кластеров к количеству априорно определенных классов сигналов. В тестовой выборке экспертным методом априорно было выделено 11 классов сигналов. Кластеризации подвергалась выборка из 1200 сигналов. В качестве классификатора сигналов использовались карты Кохонена четырех типов:
— одномерная карта Кохонена с алгоритмом обучения SOM;
— одномерная карта Кохонена с алгоритмом обучения PLSOM;
— двухмерная тетрагональная карта Ко-хонена с алгоритмом обучения SOM;
— двухмерная гексагональная карта Ко-хонена с алгоритмом обучения SOM.
На рис. 5 представлены результаты кластеризации сигналов с использованием одномерной КК с алгоритмами обучения SOM и PLSOM. На рис. 6 представлены результаты кластеризации сигналов с использованием двухмерных тетра- и гексагональных КК с алгоритмами обучения SOM.
Как видно из рисунков, КК с алгоритмом PLSOM при избыточном количестве нейронов (количество нейронов равно половине количества сигналов в выборке) работает более качественно, чем с алгоритмом SOM. Максимальное количество кластеров при алгоритме обучения PLSOM равно 23, тогда как при алгоритме SOM — 69, что явно избыточно. Гексагональная КК оказалась более эффективной, чем тетрагональная, но менее эффективной, чем одномерная КК с алгоритмом обучения PLSOM.
Таким образом, видно, что одномерная карта Кохонена, обученная алгоритмом PLSOM, является более устойчивой к избыточности нейронов в карте.
Анализируя полученные результаты, можно сделать следующие выводы.
1. Самоорганизующиеся карты Кохоне-на позволяют проводить классификацию и распознавание сигналов от различных ис-
точников с целью выявления редких, нетипичных источников радиоизлучений и предотвращения несанкционированного занятия эфира.
2. Самоорганизующиеся карты Кохонена обладают достаточным быстродействием для работы в системах реального времени выполнения.
3. При обучении с использованием алгоритма БОМ двухмерные карты Кохонена обеспечивают более правильную кластеризацию сигналов, чем одномерные.
4. Алгоритм PLSOM обеспечивает правильную кластеризацию сигналов по структурно-временным признакам при гораздо меньшем количестве нейронов, чем алгоритм БОМ.
5. Алгоритм PLSOM обеспечивает большую устойчивость к избыточности нейронов в карте, чем алгоритм БОМ.
Литература
1. Скляр Б. Цифровая связь. Теоретические основы и практическое применение. Изд 2-е, испр. — М: Издательский дом "Вильямс", 2003. — 1104 с.
2. Феер К. Беспроводная цифровая связь.
Методы модуляции и расширения спектра. — М: Радио и Связь, 2000. — 520 с.
3. Хайкин С. Нейронные сети: полный курс. — М.: Издательский дом "Вильямс", 2006. — 1104 с.
4. Виноградов А.Н., Лебедев А.Н., Терешо-нок М.В. Применение искусственных нейронных сетей для распознавания цифровых радиосигналов/Труды МТУСИ. — М., 2006. — С.136-147.
5. Kohonen T. Self-Organization and Associative Memory. 2nd ed.Berlin: Springer-Verlag, 1987.
6. Аджемов С.С., Виноградов А.Н., Лебедев А.Н., Терешонок М.В. Управление сигнальнопараметрической базой данных радиомониторинга. Свидетельство об официальной регистрации программы для ЭВМ №2007612090, 23.06.2007 г.
7. E. Berglund and J. Sille. The Parameter-Less SOM Algorithm. In B. C. Lovell, D. A.Campbell, C. B. Fookes, and A. J. Maeder, editors, ANZIIS. — РР. 159-164, 2003.
8. Медведев В.С., Потемкин В.Г. Нейронные сети. Matlab 6 / Под общ. ред. В.Г Потемкина. — М.: ДИАЛОГ-МИФИ, 2002. — 496 с.
9. Аджемов С.С., Виноградов А.Н., Лебедев А.Н., Терешонок М.В., Чиров Д.С. Интеллектуальный анализ данных. Свидетельство об официальной регистрации программы для ЭВМ №2007612101, 23.05.2007 г.