Научная статья на тему 'ПОСТРОЕНИЕ БАЗЫ НЕЧЕТКИХ ПРАВИЛ ДЛЯ РАСПОЗНАВАНИЯ ПУЛЬСАРОВ С ПОМОЩЬЮ САМОКОНФИГУРИРУЕМОГО ГЕНЕТИЧЕСКОГО АЛГОРИТМА'

ПОСТРОЕНИЕ БАЗЫ НЕЧЕТКИХ ПРАВИЛ ДЛЯ РАСПОЗНАВАНИЯ ПУЛЬСАРОВ С ПОМОЩЬЮ САМОКОНФИГУРИРУЕМОГО ГЕНЕТИЧЕСКОГО АЛГОРИТМА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
классификация / эволюционные методы / система на нечеткой логике / распознавание образов / генетический алгоритм / classification / evolutionary methods / fuzzy logic system / pattern recognition / genetic algorithm

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — А.А. Кораблева, П.А. Шерстнев, Л.В. Липинский

Рассматривается решение задачи построения базы нечетких правил для распознавания пульсаров с помощью самоконфигурируемого генетического алгоритма. Подход позволяет автоматически сформировать правила, доставляющие высокую точность классификации объектов, в том числе и космических.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — А.А. Кораблева, П.А. Шерстнев, Л.В. Липинский

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DESIGNING A DATABASE OF FUZZY RULES FOR PULSAR RECOGNITION USING A SELF-CONFIGURING GENETIC ALGORITHM

The solution of the problem of constructing a base of fuzzy rules for the recognition of pulsars using a self-configuring genetic algorithm is considered. The approach allows you to automatically generate rules that deliver high accuracy of classification of objects, including space ones.

Текст научной работы на тему «ПОСТРОЕНИЕ БАЗЫ НЕЧЕТКИХ ПРАВИЛ ДЛЯ РАСПОЗНАВАНИЯ ПУЛЬСАРОВ С ПОМОЩЬЮ САМОКОНФИГУРИРУЕМОГО ГЕНЕТИЧЕСКОГО АЛГОРИТМА»

УДК 519.7

ПОСТРОЕНИЕ БАЗЫ НЕЧЕТКИХ ПРАВИЛ ДЛЯ РАСПОЗНАВАНИЯ ПУЛЬСАРОВ С ПОМОЩЬЮ САМОКОНФИГУРИРУЕМОГО ГЕНЕТИЧЕСКОГО АЛГОРИТМА

А. А. Кораблева, П. А. Шерстнев Научный руководитель - Л. В. Липинский

Сибирский государственный университет науки и технологий имени академика М. Ф. Решетнева Российская Федерация, 660037, г. Красноярск, просп. им. газ. «Красноярский рабочий», 31

E-mail alkorableva1998@gmail.com

Рассматривается решение задачи построения базы нечетких правил для распознавания пульсаров с помощью самоконфигурируемого генетического алгоритма. Подход позволяет автоматически сформировать правила, доставляющие высокую точность классификации объектов, в том числе и космических.

Ключевые слова: классификация, эволюционные методы, система на нечеткой логике, распознавание образов, генетический алгоритм.

DESIGNING A DATABASE OF FUZZY RULES FOR PULSAR RECOGNITION USING A

SELF-CONFIGURING GENETIC ALGORITHM

A. Korableva, P. A. Sherstnev Scientific supervisor - L.V. Lipinsky

Reshetnev Siberian State University of Science and Technology 31, Krasnoyarskii rabochii prospekt, Krasnoyarsk, 660037, Russian Federation E-mail alkorableva1998@gmail.com

The solution of the problem of constructing a base of fuzzy rules for the recognition of pulsars using a self-configuring genetic algorithm is considered. The approach allows you to automatically generate rules that deliver high accuracy of classification of objects, including space ones.

Keywords: classification, evolutionary methods, fuzzy logic system, pattern recognition, genetic algorithm.

Введение. В космическом пространстве находится бесчисленное множество различных объектов. В то время как некоторые из них можно легко отнести к одному из классов, идентификация других объектов представляется сложной задачей. Пульсары - это редкий тип нейтронных звезд, которые производят радиоизлучение, обнаруживаемое здесь, на Земле. Они представляют значительный научный интерес и имеют сложности обнаружения, связанные с радиочастотными помехами. В настоящее время инструменты машинного обучения, такие как нейросети, успешно используются для автоматической идентификации пульсаров, однако результаты работы нейросети невозможно интерпретировать [1-2]. Целью данной работы является применение интерпретируемого подхода идентификации космических объектов на примере решения задачи распознавания пульсаров нечетким классификатором с настройкой базы правил самонастраивающимся генетическим алгоритмом.

Подход. Формирование нечеткого классификатора сводится к задаче выбора наилучшей базы правил из всех возможных сочетаний. Такая оптимизационная задача имеет высокую

Секция «Математические методы моделирования, управления и анализа данных»

размерность, а также вид целевой функции, не позволяющий использовать классические методы оптимизации. В задачах такого рода эффективно использовать эволюционные методы [3]. Использование последних, однако осложняется необходимостью выбора параметров эволюционных алгоритмов оптимизации (селекции, мутации и скрещивания). В данной работе используется метод самоконфигурации из [4] суть которого заключается в увеличении вероятность выбора того оператора, который доставил наибольшую суммарную пригодность на данном поколении.

Индивидом генетического алгоритма является база правил. Каждое правило представляет из себя набор предпосылок, связанных оператором «И», а также одно заключение в виде отнесения объекта к тому или иному классу. С учетом этим особенностей, длина бинарной строки равна:

(l + ceil(log2 (nsets +1)) • nvar + ceil(log2 (nclass))) • nrules

?

где nsets - количество нечетких термов каждой переменной; nvar - количество переменных; ndass - количество классов; nmles - максимальное количество правил в базе; ceil - функция округления вверх.

Дополнительный бит выделяется для каждого правила, как индикатор, используется это правило в базе или нет. Также учитывается дополнительный терм игнорирования. Так можно автоматически настраивать размер базы правил и длину правила. Функцией пригодности является f1 - мера со штрафом за размер базы правил и размера правил.

Набор данных. HTRU2 - это набор данных, который описывает выборку, состоящую из пульсаров и других звезд, собранных во время исследования Вселенной с высоким временным разрешением [5]. Объекты разделены на два класса: Не пульсар (16259 примера); Пульсар (1639 примеров).

Каждый объект описывается 8 непрерывными переменными. Первые 4 переменные представляют собой статистику, полученную из интегрированного профиля (ИП) пульсара, остальные 4 переменные получены из DM-SNR кривой [6]. Названия переменных следующие: 1. Среднее значение ИП; 2. Стандартное отклонение ИП; 3. Избыточный эксцесс ИП; 4. Асимметрия ИП; 5. Среднее значение DM-SNR; 6. Стандартное отклонение DM-SNR; 7. Избыточный эксцесс кривой DM-SNR; 8. Асимметрия кривой DM-SNR.

Результаты. Для решения задачи были выбраны следующие параметры: Количество поколений: 200; Размер популяции: 100; Размер турнира: 5; Нечетких множеств каждой переменной: 3 (Маленькое, Среднее, Большое); Максимальное количество правил в базе: 10;

В качестве меры точности выступала f1 - мера. Выборка разделена на тест и обучение в пропорциях 0.33 и 0.67. Поскольку результаты, получаемые с помощью эволюционных алгоритмов оптимизации, имеют случайный характер, результаты решения задачи усреднялись на основании 30 запусков. Усредненная F1 - мера на тестовой выборке составила 0.92737. В табл. 1 представлена одна из полученных баз нечетких правил.

Таблица 1

База нечетких правил для задачи HTRU2__

Предпосылки Заключение

Если Среднее значение ИП маленькое и Избыточный эксцесс ИП средний Пульсар

Если Избыточный эксцесс ИП маленький и Стандартное отклонение БМ- SNR маленькое Не пульсар

Очевидно, что в минимальном случае база может состоять из двух правил (два класса). Данные правила состоят всего из двух условий. Стоит отметить, что из всех 8-ми переменных используется только три переменные. Рассмотрим далее статистику работы самоконфигурируемого генетического алгоритма. На рис. 1 представлены графики

вероятности выбора оператора и номера поколения, усредненные по 25 запускам, а также средняя и лучшая пригодность на каждом поколении.

и 0.34 -

о

т

£ 0.32 -о

а о-зо -0.28 -

Рис. 1. Усредненные вероятности операторов и пригодность

- one_point two_poiint - uniform

О 25 50 75 100 125 150 175 200 Поколение

Анализируя результаты самоконфигурации, можно сделать вывод, что на данной задаче алгоритм отдавал предпочтение слабой мутации и турнирной селекции, а также одноточечному и двухточечному скрещиванию.

Выводы. Использование самоконфигурируемого генетического алгоритма для настройки базы нечетких правил позволяет по выборке автоматически построить эффективный и интерпретируемый классификатор. Так, при решении задачи распознавания пульсаров полученная база составляла всего два коротких правила, опирающихся на три признака. Полученные результаты могут быть использованы для лучшего понимания природы космических объектов.

Библиографические ссылки

1. Eatough R. P. Selection of radio pulsar candidates using artificial neural networks // Monthly Notices of the Royal Astronomical Society. - 2010. - №4. - С. 2443-2450.

2. Bates S. D. The high time resolution universe pulsar survey vi. an artificial neural network and timing of 75 pulsars // Monthly Notices of the Royal Astronomical Society. - 2012. - №2. - С. 1052-1065.

3. Michalewicz, Z. Genetic Algorithms + Data Structures = Evolution Programs . - 3 изд. -New York: SpringerVerlag, 1996. - 388 с.

4. Семенкина М.Е. Самоадаптивные эволюционные алгоритмы проектирования информационных технологий интеллектуального анализа данных // Искусственный интеллект и принятие решений. - 2013. - №1. - С. 13-23.

5. R. J. Lyon, B. W. Stappers, S. Cooper, J. M. Brooke, J. D. Knowles Fifty Years of Pulsar Candidate Selection: From simple filters to a new principled real-time classification approach // Monthly Notices of the Royal Astronomical Society. - 2016. - №1. - С. 1104-1123.

6. R. J. Lyon, «Why Are Pulsars Hard To Find?»: автореф. дис. д-р University of Mancheste, 2016

© Кораблева А. А., Шерстнев П. А., 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.