Научная статья на тему 'МОДИФИКАЦИЯ МЕТОДА ГЕНЕРАЦИИ НЕЧЕТКИХ ПРАВИЛ ДЛЯ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ НА НЕЧЕТКОЙ ЛОГИКЕ'

МОДИФИКАЦИЯ МЕТОДА ГЕНЕРАЦИИ НЕЧЕТКИХ ПРАВИЛ ДЛЯ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ НА НЕЧЕТКОЙ ЛОГИКЕ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
9
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
классификация / нечеткая логика / нечеткий классификатор / classification / fuzzy logic / fuzzy classifier

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Т.С. Плешкова, В.В. Становов

Предложен метод генерации нечетких правил для существующего алгоритма классификации данных с целью повышения качества генерируемых баз правил. Представленный метод позволяет повысить точность и уменьшить количество правил на некоторых данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Т.С. Плешкова, В.В. Становов

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODIFICATION OF THE FUZZY RULE GENERATION METHOD FOR A FUZZY LOGIC BASED MACHINE LEARNING ALGORITHM

A method for generating fuzzy rules for the existing data classification algorithm is proposed in order to improve the quality of the generated rule bases. The implemented method makes it possible to increase the accuracy and reduce the number of rules on some datasets.

Текст научной работы на тему «МОДИФИКАЦИЯ МЕТОДА ГЕНЕРАЦИИ НЕЧЕТКИХ ПРАВИЛ ДЛЯ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ НА НЕЧЕТКОЙ ЛОГИКЕ»

УДК 519.87

МОДИФИКАЦИЯ МЕТОДА ГЕНЕРАЦИИ НЕЧЕТКИХ ПРАВИЛ ДЛЯ АЛГОРИТМА МАШИННОГО ОБУЧЕНИЯ НА НЕЧЕТКОЙ ЛОГИКЕ

Т. С. Плешкова Научный руководитель - В.В. Становов

Сибирский федеральный университет Российская Федерация, 660041, г. Красноярск, просп. Свободный, 82А E-mail: tatyana.pleshkova2310@gmail.com

Предложен метод генерации нечетких правил для существующего алгоритма классификации данных с целью повышения качества генерируемых баз правил. Представленный метод позволяет повысить точность и уменьшить количество правил на некоторых данных.

Ключевые слова: классификация, нечеткая логика, нечеткий классификатор

MODIFICATION OF THE FUZZY RULE GENERATION METHOD FOR A FUZZY LOGIC BASED MACHINE LEARNING ALGORITHM

T.S. Pleshkova Scientific supervisor - V.V. Stanovov

Siberian Federal University Russian Federation, 660041, Krasnoyarsk, Svobodnyy Ave, 82А E-mail: tatyana.pleshkova2310@gmail.com

A method for generating fuzzy rules for the existing data classification algorithm is proposed in order to improve the quality of the generated rule bases. The implemented method makes it possible to increase the accuracy and reduce the number of rules on some datasets.

Keywords: classification, fuzzy logic, fuzzy classifier

В современном мире анализ данных является необходимым процессом во всех сферах деятельности. Один из популярных методов систематизации знания является классификация, которая подразумевает организацию данных по категориям для эффективного использования. С помощью методов классификации решаются различные задачи, например, классификация данных со спутниковых снимков. Нет единого метода для решения задач классификации данных. В зависимости от сформулированных условий необходимо подбирать метод, который бы распределял данные по соответствующим категориям. Прежде всего, в связи с тем, что заказчик или пользователь системы, осуществляющей классификацию данных, не имеет возможности понять процесс принятия решений, возникает необходимость в создании системы, позволяющей проводить процесс классификации с предоставлением информации о том, какие характеристики повлияли на определение классов. То есть интерес пользователя направлен на изучение процесса принятия решений, что дает ему возможность использования своих знаний о предметной области для повышения достоверности классификации данных. Для выполнения

Актуальные проблемы авиации и космонавтики - 2022. Том 2

данных условий необходимо использование модели белого ящика при реализации метода классификации данных.

Представление процесса принятия решений на понятном эксперту языке возможно с использованием в классификации нечетких правил, которые осуществляют определение принадлежности объекта с известными признаками к тому или иному классу. Нечеткое правило состоит из условия по типу «если... то...» с нечеткими термами в части «если...» и соответствующим номером класса в части «то.» [1]. Классификация объектов на основе нечетких правил рассматривалась многими современными исследователями, например, Ю. Ножима, Х. Ишибучи и Ф. Херрера [2]. В текущем исследовании было принято решение использовать за основу работу Х. Ишибучи, который предложил алгоритм машинного обучения на основе нечеткой логики [3], и повысить качество, точность и интерпретируемость данного метода. В статье основной целью является разработка нового метода генерации нечетких правил, который бы позволил повысить качество формируемых решений.

После реализации базовой версии алгоритма, которая описана в статье Х. Ишибучи [3], была предложена модификация с инициализацией нечетких правил. Взамен формирования нечеткого правила на одном случайном объекте, было реализовано использование нескольких объектов одного класса для создания правила. Для формирования правила сначала выбирается случайный объект а, затем выбираются еще пять объектов того же класса bi , / = 1..5, среди которых

проводится поиск ближайших двух объектов Ьк1 и Ьк2 к выбранному с помощью евклидова

расстояния (рис. 1). На основании трех объектов а, Ьк1, Ьк2 строится нечеткое правило.

Рис. 1. Визуализация метода генерации нечетких правил Также была изменена формула расчета пригодности:

fitness = wi*fi + w2*/2 + W3*/3 , 0)

где w1 = 10000, w2 = 1, w3 = 1 и f - F-мера, которая представляет собой гармоническое среднее между точностью (precision) и полнотой (recall), /2 - количество активных нечетких правил (правил, у которых достоверность больше 0.6), /3 - длина правила (количество термов, не являющихся игнорированием).

Тестирование базового и модифицированного алгоритма проводилось на четырех задачах, взятых с репозитория UCI, результаты представлены в таблице 1 и таблице 2.

Результаты работы базового алгоритма

Таблица 1

Phoneme Ring Satimage Page-blocks

Кол-во правил 10.833 20.567 22.700 9.900

Точность 0.789 0.832 0.847 0.909

F-мера 0.721 0.832 0.806 0.435

Результаты работы алгоритма с методом генерации нечетких правил

Таблица 2

Phoneme Ring Satimage Page-blocks

Кол-во правил 4.933 20.533 16.833 9.000

Точность 0.825 0.828 0.863 0.910

F-мера 0.766 0.828 0.837 0.451

Так как представлены средние значения, то чтобы оценить эффективность модификации, необходимо использовать Ц-критерий Манна-Уитни [4]. В таблице 3 приведены результаты статистического теста, где символ "=" различия несущественны, символ "+" различия существенны и модификация эффективнее, "-" различия существенны и модификация хуже чем оригинальный алгоритм.

Результаты статического теста

Таблица 3

Phoneme Ring Satimage Page-blocks

Кол-во правил + = + +

Точность + = + =

F-мера + = + +

Исходя из таблиц 1-3, можно заметить, что предложенный метод генерации нечетких правил позволяет на некоторых данных существенно сократить количество правил и одновременно улучшить точность классификации данных. Дальнейшие направления исследований может включать подбор параметров предложенного метода.

Библиографические ссылки

1. Д. Рутковская, М. Пилиньский, Л. Рутковский Нейронные сети, генетические алгоритмы и нечеткие системы М. : Горячая линия-Телеком, 2004.

2. Y. Nojima, K. Watanabe, and H. Ishibuchi, "Simple modifications on heuristic rule generation and rule evaluation in Michigan-style fuzzy genetics-based machine learning," Proc. of 2015 IEEE International Conference on Fuzzy Systems, 8 p., 2015.

3. Ishibuchi H., Mihara S., Nojima Y. Parallel Distributed Hybrid Fuzzy GBML Models With Rule Set Migration and Training Data Rotation - IEEE Transactions on fuzzy systems, Vol. 21, No. 2. -April 2013.

4. H. B. Mann and D. R. Whitney, "On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other (Annals of Mathematical Statistics, 1947).

© Плешкова Т. С., 2022

i Надоели баннеры? Вы всегда можете отключить рекламу.