Научная статья на тему 'Критерий для автоматического определения количества классов в задаче нечеткой классификации с самообучением'

Критерий для автоматического определения количества классов в задаче нечеткой классификации с самообучением Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
145
38
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Смешко Ю.В., Агафонов Е.Д.

Рассматривается задача построения нечеткого классификатора для множества объектов, представленных признаковым описанием без указаний учителя. Предложен критерий для автоматического определения количества нечетких классов.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Смешко Ю.В., Агафонов Е.Д.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Критерий для автоматического определения количества классов в задаче нечеткой классификации с самообучением»

Секция «Математические методы моделирования, управления и анализа данных»

нитного к антиферромагнитному состоянию. В случае вакансии азота значение магнитного момента существенно не изменяется в зависимости от расстояния между вакансиями. Данное явление объясняется электрон-дефицитным состоянием атомов бора, окружающих вакансию азота.

Локализация магнитного момента для монослоя И-БМ с вакансиями обоих типов происходит на атомах, окружающих вакансию.

В ходе численного моделирования магнитных свойств вакансий в монослое И-БМ было установлено, что присутствие вакансий приводит к появлению магнитного момента. Показано, что исследуемая система является магнитно упорядоченной. При увеличении расстояния между вакансиями возможен переход от антиферромагнитного к ферромагнитному состоянию и наоборот, в зависимости от типа вакансий. Откры-

тие подобного явления дает новые возможности использования вакансий в монослое h-BN для внедрения и контроля магнитного упорядочения.

Библиографические ссылки

1. Kohn W. and Sham L. J. Phys. Rev. 140. 1133 (1965).

2. Kresse G, Hafner J. et al, Phys. Rev. B 47. 558 (1993).

3. Kresse G., Hafner J. et al., Phys. Rev. B 48. 13115

(1993).

4. Kresse G., Hafner J. et al., Phys. Rev. B 49. 14251

(1994).

5. Vanderbilt D. Phys. Rev. B 41. 7892 (1990).

6. Monkhorst H. J., Pack J. D., Phys. Rev. B 13. 5188 (1976).

© Сержантова М. В., Кузубов А. А., 2012

УДК 681.3

Ю. В. Смешко Научный руководитель - Е. Д. Агафонов Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнева, Красноярск

КРИТЕРИЙ ДЛЯ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ КОЛИЧЕСТВА КЛАССОВ В ЗАДАЧЕ НЕЧЕТКОЙ КЛАССИФИКАЦИИ С САМООБУЧЕНИЕМ

Рассматривается задача построения нечеткого классификатора для множества объектов, представленных признаковым описанием без указаний учителя. Предложен критерий для автоматического определения количества нечетких классов.

Нередко процесс интеллектуального анализа данных включает в себя решение задачи классификации, то есть группировки объектов исходного множества по однородным классам. При анализе сложных систем границы классов, выделяемых в процессе классификации, могут быть размытыми. В этом случае классы пересекаются и обладают сложной формой и структурой [1]. Требование об однозначности классификации подобной совокупности объектов оказывается чрезмерно жестким. В нечетком подходе к задаче классификации вместо понятия строгой принадлежности к классу вводится понятие функции принадлежности ц, принимающей вещественные значения

из интервала [0,1] и отражающей степень сходства

объекта с типичным элементом группы (центром класса). При таком подходе класс представляет собой нечеткое множество объектов, а проблема классификации сводится к определению степени принадлежности объекта тому или иному классу.

В задаче классификации с самообучением информация о конечном множестве из т объектов представлена признаковым описанием, которое называют матрицей «объект-свойство» Хт/п, где каждый объект х е X будет интерпретироваться как точка в п -мерном признаковом пространстве 1п (X). Указания о принадлежности объектов классам отсутствуют. Количество классов также заранее неизвестно и должно определяться в процессе группировки. При решении

задачи классификации с самообучением проблема определения количества классов выходит на первый план.

Иногда встречается случай, когда заказчик (владелец данных) точно знает, сколько классов он хотел бы получить [1]. Чаще заказчик высказывает пожелание: хотелось бы получить количество классов в диапазоне от сп до ск. Алгоритм классификации с самообучением должен автоматически выбрать наиболее «есте-

*

ственное» число классов с в этом диапазоне. Для этого исследователь формирует критерий Q(X, с), с

помощью которого можно предпочесть одно разбиение другому и определиться с выбором количества классов. Тогда проблема сводится к последовательному разбиению исходной совокупности объектов на различное число классов из интервала [сп, ск] с последующим выбором разбиения, соответствующего экстремальному значению введенного функционала:

Q(X, с) ^ ехгг . (1)

сп<с<ск

В работе предлагается критерий для определения количества классов в процессе решения задачи нечеткой классификации с самообучением. Критерий сформирован на основе гипотезы компактности, предполагающей, что объекты одного класса должны образовывать компактные «сгустки» в многомерном признаковом пространстве [2]. Исходная информация для расчета критерия задана матрицей Гт/с = (цг1},

Актуальные проблемы авиации и космонавтики. Информационные технологии

которая определяется в результате группировки m объектов в c нечетких классов алгоритмом нечеткой классификации с самообучением. Предлагается следующий алгоритм для определения количества классов:

1. Задаем границы интервала [си, ck], сп < ck .

2. а) С помощью алгоритма нечеткой классификации с самообучением производим группировку множества объектов в с нечетких классов (с = си,сп +1,...,ck ).

б) Рассчитываем показатель нечеткого внутриклассового разброса:

1 c 1 m

S=-Х—Хм(xi, tI

c l=1m i=1

(2)

d=±1 1

c l=1 c -

1

]-1 Х d(xi,Tl').

1 c 11 Ul

(3)

г) Предлагается следующий критерий для количественной оценки разбиения [1, 2]:

Da

Q( x, c) = ь -т—

S +ф

(4)

где а, Ь, ф - параметры, определяющие значимость соответствующих показателей. Шаги а), б), в), г) повторяются до тех пор, пока с = ck. После того, как значения критерия (4) определены для всего интервала [си, ck], проблема отыскания количества классов *

с сводится к решению оптимизационной задачи:

c = c: Q(X, c) ^ max .

cn<c<ck

(5)

где - функция принадлежности / -объекта 1 -классу; ё(х, х1) - функция, определяющая расстояние от I -объекта до центра 1 -класса. В качестве меры ё использовалось Евклидово расстояние в многомерном признаковом пространстве.

в) Рассчитываем показатель межклассового разброса:

В качестве исходных данных для алгоритма использовалась выборка Glass Identification, взятая с UCI Machine Learning Repository. Шесть типов стекла представлены 214 образцами. Для каждого образца измерено 9 различных показателей-признаков. Признаки выражены количественными величинами. Указания учителя отсутствуют. В качестве алгоритма нечеткой классификации с самообучением использовался алгоритм нечетких С-средних [3].

Критерий для определен ил количества классов

2 4 6 В 10 12 14 16 1В 20 22 24 26 2В 30

Число классов

Результаты применения алгоритма (cn = 1, ck = 30, c = 6, Q(X,c ) = 2.737)

Максимум критериальной функции, изображенной на рисунке, соответствует разбиению на 6 нечетких классов.

Библиографические ссылки

1. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск : Изд-во Ин-та математики, 1999. 270 с.

2. Загоруйко Н. Г. Методы распознавания и их применение. М. : Сов. радио, 1972. 208 с.

3. Bezdek J. C. Pattern Recognition With Fuzzy Objective Function Algorithm. NY: Plenum Press, 1981.

© Смешко Ю. В., 2012

i Надоели баннеры? Вы всегда можете отключить рекламу.