Научная статья на тему 'Согласованный алгоритм упорядоченной классификации'

Согласованный алгоритм упорядоченной классификации Текст научной статьи по специальности «Математика»

CC BY
122
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Чижов С. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Согласованный алгоритм упорядоченной классификации»

Согласованный алгоритм упорядоченной классификации

%

Чижов С.А.

%

(Институт проблем управления РАН; Москва)

1« Введение

Использование экспертов для получения оценок сложных объектов социально-экономической природы обычно предполагает построение модели объекта оценки, включающей в себя набор исходных критериев, влияющих на состояние объекта, а также алгоритм агрегирования исходных критериев в итоговый показатель. Однако, во многих случаях в задачах такого типа требуется разбить объекты оценки на несколько групп, объекты в каждой из которых близки по некоторому обобщенному показателю, и это разбиение оказывается достаточным для применения к объет у соответствующих управляющих воздействий. Также существенным для небольшого числа групп является то обстоятельство, что арсенал средств управления, находящийся в распоряжении руководителя, ограничен и имеет, как правило, дискретный характер.

Дня исследования крупномасштабной системы, состоящей из большого количества объектов и описываемой большим числом характеристик, связанного с необходимостью разбиения системы на подсистемы и изучения характеристик этих пэдсис-тем, предназначены методы классификационного анализа данных [1]. Сущность этих методов заключается в нахождении разбиения множества объектов системы на группы схожих Одним из наиболее разработанных в этой области является вариационный

• I *

подход [2,3], заключающийся во введении критерия качества классификации, экстре-мизация которого и приводит к искомому разбиению исходного множества объектов.

В то же время существующие методы классификационного анализа приводят к получению “неупорядоченного” набора классов, тогда как для управления социально-экономическими системами нередко требуется упорядоченность классов объектов в соответствии с некоторым качественным признаком (например, по принципу “лучше-хуже” и т.п.).

В данной работе предлагается постановка задачи классификации с упорядочением классов и рассматривается конкретный алгоритм решения этой задачи.

2. Задача упорядоченной классификации

Рассмотрим “стандартную” формальную постановку задачи в рамках вариационного подхода [3].

Пусть задано некоторое множество X с вероятностной мерой Р(А) (А с X) Размытая классификация Н множества X на г классов задается вектор-функцией Н(Х) = (hj(x), hj(xX .... ЬДх)), где tyx) - функция принадлежности точки х j-му классу (г - заранее заданное число классов). При этом считается, что hj(x) gL2(X, Р) и значение Н(Х)

для любой точки х принадлежит ограниченному замкнутому множеству V пространства значений функции Н(х). Множество V задает тип размытой классификации, рассматриваемой в конкретной задаче. Класс допустимых классификаций обозначается через E(V). За критерий качества классификации принимается некоторый функционал Ф(Н).

Задача построения размытой классификации состоит в максимизации Ф(Н) на множестве S(V).

Наиболее популярным в прикладных исследованиях является простейший вари-

ант этого функционала - функционал средневзвешенной дисперсии

J,-- ¿ J(*-Ují’hjWdPOO,

(1)

где Uj - центр j-го класса, определяемый по формуле

J лдогю

( _ х.... _ _.__

1 Jhj(x)dP(i>

X

(2)

При подобной постановке задачи все классы предполагаются равнозначными с точки зрения критерия. В то же время в рассматриваемом множестве объектов могут присутствовать объекты достаточно удаленные от всех классов Поскольку отнесение таких объектов к основным классам носит случайный характер и способно исказить

классификацию остальных объектов, целесообразно использовать так называемый фоновый класс для группирования удаленных объектов. В работе [4] рассмотрена постановка задачи размытой классификации с фоновым классом для вариационного подхода. В этом случае функционал качества классификации выглядит следующим образом*

=-£ /(* - И])’ ь,(*)ар(х) - в |МжИР(*), (3)

1=1 X X

где величина В является некоторой положительной константой, с помощью которой

можно варьировать степень влияния фонового класса на оптимальную классификацию. Сам фоновый класс введен с нулевым номером, следовательно вектор-функция принадлежности имеет вид Н(Х) = (^(х), ^(х), ..., ИДх)), где Ь^х) - степень принадлежности фоновому классу.

Под упорядоченной классификацией будем понимать разбиение исходных данных на классы, которые определяются центрами, одинаково упорядоченными относительно любой из исходных переменных, т е. и^к < ц^ ,1 < ] < г; 1 ^ к < ш. Таким образом,

можно говорить, что на множестве классов разбиения задан порядок. Требова-ние к самой упорядоченной классификации сводится к следующему: объект, принадлежащий классудолжен превосходить по каждой из переменных объекты из классов]’: 1 <, У < и, напротив, уступать объектам, принадлежащим классам) <}” < г.

Именно классификацию с фоновым классом можно использовать для выявления

I

из заданного множества тех объектов, которые не удовлетворяют предположению об упорядоченности. Однако второе слагаемое в выражении (3) “не реагирует” на неупорядоченность объекта: коэффициенты при весах принадлежности фоновому классу одинаковы для всех объектов Таким образом, требуется коррекция функционала }2

9

3. Согласованный алгоритм упорядоченной классификации

Для выявления неупорядоченных объектов в данной работе предлагается рассматривать одномерные классификации того же множества объектов. Можно предположить, что объекты, в большей степени отвечающие предположению об упорядоченности, должны иметь более близкие (согласованные друг с другом) одномерные глас-

сиф икании Следовательно искомая коррекция функционала I, (‘водится к введению функциональной зависимости от одномерных классификаций для каждого объекта ч

функционал приобретает вид

£ [и -и,)5Іі,(ж>(ІР(ж) В^Ь"», Ь°\ .... И ||") )Н, (ж)<1Р(ж),

(4)

X

X

где Н - вектор функция принадлжности при одномерной классификации на основе к* го критерия

В качестве функции £ выступающей в роли критерия упорядоченности, можно

предложить следующие:

а)Г0і<М.№, £

к-1

1-і

(5)

б) Г(Н(1), Ь®..............Ь'">) = 2- £

►і

(■") \ _

-¿Н«(ж)-Н)(ж)

ОТ к=|

(6)

где І > I

Далее приводится алгоритм для экстремизации данного функционала в случае функции упорядоченности (5) При этом, используется следующий вариант множества

V:

V: Ь,(ж) 2 0; ¿(нДж))1 = 1, который приводит, как показано в работе [3], к размытой классификации.

1) Выбрать произвольные исходные центры кластеров и,, и2, .... иг, которые удовлетворяют предположению об упорядоченности: ц^ < ил , 1 <} < 1 £ г; I <; к <; т

2) Рассчитать по следующим формулам весовые коэффициенты принадлежности

объектов для одномерных размытых классификаций без фонового класса на основе с<

і

«і

ответствующих компонент вектора X

Ь*{1) * 1, Ь*(ж) « 0, і * з, если хк « ц*, 1 ^ к

т;

Ь«(х) -(х) *

1, (ж) =0,2 ^ і <; г, если хк < ц1к,

1, Ьу°(ж) « 0, 1 < ] < г -1, если > ил>

•«?(*> =0, 8* ¡-1,), если и. і к < \ < и)к;

для всех к: 1 < к < т.

3) Найти весовые коэффициенты объектов для основной классификации с фоно

вым классом:

Ь$(х) « I, ЬДх) =0, } * 8, если х* = иА, 1 < к < т, (7 I)

иначе

М*> =

ж . т 0 ••■II • к $ • А* .Літ - V • •• V

Ї/ х /И-1)

(7.2)

Ь,(х)

[(ж - “і)1 {¿[(«-аІ),]Лі-,, + [ВЧ.)іЛ-»Г

V ф ^

, 1 < і г; г; (7.3)

для всех і: 1 < ¡< п.

4) Найти новые координаты для центров кластеров в соответствии с формулой

(2).

5) Повторить шаги (2) и (3)

6) Сравнить новую и предыдущую матрицы весовых коэффициентов Если принятое условие останова выполнено, алгоритм прекращает свою работу. В противном случае требуется повторить шаги (4-6)

Использование другого множества V требует лишь изменения формул (7.1-7 3). В частности, можно использовать о?раничения для вектор-функций принадлежности

Н(х), приводящие к четким классификациям или к классификациям с размытыми границами между классами. Работа данного алгоритма, в частности, его сходимость, была проверена на ряде наборов модельных данных.

Аналогичный алгоритм можно предложить для функционала, в котором использован критерий упорядоченност и вида (6)

4. Заключение

• ■ Л

В данной работе рассмотрена задача разбиения исходного множества объектов на упорядоченные классы в рамках вариационного подхода к классификационному анализу данных. Для получения упорядоченной классификации используется связь между “упорядоченностью” объекта и согласованностью векторов его принадлежности для одномерных классификаций заданного множества. В работе предложен алгоригм зкс-тремизации для соответствующего функционала.

Как указывалось во введении, данная задача возникает при построении агрегиро-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

*

ванной оценки на основе экспертных суждений для разбиения множества объектов на упорядоченные классы. Другим важным приложением является выявление групп критериев, на которых исходное множество объектов обладает свойством упорядоченности, что фактически соответствует выделению существенных факторов на множестве исходных показателей.

Литература:

[1] Браверман Э.М., Мучник И.Б. Структурные методы обработки эмпирических дан-

ных. М. : Наука, 1983.

f2] Bejdec J. C. Pattem recognition with fuzzy objective function algorithms. N. Y., L.: Plenum

., *

Press, 1980.

[3] Бауман E.B. Методы размытой классификации (вариационный подход) // Автоматика и телемеханика. 1988. № 12. С. N3-156.

[4] Бауман Е.В., Кузин М. Г. Метод построения размытой классификации с фоновым классом //Методы сбора и анализа сложноорганизованных данных. М.: Институт проблем управления РАН. 1991. С. 95-100.

i Надоели баннеры? Вы всегда можете отключить рекламу.