Научная статья на тему 'Классификация инвестиционных проектов на основе мультимножеств и нечеткой кластеризации'

Классификация инвестиционных проектов на основе мультимножеств и нечеткой кластеризации Текст научной статьи по специальности «Математика»

CC BY
332
66
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Демидова Л. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Классификация инвестиционных проектов на основе мультимножеств и нечеткой кластеризации»

Раздел III Методы искусственного интеллекта

Л.А. Демидова

КЛАССИФИКАЦИЯ ИНВЕСТИЦИОННЫХ ПРОЕКТОВ НА ОСНОВЕ МУЛЬТИМНОЖЕСТВ И НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ

Введение. Одним из решающих условий роста российской экономики является прирост инвестиций в различных отраслях народного хозяйства. Активизация инвестиционной деятельности способствует подъёму и дальнейшему развитию экономики, с помощью инвестиций создаются новые предприятия, расширяются действующие производства, обеспечивается освоение и выход на рынок новых видов товаров и услуг. Сегодня в России возрастает интерес к использованию передовых информационных технологий в обеспечении процесса принятия решений и стратегического управления в условиях неопределенности. В инвестиционной деятельности применение таких технологий сводится к выбору проектов и распределению ресурсов между ними. В настоящее время часто при выборе инвестиционных проектов предприятия работают в условиях повышенного риска невозврата вложенных средств. Использование подобных информационных технологий в деятельности предприятий позволяет повысить рентабельность и в целом улучшить экономический климат в стране.

Рассмотрим задачу принятия решения о выборе инвестиционных проектов в многокритериальной среде. Среди предложенных проектов необходимо выявить проекты, которые будут включены в план реализации, проекты, которые будут исключены из плана реализации, и проекты, рассмотрение которых будет отложено. При этом выбор проектов осуществляется в соответствии с некоторым набором критериев (таких, как "наличие денежных средств", "срок окупаемости проекта", "точка безубыточности" и т.п.). Т.о., возникает задача выбора проектов по многим критериям.

Пусть X = } - множество объектов (проектов), подлежащих

многокритериальному анализу; С = ^3~1,...,Сп } - множество количественных и

качественных критериев, которыми оцениваются объекты, а количество экспертов равно т .

Так как каждый объект (проект) оценивается несколькими экспертами, то имеется несколько различных вариантов оценивания этого объекта, и оценки экспертов могут быть как схожими, так и противоречивыми. Эксперты могут относить сильно различающиеся объекты в один и тот же класс, а объекты со сходными критериальными оценками - в разные классы. Несогласованность индивидуальных экспертных оценок может быть вызвана неоднозначностью понимания экспертами решаемой задачи, ошибками и неточностями при оценивании объектов по отдельным критериям, специфичностью знаний экспертов. Построение итогового решения в существующих методах классификации обычно выполняется путем согласования или усреднения

индивидуальных экспертных оценок. Часто бывает очень сложно или невозможно найти согласованное мнение экспертов. При принятии решения об отнесении объекта к некоторому классу следует учесть все, даже и несовпадающие (противоречивые) оценки экспертов. Индивидуальные оценки экспертов могут быть получены в соответствии с известными методиками, например, теория нечетких множеств (ТНМ) позволяет формализовать процесс многокритериального анализа объектов, рассматривая интегральный критерий как нечеткую свертку частных критериев по схеме Беллмана-Заде.

Многокритериальный анализ объектов. Каждый г - й эксперт решает задачу многокритериального анализа, состоящую в классификации элементов множества X по критериям из множества О. Пусть ю \xj) - число в диапазоне [0, 1],

характеризующее уровень оценки объекта х j е X по критерию Оу е О: чем

больше число ю {xj), тем выше оценка объекта Xj (j = \,к ) по критерию Оу

(/ = 1,п). Представим критерий Оу в виде нечеткого множества Оу на множестве объектов X [2]:

О = \«м лЫ\, (,,

I х1 хк \

где ЛО {xj ) - степень принадлежности элемента Xj нечеткому множеству Оу .

Степени принадлежности нечеткого множества (1) можно найти, например, методом построения функций принадлежности на основе парных сравнений по шкале Саати [2]. Пусть г - м экспертом для каждого объекта Xj по критериям О у были

даны оценки: gj у г = /л^ г {х j ) или gj у г = /л^ гаа {xj ) при равновесных или

неравновесных критериях соответственно (ау - коэффициент относительной важности критерия О у, а1 +... + ап = 1). Пусть по / - у критерию экспертами

Уj ~

было дано Ыу различных оценок gj у г, которые обозначим через (уу = 1 , Ыу); а

количество экспертов, давших объекту х^ оценку дУ‘, равно кс (¡У‘)

( ^ кс ) = т). Пусть оценки дУ‘ (I = 1, п, у = 1, ыг ) упорядочены от лучшего

У, =1 ]

значения к худшему. Для каждого объекта Х] на множестве критериев

О = ^О1,..., Оп } сформируем мультимножество [3]:

С] ={ кс] {1• ч!, ...,кс] (1 } чТ , ...,кс] ^П } чПг , ...,кс] ($п} чП? }.(2)

Наилучшим и наихудшим объектам соответствуют мультимножества Стах и Стп , называемые идеальным и антиидеальным решениями:

Стах = { т • 41,0, ...°,т • 42,0, ...°,т • Ч1п,(0, 0 } (3)

Стп ={ 0,0, ...,т • чЫ ,0,0, ...,т • чЫ2, 0,0, ..., т • д1 }, (4)

Задача многокритериальной классификации объектов сводится к классификации мультимножеств. Выполним разложение совокупности объектов X на некоторое количество классов на основе нечеткой кластеризации [4].

Нечеткая кластеризация на основе мультимножеств. Задача нечеткой кластеризации заключается в определении нечеткого разбиения множества объектов исследуемой совокупности, которые образуют структуру нечетких кластеров, присутствующих в рассматриваемых данных [4]. При этом определяют степени принадлежности элементов исследуемой совокупности искомым нечетким кластерам. Пусть С = {С],...,Ск } - множество объектов кластеризации, соответствующее

множеству исходных объектов X = {х1,...,Хк }. Сформируем матрицу Р

п

размерности к х 5 (5 = 2 ыу ), строки которой соответствуют мультимножествам 1=1

с] (j = 1,к).

Задача нечеткой кластеризации: определить нечеткое разбиение

Я{р) = {Р(\Р( с В} (^ РI = Р, РI е Я ; высота к$ < 1 для

п

В = Р1 Рт при любых Р1, Рт е Я ) множества 5 = 2 Ыу на некоторое

у=1

число с нечетких кластеров Рг, которое доставляет экстремум целевой функции т = 2 среди всех разбиений.

Искомые кластеры являются нечеткими множествами Р(, образующими

нечеткое разбиение множества объектов Р, а условие ^ Рt = Р принимает вид

2 ЛР {с] )= 1 ( ус] е Р). (5)

г=1

Для нечетких кластеров определим центры Уг искомых кластеров Рг , которые рассчитываются для каждого из кластеров по формуле:

* = 2 лс,))" • 2 Мс]))”

]=7 _ _ ' ]—

(г = 1, с ; I = 1,п; у = 1, ыу), (6)

где т - экспоненциальный вес (т > 1). Центры кластеризации являются векторы

Уг = )= уЫ,1’-’ у1,п,-•-, \пп) в 5 -мерном (5 = 2 Ыу)

у=1

пространстве.

Представим целевую функцию как сумму квадратов взвешенных отклонений координат объектов кластеризации от центров кластеров:

f {Dt, vt ) = Т Т {щ (с j )]г ■ di , , t,

j=11=1

(d,,Vii, = i i (kCjУ-)-vpJ). (7)

i =1y- =1 j

Для матрицы D и числа m необходимо определить значения функций принадлежности объектов кластеризации Cj е D нечетким кластерам Dt , которые

доставляют минимум целевой функции (7) и удовлетворяют ограничениям (5), (6), (8), (9):

ТHDt Cj)> о, (t = 17c); (8)

j=1 _

jUDt (Cj )> 0, (t = 1, c , VCj е D). (9)

При этом осуществляется минимизация отклонения всех объектов кластеризации от центров нечетких кластеров пропорционально значениям функций принадлежности этих объектов соответствующим кластерам. Выполним кластеризацию при разных количествах нечетких кластеров с на основе алгоритма FCM (Fuzzy C-Means) [4]:

1. Зададим количество с нечетких кластеров; число итераций алгоритма s; параметр сходимости алгоритма s ; экспоненциальный вес расчета целевой функции и центров кластеров m. В качестве разбиения для матрицы D зададим некоторое нечеткое разбиение R(d~) = {Dt \ Dt ^ D} на непустые кластеры, описываемое

совокупностью функций принадлежности u d (Cj ) (t = 1, c, VC j е D).

2. Для текущего нечеткого разбиения R(d) определим центры нечетких кластеров по формуле (7) и значение целевой функции по формуле (8).

3. Сформируем новое разбиение R’(p) множества объектов на непустые

нечеткие кластеры с функциями принадлежности uDt C'j ) (t = 1, c , VC j е D):

(m-1

лР (с] )= 12 к,у,г/4,у,1 (Ю)

/ I =1

Если ёу у г = 0 для некоторого С] е Р и некоторого г е {2,..., с}, то для кластера Рг принимают лР ^С]' )= 1, а для кластеров Р1 (IФ г) -

/л'р1 (с]■ )= 0 . Если ёу у г = 0 для некоторого С] е Р при нескольких г е {2,..., с}, то для наименьшего г принимают лР (С]')= 1, а для других I е {2,..., с} (IФ г) - лР1 )= 0 .

4. Для нечеткого разбиения Я'{Р) = {Рг \ Рг с Р} по формуле (11) рассчитаем центры нечетких кластеров у и значение целевой функции /{Рг, уг) по формуле (7).

5. Если количество выполненных итераций превышает число s или модуль разности f (d,V )- f'{Dt ,v,) < s, то в качестве результата нечеткой кластеризации принимается разбиение R'(D)={Dt\Dt ^ D}, и алгоритм завершается. В

противном случае текущим разбиением следует принять R(D) = R'(D) и перейти к шагу 3.

В результате применения алгоритма FCM определяется локальнооптимальное нечеткое разбиение, описываемое совокупностью функций принадлежности, и типичные представители нечетких кластеров. Для оценки компактности и хорошей отделимости кластеров используется индекс Хие-Бени [5]:

I £ Ц (С; f ■ dW

* =1='’=„ м----------------------2' (ll)

к ■ min £ £ Ы\ - vy))

1 ^t l=l yl =1

При хороших результатах нечеткой кластеризации * < l, при этом в качестве искомого числа кластеров с следует выбрать то, для которого индекс * принимает минимальное значение. Отметим, что нечеткая кластеризация может

*

также быть выполнена с соблюдением, например, требования о том, что с > с

*

(с - заранее заданное число кластеров). Для получения адекватных результатов нечеткой кластеризации необходимо многократное выполнение алгоритма FCM при заданном числе кластеров для различных исходных нечетких разбиений и сравнение значений целевой функции полученных нечетких разбиений с целью принятия окончательного решения об искомой нечеткой кластеризации.

Оптимизация на основе генетических алгоритмов. Нечеткая кластеризация, выполненная с применением генетических алгоритмов, позволяет значительно сократить время поиска оптимального нечеткого разбиения. Для заданного числа кластеров с каждая хромосома может быть закодирована либо координатами центров всех кластеров, либо степенями принадлежности (числами из интервала [0,1]) объектов (и мультимножеств) нечетким кластерам (что позволит избежать потери информации во время операции скрещивания, т.к. хромосомы-родители будут обмениваться степенями принадлежностей, а не координатами центров) [6]. Во втором случае хромосома будет состоять из к частей (по количеству объектов), а каждая часть - из с подчастей (по количеству кластеров) и для любой подчасти будет выполняться условие (5). Функция соответствия будет иметь вид

J = £ (max (ßDt ^Cl ))- 0-5) ^ max . (12)

1=1 t=1,c

Хромосома, в которой имеются степени принадлежности, близкие к 1, имеет больше шансов быть признанной лучшей для решения задачи. При этом будет обеспечиваться минимум целевой функции (7). В идеальном случае

J = к/2 .

Выбор родителя будет состоять в выборе лучшей хромосомы, которая максимизирует функцию (12) из двух случайно выбранных. Затем две выбранные таким образом хромосомы родителя будут использоваться для скрещивания.

При выполнении скрещивания выбирается вероятность скрещивания Rc и

генерируется случайное число Nc. Если Rc > Nc, то случайным образом

выбирается точка скрещивания z (z mod c = 0) и выполняется скрещивание. При этом обеспечивается обмен всеми степенями принадлежностей объекта и потому выполняется условие (5).

При выполнении мутации выбирается вероятность мутации Rm и

генерируется случайное число Nm. Если Rm > Nm, то случайным образом выбирается точка мутации z (z mod c = 0), случайное число a е[0 — u(z) ...1 — u(z)], и выполняется мутация: fj.(z) = u(z) + a . Для

обеспечения условия (5) изменяются степени принадлежностей объекта, находящегося в точке пересечения, другим кластерам:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

u(z +1) = u(z +1)—a (с — 1), ...,

u(z + с —1) = ju{z + с — 1) — а/ (с — 1).

Тогда генетический алгоритм имеет вид:

1. Случайным образом выбираются начальные центры кластеров.

2. Создается популяция размера P в соответствии с формулой (9) для степеней принадлежности.

3. При g < G (G — количество генераций) вычисляется функция

соответствия (12) для каждой хромосомы и создается Pj2 пар хромосом.

4. Выполняется скрещивание и мутация на текущей популяции.

5. Создается новая генерация размера P , дополненная хромосомами-детьми, а хромосомы с худшими значениями функции соответствия (12) отбрасываются.

6. Выбирается лучшая хромосома, которая максимизирует функцию соответствия (12) и для нее вычисляются центры нечетких кластеров в соответствии (6). Для каждого объекта (и мультимножества) определяются степени принадлежности его к нечетким кластерам с новыми центрами.

Данный алгоритм может быть выполнен при различных значениях с. Для выбора оптимального разбиения следует использовать индекс Хие-Бени (11).

Нечеткая классификация. Центрам нечетких кластеров можно поставить в соответствие точки метрического пространства мультимножеств (C,d ) с метрикой

Хемминга d1p = \т(ЛАВ')\1 ^ p (A , B - мультимножества, p - целое число) [3]. Для многокритериальной классификации эта метрика принимает вид

dу = т{АЛВ) = £ £ к лл {$1)— к в ) . (13)

1=1уг =1 1

Определим для центров нечетких кластеров величины dj(Cmax, Vt). "Ближайшим" к идеальному решению является нечеткий кластер с центром vt, если

d1(pmax, vt )< d1(pmax, vl) для l ^ t. (14)

Т.к. каждый объект оценивается т экспертами по п критериям, то выражение для расстояния от идеального решения до центра кластера принимает вид

' =1 У' =1

Тогда условие (14) приобретает форму:

= 2-I

1=1

т - V,

(15)

п п

I \ ' >1V,' • (16)

1=1 '=1

Таким образом, задача многокритериальной классификации объектов сводится к сравнению взвешенных сумм первых (наилучших) оценок центров

; п 1

нечетких кластеров по всем критериям О': Н1 = IVI ' . Лучшим будет тот

'=1 ’

нечеткий кластер 01, для которого сумма Н1 будет наибольшей. Если будут получены группы эквивалентных или несравнимых нечетких кластеров, имеющих одинаковые суммы Н1, следует вычислить в соответствующей группе сумму

тг2 Пл,2

Н1 = IVI ' всех вторых оценок по всем критериям и упорядочить нечеткие

'=1 ’

тт2

кластеры внутри каждой группы от лучшего к худшему по величинам Н сумм

вторых оценок. Этот процесс повторяется до полного упорядочения всех нечетких кластеров.

Аналогичным образом можно выполнить классификацию по отношению к антиидеальному решению Ст'п, заданному выражением (4). При этом кластер

01 лучше кластера П, если он находится дальше от антиидеального решения

С:

Ст'п :

(^1^Ст'п, ) > (^1^Ст'п, ) для 1 ^ ^ • (17)

В результате нечеткой кластеризации совокупность объектов X, для которых на основе индивидуальных экспертных оценок были сформированы мультимножества Cj (у = 1,к), будет разложена на классы Х1, которым

соответствуют нечеткие кластеры П с центрами VI (^ = 1, с ). При этом будут

учтены все, даже несовпадающие (противоречивые) индивидуальные оценки экспертов.

Заключение. Предлагаемый подход к классификации объектов может быть использован для классификации инвестиционных и инновационных проектов, конкурсных заявок, участков городских инженерных коммуникаций (которые должны быть признаны, например, "аварийными" и находящимися "в удовлетворительном состоянии") и т.п. При этом будет обеспечено выполнение анализа данных без потери или искажения. В качестве критериев могут выступать количественные и качественные, в том числе и противоречивые данные. Классификация объектов может быть выполнена по степени близости к

п

наилучшему (наихудшему) объекту в метрическом пространстве мультимножеств на основе нечеткой кластеризации. Применение генетического алгоритма позволит значительно сократить время поиска оптимального нечеткого разбиения.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Демидова Л.А., Кираковский В.В., Пылькин А.Н. Алгоритмы и системы нечеткого вывода при решении задач диагностики городских инженерных коммуникаций в среде MATLAB. - М.: Радио и связь, Горячая линия - Телеком, 2005. - 365 с.

2. Беллман Р., Заде Л. Принятие решений в расплывчатых условиях. В кн.: Вопросы анализа и процедуры принятия решений. - М.: Мир, 1976. - С.172-215.

3. Петровский А.Б. Многокритериальное принятие решений по противоречивым данным: подход теории мультимножеств // Информационные технологии и вычислительные системы. 2004. №2. С. 56-66.

4. Леоненков А. Нечеткое моделирование в среде MATLAB и fuzzyTECH. - СПб.: БХВ-Петербург, 2003. - 736 с.: ил.

5. Xei X.L., Beni G.A. Validity Measure for Fuzzy Clustering // IEEE Trans. on Pattern Analysis and Machine Intellegence 3 (8). - 1991. - P. 841-846.

А.Ю. Молчанов АДАПТИВНАЯ СИСТЕМА АВТОМАТИЧЕСКОЙ ОПТИМИЗАЦИИ С НЕЧЕТКИМИ СТРАТЕГИЯМИ

Задачи поиска оптимальных режимов работы энергетического оборудования, оптимизации режимных испытаний являются актуальными, так как решение этих задач повышает экономичность использования энергоресурсов и дает значительный экономический и экологический эффект [1]. Рассматриваемые задачи оптимизации являются многокритериальными и многомерными в общем случае и должны решаться в условиях неполноты сведений об объекте. Это требует модификации существующих подходов к построению систем автоматической оптимизации (САО), целью функционирования которых является поиск величин управляющих воздействий, при которых достигается экстремум показателя качества системы [2].

Поиск оптимальных величин входных воздействий можно представить как совокупность этапов, направленных на разрешение неопределенности относительно эффективности функционирования объекта управления (ОУ) и выбор управляющих решений: [3]

Этап 1. Процесс получения достоверной информации;

Этап 2. Выбор оптимального управления для достижения цели поиска.

Поисковой стратегией САО назовем совокупность правил выбора управляющих решений для каждой ситуации функционирования САО. Эффективность поисковой стратегии оценивается набором критериев, включающим критерии точности (среднего отклонения), быстродействия (время поиска) [2,4].

Процедура получения информации должна обеспечивать помехоустойчивость системы, т.е. снижение частоты ложных срабатываний; быстродействие системы, т.е. время реакции на изменение состояния; компенсацию переходных процессов в ОУ, при наименьшем возможном воздействии на ход нормального

i Надоели баннеры? Вы всегда можете отключить рекламу.