Научная статья на тему 'Процедура группирования контролируемых параметров в диагностической экспертной системе'

Процедура группирования контролируемых параметров в диагностической экспертной системе Текст научной статьи по специальности «Математика»

CC BY
76
30
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Миненкова Злата Евгеньевна

Описывается комбинированный механизм логического вывода, существенным элементом которого является разбиение всего множества контролируемых параметров на возможно более независимые подмножества. Эта идея реализуется особой процедурой группирования в специальном пространстве, где “расстояние” между двумя параметрами — величина, обратная их коэффициенту корреляции.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Grouping Procedure of controlled parameters for diagnostic expert systems/

Attached to construction of diagnostic expert systems arises grouping task decision necessity of controlled parameters. In offered method grouping procedure performs in special space, where “distance” between two parameters size, reverse to their correlation coefficient. The grouping centers are the parameters pairs a correlation coefficients sum of which maximum. A further parameters linking up makes to that grouping center, “distance” to which least.

Текст научной работы на тему «Процедура группирования контролируемых параметров в диагностической экспертной системе»

УДК 519.237.8

ПРОЦЕДУРА ГРУППИРОВАНИЯ КОНТРОЛИРУЕМЫХ ПАРАМЕТРОВ В ДИАГНОСТИЧЕСКОЙ ЭКСПЕРТНОЙ СИСТЕМЕ

МИНЕНКОВА З.Е.________________________

Описывается комбинированный механизм логического вывода, существенным элементом которого является разбиение всего множества контролируемых параметров на возможно более независимые подмножества. Эта идея реализуется особой процедурой группирования в специальном пространстве, где “расстояние” между двумя параметрами — величина, обратная их коэффициенту корреляции.

При построении диагностических экспертных систем возникает необходимость решения задачи группирования контролируемых параметров.

1. Постановка задачи группирования

Задача кластеризации состоит в следующем.

Пусть (Д,A2,...,A„) — набор контролируемых параметров объекта, а k. . — коэффициент корреляции между параметрами с номерами j1 и j2.

Р

Z j - є {І2,..,п}.

i=1

Индикатор Xjj будет равен 1 только тогда, когда

оба параметра будут входить в одну i группу. Индикатор равен 0, если j1 и j2 не входят в і-ю группу, кроме того, это ограничение не позволяет образовать группу из одного элемента.

Полученная задача является минимаксной трех-индексной бипланарной транспортной задачей линейного программирования [1].

В результате реализации описанного алгоритма все множество контролируемых параметров разбивается на подгруппы. Отметим, что трудности аналитического решения сформированной многоиндексной задачи линейного программирования быстро растут с увеличением размерности задачи. В связи с этим рассмотрим приближенный алгоритм ее решения.

2. Эвристический алгоритм группирования параметров

Алгоритм является итерационным и содержит подготовительный и основной этапы.

Подготовительный этап.

На этом этапе отыскиваются “центры группирования” в виде пар параметров.

Введем индикатор X. , принимающий значение,

равное 1, если параметр j назначен в і-ю группу, и равное 0 — в противном случае.

Тогда естественная постановка задачи группирования имеет вид: найти набор

j = arg max j min min {j. x, J

удовлетворяющий ограничениям

p

Z xv = i, j = 1,2,-, n

i=i

Введем индикатор

Z.

1, если параметры (ij) образуют центр группирования, 0, если не образуют.

Тогда может быть сформулирована следующая оптимизационная задача. Найти набор {-ZjJ , максимизирующий

ФЛ =tt j а)

І=1 j=1

и удовлетворяющий ограничениям

где р — количество групп.

Данное ограничение указывает на то, что каждый из параметров может попасть только в одну из групп.

Полученная задача квадратичного булева программирования легко трансформируется в задачу линейного программирования с использованием преобразования х.j = х. х. . Ясно, что индикатор X.. равен 1 только в том случае, когда X. = X.. = 1.

При этом исходная задача преобразуется к виду: найти набор

{xihj2} = arg max\ min min\k... x

I i J1J2

удовлетворяющий ограничениям

Z Zjj = 1, i = 1,2, ., п , (2)

j=1

Z Zij =1, j = 1,2, ., п, i=1 (3)

= Zji. (4)

Смысл этой задачи очевиден. В матрице коэффициентов корреляции K = [K-ij) отыскивается п

элементов таких, что сумма соответствующих коэффициентов корреляции максимальна. При этом ограничения (2), (3) обеспечивают выполнение естественного требования, чтобы никакая пара из этих п элементов не лежала в одном столбце или одной строке, т.е. ни один из параметров не может быть использован для образования двух или более центров. Ограничение (4) фиксирует то обстоя-

114

РИ, 2000, № 3

тельство, что элементы матрицы (i, j и (j, i) соответствуют одной и той же паре.

Полученная задача является задачей булева линейного программирования. Дополнительное ограничение (4) существенно отличает ее от классической задачи назначения, для точного решения которой мог бы быть применен известный “венгерский метод”. Для решения задачи (1)-(4) используем приближенный алгоритм.

Предварительно сделаем два замечания. Первое из них относится к любой задаче линейного программирования и состоит в следующем.

Пусть набор |х*| , j = 1,2,...,n является решением

задачи максимизации для линейной целевой функции

Lx)=Z cjxj

j=1

(5)

при ограничениях

n

Zajxj = b , i = 1,2,...m, (6)

j=i

Xj ^ 0, j = 1,2,...,n .

Тогда, очевидно, этот же набор является одновременно решением задачи минимизации для целевой функции

L'(x) = £ cjxj, (7)

j=1

где c'j = —Cj , j = 1,2,..., n при тех же ограничениях.

m n

L(x) = YLcijxv (8)

i=1 j = 1

и удовлетворяющий ограничениям

n

Z Xj = a,, i = 1,2,..., m,

j=1

m

Z Xj = bj, j = 1,2,..., n (9)

i=1

Xj > 0,i = 1,2,...,m, j = 1,2,...,n, выполнено преобразование

c'ij = cij + di + ej, i = 1,2,..., m, j = 1,2,..., n. Тогда

L'{x) = Yic'jXj =

i=1 j=1

m n m n m n

=YLcx+YLdtxv+YLejxj =

i=1 j= 1 i=1 j= 1 i=1 j= 1

m n n m

=L{x)+x d Z xj+Z ej Z xj = (io)

i=1 j=1 j=1 i=1

m n

= L(^ + ^ diai ejbj = L(x) + c,

i=1 j=1

где c — константа, не зависящая от набора |x,j j .

Отсюда следует, что на любом наборе, удовлетворяющем (9), значение целевой функции для преобразованной задачи отличается от значения целевой функции исходной задачи на константу, определяемую только параметрами преобразования и константами самой задачи, но не набором jxjj . Поэтому оптимизирующие наборы этих задач совпадают.

Второе замечание справедливо для задач линейного программирования типа транспортных и касается возможности так называемых эквивалентных пре -образований задач линейного программирования. Введем следующие определения.

Определение 1. Задачи линейного программирования будем называть эквивалентными, если их оптимизирующие наборы совпадают.

Определение 2. Преобразование, переводящее задачу линейного программирования в эквивалентную ей задачу, будем называть эквивалентным.

Покажем, что для задач линейного программирования типа транспортных, в том числе и для задач (1)-(5), эквивалентным является преобразование, состоящее в прибавлении по всем элементам какой-либо строки и столбца матрицы О произвольных констант.

Действительно, пусть для задачи: найти {xj}, i = 1,2,...,m , j = 1,2,..., n,

Перейдем к описанию алгоритма.

Предварительно исходная задача максимизации (1) трансформируется в некоторую эквивалентную ей задачу минимизации таким образом, чтобы все элементы полученной для эквивалентной задачи

матрицы [c'ij ) были неотрицательны. Цель описанных ниже операций состоит в получении в результате эквивалентных преобразований исходной матрицы (cij ] такой матрицы D , которая содержала

бы n нулей, никакая пара из которых не лежала бы в одной и той же строке и в одном и том же столбце.

Систему нулевых элементов матрицы, обладающей тем свойством, что никакая пара из них не лежит в одной строке или в одном столбце, будем называть системой независимых нулей. Понятно, что если система независимых нулей содержит ровно n элементов (больше, чем n их не может быть по определению), а остальные элементы матрицы неотрицательны, то решение задачи минимизации

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

минимизирующий

LdX=zz

cjxj

i=1 j =1

РИ, 2000, № 3

115

при удовлетворении (2)-(4) состоит в выборе плана назначения X * = (х.), единичные компоненты которого соответствуют нулевым элементам (из системы независимых нулей) матрицы D , получаемой в результате эквивалентного преобразования.

Действительно, так как нет никакой пары независимых нулей, лежащих в одной строке или столбце, то такой план удовлетворяет ограничениям (2), (3). Значение целевой функции LD{X) на этом плане равно нулю и в силу неотрицательности элементов матрицы D не может быть уменьшено.

С другой стороны, так как матрица D была получена из исходной с помощью эквивалентных преобразований, то набор X* максимизирует (1).

Процедура эквивалентного преобразования исходной матрицы C выполняется следующим образом.

В каждом столбце матрицы C отыскивается максимальный элемент, т.е.

I j = max{cj}, j = 1,2,..., n.

Далее формируется новая матрица C = [cj) по

правилу: каждый элемент с'- равен разности между

и

максимальным элементом £ . соответствующего столбца исходной матрицы и соответствующим (і, j)-м элементом исходной матрицы, т. е.

4 = maXCj) - с. = і j - с. > о, (її)

і = 1,2,...,n, j = 1,2,...,n.

В результате проведения этой операции получим матрицу C с неотрицательными элементами, в каждом столбце которой имеется по крайней мере один нуль.

Преобразование (11) является эквивалентным, так как изменение знака матрицы C не искажает оптимизирующего набора, так же как и прибавление ко всем элементам одного и того же столбца одной и той же константы.

Теперь в каждой строке матрицы C' отыскивается минимальный элемент, который вычитается из всех элементов соответствующей строки матрицы. Таким образом, элементы получаемой при этом матрицы C" рассчитываются по формуле

4 = 4 - rnn(с'.} = сі. -di > 0, (ї2)

і = 1,2,...,n , j = 1,2,...,n .

Преобразование (12) также является эквивалентным. В результате его проведения в каждой строке матрицы образуется, по меньшей мере, один нуль.

В силу ограничения (4) требуемую систему независимых нулей, задающих решение задачи выбора “центров группирования”, можно выбирать из любой половины (над главной диагональю или под ней) полученной симметричной системы нулей.

Подготовительный этап завершается формированием множества М, состоящего только из элементов, образующих центры группирования.

Основной этап.

П1. Найти j і M такой, что

Сформировать M = M ^ j . Поясним приведенные соотношения.

( j, 4 = arg max j min

M I <=1,2

На этом этапе итерационно осуществляется рациональное подключение каждого из параметров, не использованных в качестве “центров группирования”, к одной из сформированных групп. Пусть параметр j не принадлежит ни одному из “центров группирования”. Введем следующие обозначения: j — первый элемент из пары, составляющей і -й “центр группирования”; j 2 — второй элемент из

этой пары. Пусть К. . — коэффициент корреля-

i1

ции между j -м параметром и первым элементом пары из і -го “центра группирования”, а K. . —

. J’Ji2

коэффициент корреляции между j -м параметром и вторым элементом из этой пары. Находим среди этих коэффициентов минимальный -

К. . = mm К. . Так поступаем с каждым из “цен-

тров группирования” и в каждом случае находим минимальный коэффициент корреляции. Теперь имеем набор минимальных коэффициентов корреляции между j -м параметром и каждым “центром группирования”. Затем из всего набора минимальных коэффициентов находим максимальный элемент — К. . Этот максимальный коэффициент и определит, к какому “центру группирования” следует отнести данный j параметр. Этот коэффициент корреляции характеризует степень статистической связи между j -м параметром и і -й группой.

П2. Если M Ф (1,2,...,n), то П1 повторить. В противном случае работа алгоритма завершена.

Таким образом, процедура продолжается, пока в множестве M не окажутся все контролируемые параметры, т.е. все параметры будут сгруппированы.

Многочисленные вычислительные эксперименты показали хорошую работоспособность приведенного эвристического алгоритма кластеризации.

Литература: 1. Раскин Л.Г., Кириченко И.О. Многоиндексные задачи линейного программирования. М.: Радио и связь, 1982. 239 с.

Поступила в редколлегию Рецензент: Раскин Л.Г.

Миненкова Злата Евгеньевна, преподаватель Машиностроительного техникума ПГТУ (г.Мариуполь). Научные интересы: классификация, статистическое оценивание. Адрес: Украина, 87520, Мариуполь, ул. Мамина-Сибиряка, 37, кв. 28, тел. (0629)38-69-45.

116

РИ, 2000, № 3

i Надоели баннеры? Вы всегда можете отключить рекламу.