Научная статья на тему 'Поиск максимальных интервалов области признакового пространства в лексикографическом порядке'

Поиск максимальных интервалов области признакового пространства в лексикографическом порядке Текст научной статьи по специальности «Математика»

CC BY
36
5
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Ильченко А.В.

В статье изучаются свойства индикаторных векторов интервалов признакового пространства, рассматриваются алгоритмы поиска замкнутых индикаторных векторов и индикаторных векторов, порождающих максимальные интервалы заданной области признакового пространства.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The properties of characteristic vector families for intervals of the feature space are under investigation. The search algorithms for the closed characteristic vectors and vectors generating the maximum intervals of the specified feature space region are considered in the paper.

Текст научной работы на тему «Поиск максимальных интервалов области признакового пространства в лексикографическом порядке»

УДК 517.9

ПОИСК МАКСИМАЛЬНЫХ ИНТЕРВАЛОВ ОБЛАСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА В ЛЕКСИКОГРАФИЧЕСКОМ

ПОРЯДКЕ

© Ильченко A.B.

Таврический национальный университет им. В.И. Вернадского

факультет математики и информатики

пр-т Вернадского, 4, г. Симферополь, 95007, Украина e-mail: ilch@crimea.edu

Abstract. The properties of characteristic vector families for intervals of the feature space are under investigation. The search algorithms for the closed characteristic vectors and vectors generating the maximum intervals of the specified feature space region are considered in the paper.

Введение

Алгоритмы и методы кластерного анализа во многом составляют основу приложений анализа данных. Рост объёма данных, подлежащих обработке, предъявляет ряд требований к используемым алгоритмам кластеризации: возможность находить кластеры в пространствах большой размерности, наглядность, лёгкость интерпретации полученных результатов, отсутствие необходимости приведения исходных данных к какому-либо каноническому виду и так далее.

В некоторых случаях выполнение многих из этих требований могут обеспечить алгоритмы и методы анализа формальных понятий [1, 2, 6], сеточные методы.

Целью статьи является рассмотрение понятия индикаторного вектора интервала признакового пространства, изучение свойств семейства таких векторов, построение и обоснование алгоритма поиска замкнутых индикаторных векторов и индикаторных векторов, порождающих максимальные интервалы заданной области признакового пространства.

1. Максимальные интервалы области признакового

пространства

{А0, Ai,..., An_i, } - семейство множеств, каждое из которых конечно и линейно упорядоченно. Прямое произведение множеств семейства А определяет п-мерное признаковое пространство S:

S = А0 х Ai х • • • х An-i-

Иногда на обозначение Aj ссылаются как на измерение (атрибут, домен) признакового пространства. Поскольку множество значений по каждому Aj линейно упорядоченно, можно говорить о положительном и отрицательном направлениях по соответствующему измерению.

щ = \Ai\, % = 0,1,..., п — 1 - мощность домена А^.

Элементы домена А^ можно перенумеровать и, в дальнейшем, всегда считать, что = {0,1,,,,, п — 1},

Пусть Н С— $ некоторая область признакового пространства Б. Интервал I, содержащийся в области //. называется максимальным интервалом области //. если не существует его собственного надинтервала, содержащегося в области //.

Множество всех максимальных интервалов области II называется сокращенной интервальной структурой этой области [4]. Каждую область Н признакового пространства 5 можно представить в виде объединения интервалов ее сокращенной интервальной структуры.

Удобно точки области II называть единичными точками (1-точки) так, как если бы была задана индикаторная функция этой области, а интервалы области II называть 1-интервалами, Те точки признакового пространства, которые не содержатся в области Н, будем называть 0-точками признакового пространства,

2, Векторное представление интервалов

У пространства Б, размерность которого п, имеется 2п направлений, В каждом измерении по два направления: отрицательное и положительное. Любой интервал может быть получен из интервала, представляющего пространство Б, удалением некоторого числа значений из доменов, по соответствующим направлениям. Для описания интервала будет использоваться вектор длины 2п:

А = (Оо, Ох, ... , 02г, 0,2г+1, ■ ■ ■ , 0,2п-2, 0>2п-1) (1)

Компоненты такого вектора рассматриваются парами. Каждая пара соответствует одному из измерений признакового пространства. Каждая компонента такой пары отвечает одному из направлений соответствующего измерения. Пара 02г, 02г+х соответствует г-му измерению.

Компонента с^ отвечает отрицательному направлению г-го измерения. Компонента с^+х - положительному направлению.

Значение каждой компоненты такой пары - число значений, удалённых из домена Аъ по соответствующему направлению.

Такой вектор будем называть индикаторным вектором интервала или векторным описанием интервала.

Если вектор А является индикаторным вектором интервала /, то удобно говорить, что вектор А порождает интервал I (обозначение А(1)), а интервал I порождается вектором А (обозначение 1(А)).

Когда вектор А является описанием непустого интервала, то для каждого измерения признакового пространства сумма компонент по этому измерению меньше мощности домена значений этого измерения:

ч-л + «2г+1 < Щ, г = 0,1,,,,, п - 1. (2)

Если для какого-либо из измерений с^ + с^+х > /',. это означает, что такой вектор является описанием пустого подмножества.

Примечание 1. Для нас представляют интерес непустые интервалы. Поэтому вектора-описания, в которых хотя бы для одного измерения выполняется условие

о2г + а<21+1 > Щ, исключаются из рассмотрения. Если всё же потребуется использовать пустое подмножество, то в качестве индикаторного вектора будет использоваться вектор, в котором значение каждой компоненты равно мощности домена по соответствующему измерению признакового пространства, то есть вектор, в котором

о2г = ^¿+1 = щ, г = 0,1,... ,п - 1. (3)

3, Лексикографический порядок на множестве индикаторных

векторов

Определение 1. Пусть А, В - индикаторные вектора. Вектор А лексически предшествует вектору В, если существует направление к такое, что »/, < !>/, ■ а по всем направлениям, предшествующим направлению к, значения компонент векторов А и В совпадают:

А<В& Зк(ак < Ъъ.Уз < к(сЧ = Щ)). (4)

Для сокращения записи будет использоваться следующее обозначение:

А<кВ ^ак<Ък.У] < = 6,-). (5)

Тогда, определение лексического порядка запишется в виде

А<В^ЩА<кВ). (6)

Удобно индикаторные вектора перебирать в лексическом порядке, начиная с вектора (0, 0,,,,, 0, 0), который является индикаторным вектором признакового пространства

Алгоритм вычисления вектора, непосредственно лексически следующим за текущим вектором, основан на следующих соображениях.

Лексический порядок - порядок линейный. Поэтому вектора, расположенные в лексическом порядке, можно пронумеровать числами 0,1,,,,, начиная с вектора (0, 0,,,,, 0, 0), Тогда переход от текущего вектора, к вектору непосредственно лексически следующим за текущим, осуществляется прибавлением единицы к номеру текущего вектора и записи векторного представления полученного числа. То есть, индикаторный вектор можно рассматривать как позиционную запись неотрицательного целого числа.

Отличия от обычного позиционного представления чисел заключаются в следующем:

1, Для каждой пары позиций, соответствующих одному из измерений, используется своё основание, которое совпадает с мощностью домена этого измерения,

2, Для каждой пары позиций, соответствующих одному из измерений, должно выполняться ограничение (2), что позволяет исключить из рассмотрения пустые интервалы.

4, Вычисление непосредственно лексически следующего

индикаторного вектора

Псевдокод алгоритма.

Вход, А - текущий индикаторный вектор;

Выход, А + 1 - индикаторный вектор, непосредственно лексически следующий за вектором А.

Метод,

1) i = n — 1

2) while i > 0

з) a>2i+i = a>2i+i + 1

4) if a2i + a2i+i < n, then return A

5) °2j+l = 0

6) 0-2 i = a2i + 1

7) if a2i < n, then return A

8) a2i = 0

9) i = i — 1

10) end while

И) return A

Приведенный псевдокод основан на соображениях предшествующего раздела, В дальнейшем, вычисление вектора, непосредственно лексически следующего за текущим вектором А, будет обозначаться А+1.

5, Замкнутые интервалы признакового пространства

Пусть ACS - некоторое подмножество точек признакового пространства. Обозначим [А] наименьший интервал пространства S, содержащий подмножество точек А (интервальное замыкание, интервальная оболочка множества А).

Операция интервального замыкания обладает обычными свойствами операции замыкания [5]:

А С В [А] С [В], (7)

А С [А], (8)

М = № (9)

Обозначим I(S) - семейство всех интервалов признакового пространства S. I е I(S) - фиксированный интервал из этого семейства,

/ Г II подмножество точек области II. содержащихся в интервале I (1-точки пространства S, содержащиеся в интервале I).

[1ПН] - наименьший интервал пространства S, содержащий подмножество / Г II (интервальное замыкание подмножества 1-точек пространства S, содержащихся в интервале I).

Определение 2. Интервал I £ I(S) называется замкнутым (относительно области Я)), если [ШН] = I.

Утверждение 1. Каждый 1-интервал является замкнутым интервалом,.

Доказательство. Пусть I е 1(Б) и/С //.

Так как / С II. ю I Г 11 = 1 н. следовательно, [/ П Д] = [/].

Это, с учётом очевидного равенства [/] = I, позволяет сделать вывод, что [I П Я] = I. □

Примечание 2. В силу утверждения 1, максимальные 1-интервалы имеет смысл искать среди замкнутых интервалов.

Примечание 3. Замкнутые интервалы интересны и сами по себе. Например, в анализе формальных понятий [1], [2] их можно рассматриваться как содержания «интервальных» формальных понятий, В задачах распознавания образов замкнутые интервалы могут быть использованы для построения различных гипотез [6].

6, Решётка интервалов и решётка индикаторных векторов

Для семейства I(S) выполняется свойство замыкания [3] относительно операции пересечения. Поэтому I(S), упорядоченное отношением включения С, является полной решёткой.

Обозначим A(S) семейство всех индикаторных векторов признакового пространства S.

Между множествами I(S) и A(S) существует взаимно-однозначное соответствие (с учётом примечания 1):

' 1(A)++А(1).

На векторах семейства A (S) следующим образом определяется отношение предшествование <:

А<В1(B) С 1(A). (10)

Так определённое отношение предшествования является отношением порядка, двойственным к порядку, определяемому отношением включения С на множестве I(S). Поэтому, множество A(S), упорядоченное отношением <, является двойственным к решётке (I(S), С) и, следовательно, является полной решёткой,

С использованием введенного отношения предшествования, определяются отношения строгого < и непосредственного ~< предшествования, А< В ^ А<В ж Аф В. А<В ^ А<В жЗС е A(S) . А < С < В.

Утверждение 2. Пусть А, В е A(S).

А < В «ф» cij < bj, j = 0,1,..., 2п - 1. (11)

Доказательство. А < В ■ФФ- 1(B) С 1(A)

•ФФ- по каждому из 2п направлений признакового пространства, в интервале 1(A) удалено не больше значений, чем удалено по соответствующим направлениям в интервале 1(B)

•ФФ- Oj < bj, j = 0,1,..., 2п - 1. □

Из утверждения 2 следует

Утверждение 3. Решёточный порядок < на множестве индикаторных векторов с сохранением порядка вложен в лексический порядок <:

А< В ^ А< В. (12)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Так же, из утверждения 2 следует Утверждение 4.

А~< В^В \к(ак + 1 = Ьк,Щ ф к(щ = 6,-)). (13)

7, Оператор замыкания на решетке индикаторных векторов

Пусть Н С Б - область пространства На множестве А(Б) определим оператор ". который каждому индикаторному вектору А ставит в соответствие индикаторный вектор А", порождающий наименьший интервал, содержащий те же 1-точки, что и интервал, порождаемый исходной вектором А.

Результат действия оператора ". удобно представить в виде следующей последовательности шагов:

А => 1{А) => 1{А) П Я =>■ [1(А) П Я] =>■ А".

В силу своего определения, оператор "' обладает следующими свойствами, аналогичными свойствам (7) — (9):

А<В^А"< В", (14)

А < А", (15)

(А")" = А", (16)

и, следовательно, является оператором замыкания [3] на множестве А(Б). Вектор А" называется замыканием вектора А.

Определение 3. Индикаторный вектор А называется замкнутым, если он совпадает со своим замыканием, то есть, если А" = А.

В силу определения оператора замыкания, именно замкнутые индикаторные вектора порождают интересующие нас замкнутые интервалы.

Если у вектора А его компоненты обозначены как г/. ] = 0,1,,,,, 2п — 1, то соответствующие компоненты вектора А" будут обозначаться о", ] = 0,1,,,,, 2п — 1, В силу монотонности оператора замыкания (14) и утверждения 2, компоненты векторов А и А" удовлетворяют условию

а5 < а'!, з = 0,1,...,2п- 1. (17)

Пусть А е . !(>') и А <„, А + 1, В этом случае

А = (о0,----'/,„• ат+1,..., а-,„ |) и А + 1 = (>/„•.. ■, ат + 1, 0,..., 0), где

т = тах{] : Ф 0, ] = 0,1,,,,, 2п — 1, } (18)

то есть, т - наибольшее направление признакового пространства, по которому компонента а I вектора А + 1 отлична от нуля,

Обозначим М - подмножество всех векторов, которым вектор А предшествует по компоненте т:

М = {1)е А(Б) | А <т £>}. (19)

Любой вектор С (Е А(Б) такой, что С и к < т находится лексически дальше от вектора А, чем каждый из векторов подмножества М. Поэтому, именно среди векторов подмножества М следует искать замкнутый вектор, лексически ближайший к вектору А. И только, если в подмножестве М искомого вектора не окажется, переходить к векторам, которым вектор А лексически предшествует по направлениям, меньшим направления т,.

В множестве А(Б), упорядоченном отношением лексического порядка, подмножество М является интервалом. Обозначим этот интервал [В, В + +]. Нижняя граница этого интервала В - вектор, непосредственно лексически следующий за вектором А, то есть, В = А + 1. Вектор В + + определяется по вектору А + 1 и соответствующему измерению т (18),

Утверждение 5. УА е А(Б) : А < (А + 1)".

Утверждение 6. Пусть А е А(Б). Если А <то А + 1, О - замкнутый вектор такой, что А <то £>, то (А + 1)" < Б и, следовательно, (А + 1)" < £>.

Утверждение 7. Пусть А е А(Б). Если А <т А + 1, О - замкнутый вектор такой, что А <т £>, то А <т (А + 1)".

Из утверджений 6 и 7 вытекают следующие утверждения.

Утверждение 8. Если А <то А + 1 и А <то (А + 1)", то (А + 1)" - лексически наименьший замкнутый вектор среди замкнутых индикаторных векторов, лексически следующих за вектором А.

Утверждение 9. Если (А + 1)" не является лексически наименьшим замкнутым вектором среди замкнутых индикаторных векторов, лексически следующих за вектором А, то не выполняется, условие А <то (А + 1)".

Последнее утверждение позволяет сформулировать условие проверки, является ли вектор (А + 1)" искомым индикаторным вектором.

Утверждение 10. Пусть

к = тт{] | а!- ф а,/, ] = 0,1,,,,, 2п — 1}, (20)

то есть, к - наименьшее направление признакового пространства, по которому компоненты векторов А и (А+ 1)" не совпадают. Тогда, если к < т, то (А + 1)" не является, искомым вектором.

Таким образом, если выполняются условия утверждения 10, интервал [В, В + +], где В = А + 1, не содержит замкнутых векторов и его элементы следует пропустить. Для этого следует перейти к вектору, непосредственно лексически следующему за вектором В + +.

Интервал [В, В + +] удобно называть исключаемым интервалом незамкнутых векторов,

8, Алгоритм поиска лексически следующего замкнутого

индикаторного вектора

Алгоритм lexicalNextClose(A) - алгоритм поиска лексически наименьшего замкнутого индикаторного вектора, следующего за вектором А.

Псевдокод алгоритма lexicalNextClose(A).

Вход, А - текущий замкнутый индикаторный вектор; Выход, С - лексически наименьший замкнутый индикаторный вектор, следующий за вектором А.

Метод,

1) В = А+ 1

2) С = А"

3) repeat

4) т = m,ax{j \ bj Ф 0, j = 0,1,,,,, 2п — 1}

5) k = min{j | bj ф Cj, j = 0,1,,,,, 2п — 1}

6) if к < т then begin

7) В = В + +

8) В = В + 1

9) С = В"

10) end

11) until к < т

12) return С

Пояснения к псевдокоду алгоритма lexicalNextClose(A).

Шаг 1, В вектор, непосредственно лексически следующий за А.

Шаг 2, С - замыкание вектора В.

Шаги 3-11, Цикл, осуществляющий вычисление искомого вектора. Шаг 4, т - наибольшее измерение признакового пространства, по

которому компонента вектора В отлична от нуля. Шаг 5, к - наименьшее измерение признакового пространства, по

которому компоненты векторов В и С не совпадают. Шаг 6, Проверка, является ли вычисленное С искомым вектором.

Если условие выполняется, то - не является. Шаг 7, Пропуск лексического интервала незамкнутых векторов,

следующих за текущим вектором В. Шаг 8, Замена текущего значения вектора В на вектор,

непосредственно лексически следующий за вектором В + +, Шаг 9, С - замыкание вектора В.

Шаг 11, Проверка, найден ли искомый вектор.

Шаг 12, Возврат найденного вектора С.

9, Исключаемый интервал

Пусть А Е A(S) - 1-вектор, 1(А) - порождаемый им интервал,

A^ = {De A(S) I A<D}. (21)

Элементы подмножества - это 1-вектора, порождающие подинтервалы интервала 1{А).

A^ = {DE A(S) I А < D}. (22)

Элементы подмножества А< - все вектора, лексически следующие за вектором А.

В силу линейности лексического порядка подмножество А< - цепь в упорядоченном множестве (A(S),<), начинающаяся с вектора А.

Рассмотрим на подмножестве подцепочку максимальной длины, начальный

элемент которой вектор А, и состоящую из элементов подмножества непосредственно лексически следующих друг за другом.

Такая подцепочка образует некоторый интервал [А, В] подмножества v4.<. Вектор А - нижняя грань этого интервала. Вектор В - это вектор из подмножества такой, что непосредственно лексически следующий за ним вектор (вектор В + 1) уже не является элементом подмножества .1, ,

1-интервалы, порождаемые векторами из интервала [А, В], не являются максимальными (за исключением, может быть, вектора А), и, следовательно, могут быть исключены из рассмотрения (пропущены). Таким образом, от вектора А можно сразу перейти к вектору В.

Интервал [А, В] будем называть исключаемым интервалом 1-векторов, Вычисление вектора В по заданному вектору А осуществляется следующим образом.

Пусть А = (>/,,.,,,, а2п-1) и

т = max{i \ ф О V Ф 0, % = 0,1,,,,, п — 1}, (23)

то есть, т - наибольшее измерение признакового пространства S, в котором хотя бы по одному из направлений есть отличная от нуля компонента. Различаются два случая: a2rn+i = 0 и a2rn+i Ф О, Каждый из этих случаев рассмотрим отдельно. Случай 1), a2m+i = О,

Здесь вектора А и В имеют следующий вид:

А = (о0,..., о2то_i, а2т, 0,..., 0), (24)

В = (оо,..., 02m-i, b2rn, b2m+i,,,,, b2n-i), (25)

где

&2то = ("//< — 1); Ь2т+1 = 0,

&2то+2 = (%+1 — 1), &2то+3 = 0, ^g^

Ъ2п-2 = ("„ I - 1), &2га-1 = 0.

Для компонент векторов А и В выполняются условия покомпонентного предшествования:

Оо = Ьо, . . . , 02то-1 = &2ТО-1, а>2т, < &2то, ■ ■ ■ , 02п-1 < Отсюда, в силу (11), А < В и, следовательно, В Е

Кроме того, так как А < В, то А < В, а, значит, [А, В] - интервал в т4.<. Каждый вектор I) Е [А, В] имеет вид:

I) = (оо, ■ ■ ■ , 02ТО-1, (1,2гп; ^2то+Ъ ■ ■ ■ , (1>2п-1);

и для его компонент выполняются условия ч < (I¡. ] = 0,1,,,,, 2п — 1, Поэтому .1 < I) н. следовательно, I) Е Таким образом, [А, В] С

Покажем, что вектор, непосредственно лексически следующий за вектором В, не

А А

принадлежит подмножеству 1,

Пусть С = В+1 - вектор, непосредственно лексически следующий за вектором В. В векторе С компонента С2т = 0. Так как 02ТО ф 0. чо С2т ^ о>2т и, следовательно, А £ С, то есть, С £ . Случай 2), 02ТО+1 т^О,

Здесь вектора А и В имеют следующий вид:

А = (о0,..., о2то-1, о2то, о2то+1, 0,,,,, 0), (27)

В = (оо, ■ ■ ■ , 02то-1, 02т, &2ТО+1, ■ ■ ■ , &2П-1), (28)

где

&2то = 0'2т; &2то+1 = (Пт — 1) — 02то,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

&2то+2 = (ито+1 — 1), &2то+3 = 0,

(26)

Ъ2п-2 = ("„ I - 1), &2га-1 = 0.

Для этого случая обоснование почти полностью повторяет предыдущий вариант, за исключением того, что в векторе С теперь компонента С2т+1 = 0,

Таким образом, по заданному 1-вектору А, используя (26) или (29), можно вычислить исключаемый интервал 1-векторов [А, В].

10, Расширение исключаемого интервала

А- вектор, непосредственно предшествующий вектору А по направлению 2т + 1,

Так как

А = (о0, ■ ■ ■ , а,2т-1, а,2т, а,2т+1, 0,..., 0), то, с учётом (13),

А = (о0,..., о2то-1, о2то, а2т+1 — 1, 0,,,,, 0),

А- < .1 н. следовательно, 1(А) С /(.1 ) и А- < А.

Вектор А- - это не 1-вектор, Если бы вектор Апорождал 1-иптервал, то [А-, В] был бы исключаемым интервалом 1-векторов, А Е [А~~, В] и, поэтому, вектор А был бы исключён из рассмотрения.

Рассмотрим интервал •/. определяемый следующим образом:

J = I(A-)\I(A). (30)

Так как, 1П1(А) = 0 и /(.1 ) = Л.,1(Л). то интервалы ./ и 1(А) порождают разбиение интервала А

I (Л) - 1-интервал, I(Л } - не 1-интервал, Следовательно, именно интервал ,1, является интервалом, содержащим хотя бы одну 0-точку признакового пространства. Поэтому, любой интервал, содержащий интервал ,1, - не 1-интервал, Индикаторный вектор интервала ./:

А(^) = (°0; ■ ■ ■ ) Й2ТО-1, (пт — 1) — (о2то+1 — 1), а2т+1 — 1, 0, , , , , 0), (31)

Пусть [А, В] - исключаемый интервал 1-векторов, порождаемый вектором А. Рассмотрим следующие два шага.

Шаг 1).

В + 1 = (о0,.. ■, а,2т-1, о2то + 1, 0,..., 0). (32)

Так как, В + 1 < .!(./). то /(.!(./)) С 1(В +1) и, следовательно, В + 1 - не 1-интервал,

С = (оо, ■ ■ ■ , 02то-1, (12т + 1, 0>2т,+ 1 ~ 1; (^то+1 — 1); 0, , , , , (пп-1 — 1), 0), (33)

Так как, С < .!(./)- то /(. 1 (./)) С I(С) и, следовательно, С - не 1-интервал,

Далее, В + 1 < С и V/) е [В + 1,С] : !)<('. Следовательно, !((') С /(/)) н I) не 1-вектор, Поэтому, [В + 1, С] можно исключить из рассмотрения, тем самым расширив интервал [А, В] до интервала [А, С].

Шаг 2).

С + 1 = (о0,..., а2т-ь о2то + 1, о2то+ь 0, 0,..., 0, 0). (34)

Так как, А < С + 1, то /((' + 1) С 1{А) и, следовательно, [С + 1, (С + 1) + +] С А<. Поэтому, интервал [С + 1, (С + 1) + +] можно исключить из рассмотрения, расширив интервал [А, С] до интервала [А, (С + 1) + +],

Обозначим В = (С+1)++ и расширенный таким образом исключаемый интервал снова запишем в виде [А, В].

Шаги 1) и 2) повторять до тех пор, пока компоненты вектора В станут равными

&2то = (пт ~ 1) — °2то+Ъ Ь2т+1 = °2то+1- (35)

Примечание 4. Расширение исходного интервала [А, В] проводилось только для случая о2то+1 ф 0, Если о2то+1 = 0, то выражения (29) и (35) совпадут. Поэтому выражение (35) рассматривается как обобщение выражений (29) и (35),

Примечание 5. Вектор В, полученный в результате указанных вычислений будем обозначать А + +т, тем самым подчёркивая, что для его вычисления использован вектор А и информация по измерению т этого вектора (23),

11, Алгоритм поиска 1-векторов, порождающих максимальные 1-интервалы

Алгоритм ИзИМтАпИскатз - алгоритм поиска всех 1-векторов, порождающих максимальные 1-интервалы,

Псевдокод алгоритма Из1МтАпИскат8.

Вход, Нет;

Выход, В - список всех 1-векторов, порождающих максимальные 1-интервалы, Метод,

1

4

5

6

7

8 9

10 11 12

if (0,,,,, 0) - l-B6KTop return {(0,,,,, 0)} B = 0

A = (0,...,0)» repeat

if (A — 1) - 1-BeKTop then begin

if 3D e B : D < A then B = B U {A} m = max{i \ a2i ^ 0 V o2i+i ^ 0. i = 0,1,,,,, n — 1} A = A + +m end

A = lexical NextClose(A)

until ,1^(0.....0)"

return B

Пояснения к псевдокоду алгоритма Ыз1МтАпискатз.

Шаг 1, Если вектор, порождающий признаковое пространство, - 1-вектор,

то он порождает единственный максимальный 1-интервал, Шаг 2, Изначально множество В искомых 1-векторов пусто.

Шаг 3, А - текущий замкнутый вектор - замыкание вектора,

порождающего признаковое пространство. Шаги 4-11, Цикл, осуществляющий вычисление искомого множества векторов. Шаг 6, Если текущий 1-вектор А - это максимальный 1-вектор, то

включить его в множество В. Шаг 7, т - наибольшее измерение признакового пространства Б,

по которому хотя бы по одному из направлений есть отличная от нуля компонента.

Шаг 8, Перейти к правой границе исключаемого интервала.

Шаг 10, Найти замкнутый вектор, лексически следующий за текущим

вектором А.

Заключение

В работе получены следующие результаты: Определено понятие интервала, замкнутого относительно заданной области признакового пространства и показано, что искомые максимальные интервалы являются замкнутыми. Ведено понятие индикаторного вектора интервала, как способа представления интервалов признакового пространства. На множестве таких векторов определён оператор замыкания, порождающий замкнутые индикаторные вектора, реализующие замкнутые интервалы, Предложен алгоритм поиска в лексикографическом порядке всех замкнутых индикаторных векторов. Предложен алгоритм поиска в лексикографическом порядке всех индикаторных векторов, порождающих максимальные интервалы области признакового пространства,

список литературы

1. Ganter, В., Wille, R. Formal Concept Analysis - Mathematical Foundations. Springer-Verlag, Berlin., 1999.

2. Gugisch, R. Lattice Contexts - a Generalization in Formal Concept Analisys. Handuot to ICCS 2000, Darmstadt(2000) http://www.mathe2.uni-bayreuth.de/ralfg/papers/diplom.ps.gz.

3. Биркгоф Г. Теория решёток: Пер. с англ. - М.: Наука, 1984. - 568 с.

4. Ильченко А.В. Компактная компонентная и сокращённая интервальная структуры признакового пространства, порождаемые эмпирическими данными // Сб.Таврический вестник информатики и математики. - 2005. - Л>2. - С. 126-142.

5. Колмогоров А.К., Фомин С.В. Элементы теории функция и функционального анализа. - М.: Наука. Гл. ред. физ.-мат. Лит., 1989. - 624 с.

6. Кузнецов С. О. Автоматическое обучение на основа анализа формальных понятий // Автоматика и телемеханика. - 2001. - JM0. - С. 3-27.

Статья поступила в редакцию 10.12.2010

i Надоели баннеры? Вы всегда можете отключить рекламу.