Научная статья на тему 'Кластеризация окрестностной структуры'

Кластеризация окрестностной структуры Текст научной статьи по специальности «Математика»

CC BY
163
101
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОКРЕСТНОСТНАЯ СТРУКТУРА / МЕТРИКА / КЛАСТЕРИЗАЦИЯ / ФАКТОР-СТРУКТУРА / NEIGHBORHOOD STRUCTURES / METRICS / CLUSTERING / FACTOR-STRUCTURE

Аннотация научной статьи по математике, автор научной работы — Шмырин Анатолий Михайлович, Мишачёв Николай Михайлович, Косарева Анастасия Сергеевна

В статье определяется метрика на множестве узлов окрестностной структуры и рассматривается задача кластеризации окрестностной структуры по этой метрике или, что то же самое, задача построения окрестностной фактор-структуры. Определяемая метрика учитывает как связи между узлами структуры, так и имеющиеся экспериментальные данные кортежи состояний и управлений.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

CLUSTERING OF NEIGHBORHOOD STRUCTURE

We define a metric on the set of nodes of neighborhood structure and consider the clustering problem for the structure with respect to the metric, or, what is the same, the problem of constructing the factor-structure. Determined metric takes into account both the connections between the nodes of the structure and the experimental data at the nodes.

Текст научной работы на тему «Кластеризация окрестностной структуры»

УДК 512.8

БОТ: 10.20310/1810-0198-2016-21-2-457-462

КЛАСТЕРИЗАЦИЯ ОКРЕСТНОСТНОЙ СТРУКТУРЫ

© А. М. Шмырин, Н. М. Мишачев, А. С. Косарева

В статье определяется метрика на множестве узлов окрестностной структуры и рассматривается задача кластеризации окрестностной структуры по этой метрике или, что то же самое, задача построения окрестностной фактор-структуры. Определяемая метрика учитывает как связи между узлами структуры, так и имеющиеся экспериментальные данные - кортежи состояний и управлений.

Ключевые слова: окрестностная структура; метрика; кластеризация; фактор-структура.

Окрестностная структура (см. [1]) является удобным средством формализации связей между элементами моделируемой системы. Эту структуру можно рассматривать как «дискретный каркас» на основе которого можно строить математические модели следующего уровня, например линейные или билинейные. В книге [1] математические модели, надстроенные над окрестностной структурой, называются окрестностными системами. При моделировании систем с большим количеством элементов возникает необходимость построения фактор-структуры, содержащей меньшее количество укрупненных элементов (кластеров). Для этого нужно определить метрику на множестве элементов системы и правило преобразования связей между ними в связи между кластерами.

1. Окрестностные структуры.

Для того, чтобы корректно определить кластеризацию окрестностной структуры, т. е. переход к фактор-структуре, нам пришлось, по сравнению с [1], модифицировать основное определение и сопутствующие ему обозначения.

Окрестностной структурой мы называем взвешенный ориентированный граф с п вершинами и ребрами двух сортов, назовем их в -ребрами и и -ребрами. Эти ребра символизируют два типа связей между вершинами: связи «по состоянию» и связи «по управлению». Две вершины аг и аз могут быть соединены не более чем двумя в -ребрами (от аг к ац и от ац к аг) и, аналогично, не более чем двумя и -ребрами. Можно считать, что два таких в -ребра (или и -ребра) - это одно ребро с двумя ориентациями: от аг к ац и от ац к аг. Вершины графа называются узлами окрестностной структуры. Вес каждого ребра - это пара чисел (с, с) из интервала [0,1] , таких что с + с> 0 . Мы считаем, что ребро с весом (с, с) ,ведущее из узла аг в узел ац , описывает две связи аг с ац : мягкую связь с весом с и жесткую связь с весом с. Если с = 0 , то имеется только мягкая связь узлов, если с = 0 , то имеется только жесткая связь узлов. Мягким связям будут соответствовать вычисляемые коэффициенты математической модели, жестким - заданные коэффициенты.

Окрестностью узла аг по состоянию (управлению) называется множество всех концевых узлов всех в -ребер (и -ребер) исходящих из узла аг. Мы будем описывать окрестност-ную структуру матрицей смежностей [5, Б, и, и] , составленной из четырех матриц порядка п х п. Строка Б>1 = \ёц, ■ ■ ■ ,вСт] матрицы 5 задает веса мягких (вычисляемых) связей узла аг по состояниям: вц € (0,1] (вес связи), если узел ац входит в окрестность узла аг по состоянию и вц = 0 если узел аз не входит в эту окрестность. Аналогично определяются строки

остальных матриц Б,и,и . Обычно й + з^ = 0 и Т + = 0 , т. е. каждый узел входит в свои окрестности по состояниям и по управлениям (этому соответствует петли графа), но, вообще говоря, мы не исключаем случай, когда Т + =0 или й + щ = 0 .

Замечание. В книге [1], если использовать нашу терминологию, все ребра графа являются одинарными, т. е. описывают либо мягкую либо жесткую связь. В наших обозначениях это соответствует тому, что одно из двух чисел й или с является нулем. Наличие весовых множителей для связей г -го узла с остальными узлами в книге [1] интерпретируется как нечеткость соответствующих окрестностей.

2. Кортежи данных.

Статистику наблюдений реальной системы, описываемой окрестностной структурой, запишем в виде К х 2п-матрицы данных [Х\,..., Хп, VI,..., УП\ , где К - количество наблюдений системы. Строки [Xк ,Ук\ матрицы данных являются результатами к -го наблюдения (эксперимента): Xк = [хк , хП\ и Ук = [у^ ,... ,уП \ - это состояния и управления в узлах структуры, наблюдавшиеся в к -м эксперименте. Мы будем называть эти строки кортежами данных. Столбцы матрицы данных X^ или У - это векторы данных всех наблюдений соответствующего узла. В общем случае состояние или управление в узлах структуры могут быть многопараметрическими и потому элементы матрицы данных могут быть векторами (вообще говоря, разных размерностей). В простейшем случае, который мы далее и будем рассматривать, эти элементы являются числами. Итак, мы будем считать состояния и управления в узлах структуры скаля'рами. Это ограничение не является принципиальным и все дальнейшее нетрудно переписать для случая векторных состояний и управлений.

Замечание. Мы будем считать, что единицы измерения состояний и управлений в каждом узле выбраны таким образом, что выборки {хк}, к = 1,..., К и {ук}, к = 1,..., К (здесь г - номер узла) центрированы и нормированы. Переход к таким единицам измерения всегда возможен, но, как правило, требует пересчета заданных («жестких») коэффициентов математической модели.

3. Окрестностные системы.

Простейшей математической моделью, ассоциированной с окрестностной структурой (и описывающей работу соответствующей реальной системы), является линейная симметричная окрестностная система (модель). В рамках нашего подхода к определению метрики и дальнейшей кластеризации окрестностной структуры можно было бы рассматривать и более сложные модели, например билинейные (см [1]), но мы для простоты ограничимся здесь линейным случаем.

Мы будем использовать далее обозначение А о В для поэлементного произведения (произведения Адамара) матриц А и В . Линейная симметричная окрестностная система имеет

вид __ __ __ __

(й о й)Х + (Т о и)У = (П о Б)Х + (Т о и)У, (1)

где [Б, Б, и, и\ - определенная выше п х 4п матрица смежности окрестностной структуры, й = {йщ} и Т = {йщ} - п х п -матрицы вычисляемых коэффициентов системы, £} = {Шщ} и Т = {тщ} - п х п -матрицы заданных коэффициентов системы, X и У - п -кортежи состояний и управлений, являющиеся неизвестными окрестностной системы. Вычисляемые коэффициенты системы соответствуют мягким связям, заданные коэффициенты соответствуют жестким связям. Напомним, что мы считаем состояния и управления в узлах структуры скалярами, и потому элементы матриц Т, Т, £}, Т являются скалярами. В общем случае, когда состояния и управления являются векторами, элементы матриц Т,Т,П,Т будут матрицами.

Замечания.

1. Отличие системы (1) от аналогичной системы в книге [1] состоит в том, что узел ац , участвующий в записи г -го уравнения системы, может порождать слагаемое и в левой и в правой частях уравнения. Слагаемое в левой части содержит синтезируемый (вычисляемый) коэффициент и соответствует мягкой связи узла аг с узлом ац . Слагаемое в правой части содержит заданный коэффициент и соответствует жесткой связи узла аг с узлом ац . В книге [1] узел ац (в уравнении для узла аг) мог порождать слагаемое только в одной из частей.

2. Система (1) записана в виде, удобном для дальнейшей идентификации. После идентификации синтезированные и заданные коэффициенты при одинаковых неизвестных хг (или иг) можно объединить.

3. Не следует путать коэффициенты Т, Т, П,Т и веса [Б, Б, и, и ] .В окрестностной системе (1) заранее заданы матрицы П,Т (заданные коэффициенты) и [Б, Б, и, и] (веса). Матрицы с , Тс - синтезируемая часть системы.

4. Вообще говоря, левая часть системы может еще содержать неизвестный вектор С, а правая - заданный вектор С . Но такую систему всегда можно привести к виду (1). Для этого нужно формально ввести в систему два дополнительных узла, которые входят в окрестности всех узлов по состояниям, а их собственные окрестности - пустые. Все остальные узлы нужно считать мягко связанными с первым формальным узлом и жестко - со вторым. При этом соответствующий столбец матрицы Т (столбец вычисляемых коэффициентов) равен С и соответствующий столбец матрицы П (столбец заданных коэффициентов) равен С . Все данные по состояниям формальных узлов - единицы (хкп+\ = хкп+2 = 1) и все данные по управлениям - нули (= уП+2 = 0 ). Такие формальные узлы не порождают дополнительные уравнения системы.

В координатной записи линейная симметричная окрестностная система имеет вид

п п

^[(£>¿4 Тщ) Хз + (Тщ Щд) Уд ] = ^2[(Шгд вщ) Хд + (т гдЩд) Уд ], (2)

д=1 д=1

где (Тщ = 0 если Тгд = 0 , Тгд = 0 если Тгд = 0 , шгд = 0 если ~вгд = 0 и тгд = 0 если игд = 0 .

4. Синтез (идентификация) линейной окрестностной системы.

Рассмотрим задачу нахождения коэффициентов (Тгд и Тгд окрестностной системы (2) по экспериментальным данным - кортежам [Xк,Ук],к = 1,..., К . Подстановка кортежей данных в уравнении окрестностной модели (2) приводит к системе пК линейных уравнений для неизвестных коэффициентов Т и Т окрестностной модели. Вообще говоря, в окрестностной модели могут быть дополнительные условия, связывающие искомые коэффициенты разных уравнений модели, например условие симметричности или антисимметричности матриц с и Тс . Если таких условий нет, то система уравнений для нахождения коэффициентов окрест-ностной модели распадается на п систем, по одной системе для каждого узла модели:

п

^У^д (Тгд х*) + Тгд (щд Ук)] = Ьк, (3)

д=1

где Ьк = ^ПП=1[(гд(вгдхк) + тгд(игдук)] . Подчеркнем, что неизвестными в системе (3) являются искомые коэффициенты (Тгд и Тгд г -го уравнения окрестностной модели, а коэффициентами - числа Тгдхк и Тгдук Обозначим через Гг количество (ненулевых) неизвестных (Тгд и Тгд в системе (4). В невырожденном случае, т. е. когда ранг матрицы системы максимален, коэффициенты (Тгд и Тгд г можно найти как:

а) нормальное решение системы (решение с минимальной нормой), если К <гг;

b) решение определенной системы при K = ri ;

c) псевдорешение переопределенной системы (вектор неизвестных, минимизирующий норму вектора невязки), если K>r% .

Если ранг матрицы системы не максимален, то искомые коэффициенты можно найти как псевдорешение системы: минимальный по норме вектор, минимизирующий невязку.

5. Метрика на множестве узлов окрестностной структуры.

Для каждого узла ai окрестностной структуры определим взвешенную матрицу данных

Di = [siiXi,..., SinXn, siiXi,..., ßinXn, пцУ\,..., UinVn, uiiVi,..., щпУи, ] (4)

этого узла. Ненулевыми столбцами матрицы Di являются взвешенные столбцы матрицы данных [Xi,..., Xn, Vi,..., Vn], соответствующие всем узлам из окрестностей узла ai. Зададим метрику на множестве узлов окрестностной структуры формулой

rij = yj\\Di - Dj||2 + \\Xi - Xj||2 + \\Vi - Vj||2. (5)

Первое слагаемое под корнем оценивает сходство окрестностей узлов с учетом экспериментальных данных и взвешенных связей. Узел, входящий в окрестности по состояниям (управлениям) узлов ai и aj , или не входящий ни в одну из этих окрестностей, даст нулевой вклад в \\Di — Dj\\ . Узел aq , входящий только в одну из этих окрестностей, даст вклад, пропорциональный взвешенным данным наблюдений в aq . Сумма двух следующих слагаемых под корнем - это квадрат расстояния между векторами данных узлов ai и aj . Таким образом, определенная метрика вычисляет близость узлов по данным наблюдений и по их взвешенным связям (окрестностям) в окрестностной системе. З а м е ч а н и я.

1. Вместо взвешенной матрицы данных Di в формуле (5) можно использовать нормированные строки весов Di = Ci/\\ Ci \\ , где

Ci — [sil, ... , sin, sii, ... , sin, Uii, ... , uin, Uii, ... , Uin, ]. (6)

Определенная таким образом метрика fij в некоторых случаях может оказаться удобнее чем rij . Например, метрика fj оценивает расстояния между узлами окрестностями структуры и в том случае, когда данных нет.

2. Другой подход к определению меры близости узлов окрестностной структуры по связям и данным обсуждался в [2]. Заметим, что определенная в [2] мера dj , вообще говоря, не является метрикой (не выполнено неравенство треугольника).

6. Окрестностные фактор-структуры.

Используя определенную выше метрику rij (или fj ), можно разбить узлы окрестностной структуры на кластеры с помощью какого-либо алгоритма кластеризации. В любом случае, далее нужно пересчитать матрицу смежности окрестностной структуры и матрицу данных. В качестве вектора данных (по управлению или состоянию) кластера можно взять среднее арифметическое векторов данных всех вошедших в кластер узлов. Далее, окрестность кластера I по состояниям (управлениям) будем считать состоящей из всех кластеров J, таких что хотя бы один из узлов кластера J входит в окрестность хотя бы одного из узлов кластера I. Вес соответствующей мягкой связи кластера I с кластером J положим равным среднему арифметическому весов всех мягких связей узлов из кластера I с узлами из кластера J .

Аналогично, вес соответствующей жесткой связи кластера I с кластером J положим равным среднему арифметическому весов всех жестких связей узлов из кластера I с узлами из кластера J . Заданные коэффициенты жестких связей кластеров можно определить как средние арифметические соответствующих заданных коэффициентов жестких связей узлов из I с узлами из J .

СПИСОК ЛИТЕРАТУРЫ

1. Блюмин С.Л., Шмырин A.M. Окрестностные системы. Липецк: ЛЭГИ, 2005.

2. Shmyrin, A.M., Kosareva, A.S. The measure of similarity in solving the problem of clustering neighborhood structures // Modern informatization problems in the technological and telecommunication systems analysis and synthesis: Proceedings of the XXI-th International Open Science Conference (Yelm, WA, USA, Januar 2016), 2016. P. 341-346.

БЛАГОДАРНОСТИ: Работа поддержана грантом РФФИ (код проекта 16-07-00854 а).

Поступила в редакцию 21 марта 2016 г.

Шмырин Анатолий Михайлович, Липецкий государственный технический университет, г. Липецк, Российская Федерация, доктор технических наук, профессор, заведующий кафедрой высшей математики, e-mail: amsh@lipetsk.ru

Мишачёв Николай Михайлович, Липецкий государственный технический университет, г. Липецк, Российская Федерация, кандидат физико-математических наук, доцент кафедры высшей математики, e-mail: nmish@lipetsk.ru

Косарева Анастасия Сергеевна, Липецкий государственный технический университет, г. Липецк, Российская Федерация, аспирант, кафедра высшей математики, e-mail: kosarewanastya@yandex.ru

UDC 512.8

DOI: 10.20310/1810-0198-2016-21-2-457-462

CLUSTERING OF NEIGHBORHOOD STRUCTURE

© A. M. Shmyrin, N. M. Mishachev, A. C. Kosareva

We define a metric on the set of nodes of neighborhood structure and consider the clustering problem for the structure with respect to the metric, or, what is the same, the problem of constructing the factor-structure. Determined metric takes into account both the connections between the nodes of the structure and the experimental data at the nodes. Key words: neighborhood structures; metrics; clustering; factor-structure.

ACKNOWLEDGEMENTS: The work is supported by the Russian Fund for Basic Research (project № 16-07-00854 a)

REFERENCES

1. Blyumin S.L., Shmyrin A.M. Neighborhood system. Lipetsk: LEGI, 2005.

2. Shmyrin, A.M., Kosareva, A.S. The measure of similarity in solving the problem of clustering neighborhood structures // Modern informatization problems in the technological and telecommunication systems analysis and synthesis: Proceedings of the XXI-th International Open Science Conference (Yelm, WA, USA, Januar 2016), 2016. P. 341-346.

Received 21 March 2016.

Shmyrin Anatoliy Mikhailovich, Lipetsk State Technical University, Lipetsk, the Russian Federation, Doctor of Techniques, Professor, the Head of the Higher Mathematics Department, e-mail: amsh@lipetsk.ru

Mishachev Nikolay Mikhailovich, Lipetsk State Technical University, Lipetsk, the Russian Federation, Candidate of Physics and Mathematics, Associate Professor of the Higher Mathematics Department, e-mail: nmish@lipetsk.ru

Kosareva Anastasia Sergeevna, Lipetsk State Technical University, Lipetsk, the Russian Federation, graduate student of the Higher Mathematics Department, e-mail: kosarewanastya@yandex.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.