Научная статья на тему 'Нечеткое разбиение объектов на основе критериев плотности'

Нечеткое разбиение объектов на основе критериев плотности Текст научной статьи по специальности «Математика»

CC BY
394
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
кластеризация / расстояние Хемминга / горная кластеризация / нечеткая логика / Clustering / Hamming distance / mountain clustering / fuzzy logic / кластеризація / відстань Хеммінга / гірська кластеризація / нечітка логіка

Аннотация научной статьи по математике, автор научной работы — Кучеренко Е. И., Глушенкова И. С., Глушенков С. А.

Решена задача разбиения по критериям плотности в нечетком пространстве состояний при пересечении признаков. Объектом исследования являлись процессы разбиения заданной выборки объектов на подмножества. Предмет исследования составляют методы и алгоритмы нечеткого разбиения объектов на основе критериев плотности в сложных системах. Цель работы: развитие метода горной кластеризации Ягера-Филева на основе нечетких представлений для повышения эффективности решений. Предложен нечеткий метод разбиения, основанный на вычислении плотности распределения интегральных признаков объектов в нечетком пространстве состояний, который, в отличие от существующих, дополнительно функционирует в нечетком пространстве состояний и признаков. Описаны и обоснованы этапы метода нечеткого разбиения признаков с использованием нечеткого расстояния Хемминга. Была создана программа моделирования плотности распределения признаков на основе разработанного метода. Выполнен эксперимент по определению принадлежности объекта при пересечении областей нечеткого распределения признаков и предоставление результатов в виде логического вывода и графического материала. Результаты эксперимента позволяют рекомендовать предложенный метод для использования на практике. Перспективой дальнейших исследований является исследование и алгоритмизация метода, его адаптация в пространстве признаков предметных областей.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Кучеренко Е. И., Глушенкова И. С., Глушенков С. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FUZZY PARTITIONING OF THE OBJECTS BASED ON THE CRITERIA OF DENSITY

The problem of the partition of the criteria in the fuzzy space density of states at the intersection of features. The object of research is the process of partitioning a given sample of objects into subsets. Subject of research methods and algorithms make fuzzy partition of objects based on the criteria density in complex systems. Objective: to develop a method of clustering mining Jager-Fileva based on fuzzy concepts to improve the effectiveness of the decisions. It was proposed fuzzy partitioning method based on the calculation of the density distribution of the integral attributes of the objects in a fuzzy space of conditions. The method, in contrast to existing, additionally operates in a fuzzy state space and features. Describe and justify the steps of the method of fuzzy partitioning features using fuzzy Hamming distance. It was created simulation program distribution density of features on the basis of this method. An experiments conducted to determine the affiliation of the object at the intersection of fuzzy areas of distribution and the provision of evidence of results in the form of inference and graphic material. The experimental results allow us to recommend the proposed method to be used in practice. Prospects for further research is to study and algorithmization method, its adaptation to the feature space domains.

Текст научной работы на тему «Нечеткое разбиение объектов на основе критериев плотности»

НЕЙРО1НФОРМАТИКА ТА ШТЕЛЕКТУАЛЬШ СИСТЕМИ

НЕЙРОИНФОРМАТИКА И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

NEUROINFORMATICS AND INTELLIGENT SYSTEMS

УДК 519.71

Кучеренко Е. И.1, Глушенкова И. С.2, Глушенков С. А.3

1Д-р техн. наук, профессор, профессор кафедры искусственного интеллекта Харьковского национального университета

радиоэлектроники, Харьков, Украина

2Канд. техн. наук, доцент кафедры геоинформационных систем, оценки земли и недвижимого имущества Харьковского

национального университета городского хозяйства имени А.Н. Бекетова, Харьков, Украина 3Аспирант кафедры геоинформационных систем, оценки земли и недвижимого имущества Харьковского национального

университета городского хозяйства имени А.Н. Бекетова, Харьков, Украина

НЕЧЕТКОЕ РАЗБИЕНИЕ ОБЪЕКТОВ НА ОСНОВЕ КРИТЕРИЕВ _ПЛОТНОСТИ_

Решена задача разбиения по критериям плотности в нечетком пространстве состояний при пересечении признаков. Объектом исследования являлись процессы разбиения заданной выборки объектов на подмножества. Предмет исследования составляют методы и алгоритмы нечеткого разбиения объектов на основе критериев плотности в сложных системах. Цель работы: развитие метода горной кластеризации Ягера-Филева на основе нечетких представлений для повышения эффективности решений. Предложен нечеткий метод разбиения, основанный на вычислении плотности распределения интегральных признаков объектов в нечетком пространстве состояний, который, в отличие от существующих, дополнительно функционирует в нечетком пространстве состояний и признаков. Описаны и обоснованы этапы метода нечеткого разбиения признаков с использованием нечеткого расстояния Хемминга. Была создана программа моделирования плотности распределения признаков на основе разработанного метода. Выполнен эксперимент по определению принадлежности объекта при пересечении областей нечеткого распределения признаков и предоставление результатов в виде логического вывода и графического материала. Результаты эксперимента позволяют рекомендовать предложенный метод для использования на практике. Перспективой дальнейших исследований является исследование и алгоритмизация метода, его адаптация в пространстве признаков предметных областей.

Ключевые слова: кластеризация, расстояние Хемминга, горная кластеризация, нечеткая логика.

НОМЕНКЛАТУРА

ГИС - геоинформационные системы; Cj - размер множества разбиения; D - детерминированное состояние; {djj } - множество расстояний; E - ребро графа; F - нечеткое состояние; О' - граф;

Int - интегральное распределение признаков; {Kj} - множество разбиений; m - количество уровней иерархии; {Ojj } - множество объектов;

{O а, Oß} - объекты локализованного пространства; P(x, y) - вероятностное распределение плотностей; {Pija} - параметры множества;

© Кучеренко Е. И., Глушенкова И. С., Глушенков С. А., 2016 DOI 10.15588/1607-3274-2016-1-4

Ri - радиус множества разбиения;

Sije - площадь распределения плотности;

U - матрица распределения плотностей признаков по объектам;

Zi - центры множества разбиения;

{ajj} - пространственные координаты;

A|a(Sjp) - величина дискретизации;

(8(0 a X 8(°р )) - относительное расстояние Хемминга;

8j - расстояние Хемминга;

П(0) - квадратичный индекс нечеткости;

|oa, М-оР - множество значений функции принадлежности;

МА - функция принадлежности;

M(SjP) - функция принадлежности плотности распределения;

p-ISSN 1607-3274. Радюелектронжа, шформатика, управлiння. 2016. № 1 e-ISSN 2313-688X. Radio Electronics, Computer Science, Control. 2016. № 1

pa - плотность распределения признаков;

{PjP} - множество распределения плотности признаков. ВВЕДЕНИЕ

Важным аспектом классификации объектов является представление, структурирование и анализ огромных массивов информации, которые составляют основу функционирования и развития сложных систем. При анализе многомерных распределенных объектов требуются универсальные и надежные подходы, направленные на минимизацию критериев на множестве ограничений предметной области. Особенно это актуально при реализации геоинформационных систем (ТИС) и технологий.

Проблема принятия решений в таких системах является не тривиальной задачей [1] и характеризуется неопределенностью, которая может быть снижена за счет применения нечетких (fuzzy) знание-ориентированных технологий. Существующие решения [2] на основе построения кластеров являются актуальными в ТИС и технологиях. Однако наличие свойств пересечения кластеров часто приводит к трудностям классификации объектов производственных систем, что приводит к технологиям нечеткого разбиения пространства по заданным критериям.

Целью настоящих исследований является разработка и совершенствование подходов к оптимизации и классификации таких объектов на основе развития методов и алгоритмов нечеткой кластеризации и разбиения, а также систем на их основе.

1 ПОСТАНОВКА ЗАДАЧИ

Кластерный анализ - это задача разбиения заданной выборки объектов на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались [1]. Кластерный анализ представляет собой многомерную статистическую процедуру, выполняющую сбор данных, содержащих информацию о выборке объектов, и упорядочивающую объекты в сравнительно однородные группы нечетких разбиений. Множество разбиений {Кг-}, i е I характеризуется:

- центрами Zi, i е I;

- размером Q - {Кг-}, i е 11Q Ф 0 ;

- радиусами Ri - {Кг-}, i е 11 Ri Ф 0;

- множеством объектов {О }, j е J;

- множеством расстояний между кластерами {йу }, причем:

й (А, А) = 0; й (А, В) = й (В, А); й(А,С) < й(А,В) о й(В,С); й(А,В) > 0.

Множество объектов {Оу }, у е J характеризуется множествами признаков распределения плотностей {р гур}, Р е В, пространственных координат {ау } и параметров { руа }, аеА, причем Оу е{Оу }, У е J | {а у } * 0, {р у } *0.

Необходимо предложить методы и алгоритмы нечеткого разбиения объектов на основе критериев плотности в сложных системах и технологиях пространственно распределенных объектов предметных областей. 2 ОБЗОР ЛИТЕРАТУРЫ

Применение кластерного анализа в общем виде сводится к следующим этапам [3]:

- выборка объектов для кластеризации;

- определение множества переменных, по которым будут оцениваться объекты в выборке с нормализацией значений переменных;

- вычисление значений меры сходства между объектами;

- применение метода кластерного анализа для создания групп сходных объектов (кластеров);

- представление и интерпретация результатов анализа.

Для каждой пары объектов измеряется «расстояние»

между ними - степень схожести. Существует множество метрик [3]: эвклидово расстояние; квадрат эвклидова расстояния; манхэттенское расстояние или расстояние Хем-минга; расстояние Чебышева; степенное расстояние, которое является модификацией расстояния Эвклида.

Существуют следующие методы и алгоритмы кластеризации [3] (табл. 1):

- алгоритмы иерархической кластеризации;

- алгоритмы квадратичной ошибки;

- нечеткие алгоритмы;

- алгоритмы, основанные на теории графов;

Таблица 1 - Методы и алгоритмы кластеризации

Методы и алгоритмы кластеризации Положительные качества Отрицательные качества

алгоритмы иерархической кластеризации представление результата в виде дендрограммы необходима система полных разбиений

алгоритмы квадратичной ошибки минимизация среднеквадратической ошибки разбиения требуется задание количества кластеров

нечеткие алгоритмы мягкое разбиение на кластеры необходимо заранее знать количество кластеров

алгоритмы, основанные на теории графов наглядность и возможность внесения различных модификаций сложность подбора значащих коэффициентов

алгоритм выделения связных компонент наглядность и возможность внесения различных модификаций трудности управления количеством кластеров при помощи порога расстояния

алгоритм минимального покрывающего дерева наглядность и возможность внесения различных модификаций трудности управления количеством кластеров при помощи порога расстояния

послойная кластеризация наглядность и возможность внесения различных модификаций трудности управления количеством кластеров при помощи порога расстояния

- алгоритм выделения связных компонент;

- алгоритм минимального покрывающего дерева;

- послойная кластеризация.

Наличие множества методов и алгоритмов кластеризации не охватывает всей совокупности подходов и особенностей распределения признаков объектов, что свойственно распределению различной природы и требует дальнейших исследований.

3 МАТЕРИАЛЫ И МЕТОДЫ

Предлагаемые решения являются дальнейшим развитием метода горной кластеризации Ягера-Филева [4] на основе нечетких представлений.

Утверждение 1. Если задано множество площадей распределения плотностей признаков {Pjp}, Р£В, пространственных координат {aij} и параметров {Pija.},а 6 А, а также задана плотность распределения признаков {Р/р }, Р 6 В в виде pa, а 6 А, для которых характерно Sj, i 6 I, j 6 J, тогда критерием поиска плотности распределения признаков может быть

Z pi/P Sj

Í6I, j6J ,„ . *

Ра =--^(SV P ^ Рj >Р , (1)

Z Sj

i6l, J6J

где p - порог плотности, - функция принадлеж-

ности плотности распределения (Pij) по некоторой площади из Sij-p.

Особенностью метода является то, что он не требует задания количества кластеров и при числе признаков (n = 2) поверхность распределения близка к горному рельефу. Кластеризация по горному методу не является нечеткой, однако, ее часто используют при синтезе нечетких правил на знаниях [4]. Особенностью горной кластеризации является следующее:

- на первом шаге горной кластеризации определяют точки, которые могут быть центрами кластеров;

- на втором шаге для каждой такой точки рассчитывается значение потенциала, показывающего возможность формирования кластера в ее окрестности. Плотность расположения объектов в окрестности потенциального центра кластера является функцией от значения его потенциала;

- на третьем шаге итерационно выбираются центры кластеров среди точек с максимальными потенциалами. Формируются также объекты кластеризации.

Важной особенностью, накладывающей ограничения на применение метода, является отсутствие возможности решений в нечетком пространстве состояний. Анализ возможных решений по совершенствованию вышеизложенного метода [4] позволил сформулировать следующее предположение: на первом этапе построение решетчатого гиперкуба следует дополнить функцией принадлежности распределения

Тогда этапы нового метода нечеткого разбиения признаков могут быть такие.

Этап 1. Формируем интегральное распределение признаков

Z pjp

Int =

i6l, j6j ,р6В

jP

Z Sjp

i6l, j6j ,р6В

(2)

исключаем из рассмотрения р/р, для которых 111 л | J | л | В |= 0, и уточняем интегральные признаки (2)

Z pjp S,

Int =

i6l, j6J ,р6В

'jP

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Z sí/p

i6I, j6J ,р6В

(3)

Этап 2. Формируем область Б-р , для которой значение квадратичного индекса нечеткости [5] принимает вид

2

П(О) = ^= e(O, O) —^ min. 4n

(4)

Искомое значение (4) определяем в качестве первого с максимальной плотностью признаков потенциального

центра разбиения {К^}, I = 1| Сг- * 0 .

Этап 3. Формируем потенциальные центры разбиения. Для этого диапазоны изменения входных признаков разбиваем на п интервалов согласно (1), причем принимаем

2

Н(Б/р ) = Н(Бг+1,/+1,р.Х Н(Б/р) = ехр(-к(X - и) X к > 0, (5)

где к - крутизна функции, и - центр гауссиана.

Параметры функции (5) являются элементами настройки.

Этап 4. Задав в (5) ц(Б/р ) = |н(>%р ) о и величину дискретизации Дц(Б/р), находим итерационно, согласно (1),

значения х = ,..., Хп, таким образом, что

*

Р/ = Ро >Р . (6)

Это определяет число и размер потенциальных пространств разбиения ДБа-.

Этап 5. Уточняем из особенностей поверхности {Б/р}

проекции значений {х0^^хп}, | х0^^хп}|= N, что и определяет размер разбиения

Ci xi+1-xi

и радиус

R =

xi+1 xi 2

(7)

(8)

объектов.

Этап 6. Радиусы объектов уточняются на основе квадратичной нормы с учетом (6) и повторной реализацией этапов 1-5. Отметим, что Я * Яг+1, с1 * С+1.

Этап 7. Осуществляем упорядочение признаков и формирование матрицы распределения плотностей признаков по объектам

и = {К }, I £ I | ( С * 0, О у , I £ I, / £ J), / о- £ {О-}, / £ J | {а-} * 0,{р-} * 0. (9)

р-К8К 1607-3274. Радюелектронжа, шформатика, управлшия. 2016. № 1 е-ЕЗБЫ 2313-688Х. Каёю Е1еойоп^, Сошриег Баепое, Сопйо1. 2016. № 1

Этап 8. Останов.

Для реализации этапов 1-7 в знание-ориентированных технологиях целесообразно применить стратегию согласно [6], как решение

{//хц(х) Меп у ц(у )},

согласно

(10)

(11)

у = Vх лц(х, у) с последующей (11) дефаззификацией [6].

Пусть существуют объекты {Оа, О р } с {Оу Ь ] е J множества значений функций принадлежности, для которых

Цо„ пЦоР Ф0.

(12)

Существует некоторое пространство 5(х, у), которое принадлежит (12). Необходимо определить принадлежность пространства 5 (х, у) одному из объектов из {Оа, Ор} если р5(х,у) >р

Утверждение 2. Если справедливо (12) и необходимо определить принадлежность пространства 5(х, у) одному из объектов из {°а, Ор}, при р 5(х ) > р *, то пространство 5(х, у) принадлежит одному из объектов Ок е{Оа, Ор}, согласно

(8(Оа), 8(Ор ))-

^х,у), Р 5(х,у) >Р'

-»шт.

(13)

Доказательство утверждения 2 очевидно, если принять в качестве критерия меру (13). В качестве критерия локализации пространства 5(х,у) на объектах {Оа,Ор} введем меру на основе нечеткого расстояния Хемминга [7]

5(О^, 5 (х, у)) =

й (Ок, 5 (х, у))

(14)

которая справедлива при условии, что плоскость дискретизации функций принадлежности объектов в (14) определена в виде

ПОа = "Ор = "

(15)

Тогда, используя (14), (15), мы можем выявить свойство принадлежности (13) пространства 5(х, у) к объектам из {Оа Ор}.

Следствие утверждения 2. Если существует мера расстояния в виде расстояния Хемминга [14] причем

{ц А} п {ц д.+1} ф0

(16)

то следует рассматривать ряд случаев распределения плотностей.

Случай А. Пусть существует вероятностное распределение плотностей вещества на плоской поверхности

Р( х, у) = е~к (х-а)2

(17)

где а - центр гауссиана.

Определим пространство распределения плотностей на основе (17), где предложено формирование первого разбиения 5ур с центром разбиения

К, е{К,},/ = 1|Сг Ф0.

(18)

Тогда справедливо утверждение. Утверждение 3. Если задана карта распределения с центрами а1, а2, находящимися в изолированном пространстве, и подвергающимися динамическим внешним факторам, то правило матричного отображения пространства имеет вид (19).

Приняв в (16) а^ = а2, уточнив (17), выполним анализ

расположения точки а(х, у) е 5 (х, у) согласно критерия

а, п Р(х, у) Ф 0,

(19)

При нарушении (19), имеем возможное несоответствие согласно утверждения 3, что требует дальнейших исследований.

Рассмотрим случай, когда справедливо (18), (19). Случай В. Приняв терм лингвистической переменной в виде цА Ф 0, цФ 0, функции принадлежности

определены в виде гауссианов:

ц = е-к1(х-а1) , к1 > 0,

' 1

ц

А2

= е-к2(х—а2)2 , к2 > 0

(20)

(21)

Сформулируем утверждение 4.

Утверждение 4. Если существует (14), для которого справедливо (16), то нахождение минимального значения из

а = шш(5(ц д), 8(ц а+1 )),

/е I

(22)

определяет принадлежность области 5 (х, у) соответствующему нечеткому разбиению при выполнении (16).

Справедливость утверждения 4 непосредственно следует из меры расстояния (14) и сущности операции пересечения функций принадлежности (16).

Используя положения (14), рассмотрим пересечение областей (20), (21), причем к^ > 0, к2 > 0, к^ < к2, а^ > а2, для которых справедливо (16).

Вычислениями определено, что 8а1 < 8а2, тогда область 5 (х, у) принадлежит, согласно (22), разбиению (20).

Действительно, пространство 5 (х, у) попадает под влияние области с меньшим расстоянием Хемминга, что подтверждает справедливость (22) на функциях (20), (21).

Следствие 1 утверждения 4. В случае, если расстояния равны 8 (14)

{ц А} = {ц А,+1}

<е,

(23)

где е - норма точности, то пространство 5 (х, у) не принадлежит ни к одному из источников.

Следствие 2 утверждения 4. Положения утверждения 4 справедливы при выполнении условия (6).

п

Тогда, учитывая положения утверждений 2-4, дополнительно к этапам 1-8, сформулируем дополнения:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5' Если справедливо (12), то осуществляем уточнение нахождения дополнительных кластеров согласно (13)-(22);

5'' Осуществляем контроль разбиения согласно этапов 1-7.

4 ЭКСПЕРИМЕНТЫ

Для эксперимента была создана программа моделирования плотности распределения признаков на основе разработанного метода при условии {ц } п {ц a ■ } Ф0.

UML - диаграмма классов представлена на рис. 1.

Программа PL.v.0.1, которая реализована в среде Python [8].

5 РЕЗУЛЬТАТЫ

В качестве исходных данных используются параметры, определяющие вид функции и местоположение в пространстве (рис. 2):

- координаты проекций источников признаков влияния и искомой точки на ось OX;

- значения крутизны функций принадлежности распределения плотности признаков от соответствующих источников;

- значение ограничителя в расчетах (ПДК).

ПДК - минимальное значение плотности признаков для изменения состояния искомой точки. ПДК выполняет роль логического оператора, который определяет дальнейший сценарий работы программы. Возможны 3 сценария работы программы. Сценарий 1: ПДК больше значений множеств в искомой точке, тогда точка не изменяет свое состояние и не принадлежит не к одной точке. Сценарий 2: ПДК меньше одного из значения множеств. Сценарий 3: ПДК меньше значений двух функций принадлежности в искомой точке, тогда для определения множества, к которому принадлежит точка, выполняется расчет расстояния Хемминга.

Во время работы программы выполняется расчет принадлежности точки к зонам влияния исходных мно-

жеств. В случае влияния обоих множеств на искомую точку выполняется расчет расстояния Хемминга и формирования результата путем логического вывода. Помимо выдачи текстового результата работы, программа выводит изображение с наглядным отображением всех объектов.

Таким образом, в результате эксперимента подтверждена справедливость утверждения 4 (рис. 2). 6 ОБСУЖДЕНИЕ

В работе рассмотрены методы нечеткого разбиения признаков по критерию плотности. Сформулирован метод, который является развитием метода горной кластеризации Ягера-Филева, что позволяет развивать метод на случай нечеткого пространства состояний. Дана оценка эффективности методов, основанных на вероятностном и нечетком распределении плотности признаков. Определена перспективность нечеткого разбиения по отношению к вероятностному распределению.

Действительно, используя положения (14) рассмотрено пересечение областей нечеткого распределения признаков. Вычислениями определено, что в случае, когда 8а1 < 8а область 5 (х, у) принадлежит, согласно (22), разбиению (20).

Определено, что справедливо следствие утверждения 4 в случае, если расстояния равны (23).

Экспериментом подтверждена вычислительная сложность в виде полинома второго порядка

О(п) = А0 + Ьх + сх2, (24)

для (24) справедливо

А0 ф 0, Ь Ф 0, с Ф 0.

Развитием метода является адаптация подходов к предметным областям путем дополнительного введения влияния различных внешних факторов на процесс нечеткого распределения пространства признаков.

KLO - int вв./вв. -» KL1 - вычисления на основе нечеткой логики и алгебры предикатов

- KL0.1 Int вв. - KL0.2 irit выв. - KL0.3 достовер. - KL1.1 нахождение нечеткого расстояния - KL1.2 нахождение функции min покрытия - KL1.3 вычисление min функций

7

К1.3- формирование отчетов KL2 - формирование пространства нечетких разбиений

- К13.1 построение логических отчетов - К13,2 отображение логических отчетов d——

- KL2.1 формирование подмножеств классов

Рисунок 1 - UML диаграмма классов приложений

р-К8К 1607-3274. Радюелектронжа, iнформатика, управлiння. 2016. № 1 е-ЕЗБЫ 2313-688Х. Каёю Е1еойоп^, Сошриег Баепое, Сопйо1. 2016. № 1

Рисунок 2 - Моделирование разбиений с различными сценариями

ВЫВОДЫ

Разработка знание-ориентированных интеллектуальных методов и моделей анализа сложных объектов является важной составляющей технологических пространственно распределенных процессов, функционирующих в условиях неопределенности. Знание-ориентированные методы направлены на моделирование и обработку детерминированных, вероятностных и нечетких знаний, как фактора повышения качества разбиений. Полученные результаты научных исследований позволили более полно, с высокой адекватностью реализовать разбиения по критериям плотности в нечетком пространстве состояний. Подход позволяет принципиально выделить нечеткую область при пересечении признаков. Таким образом, в работе предложено и исследовано:

1. Выполнен содержательный анализ методов и алгоритмов кластеризации объектов на множестве признаков . Определено, что наличие множества методов и алгоритмов кластеризации не охватывает всей совокупности подходов и особенностей распределения признаков плотности объектов, что свойственно распределению различной природы. В связи с этим важно рассмотрение подходов к нечеткому разбиению объектов на основе плотности их распределения в нечетком пространстве состояний.

2. Получил дальнейшее развитие новый нечеткий метод разбиения, основанный на вычислении плотности распределения интегральных признаков объектов в нечетком пространстве состояний, который, в отличие от существующих, дополнительно функционирует в нечетком пространстве состояний и признаков путем построения решетчатого гиперкуба с нечеткой функцией принадлежности, что позволяет рациональное разбиение признаков на множестве объектов.

3. Перспективой дальнейших исследований является исследование и алгоритмизация метода в задачах проек-

тирования и эксплуатации систем, его адаптация в пространстве признаков предметных областей. БЛАГОДАРНОСТИ

Работа выполнена в рамках исследований госбюджетной НИР «Нейро-фаззи системы для текущей кластеризации и классификации последовательностей данных в условиях их искривления отсутствующими и аномальными наблюдениями» (№ гос. регистрации 0113U000361). Авторами разработаны новые методы и модели, основанные на нечетком разбиении объектов на основе критериев плотности. Определены границы адекватности метода в программной среде ГИС и его вычислительная сложность, которая близка к квадратичной.

В рамках выполняемой НИР решены также задачи практической реализации и внедрения на реальных объектах.

СПИСОК ЛИТЕРАТУРЫ

1. Gan G. Data Clustering: theory, algorithms, and applications / G. Gan, C. Ma, J. Wu. - SIAM, Philadelphia, ASA, Alexandria, VA, 2007. - 466 p.

2. Cluster Analysis / [B. Everitt, S. Landau, M. Leese, D. Stahl]. -John Wiley &Sons Ltd, 2011. - 330 p.

3. Xu R. Clustering / R. Xu, D. C. Wunsch. John Wiley &Sons, Inc, 2009. - 358 p.

4. Yager R. Essentials of Fuzzy Modeling and Control / R. Yager, D. Filev. - USA : John Willey & Sons,1984. -387 p.

5. Борисов В. В. Нечеткие модели и сети / В. В. Борисов, В. В. Круглов, А. С. Федулов. - M. : Горячая линия, 2012. - 284 с.

6. Tsoukalas L. H. Fuzzy and Neural Approaches in Engineering / L. H. Tsoukalas, R. E. Uhrig. - New York : John Wiley&Sons.Inc, 1997. - 587 p.

7. Блейхут Р. Теория и практика кодов, контролирующих ошибки / Р. Блейхут. - М. : Мир, 1986. - 576 с.

8. Severance C. Python for Informatics [Electronic resource]. -Regime of access : http://do1.dr-chuck.com/py4inf/EN-us/ book.pdf.

Статья поступила в редакцию 16.10.2015.

После доработки 28.10.2015.

Кучеренко С. I.1, Глушенкова I. С.2, Глушенков С. А.3

'Д-р техн. наук, професор, професор кафедри штучного штелекту Харгавського нацюнального ушверситету радюелектрошки, Харгав, Украша

2Канд. техн. наук, доцент кафедри геошформацшних систем, оцшки землi та нерухомого майна Харгавського нацюнального ушверситету мюького господарства iменi О.М. Бекетова, Харгав, Украша

3Аспирант кафедри геошформацшних систем, оцшки землi та нерухомого майна Харгавського нацюнального ушверситету мюького господарства iменi О.М. Бекетова, Харгав, Украша

НЕЧ1ТКЕ РОЗБИТТЯ ОБ'еКТ1В НА ОСНОВ1 КРИТЕРПВ Щ1ЛЬНОСТ1

Розв'язано задачу розбиття за крш^ями щшьност в нечеткому простер сташв при перетиш ознак. Об'ектом дослщження були процеси розбиття задано! вибiрки об'ек™ на пщмножини. Предмет дослщження становлять методи й алгоритми нечеткого розбиття об'ек™ на основi критерпв щшьност в складних системах. Мета роботи: розвиток методу прсько! кластеризацп Ягера-Фшев на основi нечетких уявлень для шдвищення ефективност ршень. Запропоновано нечеткий метод розбиття, заснований на обчисленш щшьност розпод^ штегральних ознак об'ек™ в нечеткому простер сташв, який, на вщмшу вщ юнуючих, додатково функцюнуе в нечеткому простер сташв i ознак. Описано й обгрунтовано етапи методу нечеткого розбиття ознак iз застосуванням нечгтко! вщсташ Хеммшга. Було створено програму моделювання щшьност розподiлу ознак на основi розробленого методу. Виконано експеримент щодо визна-чення належност об'екта при перетинi областей нечеткого розподiлу ознак та надання результапв у виглядi логiчного виведення i графiчного матерiалу. Результати експерименту дозволяють рекомендувати запропонований метод для використання на практицг Перспективою подальших дослщжень е дослiдження та алгоритмiзацiя методу, його адаптащя в просторi ознак предметних областей.

Ключовi слова: кластеризащя, вiдстань Хеммiнга, гiрська кластеризацiя, нечгтка логiка.

p-ISSN 1607-3274. PagioeneKTpomKa, rn^opMaTHKa, ynpaBmHHA. 2016. № 1 e-ISSN 2313-688X. Radio Electronics, Computer Science, Control. 2016. № 1

Kucherenko Ye. I.1, Glushenkova I. S.2, Glushenkov S. A.3

'Dr.Sc., Professor, Department of Artificial Intelligence, Kharkiv National University of Radio Electronics, Kharkiv, Ukraine 2PhD, Associate Professor, Department of Geoinformation Systems, Land Valuation and Real Property, O. M. Beketov National University of Urban Ekonomy in Kharkiv, Kharkov, Ukraine

3Postgraduate student, Department of Geoinformation Systems, Land Valuation and Real Property, O. M. Beketov National University of Urban Ekonomy in Kharkiv, Kharkiv, Ukraine

FUZZY PARTITIONING OF THE OBJECTS BASED ON THE CRITERIA OF DENSITY

The problem of the partition of the criteria in the fuzzy space density of states at the intersection of features. The object of research is the process of partitioning a given sample of objects into subsets. Subject of research methods and algorithms make fuzzy partition of objects based on the criteria density in complex systems. Objective: to develop a method of clustering mining Jager-Fileva based on fuzzy concepts to improve the effectiveness of the decisions. It was proposed fuzzy partitioning method based on the calculation of the density distribution of the integral attributes of the objects in a fuzzy space of conditions. The method, in contrast to existing, additionally operates in a fuzzy state space and features. Describe and justify the steps of the method of fuzzy partitioning features using fuzzy Hamming distance. It was created simulation program distribution density of features on the basis of this method. An experiments conducted to determine the affiliation of the object at the intersection of fuzzy areas of distribution and the provision of evidence of results in the form of inference and graphic material. The experimental results allow us to recommend the proposed method to be used in practice. Prospects for further research is to study and algorithmization method, its adaptation to the feature space domains.

Keywords: Clustering, Hamming distance, mountain clustering, fuzzy logic.

REFERENCES

1 Gan G., Ma C., Wu J. Data Clustering: theory, algorithms, and applications^ SIAM, Philadelphia, ASA, Alexandria, VA, 2007, 466 p.

2. Everitt B., Landau S., Leese M., Stahl D. Cluster Analysis. John Wiley &Sons Ltd, 2011, 330 p.

3. Xu R., Wunsch D. C. Clustering. John Wiley &Sons, Inc, 2009, 358 p.

4. Yager R., Filev D. Essentials of Fuzzy Modeling and Control. USA, John Willey & Sons, 1984, 387 p.

5. Borisov V. V., Kruglov V. V., Fedulov A. S. Nechetkie modeli i seti. Moscow, Gorjachaja linija, 2012, 284 p.

6. Tsoukalas L. H., Uhrig R. E. Fuzzy and Neural Approaches in Engineering. New York, John Wiley&Sons.Inc, 1997, 587 p.

7. Blejhut R. Teorija i praktika kodov, kontrolirujushhih oshibki. Moscow, Mir, 1986, 576 p.

8. Severance C. Python for Informatics [Electronic resource]. Regime of access : http://do1.dr-chuck.com/py4inf/EN-us/ book.pdf.

i Надоели баннеры? Вы всегда можете отключить рекламу.