Научная статья на тему 'АДАПТАЦіЯ МЕТОДУ НЕЧіТКИХ С-СЕРЕДНіХ ДО ЗАДАЧі ВИЗНАЧЕННЯ СТРУКТУРИ СОЦіАЛЬНИХ ГРУП'

АДАПТАЦіЯ МЕТОДУ НЕЧіТКИХ С-СЕРЕДНіХ ДО ЗАДАЧі ВИЗНАЧЕННЯ СТРУКТУРИ СОЦіАЛЬНИХ ГРУП Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
108
39
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТРУКТУРА СОЦіАЛЬНОї ГРУПИ / НЕЧіТКА КЛАСТЕРИЗАЦіЯ / ЛіНГВіСТИЧНА ЗМіННА / МЕТОД НЕЧіТКИХ С-СЕРЕДНіХ / СТРУКТУРА СОЦИАЛЬНОЙ ГРУППЫ / НЕЧЕТКАЯ КЛАСТЕРИЗАЦИЯ / ЛИНГВИСТИЧЕСКАЯ ПЕРЕМЕННАЯ / МЕТОД НЕЧЕТКИХ С-СРЕДНИХ / SOCIAL GROUP STRUCTURE / FUZZY CLUSTERING / LINGUISTIC VARIABLE / FUZZY C-MEANS METHOD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Мулеса О. Ю.

Рассматривается задача определения структуры социальных групп как задача нечеткой кластеризации объектов. Предлагается адаптация метода нечетких с-средних для решения сформулированной задачи, которая заключается в определении новых способов вычисления расстояния между объектами и определения центров кластеров. Эффективность метода достигается путем представления признаков объектов через соответствующие лингвистические переменные.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Adaptation of fuzzy c-means method for determination the structure of social groups

The problem of determining the structure of social groups occurs in various scientific researches related to the necessity classification of persons on certain grounds or building a sociodemographic portrait of people of some social group. Such problems are usually solved by conducting sociological research and further statistical analysis of the results. This approach is effective, but often results in the need to attract substantial financial and human resources. So, it is important to develop the models and methods for solving this class of problems based on readily available data. Verbal and mathematical formulation of the problem of determining the structure of a social problem of fuzzy clustering are made in the article. However, the article noted that the feature of input data is their numerical nature, making it difficult to use the classical methods of clustering objects. Also, performing clustering, in this case it is necessary to take into account the aim of problem the nature of clusters. To solve the problem it is proposed an adapted fuzzy-c-means method, in which on the basis of expert interviews are taken into account not only the value attributes, which are characterized by objects, but also the importance of these attributes when making reference of the object to a particular cluster. Objects, in turn, are represented by means of linguistic variables on the set of which are defined the relevant metrics. The proposed method can be effectively used for tasks related to the determination of society structure.

Текст научной работы на тему «АДАПТАЦіЯ МЕТОДУ НЕЧіТКИХ С-СЕРЕДНіХ ДО ЗАДАЧі ВИЗНАЧЕННЯ СТРУКТУРИ СОЦіАЛЬНИХ ГРУП»

УДК 004.02:004.09 Б01: 10.15587/2312-8372.2015.41014

мулеса о. ю. АДАПТАЦ1Я МЕТОДУ НЕЧ1ТКИХ

С-СЕРЕДН1Х ДО ЗАДАЧ1 ВИЗНАЧЕННЯ СТРУКТУРИ СОЦ1АЛЬНИХ ГРУП

Розглядаеться задача визначення структури сощальних груп як задача нечтког кластеризацп об'ектгв. Пропонуеться адаптащя методу нечтких с-середн1х для розв'язання сформульованог задачг, яка полягае у визначеннг нових способ1в обчислення вгдстанг мгж об'ектами та вста-новлення центргв кластергв. Ефективтсть методу досягаеться шляхом представлення ознак об'ектгв через в1дпов1дн1 лтгвктичнг зм1нн1.

Клпчов1 слова: структура сощальног групи, нечтка кластеризацгя, лтгвгстична змтна, метод нечтких с-середн1х.

1. Вступ

Сощальна структура сустльства, як сукуптсть взаемо-пов'язаних та взаемодшчих мiж собою сощальних груп е об'ектом багатьох наукових дослщжень [1, 2]. Вивчення 11 властивостей дозволяе розв'язувати важливi сощальш, полиичш, економiчнi, медичш та iншi задачi [1-3]. Ос-новними елементами соцiальноi структури сустльства е сощальш групи оаб, об'еднаних за деякими спорщне-ними ознаками: етшчними, демографiчними, професш-ними, територiальними тощо. Результати дослiдження структури сощальних груп е основою для здшснення прогнозування виникнення та розвитку рiзних сощальних процеав, планування та виконання профшактичних i запобiжних дш до попередження виникнення нега-тивних явищ у суспiльствi загалом та в колективi зо-крема, прогнозування розвитку ринюв збуту товарiв та отримання характеристики ринку трудових ресурав тощо. Серед параметрiв, що характеризують структуру соцiальноi групи е 11 юльюсний та якiсний склад. Зви-чайно, задачi визначення структури сощально! групи розв'язують шляхом аналiзу результапв соцiологiчних дослiджень, якi, як правило, е високоварпсними, ресурс-номiсткими та розтягнутими в час! Проте, на практищ часто виникають задачi, пов'язаш з визначенням юль-кiсних характеристик таких груп, яю характеризуються закрипстю та невеликою чисельнiстю, наприклад, групи тдвищеного ризику iнфiкування В1Л [3-5]. Виявлен-ня та опитування представниюв цих груп е складною, а подекуди i не вирiшуваною проблемою. Таким чином, актуальним е розробка пiдходiв та методiв визначення структури деяких сощальних груп, яю б базувалися на використанш доступних даних таких як результати експертних опитувань.

Серед задач, яю виникають в ходi дослвдження со-цiальноi структури суспiльства важливою е задача його подшу на сощальш групи, яка математично може бути представлена як задача кластеризацп [6].

2. Анал1з л1тературних даних та постановка проблеми

Задача кластеризацп полягае у визначенш груп об'екпв, що е найбшьш близькими один до одного за

деяким критерiем [7-11]. Бшьшкть методiв кластеризацп базуються на аналiзi матриць коефiцiентiв подiбностi, в якостi яких виступають, як правило вщсташ. Серед методiв кластерного аналiзу варто виокремити наступнi:

— статистичш [12, 13], якi базуються на припущенш, що кластери добре описуються деяким амейством iмовiрнiсних розподШв;

— деревовиднi [14, 15], в результат роботи яких вiдбуваеться побудова дерева кластерiв;

— нейромережнi [9, 16, 17], в основi яких лежить використання карт Кохонена;

— генетичш алгоритми [9, 11], яю використовують принципи природного вiдбору, селекцп та мутацп. Особливе мiсце серед методiв кластеризацп посiдае

метод нечетких с-середнiх [18], який базуеться на апарат теорп нечiтких множин [19]. В основi цього методу лежить положення про те, що кожен об'ект може нале-жати рiзним кластерам з рiзною ступенем належность Характерною особливiстю задач визначення структури сощальних груп е те, що вхщш даш переважно мають нечисловий характер. Цей фактор ускладнюе застосування класичних методiв кластеризацп, робить 1х сильно залежними ввд правил переводу нечислових даних у числовi та використовуваних метрик.

1ншою особливштю класу задач, що розглядаеться е те, що при виконанш розбиття групи населення на окремi сощальш групи необхщно брати до уваги мету розв'язання задачу тобто природу таких груп, а, отже, по^зному враховувати ознаки соцiально-демографiч-ного портрету особи.

Також, важливим е те, що в рядi прикладних задач пов'язаних з дослвдженням сощальних явищ немож-ливо отримати чгтю однозначнi розв'язки. Повсякчас зустрiчаються випадки, коли один i той же об'ект може рiзною мiрою належати до рiзних груп, що необхвдно враховувати при розв'язанш таких задач.

Зазначенi факти обумовлюють необхщшсть розвитку теорп нечеткого кластерного аналiзу на клас задач, пов'язаних з дослщженням структури сустльства.

3. Об'ект, ц1ль та задач1 дослщження

Об'ектом дослгдження е технологи розв'язання задач визначення структури сощальних груп.

TECHNOLOGY AUDiT AND PRODUCTiON RESERVES — № 2/2(22], 2015, © Мулеса О. Ю.

73-J

Метою дослгдження е пiдвищення ефективностi про-цеав прийняття рiшень при розв'язаннi задач, що ви-никають в управлшш, виробництвi, медицинi, шляхом розробки моделей та методiв кластеризацii в умовах невизначеност!

В межах визначеноi мети були поставлеш такi задачi:

— виконати аналiз задачi визначення структури сощальних груп та побудувати и вербальну постановку;

— побудувати математичну модель задачi визначення структури соцiальноi групи як задачi клас-теризацii;

— розробити метод нечико' кластеризацii для задачi визначення структури соцiальноi групи на основi експертних оцiнок та з використанням апарату теорii нечiтких множин.

4. Задача визначення структури

сощально'! групи як задача нечгако'! кластеризацп

Вербальна постановка задачi визначення структури соцiальноi групи може бути виконана таким чином: у заданш соцiальнiй груш здшснити групування ii членiв за певними соцiально-демографiчними ознаками; визначити юльюсний та представницький склад кож-ноi складовоi заданоi групи. Представники групи характеризуются значеннями ознак, що входять в '¿х соцiально-демографiчний портрет. До таких ознак, як правило вщносять стать, вж, освiтнiй рiвень, професiйну дiяльнiсть, сiмейний стан, сощальний рiвень, релiгiйну належнiсть тощо.

Критерп групування осiб залежать вiд задачу яка розв'язуеться. Це може бути групування оаб за '¿х спо-живчими вподобаннями, за купiвельною спроможшстю, за характером суспiльноi поведiнки тощо. Складшсть здiйснення такого групування пов'язана з тим, що через ввдсутшсть чггких описiв груп, на як розбиваеться задана, можливi випадки, в яких для деяких оаб ви-никне ситуацiя одночасноi належност до рiзних груп. З огляду на це представимо поставлену задачу к задачу нечико' кластеризацп, математичну модель яко' побудуемо таким чином:

Нехай дано множину об'екпв х={{= ( хг1, хг2,..., ХгМ),

г = 1, Ы}, якi характеризуються за множиною ознак К =

= {К1,К2,...,Км}, тобто хц — значення ]-о\ ознаки для г-го об'екта. Необхiдно розбити дану множину на G не-чiтких кластерiв за заданим критерiем, тобто побудувати алгоритм 0, виконання якого дозволило б визначати ступеш належносп об'екта до кожного з кластерiв, тобто:

Хг X),Ц2 (X),...,ЦС X)),

де цё (Хг) — стутнь належностi об'екта Хг кластеру пiд

__о

номером g, g = 1,0, при чому ^ц^ (Xi ) = 1.

g =1

Для розв'язання сформульовано' задачi на практи-цi часто використовуеться метод нечиких с-середнiх. Основною складнiстю застосування цього методу в да-

ному випадку е те, що, як правило, значна частина координат векторiв Хг приймае нечисловi значення, що приводить до необхщност введення спещальних функцiй вiдстанi мiж об'ектами. Також, при здшсненш розбиття об'ектiв на кластери необхвдно забезпечити врахування особливостей самих кластерiв.

В дослiдженнi пропонуеться адаптований метод не-чiтких с-середшх.

5. Алгоритм адаптованого методу нечгаких с-середшх для розв'язання задач1 визначення структури сощально'! групи

На початку роботи процедури кластеризацп необ-хiдно розв'язати таю задача

1. Задача впорядкування ознак. Вербальна постановка задачi е такою: необхщно для кожно' ознаки з мно-жини К встановити стутнь п впливу на можлившть входження об'екта до того чи шшого кластеру.

Математично задача полягае у щентифжацп функ-щонально' залежностi О, за допомогою яко' б здш-снювалося вщображення:

О: К ,

та визначалася б стутнь впливу ознаки на формування кластерiв.

Один iз способiв обчислення значень функцп О ба-зуеться на результатах експертних опитувань та зводить-ся до послщовних розв'язань задач числово' оцiнки об'екта. Серед методiв визначення числово' оцiнки об'екта можна виокремити статистичний метод, утилиарний та егалiтарний методи, евристичт методи тощо [18, 20, 21]. Позначимо а^ = О(Kj), ] = 1,М.

2. Задача побудови лтгвктичних змтних. Для кожно' ознаки з множини К будуемо лшгвктичну змшну [9, 19]. Побудову можна виконувати на основi висновюв екс-перпв. Позначимо через {¡^,Т},Sj,Р^ параметри, що вiдповiдають лiнгвiстичнiй змшнш К^, ] = 1, М; Rj — потужшсть множини Т; цгТ^ (х^ — функцiя належ-ност для г-го терму множини Т, г = 1, Rj.

Шсля розв'язання вказаних задач переходимо до запуску иерацшно' процедури адаптованого методу нечиких с-середшх. Алгоритм методу е таким:

Крок 1. Задаемо параметр зупинки алгоритму £ е(0;1) та ступiнь нечикосп т, 1 < т [18]. При т = 1 от-римуемо чiтке розбиття, тобто розбиття, у якому кожен об'ект ввдноситься тшьки до одного кластеру. 1з збшь-шенням параметру т збiльшуеться ступiнь розмитостi видшених кластерiв.

Для кожного об'екта iз множини Х = {Хг =(хг1,хг2,

...,хм),г = 1,Ы} довiльним чином задаемо ступiнь на-

лежностi кожному з кластерiв та формуемо матрицю и0 = (и^), ищ е[0;1], де ищ — початкова ступiнь на-

лежност г-го об'екта g-му кластеру (г = 1,Ы,g = 10|,

о

та ^ищ = 1, е{1,...,N}.

g=1

Визначимо функцiю вiдстанi мiж двома об'ектами Хг1, Хг2 еХ таким чином:

ТЕХНОЛОГИЧЕСКИЙ АУДИТ И РЕЗЕРВЫ ПРОИЗВОДСТВА — № 2/2(22], 2015

d (ip Xi2 )-

m f Rj

I a j ' Rj I ^rTj ((iij ) - №rTj (xi2

j-1V r-1

j-1

(1)

де xixj, xi2j — вiдповiднi компоненти BeKTopiB X^, Xi2.

Крок 2. Визначаемо значення функцiй належностi для компонент BeKTopiB, що е поточними центрами ^acTepiB за формулою:

^ (С)- ^^V

%(uig ) -VrTj (xij )

де C(g)-(c{g),c2g),...,cMM — поточний центр g-го класте-

РУ (g - 1,G).

Крок 3. Знаходимо вщсташ вiд об'еклв до центрiв кластерiв за формулою (1). Позначимо dig - d((i, с (g A,

i - xn, g- %G.

Крок 4. Обчислюемо коефiцieнти матрицi U за формулами:

якщо Eg e{1,2,...,G}: dig1 -0, то Uigx -1, Uig -0, Vg*gi, g-1,G;

якщо Vg -1,G dig > 0, то uig --

1

N f d 4

ig

!Vdlg/

I

l -1

Крок 5. Перевiряемо умови зупинки алгоритму. Тоб-то, якщо ||| - и *| |2 <е, де и * — матриця, отримана на попередньому крощ, то алгоритм закшчено, шакше переходимо до кроку 2.

6. Сфери застосування методу

Адаптований метод нечико! кластеризацп може використовуватися в задачах дослвдження соцiальноi структури суспiльства. Числовi експерименти розв'язу-вання таких задач запропонованим методом показали, що кiлькiсть иерацш залежить вiд початкових значень функцп належностi, а результат об'еднання об'екпв у кластери, — вiд визначення вагових коефщенпв оз-нак, що впливають на групування. Незважаючи на таю особливосп, при вдалому пiдборi параметрiв та залученнi квалiфiкованих експерпв, метод дозволяе ефективно визначати структуру сощальних груп без необхiдностi проведення додаткових експертиз, опитувань тощо.

Також, результати розбиття групи оаб на тдгрупи можуть бути основою для розв'язання задач побудови соцiально-демографiчного портрету особи-представника певно! групи, що виникають в политологи, економiцi, медицинi та iнших галузях.

7. Висновки

В робот дослщжено задачу визначення структури сoцiальних груп. Проведений аналiз задачi виявив li oсoбливoстi, пoв'язанi з характером вхщних даних та складностями, якi виникають при визначенш вiдстанi мiж об'ектами.

Виконано вербальну та математичну постановки за-дачi визначення структури сощально! групи як задачi нeчiткoi кластеризацп, яка передбачае можлившть ви-конання такого розбиття на кластери, при якому кожен об'ект може одночасно належати деюльком кластерам з piзними ступенями налeжнoстi.

Розроблено адаптований метод нечиких с-серед-шх для розв'язання сформульовано! задачi. В мeтoдi використано результати експертних опитувань щодо oцiнки впливу окремих ознак на можлившть входження oб'ектiв у кластери. Врахування таких ощнок дозволяе проводити розбиття у вщповщност! до мети задачi та природи самих кластepiв. Ознаки oб'ектiв, за якими проводиться розбиття на кластери, представлен у ви-глядi лiнгвiстичних змшних. Таке перетворення дозволяе в подальшому проводити пopiвняння нечислових даних та задавати метрику на множит об'еклв.

Запропоновано правила для обчислення вщсташ мiж об'ектами та визначeннi цeнтpiв кластepiв, якi базуються на врахуванш вiдстанeй мiж ознаками, яким вщповща-ють нeчiткi множини лiнгвiстичних змшних.

В дослщженш зазначeнi класи задач, для яких ефек-тивним е використання запропонованого методу.

Л1тература

1. Огаренко, В. М. Сощолопя малих груп [Текст]: шдручник для студ. вуз1в / В. М. Огаренко, Ж. Д. Малахова; Гумашт. ун-т, Запор1зький 1н-т держ. та мунщипального управлшня. — Ки!в: Центр навчально! л1т., 2005. — 291 с.

2. Жоль, К. К. Сощолопя [Текст] / К. К. Жоль. — К.: Либщь, 2005. — 440 с.

3. Миронюк, I. С. Результати визначення ощночно! чисельност представнигав уразливо! щодо шфжування В1Л групи насе-лення (жшки секс-б1знесу) в Закарпатськш област [Текст] / I. С. Миронюк, В. Й. Шатило, I. Я. Гуцол, В. В. Брич // Укра!на. Здоров'я наци. — 2011. — № 2(18). — С. 133-137.

4. Миронюк, I. С. Застосування шформацшних технологш для вир1шення задач! ощнки чисельност представниюв груп високого ризику шфжування ВIЛ [Текст] / I. С. Миронюк, О. Ю. Мулеса // Вюник сощально! ппени та оргашзаци охорони здоров'я Укра!ни. Науково-практичний журнал. — 2013. — № 3(57). — С. 55-63.

5. Миронюк, I. С. Визначення поведшкових ризигав ВШ-шфь кованих жител1в Закарпаття, пов'язаних з трудовою м1гра-щею [Текст] / I. С. Миронюк // Туберкульоз. Легенев1 хвороби. ВШ-шфекщя. — 2012. — № 2(9) — С. 97-102.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

6. Мулеса, О. Ю. !нформацшш технологи кшькюного ощ-нювання груп ризику шфжування в1русом 1мунодефщиту людини [Текст] / О. Ю. Мулеса // Схщно-бвропейський журнал передових технологш. — 2013. — № 5/4(65). — С. 10-15. — Режим доступу: \www/URL: http://journals. uran.ua/eejet/article/view/18327

7. Ту, Дж. Принципы распознавания образов [Текст] / Дж. Ту, Р. Гонсалес. — М.: Мир, 1978. — 412 с.

8. Мандель, И. Д. Кластерный анализ [Текст] / И. Д. Мендель. — М.: Финансы и статистика, 1988. — 320 с.

9. Снитюк, В. 6. Прогнозування. Модель Методи. Алгорит-ми [Текст]: навч. поаб. / В. 6. Снитюк. — К.: Маклаут, 2008. — 364 с.

10. Gorban, A. N. Method of Elastic Maps and its Applications in Data Visualization and Data Modelling [Text] / A. N. Gorban, A. Yu. Zinovyev // Int. Journal of Computing Anticipatory Systems, CHAOS. — 2002. — Vol. 12. — P. 353-369.

a

m-1

TECHNOLOGY AUDiT AND PRODUCTiON RESERVES — № 2/2(22], 2015

11. Снитюк, В. Эволюционная кластеризация сложных объектов и процессов [Текст] / В. Снитюк // XI-th International Conference «Knowledge-Dialogue-Solution» — Varna, 2005. — Т. 1. — С. 232-237.

12. Батуркин, С. А. Статистические алгоритмы кластеризации данных в адаптивных обучающих системах [Текст] / С. А. Батуркин, Е. Ю. Батуркина, В. А. Зименко, И. В. Сигинов // Вестник РГРТУ. — Рязань, 2012. — Вып. 31, № 1. — C. 82-85.

13. Фукунага, К. Введение в статистическую теорию распознавания образов [Текст] / К. Фукунага. — М.: Наука. Главная редакция физико-математической литературы, 1979. — 368 с.

14. Плюта, В. Сравнительный многомерный анализ в эконо-метрическом моделировании [Текст] / В. Плюта. — М.: Финансы и статистика, 1989. — 175 с.

15. Котов, А. Кластеризация данных [Электронный ресурс] / А. Котов, Н. Красильников. — 2 октября 2006 г. — Режим доступа: \www/URL: http://yury.name/internet/02ia-seminar-note.pdf

16. Kohonen, T. Self-Organization and Associative Memory [Text] / T. Kohonen // Springer Series in Information Sciences. — Springer Berlin Heidelberg, 1989. — 312 p. doi:10.1007/978-3-642-88163-3

17. Горбаченко, В. И. Сети и карты Кохонена [Электронный ресурс] / В. И. Горбаченко. — Режим доступа: \www/URL: http://gorbachenko.self-organization.ru/index.html

1S. Смешко, Ю. В. Об одном критерии для выбора значения экспоненциального веса в алгоритме классификации нечетких С-средних [Текст] / Ю. В. Смешко // Молодежь и наука. — Красноярск, 2012. — С. 19-25.

19. Орловский, С. А. Проблемы принятия решений при нечеткой исходной информации [Текст] / С. А. Орловский. — М.: Наука. Главная редакция физико-математической литературы, 1981. — 208 с.

20. Волошин, О. Ф. Теорiя прийняття ршень [Текст]: навч. поабн. / О. Ф. Волошин, С. О. Мащенко. — К.: Видавничо-полiграфiчний центр «Кшвський ушверситет», 2010. — 366 с.

21. Маляр, М. М. Схема паралельно-послщовного вщаву BapiaH-TiB для зaдaчi вибору [Текст] / М. М. Маляр, О. Ю. Швала-riH // Схщно-бвропейський журнал передових технологш. — 2011. — № 1/4(49). — С. 39-42. — Режим доступу: \www/ URL: http://journals.uran.ua/eejet/article/view/1911

АДАПТАЦИЯ МЕТОДА НЕЧЕТКИХ С-СРЕДНИХ К ЗАДАЧЕ ОПРЕДЕЛЕНИЯ СТРУКТУРЫ СОЦИАЛЬНЫХ ГРУПП

Рассматривается задача определения структуры социальных групп как задача нечеткой кластеризации объектов. Предлагается адаптация метода нечетких с-средних для решения сформулированной задачи, которая заключается в определении новых способов вычисления расстояния между объектами и определения центров кластеров. Эффективность метода достигается путем представления признаков объектов через соответствующие лингвистические переменные.

Ключевые слова: структура социальной группы, нечеткая кластеризация, лингвистическая переменная, метод нечетких с-средних.

Мулеса Оксана ЮрИвна, кандидат техтчних наук, доцент, кафедра тбернетики i прикладног математики, ДВНЗ «Ужго-родський нащональний утверситет», Украгна, e-mail: mulesa.oksana@gmail.com.

Мулеса Оксана Юрьевна, кандидат технических наук, доцент, кафедра кибернетики и прикладной математики, ГВУЗ «Ужгородский национальный университет», Украина.

Mulesa Oksana, Uzhgorod national university, Ukraine, e-mail: mulesa.oksana@gmail.com

I 7G

технологический аудит и резервы производства — № 2/2(22), 2015

i Надоели баннеры? Вы всегда можете отключить рекламу.