Научная статья на тему 'МОДЕЛЬ АНАЛИЗА ФАКТОРОВ НА ОСНОВЕ НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ С-СРЕДНИХ'

МОДЕЛЬ АНАЛИЗА ФАКТОРОВ НА ОСНОВЕ НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ С-СРЕДНИХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
113
17
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД НЕЧЁТКОЙ КЛАСТЕРИЗАЦИИ С-СРЕДНИХ / НЕЧЕТКАЯ СТАТИСТИКА РАЗРЫВА / ОЦЕНКА КАЧЕСТВА СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМ / ЭКОНОМИКА ВЬЕТНАМА

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нгуен Тхи Тху Зунг, Черненькая Людмила Васильевна

В настоящее время бурно используются методы математической статистики при оценке развития социально-экономических систем регионов. Предложена модель анализа факторов на основе метода нечетких C-средних с помощью нечеткой статистики разрыва, реализованная на языке программирования Python. Применение нечетких C-средних с использованием нечеткой статистики разрыва показало надежное и эффективное распределение регионов по группам. Предложенная модель анализа использована для исследования социально-экономических систем регионов Вьетнама, однако может быть рекомендована к применению специалистами в области математических методов многомерной статистики, оценки качества развития социально-экономических систем или других сфер деятельности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Нгуен Тхи Тху Зунг, Черненькая Людмила Васильевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FACTOR ANALYSIS MODEL BASED ON FUZZY C-MEANS CLUSTERING

Currently, the methods of mathematical statistics in assessins the development of socio-economic systems of the regions are used vigorously. A model of factor analysis based on the method of fuzzy C-means using fuzzy gap statistics and Python programming language was proposed. Application of fuzzy C-means using fuzzy gap statistics showed reliable and efficient distribution of regions into groups. The analysis model has been applied to the study of the socio-economic systems of the regions of Vietnam. The work is recommended for use by students, specialists in the field of mathematical methods of multivariate statistics, quality assessment of the development of socio-economic systems or other areas of the country.

Текст научной работы на тему «МОДЕЛЬ АНАЛИЗА ФАКТОРОВ НА ОСНОВЕ НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ С-СРЕДНИХ»

УДК 519.2:330

DOI: 10.24412/2071-6168-2023-1-329-337 МОДЕЛЬ АНАЛИЗА ФАКТОРОВ НА ОСНОВЕ НЕЧЕТКОЙ КЛАСТЕРИЗАЦИИ С-СРЕДНИХ

Нгуен Тхи Тху Зунг, Л.В. Черненькая

В настоящее время бурно используются методы математической статистики при оценке развития социально-экономических систем регионов. Предложена модель анализа факторов на основе метода нечетких C-средних с помощью нечеткой статистики разрыва, реализованная на языке программирования Python. Применение нечетких C-средних с использованием нечеткой статистики разрыва показало надежное и эффективное распределение регионов по группам. Предложенная модель анализа использована для исследования социально-экономических систем регионов Вьетнама, однако может быть рекомендована к применению специалистами в области математических методов многомерной статистики, оценки качества развития социально-экономических систем или других сфер деятельности.

Ключевые слова: метод нечёткой кластеризации С-средних, нечеткая статистика разрыва, оценка качества социально-экономических систем, экономика Вьетнама.

Кластеризация широко используется в различных исследованиях. Суть кластеризации заключается в том, что алгоритм группирует наблюдения в кластеры на основе оценивания расстояния до центров кластеров.

Один из первых алгоритмов кластеризации был реализован на методе K-средних (KM), который позволяет точно распознать хорошо разделенные кластеры. Для повышения точности KM при работе с наборами данных, содержащих перекрывающиеся кластеры, был сформулирован алгоритм нечетких С-средних (Fuzzy C-Means (FCM)) [1]. Мягкая кластеризация, особенно нечеткая кластеризация, имеет ряд преимуществ перед жесткой кластеризацией. Например, ограничение принадлежности каждого наблюдения при жесткой кластеризации совершенно нереально для реальных наборов данных, и более естественно было бы назначить степень принадлежности каждому наблюдению [2]. Кроме того, нечеткая кластеризация классифицирует отклоняющиеся наблюдения более точно, чем жесткая кластеризация, поскольку каждому наблюдению присваивается степень принадлежности. С другой стороны, нечеткий алгоритм позволяет более точно классифицировать такие наблюдения, поскольку присвоенная степень принадлежности точно определяет родительский кластер, даже если разница составляет небольшой процент [1].

Значения точности, полноты и меры f являются более точными при применении нечетких C-средних по сравнению с алгоритмом K-средних. В алгоритме нечетких C-средних количество точек данных распределено равномерно. Нечеткий алгоритм эффективен для больших наборов данных и хорошо подходит для кластеризации требований [3].

Впоследствии было разработано много новых методов, основанных на платформе FCM, позволяющей улучшить процедуру и преодолеть ограничения для дальнейшего улучшения способности кластеризации этого алгоритма во многих областях. Так, Нечеткие C-средние Густафсона Кесселя (GKFCM)) лучше работают для несферических кластеров, Нечеткие С-средние++ (FCM++) и подавленные-нечеткие C-средние (S-FCM) улучшают эффективность FCM, а возможностные C-средние (PCM) позволяют получить более точный результат для наборов данных с шумами и выбросами [1,4].

Основным недостатком KM, а также FCM является выбор начального числа кластеров. Существует множество вспомогательных методов, помогающих аналитику выбрать наиболее подходящее число кластеров, среди них хорошие результаты показывает статистический алгоритм нечеткой статистики разрыва.

Нечеткая статистика разрыва была опубликована Р. Тибширани, Г. Вальтером и Т. Хасти (Стэнфордский университет, 2001). Нечеткая статистика разрыва была разработана для эффективной поддержки нечеткой кластеризации. Она оказалась более мощной, чем обычная статистика разрыва для набора данных IRIS. Результаты были проверены при сравнении нечеткой статистики разрыва с традиционными индексами нечеткой кластеризации, такими как коэффициент разбиения или индекс энтропии, введенный Бездеком, расширенные индексы Кси-Бени и индекс Фукуямы-Сугено [5].

Каждое усовершенствование метода подходит для решения разных задач, однако это не означает, что, чем больше усовершенствований используется, тем лучше, важно, чтобы метод отвечал требованиям исследовательской работы.

Целью данного исследования является разделение 63 регионов Вьетнама по 144 социально-экономическим критериям. Собранная статистика - это большие данные с перекрывающимися группами, не содержащими несферические кластеры, поэтому для решения задач исследования выбран метод нечетких С-средних и метод нечеткой статистики разрыва, при этом данные требуют предварительной обработки. В данной работе для выбора количества кластеров использован метод нечеткой статистики разрыва.

Исследование включает следующие разделы:

1. Введение, постановка задачи.

2. Описать алгоритм, используемый для анализа.

3. Сбор данных и подготовка данных.

4. Результаты анализа.

5. Сравнение результатов с реальностью.

6. Рекомендации по результатам исследования.

7. Заключение.

Алгоритм методов анализа.

Нечеткие С-средние. Исходными данными для кластеризации является совокупность наблюдений из п элементов X = (X, X X ) , где п — количество объектов, каждый X е X г = 1 п —

п ^ г ' '

вектор с d признаками (размерностями) для каждого объекта. Кластер представлен набором с кластеров с центрами кластеров УХ,У2,...,У в наборе центроидов V [6-8].

Структура кластера задается матрицей принадлежности ипхс, где игк членство значение, определяющий принадлежность г — го элемента в к — му кластеру; г = 1, п; к = 1, с . Чем больше и¿к, тем выше степень уверенности в том, что элемент Xг принадлежит кластеру к. Тогда 0 < и¡к < 1 и

с

^и.к = 1 для каждого XI. Значение и^ определяется следующей функцией [7]:

к=1

1 , (1)

иг,к =-

2

( „Л

c

I

j=1

X -Vk\

4..X -Vj\2

2 m-1

где i = 1, n; k = 1, c, m e (1, + - взвешенный индекс, также известный как гладкие параметры, определяющий нечеткость, размытость кластеров.

Метод нечеткой кластеризации C-средних основан на целевой функции J (функция потерь), которую необходимо минимизировать [8]:

J(U, c) = i I<k||xi - vkf, (2)

i=1 k=1

Нечеткая статистика разрыва. Внутрикластерная сумма квадратов расстояний от кластерных средних определяется как

c 2

w = II||x -vj , (3)

k=1 ieck 2

J (U, C) в литературе по FCM называется суммой квадратов расстояний внутри кластера и может быть использовано в качестве меры погрешности для создания нечеткой статистики разрыва [8-9].

jm,k =I Iklx - vkE • (4)

i=1 k=1

В качестве дополнительной мотивации отметим, что при m ^ 1 приближение Jm k стремится к поведению Wk.

Нечеткая статистика разрыва определяется по формуле:

Gap(k) = Ejlog (Jm,k)}-log (Jm,k), (5)

1 B

где E |log( J* k)} =_I log (J kb ) - ожидаемое значение меры ошибки для эталонного Jm k распре-

B b=1

деления нулевой модели [9].

Стандартное отклонение определяется по формуле:

sd (k ) =

1 _ 2

- I(log (m,k,b ) - log( Jm,k,b ))

B ь

(6)

Учет дополнительно ошибки моделирования:

Ч = ^1 + B'

Количество кластеров определяется через наименьшее k так, чтобы

Gap (k) > Gap (k +1) —

k+i'

(7)

(8)

Сбор и подготовка данных. Для целей исследования использованы данные 63 вьетнамских провинций по 144 социально-экономическим показателям, собранные на основе Общей статистики Вьетнама в 2019 году [10].

Исследования показали, что предварительная обработка данных обязательна при анализе реальных данных, особенно при большом объеме источников социально-экономической информации [10]. В исследовании данные предварительно обработаны по следующей схеме:

- очистка данных,

- определение коэффициента корреляции с обнаружением избыточных атрибутов,

- нормализация Z-оценки,

- вменение случайной выборки.

Вышеуказанные процессы обрабатываются на языке программирования Python.

Результаты анализа.

Алгоритм нечеткой кластеризации C-средних. Алгоритм метода нечеткой кластеризации С-средних реализован в соответствии со схемой, представленной на рис. 1. Алгоритм состоит из нескольких этапов. Сначала определяем списки объектов (формирование экспериментальных данных). Этот шаг необходим для инициализации значений функции: векторный набор значений центра кластера V , репрезентативный матрица принадлежности U и взвешенный индекс m . Количество кластеров c определяется на основе метода нечеткой статистики разрыва [11].

Затем для каждого кластера определяется центральное значение каждого кластера по формуле:

ZU ( k )mXi

vk =—

k n

(8)

Zu ( k )m

i=1

После этого вычисляется матрица принадлежности U, следуя уравнению (1). Проверка условия остановки: вычислить значение целевой функции J, если значение изменится, вернуться к шагу 2, в противном случае завершить алгоритм. Если ^Ц[— Щ() > &, где 8 - критерий завершения между 0 и 1, то значение J изменяется [11-12].

Рис. 1. Алгоритм нечеткой кластеризации С-средних

Алгоритм FCM состоит из двух основных шагов: обновление центра кластера и обновление матрицы принадлежности. Эти два шага выполняются поочередно для минимизации функции ^ Алгоритм останавливается в том случае, когда J сходится [12].

331

Алгоритм метода нечеткой статистики разрыва. Суть алгоритма нечеткой статистики разрыва заключается в том, что за оценку оптимальных кластеров принимаем значение, максимизирующее статистику расстояний [9]. Шаги по реализации статистического алгоритма нечеткой статистики разрыва последовательно описаны на рис. 2.

Алгоритм нечеткой статистики разрыва работает следующим образом [9,13]:

1. Оценить максимальное количество кластеров k max. Сгруппировать исходные данные с каждым фиксированным числом кластеров k, используя описанный выше алгоритм нечетких C-средних, где k = 1,2,..., k _max.

2. Рассчитать каждое значение разрывов, которое описывается как логарифмическая разница между средней дисперсией набора эталонных данных B и дисперсией исходного набора данных.

3. Рассчитать статистику Gap, стандартное отклонение sdk и ошибку моделирования. sk по формулам (5), (6) и (7).

Оптимальным является количество кластеров, заданное k, по крайней мере такое, что удовлетворяет формуле (8).

Результаты расчетов. На основе комбинированной модели алгоритмов нечеткой кластеризации C-средних и нечеткой статистики разрыва данные обрабатываются на языке python, значения Gap рассчитываются путем сравнения целевого набора данных с эталонным набором данных. В данной статье было выбрано значение kmax = 20 и количество эталонных значений установлено B = 1000. При больших значениях B метод будет давать более убедительные результаты, но время выполнения алгоритма, реализованного на языке программирования Python, будет больше [13,14].

Fuzzy-с-means

8.0

7.5

7.0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

_ 6.5 ч

| 6-0 DI £

5.5 5.0 4.5 4.0

reference

— data

V-

Fuzzy Gap Statistics

7+5 1С О Ц-5 15.0 Number of clusters

7.S 10.0 11.5 15.0 17.5 10.0 Number Cf Clu&ters

а б

Рис. 3. Результаты анализа: а - результаты сравнения значения логарифма разрыва с целевым набором данных и эталонным набором данных; б - разность и ошибка логарифма расстояния

для двух наборов данных

Из данных, представленных на рис. 3, а, можно увидеть, что результаты вычисления логарифма расстояния для целевого набора данных уменьшаются быстрее и значительнее, чем для эталонного набора данных, что позволяет предсказать результаты разрыва с большим различием между двумя наборами данных для к от 1 до k-мах [13,14]. Из рис. 3, б следует, что значение разрыва имеет тенденцию сильно увеличиваться при изменении к от 0 до 4, а затем медленно увеличиваться до к_тах=20.

Оптимизации значения количества кластеров к. На рис. 4 показано различие функций Gap(k+1) и Gap(k) с учетом погрешности, определяемой по формуле (8). Точки под красной линией показывают, что значение Gap при заданном значении к больше, чем значение Gap при к+1 с учетом значения погрешности. Как показано на риснке 4, при к от 4 до к тах = 20 значения начинают удовлетворять формуле (8).

Рис. 4. Оптимизация значения количества кластеров к

Однако, согласно алгоритму, оптимальным значением к является наименьшее значение к, удовлетворяющее этой формуле, потому что при выделении большего количество кластеров, кластеры будут сжиматься, что означает, что значение общего расстояния будет уменьшаться, поэтому оптимальным к является наименьшее значение к, при котором значение общего расстояния является наименьшим. Таким образом выбираем к = 4 [9, 13-14].

Результаты кластеризации. С помощью алгоритма нечеткой статистики разрыва на основании модели определено количество кластеров, равное 4, таким образом, чтобы внутрикластерная сумма расстояний была наименьшей. Имея 4 нечетких кластера: кластер 1, кластер 2, кластер 3 и кластер 4, определяем значения элементов матрицы и, которые покажут степень принадлежности каждого района из 63 районов Вьетнама к каждому из 4 кластеров. (см. таблицу). Например, для города Ханой, значение степени принадлежности к группам 1, 2, 3 и 4, составляют 0,11406; 0,095706; 0,60314; 0,187094 соответственно, показывая, что Ханой наиболее сильно принадлежит к группе 3 со степенью 60,3%; степень принадлежности к 4 группе - 18,7%; принадлежность к 1-й и 2-й группе составили 11,4% и 9,6% соответственно. Значения, выделенные жирным шрифтом, представляют более 60% принадлежности каждого региона к соответствующему кластеру, что указывает на сильную принадлежность к этому классу.

Значения элементов матрицы принадлежности U

Объект Кластеры

Код Провинции 1 2 3 4

HN Ханой 0,11406 0,095706 0,60314 0,187094

VP Винь Фук 0,044358 0,029828 0,841159 0,084656

BN Бак Нинь 0,078774 0,069393 0,719716 0,132118

QN Куанг Нинь 0,03164 0,028018 0,867892 0,07245

HD Хай Дуонг 0,077272 0,046856 0,67758 0,198291

HP Хай Фонг 0,025497 0,021977 0,895958 0,056568

HY Хунг Иен 0,009541 0,006404 0,962804 0,021251

TB Тай Бинь 0,109762 0,195886 0,093614 0,600737

HN.1 Ха Нам 0,04446 0,024417 0,823676 0,107448

NB Нам Дин 0,109954 0,063509 0,067455 0,759083

NB Нинь Бинь 0,029607 0,022149 0,87979 0,068454

HG Ха Гианг 0,880011 0,024543 0,025833 0,069614

CB Цао Банг 0,924203 0,014044 0,016323 0,045431

BK Бак Кан 0,863314 0,028785 0,028402 0,079499

TQ Туйен Куанг 0,873832 0,024931 0,025462 0,075775

LC Лаокай 0,342691 0,059459 0,187422 0,410428

YB Иен Бай 0,945676 0,009073 0,01044 0,034811

TN Тай Нгуен 0,095739 0,07889 0,670649 0,154722

Окончание

LS Ланг Сон 0,923245 0,012618 0,016572 0,047566

BG Бак Джанг 0,153417 0,062418 0,425034 0,359131

РТ Фу Тхо 0,270102 0,060833 0,173944 0,49512

ВВ Дьен Бьен 0,698727 0,043583 0,06666 0,191031

LC.1 Лай Чау 0,840778 0,033311 0,034612 0,091299

SL Сон Ла 0,877814 0,02577 0,025794 0,070623

НВ Хоабинь 0,847383 0,019893 0,030108 0,102616

ТН Цинхуа 0,156832 0,059482 0,156231 0,627455

^ Нгхе Ан 0,166177 0,052047 0,062278 0,719498

НТ Ха Тинь 0,185148 0,108641 0,38156 0,324651

QB Куанг Бинь 0,137201 0,067784 0,050862 0,744152

QT Куанг Три 0,431655 0,06515 0,0602 0,442995

ТТН Хюэ 0,207672 0,045153 0,065688 0,681487

ВN Дананг 0,043652 0,03185 0,830746 0,093752

QN.1 Куанг Нам 0,102142 0,062432 0,228394 0,607032

QN.2 Куанг Нгай 0,098978 0,323299 0,161453 0,41627

ВВ Бинь Динь 0,103061 0,368056 0,081275 0,447608

PY Фу Иен 0,362376 0,143976 0,068042 0,425606

КН Кханьхоа 0,101431 0,077187 0,418054 0,403329

ОТ Нинь Туан 0,089337 0,653708 0,056733 0,200221

ВТ Бинь Туан 0,103867 0,379997 0,092928 0,423209

КТ Кон Тум 0,882624 0,015046 0,022711 0,079618

GL Джиа Лай 0,648208 0,049555 0,07906 0,223177

ВL Дак Лак 0,814941 0,030654 0,037282 0,117123

ВШ Дак Нонг 0,44691 0,112803 0,151407 0,288879

LВ Лам Донг 0,472432 0,08071 0,131233 0,315626

ВР Бинь Фуок 0,130061 0,048902 0,564532 0,256505

ТШ Тай Нинь 0,079648 0,041151 0,70589 0,173311

BD Бинь Зыонг 0,055283 0,045397 0,79924 0,10008

ВК2 Донг Най 0,028734 0,021212 0,893435 0,056619

BR БР-ВТ 0,157028 0,203029 0,360686 0,279257

ТС Хошимин 0,249739 0,245966 0,249745 0,25455

LA Лонг Ан 0,018156 0,012967 0,92706 0,041817

TG Тиен Джианг 0,106082 0,366521 0,099024 0,428373

ВТ.1 Бен Тре 0,035169 0,870137 0,032031 0,062663

ТУ Тра Винь 0,043357 0,804741 0,035547 0,116355

УЬ Вин Лонг 0,141022 0,390712 0,083002 0,385264

ВТ Донг Тап 0,014964 0,941933 0,01372 0,029383

AG Ан Джианг 0,034923 0,875214 0,024444 0,06542

^ Киен Джанг 0,034446 0,862678 0,035664 0,067212

СТ Кан Тхо 0,103711 0,2278 0,225557 0,442932

HG.1 Хау Джанг 0,111832 0,073083 0,0577 0,757385

ST Сок Транг 0,028587 0,888169 0,02122 0,062024

ВЬ Бак Лью 0,039449 0,858054 0,034811 0,067686

СМ Ка Мау 0,030788 0,884153 0,029251 0,055808

Как показаны в таблице, только 16 из 63 объектов входят в свой кластер со степенью принадлежности менее 0,5. 35 из 47 объектов имеют степень принадлежности к классу, превышающую 0,7. Это означает, что степень принадлежности к другим кластерам этих объектов низкая, менее 0,2. Это доказывает, что разделенные группы очень «плотные», а не «рыхлые». Таким образом, найдено оптимальное количество кластеров, степени принадлежности объектов высокие, пограничных объектов мало.

Сравнение результатов с реальностью. Результаты разделения 63 провинций Вьетнама на 4 группы по совокупности социально-экономических показателей отображены на карте (см. рис. 5). Группа 1 иллюстрируется зеленой цветовой гаммой, значение степени принадлежности выражается так же, как интенсивность цвета, темно-зеленый цвет показывает высокое значение степени принадлежности к группе 1, светлый зеленый цвет отображает более низкий уровень принадлежности.

Такие же иллюстрации представлены на карте для группы 2, группы 3 и группы 4.

Опираясь на фактические картографические данные Вьетнама [10], можно видеть, что слой 1 совпадает с группой регионов с горным рельефом, неудобным для движения транспорта.

Группа 2 отличается большими площадями, производством риса, наибольшей продуктивностью животноводства, растениеводства и технических культур.

Группа 3 имеет высокий размер ВВП и доходов, ВВП на душу населения является одним из самых высоких в стране, а плотность населения выше, чем в других регионах.

Группа 4 обладает высокой конкурентоспособностью (индекс РАР1 2020), имеет большой потенциал социально-экономического развития и инвестиций.

1 I

I

1 ^

кластер 1 кластер 2

<

\

- ш!^

кластер 3 кластер 4

Рис. 5. Иллюстрация классификации 63 провинции на 4 кластера

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рекомендации по результатам исследования. Представленная выше модель основана на применении методов многомерного математического анализа, а именно: сочетание метода нечеткой кластеризации C-средних и методом выбора оптимального количества кластеров с помощью алгоритма нечеткой статистики разрыва. Сочетание этих двух алгоритмов является достаточно новым, редко применяемым для практических задач, в основном они используются в задачах искусственных нейронных сетей, машинного обучения, анализа и распознавания изображений. Данная работа показала новый аналитический путь в применении этих методов для анализа социально-экономических проблем, сравнение с действительной ситуацией показало, что результаты исследования обладают достоверностью и имеют высокую практическую значимость.

Приведенные выше результаты могут быть использованы для поддержки принятия решения по выбору направления развития каждого кластера. С учетом сильных и слабых сторон каждого кластера будут определены сценарий решений, чтобы обеспечить конкуренцию для содействия развитию района в кластере и между кластерами [16].

Предложенная модель, основанная на использовании методов математического анализа, может найти широкое применение и в других сферах.

Заключения. На основе социально-экономических критериев районов, установленных Главным статистическим управлением Вьетнама, и результатов обработки собранных данных, 63 провинции Вьетнама разделены на 4 региона с различной степенью принадлежности. Для решения поставленной задачи была использована разработанная модель, основанная на использовании метода нечеткой кластеризации C-средних и алгоритма нечеткой статистики разрыва. Программная реализация выполнена на языке Python. С помощью статистического метода нечеткой статистики разрыва выбрано оптимальное количество кластеров, равное 4. По результатам анализа нечеткой кластеризации C-средних установлено, что провинции относятся к группам с достаточно большой степенью принадлежности, пограничных объектов мало. Результаты сопоставлены с фактическими данными, что свидетельствует о

%

4*

практической ценности исследования. Результаты могут быть использованы в качестве основы для других многомерных математических задач и для принятия решений по выбору направлений социально-экономического развития провинций Вьетнама.

Список литературы

1. Виктор Гарсия Доминго. Нечеткие C-средние и алгоритмы кластеризации. сравнительное исследование, 2019. С. 57- 67.

2. Густафсон Д.Э., Кессель В.К., Нечеткая кластеризация с нечеткой ковариационной матрицей. Конференция IEEE по решениям и управлению, включая 17-й симпозиум по адаптивным процессам, 1978. С. 761-766.

3. Ананти Шешасаи, П. Шармила., Сравнительное исследование алгоритмов нечетких C-средних и K-средних для кластеризации требований. Индийский журнал науки и технологий., № 7 (6),

2014. С. 853-857.

4. Ле Тай Хунг, Чан Динь Кханг, Ле Ван Хунг., Нечеткая кластеризация с использованием лингвистически значимого показателя. Материалы 8-й Национальной конференции по фундаментальным и прикладным исследованиям в области информационных технологий (FAIR); Ханой, 9-10 июля 2015. С. 537-546.

5. Кристофер Сентелле, Сиу Лун Хонг, Майкл Георгиопулос. Нечеткая статистика разрыва для нечетких с-средних. Материалы 11-й Международной конференции ISATED по искусственному интеллекту и программным вычислениям. Пальма-де-Майорка, Испания, 2007. С. 68-73.

6. Зейнель Джебечи1, Фиген Йылдыз. Сравнение алгоритмов K-средних и нечетких C-средних на различных кластерных структурах // Журнал сельскохозяйственной информатики (ISSN 2061-862X)

2015. Vol. 6, №3. С. 13-23.

7. Роберт Л. Кэннон, Джитендра В. Дэйв и Джеймс С. Бездек. Эффективная реализация алгоритмов кластеризации нечетких с-средних. Более подробные транзакции по анализу паттернов и машинному интеллекту. Том. Пами-8, № 2, март 1986. С. 248-255.

8. Кудинов Ю.И., Кудинов И.Ю. Нечеткое моделирование и кластеризация, Про-бл. управл., 2008. Вып. 6. С. 2-10.

9. Кристофер Сентелле, Майкл Георгиопулос, Георгиос Анагностопулос, Сиу Лун Хонг. Нечеткая статистика разрыва для Fuzzy C-Means. Материалы 11-й Международной конференции IASTED по искусственному интеллекту и программным вычислениям, январь 2007 г., Пальма-де-Майорка, Испания. С. 68-73.

10. Главное статистическое управление Вьетнама. [Электронный ресурс] URL: https://www.gso.gov.vn (дата обращения: 10.09.2022).

11. Джеймс с. Бездек, Роберт Эрлих, Уильям Фулл, fcm: нечеткий алгоритм кластеризации с-средних. Компьютеры и науки о Земле, 1984. Том. 10, № 2-3. С. 191-203.

12. Новоселова Н.А., Том И.Э. Эволюционный метод нечеткой кластеризации. Информатика. 2009;(3(23)). С. 55-67.

13. Роберт Тибширани, Гюнтер Вальтер, Тревор Хасти. Оценка количества кластеров в наборе данных с помощью статистики пропусков. // Журнал Королевского статистического общества, 2001. Часть 2. С. 411-423.

14. Мойган Мохайер, Карл-Ханс Энглмайер, Фолькер Дж. Шмид. Сравнение определений статистики Gap с функцией логарифмирования и без нее // Технический отчет. №96. 2010.

15. Нгуен Т.Т.З. Модели для анализа развития экономики нескольких районов Вьетнама на основе математических методов многомерной статистики // Импульс организационных инноваций: Сборник конкурсных работ 1 межвузовского конкурса студентов, магистрантов и аспирантов. М.: Общество с ограниченной ответственностью "Русайнс", 2020. С. 301-324. EDN VCUSXS.

16. Волкова В.Н., Горелова Г.В., Козлов В.Н., Лыпарь Ю.И., Паклин Н.Б., Фирсов А.Н., Черненькая Л.В. Моделирование систем. Подходы и методы: учеб. пособ. / Под ред. В.Н. Волковой. СПб.: Изд-во Политехн. ун-та, 2013. 567 с.

Нгуен Тхи Тху Зунг, аспирантка, thudung.mta.tb@gmail.com, Россия, Санкт-Петербург, Санкт-Петербургский Политехнический университет Петра Великого,

Черненькая Людмила Васильевна, д-р техн. наук, профессор, ludmila@qmd.spbstu.ru, Россия, Санкт-Петербург, Санкт-Петербургский Политехнический университет Петра Великого

FACTOR ANALYSIS MODEL BASED ON FUZZY C-MEANS CLUSTERING Nguyen Thi Thu Dung, L.V. Chernenkaya

Currently, the methods of mathematical statistics in assessing the development of socio-economic systems of the regions are used vigorously. A model offactor analysis based on the method offuzzy C-means using

336

fuzzy gap statistics and Python programming language was proposed. Application of fuzzy C-means using fuzzy gap statistics showed reliable and efficient distribution of regions into groups. The analysis model has been applied to the study of the socio-economic systems of the regions of Vietnam. The work is recommended for use by students, specialists in the field of mathematical methods of multivariate statistics, quality assessment of the development of socio-economic systems or other areas of the country.

Key words: Fuzzy C-means, fuzzy gap statistics, fuzzy clustering, quality assessment of socioeconomic systems, economy of Vietnam.

Nguyen Thi Thu Dung, postgraduate, thudung.mta.tb@smail.com, Russia, St. Petersburg, Peter the Great St. Petersburg Polytechnic University,

Chernenkaya Lyudmila Vasilyevna, doctor of technical sciences, professor, ludmila@qmd.spbstu.ru, Russia, St. Petersburg, Peter the Great St. Petersburg Polytechnic University

УДК 004.94:622

DOI: 10.24412/2071-6168-2023-1-337-340 АНАЛИЗ НАГРУЗКИ, ПОЛУЧЕННОЙ ПО СЕРИИ КОМПЬЮТЕРНЫХ МОДЕЛИРОВАНИЙ

А.С. Кочеткова

При помощи компьютерного моделирования методом конечных элементов была проведена серия компьютерных моделирований в специализированных программных продуктах, в которых исследовались коронки ковшей экскаваторов. Основным исследуемым параметром послужила нагрузка, которую способна выдерживать коронка экскаватора горной машины. Приводятся модели ковша и коронок и анализируются с точки зрения возможностей и формы. В статье анализируются нагрузки на коронки, которые отличаются по форме. Исследуется зависимость площади опасного сечения коронки от выдерживаемой нагрузки. Приводятся уравнения, с помощью которых возможно получение численного значения нагрузки, которое показало относительно высокую точность, и может быть использовано для решения поставленных задач. Также уравнение полезно для быстрого и достаточно точного определения предельной нагрузки, которую может выдержать коронка, что возможно без использования сложного и длительного компьютерно-математического моделирования. Делаются выводы о том, как влияет площадь поперечного сечения коронки на выдерживаемую нагрузку.

Ключевые слова: метод наименьших квадратов, компьютерное моделирование, уравнение нагрузки, экскаватор, горные работы.

В горном деле, промышленности довольно часто используется такой вид специальной техники, как фронтальный погрузчик [1-4]. Его широкое применение обусловлено большим количеством преимуществ - это компактная, маневренная и достаточно универсальная техника, которая может выполнять широкий спектр задач. С помощью фронтального погрузчика осуществляют погрузку и выгрузку насыпных и мелкоштучных грузов, а также их перемещение по территории промышленной зоны или горного карьера.

Главный рабочий орган погрузчика, в ходе работы техники ковш набирает сыпучий или мелкоштучный материал, после чего погрузчик перемещает груз на нужное место. При этом в отличие от бульдозера, где материалы или грунт перемещаются методом толкания, здесь перемещение является обычным.

Фронтальные погрузчики благодаря простоте эксплуатации и маневренности применяются в ходе подъема и транспортировки сыпучих и несыпучих грузов, например, горных пород, руды.

На современном рынке фронтальные погрузчики представлены на колесном и гусеничном ходу. Техника на колесах применяется при выполнении земляных работ, а также на строительных площадках для перемещения материалов. Погрузчики с колесной ходовой частью являются универсальными в использовании и характеризуются высокой маневренностью. Они могут свободно перемещаться по дорогам общего пользования на своем ходу, чего нельзя сказать про гусеничные модели этой техники. Гусеничные погрузчики применяют там, где не пройдет колесная техника или там, где есть риски прокола шин. Такие модели доставляют на место выполнения работ с помощью специальной платформы и тягача. Маневренность у гусеничных погрузчиков низкая, по сравнению с колесной техникой. Кроме этого, двигаются они медленно, поэтому используются только в крайних случаях.

i Надоели баннеры? Вы всегда можете отключить рекламу.