Научная статья на тему 'ДИСКРЕТИЗАЦИЯ В МОДЕЛЯХ ПРОГНОЗИРОВАНИЯ НЕЧЕТКИХ ВРЕМЕННЫХ РЯД'

ДИСКРЕТИЗАЦИЯ В МОДЕЛЯХ ПРОГНОЗИРОВАНИЯ НЕЧЕТКИХ ВРЕМЕННЫХ РЯД Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
68
5
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
методы дискретизации / нечеткие временные ряды / дискретизация на основе отношений / дискретизация на основе энтропии / метод метаэвристической оптимизации / discretization methods / comparison of fuzzy time series discretization methods / ratio-based discretization / entropy-based discretization / metaheuristic optimization method

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Нгуен Тхи Тху Зунг, Черненькая Людмила Васильевна

Модели прогнозирования нечетких временных рядов все чаще разрабатываются и применяются на практике. Улучшение моделей прогнозирования нечетких временных рядов в основном осуществляется путем оптимизации каждой части модели. Первая часть модели представляет собой этап дискретизация временного ряда и является важным этапом при прогнозировании нечетких временных рядов. В статье проведен сравнительный анализ методов, используемых для определения шага дискретизации нечетких временных рядов. Представлены возможные пути совершенствования модели. Определены направления развития и области разработок в будущем.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Нгуен Тхи Тху Зунг, Черненькая Людмила Васильевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

FACTOR ANALYSIS MODEL BASED ON FUZZY C-MEANS CLUSTERING

Fuzzy time series forecasting models are increasingly being developed and applied in practice. The improvement of fuzzy time series forecasting models is mainly done by optimizing each part of the model, and the first part is also a step that is very important for the results of the fuzzy time series forecasting model, which is the time series discretization step. This article will describe, evaluate and compare the methods used for the discretization step of fuzzy time series. This paper will provide an overview of improvements to the model sampling rate as a prerequisite for other developments in the future.

Текст научной работы на тему «ДИСКРЕТИЗАЦИЯ В МОДЕЛЯХ ПРОГНОЗИРОВАНИЯ НЕЧЕТКИХ ВРЕМЕННЫХ РЯД»

Yukhimuk Roman Alekseevich, junior researcher at the scientific laboratory, Russia, St. Petersburg, A.F. Mozhaisky Military Space Academy,

Verevkin Sergei Alexandrovich, junior researcher at the scientific laboratory, vka@,mil.ru, Russia, St. Petersburg, A.F. Mozhaisky Military Space Academy, postgraduate, Russia, St. Petersburg, St. Petersburg Federal Research Centre of the Russian Academy of Sciences

УДК 519.2:330

DOI: 10.24412/2071-6168-2023-8-296-297

ДИСКРЕТИЗАЦИЯ В МОДЕЛЯХ ПРОГНОЗИРОВАНИЯ НЕЧЕТКИХ

ВРЕМЕННЫХ РЯДОВ

Нгуен Тхи Тху Зунг, Л.В. Черненькая

Модели прогнозирования нечетких временных рядов все чаще разрабатываются и применяются на практике. Улучшение моделей прогнозирования нечетких временных рядов в основном осуществляется путем оптимизации каждой части модели. Первая часть модели представляет собой этап дискретизация временного ряда и является важным этапом при прогнозировании нечетких временных рядов. В статье проведен сравнительный анализ методов, используемых для определения шага дискретизации нечетких временных рядов. Представлены возможные пути совершенствования модели. Определены направления развития и области разработок в будущем.

Ключевые слова: методы дискретизации, нечеткие временные ряды, дискретизация на основе отношений, дискретизация на основе энтропии, метод метаэври-стической оптимизации.

1. Описание и моделирование методов дискретизации модели прогнозирования нечеткий временный рядов. Дискретизация — важный шаг в модели прогнозирования нечетких временных рядов, который заключается в разделениие временного ряда на разделы. Если количество разделов слишком мало, прогноз может иметь большие отклонения из-за недостаточной информации. Если количество разделов слишком велико, прогноз может потерять смысл нечеткости лингвистического значения, когда нет нечеткой группы отношений, что приводит к формированию пробелов, не содержащих данных или содержащих только недосаточно данных. Этим объясняется сложность задачи нахождения оптимального деления. Вопросы дискретизации в нечетких временных рядах рассмотрены в научных трудах многих авторов, показано, что по сравнению с другими методами дискретизация дает лучшие прогностические результаты.

В статье проанализированы методы, применяемые для дискретизации в моделях нечетких временных рядов, в том числе: метод Сонга и Чиссома, метод на основе среднего, метод на основе распределения, метод на основе отношений, метод нахождения экстремумов, метод на основе энтропии, метаэвристические методы (метод оптимизации роя частиц (PSO), генетический алгоритм ^А), оптимизация колонии муравьев (АСО) и т. д.).

a. Равная длина интервала. В самом простом случае временной ряд делится на равные сегменты в соответствии с моделью Сонга и Чиссома [1-3]; Чена [4,5]. Однако, у данного метода имеются некоторые недостатки [6]: невозможно найти объективный метод определения универсума дискурса, нет убедительного подхода к определению длины интервалов. Наряду с этим, в работе [7] показано, что применение разных

296

длин интервалов приведет к разным результатам. Поэтому были предложены другие методы для решения в проблему дискретизации для повышения эффективности предсказания при решении задач дискретизации.

Ь. Метод на основе среднего и метод на основе распределения. В работе [7] предложен метод определения длины интервала на основе метода среднего и метода на основе распределения. В котором, исходя из характера распределения, методом определения длины интервалов является:

Аи = тахX < = \х1 - г =1,^,

Метод на основе среднего определяет длину интервалов как:

г=/-1

ÄU = round xi

1 X Fi Xi+l|

1 J=1_

t - 1

с. Метод на основе отношений. В работе [8] предложен новый метод определения длины интервала, основанный на методе отношений. Отношение определяем, как наименьшую относительную разницу, которая больше, чем, по крайней мере, доля всех:

*

ratio = max rt

\xt xt-l

nr <an„

I At-1

Найденное значение отношения будет использовано для определения длины деления временного ряда. С помощью этого метода в работе [9] показано, что для расчета требуется много времени, а результаты не очень эффективны. Поэтому предложен метод реализации оптимизации, который определяет отношение с помощью функции нахождения экстремумов.

d. Метод нахождения экстремумов. Применением функции нахождения экстремумов нет позволяет не выполнять некоторые вычисления, такие как: относительная разница, кумулятивное распределение относительных различий [9]. Этот метод дает лучше результаты, чем метод отношений [8] с гораздо более низким RMSE. В алгоритме, реализующем данный метод, использована функция «fminbnd» в соответствии с идеей Кифера [10], которая была интегрирована в Matlab для выполнения задачи минимизации значения RMSE с каждым циклом в пределах значения 0,2, принимаемого в

качестве верхней границы отношения в процедуре оптимизации:

*

ratio = fminbnd(y^Mffi' (ratio), 0,0.2) .

Наряду с вышеупомянутыми усовершенствованными методами, также основанными на функции минимизации одной переменной «fminbnd» на фиксированном интервале, в работе [11] представлен новый подход, основанный на оптимизация длины интервала для нечетких временных рядов первого порядка с использованием fminbnd для минимизации значения MSE, когда значение интервала изменяется от 200 до 500:

AU * = fminbnd (fMSE (AU), 200,500)

В работе [12] описан тот же метод, но для нечетких временных рядов высокого порядка при значении интервала от 200 до 1000:

AU * = fminbnd (fMSE (AU),200,1000)

e. Метод дискретизации на основе энтропии. Для оптимизации дискретизации разработан метод, основанный на энтропии. Метод дискретизации на основе энтропии основан на работе Шеннона и Уивера в 1949 году [13]. Идея этого метода состоит в том, чтобы вычислить значение энтропии для каждого класса разбиения-кандидата и выбрать подходящие границы для дискретизации. После этого энтропия примет больший интервал, охватывающий все значения признака, далее разбиваем этот интервал на меньшие подинтервалы, пока не будет выполнено конкретное правило

остановки [14]. В работе [15] показано, что средняя точка между каждой парой соседних значений рассматривается как возможная точка разделения [16]. Таким образом, определения дискретизации на основе энтропии включают следующие понятия:

Множество объектов D состоит из n классов (dx,d2,...,dn) с вероятностью

p1,p2,...,pn. Следовательно, энтропию D можно проиллюстрировать следующим образом:

n

Entropy (D) = -X pt log2 (pi).

i=1

Пусть атрибутX разбивает D на m непересекающихся множествD1,D2,...,Dm , таким образом, энтропия entropy (X, D) множества D, разделенная X, определяется следующим образом:

Entropy (X, D ) = -X—-Entropy (Di), i=1 D

где |Di | - количество кортежей в D. Точка отсечения атрибута X должна предоставлять значение атрибута, удовлетворяющее минимальным требованиям к ожидаемой информации. Политика выбора точки отсечения повторно используется в каждом разделе до тех пор, пока не будет выполнен критерий остановки.

Другая методика, основанная на энтропии, также применяется с условием, что ключевой целью анализа минимизации энтропии является определение количества информации в заданном наборе данных [17]. Энтропией распределения вероятностей является мера неопределенности распределения, основанная на определении энтропии, предложенном Кристенсеном Рональдом в 1980 году [18] для каждого значения x в области Х1 и x2.

Росс в 2000 году разработал метод определения интервалов для нечетких временных рядов методом минимизации энтропии (MEPA) [19]. Значения энтропии рассчитываются между каждыми двумя соседними данными во время t и t +1, чтобы получить минимальное значение точки разделения энтропии. Процесс начинается с выбора пороговой точки, то есть точки с наименьшей энтропией, первичного порога (PRI), затем данные разделяются на две противоположные части через энтропию, для этих частей повторяется описанный выше процесс, чтобы найти вторичные пороги (SEC1, SEC2), затем процесс повторяется, чтобы найти четыре третичных порога (TER1, TER2, TER3, TER4). Таким образом, универсальный дискурс U разбивается на семь неравных интервалов перекрытия, где u1 =[Dmin -D1,SEC1], u2 =[TER1, TER2], u3 =[SEC1,PRI],

u4 =[TER2, TER3], u5 =[PRI, SEC2], u6 =[TER3, TER4], u7 =[SEC2, Dmax + D2 ]. Тогда нечеткие множества будут представлены, как показано на рис. 1.

TERJ SEC1 TER2 PRI TER3 SEC2 TER4-Рис. 1. Нечеткие множества методом МЕРА [19]

Предположим, что пороговое значение определяется для выборки в диапазоне от x1 до x2. Уравнение энтропии с каждым значением x записывается для областей

[xj, x1 + x] и [x1 + x, x2 ], обозначает первую область обозначаем p, вторую - q. Энтропия с каждым значением x в области между x1 и x2 выражается как [18]:

298

S(x) = p(x)Sp (x) + q(x)Sq (x),

где

sp (x)= -[ p (x )ln P (x)+P2 (x )ln P2 (x)]; Sq (x) = -[qi (x)ln qi (x)+q2 (x)ln q2 (x)],

где pk (x) и qk (x) - условные вероятности того, что выборка класса k находится в области [ xi, xi + x ] и [ xi + x, x2 ] соответственно; p (x) + q ( x ) = i и p ( x) и q (x) - вероятности того, что все образцы находятся в области [ xi, xi + x] и [ xi + x, x2 ] соответственно.

По вопросу о выборе числа областей в работе [i9] показано, что в приложениях нечеткой логики часто используется нечетное количество функций принадлежности для разделения области, т.е. рекомендуется выделять пять или семь областей. В работе [20] предложено семь областей — это наилучшее число классификаций в функции кратковременной памяти человека. Однако, данное предположение еще не получило должного обоснования.

Метод на основе энтропии широко применяется в моделях прогнозирования нечетких временных рядов. Этот метод был впервые применен в работе [2i]. Исходные данные должны быть отнесены к классу. Из-за характера энтропии не существует конкретного правила для определения количества классов и характеристики классов данных, в то время как это во многом определяет результат. Наряду с этим, данный метод встречается и в других публикациях шаге дискретизации временного ряда [22-26].

f. Метод метаэвристической оптимизации. Алгоритм метаэвристической оптимизации является относительно новым подходом к решению задач в рассматриваемой области. К метаэвристическим методам оптимизации относятся: метод оптимизации роя частиц (PSO), генетический алгоритм (GA), оптимизация колонии муравьев (ACO) и др. В настоящее время они широко применяются в дискретизации модели прогнозирования нечетких временных рядов.

Метод оптимизации роя частиц (PSO). Наиболее широко применяемым методом в области данного исследования является метод оптимизации роя частиц, который был впервые применен в работе [27]. Отличительной особенностью эвристического алгоритма является то, что он одновременно исследует разные точки в разных областях пространства решений, чтобы найти глобальное оптимальное решение. Из-за этой особенности могут возникнуть локальные оптимальные ловушки.

Метод оптимизации PSO используется для оптимизации ценности (положения) особей Xi = (Xi Xi ... Xi ) в популяции, чтобы удовлетворить заданную целевую

i, ' 2 ' ' n-i

функцию f (X). Далее в каждом цикле iter значения экземпляра оптимизируются и изменяются по формуле:

VL+i = wVier + Ci^RAND(J(Plest - Xi) + C2□RAND(JXGbest - ^) X'ter+i = X^. + VU,

где PL = f (Xi ^ GbeSt = min(Pbestt )|N .

Большинство исследований сочетают метод PSO, используемый для оптимизации интервального деления нечетких временных рядов, с целевой функцией

M т-т

f (P) = min(MSE(Pi)) . Предположим, что количество сегментов временного ряда

i=i

предопределено с n сегментами в интервале [Dmin;Dmax]. Метод PSO используется для оптимизации отдельного местоположения pi = (р pi,...,pi ), при этом M |p!,р2,...,pMJ

, а каждый экземпляр представляет собой (n -1) размерный вектор, значение которого используется для деления интервалов данных. Затем для каждого набора (pip2,...,pi ) разбиваем данные на следующие интервалы:

(Dmin - K; p1 ), [Pi, р2), [р2, Рз ), . ., [рП-1,Dmax + L . Алгоритм представлен на рис. i.

299

Рис. 1. Алгоритм метода оптимизации роя частиц

Процедура завершается, когда превышено допустимое количество итераций Maxiter или ошибка MSE меньше допустимого значения ошибки.

При использования метода PSO применяют либо методы поддержки с оптимизацией количества интервалов для деления на входе осциллятора [ nmin, nmax ], либо метод

прогнозирования высокого порядка. Однако использование вышеперечисленных методов требует проведения трудоемких расчетов с использованием сложного программного обеспечения, а также большого времени на проведение моделирования для получения необходимых параметров.

В то время как метод оптимизации роя частиц использовался в работе [28] в модели прогнозирования нечетких временных рядов первого порядка, в работе [29] использовали данный метод в моделях высокого порядка. В работе [30] представлена модель NPSO — усовершенствованная гибридная модель прогноза, основанная на нечетких временных рядах и PSO, которые обладают большей эффективностью, чем HPSO [29]. Модель NPSO учитывает больше информации о каждом следующем состоянии нечетких отношений на основе новой предложенной схемы EBN, чем модель HPSO. Возможные приложения описаны в работах [31-36].

Генетический алгоритм (GA). Генетический метод разработан Холландом в 1960-1970-х годах, основан на популяционном подходе и широко применяется во многих типах задач оптимизации (стационарный или нестационарный (изменяется со временем), линейный или нелинейный, непрерывный, прерывистый или со случайным шумом) [37]. Холланд предложил концепцию генетических алгоритмов, которая включает в себя операции кроссовера, мутации и воспроизведения генетических алгоритмов, которые обобщены в работах [38-40]. Как метод оптимизации роя частиц, после определения целевой функции и критериев отбора хромосом генетический метод генерирует популяции особей, представленных векторами Xi = (Xi Xi ... Xi ). На каждой ите-

1, ' 2 ' ' и-1

рации метода выполняются основные операции кроссовера, мутации, воспроизведения, затем по целевой функции и критериям отбора выбрасывают особи с худшими показаниями. Популяция восстанавливается путем добавления новых особей, итерации повторяются до получения результатов по критерию останова. Генетический алгоритм представлен на рис. 2.

В концепции прогнозирования нечетких временных рядов генетический метод применяется многими авторами для улучшения качества результата прогноза [41]. Lee в своей работе предложил метод, построенный на двухфакторных нечетких логических отношениях высокого порядка, и использует генетические алгоритмы для регулировки длины каждого интервала [42]. Модифицированный генетический алгоритм (MGA) вносит свой вклад в этап фаззификации. В частности, эта модель направлена на проверку негативных эффектов операции мутации для получения более точных прогнозов [42].

Rezan Uslu использовал генетический алгоритм, чтобы избежать субъективных решений при определении длины интервалов. С помощью генетического алгоритма пространство поиска было дифференцировано [43], поскольку генетический алгоритм ищет решения не в одной точке, а во множестве точек.

Рис. 2. Генетический алгоритм (GA)

Авторы также используют другие методы метаэвристической оптимизации для дискретизации данных временных рядов. В работе [44] модель использует алгоритм оптимизации муравьиной колонии (ACO) для поиска наилучшего раздела для модели нечетких временных рядов высокого порядка. В работе [45] интегрирован алгоритм искусственной пчелиной колонии в искусственную нейронную сеть Pi-Sigma для модели прогнозирования нечетких временных рядов.

1. Сравнение методов. На основе анализа рассмотренных исследований можно провести сравнение методов с точки зрения преимуществ и недостатков в соответствии со следующей таблицей.

Таблица сравнения методов

Метод Достоинства Недостатки

Равная длина интервала - Простота - Правил сопоставления для всех входных данных не существует. - Длина интервалов выбирается равномерно и случайно. - Количество интервалов выбирается случайным образом.

Метод на основе среднего и метод на основе распределения - Простота - Существует правило сопоставления, которое определяет длину интервала для каждого из входных данных. - Количество интервалов определяется путем отбора. - Длина интервалов выбирается равномерно, не гибко.

Метод на основе отношений - Существует правило сопоставления, которое определяет длину интервала для каждого из входных данных. - Количество интервалов определяется путем отбора. - Длина интервалов выбирается равномерно, не гибко.

Метод нахождения экстремумов - Существует правило сопоставления, которое определяет длину интервала для каждого из входных данных. - Алгоритм использует функцию оптимизации результата. - Количество интервалов определяется путем отбора. - Длина интервалов выбирается равномерно, не гибко.

Метод на основе энтропии - Существует правило сопоставления, которое определяет длину интервала для каждого из входных данных. - Длина интервалов определяется по-разному. - Расчет достаточно сложен. - Первоначальная кластеризация приблизительная.

Методы метаэвристической оптимизации - Существует правило сопоставления, которое определяет длину интервала для каждого из входных данных. - Длина интервалов определяется по-разному. - Алгоритм использует функцию оптимизации результата. - Выполнение большого количества циклов. - Сложные расчеты.

Помимо вышеуказанных преимуществ и недостатков, которые оцениваются авторами, видно, что в настоящее время широко используются метаметоды, которые легко интегрируются и используются с интеллектуальными сетевыми моделями для уменьшения вычислительной сложности.

Заключения. В данной работе рассмотрены наиболее популярные методы, применяемые для дискретизации, которая в значительной степени влияет на результаты модели прогнозирования нечетких временных рядов. Проанализированы преимущества и недостатки рассмотренных методов: метод Сонга и Чиссома, метод на основе среднего, метод на основе распределения, метод на основе отношений, метод нахождения экстремумов, метод на основе энтропии, метод метаэвристические оптимизации (метод оптимизации роя частиц (PSO), генетический алгоритм (GA), метод оптимизации колонии муравьев (ACO). Показаны возможные приложения данных методов. Эта статья будет служить основой для будущих исследований в области выбора и разработки методов на этапе дискретизации для получения оптимальных результатов прогнозирования.

Список литературы

1. Song Q., Chissom B.S. Fuzzy time series and its models // Fuzzy Sets and Systems. 1993. Vol. 54. P. 269-277.

2. Song Q., Chissom B.S. Forecasting enrollments with fuzzy time series-Part I // Fuzzy Sets and Systems. 1993. Vol. 54. P. 1-9.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Song Q., Chissorn B.S. Forecasting enrollments with fuzzy time series-part II // Fuzzy Sets and Systems. 1994. Vol. 62. P. 1-8.

4. Chen S.-M. Fuzzy sets and systems Forecasting enrollments based on fuzzy time series // Fuzzy Sets and Systems. 1996. Vol. 81. P. 311-319.

5. Chen S.-M. Forecasting enrollments based on high-order fuzzy time series // An International Journal. 2002. Vol. 33. P. 1-16.

6. C.T. Lee, H.F.W. A method for fuzzy time series—An example for telecommunication demands // IFORS' 96, Canada. 1996.

7. Huarng K. Effective lengths of intervals to improve forecasting in fuzzy time series // Fuzzy Sets and Systems. 2001. Vol. 123. P. 387-394.

8. Huarng K., Yu T.H.K. Ratio-based lengths of intervals to improve fuzzy time series forecasting // IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics. 2006. Vol. 36. № 2. P. 328-340.

9. Yolcu U. et al. A new approach for determining the length of intervals for fuzzy time series // Applied Soft Computing Journal. 2009. Vol. 9. № 2. P. 647-651.

10. Kiefer J. Sequential Minimax Search for a Maximum // Source: Proceedings of the American Mathematical Society. 1953. Vol. 4. № 3. P. 502-506.

11. Egrioglu E. et al. A new approach based on the optimization of the length of intervals in fuzzy time series // Journal of Intelligent and Fuzzy Systems. 2009. Vol. 22. № 1. P. 15-19.

12. Egrioglu E. et al. Finding an optimal interval length in high order fuzzy time series // Expert Syst Appl. 2010. Vol. 37. № 7. P. 5052-5055.

13. Krippendorff K. Mathematical Theory of Communication. Sage, 2009. P. 614618.

14. Pal N.R., Pal S.K. Entropy: A New Definition and its Applications. Vol. 21.

№ 5.

15. Han J., Kamber M., Pei J. Data Mining. Concepts and Techniques, 3rd Edition (The Morgan Kaufmann Series in Data Management Systems). 2011.

16. Le D.D., Satoh S. Ent-Boost: Boosting using entropy measures for robust object detection // Pattern Recognit Lett. 2007. Vol. 28. № 9. P. 1083-1090.

17. Yager Dimita R.R., Filev P. Template-based fuzzy systems modeling. 1994.

18. Christensen R. Entropy minimax multivariate statistical modeling—I: Theory // Int J Gen Syst. 1985. Vol. 11. № 3. P. 231-277.

19. Ross T.J. Fuzzy logic with engineering applications. John Wiley, 2010. 585 p.

20. Miller G.A. The psychological review the magical number seven, plus or minus two: some limits on our capacity for processing information 1. 1956.

21. Cheng C.H., Chang J.R., Yeh C.A. Entropy-based and trapezoid fuzzification-based fuzzy time series approaches for forecasting IT project cost // Technol Forecast Soc Change. 2006. Vol. 73. № 5. P. 524-542.

22. Chen B.-T., Chen M.-Y., Chiang H.-S., Chen C.-C. Forecasting Stock Price Based on Fuzzy Time-Series with Entropy-Based Discretization Partitioning // LNAI. 2011. Vol. 6882. P. 382-391.

23. Chen M.Y., Chen B.T. Online fuzzy time series analysis based on entropy discretization and a Fast Fourier Transform // Applied Soft Computing Journal. 2014. Vol. 14. № PART B. P. 156-166.

24. Chen M.Y., Chen B.T. A hybrid fuzzy time series model based on granular computing for stock price forecasting // Inf Sci (N Y). Elsevier Inc., 2015. Vol. 294. P. 227241.

25. Zhou R., Yang Z., Yu M., Ralescu D.A. A portfolio optimization model based on information entropy and fuzzy time series // Fuzzy Optimization and Decision Making. Springer New York LLC, 2015. Vol. 14. № 4. P. 381-397.

26. Zhang C., Ma C., Song D., Tian W. An Entropy-based Fuzzy Time Series Method for Forecasting Airport Passenger Throughput. 2007.

27. Kennedy J., Eberhart R. Particle Swarm Optimization / ed. Neural Networks. IEEE Int. Conf., 1995. P. 1942-1948.

28. North American Fuzzy Information Processing Society. Annual Meeting (28th : 2009 : Cincinnati, O., North American Fuzzy Information Processing Society. Fuzzy Information Processing Society, 2009, NAFIPS 2009, Annual Meeting of the North American. IEEE, 2009.

29. Kuo I.H. et al. An improved method for forecasting enrollments based on fuzzy time series and particle swarm optimization // Expert Syst Appl. Elsevier Ltd, 2009. Vol. 36. № 3 PART 2. P. 6108-6117.

30. Kuo I.H. et al. Forecasting TAIFEX based on fuzzy time series and particle swarm optimization // Expert Syst Appl. 2010. Vol. 37. № 2. P. 1494-1502.

31. Egrioglu E. PSO-based high order time invariant fuzzy time series method: Application to stock exchange data // Econ Model. Elsevier B.V., 2014. Vol. 38. P. 633639.

32. Cheng S.H., Chen S.M., Jian W.S. Fuzzy time series forecasting based on fuzzy logical relationships and similarity measures // Inf Sci (N Y). Elsevier Inc., 2016. Vol. 327. P. 272-287.

33. Tinh N. Van, Dieu N.C. A new hybrid fuzzy time series forecasting model based on combining fuzzy c-means clustering and particle swam optimization // Journal of Computer Science and Cybernetics. Publishing House for Science and Technology, Vietnam Academy of Science and Technology, 2019. Vol. 35. № 3. P. 267-292.

34. Van Tinh N. Forecasting of COVID-19 Confirmed Cases in Vietnam Using Fuzzy Time Series Model Combined with Particle Swarm Optimization // Computational Research Progress in Applied Science & Engineering CRPASE. 2020. Vol. 06. № 02. P. 114120.

35. Chen S.M., Zou X.Y., Gunawan G.C. Fuzzy time series forecasting based on proportions of intervals and particle swarm optimization techniques // Inf Sci (N Y). Elsevier Inc., 2019. Vol. 500. P. 127-139.

36. Cagcag Yolcu O., Alpaslan F. Prediction of TAIEX based on hybrid fuzzy time series model with single optimization process // Applied Soft Computing Journal. Elsevier Ltd, 2018. Vol. 66. P. 18-33.

37. John H. Holland. Adaptation in Natural and Artificial Systems / ed. An Introductory Analysis with Applications to Biology C. and A.I. Cambridge: The MIT Press, 1975.

38. Goldberg D.E. Genetic algorithm in search, optimization, and. 1989.

39. Goldberg D.E., Korb B., Deb K. M essy Genetic Algorithms: Motivation, Analysis, and First Results // Complex Systems. 1989. Vol. 3. P. 493-530.

40. Alhijawi B., Awajan A. Genetic algorithms: theory, genetic operators, solutions, and applications // Evolutionary Intelligence. Springer Science and Business Media Deutschland GmbH, 2023.

41. Chen S.M., Chung N.Y. Forecasting enrollments using high-order fuzzy time series and genetic algorithms // International Journal of Intelligent Systems. 2006. Vol. 21. № 5. P. 485-501.

42. Bas E., Uslu V.R., Yolcu U., Egrioglu E. A modified genetic algorithm for forecasting fuzzy time series // Applied Intelligence. Kluwer Academic Publishers, 2014. Vol. 41. № 2. P. 453-463.

43. Rezan Uslu V., Bas E., Yolcu U., Egrioglu E. A fuzzy time series approach based on weights determined by the number of recurrences of fuzzy relations // Swarm Evol Comput. Elsevier B.V., 2014. Vol. 15. P. 19-26.

44. Cai Q., Zhang D., Zheng W., Leung S.C.H. A new fuzzy time series forecasting model combined with ant colony optimization and auto-regression // Knowl Based Syst. Elsevier B.V., 2015. Vol. 74. P. 61-68.

45. Egrioglu E., Yolcu U., Bas E. Intuitionistic high-order fuzzy time series forecasting method based on pi-sigma artificial neural networks trained by artificial bee colony // Granular Computing. Springer Nature, 2019. Vol. 4. № 4. P. 639-654.

Нгуен Тхи Тху Зунг, аспирантка, thuduns.mta.tb@smail.com, Россия, Санкт-Петербург, Санкт-Петербургский Политехнический университет Петра Великого,

Черненькая Людмила Васильевна, д-р техн. наук, профессор, ludmila@qmd.spbstu.ru, Россия, Санкт-Петербург, Санкт-Петербургский Политехнический университет Петра Великого

FACTOR ANALYSIS MODEL BASED ON FUZZY C-MEANS CLUSTERING Nguyen Thi ThuDung, L.V. Chernenkaya

Fuzzy time series forecasting models are increasingly being developed and applied in practice. The improvement of fuzzy time series forecasting models is mainly done by optimizing each part of the model, and the first part is also a step that is very important for the results of the fuzzy time series forecasting model, which is the time series discretization step. This article will describe, evaluate and compare the methods used for the discretization step of fuzzy time series. This paper will provide an overview of improvements to the model sampling rate as a prerequisite for other developments in the future.

Key words: discretization methods, comparison of fuzzy time series discretization methods, ratio-based discretization, entropy-based discretization, metaheuristic optimization method.

Nguyen Thi Thu Dung, postgraduate, thudung.mta. tb@,gmail. com, Russia, St. Petersburg, Peter the Great St. Petersburg Polytechnic University,

Chernenkaya Liudmila Vasilevna, doctor of technical sciences, professor, ludmila@qmd.spbstu.ru, Russia, St. Petersburg, Peter the Great St. Petersburg Polytechnic University

i Надоели баннеры? Вы всегда можете отключить рекламу.