Научная статья на тему 'Повышение достоверности обработки данных на основе нечеткой модели идентификации случайных временных процессов'

Повышение достоверности обработки данных на основе нечеткой модели идентификации случайных временных процессов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
156
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ / ОБРАБОТКА ДАННЫХ / DATA PROCESSING / СЛУЧАЙНЫЙ ВРЕМЕННОЙ ПРОЦЕСС / CASUAL TEMPORARY PROCESS / СВОЙСТВО НЕСТАЦИОНАРНОСТИ / PROPERTY OF NON-STATIONARITY / ИДЕНТИФИКАЦИЯ / IDENTIFICATION / ДОСТОВЕРНОСТЬ / RELIABILITY / INTELLECTUAL ANALYSIS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Жуманов Исраил Ибрагимович, Бекмуродов Зохид Талибович, Каюмова Нафиса Мухиддиновна

Сформулирована задача и разработаны методические основы построения систем интеллектуального анализа данных на основе гибридной модели идентификации для повышения достоверности прогноза случайных временных процессов. Предложены подходы к построению новых механизмов оптимизации обработки данных на основе нечетких моделей на основе выявления свойств нестационарности случайных временных процессов и синтеза статистических и динамических моделей идентификации. Разработаны принципы, методы и алгоритмы идентификации на основе комбинирования возможностей нечетких множеств, нечеткой логики и нейронной сети. Достоверность разработанной методики подтверждена результатами экспериментальных исследований.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Жуманов Исраил Ибрагимович, Бекмуродов Зохид Талибович, Каюмова Нафиса Мухиддиновна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Повышение достоверности обработки данных на основе нечеткой модели идентификации случайных временных процессов»

ТЕХНИЧЕСКИЕ НАУКИ

ПОВЫШЕНИЕ ДОСТОВЕРНОСТИ ОБРАБОТКИ ДАННЫХ НА ОСНОВЕ НЕЧЕТКОЙ МОДЕЛИ ИДЕНТИФИКАЦИИ СЛУЧАЙНЫХ ВРЕМЕННЫХ ПРОЦЕССОВ Жуманов И.И.1, Бекмуродов З.Т.2, Каюмова Н.М.3 Email: Jumanov1144@scientifictext.ru

1Жуманов Исраил Ибрагимович - доктор технических наук, профессор; 2Бекмуродов Зохид Талибович - ассистент; 3Каюмова Нафиса Мухиддиновна - магистрант,

кафедра информационных технологий, Самаркандский государственный университет, г. Самарканд, Республика Узбекистан

Аннотация: сформулирована задача и разработаны методические основы построения систем интеллектуального анализа данных на основе гибридной модели идентификации для повышения достоверности прогноза случайных временных процессов. Предложены подходы к построению новых механизмов оптимизации обработки данных на основе нечетких моделей на основе выявления свойств нестационарности случайных временных процессов и синтеза статистических и динамических моделей идентификации. Разработаны принципы, методы и алгоритмы идентификации на основе комбинирования возможностей нечетких множеств, нечеткой логики и нейронной сети. Достоверность разработанной методики подтверждена результатами экспериментальных исследований.

Ключевые слова: интеллектуальный анализ, обработка данных, случайный временной процесс, свойство нестационарности, идентификация, достоверность.

INCREASE OF DATA PROCEEDING RELIBILITY ON THE BASIS OF FUZZY MODEL OF RANDOM TIME PROCESSES IDENTIFICATION

1 2 3

Jumanov I.I.1, Bekmurodov Z.T.2, Kayumova N.M.3

Jumanov Israil Ibragimovich - Doctor of Science, Professor; 2Bekmurodov Zokhid Talibovich - Assistant; 3Kayumova Nafisa Mukhiddinovna - Undergraduate, DEPARTMENT OF INFORMATION TECHNOLOGIES, SAMARKAND STATE UNIVERSITY, SAMARKAND, REPUBLIC OF UZBEKISTAN

Abstract: the task is formulated and methodical bases are developed to construct the systems of data intellectual analysis on the basis of identification by hybrid model for increase of random time processes forecast reliability. Approaches are proposed to constructing the new mechanisms for optimizing data processing on the basis of fuzzy models on the basis of identifying the nonstationary properties of random time processes and synthesis of statistical and dynamic identification models. The principles, methods and algorithms of identification based on combining the capabilities of fuzzy sets, fuzzy logic and a neural network are developed. The reliability of the developed technique is confirmed by results of experimental researches.

Keywords: intellectual analysis, data processing, casual temporary process, property of non-stationarity, identification, reliability.

УДК 658.512.011

Постановка задачи. Необходимость развития существующих технологий анализа случайных временных процессов (СВП) объясняется ограниченными возможностями традиционных подходов, основанных на методах авторегрессии, спектральных преобразований, экспоненциального сглаживания и других технологий [1].

Настоящая статья посвящена разработке методических основ создания методов интеллектуального анализа данных (ИАД) по результатам исследования внутренней структуры СВП, представленной в виде совокупности отношений между интервально -временными признаками, описывающими процесс, а также построению нечеткой математической модели идентификации СВП.

Концептуальным подходом к построению новых механизмов оптимизации обработки данных на основе нечетких моделей служит выявление свойства нестационарности СВП, а также синтез статистических и динамических моделей идентификации [2, 3].

Особенности и принципы проектирования методов ИАД на основе нечетких моделей и нечеткой логики. Важной особенностью подхода по применению нечетких моделей для повышения достоверности обработки данных нестационарных объектов является выполнение функций синтеза количественного и качественного моделирования с целью оптимизации описания объекта, анализа и обработки информации. При этом алгоритм нечеткой логики становится качественным индикатором анализируемого временного ряда, что дает возможность формирования лингвистических входных и выходных переменных, фазификации, генерации правил выводов и механизмов использования свойства нестационарности СВП, а также контроля достоверности обработки данных. Наиболее ценным свойством нечетких моделей является еще способность успешно решать задачи при сложных аналитических зависимостях между входными и выходным параметрами; проектировать оптимальные аппроксиматоры временных рядов; строить адекватные модели в многомерных пространствах, включая пространства смешанного типа, в которых часть переменных являются непрерывными, а часть - дискретными [2].

Принцип применения статистических и динамических подходов к идентификации СВП заключаются в следующем. При идентификации СВП задается Т = ,Х2,.../„] -дискретная временная шкала в виде упорядоченной последовательности числовых значений 5(Х ) = (X(Х),X(Х),...,X(Х)) и формализуются процедуры, позволяющие по прошлым

значениям ряда аппроксимировать его значения для произвольного момента времени ? с заданной точностью. В качестве идентификаторов СВП могут быть использованы методы авторегрессии, фильтры со ступенчатой, полиномиальной, параболической и кубической функциями. Пусть идентификатор СВП представляется дифференциальным уравнением

ао ёпх а ёп—1 х а ёх

+--Ц--т +... + ——--+ х = ау. (1)

п—1 11 п—1 1. ' 4 '

( лп ю^1 ёГ1 ( Ж

где х - величина на входе фильтра; у - величина на выходе фильтра.

ё

Тогда уравнение (1) с помощью оператора р = — запишется в виде

Ж

(1 + а-п—1 р + а-п—2 р2 +...+ рп)х = ау. (2) ( ( ( Оператор дифференцирования р связан с оператором функции разности - А следующей зависимостью:

Л ~ Лк -1 2 п

1 Л 1 / ч\к+1 Л гг 2п

Р > * = 2 (-1Г1—- , при Т =-, (3)

Т к=1 к пю

где П - число отсчетов на период Т ; Т - шаг дискретизации.

Ограничивая число членов в сумме (3), получим разностное уравнение с постоянными коэффициентами, порядок которого будет определяться числом взятых членов. Если в

уравнении (2) ограничиться разностями порядка N, то разностное уравнение примет вид

Ъ^ Л"х[пТ ] + Ъ^Л^1 х[пТ ] +... + Ъ^х[пТ ] = ау[пТ ]. (4)

Коэффициенты Ъ. этого уравнения связаны с коэффициентами уравнения (2). Заменяя в уравнении (4) разности функции х(г) их значениями получаем соотношение, связывающее N значений функции от х[пТ] до х[(п + №)Т]

Лх[пТ] = 2(-1)ус!ух[пТ + ( 1 - у)Т], ( I = 1,N), (5)

у=0

где х[пТ ] - значения величины в моменты времени, а 1 = 1,2,...,N. Таким образом, изложенный в качестве примера широко распространенный статистический подход приводит к созданию трудоемких алгоритмов идентификации, асимптотические оценки сложности которых напрямую зависят от объема данных СВП -

N, интервала дискретизации - T и шага экстраполяции - Т.

Для совершенствования и развития статистического подхода предлагается метод представления СВП на основе нечетких множеств, модель которого не зависит от размеров ретроспективных данных и обладает способностью настройки переменных T и Т.

Идентификация СВП на основе нечетких моделей. Для реализации подхода дискретное нечеткое множество, определенное на универсуме и, задается в виде [3]

л = /л(и1)/и1 + /л (и2)/и2 +... + /л(ип)/ип > (6) где /л (и) : и ^ [0,1] - функция принадлежности (ФП) нечеткого множества;

/л (иг ) - степень принадлежности элемента ВР иг е Л, г = 1, п ; Представим нечеткие данные 1 -го и (1 +1) -го периодов, как нечеткие множества лу и л^ на универсуме и . Нечеткая логическая зависимость представляется в виде: л у ^ лк, где л у - текущее состояние, а лк - следующее состояние нечеткой зависимости. Для

реальных значений ВР / (г) = Т, 1= 1,2,... на универсуме и приращения представляются в виде

и = -Дь А^ + В2\, ( Д^ = ШШ(Д0 - /($-1)) , Дшх = Шах(/(г) - /($ -1)) );

г г

где АШ[П и Ашах - минимальное и максимальное приращения значений фактора; А1 и А2 - два действительных числа, обеспечивающие разбиение универсума и на п интервалов равной длины: , и2,..., ип.

Лингвистические термы лг (г = 1, п) нечетких множеств представляются в виде

A1 = 1/u1 + 0,5/u2 + 0/u3 +... + 0/un _1 + 0/un; A2 = 0,5/m1 +1/u2 + 0,5/u3 + 0/u4 +... + 0/ми.

Ап = 0/ и + 0/ +... + 0/ ип _ 2 + 0,5/ ип +1/ ип. Искомое значение идентифицируемой величины находится как сумма реального значения временного ряда фактора Т для I -го периода и дефаззифицированного значения

элемента ВР у1+1, т.е.:

Ъ+1 = Т + у+1. (8)

Реальное значение приращения ВР для (/ +1) -го периода находится по методу центра тяжести для одноточечных множеств:

n n

У+1 = Z wr ■ zr / Z wr ' (9)

r=1 r=1

где n -количество интервалов ur (r = 1, n); zr - средняя точка r -го интервала;

wr - значение степени принадлежности для r -го интервала результирующего элемента. Особенность метода нечеткой идентификации заключается в определении значения критерия оценки достоверности либо точности обработки данных в виде средней относительной ошибки

m

AFer = (100/m)Z|(Fi _Tt)/Tt\, (10)

i=1

где Fi и Ti - идентифицированное и реальное значения для i -го периода; m - количество периодов.

Список литературы /References

1. Минаев Ю.Н., Филимонова О.Ю., Лиес Б. Методы и алгоритмы решения задач идентификации и прогнозирования в условиях неопределенности в нейросетевом логическом базисе. М.: Горячая линия - Телеком, 2003. С. 120-135.

2. Борисов В.В., Круглое В.В., Федулов А.С. Нечеткие модели и сети. М.: Горячая линия -Телеком, 2007. С. 27-54.

3. Ярушкина Н.Г. Основы теории нечетких и гибридных систем: Учебное пособие. М.: Финансы и статистика, 2004. С. 34-78.

i Надоели баннеры? Вы всегда можете отключить рекламу.