Научная статья на тему 'Принятие проектных решений на основе анализа нечетких тенденций временных рядов'

Принятие проектных решений на основе анализа нечетких тенденций временных рядов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
114
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Принятие проектных решений на основе анализа нечетких тенденций временных рядов»

Здесь Ехрэ(е) - подвыражения е. Таким образом, для выражения, которое не является условным или применением функции, просто берется конъюнкция утверждений корректности его подвыражений.

И, наконец, выражению, представляющему собой просто переменную х, функция Т ставит в соответствие переменную-высказывание Сх. На ее место в дальнейшем будет подставлено утверждение корректности выражения, передаваемого функции на месте параметра х: Т({х}) = Сх.

Такого тривиального определения функции Т для нескольких видов выражений оказывается достаточно для того, чтобы получать существенно более слабые утверждения корректности во многих случаях. Данная техника может применяться к выражениям произвольной вложенности, в том числе к многократно вложенным условным выражениям. В этом случае шаблон высказывания будет включать вложенные импликации.

При решении задачи определения корректности программы с точки зрения правильности ис-

пользования определенных функций можно получать различные утверждения логики. Все они будут верными в том смысле, что их истинность соответствует корректности программы. Однако при тривиальном подходе получаемые утверждения в большинстве случаев слишком сильны. Следовательно, во-первых, их сложнее доказывать и, во-вторых, большее множество программ будет признано некорректными. Предложенная методика позволяет получать более слабые утверждения корректности программ. Таким образом, корректность становится легче доказуемой, и множество доказуемо корректных программ лучше аппроксимирует множество действительно корректных.

Список литературы

1. Peyton Jones S. и др. Report on the programming language Haskell 98, a non-strict, purely functional language, http://haskell.org, 1999.

2. Augustsson L. Compiling lazy functional languages, part II, Chalmers University, 1987.

3. Ennals R., Peyton Jones S. Optimistic evaluation: an adaptive evaluation strategy for non-strict programs, International Conference on Functional Programming, 2003.

ПРИНЯТИЕ ПРОЕКТНЫХ РЕШЕНИИ НА ОСНОВЕ АНАЛИЗА НЕЧЕТКИХ ТЕНДЕНЦИЙ ВРЕМЕННЫХ РЯДОВ

А.А. Стецко, к.т.н. (НПО «Марс», г. Ульяновск)

Сложные технические системы, такие как вычислительные сети, обладают объективной неопределенностью, что требует дальнейшего расширения инструментария прогностики. Все чаще используются интеллектуальные методы, которые расширяют классическую классификацию прогностических методов и представляют собой сочетание формализованных процедур обработки информации, полученной по оценкам специалистов-экспертов. Исследования данных и методов анализа в последние десятилетия оформились в виде отдельного направления, называемого TimesSeries Data Mining. В работах ряда зарубежных и российских ученых [1, 7-10] исследованы методы нечеткой регрессии, анализа данных нечетких временных рядов (НВР).

Нечеткое преобразование (F-преобразование) - методика, разработанная И. Перфильевой [4], которая может быть отнесена к методикам нечеткого приближения. Нечеткое преобразование позволяет провести фильтрацию исходного временного ряда (ВР) и выделить тренд. Если полученный в результате F-преобразования тренд разложить на нечеткие тенденции (НТ) методом скользящего окна, то полученный итог позволяет

принять управленческое или проектное решение на основе знаний о значимости тенденций.

В данной статье предложен гибридный метод, сочетающий F-преобразования и НТ для принятия решений, и его применение для задач анализа эффективности эксплуатации информационных систем на основе исходных данных системных журналов.

Основные определения анализа НВР. Для

описания развития моделируемого процесса в лингвистических терминах введем понятие временного ряда нечетких тенденций (ВРНТ). Выделим базовые операции обработки НТ.

Определение 1. НТ. Пусть yд= {y 1v..,ym} -

НВР лингвистической переменной (Y ,Ty,Uy,

GyMy), Уд = {y д} - множество НВР одинаковой

длины. Тогда НТ т, определенная на Уд, есть совокупность упорядоченных пар T={yд (yд)}, где цт (yд) представляет собой степень принадлежности y д к НТ.

Если говорить о тенденции как лингвистической переменной, терм-множеством которой явля-

ется множество различных тенденций, наблюдаемых на ВР, а универсумом - множество всевозможных функций, НТ определяется как

(т,{т'},Уд ,Gт ,M,;), i=1..p, где p - количество видов НТ, определенных на ВР; Уд - множество НВР переменной длины.

Определяя НТ на всех интервалах [t-m+1, t] ВР и позиционируя начало или окончание интервала к временной шкале, получим ВРНТ.

Определение 2. ВРНТ. Пусть {yAt} - множество НВР длиной m, где y^ ={yt_m+1>».,yt}, У t eY ■ Тогда ВРНТ есть упорядоченное во времени нечеткое множество: Tt = {t,^(yAt)}.

Для лингвистической переменной тенденция ВР определяется совокупностью значений всех видов НТ: Tt = {t,Tl,...,TP}.

Делая предположение о развитии системы как результата предыдущих состояний, предполагаем наличие зависимости НТ от значений тенденций в предыдущие временные промежутки.

Модель НТ (МНТ). Моделью НТ с характеризующими параметрами (n,p,m,l) обозначим совокупность компонент и уравнений:

у t = Fuzzy[yt], y't = deFuzzy[y't],

it = Tend[y t_m. +i,...,y t]L

y't = deTend[Xt,...,Xt+m_i],

Tt = f(xt_1,...xt_,), i=1..n, j=1..p , m=max(mj),

где уt = {уt} - НВР; n - количество термов НВР; Fuzzy - функционал фаззификации; Tt = {Tj} -ВРНТ; p - количество термов НТ, mj - интервал определения НТ; Tend - функционал распознавания НТ; f - функциональная зависимость; l - временной лаг; y't = {y't} - НВР, полученный из ВРНТ; deTend - функционал получения НВР из оценки НТ; y't - дефаззифицированный ВР, de-Fuzzy - функционал получения четкого ВР из НВР.

В результате экспертного построения НТ могут возникнуть отклонения между исходным ВР и смоделированным. Обозначим данные отклонения как ошибки построения.

_ Ошибка построения НВР:

Енвр = (yt_deFuzzy(Fuzzy(yt)))2 =(yt _y')2.

_ Ошибка построения ВРНТ: Ент = (yt _deTend(Tend(yt )))2=(yt _y't )2.

_ Ошибка построения ВР: Евр = (yt _ deFuzzy(deTend(Tend(Fuzzy(yt)))))2 =

=(yt _ y' )2.

Так, выбор функций принадлежности и ее параметров, метода дефаззификации определяет разницу между исходным ВР и преобразованным

из НВР. Выбор видов тенденций и методов обусловливает несоответствие исходного нечеткого ряда к полученному НВР из ВРНТ.

МНТ можно привести к разностному уравнению четкого ВР:

Т, = ^(Т,-а У, = ^ (у,+ш-а-1 ) .

Особенности процесса распознавания НТ.

Построение модели ВР - это итеративный процесс идентификации, оценки и проверки модели. Идентификация МНТ заключается в описании нечетких переменных и построении соответствующих функционалов. На этапе оценки для модели выбирается инструмент нахождения функциональной зависимости и оцениваются параметры выбранной функции по обучающей выборке. При диагностике проверяется способность модели к аппроксимации и экстраполяции.

Опишем НТ в виде последовательности нечетких меток, формирующих правила распознавания, что позволит одновременно описать и дать формулу расчета степени принадлежности четкого ряда к тенденции. Совокупность всех правил определения видов НТ составляет первый уровень общей системы логического вывода МНТ, которая реализует функционал Те^ для получения ВРНТ (в формализованном виде):

Ш)

к^т,=-к=встсу а-)к)))}. ) к=1

Множество правил уравнения МНТ составляет второй уровень вывода:

Н2:т, ={т| = в(Т С<'кш))}. ) к=1

Для анализа и построения четкого ВР по нечеткой модели (функционал deTend) каждому виду НТ сопоставим НВР, имеющий наибольшую степень принадлежности. Множество таких правил, реализующее функционал преобразования ВРНТ в НВР deTend, формирует третий уровень:

ь Р ш,

Кз:у, = {ук = в <+н)}.

,=1 )=1, Ь(1,))=к

Таким образом, МНТ полностью реализуется многоуровневой системой логических отношений: К1 ^ К2 ^ К3, где выходы в виде нечетких переменных одного набора правил подаются на входы следующего набора правил без дефаззификации и фаззификации. Преобразования в нечеткие и четкие значения происходят только в отношениях К1 и соответственно.

Использование нечеткой нейронной сети (ННС) для распознавания НТ. В качестве инструмента построения функциональной зависимости (уровень К2) в виде нечетких отношений воспользуемся аппаратом ННС. Для этого введем классические нечеткие нейроны, в которых операции сложения и умножения заменяются триангуляр-ными нормами:

И-нейрон Р=Т^Сх^^^Сх^з)): импликация предпосылок правила;

ИЛИ-нейрон ф= 8(Т(Р1Гг1),Т(Р2Гг2)): агрегация правил.

Интерпретация ННС в лингвистической форме приводит к записям:

если (х1 или w1) и (х2 или W2), то Р,

если (Р1 и z1) или (р2 и /2), то ф.

Веса w и z можно рассматривать как степени влияния соответствующего входа на выход.

На основе таких нейронов можно построить сеть логического вывода по Мамдани для нахождения НТ, добавив в К2 весовые коэффициенты. Каждому виду НТ соответствует своя сеть. ННС состоит из двух слоев (если считать за слой нейроны): слой конъюнкции нечетких входов и слой дизъюнкции правил. Формализованно такую сеть можно выразить следующим образом:

г р I

т'= 8[Т(Рj, Рj = Т[Т[8(х;_к^)]],

j=1 1=1 к=1

где Т' - значение, рассчитанное для некоторого вида тенденции Т ; Т - оператор конъюнкции; 8 -оператор дизъюнкции; г - количество правил; I, р - параметры МНТ. Основная идея обучения ННС состоит в итерационной процедуре оптимизации весов ^^¿к) и устранении незначимых связей (сокращении сети), в результате которого формируется необходимый состав и количество правил.

Преобразование. Нечеткое преобразование (Б-преобразование) - методика, которая работает с непрерывной функцией f, определенной на интервале действительных чисел w=[иь,ик]с Я [4]. Б-преобразование может быть использовано, помимо остальных случаев, для приближения f с достаточной точностью и для фильтрации ее возможного шума.

Предположим, что функция f известна в точках р1Г..,рк ew. Мы делим интервал w на множество равноудаленных узлов хк =иь + Ь(к_1),

k=1,...,n, где N > n, h=

n-1

фиксированной

длины. Б-преобразование имеет две фазы.

Прямое Г-преобразование. Определим п базисных функций А1 ,...,Ап, которые покрывают w, и разделим его на п неясных областей. Базисная функция должна удовлетворять следующим условиям (к=1,...,п):

1) А^ ^[0,1],Ак(хк)=1,

2) Ак(х)=0 хй (хк_1,хк+1), где мы формально полагаем х0 = х1 =иь ,хп+1 = хп =иК,

3) Ак(х) непрерывна,

4) Ак(х) монотонно возрастает на [хк-1,хк ] и монотонно убывает на [хк,хк+1],

5) 2к=1Ак(х)=1 для всех xew . Используя базисные функции, мы преобразуем данную функцию f в кортеж из п действительных чисел [Г1,...,Гп ], определенных

2 Л1^)Ак(^)

F,

k ZNiAk(Pj)

k=1,...,n.

Обратное F-преобразование. Результатом прямого F-преобразования является вектор из чисел [F1,...,Fn ]. Это множество содержит информацию об оригинальной функции f и может быть использовано, чтобы получить функцию

n

fF,n(x) = SFk ■ Ak(x).

k=1

Можно доказать, что если n возрастает, тогда fF,n(Pj) сходится к f(Pj), j=1,...,N. Ясно, что

функция fF,n непрерывна.

F-преобразование имеет (кроме прочих) следующие свойства, важные для использования в этой статье:

a) у него прекрасные фильтрующие свойства;

b) его легко вычислять;

c) F-преобразование стабильно относительно выбора точек P1 ,...,PN . Это означает, что при выборе других точек Pk (и, возможно, при изменении их числа N) результирующая функция fF,n

значительно не меняется. Отметим, что это неверно для многих классических численных методов.

Результаты анализа НВР на основе МНТ на примере системных журналов информационной системы. По МНТ проанализирована работа одного из узлов вычислительной сети Ульяновского государственного технического университета и создана модель узла, генерирующая нагрузку сетевого интерфейса в зависимости от параметров работы пользователей, программного обеспечения и оборудования. Узлом является сервер под ОС Microsoft Windows 2003, выполняющий приложения в терминальном режиме. Основное пользовательское приложение: базы данных «1С: Предприятие», работающее в файл-серверном режиме, где данные расположены на этом же сервере. Для описания сервера были выбраны данные из журнала событий прикладного ПО и журнала счетчиков ОС (см. табл.). Статистика собрана с 15-се-кундным интервалом в течение одного дня.

Для всех параметров установлены нечеткие переменные НВР, описывающие значения: высокое, низкое. Установлены НТ независимых параметров: загрузка, простой. Для трафика определены НТ: рост, падение, простой, скачок. Для построения модели работы узла ВС были проведены эксперименты. Анализировались модели МНТ от самого простого случая (МНТ(п,р,1,/) до моделей, включающих в себя как НВР, так и ВРНТ (МНТ(п,5,3,/ ).

UR UL

Описание переменных

Параметр Описание

Память/Обмен страниц в сек. Число страниц (из оперативной памяти), прочитанных с диска или записанных на диск

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Обращений записи на диск/сек. Частота выполнения операций записи на физический диск

Обращений чтения с диска/сек. Частота выполнения операций чтения с физического диска

% загруженности процессора Время, которое процессор тратит на обработку всех потоков команд

Операции чтения Количество объектов, открытых для просмотра в ПО «1С: Предприятие»; определяется из логов всех баз данных установленных на сервере

Операции записи Количество объектов, записанных в ПО «1С: Предприятие»; определяется из логов всех баз данных, установленных на сервере

Трафик Количество байтов, которое сервер послал или получил через сеть

II f ill ........

1 Ii Iii

1

111 4141 V TV 1

Моделирование трафика сервера при разных видах работ

На первом этапе рассматривались модели: зависимость НВР от НВР и ВРНТ независимых переменных; зависимость НВР от НВР зависимой переменной, НВР и ВРНТ независимых переменных; зависимость НТ от НВР и ВРНТ независимых переменных. На втором этапе по наилучшим моделям составлены гибридные модели, рассмотрены линейные модели ВР с распределенным лагом (DL), с авторегрессионной составляющей (ADL) и нелинейные модели на НС, полученные в программах Statistica 6.0 и Statistica Neural Networks.

Для моделирования объема трафика сервера экспертом были предложены и описаны следующие режимы работы сервера: ввод данных, чтение данных, формирование отчетов с высокими значениями тенденций параметров Xi-X6. По НТ спрогнозированы низкие и высокие значения трафика, а также его четкие значения при различных режимах работы (см. рис.).

Таким образом, эксперименты показывают, что модели с использованием интегрального метода F-преобразований и НТ результативны для анализа; предложенная ННС позволяет аппроксимировать сложные функциональные зависимости; построенная модель позволяет моделировать работу узла ВС и интегрировать ее в общую систему моделирования ВС.

Список литературы

1. Tanaka H., Uejima S., Asai K. Linear regression analysis with fuzzy model, IEEE Trans. Systems Man Cybernet. 12, 1982, 903-907.

2. Kacprzyk J., Wilbik A. and Zadrozny S. Linguistic summarization of time series by using the Choquet integral. // IFSA'07 Theoretical Advances and Applications of Fuzzy Logic.

3. Pedrycz W., Smith M.H. Granular correlation analysis in data mining, Proc. IEEE Int. Fuzzy Systems Conf., Korea, 1999, III-1235 - IH-1240.

4. I. Perfilieva, Fuzzy transform, in: D. Dubois et al. (Eds.), Rough and Fuzzy Reasoning: Rough versus Fuzzy and Rough and Fuzzy, Springer-Verlag, Heidelberg, 2004, pp. 63-81.

5. I. Perfilieva, Fuzzy transform: application to reef growth problem, in: R. Demicco, G.J. Klir (Eds.), Fuzzy Logic in Geology, Academic Press, Amsterdam, 2003, pp. 275-300.

6. Новак В., Перфильева И., Мочкорж И. Математические принципы нечеткой логики. / Пер. с англ.: Под ред. А.Н. Авер-кина. - М.: ФИЗМАТЛИТ, 2006.

МОДЕЛИРОВАНИЕ СЕРВЕРА И РАБОЧЕЙ СТАНЦИИ ВЫЧИСЛИТЕЛЬНОЙ СЕТИ С ПОМОЩЬЮ РАСКРАШЕННЫХ СЕТЕЙ ПЕТРИ

В.Г. Тронин; Стецко A.A., к.т.н. (НПО «Марс», г. Ульяновск)

В статье описаны модели сервера и рабочей станции в программном продукте, моделирующем вычислительную сеть на прикладном уровне. Данный программный продукт реализует раскрашенные сети Петри, собственные математические модели загрузки узлов. Он был разработан с учетом особенностей научно-производственного объединения (НПО) и предназначен для прогноза загруз-

ки, анализа слабых мест в структуре кампусной вычислительной сети.

Для моделирования вычислительной сети НПО была использована теория сетей Петри, несомненным достоинством которых является математически строгое описание модели. Это позволяет проводить анализ с помощью современной вычислительной техники.

i Надоели баннеры? Вы всегда можете отключить рекламу.