щий балл терма: w'k "= p *wi) или среднего ве-
са wr =
/k . Полученный сбалансиро-
( к
р * ч)
V 1=1
ванный вес будет принадлежать диапазону [1..100].
Применение нечеткого сбалансированного веса в задачах информационного поиска позволит пользователям настраивать выдаваемые ИПС результаты. Например, разбив диапазон [1..100] на равные 4 части, можно предположить существование градаций ключевых слов: "неключевые", "слабые ключевые", "ключевые", "сильные ключевые". При этом пользователь может производить градацию полноты и точности ответа ИПС: "полный", "преимущественно полный", "преимущественно точный", "точный".
Программная реализация индексации ЭД
Основой проблемой предложенного метода является формирование механизмов градации полноты/точности и получение коэффициентов для каждого алгоритма расчета сбалансированного показателя, которые требуют проведения значительного количества экспериментов и больших временных затрат на экспертную оценку.
Программная реализация нечеткого сбалансированного показателя ведется в рамках совместного проекта НПО «МАРС» и УлГТУ по созданию ИПС проектной документации. Проект имеет рабочее название "Интеллектуальный сетевой архив
электронных информационных ресурсов" (ИСА ЭИР). Определение "интеллектуальный" вводится в связи с использованием алгоритмов мягких вычислений, используемых при построении архитектуры ИСА ЭИР и реализации процессов информационного поиска: теории нечетких подмножеств, теории нейронных сетей, теории нечетких временных рядов.
Одним из этапов разработки ИСА ЭИР является разработка модуля индексирования, включающего операцию взвешивания. Первый этап разработки модуля «ИСА ЭИР: индексатор» реализован:
- спроектирована и реализована БД для хранения ЭД, результатов индексирования (нечетких частотных словарей);
- разработан программный модуль индексирования ЭД (форматы MS Word, RTF, TXT) и заполнения БД;
- расчет весов термов по формулам абсолютных и частных мер, формуле "сигнал-шум", формуле распределения частоты термина.
Предложенный метод формирования нечеткого сбалансированного показателя позволяет объединять достоинства известных статистических алгоритмов взвешивания термов и обеспечивает более точное выделение ключевых слов в тексте документов. Проводимые эксперименты в рамках проекта ИСА ЭИР позволят проверить возможность применения разных алгоритмов взвешивания для получения более точных весовых коэффициентов.
i=l
МОДЕЛИРОВАНИЕ ТРАФИКА ТЕРМИНАЛ-СЕРВЕРА НА ОСНОВЕ АНАЛИЗА НЕЧЕТКИХ ТЕНДЕНЦИЙ ВРЕМЕННЫХ РЯДОВ
Н.Г. Ярушкина, д.т.н.; Т.Р. Юнусов, Т.В. Афанасьева, к.т.н. (УлГТУ, г. Ульяновск)
В настоящее время резко возрастает сложность создаваемых и эксплуатируемых технических систем. В процессе проектирования и эксплуатации таких систем моделирование является эффективным методом прогнозирования основных характеристик поведения систем. Сложные технические системы, такие как вычислительные сети, обладают объективной неопределенностью, что требует дальнейшего расширения инструментария прогностики. Все чаще используются интеллектуальные методы, которые расширяют классическую классификацию прогностических методов и представляют сочетание формализованных процедур обработки информации, полученной по оценкам специалистов-экспертов. Исследования данных и их методов анализа в последние десятилетия оформились в виде отдельного направления, называемого интеллектуаль-
ным анализом данных, или Data Mining, в котором анализ временных рядов (ВР) получил понятие интеллектуального анализа ВР, или Times-Series Data Mining. Многие задачи анализа нечетких ВР (НВР) остаются нерешенными, в частности, задачи анализа нечетких тенденций (НТ) и генерации правил распознавания тенденций. Методы анализа НВР могут быть положены в основу создания библиотек имитационных моделей элементов сложных технических систем, в частности, вычислительных терминальных сетей (ВС).
Одной из задач моделирования ВС разного уровня является анализ пропускной способности сети (трафик, нагрузка, задержка и т.д.). Если для коммутирующего оборудования существует достаточно много программных библиотек, позволяющих выполнять имитационное моделирование, то для узлов-пользователей, обладающих слож-
ной, многокомпонентной структурой, необходимо реализовывать в каждом случае свои модели. Известны подходы к моделированию работы узлов-пользователей ВС на основе генерирования исходящего трафика с использованием накопленной статистики работы узла и, как результата, моделирования обработки узлом входящего трафика.
Интеллектуальные методы анализа ВР, используемые для моделирования элементов ВС
Наиболее популярными интеллектуальными инструментами анализа ВР являются нейронные сети (НС) и нечеткая логика.
НВР называют упорядоченную последовательность наблюдений над некоторым явлением, состояния которого изменяются во времени, если значение состояния в момент времени выражено с помощью нечеткой метки (см., напр.: Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений. М., 1976; Ярушки-на Н.Г Вычислительный интеллект: синергизм слова и числа // Информационные технологии и вычислительные системы, 2002, № 4).
Нечеткая метка может быть сформирована непосредственно экспертом или получена на основе некоторого исходного ВР.
НТ НВР является нечеткая метка, выражающая динамику (систематическое движение) НВР. Понятие "тенденция", моделируемое нечетким множеством, может быть описано набором сконструированных эмпирических правил. Для нахождения НТ предлагается использовать нечеткие НС. Анализ НТ позволяет на основе динамики процесса прогнозировать поведение ВР путем предсказания тенденций развития изучаемого объекта. При этом не предусматривается прогнозирование численных значений ВР, что можно отнести к недостаткам предложенных методов.
Математическая модель ВР НТ
Рассмотрим дискретный ВР У={уь t - последовательность моментов времени}, у^иу.
Определение 1. НВР У называется упорядоченная последовательность наблюдений над неким явлением, характер которого изменяется во времени, если значения, принимаемые некоторой величиной в момент времени, выражены с помощью нечеткой метки: у' = {(у' у( ))^} , где
у' - '-й элемент терм-множества лингвистической
переменной (у ,Гу,иу,Оу,Ыу).
Таким образом, НВР представляет собой векторный ВР значений всех нечетких переменных:
у={У( } , где у( = {у1 ,—УП } ; п - количество терм.
Определение 2. НТ. Пусть уА = {у1,...,ут} -
НВР, УА = {уА} - множество НВР одинаковой длины. Тогда НТ т, определенная на УА, есть совокупность упорядоченных пар: т={уА,рт(уА )} , где цт(уА ) представляет собой степень принадлежности уА к НТ т.
Определение 3. ВРНТ. Пусть {уА}- множество НВР длиной m, где уА = {y,_m+1,-,y,} , yt eF t. Тогда ВРНТ есть упорядоченное во времени нечеткое множество: т, = {t,y,v(уА )}.
Предположим наличие зависимости между НТ, наблюдаемыми в разные моменты времени. Используя схему разностного уравнения, представим модель ВРНТ для одной переменной: Tt = f( Tt_1,...Tt_l) , где l - временной лаг.
Для построения модели ВРНТ были определены следующие функционалы:
_ Fuzzy - фаззификация и deFuzzy - дефаззи-фикация ВР;
_ Tend - описание и распознавание НТ;
_ deTend - получение НВР из значений НТ.
Определение 4. Модель НТ (МНТ). Совокупность компонент и уравнений:
у] = Fuzzy[yt] , yt = deFuzzy[у^—уП ], i=1--n,
т = Tend[y,_m. +1,-,y,] ,
y] = deTend[т,,...,т,+т_1 ], m = max(mj), j=1..p, Tt = f(Tt_1>...Tt_l) , где n - количество термов НВР; p - количество термов НТ; mj - интервал определения НТ; l - временной лаг, обозначим МНТ с характеризующими параметрами (n, p, m, l). В более подробном виде параметры можно обозначить как (n,{pk},{mk},l), где pk - количество видов тенденций, имеющих интервал определения mk.
Рассмотрим соотношение моделей НВР, ВРНТ и МНТ. Модель МНТ (np,1,l) является, по сути, обычной моделью НВР, использующейся в интеллектуальных методах анализа ВР. В то же время НВР - это частный случай ВРНТ, так как для НВР полагаем интервалы определения тенденций как единичные. Заметим, что МНТ (n,{pk},{1, ...},l), позволяя включать как моментные, так и интервальные нечеткие характеристики ряда, является обобщением моделей НВР и ВРНТ, что позволяет в дальнейшем использовать ее не только в качестве модели ВР, но и для решения задач анализа и прогнозирования НВР.
Представление МНТ с помощью нечеткой НС (ННС)
В качестве инструмента построения функциональной зависимости в виде нечетких отношений используем аппарат ННС. Особенностью системы логического вывода по НТ при реализации схемы сети является то, что отсутствуют слои фаззифи-
кации и дефаззификации, так как входы и выходы - нечеткие значения (в их интерпретации). Используем классические нечеткие нейроны, в которых операции сложения и умножения заменяются треугольными нормами:
- И-нейрон ß=T(S(r1,w1),S(r2,w2)),
- ИЛИ-нейрон т0 = S(T( ß1,z1 ),T( ß2,z2)).
Порядок выявления нечетких зависимостей на
основе ННС следующий: инициализация ННС; обучение (оптимизация весов сети); анализ сети (сокращение сети).
В результате получается система логического вывода, являющаяся объясняющей функцией в модели ВР. Нечеткие продукции легко интерпретируются для эксперта, так как выражены в терминах присущих исследуемой области, и отсутствуют скрытые нелинейные связи.
Программная система анализа НВР
Для анализа НВР по предложенной МНТ создано программное обеспечение FuzzyTendNet. Программа написана в среде Microsoft Visual Basic .NET, для запуска скомпилированной версии требуется Microsoft .NET Framework 1.1.
Основные задачи, решаемые системой:
- многомерный анализ данных с несколькими входными и выходными переменными;
- реализация функционалов модели Fuzzy, deFuzzy, Tend, deTend;
- реализация модели НТ (определение 4), оптимизация на основе методов НС;
- прогнозирование ВР на заданный интервал;
- графическое отображение всех ВР: исходных, нечетких переменных, НТ;
- сохранение сформированной модели во внешнем файле в формате XML.
В основе программы лежит иерархическое представление проекта, которое одновременно является представлением внутренней программной реализации на основе объектно-ориетированного программирования и форматом хранения в XML-файле.
Моделирование терминал-сервера на основе ВРНТ
На основании рассмотренной модели проанализирована работа одного из узла вычислительной сети вуза. Узлом является сервер, работающий под Microsoft Windows 2003, выполняющий приложения в терминальном режиме. Основное пользовательское приложение: БД «1С:Предприятие», работающее в файл-серверном режиме, где данные расположены на этом же сервере. Для моделирования трафика на основе предложенного подхода были выбраны семь параметров работы узла, из которых сформированы ВР.
Анализ производился в авторской программе FuzzyTendNet. Для всех параметров установлены
нечеткие переменные НВР, описывающие значения: «высокое», «низкое». Установлены НТ: «загрузка», «простой». Для трафика также определены дополнительные НТ: «рост», «падение».
Анализировались МНТ (п,р,т,1) от самого простого случая (МНТ(2,2,1,2) до моделей, включающих в себя как НВР, так и ВРНТ (МНТ(2, {2,4},{1,2},2).
Таким образом, комбинируя интервалы НТ входных и выходных переменных т=(1,{1,2},2), получали разные варианты моделей для сравнительного анализа. В результате при сравнении с экспертными оценками был сделан вывод, что МНТ описывает изменение параметров трафика успешно. На рисунке 1 представлен прогноз изменения параметров трафика на шаг вперед для двух МНТ.
Полученная функциональная зависимость не только хорошо описывает работу сервера, но и дает лингвистическую интерпретацию зависимости.
Для моделирования объема трафика сервера экспертом были предложены и описаны следующие режимы работы сервера: ввод данных, их чтение, формирование отчетов с высокими значениями соответствующих групп параметров. На рисунке 2 представлены результаты моделирования объема трафика на основе МНТ.
Таким образом, МНТ является результативным индикатором развития моделируемого процесса в сложной технической системе, описанного качественно в лингвистических терминах. Базовыми операциями обработки НТ являются алго-
ритмические операции обработки НТ, а именно, операция формирования ВРНТ по исходному ВР и обратная операция генерации ряда - представителя НТ. ННС предложенной архитектуры является эффективным генератором правил распознавания
НТ. Разработанная математическая имитационная модель терминала сервера как элемента вычислительной сети на основе ВРНТ позволяет прогнозировать загрузку процессора, исходящий и входящий трафики сервера.
ПОСТРОЕНИЕ ЭКСПЕРТНЫХ СИСТЕМ НА БАЗЕ ИЕРАРХИЧЕСКОГО НЕЧЕТКОГО ВЫВОДА
Н.Н. Ястребова (УлГТУ, г. Ульяновск)
При проектировании экспертных систем программист неизбежно сталкивается со сложными задачами представления данных и моделирования человеческих рассуждений, решение которых связано с областью искусственного интеллекта.
Для моделирования сложных рассуждений о явлениях реального мира, когда описание системы представляет собой большую совокупность переменных различной природы, возникает необходимость использования иерархических баз знаний. Это связано с тем, что эксперту сложно уловить взаимосвязи объектов, если их количество превышает 9. Кроме того, применение иерархических нечетких баз знаний позволяет преодолеть "проклятие размерности" и небольшим количеством нечетких правил адекватно описать многомерные зависимости "входы-выход".
На рисунке 1 приведен пример иерархической нечеткой базы знаний, моделирующей зависимость У=/(х1)х2)х3)х4)х5)х6) с использованием трех баз знаний. Эти базы знаний описывают зависимости: У1=/1(х1>х2), У2=/2(х4,х5,хб) иУ=/з(У1,хз,У2).
Пусть для лингвистической оценки переменных используется по пять термов. Тогда максимальное количество правил для задания зависимости У=/(х1)х2)х3)х4)х5)х6) с помощью одной базы знаний будет равным 56=15625. Для иерархической базы знаний (рис.1), описывающую ту же зависимость, максимальное количество правил будет равным 52+53+53=275. Причем это «короткие» правила с двумя-тремя входными переменными.
Существует два способа создания иерархических систем нечеткого вывода.
1. Выполнение нечеткого вывода для промежуточных переменных с последующей передачей четких значений этих переменных в нечеткие системы следующего уровня иерархии. Недостаток этого способа состоит в том, что над промежуточными переменными (У1, У2 на рис. 1) последовательно выполняются операции дефаззификации и фаззификации. Следовательно, для промежуточных переменных надо задавать функции принадлежности. Кроме того, необходимо обеспечить эквивалентность нечетких множеств до и после операций дефаззификации и фаззификации.
2. Процедуры дефаззификации и фаззифика-ции для промежуточных переменных не выполняются. Результат логического вывода в виде нечеткого множества напрямую передается в машину нечеткого вывода следующего уровня иерархии. Поэтому для описания промежуточных переменных в иерархических нечетких базах знаний достаточно задать только терм-множества без определения функций принадлежностей.
Очевидно, что второй метод дает преимущества:
- избавляет пользователя от необходимости задания функций принадлежности для промежуточных переменных (как известно, эта процедура является одним из самых узких мест теории нечетких множеств);
- использование в качестве основы нечеткого вывода по Сугено позволяет избежать накопления нечеткости, при этом отсутствие промежуточных процедур фаззификации/дефаззификации снижает вычислительную погрешность.
Рассмотрим алгоритм выполнения иерархического нечеткого вывода (рис.2).
1. Вектор входных переменных, используемых на всех шагах нечеткого вывода (х= {.х1,х2,...,хт\ ).
2. Преобразование входных переменных в нечеткую форму - процедура фаззификации.
3. Цикл 1:=1 Ьо N йо (где N - число шагов нечеткого вывода).
3.1. Выполнить процедуру нечеткого логиче-