Научная статья на тему 'Использование нечеткого логического вывода для интеллектуального анализа данных'

Использование нечеткого логического вывода для интеллектуального анализа данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1503
249
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
интеллектуальные информационные системы / нечеткая логика / нирс / анализ данных / students' research effort / intellectual information system / fuzzy logic / data analysis

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Вахитов Александр Робертович, Силич Виктор Алексеевич

Показан способ интеллектуального анализа данных, основанный на использовании нечеткого логического вывода. Обсуждаются принципы реализации способа, области применения, а также преимущества по сравнению с другими способами обработки данных. Особое внимание уделяется практическому применению данного способа в предметной области, связанной с НИРС в вузе. Сделан вывод о целесообразности использования нечеткой логики в условиях неопределенности и неполноты знаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Вахитов Александр Робертович, Силич Виктор Алексеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The method of intelligent data analysis based on using fuzzy inference has been shown. Principles of this method implementation, field of application, as well as advantages in comparison with other methods of data processing are discussed. Special attention is paid to practical application of this method in application domain connected with students" research effort in university. The conclusion is drawn on appropriateness of using fuzzy logic in conditions of uncertainty and knowledge imperfection.

Текст научной работы на тему «Использование нечеткого логического вывода для интеллектуального анализа данных»

УДК 004.89

ИСПОЛЬЗОВАНИЕ НЕЧЕТКОГО ЛОГИЧЕСКОГО ВЫВОДА ДЛЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

А.Р. Вахитов, В.А. Силич

Томский политехнический университет E-mail: arv@tpu.ru

Показан способ интеллектуального анализа данных, основанный на использовании нечеткого логического вывода. Обсуждаются принципы реализации способа, области применения, а также преимущества по сравнению сдругими способами обработки данных. Особое внимание уделяется практическому применению данного способа в предметной области, связанной с НИРС в вузе. Сделан вывод о целесообразности использования нечеткой логики в условиях неопределенности и неполноты знаний.

Ключевые слова:

Интеллектуальные информационные системы, нечеткая логика, НИРС, анализ данных. Key words:

Intellectual information system, fuzzy logic, students' research effort, data analysis.

Знания, которыми располагает человек, в какой-то степени всегда неполны, приближенны, ненадежны. Тем не менее, людям на основе таких знаний удается делать достаточно обоснованные выводы и принимать разумные решения. Следовательно, чтобы интеллектуальные информационные системы были действительно полезны, они должны учитывать неполную определенность знаний и успешно действовать в таких условиях [1, 2]. Таким образом, неполная определенность и нечеткость имеющихся знаний - скорее типичная картина при анализе и оценке положения вещей, при построении выводов и рекомендаций, чем исключение. В процессе исследований по искусственному интеллекту для решения этой проблемы выработано несколько подходов.

Одним из таких подходов является нечеткая логика Л. Заде. В его работе [3] понятие множества расширено допущением, что функция принадлежности элемента к множеству может принимать любые значения в интервале [0..1], а не только 0 или 1. Такие множества были названы нечёткими. Также Л. Заде были предложены логические операции над нечёткими множествами и предложено понятие лингвистической переменной, в качестве зна-

чений которой выступают нечёткие множества.

Модель нечеткой логики делает возможным реализацию в системе интеллектуальных функций, основанных на анализе неполной информации о предметной области, и построение удобного пользовательского интерфейса, в котором вывод данных имеет такие сходства с результатами человеческих рассуждений, как приближенность, неуверенность и субъективность. Кроме того, благодаря непрерывности функции принадлежности появляются преимущества в скорости обработки данных.

Функциональная схема процесса нечеткого вывода представлена на рис. 1 [4].

Выполнение первого этапа нечеткого вывода -фаззификации - осуществляет фаззификатор. За процедуру непосредственно нечеткого вывода ответственна машина нечеткого логического вывода, которая производит второй этап процесса вывода на основании задаваемой нечеткой базы знаний (набора правил), а также этап композиции. Дефаззификатор выполняет последний этап нечеткого вывода - дефаззификацию [5].

Исследуемая предметная область (НИРС в вузе) система была описана в терминах нечеткой логики. В соответствии с предложенным методом

Рис. 1. Функциональная схема процесса нечеткого вывода

был осуществлен нечеткий логический вывод. Предметная область описывается следующими входными параметрами А1 и выходными параметрами В,, таблица:

Таблица. Входные и выходные параметры системы

Обозначение Описание Универсум (список возможных значений)

Входные параметры

А Количество результатов НИРС Множество натуральных чисел п

А Сумма денег, полученных за НИРС Множество положительных вещественных чисел т

Аз Число страниц,опубликованных по итогам НИРС п

A4 Число наград за НИРС п

As Число поощрений по итогам НИРС п

А Сумма денег, затраченных на поощрения т

Выходные параметры

Премирование m

Назначение преподавателю руководства НИРС n

Вз Рекомендация для поступления в аспирантуру n

B4 Рекомендация на стажировку n

Bs Командировка на конференцию n

Все универсумы находятся в пределах измеримого диапазона с 5 степенями градации (термами): очень низкий [0..xj, средний [x^.x2], высокий [x2..x3]. Конкретные значения x¡ зависят от масштабов анализа данных (на уровне конкретного студента или преподавателя, кафедры, факультета либо вуза) и особенности измерения данного параметра. Исследуемая система описывается правилами вывода:

L{. (A5e[0..x1]AA6e[0..x1])A(A1e[x2..x3]v

vA2 e [x2..x3] vA3 e [x2..x3] vA4 e [x2..x3]) ^B1 e [x1..x2];

L2: (A5e[0..X1]AA6e[0..X1])A(A1e[x2..X3]A

л^е [х^ХзМзе [х2..ХзМ4е [х2.Хз])^В1е [X2..X3]; L3: (A5e [x1..X2]AA6e [x1..X2])A(A1e [x2..x3]v

v^e [x2..x3]v4e [x2..X3]vA4e [x2..X3])^B1e [0..X1]; L4: (A5e [x1..x2]AA6e [x1..x2])A(A1e [x2..x3]a

AA2 e [X2..X3] AA3 e [X2..X3] AA4 e [X2..X3]) e [X1..X2];

L5: (A5 e [x2..x3] aA6 e [x2..x3]) a(A1 e [x2..x3] a

AA2 e [X2..X3] AA3 e [X2..X3] AA4 e [X2..X3]) ^B1 e [0..X1];

L5: (A2e[x2..x3]AA4e[x2..x3]AA1e[0..x1]AA5e[0..x1])^

^B2e[x1..x2]; L6: (A2 e [x1..x2] aA4 e [x1..x2] aA1 e [0..x1 aA5 e [0..x1]) ^ ^B2e[0..xJ;

L7: (A3e [^..XjMAe [x2..x3]AA26 [X2..X3]aA46 [x2..x3]))^

L8: (A3 e [xj ..x2] v(Aj e [x1 ..x2] aA2 e [x1 ..x2] aA4 e [xj..x2])) ^ ^e^.xj;

L9: (Aje[x2..x3]v^2e[x2..x3]v^3e[x2..x3])^^4e[xj..x2];

Lj0: (Aje [x2..x3]AA2e [x2..x3]AA3e [x2..x3])^B4e [x2..x3];

Ln: (A^ [x^A^e [x^D^e [x^];

Lj2: (Aj e [x2..x3] vA3 e [x2..x3])^B5 e [x2..x3];

Lj3: (A^ [x^A^e fe.^D^e [x^];

Lj4: (Aje[x2..x3]AA6e[0..xj])^A5e[xj..x2];

Lj5: (A1e[0..x1]vA6e[0..x1])^A5e[0..x1].

Следует отметить, что наряду с возможностью вывода выходных параметров на основе входных в системе также возможен вывод неизвестных входных параметров из известных входных параметров (правила вывода Lj3-Lj5).

Рассмотрим алгоритм нечеткого вывода на конкретном примере. У одного из студентов необходимо доопределить значение A5, зная значения Aj и A6, используя затем полученные параметры для генерирования решения о том, заслуживает ли студент дополнительных поощрений.

Универсум значения числа поощрений A5,ora этого студента находится в отрезке [0..6]. Начальное множество термов - низкое, среднее, высокое. Функции принадлежности u(A5) показаны на рис. 2.

Универсум значения числа результатов Aj для этого студента находится в отрезке [0..20]. Начальное множество термов - {малое, среднее, большое}. Функции принадлежности u(A1) приведены на рис. 3.

Универсум значения суммы денег A6 для этого студента находится в отрезке [0..12000]. Начальное множество термов - {малая, средняя, большая}. Функции принадлежности ju(A6) имеют следующий вид, рис. 4.

Нечеткий логический вывод производится в несколько этапов:

1. Этап фаззификации.

На основе значений A1=15 и A6=7000 была осуществлена фаззификация, в результате которой получены следующие степени уверенности в значениях входных переменных:

• Число достижений A1 большое - 0,65; среднее -0,7; малое - 0,35.

• Сумма денег A6 большая - 1; средняя - 0,5; малая - 0.

2. Этап нечеткого вывода.

На данном этапе вычислены степени уверенности посылок правил L13-L15, представляющих из себя нечеткие импликации:

• L13: min(A1e[x2..x3]AA6e[x2..x3])=min(0,65;1)=0,65.

• L14: min(A1e[x2..x3]AA6e[0..x1])=min(0,65;0)=0.

• L15: max(A1e[0..x1]vA6e[0..x1])=max(0,35;0)=0,35.

3. Этап композиции.

Рис. 2. Функции принадлежности /л(Аь)

Рис. 3. Функции принадлежности ^.(А)

Рис. 4. Функции принадлежности ^(А)

Рис. 5. Аккумуляция правил

Степень уверенности заключения задается функцией принадлежности соответствующего терма. Поэтому с использованием определения нечеткой импликации как минимума левой и правой частей получены новые нечеткие переменные, соответствующую степени уверенности в значении выходных данных при применении к заданным входам соответствующего правила.

Затем была проведена аккумуляция - объединение результатов применения всех правил, рис. 5.

В результате была получена функция принадлежности для числа поощрений A5, которая говорит о степени уверенности в значении искомого параметра на основе входных параметров и правил нечеткого логического вывода. 4. Этап дефаззификации.

Для преобразования нечеткого набора значений к точным был использован метод первого мак-

симума, в результате чего было определено, что число поощрений находится в диапазоне «среднее» и равно примерно 3.

Затем полученные данные были использованы для определения выходных параметров В.. Зная, что А;=15, А5=3, Аб=7000, согласно правилу нечеткого логического вывода Ь3:

(А е [х1 ..х2] лАб6 [х1 ..х2])л(А1 е [х2..х3] vA2 е [х2..х3] V vA3 е [х2..х3] vA4 е [х2..х3]) ^В1 е [0..х1] было определено, что с данными показателями НИР этот студент заслуживает премирования в размере [0..2000].

Таким образом, использование нечеткого логического вывода делает возможным получение новых знаний на основе анализа существующих данных даже в условиях неполноты и приближенности сведений об исследуемой предметной области.

СПИСОК ЛИТЕРАТУРЫ

1. Brachman R., Sefridge P. Knowledge representation support for data archeology // Intelligent and Cooperative Information Systems. -1993. - №2. - P. 113-120.

2. Борисов А.Н., Алексеев А.В., Меркурьева Г.В. и др. Обработка нечеткой информации в системах принятия решений. - М.: Радио и связь, 1989. - 304 с.

3. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений. - М.: Мир, 1976. - 165 с.

4. Корниенко А.В. Интеллектуальные информационные системы в экономике. - Томск: Изд-во ТПУ, 2008. - 177 с.

5. Кузнецов С.Д. Неопределенная информация и трехзначная логика // СУБД. - 1997. - № 5. - С. 65-67.

Поступила 08.09.2010г.

УДК 004.89

ВЫБОР КЛАССА МАТЕМАТИЧЕСКОЙ МОДЕЛИ СИСТЕМЫ НА ОСНОВЕ МЕТОДА СААТИ И ИНТЕГРАЛЬНЫХ КРИТЕРИЕВ

А.Р. Вахитов, В.А. Силич

Томский политехнический университет E-mail: arv@tpu.ru

Показано обоснование выбора класса математической модели информационной системы, содержащей сведения о НИРС в вузе. Произведено описание альтернативных классов моделей, основных критериев выбора и применения метода Саати и интегральных критериев для выбора наиболее подходящего варианта из имеющихся альтернатив. Сделан вывод о целесообразности использования нечеткой логики в качестве класса математической модели для исследуемой предметной области.

Ключевые слова:

Математическая модель, НИРС, метод Саати, интегральные критерии. Key words:

Mathematical model, students' research effort, Saati's method, integral criterias.

Создание математического обеспечения информационной системы предполагает обоснование выбора класса математической модели из множества Х альтернативных вариантов х., а также непосредственное описание предметной области в терминах выбранного класса. К числу основных логических моделей, для которых разработаны формальные методы логического вывода, относятся [1, 2]:

х1 - исчисление высказываний; х2 - исчисление предикатов; х3 - семантические сети; х4 - дескриптивная логика; х5 - нечеткая логика.

Исследуемой предметной областью является НИРС в вузе. Обоснование выбора класса математической модели является важным этапом при разработке системы, так как здесь должны учитывать-

i Надоели баннеры? Вы всегда можете отключить рекламу.