Научная статья на тему 'Оценивание закономерностей для базы знаний'

Оценивание закономерностей для базы знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
125
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗА ЗНАНИЙ / ОЦЕНИВАНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Набродова И. Н., Токарев В. Л.

Рассмотрен метод достижения адекватности лингвистической модели реальной системе, используемой для компьютерной поддержки принятия решений сложных задач.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Оценивание закономерностей для базы знаний»

7. Graham D. B. and Allinson N. M. Face recognition using virtual parametric eigenspace signatures Image Processing and its Applications. 1997. P. 106-110.

8. Lanitis A., Taylor C. J. and Cootes T. F. Automatic Interpretation and Coding of Face Images Using Flexible Models.// IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997.

9. Grudin M. A., Lisboa P. J., Harvey D. M. Compact multi-level representation of human faces for identification.// Image Processing and its Applications. 1997. Vol. 19. P. 743-756.

V. Tokarev, K. Kotov

The image signs vector determination for identification task

The method of image signs vector determination and it relation to pattern space are discussed.

Получено 12.11.2009

УДК 004.825

И. Н. Набродова, ведущий инж., (4872) 33-24-45, ira1978@tsu.tula.ru (Россия, Тула, ТулГУ),

В. Л. Токарев, д-р техн. наук, проф., (4872) 33-24-45, tokarev@tsu.tula.ru (Россия, Тула, ТулГУ)

ОЦЕНИВАНИЕ ЗАКОНОМЕРНОСТЕЙ ДЛЯ БАЗЫ ЗНАНИЙ

Рассмотрен метод достижения адекватности лингвистической модели реальной системе, используемой для компьютерной поддержки принятия решений сложных задач.

Ключевые слова: база знаний, оценивание.

Введение. Одной из задач, возникающих при создании компьютерных систем поддержки принятия решений, является оценивание закономерностей, связывающих различные переменные, массивы значений которых имеются в хранилище данных. Хранилищем данных сегодня называют предметно-ориентированное, интегрированное, привязанное ко времени, неизменяемое собрание данных, используемых для поддержки процесса принятия управленчески решений. Предметна ориентация означает, что данные объединены в категории и хранятся в соответствии с теми областями, которые они описывают, а не в соответствии с приложениями, которые их используют. Привязанность ко времени означает, что хранилище можно рассматривать как собрание исторических данных, т. е. конкретные значения данных однозначно связаны с опре деленными моментами времени.

Выведенные из данных закономерности и правила можно применять для описания существующих отношений и закономерностей, а также для принятия решений и прогнозирования их последствий.

Для оценивания (выявления) закономерностей широко используется метод индуктивных выводов [1,2]. В процессе индуктивного обучения может участвовать специалист, выдвигающий гипотезы. Такой способ называют обучением с учителем. Поиск закономерностей может осуществляться и без учителя путем автоматической генерации гипотез. В современных программных средствах, как правило, сочетаются оба способа, а для проверки гипотез используются статистические методы. Примером системы с применением индуктивных выводов является "ЭкспертРуль Майнер", ра-работанна фирмой "АтарСофтваре ЛТД" (Вeликoбрлтaнля) [3].

Однако задач оценивания закономерностей существенно осложняется в условиях разнотипности, недостаточности или неопределенности данных, или когда получение требуемых данных является сложной, трудоемкой, дорогостоящей или вовсе невозможной задачей. При этом в обычном понимании четкие модели, отображающие искомые закономерности, не могут быть получены либо они могут быть получены слишком сложными для практической поддержки принятия решения. Значима же часть информации о системе или процессах, относительно которых принимаются решения, может быть представлена только в качественных шкаах или в форме высказываний на естественном языке. Используемые в этих случаях методы построения нечетких продукционных моделей (лингвистических моделей) [4] сложны в настройке и их адаптации к изменяющейся обстановке.

В данной работе предлагается метод параметрической оптимизации построенной лингвистической модели по обучающей выборке данных, обеспечивающий повышение адекватности получающейся модели моделируемой для поддержки принятия решений.

Параметрическая оптимизация нечеткой модели. Будем считать, что задана обучающа выборка, состоящая из множества примеров следующего вида:

{*1 (к X х2(к хп (к X у (к )}*^ ,

где Xl(k),X2(k),...,xn(к) - значения информативных входных переменных Xl,X2,...,xn; у(к) - значение выходной переменной у в к-м примере; N -общее число примеров в обучающей выборке.

Предполагается также, что известны минимаьные и максимаьные значения каждой переменной:

Х1 е [х1.тт ,Х1.тах 1...,хп е [хп.тт,хп. тах 1у е [утт,утах].

На каждой области значений этих переменных построим терм-множества aj еЛ;, I = 1,...,п; Ь е В . Значениям лингвистической переменной (ЛП) aj еЛj соответствуют нечеткие подмножества с функцией при-

надежности ца . (), а значениям ЛП Ь е В - нечеткие подмножества с функцией принадлежности цц (у).

Число термов Шу = |в| определим из требуемой точности определения дискретных значений выходной переменной Ь еВ, а число термов входных переменных - из условия

п

шу <Птг (1)

; =1

и стремления минимизации количества нечетклх правил (сократить число дизъюнкций).

Функцию принадлежности каждого терма

^а] (•;),ЦЬ (У), I = 1,. .,п; j = 1,. .,шх. ; I =1,...,Шу выберем треугольной формы с вершиной ц = 1 в центре отрезка ц = 0. То есть каждый терм ЛП L характеризуется двумя переменными: 1) модой - положением са, (•;)вершины ца. (X;) = 1 на оси значений баовой переменной; 2) шириной da (X;) функции принадлежности - величиной проекции отрезка на ось баовой переменной, полученного на уровне ца(X;) = 0,5.

Обычно выбор величины ё является результатом компромисса между желанием избежать чрезмерного влияния шума при переходе от баовой переменной к ЛП и стремлением достичь адекватность модели исследуемой системе.

Предполагается также, что по выборке данных методом индуктивного вывода модели [4] построена нечетка реляционна модель (качественное описание системы в терминах значений лингвистических переменных)

Р

(а1.р (к) А а2.р (к) А • • • V ап.р(к))^ Ь(к) . (2)

^ “2.р^^^^^ ’“п. р'

Р11

Для каждого примера обучающей выборки по значениям входных переменных -1(к),-2 (к),...,хп (к) определяется значение выходной переменной у(к), которое позволяет определить ошибку модели

е(к) = у(к) -у(к).

Соответствие модели реаьной системе будем оценивать критерием

1 N 2

J(с, d) =— Уе (к) ^ тт. (3)

М к=1

Достижение минимума этого критерия составляет задачу параметрической оптимизации модели (3), в которой управляемыми параметрами являются значения caj ( X;) и daj (X;).

Предлагается поставленную задачу решать в два этапа. Сначаа решается задача

Cj(х;) = аг§ тт J(с),с = \Jcj(X;) .

затем - задача

dj (X;) = аг§ тт J(d), d = и dj (х;) .

djеd ^

Решение первой задачи предлагается осуществить методом стохастической аппроксимации

С?+1 = С? + а?VJ(с?) I = 1,...,п,

J С? )-J С?-1)

где

сд =

с?

с1і

С? 2і

С . та

, ш(с«)=

С? -с,?"1

/ 1іч 1і/

J ()-J (с?-1

с? -с?-1

та та

і = 1,..., п.

скаляр а > о опредляетшаг процедры, определяемый из условия

J(?+ )=т>п Ц-<С« + аqvJ(с«)).

а

Достигнутое значение тт J (с) понижается второй процедрой

cjеХ;

вд+1 =вд + р^; =1,...,п ,

J С? )- (^ Ч

где В?

а1і

а?

а?. т?

VJ (а?

а? -а?

Ъ\ і

J (а ? Ма И

-1

а? -а? 2 2

J а? .)-J(4

ті' \ т.

і = 1,..., п

dq .-dq-1

Ш;7 Ш;7

скаляр Р? >0 определяет шаг процедры, определяемый из условия

JС?+1)= т ш J(в? + р^(в? ))

Р? >0

Сходимость указанных процедр обеспечивается выбором функций aq,fiq ^ 0 при q ^ N. Одним из вариантов может служить функция

r(q)=°Mi+q)-

Заключение. Предложенный метод позволяет ускорить процесс достижения адекватности получаемых нечетких моделей реальным системам. Получение таких закономерностей позволяет построить базу знаний для интеллектуальной поддержки принятия решений задач классификации, диагностики, управления нелинейными статическими и динамическими объектами и системами, а также рада других задач, требующих решения систем нечетких уравнений.

Библиографический список

1. Приобретение знаний/ под ред. С. Осуги, Ю. Саки. М.: Мир, 1990.

304 с.

2. Борисов В. В., Федулов А. С. Нечеткие продукционные модели и сети. Смоленск: Изд-во ВА ВПВО ВС РФ, 2005. 240 с.

3. http://www.xpertrule.com

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4. Токарев В. Л. Теория обеспечения рациональности решений. Тула: Изд-во ТулГУ, 2000. 120 с.

I. Nabrodova, V. Tokarev

Estimation of laws for the knowledge base

The linguistic model adequacy achievement method to the real system for computer support of decision-making is considered.

Получено 12.11.2009

УДК 004.457

А. В. Анцев, аспирант, (4872)35-18-87, stanki@uic.tula.ru (Россия, Тула, ТулГУ)

ИНФОРМАЦИОННАЯ ПОДДЕРЖКА АНАЛИЗА ОДНОРОДНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ КОМПЬЮТЕРНОГО КЛАССА

Представлены метод получения списка программного обеспечения, установленного в компьютерном классе с использованием функций WinAPI для работы с реестром операционных систем семейства Microsoft Windows, и инструмент автоматизации получения списка программного обеспечения, установленного на конкретном компьютере, и представления списков программ компьютерного касса для анализа и сравнения с целью обеспечения однородности использземого программного обеспечения.

Ключевые слова: программное обеспечение, операционная система, информационная поддержка, компьютерный касс.

В настоящее время перед предприятиями различных отраслей промышленности возникла проблема контроля версий установленного про-

i Надоели баннеры? Вы всегда можете отключить рекламу.