Научная статья на тему 'Методика адаптивного извлечения и анализа знаний для построения базы знаний и быстрого принятия решений в САПР ситуационных центров'

Методика адаптивного извлечения и анализа знаний для построения базы знаний и быстрого принятия решений в САПР ситуационных центров Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
148
49
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Куземин Александр Яковлевич, Фастова Дарья Владимировна, Янчевский Игорь Владимирович

Разрабатывается подход для извлечения знаний из информации, поступившей на вход базы знаний, а также распределение новых знаний по подмножествам знаний, уже находящихся в ней. Реализуется преобразование знаний в параметры модели (данные) для последующего принятия решений по данному подмножеству. Принятие решений предлагается осуществлять с помощью аппарата нечетких множеств.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Куземин Александр Яковлевич, Фастова Дарья Владимировна, Янчевский Игорь Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Technique of adaptive extraction and analysis of knowledge for construction of base of knowledge and fast acceptance of the decisions in systems of designing of design works of the situation centres

One of the basic questions from the pint of view of mathematical modeling during construction of information systems for situation management is the way of representation of knowledge with which help system should accept the decisions in a concrete situation. The representation of knowledge can be given by a way, which the transition of the submitted fragments of the information in the terms of structure of bases of knowledge and databases would allow. The acceptance of the decisions can be carried out with the help of the device of indistinct sets.

Текст научной работы на тему «Методика адаптивного извлечения и анализа знаний для построения базы знаний и быстрого принятия решений в САПР ситуационных центров»

Саме цей метод (27) зі строгим теоретичним обгрунтуванням (в тому числі і при відході від ідеалізованої моделі) має всі переваги, що вказують на доцільність його використання. Числові експерименти підтверджують ефективність цього методу при відносній простоті його реалізації.

Одною з форм представлення результату є відображення поверхні (рис .4), що сформована методами тривимірної інтерполяції та розташування елементарних плоских елементів (фацетів) у відповідності до позиції сусідніх точок, тривимірні координати яких встановлено при реконструкції. Тут враховані ефекти освітлення та затінення невидимих елементів поверхні, а також передано яскравість вихідних зображень відповідним елементам реконструйованої поверхні. Цей етап реалізовано на основі вбудованих функцій OpenGL в середовищі MatLab.

Висновки

Реалістичність реконструйованої поверхні (див. рис. 4), збереження пропорцій між розмірами окремих елементів поверхні та передача кутових співвідношень вказує на правильність вибраного підходу до тривимірної реконструкції та ефективність виконання кожної з його складових. Очевидно, що достовірність реконструкції залежить від точності встановлення відповідності між двома зображеннями, тобто від правильності виконання етапу погодження стереопроекцій, а також від точності всіх параметрів епіполярної геометрії, що оцінюються. Тому для покращення точності перспективним видається узагальнення розробленого алгоритму на випадок кількох проекцій, а також удосконалення мір подібності при погодженні та введенні більш адекватних моделей функцій відмінності для регуляризації розв’язку.

УДК 681.3:51 '

МЕТОДИКА АДАПТИВНОГО ИЗВЛЕЧЕНИЯ И АНАЛИЗА ЗНАНИЙ ДЛЯ ПОСТРОЕНИЯ БАЗЫ ЗНАНИЙ И БЫСТРОГО ПРИНЯТИЯ РЕШЕНИЙ В САПР СИТУАЦИОННЫХ ЦЕНТРОВ

КУЗЕМИНА.Я., ФАСТОВА Д.В.,

ЯНЧЕВСКИЙ И.В.

Разрабатывается подход для извлечения знаний из информации, поступившей на вход базы знаний, а также распределение новых знаний по подмножествам знаний, уже находящихся в ней. Реализуется преобразование знаний в параметры модели (данные) для последующего принятия решений по данному подмножеству. Принятие решений предлагается осуществлять с помощью аппарата нечетких множеств.

Введение

Одним из основных вопросов с точки зрения математического моделирования в процессе построения информационных систем для ситуационного 118

Література: 1. Faugeras O. Three-Dimensional Computer Vision: a Geometric Viewpoint. Cambridge: MIT press. 1993. 2. Harris C, StephensM. A combined corner and edge detector // Fourth Alvey Vision Conference. 1988. P.147151. 3. Zhang Z, Deriche R, Faugeras O, Luong Q.-T. A robust technique for matching two uncalibrated images through the recovery of the unknown epipolar geometry / / Artificial Intelligence Journal. 1995. Vol.78. P.87-119. 4. Alvarez L, Deriche R, S6nchez J, Weickert J. Dense Disparity Map Estimation Respecting Image Discontinuities: A PDE and Scale-Space Based Approach // INRIA Tech. report N°3874. Sophia Antipolis. 2000. 5. Nagel H. -H, Enkelmann W. An investigation of smoothness constraints for the estimation of displacement vector fields from images sequences // IEEE Trans. Pattern Anal. Mach. Intell. 1986. Vol. 8. P.565-593.

Надійшла до редколегії 21.02.2005

Рецензент: д-р техн. наук Свірь І.Б.

Синявський Андрій Тадейович, канд. техн. наук, м.н.с. відділу “Методи та системи обробки, аналізу та ідентифікації зображень” Фізико-механічного інституту ім.Г.В.Карпенка НАЛУ. Наукові інтереси: прямі та зворотні задачі дифракції, обробка сигналів та зображень. Адреса: Україна, 79601, Львів, вул. Наукова, 5, email: [email protected]

Русин Богдан Павлович, д-р техн. наук, професор, нач. відділу “Методи та системи обробки, аналізу та ідентифікації зображень” Фізико-механічного інституту ім.Г.В.Карпенка НАНУ. Наукові інтереси: обробка та розпізнавання зображень. Адреса: Україна, 79601, Львів, вул. Наукова, 5, e-mail: [email protected]

управления является способ представления знаний, на основе которого принимается решение в конкретной ситуации. Трудность в представлении знаний заключается в реализации перехода фрагментов информации в термины структур баз данных (БД) и баз знаний (БЗ). С точки зрения фактов и процессов, приводящих к изменению БЗ, следует рассматривать семантику и синтаксис подобного представления. Под синтаксисом будем понимать набор правил для соединения символов в логически конкретные выражения, а под семантикой — способ интерпретации выражений, которые образуются в результате конкретных реализаций синтаксических правил.

Актуальность проблемы обусловлена необходимостью разработки информационной интеллектуальной системы на основании БД и БЗ, которая сможет самостоятельно формировать и пополнять базу данных и знаний, а также проводить логический вывод для последующего приятия решений по подмножествам.

Цель работы — уменьшение времени, необходимого для принятия решения по определенному подмножеству, за счет извлечения и анализа нового знания, поступающего на вход БЗ.

РИ, 2005, № 2

Для получения поставленной цели необходимо решить следующие задачи:

— реализовать построение предикатных запросов и их модификацию, которые будут аппаратом описания и изучения процессов обновления и модификации баз данных и знаний;

—определить правила логического вывода на основании баз данных и знаний;

— вычислить наименьшее расстояние между знаниями, необходимое для отнесения нового знания к ближайщему подмножеству.

Под базой данных будем понимать набор фактов. Основные идеи такого подхода рассматриваются в рамках конкретных реализаций SQL, или реализаций WWW и WEB.

Однако в указанных выше реализациях функция логического обоснования запросов смещена на пользователя базы данных, в Prolog-программе предусматривается построение базы знаний инженером и применяется постоянное сопровождение пользователя во время сеанса логического вывода.

1. Описание БЗ

Определение 1. Содержанием знания «если Xj &...& XK, то XK+1 &... & XK+L » называется множество W = Пі х П2 х... х nK+L . Произвольный элемент этого множества называется элементом содержания знания.

Содержанием условия знания называется множество Wj = Пі х П2 х... х Пк. Произвольный элемент этого множества называется элементом содержания условия знания.

Содержанием следствия знания называется множество W2 = Пк+і х Пк+2 х ...х ^ . Произвольный элемент этого множества называется элементом содержания следствия знания.

Определение 2. Под вероятностью р; элемента содержания знания w; є W будем понимать вероятность события, состоящего в том, что все предикатные константы, составляющие w;, примут логическое значение «И» при подстановке в значение вместо аргументов объектов из областей истинности переменных предикатов, составляющих это знание.

Все решения в предметной области принимаются на основании анализа заключений экспертов и специалистов с опытом работы. База знаний информационной системы рассматривается согласно [1, 2] как набор информационных сущностей атомарных предикатов с некоторого информационного пространства ш . Все изменения, которые происходят в БЗ, рассматриваются как следствие модификаци-онных предикатных запросов Qm . Основой самих предикатных запросов является набор модифика-ционных предикатных правил:

Qm О (KB)<<

KB-(X)

KB+(X)

<<,

(1)

где X еШ , Kb+(X означает, что атомарный предикат должен быть включен в базу знаний Kb ; Кв означает, что X должен быть исключен из базы знаний; (Kb)<< означает модификацию базы знаний на уровне логической связности предикатных правил, как следствие использования операций добавления и исключения правил; KB±(X) означает возможность модификации не только базы знаний, но и защиту самого пользователя на основе дискрипторов; << рассматривается как комплексная стрелка, особенности которой исследуются теорией категорий.

2. Извлечение знаний

Знания можно представить в виде продукционных правил типа [3]:

«если X1 & ...&XK, то XK+1 &...&XK+L », где Xj...Xk , Xk+1- Xk+l — некоторые предикаты.

Элемент содержания знания wj представляет собой

вектор, компонентами которого являются значения переменных предикатов, входящих в это знание. Элементу содержания знания wj можно поставить в соответствие вектор Zj = Zj(1) Zj(K + L)

из Rk+l .

Функция распределения знаний — это функция от К + L аргументов: F(y) = F(y(1),y(2),...,y(K + L)) с

областью определения Rk+l , принимающая значения в пространстве R1. Она вычисляется по формуле F(y) = ^ pj , где zj — отображение элемента

zj < y

содержания знания wj в Rk+l . Выражение zj < y понимается как выполнение условий: zj(i) < y(i), i = 1, К + L .

Определение 3. Расстоянием между сравнимыми знаниями ЗН1 и ЗН2 назовем расстояние Хеллин-

гера d(G, Q) между двумя распределениями вероятностей их элементов содержания

G = {pm p12> p1r. •••} и Q = {p2b p22,-,p2r,--> ,

которое вычисляется по следующей формуле:

d(G,Q) = £ц/й~. (2)

Вычисляя расстояние между знаниями, решаем задачу распределения извлеченного нового знания. Определяется расстояние между новым знанием и всеми имеющимися знаниями в БЗ, а затем новое знание относится к подмножеству, содержащему такое знание, для которого расстояние принимает наименьшее значение.

РИ, 2005, № 2

119

3. Принятие решений

Несмотря на то, что принятие решений осуществляется в выбранном подмножестве знаний, для сложных систем и процессов адекватное математическое описание принятия решений отсутствует либо представляет собой достаточно громоздкие математичес -кие конструкции, оптимизация которых и практическое использование в реальном времени невозможны. Эта проблема может быть решена применением алгоритмов, построенных на моделях, имитирующих процесс принятия решений опытным экспертом. Для большого числа моделей принятия решений в качестве математического аппарата может быть использована теория нечетких множеств. При выборе решений в ситуационных центрах целью этапов проектирования является выбор его варианта или значения параметра из достаточно небольшого заранее заданного множества, определенного, как уже говорилось ранее, с помощью формулы (2). Для моделирования процесса принятия решений предлагается использовать модели, основанные на нечетком правиле modus ponens, нечеткой индуктивной схеме вывода и нечеткой экспертной информации второго рода. При этом будет применяться индуктивная схема вывода вида [4]:

^Если Вь тоА^; ^Если В2, тоА2^;

ЕР =\

^Если

Вш, тоАш);

A'- истинно

(3)

B' - истинно

(ЕслиА,тоВ^ = (Если -В, то -.А),

Здесь выражения А и В являются отрицательными выражениями А и В.

Применяя правило контрапозиции к выражениям LVj ', j = 1,..., m системы второго типа, получаем

^Если Bj,TO Aj ^ = ^Если -iAj, то -.Bj^,

где высказывания -■ A и B j можно рассматривать

как высказывания (р w есть аk) и (р у есть а^,

* *

k = Wj и l = Vj , в которых значения a k и а і определяются функциями принадлежности рk и р і, являющимися дополнениями к р n и Р p , где n = Wj и p = Vj :

рk(w) = 1 - рn (w), V w є W = X x Y x Z x ..., pl(v) = 1 -pp(v),Vvє V .

Выводы

Научная новизна разработанного подхода состоит в том, что информационная интеллектуальная система на основании БД и БЗ позволяет формировать и пополнять базу данных и знаний, после чего самостоятельно преобразует проанализированные знания в параметры модели для принятия решений по определенному подмножеству.

Практическая значимость: данный подход уменьшает время, необходимое для принятия решения по подмножествам, в среднем на 20%. Результат получен за счет экономии времени на этапе извлечения знаний из БЗ, а также за счет использования расстояния Хеллингера на этапе сравнения и классификации новых знаний.

Здесь четкие высказывания A' и B' имеют следующий вид:

A': (pW есть w'); B': (pV есть v'),

w' = (x, y, z...) є Xx Y xZx..., v'є V .

В данной схеме вывода высказывания о значениях входных параметров являются посылкой для самой схемы (высказывание A') и следствием внутри системы L2 высказывания (высказывания Aj), а высказывания о значениях выходных параметров являются следствием для схемы вывода (3) (высказывание B'), но посылкой внутри схемы L2 (высказывания B j). Поэтому для выбора значений выходного параметра V на основе правила modus ponens необходимо преобразовать схему вывода (3) к виду:

l(1)

A' - истинно

В' - истинно

Для этого предлагается преобразовать систему высказываний второго типа в эквивалентную ей систему первого типа, используя правило контрапозиции, согласно которому для произвольных выражений А и в высказывания "ЕСЛИ А, ТО В" и "ЕСЛИ —.В, ТО ^А" эквивалентны, т.е.

Литература: 1. Шекета В. Модифікаційні предикатні запити // Проблеми програмування Інституту Програмних Систем НАН України. 2004. №2-3. С.339-343 / / Спеціальний випуск за матеріалами 4 МНПК «Укр-Прог2004», 1-3 червня 2004. Київ, Кібернетичний центр НАН України. 2. Sheketa V.I. Predicate queries modification, as an tool to work with the knowledgebases of oil and gas subject domain // In proceedings of 6-th International scientific conference “Modern problems of Radio Engineering, telecommunications and Computer science — TCSET’2004”. Lviv-Slavsko. 2004. February 2428. P.315-319. 3. Коваль В.Н., Кук Ю.В. Извлечение и анализ знаний // Искусственный интеллект. 2004. №3 С.293-304. 4. Малышев Н.Г., Берштейн Л.С., Боженюк А.В. Нечеткие модели для экспертных систем в САПР. М.: Энергоатомиздат, 1991. 136 c.

Поступила в редколлегию 27.05.2005

Рецензент: д-р физ.-мат. наук, проф. Смеляков С.В.

Куземин Александр Яковлевич, канд. техн. наук, проф. каф. информатики ХНУРЭ. Научные интересы: системный подход в проектировании и программировании. Адрес: Украина, 61166, Харьков, пр. Ленина, 14, тел. 702-15-15.

Фастова Дарья Владимировна, аспирантка каф. информатики ХНУРЭ. Научные интересы: проектирование информационных систем, системный анализ. Адрес: Украина, 61166, Харьков, пр .Ленина, 14, тел. 702-15-15.

Янчевский Игорь Владимирович, ген. директор ЗАО ПО «ВТ и СА», соискатель каф. информатики ХНУРЭ. Адрес: Украина, 61166, Харьков, пр Ленина, 14, тел. 70215-15.

120

РИ, 2005, № 2

i Надоели баннеры? Вы всегда можете отключить рекламу.