Научная статья на тему 'Систематизация базы знаний в информационных системах'

Систематизация базы знаний в информационных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
681
139
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАЗА ЗНАНИЙ / ЭКСПЕРТНАЯ СИСТЕМА / АТРИБУТ / ДОМЕН / БИНАРНОЕ ОТНОШЕНИЕ / МНОЖЕСТВА И ИЗОБРАЖЕНИЕ / KHOWLEDGE BASE / EXPERTISE SYSTEM / ATTRIBUTE / DOMEN / BINARY RELATION / MULTITUDES AND DEPICTION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Боскебеев Калычбек Джетмишбаевич

Предоставление студентам максимально возможной самостоятельной работы с учебным материалом по конкретной дисциплине с помощью интеллектуальных обучающих систем и самоконтроль получаемых знаний с применением современных инновационных информационных технологий. Предложена систематизация базы знаний в информационных системах, которая обусловливает необходимость компьютерной поддержки процессов формализации и извлечения знаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Systematization of Knowledge Base in Informational Systems

Students are endowed with maximum of availabilities for self-sufficient work with educational material on a concrete discipline by dint of intellectual teaching systems, they are enabled with self-control of obtained knowledge through application of modern innovational-informative technologies. The author proposes a systematization of a khowledge base in informational systems which precondition a necessity of computer support in regard to the process of knowledge extraction formalization.

Текст научной работы на тему «Систематизация базы знаний в информационных системах»

УСУЛИ ТАЪЛИМ МЕТОДИКА ПРЕПОДАВАНИЯ METHODS OF TEACHING

УДК: 6Ф8 К.Д. БОСКЕБЕЕВ

ББК 32.97

СИСТЕМАТИЗАЦИЯ БАЗЫ ЗНАНИЙ В ИНФОРМАЦИОННЫХ

СИСТЕМАХ

Цель исследования. Разработка языка интеллектуальной системы логического анализа и моделирования в области системы обучения студента. Процессы совершенствования и развития системы знаний требуют систематического пополнения базы знаний [1, с. 34]. При этом общий объем работ возрастает. Требуется обеспечить согласованность всей совокупности, а не только вновь вводимой порции знаний.

Модель исследования. В настоящей статье предлагается новое применение теории приближенного множества, являющейся обобщением и дальнейшим развитием алгебраических теорий и обладающей универсальной возможностью для подачи знаний при обучении и обработке знаний пользователя. Формальное описание подачи знаний в обучении, системы, отражающей модель представления знаний в экспертных системах.

Появление экспертных систем в рамках исследований в период, когда искусственный интеллект (ИИ) (artificial intelligence) переживал серьезный кризис, было необходимо в качестве существенного прорыва в развитии практических приложений [3, с. 12]. Этот прорыв произошел, когда на смену поискам универсального алгоритма мышления и решения задач исследователям пришла идея моделировать конкретные знания специалистов-экспертов. Так в США появились первые коммерческие системы, основанные на знаниях, или экспертные системы (ЭС). Эти системы по праву стали первыми интеллектуальными системами, и до сих пор единственным критерием интеллектуальности является наличие механизмов работы со знаниями. Так появился новый подход к решению задач искусственного

И

интеллекта — представление знаний. Знания — это хорошо структурированные данные, или данные о данных, или метаданные. Статья посвящена средствам, позволяющим облегчить подготовку базы четких знаний в информационных системах. Для анализа и систематизации знаний используется теория приближенных множеств [4, с. 342].

Приближенные множества базируются на понятии пространства аппроксимации и способе аппроксимации множества и семейства множеств. Пространство аппроксимации -это упорядоченная пара А = (и, Я), в которой U является универсумом, a Я - бинарным

отношением И Е и X и Определенное на универсуме И бинарное отношение Я является отношением эквивалентности и разбивает множество, которое определено на классы эквивалентности, образующие фактор - множество этого отношения.

Для аппроксимации подмножества X универсума и вводится понятие

нижняя аппроксимации X

_Д X = [х ё Е7: цх]1 ^ X} (11)

и $ - верхняя аппроксимации X

Для произвольного подмножества X £ X если = то X - Я -

различимое. Если _^ , то тогда - приближенное множество.

На основе введенных понятий вводятся определение точности и приближенности аппроксимаций множества и определение по аппроксимации семейства множеств.

Единица знаний характеризует некоторый объект через его свойства и отношения с другими объектами. Объект характеризуется некоторой совокупностью атрибутов.

Определение. Информационная система - это упорядоченная четверка:

где и - непустое конечное множество-универсум,

О- непустое конечное множество атрибутов,

^ ^ I/ П

Че(2 , где Я - домен атрибута Я Ё У ,

.функция информации, для которой Е для

каждого Ч е 0 и ^ е ^ .

Информацией о * в ^ называют функцию [х:0 такую, которая

fxІЯ) = _Г(^' Я) для каждого Ч в Я .

Пусть ^ ^ Q $ ~ множество атрибутов). Через ^ обозначим бинарное отношение на множестве объектов, для которых совпадают значения атрибутов для

каждого Ч е Р . Или ^ для каждого ^ — 0 . Множество атрибутов ^

зависит от множества атрибутов ^ в записи ^ ^ , если Р ~1* $.

Р

Определение. Подмножество атрибутов г независимое в ^ , если для каждого

В с ^ ^ в противном случае Р - зависимое в ^ .

На понятие зависимости между атрибутами объектов вводится определение редукта.

Определение. Подмножество ^ е ^ е 0 является редуктом В ^ если ^ максимальное (в смысле включения) независимое подмножество В.

Принципиально важным для построения модели предметной области является

следующий вывод: если ^ — редукт ^ , то ^ = ^.

Определение. Атрибут Р е Р лишний в Р , если ^ (' , то в

противном случае Р не удаляемый из ^ .

Определение. Множество всех не удаляемых атрибутов называется ядром ^ в

записи

СОНЕ(Р) = {р вР-.РъР-}*}- (1.4)

Свойство. Пусть RED(P) обозначает семейство всех редуктов Р. Верно, что

СОЕЕ№= р| В.

(1.5)

Определение. Множество атрибутов В зависит в степени

к

^ С О — — 1) от множества атрибутов ^ в системе ^ , в записи

если ^ — 3 р Где 3' р — является Р ~ качеством аппроксимации в системе .V, Если

^ , то ^ в целом зависит от ^ ,

^ ^ , то ^ частично зависит от ^ ,

^ ^ , то ^ не зависит от ^ .

В работе З. Равлака рассматривается применение теории приближенных множеств для устранения противоречивости и избыточности системы продукций частного вида -таблицы решений. Путем вычисления редуктов исходного множества правил из таблицы

решений удаляются лишние атрибуты и правила. Для этого множество атрибутов О разбивается на два непересекающихся подмножества: ^ — условные атрибуты и - решающие атрибуты.

СиО = (2,СпО =0. (1.6)

Таблица решений представляется в виде упорядоченной пятерки:

где ^ — конечное множество, универсум; г _

ь конечное множество условных атрибутов; п, _

и конечное множество решающих атрибутов;

ПсСиО — домен атрибута а, /'• 1ТХ(.С1Ю^ —<* V такая

решающая функция, что Ё д для каждого ^ е С1Ю и Л' ё I]

Пусть ПТ < .> - хаблица решений, и пусть ^ — *3 ■

Подмножество ^ независимо в ПТ, если для каждого В с А, В с А.

Подмножество ^ зависимо в ПТ, если существует & с А, такое, что В = А.

Подмножество В £ А называется редуктом множества ^ в ПТ если ^ -

максимальное независимое подмножество в ПТ Подмножество В £ А есть редукт множества ^ относительно С — Я в ПТ если ^ - независимое

подмножество множества ^ , такое, что Р08В(С*) = Р08Л(С*). Если ^ = С , редукт

&

^ относительно ^ совпадает с редуктом ^ . Если А-*В в ПТ и С редукт^

или редукт ^ относительно В в ПТ т0 С-їВ

Определение. Функция Я: СиП , —* V называется правилом решения в 1)1. если

существует ^ є ^ такое, что Ч = їхш Проекция д на С' (с[ С) и проекция <:/ на D (q/D) называются

соответственно условиями и решениями правила решения q.

Определение. Правило решения Ї называется детерминистическим правилом

решения в ИТ, если для каждого %,у с II X Ф у из С С вытекает їх_ _їу_

О О , в противном случае Ї ~ недетерминистическое правило решения.

Определение. Таблица решений

называется корректно определенной, если

все правила решения являются детерминистическими, в противном определена некорректно.

случае

Свойство. Таблица решений

корректно определена

тогда и только тогда, когда

С

. Множество атрибутов D зависит от множества ^ РР ТЛЯ (Г £ и

И

атрибутов ^ в "■' в записи ^ ** , если

Если ^ - редукт условных атрибутов ^ в таблице решений

^ В ТО С -» О эт0 значит, что можно упростить, редуцируя множество условных атрибутов. Существование зависимости между атрибутами используем для уменьшения их количества.

Определение. Подмножество ^ — О — 0 является редуктом О В

с о

- МаКСИМаЛЬНО 11 [11 '1 и м;' м \ 1 М[' т т мт \ т м мм.'[ 'пип

независимое подмножество

недетерминистических правил решения находим проекцию , и на “/а. где = ), Кс0‘

г

D

Для на ,

если

выделения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Л

то есть

Согласно свойствам

можно провести декомпозицию таблицы решений ■ равнозначно разложив ее на две таблицы решений

1 □

такие, что Сдля ^ ^1 и С->0 для О Тх где 1\, ]/3. прообразы функций

ии

Этот формализм приближенных множеств позволяет применить его для разработки экспертной системы в обучении.

Основу экспертной системы составляет база знаний, которая накапливается в процессе ее построения. Знания выражены в явном виде и организованы так, чтобы упростить принятие решений. Задача, ставящая обычного человека в затруднительное положение, решаема экспертом. Экспертные системы призваны заменить специалиста в конкретной области, т.е. решить задачи в отсутствие эксперта. Во-первых, необходим механизм представления знаний в конкретной предметной области и управления ими. Для реализации этих функций используется механизм, называемый базой знаний. Во-вторых, необходим механизм, который на основе знаний, имеющихся в базе знаний, способен делать логические выводы. Этот механизм называется механизмом логических выводов. В- третьих, необходим интерфейс для правильной передачи ответов пользователю. В противном случае пользоваться такой системой крайне неудобно. Механизмом, реализующим эту функцию, является пользовательский интерфейс. В-четвертых, необходим механизм получения знаний от эксперта, поддержки базы знаний и дополнения ее при

необходимости. Механизмом, реализующим эти функции, является модуль приобретения знаний. В-пятых, необходим механизм, который не только способен давать заключение, но и представлять различные комментарии, прилагаемые к этому заключению, и объяснять его мотивы. В противном случае пользователю будет трудно понять заключение. Такое понимание необходимо, если заключение используется для консультации или оказания помощи при решении каких-либо вопросов. Механизм, реализующий эти функции, называется модулем советов и объяснений.

Перечисленные структурные элементы являются наиболее характерными, хотя в реальных экспертных системах их функции могут быть усилены соответствующим образом или расширены. Механизм объяснений играет весьма важную роль. Он важен как для пользователя, так и для эксперта, представляющего знания в конкретной области. Это обусловлено тем, что с его помощью эксперт определяет, как работает система, и позволяет точно выяснить, как используются знания, предоставленные им. По опыту нам известно, что большая часть знаний в конкретной предметной области остается личной собственностью эксперта. И это происходит не потому, что он не хочет разглашать своих секретов, а потому, что он не в состоянии сделать этого - ведь эксперт знает гораздо больше, чем сам осознает. Иначе говоря, необходимо извлечь знания, которыми подсознательно владеет специалист, и для этого используется модуль советов и объяснений.

Для реализации обучающей экспертной системы наиболее подходит распространенный язык логического программирования VisualProlog[5, с. 3]. Вначале была определена будущая структура экспертной системы с помощью теории информационных процессов и систем (см. рис.1.) в виде:

Рис. 1. Структура экспертной системы После того, как была создана обучающая экспертная система, мы переходим к созданию базы знаний. Для этого запустим программу обучающей экспертной системы (см. рис. 2).

Файл Правка Обучение Параметр Секция Заголовок Изображения Помощь Window

О

Рис. 2. Окно обучающей экспертной системы

В меню «Файл» находятся стандартные команды, такие как - «Создать», «Открыть», «Сохранить», «Сохранить как», «Печать», «Настройка печати», а также специальные пункты: «Загрузить сеанс» и «Сохранить сеанс». Меню «Правка» содержит также стандартные команды для редактирования текстовых значений: «Отменить», «Повторить», «Вырезать», «Копировать», «Вставить», «Удалить», «Выделить все», «Искать», «Искать снова», «Заменить» и

«Шрифты». Есть и специальная команда «Вставить», наведя на которую, можно открыть дополнительную вкладку с параметрами вставки.

В меню «Обучение» (см. рис. 3). подменю - пункт «Начать Обучение» используется для запуска загруженной базы знаний.

Файл Правка Я Параметр Секция Заголовок Изображения Помощь Window

ПШ Начать Обучение И Продолжить Обучение I

Совет, данный в последнем сеансе

Проверить Базу Знаний

Показать Базу Знаний

Рис. 3. Меню «Обучение»

Пункт «Проверить Базу Знаний» предназначен для автоматической проверки базы знаний на наличие ошибок.

Меню «Параметр» служит непосредственным инструментом для редактирования параметров, необходимых для создания базы знаний, и состоит из следующих пунктов: Новый Параметр, Изменить Параметр, Обновить Параметр, Удалить Параметр, Показать Текущий Параметр, Какое значение Параметра было установлено, Что, если Параметр изменит Свое Значение.

Команда picture (ga) отвечает за изображение, которое будет отображаться в создаваемом нами окне. В скобках указывается имя изображения, изначально загруженного в Базу Данных Изображений. Для того, чтобы посмотреть имеющиеся изображения в Базе Изображений или добавить новые, необходимо перейти в меню «Изображения» | «База Данных Изображений».

Для того, чтобы добавить свое изображение, нужно нажать на кнопку «Import» и выбрать любое изображение, хранящееся у вас на компьютере в формате *bmp. Так было реализовано первое окно, отвечающее за выбор разделов. Для его запуска нужно перейти в меню «Обучение» - «Начать Обучение».

Феномен понимания текста во многом еще остается загадочным. В интеллектуальных системах имеется способ уточнить интерпретацию этого термина. Можно, например, считать, что система понимает введенный в нее текст, если с точки зрения некоторого человека (или группы экспертов) она правильно отвечает на все вопросы, связанные с информацией, отраженной в тексте. Человек понимает речь и изображения и для решения всевозможных задач использует знания в конкретной предметной области. Для выполнения аналогичной работы компьютером эти знания необходимо представить в какой-нибудь форме и составить нужную программу. Знания можно помещать в прикладную программу, используя методы алгоритмического программирования на языках типа JAVA ,C#. Однако такой подход затрудняет понимание того, каким, таким образом используются знания и какую роль они выполняют. В отличие от такого подхода можно использовать системы, основанные на концепциях искусственного интеллекта и инженерии знаний, с чем связана предложенная обучающая экспертная система.

ВЫВОДЫ

1. Дается формальное описание извлечения, проверки знаний на полноту и непротиворечивость, а также последующей систематизации для включения в базу знаний.

2. Для обработки неточных знаний их необходимо дополнить следующими положениями из теории нечетких множеств и нечетких выводов.

3. Предлагается обучающая экспертная система, которая, в свою очередь, определяет уровни понимания текста. На первом уровне все вопросы прямо связаны с предложенным текстом, и ответы на них в явном виде содержатся в этом тексте.

Список использованной литературы:

1. Приобретение знаний: Пер. с япон. /Под ред. С. Осуги, Ю. Саэки. - М.: Мир, 1990.-

304 с.

2. Представление и использование знаний: Пер. с япон./Под ред Х. Уэно. М. Исидзука. -

М.:Мир, 1989. - 220 с.

3. Нейлор К. H. Как построить свою экспертную систему: Пер. с англ. — М.:

Энергоатомиздат, 1991. — 286 с: ил. ISBN 5-283-02502-0.

4. Rawlak Z. Rough Sets //Int. Inform. Comp.Sci.-11(1982)/- PP.341-386.

5. Боскебеев К.Д. Б85. Разработка экспертной системы с помощью логического языка в

среде VisualProlog 5.1.- Б.: ИЦ«Техник», 2008. - 110 с.

Reference Literature

1. Knowledge Acquiring: translation from Japanese/ Under the editorship of S. Osughi, Yu. Yu.

Salki. -M.: World, 1990. -304pp.

2. Presentation and Usage of Knowledge: translation from Japanese / under the editorship of

Kh. Ueno. -M.: Isidzuka. -M.: World, 1989. -220pp.

3. Neylor K.N. How to Build one's Expertise System: Translation from English. -M.:

Energoatomizdat, 1991. -286pp. ill ISBN 5-283-02502-0

4. Rawlak Z. Rough Sets //Int. Inform. Comp.Sci.-11(1982)/ - PP.341-386.

5. Beskebeyev K.D. B85. Elaboration of Expertise System by Means of Logical Language in

Visual/Prolog 5.1.. Environment 5.1. -Bishkek: IC “Technician”, 2008. -110pp.

Систематизация базы знаний в информационных системах

Ключевые слова: база знаний, экспертная система, атрибут, домен, бинарное отношение, множества и изображение

Предоставление студентам максимально возможной самостоятельной работы с учебным материалом по конкретной дисциплине с помощью интеллектуальных обучающих систем и самоконтроль получаемых знаний с применением современных инновационных информационных технологий. Предложена систематизация базы знаний в информационных системах, которая обусловливает необходимость компьютерной поддержки процессов формализации и извлечения знаний.

Systematization of Knowledge Base in Informational Systems

Key words: khowledge base, expertise system, attribute, domen, binary relation, multitudes and depiction

Students are endowed with maximum of availabilities for self-sufficient work with educational material on a concrete discipline by dint of intellectual teaching systems, they are enabled with self-control of obtained knowledge through application of modern innovational-informative technologies. The author proposes a systematization of a khowledge base in informational systems which precondition a necessity of computer support in regard to the process of knowledge extraction formalization.

Сведения об авторе:

Боскебеев Калычбек Джетмишбаевич, кандидат технических наук, доцент, завотделом науки и международных связей Кыргызского государственного технического университета им. И. Раззакова (Республика Кыргызстан), e-mail: kboskebeev@mail.ru

Information about the author:

Beskebeyev Kalychbek Djetmishbayevich, Candidate of Engineering Sciences, Associate Professor, Chief of the department of science and international relations under the Kyrgyz State Technical University named after I. Razzakov (Kyrgyzstan Republice), e-mail: kboskebeev@mail.ru

i Надоели баннеры? Вы всегда можете отключить рекламу.