Научная статья на тему 'Анализ современного состояния автоматизированных систем приобретения и представления знаний'

Анализ современного состояния автоматизированных систем приобретения и представления знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
624
106
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНФОРМАЦИОННОАНАЛИТИЧЕСКАЯ СИСТЕМА / АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ ПРИОБРЕТЕНИЯ ЗНАНИЙ / ХРАНИЛИЩА ДАННЫХ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / ВИТРИНЫ ДАННЫХ / СТРУКТУРНАЯ СХЕМА / ЭС / МЕТАЗНАНИЯ / INFORMATION-ANALYTICAL SYSTEM / THE AUTOMATED SYSTEMS OF ACQUISITION OF KNOWLEDGE / STOREHOUSES OF DATA / THE INTELLECTUAL ANALYSIS OF DATA / SHOWWINDOWS OF DATA / THE BLOCK DIAGRAMME / METAKNOWLEDGE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Курейчик В. В., Сороколетов П. В., Щеглов С. Н.

В работе проводится анализ современного состояния автоматизированных систем приобретения и представления знаний. Показаны различные классификации систем приобретения знаний. Выявлены основные группы проблем, характерных для этих систем. Предложена структурная схема систем приобретения знаний. Проведен анализ моделей представления знаний. Рассмотрены вопросы, возникающие при решении проблемы представления знаний. Показаны качественные и количественные показатели экспертной системы, которые могут быть улучшены за счет использования метазнаний, т.е. знаний о знаниях. Перечислены возможные назначения метазнаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Курейчик В. В., Сороколетов П. В., Щеглов С. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The analysis of a modern condition of the automated systems of acquisition and representation of knowledge

In work the analysis of a modern condition of the automated systems of acquisition and representation of knowledge is carried out. Various classifications of systems of acquisition of knowledge are shown. The basic groups of problems, characteristic for these systems are revealed. The block diagramme of systems of acquisition of knowledge is offered. The analysis of models of representation of knowledge is carried out. The questions arising at the decision of a problem of representation of knowledge are considered. Are shown qualitative and quantity indicators of expert system which can be improved at the expense of use of metaknowledge, i.e. knowledge of knowledge. Possible appointments of metaknowledge are listed.

Текст научной работы на тему «Анализ современного состояния автоматизированных систем приобретения и представления знаний»

УДК 519.712.2

В.В. Курейчик, П.В. Сороколетов, С.Н. Щеглов

АНАЛИЗ СОВРЕМЕННОГО СОСТОЯНИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРИОБРЕТЕНИЯ И ПРЕДСТАВЛЕНИЯ ЗНАНИЙ*

В настоящее время в механизмах автоматизированного приобретения знаний можно выделить две основные группы. Это автоматизированные системы приобретения знаний от экспертов с использованием множества наработанных технологий и методологий [1]. И новое направление - автоматизированные системы извлечения знаний без участия экспертов из существующих знаний и из текстов, массивов данных (Data mining, Knowledge Discovery in Databases) [2, 3]. Представители обоих направлений широко известны программными средствами, первое поколение которых появилось еще во второй половине 80-х годов. Это SIMER+MIR, OPAL, TEIRESAIS, АРИАДНА [4, 5]. Второе поколение, начиная с 90-х годов [6] представлено широким применением методологии KADS, в основе которой лежит понятие интерпретационной модели, позволяющей рассматривать процессы структурирования и формализации знаний как «интерпретацию» лингвистических знаний в другие представления и структуры. Представитель, данной методологии оболочка CommonKADS, KELLY, MEDIS [6, 7]. Третье поколение - это более слож-, , -ций, достижения программных средств и CASE-технологий [8], представлено в [1].

Существуют различные классификации систем приобретения знаний - по выразительности и мощности инструментальных средств, по обобщенным характери, ,

[5-9]. , -

дующую схему систем приобретения знаний, представленную на рис. 1.

Обобщая современное состояние программных средств приобретения знаний, можно выявить две группы проблем, характерных для этих систем [6]:

а) методологические проблемы:

♦ слабая проработанность;

♦ отсутствие единого теоретического базиса теоретических аспектов процессов извлечения знаний; процедуры структурирования знаний;

♦ жесткость моделей представления знаний;

♦ несовершенство математического базиса моделей представления знаний;

♦ эмпиричность процедуры выбора программного инструментария и про-

;

) :

♦ отсутствие концептуальной целостности и согласованности между отдельными приемами и методами инженерии знаний;

♦ недостаток квалифицированных спе циалистов в области инженерии знаний;

♦ неполнота методов структурирования знаний, отсутствие классификации и рекомендаций по выбору подходящего метода;

♦ жесткость программных средств, их низкая адаптивность.

Несмотря на имеющиеся недоработки в методологии и технологии, автоматизированные системы знаний позволяют расширять рынок ЭС [9]. Улучшение в

* Работа выполнена при поддержке РФФИ (гранты № 07-01-00174, № 08-01-00473).

системах эргономических показателей, использование знании о процессе извлечения и преобразования знаний расширяют возможности автоматизации процесса . , которые имеют банки данных, машины поиска знаний из данных.

По типу организации

Тип:

приобретаемого

Модель

представления

Методы

К

По типу взаимодействия

Поколения систем приобретения знаний

С обратной связью

Без обратной связи

Микро

Макро

Комплексный

Фактические

знания

Формируемые

Фиксированные

Ориентация на аналитика

Ориентация на эксперта

Кластерные

Интервью

Экспертные игры

Бионические

С использованием: методов психосемантики:

Наблюдение и другие

гГ

к

Правила

Взаимосвязи:

Продукции:

Фреймы

Сети

Факторный анализ

Многомерное

шкалирование

Сетевое

шкалирование

Репертуарные

решетки:

Кластерный анализ

знания

Рис. 1. Классификация систем приобретения знаний

Анализ моделей представления знаний. Существует множество моделей . -

лям представления знаний [6, 10, 11]:

♦ продукцио нная модель;

♦ логическая модель;

♦ фреймов ая модель;

♦ модель семантической сети.

Продукционная модель основывается на множестве правил. Схематически правила в продукционной системе можно представить в обобщенной форме: Р1,....,Рт-> р1,....ри , которая читается следующим образом: если предпосылки Р1 и Рт верны, то можно выполнить действия р1 и ри. Предпосылки часто называют условиями, а действия - заключениями. Продукционная модель чаще всего применяется в промышленных экспертных системах. Она хороша своей наглядностью, высокой модульностью, простотой механизма логического вывода, легкостью внесения дополнений и изменений.

Логические модели основываются на классическом исчислении предикатов 1-го порядка, когда предметная область или задача описывается в виде набора аксиом. Исчисление предикатов 1-го порядка в промышленных экспертных системах практически не используется [6].

Фреймовая модель определяется как структура данных для представления стереотипных ситуаций [12]. Эта структура содержит разнообразную информацию: об объектах и событиях, которые следует ожидать в той или иной ситуации, о том, как использовать информацию, имеющуюся во фрейме. Фрейм Б является средст-,

сущности в структуру записей, которая состоит из слотов-у1 и наполнителей-щ. Системы фреймов оказываются значимыми в САПР, так как они создают средства структурирования эвристических знаний, связанных с приложением правил и классификацией объектов. При использовании фреймов эвристические знания не «размываются» по программному коду приложения, но и не собираются воедино в виде метазнаний, а распределяются между теми видами объектов, к которым они при, -

[1].

Семантическая сеть - это ориентированный граф, вершины которого - понятия, а дуги - отношения между ними [6]. В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения - это связи. Наиболее часто в

: « - », « -», « - » . .; ; ; пространственные; временные; атрибутивные; логические связи; лингвистические. Недостатком семантической сети является сложность процедуры поиска вывода на .

Форма представления знаний существенно влияет на характеристики и свой, , -ной из важных проблем в области интеллектуализации САПР и искусственного интеллекта (ИИ).

,

определения состава знаний. Эти две проблемы взаимообусловлены. Действитель-

,

либо неэффективным для выражения некоторых знаний. Вопрос представления знаний можно разделить на две независимые задачи: как организовать (структурировать) знания и как представить знания в выбранной форме. Стремление выделить организацию знаний в самостоятельную задачу вызвано тем, что эта задача возникает для любого языка представления и способы решения этой задачи являются практически схожими, вне зависимости от используемого формализма.

При решении проблемы представления знаний необходимо рассмотреть сле-:

♦ определение состава представляемых знаний;

♦ определение ор ганизации знаний;

♦ определение формы представления знаний.

В частности, для ЭС представление знаний, т.е. определение модели пред, :

♦ проблем ной средой;

♦ архитектурой эк спертной системы;

♦ потребностями и целями пользователей;

♦ языком общения.

При проектировании модели знаний в САПР очень важно учитывать архитектуру экспертной системы. И с учетом архитектуры экспертной системы знания целесообразно делить на интерпретируемые и неинтерпретируемые. К первому типу относятся те знания, которые сам решатель способен интерпретировать (ин-). . их структуры и содержания. Если эти знания используются каким-либо компонентом системы, то он не "осознает" этих знаний. Неинтерпретируемые знания подразделяются на вспомогательные знания, хранящие информацию о лексике и грамматике языка общения, о структуре диалога, и поддерживающие знания. Вспомогательные знания обрабатываются естественно-языковой компонентой, но процесс этой обработки решатель не осознает, так как этот этап обработки входных сообщений является вспомогательным для проведения экспертизы. Поддерживающие знания используются при создании системы и при выполнении объяснений. Поддерживающие знания исполняют роль описаний, как интерпретируе-, . -ческие и семантические знания. Технологические знания содержат сведения о времени создания описываемых ими знаний, об авторе знаний и т.п. Семантические поддерживающие знания содержат смысловое описание этих знаний. Они содержат информацию о причинах ввода знаний, о назначении знаний, описывают способ использования знаний и получаемый эффект. Поддерживающие знания имеют .

Интерпретируемые знания можно разделить на предметные знания, управляющие знания и знания о представлении. Знания о представлении содержат информацию о том, каким образом (в каких структурах) в системе представлены ин-.

Предметные знания содержат данные о предметной области и способах преобразования этих данных при решении поставленных задач. Отметим, что по отношению к предметным знаниям знания о представлении и знания об управлении . -ственно предметные знания. Описатели содержат определенную информацию о предметных знаниях такую, как: коэффициент определенности правил и данных, меры важности и сложности. Предметные знания разбиваются на факты и испол-. -теристик предметной области. Исполняемые утверждения содержат информацию о , . Другими словами, исполняемые утверждения - это з нания, задающие процедуры обработки. Эти знания могут быть заданы не только в процедурной, но и в декларативной форме [13].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Качественные и количественные показатели экспертной системы могут быть улучшены за счет использования метазнаний, т.е. знаний о знаниях. Метазнания не представляют некоторую единую сущность, они могут применяться для достижения различных целей. Перечислим возможные назначения метазнаний:

1)

;

2)

правил из области экспертизы;

3) -ских ошибок в предметных правилах;

4) метаправила позволяют системе адаптироваться к окружению путем перестройки предметных правил и функций;

5) метаправила позволяют явно указать возможности и ограничения системы, т.е. определить, что система знает, а что не знает.

Вопросы организации знаний необходимо рассматривать в любом представ,

(модели) представления. Выделим следующие аспекты проблемы организации знаний:

♦ организация знаний по уровням пре дставления и по уровням детальности;

♦ организация знан ий в рабочей памяти;

♦ организация знаний в базе знаний.

Для того чтобы экспертная система могла управлять процессом поиска реше-, , должна уметь не только использовать свои знания, но и обладать способностью понимать и исследовать знания, т.е. экспертная система должна иметь знания о , . среде назвать знаниями нулевого уровня представления, то первый уровень представления содержит метазнания, т.е. знания о том, как представлены во внутреннем мире системы знания нулевого уровня. Первый уровень содержит знания о том, какие средства используются для представления знаний нулевого уровня. Знания первого уровня играют существенную роль при управлении процессом решения, при приобретении и объяснении действий системы. В связи с тем, что знания первого уровня не содержат ссылок на знания нулевого уровня, знания первого уровня независимы от проблемной среды. Число уровней представления может быть больше двух. Второй уровень представления содержит сведения о знаниях первого уровня, т.е. знания о представлении базовых понятий первого уровня. Разделение знаний по уровням представления обеспечивает расширение области применимости системы [14].

Выделение уровней детальности позволяет рассматривать знания с различной .

спецификой решаемых задач, объемом знаний и способом их представления. Как правило, выделяется не менее трех уровней детальности, отражающих соответст-, . -ких уровней детальности обеспечивает дополнительную степень гибкости системы, это позволяет производить изменения на одном уровне, не затрагивая другие. Изменения на одном уровне детальности могут приводить к дополнительным изменениям на этом же уровне, что оказывается необходимым для обеспечения согласованности структур данных и программ.

Рассмотрев различные модели и подходы к организации знаний, необходимо ,

, -

ставляется возможным описать одной моделью. Поэтому при создании экспертной системы необходимо применительно к её архитектуре обеспечить эффективное использование всех имеющихся в системе видов знаний, что возможно при построении её в виде гибридной экспертной системы. Разнородные знания целесообразно классифицировать и для каждого вида использовать определённую модель .

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Джексон П. Введение в экспертные системы. - М.: Издательский дом «Вильямс»,

2001. - 624 с.

2. Дюк В., Самойленко A. Data Mining: учебный курс. - СПб.: Питер, 2001. - 368 с.

3. Городецкий В.И., Самойлов В.В., Малое О.А. Современное состояние технологии извлечения знаний из баз и хранилищ данных. Ч. I // Новости искусственного интеллекта. -

2002, №3. - С. 3-12.

4. Осипов ГС. Приобретение знаний интеллектуальными системами. - М.: Наука, 1997. - 112 с.

5. Boose J. and Gaines B. Knowledge Acquisition Tools for Expert Systems. New York: Academic Press. 1988. p. 620.

6. Гаврилова ТА. Хорошевский В.Ф. Базы знаний интеллектуальны систем. - СПб: Питер, 2000. - 384 с.

7. Kingston J., Doheny J., Filby I. Evaluation of workbenches which support the Common KADS methodology. Knowledge Engineering Review. 1995. №10.

8. . . . - .: , 2002. -464 .

9. . ., . ., . ., . . -

пертные системы // Под ред. Попова Э.В. - М.: Финансы и статистика, 1996. - 320 с.

10. . . . // 3 . . 1. - :

, 1990. - 464 .

11. . ., . . . -

шений. - Рига: Зинатне, 1997. - 320 c.

12. Минский М. Фреймы для представления знаний / Пер. с англ. - М.: Энергия, 1979. - 152 с.

13. . ., . . . - .: - .

Н.Э. Баумана, 2003. - 348 с.

14. . ., . ., . . -

ной практике. - Таганрог: ТРТУ, 1996. - 135 с.

УДК 518.5:331.108.26

С.В. Скороход

ОТБОР ПЕРСОНАЛА В УСЛОВИЯХ НЕЧЁТКОЙ ИНФОРМАЦИИ НА ОСНОВЕ ЭКСПЕРТНЫХ ОЦЕНОК

. -

альной для любого предприятия. От её решения зависят качество и отдача каждого сотрудника и конечный успех предприятия в целом.

Характерными особенностями данной проблемы являются субъективность и неопределенность. Субъективность выражается в том, что оценку и подбор персонала производят люди со своими стереотипами, симпатиями, предпочтениями, которые иногда могут идти вразрез с целями самого предприятия. Неопределенность проявляется в неточных формулировках требований типа «уверенное владение Microsoft Word», «опытный пользователь ПК», «умение работать в команде», допускающими трактовку в очень широких пределах.

Одним из наиболее достоверных методов профессионального отбора является выполнение кандидатами специально подготовленных заданий с последующей оценкой результата группой экспертов [1]. Несмотря на преимущества данного ,

.

Задачей данной работы является разработка математической модели для сравнения кандидатов по результатам тестирования с использованием теории нечётких множеств и нечёткой математики [2, 3], которые позволяют формализовать присущие этому процессу свойства субъективности и неопределенности.

Общая схема отбора. Общая схема отбор а изображена на рис. 1.

i Надоели баннеры? Вы всегда можете отключить рекламу.