Анализ современного состояния автоматизированных систем приобретения и представления знаний

Курейчик В.В.; Сороколетов П.В.; Щеглов С.Н.

УДК 519.712.2

В.В. Курейчик, П.В. Сороколетов, С.Н. Щеглов

АНАЛИЗ СОВРЕМЕННОГО СОСТОЯНИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРИОБРЕТЕНИЯ И ПРЕДСТАВЛЕНИЯ ЗНАНИЙ*

В настоящее время в механизмах автоматизированного приобретения знаний можно выделить две основные группы. Это автоматизированные системы приобретения знаний от экспертов с использованием множества наработанных технологий и методологий [1]. И новое направление - автоматизированные системы извлечения знаний без участия экспертов из существующих знаний и из текстов, массивов данных (Data mining, Knowledge Discovery in Databases) [2, 3]. Представители обоих направлений широко известны программными средствами, первое поколение которых появилось еще во второй половине 80-х годов. Это SIMER+MIR, OPAL, TEIRESAIS, АРИАДНА [4, 5]. Второе поколение, начиная с 90-х годов [6] представлено широким применением методологии KADS, в основе которой лежит понятие интерпретационной модели, позволяющей рассматривать процессы структурирования и формализации знаний как «интерпретацию» лингвистических знаний в другие представления и структуры. Представитель, данной методологии оболочка CommonKADS, KELLY, MEDIS [6, 7]. Третье поколение - это более слож-, , -ций, достижения программных средств и CASE-технологий [8], представлено в [1].

Существуют различные классификации систем приобретения знаний - по выразительности и мощности инструментальных средств, по обобщенным характери, ,

[5-9]. , -

дующую схему систем приобретения знаний, представленную на рис. 1.

Обобщая современное состояние программных средств приобретения знаний, можно выявить две группы проблем, характерных для этих систем [6]:

а) методологические проблемы:

♦ слабая проработанность;

♦ отсутствие единого теоретического базиса теоретических аспектов процессов извлечения знаний; процедуры структурирования знаний;

♦ жесткость моделей представления знаний;

♦ несовершенство математического базиса моделей представления знаний;

♦ эмпиричность процедуры выбора программного инструментария и про-

;

) :

♦ отсутствие концептуальной целостности и согласованности между отдельными приемами и методами инженерии знаний;

♦ недостаток квалифицированных спе циалистов в области инженерии знаний;

♦ неполнота методов структурирования знаний, отсутствие классификации и рекомендаций по выбору подходящего метода;

♦ жесткость программных средств, их низкая адаптивность.

Несмотря на имеющиеся недоработки в методологии и технологии, автоматизированные системы знаний позволяют расширять рынок ЭС [9]. Улучшение в

* Работа выполнена при поддержке РФФИ (гранты № 07-01-00174, № 08-01-00473).

системах эргономических показателей, использование знании о процессе извлечения и преобразования знаний расширяют возможности автоматизации процесса . , которые имеют банки данных, машины поиска знаний из данных.

По типу организации

Тип:

приобретаемого

Модель

представления

Методы

К

По типу взаимодействия

Поколения систем приобретения знаний

-с

С обратной связью

Без обратной связи

Микро

Макро

Комплексный

Фактические

знания

Формируемые

Фиксированные

Ориентация на аналитика

Ориентация на эксперта

Кластерные

Интервью

Экспертные игры

Бионические

С использованием: методов психосемантики:

Наблюдение и другие

гГ

-Ё

=с

к

-г

-с

Правила

Взаимосвязи:

Продукции:

Фреймы

Сети

Факторный анализ

Многомерное

шкалирование

Сетевое

шкалирование

Репертуарные

решетки:

Кластерный анализ

знания

Рис. 1. Классификация систем приобретения знаний

Анализ моделей представления знаний. Существует множество моделей . -

лям представления знаний [6, 10, 11]:

♦ продукцио нная модель;

♦ логическая модель;

♦ фреймов ая модель;

♦ модель семантической сети.

Продукционная модель основывается на множестве правил. Схематически правила в продукционной системе можно представить в обобщенной форме: Р1,....,Рт-> р1,....ри , которая читается следующим образом: если предпосылки Р1 и Рт верны, то можно выполнить действия р1 и ри. Предпосылки часто называют условиями, а действия - заключениями. Продукционная модель чаще всего применяется в промышленных экспертных системах. Она хороша своей наглядностью, высокой модульностью, простотой механизма логического вывода, легкостью внесения дополнений и изменений.

Логические модели основываются на классическом исчислении предикатов 1-го порядка, когда предметная область или задача описывается в виде набора аксиом. Исчисление предикатов 1-го порядка в промышленных экспертных системах практически не используется [6].

Фреймовая модель определяется как структура данных для представления стереотипных ситуаций [12]. Эта структура содержит разнообразную информацию: об объектах и событиях, которые следует ожидать в той или иной ситуации, о том, как использовать информацию, имеющуюся во фрейме. Фрейм Б является средст-,

сущности в структуру записей, которая состоит из слотов-у1 и наполнителей-щ. Системы фреймов оказываются значимыми в САПР, так как они создают средства структурирования эвристических знаний, связанных с приложением правил и классификацией объектов. При использовании фреймов эвристические знания не «размываются» по программному коду приложения, но и не собираются воедино в виде метазнаний, а распределяются между теми видами объектов, к которым они при, -

[1].

Семантическая сеть - это ориентированный граф, вершины которого - понятия, а дуги - отношения между ними [6]. В качестве понятий обычно выступают абстрактные или конкретные объекты, а отношения - это связи. Наиболее часто в

: « - », « -», « - » . .; ; ; пространственные; временные; атрибутивные; логические связи; лингвистические. Недостатком семантической сети является сложность процедуры поиска вывода на .

Форма представления знаний существенно влияет на характеристики и свой, , -ной из важных проблем в области интеллектуализации САПР и искусственного интеллекта (ИИ).

,

определения состава знаний. Эти две проблемы взаимообусловлены. Действитель-

,

либо неэффективным для выражения некоторых знаний. Вопрос представления знаний можно разделить на две независимые задачи: как организовать (структурировать) знания и как представить знания в выбранной форме. Стремление выделить организацию знаний в самостоятельную задачу вызвано тем, что эта задача возникает для любого языка представления и способы решения этой задачи являются практически схожими, вне зависимости от используемого формализма.

При решении проблемы представления знаний необходимо рассмотреть сле-:

♦ определение состава представляемых знаний;

♦ определение ор ганизации знаний;

♦ определение формы представления знаний.

В частности, для ЭС представление знаний, т.е. определение модели пред, :

♦ проблем ной средой;

♦ архитектурой эк спертной системы;

♦ потребностями и целями пользователей;

♦ языком общения.

При проектировании модели знаний в САПР очень важно учитывать архитектуру экспертной системы. И с учетом архитектуры экспертной системы знания целесообразно делить на интерпретируемые и неинтерпретируемые. К первому типу относятся те знания, которые сам решатель способен интерпретировать (ин-). . их структуры и содержания. Если эти знания используются каким-либо компонентом системы, то он не "осознает" этих знаний. Неинтерпретируемые знания подразделяются на вспомогательные знания, хранящие информацию о лексике и грамматике языка общения, о структуре диалога, и поддерживающие знания. Вспомогательные знания обрабатываются естественно-языковой компонентой, но процесс этой обработки решатель не осознает, так как этот этап обработки входных сообщений является вспомогательным для проведения экспертизы. Поддерживающие знания используются при создании системы и при выполнении объяснений. Поддерживающие знания исполняют роль описаний, как интерпретируе-, . -ческие и семантические знания. Технологические знания содержат сведения о времени создания описываемых ими знаний, об авторе знаний и т.п. Семантические поддерживающие знания содержат смысловое описание этих знаний. Они содержат информацию о причинах ввода знаний, о назначении знаний, описывают способ использования знаний и получаемый эффект. Поддерживающие знания имеют .

Интерпретируемые знания можно разделить на предметные знания, управляющие знания и знания о представлении. Знания о представлении содержат информацию о том, каким образом (в каких структурах) в системе представлены ин-.

Предметные знания содержат данные о предметной области и способах преобразования этих данных при решении поставленных задач. Отметим, что по отношению к предметным знаниям знания о представлении и знания об управлении . -ственно предметные знания. Описатели содержат определенную информацию о предметных знаниях такую, как: коэффициент определенности правил и данных, меры важности и сложности. Предметные знания разбиваются на факты и испол-. -теристик предметной области. Исполняемые утверждения содержат информацию о , . Другими словами, исполняемые утверждения - это з нания, задающие процедуры обработки. Эти знания могут быть заданы не только в процедурной, но и в декларативной форме [13].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Качественные и количественные показатели экспертной системы могут быть улучшены за счет использования метазнаний, т.е. знаний о знаниях. Метазнания не представляют некоторую единую сущность, они могут применяться для достижения различных целей. Перечислим возможные назначения метазнаний:

1)

;

2)

правил из области экспертизы;

3) -ских ошибок в предметных правилах;

4) метаправила позволяют системе адаптироваться к окружению путем перестройки предметных правил и функций;

5) метаправила позволяют явно указать возможности и ограничения системы, т.е. определить, что система знает, а что не знает.

Вопросы организации знаний необходимо рассматривать в любом представ,

(модели) представления. Выделим следующие аспекты проблемы организации знаний:

♦ организация знаний по уровням пре дставления и по уровням детальности;

♦ организация знан ий в рабочей памяти;

♦ организация знаний в базе знаний.

Для того чтобы экспертная система могла управлять процессом поиска реше-, , должна уметь не только использовать свои знания, но и обладать способностью понимать и исследовать знания, т.е. экспертная система должна иметь знания о , . среде назвать знаниями нулевого уровня представления, то первый уровень представления содержит метазнания, т.е. знания о том, как представлены во внутреннем мире системы знания нулевого уровня. Первый уровень содержит знания о том, какие средства используются для представления знаний нулевого уровня. Знания первого уровня играют существенную роль при управлении процессом решения, при приобретении и объяснении действий системы. В связи с тем, что знания первого уровня не содержат ссылок на знания нулевого уровня, знания первого уровня независимы от проблемной среды. Число уровней представления может быть больше двух. Второй уровень представления содержит сведения о знаниях первого уровня, т.е. знания о представлении базовых понятий первого уровня. Разделение знаний по уровням представления обеспечивает расширение области применимости системы [14].

Выделение уровней детальности позволяет рассматривать знания с различной .

спецификой решаемых задач, объемом знаний и способом их представления. Как правило, выделяется не менее трех уровней детальности, отражающих соответст-, . -ких уровней детальности обеспечивает дополнительную степень гибкости системы, это позволяет производить изменения на одном уровне, не затрагивая другие. Изменения на одном уровне детальности могут приводить к дополнительным изменениям на этом же уровне, что оказывается необходимым для обеспечения согласованности структур данных и программ.

Рассмотрев различные модели и подходы к организации знаний, необходимо ,

, -

ставляется возможным описать одной моделью. Поэтому при создании экспертной системы необходимо применительно к её архитектуре обеспечить эффективное использование всех имеющихся в системе видов знаний, что возможно при построении её в виде гибридной экспертной системы. Разнородные знания целесообразно классифицировать и для каждого вида использовать определённую модель .

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Джексон П. Введение в экспертные системы. - М.: Издательский дом «Вильямс»,

2001. - 624 с.

2. Дюк В., Самойленко A. Data Mining: учебный курс. - СПб.: Питер, 2001. - 368 с.

3. Городецкий В.И., Самойлов В.В., Малое О.А. Современное состояние технологии извлечения знаний из баз и хранилищ данных. Ч. I // Новости искусственного интеллекта. -

2002, №3. - С. 3-12.

4. Осипов ГС. Приобретение знаний интеллектуальными системами. - М.: Наука, 1997. - 112 с.

5. Boose J. and Gaines B. Knowledge Acquisition Tools for Expert Systems. New York: Academic Press. 1988. p. 620.

6. Гаврилова ТА. Хорошевский В.Ф. Базы знаний интеллектуальны систем. - СПб: Питер, 2000. - 384 с.

7. Kingston J., Doheny J., Filby I. Evaluation of workbenches which support the Common KADS methodology. Knowledge Engineering Review. 1995. №10.

8. . . . - .: , 2002. -464 .

9. . ., . ., . ., . . -

пертные системы // Под ред. Попова Э.В. - М.: Финансы и статистика, 1996. - 320 с.

10. . . . // 3 . . 1. - :

, 1990. - 464 .

11. . ., . . . -

шений. - Рига: Зинатне, 1997. - 320 c.

12. Минский М. Фреймы для представления знаний / Пер. с англ. - М.: Энергия, 1979. - 152 с.

13. . ., . . . - .: - .

Н.Э. Баумана, 2003. - 348 с.

14. . ., . ., . . -

ной практике. - Таганрог: ТРТУ, 1996. - 135 с.

УДК 518.5:331.108.26

С.В. Скороход

ОТБОР ПЕРСОНАЛА В УСЛОВИЯХ НЕЧЁТКОЙ ИНФОРМАЦИИ НА ОСНОВЕ ЭКСПЕРТНЫХ ОЦЕНОК

. -

альной для любого предприятия. От её решения зависят качество и отдача каждого сотрудника и конечный успех предприятия в целом.

Характерными особенностями данной проблемы являются субъективность и неопределенность. Субъективность выражается в том, что оценку и подбор персонала производят люди со своими стереотипами, симпатиями, предпочтениями, которые иногда могут идти вразрез с целями самого предприятия. Неопределенность проявляется в неточных формулировках требований типа «уверенное владение Microsoft Word», «опытный пользователь ПК», «умение работать в команде», допускающими трактовку в очень широких пределах.

Одним из наиболее достоверных методов профессионального отбора является выполнение кандидатами специально подготовленных заданий с последующей оценкой результата группой экспертов [1]. Несмотря на преимущества данного ,

.

Задачей данной работы является разработка математической модели для сравнения кандидатов по результатам тестирования с использованием теории нечётких множеств и нечёткой математики [2, 3], которые позволяют формализовать присущие этому процессу свойства субъективности и неопределенности.

Общая схема отбора. Общая схема отбор а изображена на рис. 1.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Курейчик В. В., Сороколетов П. В., Щеглов С. Н.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Курейчик В. В., Сороколетов П. В., Щеглов С. Н.

The analysis of a modern condition of the automated systems of acquisition and representation of knowledge

Текст научной работы на тему «Анализ современного состояния автоматизированных систем приобретения и представления знаний»