Научная статья на тему 'Синтез разнородных знаний на основе онтологий'

Синтез разнородных знаний на основе онтологий Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
368
103
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИИ / ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ / СИСТЕМЫ УПРАВЛЕНИЯ ЗНАНИЯМИ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / ИЗВЛЕЧЕНИЕ ЗНАНИЙ / ИНТЕГРАЦИЯ РАЗНОРОДНОЙ ИНФОРМАЦИИ / ONTOLOGIES / INTELLIGENT INFORMATION SYSTEMS / KNOWLEDGE MANAGEMENT / DATA MINING / KNOWLEDGE EXTRACTION / INTEGRATION OF HETEROGENEOUS INFORMATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кравченко Юрий Алексеевич

Рассмотрена актуальная проблема создания онтологий областей знаний в целях интеграции разнородной информации в системах управления знаниями. Описан набор типовых информационных потоков, для которых будут отбираться прецеденты интеграции знаний. Подробно рассмотрены этапы идентификации знаний, интеллектуального анализа априорной информации, построения моделей знаний и реализации системы управления знаниями. Реализация данных этапов обеспечит концептуализацию знаний в виде точных описаний в онтологиях, что позволит преодолеть неопределенность за счет формализации неявных предположений и систематизировать знания за счет интеграции разнородных источников.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SYNTHESIS OF HETEROGENEOUS KNOWLEDGE BASED ON ONTOLOGIES

This article describes the actual problem of knowledge fields ontologies creation in order to heterogeneous information integration in knowledge management systems. A set of typical information flows, which will be selected precedents knowledge integration, was described. The steps of identifying the knowledge, mining a priori information, modeling knowledge and implementing a knowledge management system were showed in details. The implementation of these steps will provide a conceptualization of knowledge as accurate descriptions in ontologies, which will overcome the uncertainty due to the formalization of the implicit assumptions and organize knowledge through the integration of heterogeneous sources.

Текст научной работы на тему «Синтез разнородных знаний на основе онтологий»

15. Марков В.В., Пуголовкина О.В. Применение репертуарных решеток для формирования индивидуальных траекторий обучения // Известия ЮФУ. Технические науки. - 2011. - № 7 (120).

- С. 250-255.

Статью рекомендовала к опубликованию д.т.н., профессор Л. С. Лисицына.

Кравченко Юрий Алексеевич - Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»; e-mail: krav-jura@yandex.ru; 347928, г. Таганрог, пер. Некрасовский, 44, ГСП 17А; тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Марков Владимир Васильевич - e-mail: v_v_mar@mail.ru; кафедра систем автоматизированного проектирования; доцент.

Kravchenko Yury Alekseevich - Federal State-Owned Autonomous Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: krav-jura@yandex.ru; GSP 17A, 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634371651; the department of computer aided design; associate professor.

Markov Vladimir Vasilyevich - e-mail: v_v_mar@mail.ru; the department of computer aided design; associate professor.

УДК 002.53:004.89

Ю.А. Кравченко

СИНТЕЗ РАЗНОРОДНЫХ ЗНАНИЙ НА ОСНОВЕ ОНТОЛОГИЙ*

Рассмотрена актуальная проблема создания онтологий областей знаний в целях интеграции разнородной информации в системах управления знаниями. Описан набор типовых информационных потоков, для которых будут отбираться прецеденты интеграции знаний. Подробно рассмотрены этапы идентификации знаний, интеллектуального анализа априорной информации, построения моделей знаний и реализации системы управления знаниями. Реализация данных этапов обеспечит концептуализацию знаний в виде точных описаний в онтологиях, что позволит преодолеть неопределенность за счет формализации неявных предположений и систематизировать знания за счет интеграции разнородных источников.

Онтологии; интеллектуальные информационные системы; системы управления знаниями; интеллектуальный анализ данных; извлечение знаний; интеграция разнородной информации.

Y.A. Kravchenko

SYNTHESIS OF HETEROGENEOUS KNOWLEDGE BASED ON ONTOLOGIES

This article describes the actual problem of knowledge fields ontologies creation in order to heterogeneous information integration in knowledge management systems. A set of typical information flows, which will be selected precedents knowledge integration, was described. The steps of identifying the knowledge, mining a priori information, modeling knowledge and implementing a knowledge management system were showed in details. The implementation of these steps will provide a conceptualization of knowledge as accurate descriptions in ontologies, which will overcome the uncertainty due to the formalization of the implicit assumptions and organize knowledge through the integration of heterogeneous sources.

Ontologies; intelligent information systems; knowledge management; data mining; knowledge extraction; integration of heterogeneous information.

* Работа выполнена при частичной поддержке РФФИ (проект № 10-07-00538). 216

Введение. При создании обучающей системы управления знаниями возникает необходимость в интеграции информации из различных предметных областей на основе единого семантического описания пространства знаний. Концептуальная проработка правил синтеза разнородной информации в обучающих системах управления знаниями (ОСУЗ) осуществляется на основе создания онтологий областей знаний по результатам взаимодействия преподавателей, тьюторов и экспертов. Несмотря на выраженную специфику предметных областей, онтологии необходимо строить как цепочку взаимосвязанных процессов, что и позволит получить интегрированный характер обучающей системы управления знаниями.

1. Состав этапа идентификации области знаний. На этапе идентификации областей знаний необходимо в первую очередь определить множество исследуемых характеристик (рис. 1). В этом случае будут изучаться зависимости между множествами индивидуальных характеристик обучаемого, составляющими его компетентности и возможными формами приобретения новых знаний. Далее требуется выбрать источники априорной информации и приступить к формированию базы знаний и хранилищ данных, которые впоследствии позволят задать отношения между категориями пользователей. В качестве источников знаний легче всего подсоединяются базы данных оперативных информационных систем через механизм создания информационных хранилищ. Аналогично подсоединяется система электронных и неэлектронных архивов документов, которая может иметь централизованную и нецентрализованную схему управления. Интеграция знаний из различных источников может проводиться на основе онтологий, требования к разработке которых будут находиться в заранее сформированных спецификациях.

Для создания баз знаний прецедентов требуется определить набор типовых информационных потоков, для которых будут отбираться прецеденты.

Для формализации знаний специалистов (экспертов, тьюторов, преподавателей) необходимо построить карты знаний, в которых была бы отражена степень владения пользователей различных категорией знаний.

1.Идентификация области знаний

Рис. 1. Состав этапа идентификации области знаний

На этапе интеллектуального анализа априорной информации и извлечения знаний на основе методов интеллектуального анализа данных происходит кластеризация знаний, необходимая для дальнейшего выявления свойств и отношений между различными информационными единицами, что позволит выявить закономерности в массивах данных и перейти к построению новых правил, аксиом и ограничений (рис. 2).

2.Интеллектуальный анализ данных и извлечение знаний

Рис. 2. Состав этапа интеллектуальног анализа данных и извлечения знаний

Данный этап обеспечит концептуализацию знаний в виде точных описаний в онтологиях, что позволит обеспечить системе следующие возможности:

♦ интеллектуальность обучающей системы управления знаниями, позволяющая преодолеть неопределенность за счет формализации неявных предположений. Концептуализация в онтологиях происходит на основе семантических отношений, формирующих аксиомы, правила и ограничения;

♦ спецификация функциональных компонентов знаний в виде общего словаря и разделение знаний между различными категориями пользователей системы;

♦ систематизация знаний за счет интеграции разнородных источников на основе многоаспектной таксономии, представленной в общем словаре;

♦ метамодельная функциональность, когда онтология содержит необходимые понятия, отношения и ограничения для построения многоагентной, имитационной или иной модели (рис. 3) решения задачи с помощью модулей системы, привязанных к данным понятиям;

♦ обобщение понятий используемой области знаний, позволяющее создать теорию содержания на основе имеющейся онтологии [1, 3—5].

3. Построение моделей знаний

Рис. 3. Состав этапа построения моделей знаний

Наиболее удобной для наших исследований моделью распределенной онтологической структуры является графовая модель O = <7, A>, где O - онтология, T - таксономия введенных терминов (концептов) данной онтологии и множество отношений, определенных на данной таксономии, А - множество аксиом, правил и ограничений, основанных на заданном Т [2, 6-10]. Говоря о требованиях, предъявляемых к онтологиям, можно условно их разбить на общие требования и требования развития.

К числу общих требований можно отнести:

♦ ясность как четкую передачу смысла концептов;

♦ согласованность как логическая непротиворечивость определений;

♦ интегрируемость как возможность объединения в единое целое всякой распределенной онтологической структуры за счет использования отношений импорта. Отношение импорта можно представить в виде ориентированной графовой модели I = <0, Б>, где О - онтологии, Б - направленные дуги с началом в импортируемой онтологии и концом - в импортирующей;

♦ минимум влияния кодирования как инвариантность к методам представления знаний;

♦ минимум онтологических обязательств как отражение только существенных предположений об области знаний [1, 2, 8-12].

В число же требований развития онтологий входят:

♦ аддитивное развитие - основано на отношении импорта, подразделят онтологии на базовую и дополняющую, т.е. знания, хранящиеся в первой, наращиваются знаниями из второй без изменений в имеющейся структуре данных;

♦ интеграционное развитие - импортирование некоторого множества базовых, системно согласуемых онтологий в один интегрирующий ресурс;

♦ совместное развитие - импорт с отсутствием иерархии, когда каждая из двух онтологий является для другой и базовой, и дополняющей;

♦ комплексное развитие и реструктуризация онтологий - одновременное разнонаправленное развитие онтологий для получения упрощенной онтологической структуры без циклов, с более эффективным набором импортов;

♦ развитие нечетких онтологий - задача работы с нечеткими импортами возникает при рассмотрении распределенных онтологических структур. Нечеткий импорт, для которого определена функция принадлежности, может выявляться в ходе анализа структуры онтологии [2, 13-15].

В онтологической структуре знаний должны быть отражены парадигматические отношения понятий, независимые от контекста решаемой проблемы, и переменные синтагматические отношения понятий, возникающие в некотором контексте решения проблемы. Среди парадигматических можно выделить отношения синонимии, омономии, полисемии, обобщения, агрегации, ролевых ассоциаций и т.д., которые трансформируют словарь в тезаурус [1, 3, 4]. Синтагматические отношения отражаются в виде семантических ограничений, правил и аксиом.

Рассмотрим уровни формирования онтологического знания:

1. Контроль синтаксических понятий и конструкций предметных областей осуществляется за счет определения метаонтологии общих категорий;

2. Набор понятий, используемых при решении интеллектуальных задач независимых от выбора метода решения, определяет онтология предметной области;

3. Понятия, описывающие методы преобразования объектов предметной области, их сущность, последовательность выполнения и правила применения в конкретных ситуациях, определяет онтология задач.

Формализация онтологий происходит за счет построения семантических сетей, задающих отношения на множестве объектов знаний. Отношения представляют основные конструктивные элементы структуры знания.

Выбор инструментальных средств реализации обусловлен требованиями к функциональности ОСУЗ (рис. 4).

Рис. 4. Состав этапа реализации ОСУЗ

Нужно принять во внимание необходимость информационного поиска и анализа данных во внешних и внутренних источниках, решение общих для субъектов процесса обучения задач, обоснования принимаемых решений по выбору траекторий обучения.

Несмотря на широкий выбор программных инструментов реализации, выбираемые инструментальные средства должны обеспечивать создание и поддержку источников знаний, и доступ к ним. Для целей создания онтологий служат онтоло-

гические редакторы, реализующие ввод категорий, отношений на категориях и ограничения. Это освобождает разработчика от изучения внутреннего синтаксиса оформления онтологических конструкций [1, 9, 10]. Также необходимы инструменты трансляции онтологий из одного представления в другое при интеграции разных источников знаний. Задание категорий онтологий для источника знаний для дальнейшего индексирования возможно в режиме ручной аннотации, которая происходит с использованием специальных программных средств, позволяющих пользователю просматривать и выбирать из онтологий необходимые категории для аннотации. Индексирование источников знаний необходимо для их дальнейшего подключения. При большом числе источников знаний аннотирование и индексирование в ручном режиме не представляется возможным, в этом случае используются программы автоматической рубрикации и индексирования.

Важными функциями доступа к источникам знаний являются:

1) организация релевантного поиска по запросу с применением онтологии знаний за счет семантического контроля, анализа контекста, механизма расширения содержания. Проверка корректности запроса осуществляется по ограничениям атрибутов и аксиом, содержащихся в онтологиях. Запрос может быть расширен за счет семантически значимых отношений (синонимичных обозначений, транзитивно удаленных терминов);

2) обеспечение возможностей навигации (визуализация иерархий рубрик, многоаспектная навигация, гипертекстовый доступ к глоссарию, динамическое формирование маршрута навигации). Расширенные возможности навигации обеспечиваются на основе применения гиперболического представления онтологий, в котором узлы онтологии представлены шарами, а отношения - ребрами;

3) поддержка коммуникации пользователей и распространение знаний с помощью средств группового взаимодействия. При этом необходимо исключить случайное формирование участников коллективного обмена знаниями только лишь на основе исследуемой тематики. Формирование группы по решению определенной проблемы должно быть целенаправленным и основанным на оценке категорий онтологии. Индивидуальные особенности участников группы должны быть отражены в онтологическом профиле и формализованы в моделях.

Заключение. В работе рассмотрены проблемы интеграции разнородной информации в системах управления знаниями на основе создания онтологий. Реализация концептуализации знаний в виде точных онтологических описаний обеспечивает интеллектуальность системы управления знаниями и позволяет преодолевать неопределенность за счет формализации неявных предположений. Онтологическая структура знаний отражает парадигматические и синтагматические отношения понятий. Формализация онтологий происходит за счет построения семантических сетей, задающих отношения на множестве объектов знаний.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Тельнов Ю.Ф. Интеллектуальные информационные системы. - М.: Московский государственный университет экономики, статистики и информатики, 2003. - 26 с.

2. Электронный ресурс - http://shcherbak.net/ekstensivnoe-razvitie-ontologicheskix-struktur/.

3. Кравченко Ю.А. Технология анализа надежности адаптивных информационных сред // Известия ЮФУ. Технические науки. - 2010. - № 12 (113). - С. 103-108.

4. Кравченко Ю.А. Имитационная модель анализа данных в интеллектуальных информационных системах // Российская академия наук. Научный журнал. Известия КБНЦ РАН.

- Нальчик: Изд-во КБНЦ РАН, 2012. - № 1 (45). - С. 25-31.

5. Курейчик В.В., Родзин С.И. О правилах представления решений в эволюционных алгоритмах // Известия ЮФУ. Технические науки. - 2010. - № 7 (108). - С. 13-21.

6. Курейчик В.М., Кныш Д.С. Проблемы, обзор и параллельные генетические алгоритмы: состояние // Известия РАН. Теория и системы управления. - 2010. - № 4. - С. 72-82.

7. Курейчик В.В., Курейчик В.М., Родзин С.И. Концепция эволюционных вычислений, инспирированных природными системами // Известия ЮФУ. Технические науки. - 2009.

- № 4 (93). - С. 16-25.

8. Гладков Л.А., Гладкова Н.В. Новые подходы к построению систем анализа и извлечения знаний на основе гибридных методов // Известия ЮФУ. Технические науки. - 2010.

- № 7 (108). - С. 146-154.

9. Кравченко Ю.А. Концептуальные основы рефлексивно-адаптивного подхода к построению интеллектуальных информационных систем // Известия ЮФУ. Технические науки.

- 2011. - № 7 (120). - С. 167-171.

10. Кравченко Ю.А. Метод создания математических моделей принятия решений в многоагентных подсистемах // Известия ЮФУ. Технические науки. - 2011. - № 7 (120).

- С. 141-145.

11. Кажаров А.А., Курейчик В.М. Использование роевого интеллекта в решении NP- трудных задач // Известия ЮФУ. Технические науки. - 2011. - № 7 (120). - С. 30-37.

12. Бова В.В., Курейчик В.В. Интегрированная подсистема гибридного и комбинированного поиска в задачах проектирования и управления // Известия ЮФУ. Технические науки.

- 2010. - № 12 (113). - С. 37-43.

13. Бова В.В. Модели предметных знаний на основе системно-когнитивного анализа // Известия ЮФУ. Технические науки. - 2011. - № 7 (120). - С. 146-153.

14. Марков В.В. Методика извлечения и оценки знаний на основе нечеткой модели эксперта // Известия ЮФУ. Технические науки. - 2011. - № 7 (120). - С. 137-141.

15. Марков В.В., Пуголовкина О.В. Применение репертуарных решеток для формирования индивидуальных траекторий обучения // Известия ЮФУ. Технические науки. - 2011.

- № 7 (120). - С. 250-255.

Статью рекомендовал к опубликованию д.т.н., профессор Н.И. Витиска.

Кравченко Юрий Алексеевич - Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»; e-mail: krav-jura@yandex.ru; 347928, г. Таганрог, пер. Некрасовский, 44, ГСП 17А; тел.: 88634371651; кафедра систем автоматизированного проектирования; доцент.

Kravchenko Yury Alekseevich - Federal State-Owned Autonomous Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: krav-jura@yandex.ru; GSP 17A, 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634371651; the department of computer aided design; associate professor.

УДК 002.53:004.89

В.В. Бова

ИЗВЛЕЧЕНИЕ НЕЯВНЫХ ЗНАНИЙ С ИСПОЛЬЗОВАНИЕМ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ*

В работе изложены возможности интеллектуальных информационных технологий, основанных на искусственных нейронных сетях. Определены особенности построения ней-росетевых моделей, формирующихся на основе методов эволюционных вычислений, выделены основные направления развития нейросетевых технологий при решении сложных интеллектуальных задач: Рассмотрена возможность применения генетических алгоритмов для оптимизации параметров нейронной сети в задачах извлечения знаний. Предложен подход к выбору значимых входных параметров нейросети и механизмов кодирования потенциальных решений, который может быть реализован с использованием генетических алгоритмов. Представлены алгоритмы, повышающие эффективность обучения нейросети для извлечения неявных знаний из опытных данных.

Интеллектуальные технологии; искусственные нейронные сети; нейросетевые модели; генетические алгоритмы; эволюционные вычисления.

* Работа выполнена при частичной поддержке РФФИ (проект № 10-07-00538).

i Надоели баннеры? Вы всегда можете отключить рекламу.