Научная статья на тему 'Онтология как модель представления знаний'

Онтология как модель представления знаний Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
4882
663
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРЕДСТАВЛЕНИЕ ЗНАНИЙ / ИНЖЕНЕРИЯ ЗНАНИЙ / БАЗА ЗНАНИЙ / ОНТОЛОГИЯ / KNOWLEDGE REPRESENTATION / KNOWLEDGE ENGINEERING / KNOWLEDGE BASE / ONTOLOGY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Верхотурова Ю. С.

Представление знаний является одним из важнейших направлений исследований в области инженерии знаний. В статье рассматривается новый подход к разработке моделей представления знаний, связанный с онтологиями. Онтология это иерархически структурированное множество классов, описывающих предметную область, которое может быть использовано как основа для базы знаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Ontology as a model of knowledge representation

Knowledge representation is one of the most important directions of research in the field of knowledge engineering. This article discusses a new approach to development the models of knowledge representation, concerned with ontology. Ontology is a hierarchical structure of multiple classes describing the subject domain and that can be used as a basis for knowledge base.

Текст научной работы на тему «Онтология как модель представления знаний»

- М.: Исследовательский центр проблем качества подготовки специалистов, 2006. - 72 с.

2. Байденко В.И. Компетенции в профессиональном образовании // Высшее образование в России. -2004. - № 11. - С. 4-13.

3. Вербицкий А.А. Компетентностный подход и теория контекстного обучения. - М.: Исследовательский центр проблем качества подготовки специалистов, 2004. - 84 с.

4. Дроздова Н.В., Лобанов А.П. Компетентностный подход как новая парадигма студентоцентрирован-ного образования. - Минск: РИВШ, 2007. - 100 с.

5. Зеер Э.Ф. Психология профессии: учеб. пособие для студ. вузов. - М.: Акад. проект: Фонд «Мир», 2005.

- 329 с.

6. Зеер Э.Ф., Павлова А.М., Сыманюк Э.Э. Модернизация профессионального образования: Компетент-ностный подход. - М.: Московский психологосоциальный институт, 2006. - 216 с.

7. Зимняя И.А. Ключевые компетенции - новая парадигма результата образования // Высшее образование сегодня. - 2003. - №5. - С. 34-42.

8. Зимняя И.А. Компетентность и проблемы ее формирования в системе непрерывного образования (школа

- вуз - послевузовское образование). - Уфа: Изд-во Уфимского гос. авиац. техн. университета, 2006. -130 с.

9. Модульно-компетентностный подход в российской системе довузовского профессионального образова-

ния: теория и практика / под ред. Н.Ю. Посталюк -Самара: Учебная литература, 2006. - 192 с.

10. Новиков А.М. Методология учебной деятельности.

- М.: Эгвес, 2005. - 176 с.

11. Равен Дж. Педагогическое тестирование: проблемы, заблуждения, перспективы: пер. с англ. - М.: Коги-то-Центр, 1999. - 144 с.

12. Татур Ю.Г. Компетентностный подход в описании результатов и проектировании стандартов высшего профессионального образования: // Материалы ко второму заседанию методологического семинара. Авторская версия. - М.: Исследовательский центр проблем качества подготовки специалистов, 2004. -16 с.

13. Хуторской А.В. Современная дидактика. - СПб., 2001. - 418 с.

14. Чошанов М.А. Гибкая технология проблемномодульного обучения: метод. пособие. - М.: Народное образование, 1996. - 114 с.

15. Ярочкина Г.В., Ефимова С.А. Методика проектирования учебных материалов на модульно-компетентностной основе для системы довузовского профессионального образования: метод, пособие.

- М.: Московский психолого-социальный институт, Федеральный институт развития образования, 2006.

- 177 с.

16. Tuning Project [Электронный ресурс]. URL: Режим доступа // www.relint.deusto.es/ /index.html, свободный.

Ваганова Татьяна Геннадьевна, кандидат педагогических наук, доцент кафедры физики Восточно-Сибирского государственного университета технологий и управлений. 670013, Улан-Удэ, ул. Ключевская, 40 (в), e-mail: valen51 @mail.ru

Vaganova Tatiana Gennadievna, candidate of pedagogical sciences, associate professor, department of physics. East-Siberian State University of Technologies and Management. 670013, Ulan-Ude, Kluchevskaya str., 40(v).

УДК 002.53:004.89 © Ю.С. Верхотурова

Онтология как модель представления знаний

Представление знаний является одним из важнейших направлений исследований в области инженерии знаний. В статье рассматривается новый подход к разработке моделей представления знаний, связанный с онтологиями. Онтология - это иерархически структурированное множество классов, описывающих предметную область, которое может быть использовано как основа для базы знаний.

Ключевые слова: представление знаний, инженерия знаний, база знаний, онтология.

Yu.S. Verkhoturova

Ontology as a model of knowledge representation

Knowledge representation is one of the most important directions of research in the field of knowledge engineering. This article discusses a new approach to development the models of knowledge representation, concerned with ontology. Ontology is a hierarchical structure of multiple classes describing the subject domain and that can be used as a basis for knowledge base.

Keywords: knowledge representation, knowledge engineering, knowledge base, ontology.

1. Проблема представления знаний. ны, ни ее природными ресурсами. Теперь все

В наше время преимущества в конкурентной решают уровень образования и объем знаний,

борьбе уже не определяются ни размерами стра- накопленных обществом. В будущем процветать

будут государства, которые сумеют превзойти другие в создании и освоении новых знаний. Особую роль в этом играют информационные технологии, а в них методы и средства работы со знаниями.

Знания как особый ресурс имеют свойства непрерывного воспроизводства, наращивания, как на уровне их объемов, так и на уровне качественных характеристик (сложности, фундаментальности) адекватно изменениям в науке, социуме или культуре. Однако, как и всякий ресурс, знания подвержены оскудению и, в отличие от природных ресурсов, очень быстрому старению. Поэтому для работы со знаниями требуются особые методы их обработки, хранения и использования. Эти потребности привели к возникновению инженерии знаний - области наук об искусственном интеллекте, изучающей базы знаний и методы работы со знаниями. Основная задача инженерии знаний - получение и структурирование знаний для последующей разработки баз знаний. Базы знаний - это особого рода базы данных, разработанные для оперирования знаниями. База знаний содержит структурированную информацию о некоторой предметной области, для использования программами или человеком с конкретной целью. Современные базы знаний работают совместно с системами поиска информации, имеют классификационную структуру и формат представления знаний. Выбор адекватной модели представления знаний является одной из сложных проблем работы со знаниями.

Представление знаний - вопрос, возникающий в когнитологии (науке о мышлении) и в исследованиях инженерии знаний. В когнитологии он связан с тем, как люди хранят и обрабатывают информацию. В инженерии знаний - с подбором представления конкретных и обобщенных знаний, сведений и фактов для накопления и обработки информации в ЭВМ.

Проблема представления знаний заключается в том, что в большинстве случаев знания являются продуктом деятельности человека, точнее, эксперта в некоторой предметной области. Следовательно, главная задача - научиться хранить знания таким образом, чтобы программы (программные агенты) могли осмысленно обрабатывать их и достигнуть тем подобия человеческого интеллекта. Кроме того, развитие информационно-поисковых систем высокого уровня, диалоговых систем, базирующихся на естественном языке, интерактивных человеко-машинных систем, предназначенных для совместного решения задач управления, проектирования и т.п., выдви-

нуло еще одну задачу - представление знаний в виде, достаточно формальном для того, чтобы модель представления знаний однозначно интерпретировалась ЭВМ, независимо от производителя базы знаний. Единая модель представления знаний решит проблему поиска знаний в разнородных источниках данных и существенно облегчит задачу объединения таких источников.

2. Онтология.

Существуют десятки моделей представления знаний для различных предметных областей. Большинство из них может быть сведено к следующим классам:

• продукционные;

• семантические сети;

• фреймы;

• логические модели;

• нейронные сети.

Однако как форма представления знаний все большую популярность последнее время приобретает - онтология, которая, по мнению многих ученых, способна решить все вышеперечисленные проблемы.

Несмотря на то, что этот термин широко известен в программистском сообществе, четкого его понимания пока нет. В философии слово «онтология» означает дисциплину, которая изучает наиболее общие характеристики бытия[1]. Иными словами, онтология - представление реальности в виде универсального набора понятий и связей между ними.

По отношению к компьютерным наукам термин «онтология» впервые появился в работе Томаса Грубера, который решал задачу создания механизма взаимодействия систем баз знаний друг с другом. Для решения этой проблемы были предложены следующие методы:

• Выделить в системе управления знаниями уровень декларативного знания. Декларативное знание представляет собой описание некоторой части данного мира, в противоположность которому можно ввести процедурное знание, например знание о том, каким образом на основании описания мира делать логические выводы относительно тех или иных его свойств.

• База знаний предоставляет описание своего декларативного знания другим программам управления знаниями. Причем такое описание должно быть понятно как человеку, так и машине, и потому выдается в двух видах:

1) канонической форме, представляющей собой описание знания на языке логики предикатов;

2) в формате онтологии, т.е. в виде набора описаний термов (классов, отношений и т.д.) и определений, связывающих эти термы друг с другом.

• Построить на основе выделенных описаний библиотеки онтологий, которые можно было бы использовать в различных базах знаний [3].

Таким образом онтология, по Груберу, представляет собой описание декларативных знаний, сделанное в виде классов с отношением иерархии между ними. К этому описанию, предназначенному для чтения человеком, присоединено описание в канонической форме, которое предназначено для чтения машинами. Каждая интеллектуальная система, ядром которой является база знаний, может предоставлять несколько таких описаний, соответствующих различным областям хранящихся в ней декларативных знаний,

и, таким образом, выступает как хранилище библиотеки онтологий. Грубер представлял, что подобные системы будут выступать как библиотеки онтологий и свободно обмениваться онтологиями между собой.

Составление описания декларативного знания - задача специфическая. Суть этого процесса кроется в самом термине «онтология».

Сформулированное Грубером определение онтологии звучит так: «Онтология - это точная спецификация концептуализации». Под «концептуализацией» понимается «абстрактный, упрощенный взгляд на мир, который используется людьми для осуществления некой цели» [3]. Особенность задачи концептуализации заключается в том, что для обмена знаниями между программными системами необходимо явно описать эти знания (специфицировать их концептуализацию), причем в достаточной степени формальное, чтобы его понимали другие системы. Результат такой спецификации, по Груберу, и есть онтология.

Понятие «инженерная онтология» (по отношению к инженерии знаний) можно определить как спецификацию некой концептуализации, т.е. формальное описание некоего представления предметной области исследуемой задачи так, как это необходимо для данной задачи. Концептуализация в данном случае - это структура реальности, рассматриваемая независимо от словаря предметной области и конкретной ситуации. Иными словами, концептуализация - это упрощенный взгляд на мир. Из предметной области выделяют только те элементы, которые необходимы для решения данной задачи, другие свойства предметной области не рассматриваются.

Например, если мы рассматриваем простую предметную область, описывающую кубики на столе, то концептуализацией является набор возможных положений кубиков, а не конкретное их расположение в текущий момент времени. Грубер считал, что концептуализация проводится в терминах классов и атрибутов. Мир исследуемой задачи представляется в виде понятий, которые описываются классами, вместе с их свойствами (атрибутами) и конкретными объектами, - экземплярами классов. Например, проектируя систему, содержащую информацию об автомобилях, естественно ввести классы, представляющие марки автомобилей («Лада», «Тойота» и т.д.), а конкретные автомобили рассматривать как экземпляры классов, атрибутами которых могут быть цвет, год производства, страна-производитель и т.п.

Термин «концептуализация» использовался Грубером также и для обозначения процесса построения онтологии. Результат концептуализации называется концептуальной схемой. Для обозначения процесса построения концептуальной схемы используется также термин «концептуальное моделирование» [3].

Кроме определения понятия «онтология», предложенного Т. Грубером, существуют и другие его значения. Например, Н. Гуарино определяет онтологию так: «онтология - это формальная теория, ограничивающая возможные концептуализации мира» [4].

Исходя из всего вышесказанного, можно сделать следующие выводы. Онтология - это иерархически структурированное множество терминов, описывающих предметную область, которая может быть использована как исходная структура для базы знаний. В основе онтологии лежат свойства, классы, объекты и ограничения, реализующие представление об объектах как о множестве сущностей, характеризуемых некоторым набором свойств. Эти сущности состоят между собой в определенных отношениях и объединяются по определенным признакам (свойствам и ограничениям) в классы. В результате полного описания объектов и их свойств предметная область будет представлена как сложная иерархическая база знаний, над которой можно будет осуществлять «интеллектуальные» операции, такие как семантический поиск и определения целостности и достоверности данных.

3. Пример построения онтологии на основе учебных ресурсов Интуита.

В качестве примера составим приблизительную онтологию ресурсов интернет-университета «Интуит». Университет предлагает дистанцион-

ное обучение с выдачей официальных дипломов по программам повышения квалификации и профессиональной переподготовки специалистов в области информационных технологий. Поскольку основное содержание данного портала составляют учебные курсы, то для удобства введем суперкласс «Каталог курсов», который будет играть роль вершины иерархии онтологии. Все учебные курсы Интуита делятся на три подгруппы:

• Курсы по разделам (список всех онлайн-курсов, классифицируемых по принадлежности к какой-либо узкой предметной об ласти).

• Очные курсы (подгруппа, содержащая список всех курсов, проходящих очно).

• Специальности (список курсов по определенным специальностям).

В соответствии с этим делением суперкласс «Каталог курсов» будет содержать три подкласса - «Разделы», «Очные курсы» и «Специальности». Как и в любой другой иерархии, перечисленные классы будут иметь подклассы, экземпляры классов, свойства и т.д. Основным типом отношений такой онтологии будет бинарное отношение «часть-целое» или «раП-о/» [2].

Рассмотрим подробно класс «Разделы». Например, раздел «Архитектура ЭВМ» содержит двадцать три курса - «Архитектура и организация ЭВМ», «Архитектура микропроцессоров», «Архитектура параллельных вычислительных систем» и т.д. Количество курсов нас не интересует, так как спецификация концептуализации ресурсов Интуита подразумевает описание общей структуры учебных материалов, а не каждого курса в отдельности.

Очевидно, что класс «Разделы» имеет единственное свойство Название_раздела. Это свойство унаследуют как потомки данного класса, так и их экземпляры. Кроме того, этот класс содержит подкласс, представляющий собой учебный курс. Для того чтобы создать описание курса в Интуите, введем понятие «Учебный курс». Так же как и в предыдущем случае, этот класс имеет одно свойство - Название_курса и под-

класс «Лекции». В свою очередь, подкласс «Лекции» состоит из группы классов: «Название лекции», «Описание» (аннотация), «Содержание» (или основные термины предметной области), «Вопросы», «Дополнительные материалы» и «Литература». Например, экземпляром класса «Лекции» может быть лекция под названием «Микропроцессор». Она является частью учебного курса «Архитектура микропроцессоров», принадлежащего разделу «Архитектура ЭВМ». Для того чтобы созданная иерархия была более наглядной, изобразим ее графически на схеме (схема 1).

Не следует забывать о том, что все термины унаследуют свойства вышестоящих классов. Это необходимо не только для усиления семантических связей, но и будет полезно при решении задачи интеллектуального поиска значений какого-либо термина. Если поисковая программа знает, какой именно предметной области, а в данном случае разделу, принадлежит термин, то сможет дать более точное его определение. Под словом «знать» здесь понимается то, что поисковая программа выдает пользователю просьбу уточнить, в терминах какой предметной области он хочет получить ответ. После того как пользователь сделает свой выбор, поисковик ищет описание необходимого термина, т.е. ведет поиск по онтологии, соответствующей выбранной тематике.

Например, пользователю необходимо узнать определение слова «ячейка». При ответе на запрос «ячейка» поисковая программа выдаст все документы, содержащие этот текст. Однако термин «ячейка» может означать и электронную ячейку, ячейку в банке, ячейку общества и т.п. Умная поисковая программа могла бы иметь достаточно большую базу фактов, чтобы знать о различных значениях слова «ячейка». Но это ничего не даст такой программе до тех пор, пока создатели сайтов не предоставят описание содержания своих ресурсов поисковым программам. Предположим, что пользователь ищет информацию об электронной ячейке, а онтология Интуит содержит такое описание.

Схема 1

Тогда при запросе «ячейка» поисковик может уточнить у пользователя, не имеет ли он в виду электронную ячейку, и в случае согласия вывести на первое место в списке найденных страниц страницу с сайта интернет-университета Интуит вместе с описанием раздела, которому принадлежит термин.

4. Заключение.

Не стоит сводить теоретический смысл термина «онтология» к простому решению проблем интеллектуального поиска и структуризации ресурсов Интернета. За последние годы онтология стала центральным понятием в области компьютерной обработки информации, особенно при построении больших баз данных и знаний. Онтологии применяются в разработке приложений для программного обеспечения, при создании систем искусственного интеллекта, электронной коммерции, веб-приложений, систем поддержки принятия решений, медицинской информатики,

семантических веб-технологий и, конечно, в различных приложениях по управлению знаниями [2]. Онтология - главный функциональный элемент технологии Semantic Web.

Литература

1. Добров Б.В., Иванов В.В., Лукашевич Н.В., Соловьев В.Д. Онтологии и тезаурусы: модели, инструменты, приложения. - М.: БИНОМ, 2009. -173 с.

2. Buchholz William. Ontology // Encyclopedia of Knowledge Management. - USA, Hershey: Idea Group Reference, 2006. - P.745-790.

3. Gruber T.R. A Translation Approach to Portable Ontology Specifications. // Knowledge Acquisition, № 5/2, 1993. - P. 199-220.

4. Guarino N. Understanding, Building, and Using Ontologies. A Commentary to «Using Explicit Ontologies in KBS Development» (by van Heijst, Schreiber, and Wielinga) // International Journal of Human and Computer Studies, № 2/3. 1997. - P. 93-310.

Верхотурова Юлия Сергеевна, аспирант кафедры геометрии, Институт математики и информатики, Бурятский государственный университет. 670000, Россия, г. Улан-Удэ, ул. Смолина, 24а, e-mail: bgsha ¡[email protected] Verkhoturova Yulia Sergeevna, postgraduate student, department of geometry, Institute of Mathematics and Information, Buryat State University. 670000, Ulan-Ude, Smolin str., 24a

i Надоели баннеры? Вы всегда можете отключить рекламу.