Научная статья на тему 'Онтологии как средство представления учебного материала'

Онтологии как средство представления учебного материала Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
704
145
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОНТОЛОГИИ / АРХИТЕКТУРА ЭВМ / ЭЛЕКТРОННЫЕ ТАБЛИЦЫ EXCEL / СИСТЕМА ВЕДЕНИЯ ОНТОЛОГИЙ PROTEGE

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Еремин Е. А.

Разработана онтология материала небольшого курса по архитектуре ЭВМ, читаемого студентам физического факультета ПГПУ. Описываются базовые принципы построения онтологии, а также демонстрируются способы их реализации в электронных таблицах Excel и системе ведения онтологии Protege. Продемонстрировано, что построение электронного представления основных категорий курса может существенно улучшить его структурированность и логику изложения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Онтологии как средство представления учебного материала»

'* ПРОБЛЕМЫ ПЕДАГОГИЧЕСКОГО ПРОЕКТИРОВАНИЯ * ВИРТУАЛЬНОЙ УЧЕБНОЙ СРЕДЫ

Е.А. Еремин

ОНТОЛОГИИ КАК СРЕДСТВО ПРЕДСТАВЛЕНИЯ УЧЕБНОГО МАТЕРИАЛА

Разработана онтология материала небольшого курса по архитектуре ЭВМ, читаемого студентам физического факультета ПГПУ. Описываются базовые принципы построения онтологий, а также демонстрируются способы их реализации в электронных таблицах Excel и системе ведения онтологий Protege. Продемонстрировано, что построение электронного представления основных категорий курса может существенно улучшить его структурированность и логику изложения.

В последние годы для структурирования человеческих знаний и представления их в машинной форме широко используются онтологии [6-9]. Онтологии - это формальные описания терминов предметной области и отношений между ними. Такие описания используются в самых разнообразных областях уже сейчас: их известными прикладными применениями, в частности, являются системы категоризации Web-сайтов (поисковая система Yahoo!) и огромные базы со сведениями о продаваемых товарах (магазин Amazon). Не менее важны и перспективные разработки. Например, международный консорциум W3C уделяет большое внимание языку кодирования знаний под названием RDF (Resource Description Framework), цель которого -сделать информацию электронных документов понятной для программ-агентов, которые ведут автоматический поиск информации.

Область применения онтологий постоянно расширяется. Во многих дисциплинах, таких как, например, медицина, сейчас создаются стандартные онтологии, которые могут использоваться экспертами в этих областях для представления имеющихся знаний и аннотирования информации в

своей области. Весьма конкретные практические применения имеют всевозможные классификационные системы, например, NAICS (North American Industry Classification System), которая действует в США, Канаде и Мексике для обеспечения сопоставимости бизнес-статистики. При изучении компьютерных дисциплин широко используется их классификация, разработанная ACM (Association for Computing Machinery).

Будучи своеобразным общим словарем понятий, онтология существенно облегчает взаимопонимание ученых при совместном использовании информации. Представление данных в форме онтологий не просто обеспечивает возможность их автоматической обработки, но и позволяет людям наиболее ярко и отчетливо сформулировать свои знания по выбранной тематике.

Последнее обстоятельство с точки зрения образования представляет большой интерес. Обучение, являясь процессом целенаправленной передачи знаний, вообще предоставляет неограниченные возможности для применения онтологий (см., например, [8]; подробные публикации по данной тематике на русском языке, к сожалению, пока

© Еремин Е.А., 2008

отсутствуют). От успехов в области структурирования знаний и представления их в машинном виде во многом зависит построение автоматических обучающих систем.

В данной работе делается попытка применить онтологии к структурированию материала небольшого обзорного учебного курса по архитектуре ЭВМ, который читается студентам физического факультета. Выделяются наиболее важные термины и категории, используемые при изложении теоретического материала, и, что более существенно, связи между ними. Полученную структуру знаний в специальной литературе принято именовать тезаурусом. Даже для не очень большого объема материала тезаурус представляет собой довольно сложную структуру, которую часто называют семантической сетью. Полное представление такой сети на практике сталкивается со значительными трудностями, поэтому путем некоторых упрощений данные чаще всего приводятся к более простой системе иерархических связей, которая изображается в форме дерева (дерево хорошо знакомо всем пользователям по структуре папок и документов в компьютере). В качестве инструмента для представления онтологии в работе используются электронные таблицы Excel и система ведения онтологий Protege.

Разновидности онтологий по типам отношений

Как уже отмечалось во введении, характерной чертой онтологий является представление тех или иных связей между базовыми понятиями выбранной предметной области. Виды этих связей могут быть различными; наиболее распространенными являются следующие [2].

- Отношение "часть/целое", например, автомобиль и его составные части, каждая из которых, в свою очередь, может собираться из более мелких деталей; онтология, построенная на базе таких отношений, называется партономией (от английского слова part - часть).

- Отношение "общее/частное" ("класс/ подкласс"), например, всевозможные

классификации животных или явлений природы; соответствующая онтология называется токсономией.

- Отношение "класс/экземпляр", которое дополняет предыдущее, если на нижнем уровне классификации содержатся конкретные "индивиды", например, класс "кошка" и отдельные домашние животные Мурзик, Васька и др., или связь между самолетом марки "Ту-154" и конкретными машинами, осуществляющими те или иные регулярные рейсы.

- Смысловые связи и ассоциации, например, наличие свободных зарядов и приложение разности потенциалов есть условия существования электрического тока.

Существуют и другие виды связей: сочетание (слова в предложении), "причина/ следствие", отношение зависимости, синонимы, антонимы и некоторые другие [4]. В реальном учебном материале присутствуют все виды связей, что сильно усложняет задачу построения онтологии. В частности, в работе [5] классификация учебного контента в виде строго иерархической структуры названа одной из главных трудностей. Причина этой трудности принципиальна и лежит в природе самого изучаемого материала.

Описание отношений между понятиями

Согласно традициям, которые приняты в представлении знаний и в системах искусственного интеллекта (в частности, в языке Пролог), сведения о связи категорий описываются в виде парных отношений. Сами отношения для целей идентификации получают имена. Например, утверждение, что ОЗУ является одной из разновидностей компьютерной памяти, можно представить в виде связи с именем "являться разновидностью" между объектами "ОЗУ" и "память". Строго говоря, отношение между рассматриваемыми категориями не является симметричным, поскольку память более общее категория, чем ОЗУ (ОЗУ - это память, но память - не обязательно ОЗУ).

В связи с указанной несимметрией отношений договоримся здесь и далее называть один из объектом ведущим, а

другой - ведомым. Данные термины не являются общепринятыми и не всегда отчетливо выделяются: например, для "смысловой связи" между объектами "процессор" и "машинное слово" выбор ведущего объекта не столь очевиден. Тем не менее с точки зрения технической реализации данное деление кажется удобным.

Заметим, что связь между двумя объектами не обязательно единственная: в некоторых случаях возможны несколько различных связей, например, объекты "контроллер" и ''устройство вывода" связаны отношениями "состоять из" (контроллер является составной частью устройства) и "управлять" (контроллер управляет устройством).

Связи могут быть как универсальными (в приведенном выше примере "состоять из"), так и специфическими для данной области знаний ("управлять"). При вдумчивом отборе общее число характерных связей для фиксированной предметной области оказывается вполне обозримым.

В качестве иллюстрации рассмотрим представление в виде парных связей информации об одной из составных частей компьютера - ОЗУ. Относительно ОЗУ справедливы следующие ниже утверждения.

- ОЗУ - это одна из разновидностей компьютерной памяти.

- ОЗУ состоит из отдельных ячеек.

- ОЗУ базируется на принципе адресности (каждая ячейка имеет свой номер, который называется адресом).

- При хранении информации в ОЗУ используется также принцип хранимой программы (согласно последнему, ОЗУ является общим и для программы, и для данных).

- Конструктивно ОЗУ располагается на материнской плате компьютера.

- По технологии изготовления ОЗУ бывает статическое и динамическое.

Все приведенные выше утверждения на языке парных отношений отобразятся в виде, приведенном на рис. I.

Из приведенного рисунка видно, что рассматриваемый нами объект "ОЗУ” обладает значительным числом связей, причем связи имеют несколько разных типов. Кроме того, не стоит забывать, что все остальные объекты также имеют собственные связи, которые на рис. I не показаны.

Основные составляющие онтологии

При описании состава онтологии мы будем базироваться на той терминологии, которая принята в выбранном программном средстве Protege.

Онтологии состоят из классов, слотов и их экземпляров.

Классы (classes) описывают отдельные понятия предметной области, а экземпляры класса (instances) представляют собой конкретные примеры реализации объектов данного класса. В отличие от классов, экземпляры являются конечными объектами иерархии категорий и уже не могут подразделяться. В рассматриваемом курсе архитектуры компьютеров в качестве классов выделим, например, "клавиатуру", "мышь" и "сканер", которые является частью более крупного класса "устройства ввода". В качестве экземпляров класса "сканер" могут выступать конкретные модели сканеров. Строго говоря, определение экземпляров класса, которые являются низшим уровнем онтологии, существенно зависит от цели ее построения. Например, для обсуждаемого образовательного курса модель сканера является предельным уровнем детализации понятий, в то время как в случае построения онтологии для складского учета для каждой модели будут реализации, имеющиеся в наличии на стеллажах. Поэтому в последнем случае модель сканера тоже приходится считать классом, а в роли экземпляров выступают изделия в коробках.

Слоты (slots) - свойства и атрибуты, применяются как к классам, так и их экземплярам. В данной работе слоты имеют вспомогательный характер и используются в первую очередь для указания типов связей между объектами. Соответственно все классы в иерархии понятий курса будут иметь несколько пар слотов "отношение" и "объект", значениями которых будут названия связей между объектами.

Заметим, что в Protege между перечисленными категориями существуют строго определенные связи [3].

От класса могут быть порождены новые классы, а также конкретные экземпляры этого класса (некоторые классы, имеющие статус абстрактных, не допускают порождения экземпляров). Экземпляры являются конечными узлами иерархии, т.е. принципиально не могут иметь наследников. Су-

ществует (и в Protege поддерживается) множественное наследование классов,

когда класс происходит от нескольких родительских классов и при этом наследует все их слоты. Например, файловая система наследует отдельные черты как от внешних устройств (hardware), так и от операционной системы (software). В отличие от классов, экземпляр обязательно порождается от одного класса.

Слоты самостоятельны и напрямую не принадлежат какому-либо классу или экземпляру (это в принципе позволяет использовать один и тот же слот в разных ветвях иерархии). Они бывают двух типов -собственные слоты (own slots) и слоты шаблона (template slots). Первые являются собственностью данного класса или экземпляра и могут иметь индивидуальное значение. Вторыми может обладать только класс, причем все слоты шаблона передаются по наследству. Слоты шаблона по своей сути не могут иметь значений, пока не будут переданы конкретному экземпляру, где они, став его собственными слотами, приобретут свойство быть заполненными. Слоты могут дополняться только к классу, а экземпляры классов лишь способны их наследовать.

С каждым классом в Protege жестко связана интерфейсная форма (form), применяя которую пользователь будет заносить необходимые значения в слоты. Формы легко редактируются, что позволяет придавать им удобный для ввода вид.

Формулировка проблемы

Целью работы является составление тезауруса основных понятий курса "Архитектура ЭВМ" и установления связей между этими понятиями. Данный курс в течение многих лет читался студентам физического факультета ПГПУ. В то же время предлагаемый тезаурус может считаться несколько расширенным описанием структуры материала для изучения в школьном курсе информатики в рамках одной из его содержательных линий

- "Компьютер".

В состав курса входят следующие наиболее важные вопросы.

- Современный компьютер как единство программной и аппаратной частей.

- Фундаментальные принципы устройства ЭВМ. Архитектура.

- Функциональное устройство компьютера: основные блоки, их функции и назначение; взаимодействие между ними.

- Основной механизм исполнения программы. Загрузка программного обеспечения.

- Состав программного обеспечения современного компьютера. Роль операционной системы в функционировании компьютера.

- Основы кодирования команд и данных различных типов. Система команд компьютера.

- Арифметические основы компьютера: системы счисления, особенности двоичной арифметики.

- Логические основы устройства компьютера: операции, логические элементы и схемы.

- Варианты конструктивной реализации компьютеров.

При раскрытии перечисленных выше вопросов используется более 120 категорий, которые вошли в тезаурус. Особо отметим, что из-за достаточно большого объема данных представить их в компактном виде оказалось весьма затруднительно. Поэтому было принято решение не включать в указанный объем наиболее тривиальные термины вроде названий устройств ввода/ вывода, разновидностей базового ПО, конкретных операционных систем или существующих таблиц кодирования текста, а также прочих второстепенных деталей.

Для отражения связей между всеми этими категориями отслеживалось наличие следующих типов отношений (см. табл.1)

В таблице представлены одиннадцать типов отношений, которые потребовались для описания взаимосвязей между базовыми терминами курса. Помимо их порядкового номера и краткого названия, приведены наиболее характерные глаголы, которые обычно используются для словесного описания каждой связи; для большей

однозначности в последнем столбце даны разнообразные примеры. Подчеркнем, что каждому отношению соответствует целый ряд глаголов, что является следствием обобщенного характера базовых отношений.

Первые пять отношений табл. 1 являются наиболее общими и входят практически во все системы представления знаний. Остальные добавлены для адекватного описания выбранной предметной области, причем "основание" и "применение" главным образом отражают ссылки на теоретические основы, а остальные довольно специфичны и встречаются в единичных случаях. Поскольку, как указывалось выше, в базовый глоссарий не включались второстепенные термины и названия, экземпляры классов не рассматривались и связь под номером 3 не использовалась (в табл. 1 она включена для сохранения общности).

По-видимому, выделение и формулировка связей между понятиями является наиболее субъективной частью составления тезауруса.

Реализация тезауруса средствами Excel

Используя возможности мощного современного табличного процессора Excel, можно представить всю информацию о разрабатываемом тезаурусе в довольно компактном, хотя и не слишком наглядном виде. Опишем организацию табличного представления результатов подробнее.

Каждая категория тезауруса представляет собой совокупность отношений, которые связывают ее с остальными категориями. Как уже отмечалось ранее, объект в отношении может быть ведомым или ведущим, в зависимости от его значимости в данном отношении. Например, в отношении "часть/ целое" ведущим, несомненно, будет целое, а в отношении "реализация" - объект, который осуществляет то или иное действие (см. табл.1). В отношениях с теоретическими принципами "основание" и "применение" теоретический принцип несколько условно принимался ведущим по отношению к объекту, в котором он реализовывался. В частности, "принцип двоичного кодирования" полагался ведущим в паре с "системой

Информационные компьютерные технологии в образовании • Вестник ПГПУ • Вып. 3

Таблица I

N связь характеристика примеры

І целое/часть содержит, состоит из -является частью, входит на плате находятся...; процессор установлен на материнской плате; программы и данные хранятся на носителе; команда состоит из отдельных тактов

2 класс/подкласс имеет разновидности -является разновидностью (классификации) виды памяти: ОЗУ, внешняя память и т.д.; ОЗУ бывает статическое и динамическое; ОС и утилиты - системное ПО; счетчик команд - это регистр

з класс/экземпляр реализуется в виде -является примером (конкретный экземпляр типа) текстовыми редакторами являются Notepad, Word, ТеХ и др.; клавиатура и сканер - устройства ввода; процессор Intel содержит следующие регистры...

4 смысловая связь понятия связаны между собой по смыслу дискретность - бит, слово - процессор, разрядность - байт, конструкция - наличие ее вариантов, помехоустойчивость - кодирование данных

5 аналогия понятия аналогичны программный интерфейс (между человеком и машиной) аналогичен аппаратному (между устройствами ЭВМ)

б основание является основой -базируется на кодирование базируется на двоичной системе; ЭВМ строится на основе взаимодействия узлов; основной алгоритм существенно использует счетчик команд

7 применение («слабее», чем 6) применяет(ся), использует(ся) при взаимодействии блоков применяется шина; ПО имеет программный интерфейс; один из принципов ОЗУ - принцип хранимой программы

8 характеристика характеризует(ся) процессор характеризуется тактовой частотой; разрядность характеризует процессор и ячейку ОЗУ; система команд определяет возможности процессора

9 реализация выполняет(ся), производит(ся), осуществляет(ся) АЛУ реализует арифметические и логические операции; ROM BIOS осуществляет начальную загрузку ПО; программа обрабатывает данные

10 управление управляет(ся) чем-либо операционная система управляет работой аппаратной части; контроллер управляет вводом с внешнего устройства

11 соединение соединяет(ся) контроллер присоединяется к плате через слот расширения; разъем подсоединяет внешнее устройство к системному блоку

связанного объекта и номер связи с ним согласно табл. I. Скажем, информация "память 2" означает, что рассматриваемый объект "ОЗУ" связан с объектом "память" отношением номер 2, т.е. "класс/подкласс". "В переводе" на естественный язык это значит, что ОЗУ является разновидностью памяти. Аналогичным образом сокращение "ячейки ОЗУ I" расшифровывается как общепринятая фраза "ОЗУ состоит из отдельных ячеек".

Таблица 2

ОЗУ

память 2 ячейки ОЗУ І

принцип адресности б статическое ОЗУ 2

принцип хранимой программы 7 динамическое ОЗУ 2

материнская плата І

команд компьютера", где он использован.

Приведем в качестве примера табличное представление данных о связях объекта "ОЗУ", которые изображались ранее на рис.1. Получим некоторую характерную структуру, которая помещена в табл. 2.

В верхней выделенной цветом строке указывается название объекта. Два левых столбца описывают связи, где "ОЗУ" является ведомым, а правые - ведущим объектом. В обоих случаях указывается имя

При организации объектов тезауруса в таблице стоит не вписывать каждый раз названия объектов, а использовать стандартный механизм ссылок на ячейки. Например, для объекта "память" формула в авторской реализации имела вид =E26&R2, где Е26 - это адрес заголовка объекта "память", а R2 -текст, соответствующий отношению под номером 2 (знак "&" в Excel, как известно, используется для объединения строк). Помимо возможности легко корректировать названия объектов и связей, предлагаемая схема позволяет быстро найти на громоздкой схеме любое понятие, на которое ссылается рассматриваемый объект.

Полная таблица всех категорий курса с нанесенными по указанной системе связями представлена в табл. 3; из-за ее большого объема она вынесена из текста на отдельные страницы.

Анализ применения табличной формы представления тезауруса показывает, что она позволяет компактно размещать информацию и выводить ее на бумагу, но зато не очень наглядна и трудно читаема. Предлагаемый далее альтернативный метод представления тезауруса в виде дерева в системе Protege лишен этих недостатков, но, напротив, удобен для использования только на экране дисплея, не позволяя для такой объемной системы объектов получить распечатку на бумаге приемлемого размера и вида.

Реализация тезауруса средствами Protege

Рассмотрим теперь, какие возможности дает нам для представления тезауруса курса система ведения онтологий Protege.

Прежде всего, отметим, что говорить о единой онтологии для нашей задачи можно только весьма условно. Даже беглый анализ табл. 3 показывает, что связи между ее объектами различны, и поэтому выбрать тип "чистой" онтологии (партономия, токсономия и т.п.) невозможно. Поэтому приходится принимать компромиссное решение, например, строить дерево категорий по "главным" для объектов признакам, а все остальные связи отражать, используя механизм слотов. Заметим, что главными

связями для всяческих классификаций служат, как правило, связи типа I или 2, т.е. "часть/ целое" или "класс/подкласс".

Например, для рассмотренного выше примера (табл. 2) объект "ОЗУ" будет присоединен к объекту "память", а его связи с остальными объектами: "принцип адресности", "принцип хранимой программы" и "материнская плата" будут описаны в слотах объекта. Технически для реализации указанного сочетания связей приходится каждому классу ставить в соответствие вспомогательный экземпляр класса, в который и заносятся связи, не отраженные в дереве классов. В описываемой реализации названия класса и его экземпляра отличаются по значку подчеркивания "_" перед именем: например, " ОЗУ" есть класс, а "ОЗУ" - его экземпляр с "оставшимися" связями.

Описанная структура для реализации сложных онтологий была обоснована и подробно описана в [3]. Подобный "комбинированный" метод не слишком удобен, но, по-видимому, является единственно возможным при наличии разнородных связей между объектами в рамках системы ведения онтологий Protege.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Онтология, построенная для нашего случая, будет базироваться на двух основных классах: "отношение" и "понятие".

Первый класс ("отношение") будет содержать более 20 экземпляров класса, каждый из которых является глаголом, наиболее близко описывающим данную связь (см. табл.1). Подчеркнем, что в отличие от предыдущей реализации средствами Excel теперь мы не так сильно ограничены при отображении структуры объекта, поэтому вместо номеров связи можем позволить себе использовать более удобные словесные формулировки.

Второй из упомянутых классов ("понятие") будет вмещать в себя в качестве подклассов все те понятия курса, которые образуют огромную табл. 3. Поскольку при отображении классов в виде дерева не обязательно единовременно показывать сразу все классы (вспомните, как операционная система отображает систему папок с

документами!), количество включаемых в онтологию понятий теперь не существенно. Но зато обзор дерева, будучи интерактивной процедурой, возможен только на экране дисплея.

Рассмотрим теперь процесс построения онтологии в системе Protege несколько подробнее.

Общий вид интерфейса программы изображен на рис. 2. Как видно из рисунка, представляющего собой копию экрана в момент просмотра уже готовой онтологии, Protege позволяет работать с данными в пяти режимах - по числу интерфейсных "закладок"(см. закладки "Classes", "Slots", "Forms", "Instances" и "Queries" ниже панели инструментов главного окна). Первые четыре термина подробно разбирались ранее в разделе "Основные составляющие онтологии", а последней закладкой ("Запросы1") мы пользоваться не будем. На рис. 2 показано состояние экрана при работе в режиме "Instances" (выбранная закладка светлая): кроме обязательного окна классов "Class browser" открыты окна "Instance browser" ("Просмотр экземпляров") и "Instance editor" ("Редактирование экземпляров"). По принятым в Protege правилам, если нажать мышкой кнопку просмотра (с изображением лупы), то раскрывается специальное окно для работы с выбранным экземпляром: в нашем случае развернуто содержимое экземпляра класса "ОЗУ”, окно со слотами которого видно на переднем плане в центре.

Каждый класс содержит слоты, которые представлены в отображающем окне в виде полей редактирования. В последние занесены текущие значения слотов, над которыми находятся подписи с названиями соответствующих слотов. Например, в слоте "имя” вписано название рассматриваемого класса

- "ОЗУ”, а в располагающихся ниже слотах "имя отношения” и "объект” (с номерами I, 2, 3 и т.д.) занесена информация об отношениях выбранного объекта с другими. Заметим, что, с точки зрения принятой в Protege типологии, значения полей "имя отношения” и "объект” суть экземпляры

класса. Сравнивая значения слотов с табл.2, мы видим четыре отношения из семи, определенных для анализируемого класса. Оставшиеся связи можно найти в окне "Class browser" в левой части рис. 2: класс "ОЗУ” порождается от класса ”_памятъ” (ОЗУ -разновидность памяти), а сам в свою очередь служит родителем для классов ”_статическое ОЗУ” и ”_динамическое ОЗУ”. Таким образом, все связи из табл. 2 оказываются на рис. 2 отраженными, хотя и по-разному.

Разбирать типы отображаемых в Protege данных легче, если запомнить, что классы обозначаются в форме кружков, а их экземпляры - в форме ромбиков. На экране дополнительно имеется цветовое различие в обозначениях, но передать его на рис. 2 невозможно.

При чтении имен связей в сочетании с объектом связи следует иметь в виду, что приведенные имена объектов система склонять не способна, так что ОЗУ "является частъю” "материнская плата” (а не материнской платы) и "состоит из” "ячейки ОЗУ” (а не ячеек ОЗУ).

Все объекты в окне экземпляров обладают гипертекстовым свойством, так что щелчок по любому из них вызывает появление соответствующего окна с описанием выбранного экземпляра. Это окно будет выглядеть очень похоже на то, что изображено на рис. 2 для "ОЗУ”, только его поля будут заполнены другими значениями связей. Отсюда мы видим, что получить информацию об объектах, с которыми связано "ОЗУ”, очень легко.

Не менее просто путешествовать по дереву (иерархии) понятий, используя несложные манипуляции мышью. Поскольку данная статья не ставит целью создать практическое руководство по освоению Protege, мы не будем останавливаться на этом вопросе.

Обсуждение результатов

Проанализируем, какие возможности может нам дать представление базовых понятий курса в виде онтологии (тезауруса).

Начнем с того, что сама работа по составлению онтологии необычайно полезна

*1

1

*

л

* п

■ о тз

■б

0

о

ей

ш1

В п

х

ж

&

и

С

я

«

с

X

Ж

>

сС

V

ж

сС

V

ж

<=с

V

ж

сС

V

ж

сС

V

ж

сС

со

Е

Ш

Л

о

V

ж

сС

л

:>

га

е-

о

п.

с.

о

X

я

о.

X

I

х

о.

с

I—

0

>

<Гг

І3

с;

о

с

и

2

V

Ж

сС

V

ж

а*

>

со

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

О

=

ф

т

£

и

£ О

о

и £ \ % 1 тз - |_ Э ЙЗ й| £|

=

и

о

с,

ю

0

А

Г

±1

га

г

о

г

-е-

-

>, СП

иэ О О ш § § о Щ

й.

О

У

О

±1

=Г *

э ^ 1 га

п С1

>

О.

I I

4 • •

УЧ

Г"

“ га

га С1

^г и

о

ш и

(й <й

О О

ш ш

1— 1—

и и

О О

О. О.

\— I—

и и

*1 *1

• •

о

О

с;

ю

0

И

Ш

I—

О

0

■ТЕ

О

*

га

V

Ж

ЬО

Е

0)

А

■О

О

V

ж

*

>■ о. \— о г о

I “|

СП

0

0

1

• *

• А ►

• А А

• • ►

А ►

А А ►

Рис. 2

для преподавателя: при выделении основных категорий курса и их связей приходится проводить тщательный анализ учебного материала и его систематизацию. Получившаяся в результате этой работы онтология позволяет планировать

последовательность введения на занятиях новых понятий, более равномерно их распределять, а также более обоснованно организовывать повторение необходимого для изложения материала. Подчеркнем, что онтология дает некоторую общую картину изучаемого материала, так что ее полезность для образования трудно переоценить [I].

В подтверждение приведем несколько примеров.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Традиционно в компьютерных курсах обычно требуют знакомства с устройством двоичной системы. Пользуясь табл. 3, проследим, на что данные знания влияют. Получим следующую цепочку понятий: двоичная система - принцип двоичного кодирования - кодирование команд и данных

- система команд, а также кодирование данных (чисел, текстов и т.д.) Таким образом, отчетливо видно, что если в изучаемом курсе не требуется рассматривать вопросы кодирования или расшифровки данных и не изучается система команд компьютера, то рассмотрение в таком курсе двоичной системы есть не более чем дань традициям. Аналогичные выводы можно сделать и относительно необходимости включения в курс материала о логических элементах.

Можно применить построенный тезаурус и при оценке содержания учебного курса с других позиций. Многие пользовательские курсы базируются исключительно на основе изучения программного обеспечения. Что мы потеряем, если примем на вооружение такой подход? Из табл. 3 немедленно виден круг вопросов, где знания будут как минимум поверхностными: управление аппаратной частью компьютера с помощью ОС, вопросы,

связанные с загрузкой, работа с файловой системой, представление данных.

Разумеется, анализ тщательно составленного тезауруса позволяет получить и много других, причем даже более сложных выводов относительно логичности структуры курса и взаимосвязи его разделов материала.

Если описанную выше реализацию дополнить текстовыми полями с аннотациями к каждому понятию, то получится простейший электронный справочник по системе понятий курса с удобной навигацией.

При некоторой доработке онтология может быть полезна и при контроле знаний учащихся - какую часть понятий курса усвоил обучаемый. Учитывая, что система Proege сохраняет данные в нескольких стандартных форматах, полученная аналогия может быть в принципе использована при создании автоматизированных обучающих и контролирующих систем. Особо подчеркнем, что благодаря стандартности сохранения онтологий конкретное предметное наполнение никак не влияет на написание автоматизированных систем.

Как показывает опыт построения онтологии курса, представление учебного материала в рамках чисто древовидной модели затруднительно. Трудности носят принципиальный характер, поскольку, в отличие от "классической" онтологии, в реальных знаниях связи между объектами достаточно разнообразны. Для более адекватного представления материала имеет смысл опробовать более современные и сложные технологии струк-турирования знаний, в частности, карты предметной области (topic maps) [7]. Работы в указанном направлении будут продолжены.

Автор выражает благодарность М.Т. Шарову за полезное обсуждение базовых понятий курса и связей между ними.

Таблица З

software приклад. ПО спеи .ПО прог. интерф. ком. строка

компьютер (1) фиклад. ПО (2) software (2) спец. ПО (2) фиклад.ПО (2) sotware (7) ком .строка (2) прог.интерф. (2)

програм.пр. (6) систем.ПО (2) ПОобщ.назн. (2) ПО общ назн. интерфейс (5) граф интерф. (2) граф .интерф.

загрузка ПО (4) слот.фог. (2) фиклад.ПО (2) прог.интерф . (2) I

носители (1) фог. интерф. (7) систем. ПО ОС Ф айл сист.

ROM BIOS (1) данные (9) software (2) ОС (2) систем. ПО (2) hardware (10) ос с?)

утилиты (2) загрузка ПО (19) внеш .пам. (7)

файл.сист. (?)

ком потер .сети ROM BIOS

данные утилиты ГО У (ROM) (2) sotware (1)

software (]9) кодир. данн. (16) систем. ПО (2) матер, плата (1) начзагрузка (9)

носители (1) сист прог. ЯЗ.ВЫС.урОВ. начзагрузка

носители software (2) ЯЗ.ВЫС.урОВ. (2) сист.прог. (?) ROM BIOS CP) загрузка ПО (10)

внеш. ПЭН. (1) software (1) ассемблер (2) ассемблер загрузка ПО

данные (1) сист.прог. (?) нэч.зэгрузкэ (10) software (4)

сист.команд (6) ОС (9)

hardware функц. блоки фоцессор Д1У

компьютер (1) функц. блоки (1) hardware (1) фоцессор (?) функц.блоки (2) АЛУ (1) процессор (1) сумматор (1) слово

ОС (10) взаимод. 6л. (6) баз.финцип (16) гнмять (2) матер, плата (1) УУ (1) арифм .опер .(9) процессор (4)

конструкция (7) устр. ввода (2) со фоцессор (4) кош (1) логич.опер.(9) разрядность (4)

узлы (1) устр.вывода (?) разрядность (8) УУ

лотч. сяемы (1) такт.щстота (8) процессор (1) СчАК (1)

але м. база (1) кош сист.команд (13) per. команд (1) статич. ОЗУ

гнмять (2) регистры (1) per.флагов (1) ОЗУ (2) кош (2)

фоцессор (1) слово (4) ОЗУ триггер (1)

компьютер статич.ОЗУ (2) память память (2) ячейки ОЗУ (1) динамич. ОЗУ

software (1) функц.блоки (2) ОЗУ (?) прадреснос. (б) статич. ОЗУ (2) |ОЗУ (2) |конден.яч. (1)

hardware (1) фиерарлам (6) кош (?) прлранфог. (7) динамич. ОЗУ (2) конден .яч.

теордсновы (?) ГОУ (ROM) ГО У (ROM) (2) матер, плата (1) динамич. ОЗУ (1) 1

разное (4) ганять (2) ROM BIOS (2) внеш .пам. (2) внеш .пам.

ф.адресное. (6) узтр. ввода память (2) носители (1)

функц.блоки (2) |контроллер (1) блоч. зап. ф) блоч .зап.

шина устр .вывода файл.сист. (?) внеш .пам. (б)

взаимод. бл. (7) 1 Функц.блоки (2) |контроллер (1) контроллер (1)

Е.Л. Еремин • Онтологии как средство представления учебного материала

Продолжение таб. 3

взаимод. бл. порт

контроллер ЬаМшаге (6) шина (7) взаимод.бл. (7) | интерфейс фОТОКОЛ

взаимод.бл. (7) сист. команд (7) контроллер (7) ПДП взаимод. бл. (7) протокол (7) интерфейс (7) |кодир.данн. (7) |

внеш . гнм. (1) порт (7) взаимод.бл. (7) контроллер (7) апп.интерф . (2) ат.интерф.

устр.ввода (1) (7) преры ЕЗНИЄ прог.интерф . (5) интерф ейс (2) слот расш. (1)

устр . Е: Ы ВОДЭ (1) ферЫВЗНИе (7) взаимод.бл. (7) | Е;неш . разъем (1)

ПДП (7) интерфейс (7) сопроцессор

слот расш . (11) нзфоцеензр (7) взаимод.бл. (7) сист. команд (7)

мзтер.плата (1) компютер. сети процессор (4)

конструкция систе м. блок матер .плата

Ьагсішаге (7) гариант кон. (4) типлонстр. (4) тип Хин стр. (1 ) матер, плата 0) встроен .уст. (1) систем, блок (1) процессор (1) ОЗУ (1)

вариант кон. сне ш. разъем внеш .разъем (1) РОМ В10 5 (1)

конструкция (4) систем. блок (1) отдел.устр. (11) контроллер (1)

тип хо нет р. □пп. интерф. (1) отдел .устр. слот расш. (1) слот расш.

конструкция (4) систем.блок (1) тип Хин стр. (1 ) встроен .уст. матер.плата (1) КОНТрО.П.Пнр (11)

от дел. уст р. (1) внеш.разъем (11) систем, блок (1) | апп.интерф . (1)

углы р ЙГИ стр ы СчАК рег. команд

ЬаМшаге (1) регистры (2) гмейки ОЗУ (2) сумматор (24 узлы (2) Гр о це с сор (1) мет адресац. (7) ОчАК (?) рег.команд (2) рег.флагов (2) регистры (2) УУ 0) основ, алгор. (16) регистры (2) УУ( 1) основ.алгор. (7)

суматор триггер 0 ) переходы (7) рег.ф лагов

углы С) 1-разр . с\м. (1) ячейки ОЗУ байт регистры (2)

ту (1) узлы (2) разргвдность (8) ячейки 03 У (4) бит (1) УУ 0)

ОЗУ (1) байт (4) разрядность (4) уело в. пере К. (6)

ЛОГИЧ. схемы триггер 1-разр .сум. дешифратор

Ьагсішаге (1) триггер (2) логич.схемы (2) логич.схемы (2) логич. скемы (2) I

1-разр,с\м. (2) регистры (1) сумматор (1)

дешифратор (2) статич.ОЗУ (1)

лог.элемент (1)

лог. элемент И НЕ

логич. смемы (1) И (2) лог.елемент (2) | лог. элемент (2) |

лог. де ИСТ В. (10) ИЛИ (2) ИЛИ исключ. ИЛИ

НЕ (?) лог.елемент (2) | лог. элемент (2) |

исключ. ИЛИ (2) I

эл ем, . база реле НУ1С

ЬаМшаге (1) реле (2) элем, база (2) элем, база (2)

эл.лампа @) эл. лам га СБИС

транзистор (2) элем, база (2) элем, база (2)

ИУУ1С (2) транзистор

СБИС © элем, база (2)

Информационные компьютерные технологии в образовании • Вестник ПГПУ • Вып. 3

Окончание таб. 3

теор лоно вы баз. финцип програм, пр. основ алгор.

компьютер (16) баз. финцип (1) теор.основы 0) функц. блоки (16) баз. принцип (2) гоішаге (16) програм, пр. (7) СчАК (16) конвейер

арифметика (1) фофам. ф. £) основ, алгор. (7) ре г. команд (7) осно в. алгор. (7) |

смет. счис. (1) Ф адресное. (2) пр.адресное. конвейер (7) регистровая

алг. логики (1) Ф иерарлам (2) баз. принцип (2) ОЗУ ф) метадресац метадресац. (2) |

кодир.данн. (1) ф.2 кодир. (2) ПЗУ (РОМ) (16) сист.команд (7) регистровая (?) косвенная

сист. команд (1) Ф іран.фог. (2) Ф перар лам косвенная (2) метадресац. (2) |

баз. принцип (2) память (16) регистры (7)

пр. 2 кодир. ф.хранлрог.

баз. принцип (2) кодир.данн. (7) баз .принцип (2) ОЗУ (7)

2с£ (16) сист. команд (7) кодир.данн. (4)

сист.ко манд (4)

арифметика ариф. деист. алг. лотки лог. де ист в.

теор.основы 0) ариф . дейст. (16) арифметика (16) арифм. опер. (16) теорленовы 0) лог. действ. (16) алг. логики (16) логич.еяены (10)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

код. чисел (6) лотч.опер. (б)

сист. счис. 10 с* перевод

теор .основы 0) 10 с£ (2) сист. очіс. (2) сист.счис. (4)

сЛ; кратн. 2 (2) с£ кратн. 2 16 с £ 2 с*

перевод (4) сист. счис. (2) 16 с/с (2) с£ кратн.2 ф с Л кратн.2 (2) пр. 2 кодир. (10)

8 об (2) 8 сі бит (4)

2 ей (2) с£ кратн.2 ф

кодир данн. дискретн. бит КОД. 41 се л

теор .основы 0) дискретн. (£) кодир.данн. (18) бит (4) дискретн. (4) кодир. данн. £2)

данные (6) разрядность (3) разрядность байт (1) ариф.дейст. (б)

ф.2 кодир. (7) код. чисел (2) кодир.данн. (У) байт (4) 2 с/с (4) тексты

ф.кранлрог. (7) тексты (2) фоцессор (]8) слово (4) кодир. данн. (2) |

фОТОКОЛ (7) фафика (2) ячейки ОЗУ (18) сжатие графика

мультимед. (2) кодир. данн. (4) | кодир. данн. (2) |

сжатии (4) помехоуст. мультимед.

помехоуст. (4) кодир. данн. (4) | кодир. данн. (2) |

см от. команд команда арифм 1 .опер. такт

теор .основы 0) команда (1) сист. команд (1) арифм. опер. (2) команда (2) АЛ У (19) |команда (1) та кт .частота (4) |

ф.2 кодир. (4) мет.адресац. (7) логич.опер. и) ариф.дейст. (Ї) такт.частота

ф.лранлрог. (4) ассемблер (16) переходы (2) логич .опер. такт (4)

фоцессор (18) такт 0) команда (2) АЛ У (19) процессор (8)

контроллер (7) лог. действ, (р)

сопроцессор (7) переходы безусловный

команда (2) безусловный (2) пере моды (2)

услов. перех. (2) уел ОБ.перех.

разное тек. безо п. ОчАК (7) |п ере моды (2) рег. ф Л ЭГО Е: ф)

|компыотер (4) |тех. безоп. (2) | разное

Е.Л. Еремин • Онтологии как средство представления учебного материала

Библиографический2список

1. Андрусенко Т. Управление знаниями в учебном процессе на основе тезаурусов/ Т. Андрусенко, А. Стрижак // e-Leaming World. 2007. N I. http://www.elw.ru/magazine/22/200/

2. Буч Г. Объектно-ориентированный анализ и проектирование с примерами на C++/ Г. Буч. М.: Бином; СПб.: Невский диалект, 2000.

3. Еремин Е.А. О применении онтологий для представления программ учебных курсов/ Е.А. Еремин // Proceedings of «Modern (e-)Learning» (MeL 2007). Sofia: Institute of Information Theories and Applications FOI ITHEA, 2007. P.41-47.

4. Курс «Онтологии и тезаурусы». http:// www.microsoft.com/Rus/Msdnaa/Curricula/ Default.mspx

5. DichevaD. Authoring Educational Topic Maps: Can We Make It Easier?/ D. Dicheva, C.Dichev // Proceedings of ICALT. 2005. P. 216-219.

6. Gomez-PerezA. Ontological Engineering with Examples from the Areas of Knowledge Management, e-Commerce and the Semantic Web/ A. Gomez-Perez, M. Fernandez-Lopez, O. Corcho. Springer-Verlag, London, 2004.

7. Maedche A. Ontology Learning for Semantic Web/ A. Maedche. Kluwer Academic Publishers, Boston, 2002.

8. Milam J. Ontologies in High Education/ J. Milam// Knowledge Management and Higher Education: A Critical Analysis/ A.S.Ed. Metcalfe. Idea Group Publishing, Hershey, PA. 2005. P. 34-62.

9. Noy N.F. Ontology Development 101: A Guide to Creating Your First Ontology/ N.F.Noy, D.L. McGuinnnes. Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI-20010880. 2001 (имеется русский перевод).

http://protege.stan-ford.edu/publications/ ontology_development/ontology 101 .html

10. Noy N.F. The Knowledge Model of Protege-2000: Combining Interoperability and Flexibility/ N.F. Noy, R.W. Fergerson, M.A. Musen // Proceedings of EKAW 2000, Lecture Notes in Artificial Intelligence, no. Springer-Verlag, Berlin, 1937. P.17-32.

i Надоели баннеры? Вы всегда можете отключить рекламу.