Паньгин Сергей Александрович
ПРОБЛЕМЫ ОПИСАНИЯ СЕМАНТИКИ ПРЕДМЕТНОЙ ОБЛАСТИ В ДИСТАНЦИОННОМ ОБУЧЕНИИ
СТАНДАРТЫ В ДИСТАНЦИОННОМ ОБУЧЕНИИ
Последние десять лет много обсуждается тема дистанционного обучения. Конечно, имеется в виду использование сети Интернет, которая, как все уже убедились, имеет для этого богатейшие потенциальные возможности. Однако результаты этой работы пока скромные. Каковы причины этого и какие технологические новшества могут повысить эффективность использования глобальной сети в обучении?
Первая проблема состоит в том, что до настоящего времени системы дистанционного обучения создавались в целях подготовки персонала для крупных фирм, имеющих сеть филиалов по всему миру. Разумеется, эта подготовка велась не в таких фундаментальных областях, как математика или физика. Дистанционно обучались служащие компаний, которым требовался определенный уровень простых знаний технологического и управленческого характера. Системы, которые производят эти фирмы, не годны к массовому распространению, так как очень дороги и специализированы в силу своего происхождения.
Возможность уменьшить стоимость создания систем дистанционного обучения и расширить их применимость состоит в том, чтобы распределить работу по созданию систем дистанционного обучения, включая и создание учебных материалов. Для этого
прежде всего нужны стандарты. Стандарты для представления информации и обмена данными, для совместимости различных систем и сервисов дистанционного обучения.
Вот, например, наиболее общие требования к таким системам. Программное обеспечение, используемое в обучающих системах, должно быть:
- доступным (accessible) - давать возможность работать с системой из разных мест (локально и дистанционно, из учебного класса, с рабочего места или из дома); программные интерфейсы должны обеспечивать возможность работы людям разного образовательного уровня, разных физических возможностей (включая инвалидов), разных культур;
- адаптивным (adaptable) - позволять системам включать развивающиеся новые информационные технологии без перепроектирования
&ис&аНциоННо обучались служащие кожпаНий, ко&о-рмм определенный урОеЯъ
np/осйих ^НаНил...
систем; иметь встроенные методы для обеспечения индивидуализированного обучения;
- экономически доступным (affordable) - так как стандарты ориентируются прежде всего на непрерывное образование, происходящее в течение всей жизни человека;
- долговечным (durable) -соответствовать разработанным стандартам и предоставлять возможность вносить изменения без тотального перепрограммирования;
- интероперабельным (interoperable) - обеспечивать возможность взаимодействия различных систем, что крайне важно для распределенных учебных сред;
- многократно используемым (reusable) -поддерживать возможность многократного использования компонентов обучающих систем, построенных на основе информационных технологий, что повышает эффективность разработки и снижает ее стоимость.
Однако требований общего характера недостаточно. Нужны технические стандарты.
Существует ряд международных организаций, работающих в сфере стандартизации учебного процесса. Среди этих организаций ведущая роль принадлежит аккредитованному IEEE комитету P1484 LTSC (Institute of Electrical and Electronic Engineers, Project 1484, Learning Technology Standards Committee), занимающемуся разработкой архитектуры для технологий образовательных систем LTSA (Learning Technology Systems Architecture) [1].
Ниже мы разберем подробнее некоторые из этих стандартов.
МЕТАДАННЫЕ В СИСТЕМАХ ДИСТАНЦИОННОГО ОБУЧЕНИЯ
Другая проблема развития дистанционного обучения - бедность способов представления информации. Так, за единицу «учебной» информации обычно принимается кусочек текста, картинка, анимация, может быть, программный модуль. Однако, что-
fucenaftcytaftftma обугеКсф —
бы все эти элементы использовать в различных системах обучения, их надо как-то упорядочить. Такой способ давно известен - это создание баз данных. На каждый «учебный модуль» составляется карточка с описанием его особенностей. Далее по этой информации можно, организовав информационный поиск, найти требуемый объект. Конечно, такая работа с учебной информацией не дает больших образовательных возможностей - это просто «перелистывание» громадных справочников. Хочется, чтобы информация обладала какой-то структурой (синтаксисом) и какими-то смысловыми связями (семантикой). Для этого к базам данных подсоединяются правила синтаксической и семантической обработки, после чего ее можно считать базой знаний, а подсоединенные правила называть метаданными.
Метаданные являются важной составляющей создания распределенных учебных систем, дающих возможность многократного использования учебных материалов в различных учебных организациях, быстрого и эффективного поиска учебных материалов в сети Интернет как преподавателями, так и студентами, защиты авторских прав и т. д.
Таким образом, появляется новая область стандартизации, специфичная именно для компьютерных систем, поддерживающих обучение, - это разработка стандартов на метаданные учебных объектов. Этот стандарт формализует синтаксис и семантику метаданных учебных объектов, определяемых как атрибуты, требуемые для полного и адекватного описания учебных объектов.
Учебные объекты рассматриваются здесь максимально широко, как любая сущность, электронная или нет, которая может быть многократно использована или на которую можно ссылаться во время технологически поддерживаемого обучения. Примерами технологически поддерживаемого обучения могут служить компьютерные обучающие системы (например, «От Кремля до Рейхстага» фирмы 1С), интерактивные учебные среды (например, «Атлас древнего
мира» фирмы «Новый диск»), интеллектуальные автоматизированные обучающие системы, системы дистанционного обучения (например, eLearning Server и другие системы ДО) и учебные среды совместного пользования.
Как уже говорилось, примерами учебных объектов могут служить аудио и видео файлы, текст, гипертекст, рисунки. Кроме того, учебными объектами в обсуждаемом смысле можно считать учебное программное обеспечение и инструменты разработки, события, ссылки на которые используются во время технологически поддерживаемого обучения
Стандарты на метаданные учебных объектов связаны с определением минимального набора атрибутов, необходимых для управления, размещения и оценки этих учебных объектов. Стандарты обеспечивают возможность локального расширения основных полей и типов, поля могут иметь статус обязательных или произвольных. Это означает, что мы можем добавлять к уже разработанным системам новые элементы, связанные с иным структурированием, либо добавлением новых «смыслов».
В качестве простого примера атрибутов учебных объектов можно привести тип объекта, имя автора, адрес владельца, условия распространения и формат.
Для каждого конкретного учебного объекта можно иметь более одного набора метаданных. Это означает, что объект может быть описан несколькими способами, и взаимодействие с ним может осуществляться через разные интерфейсы.
Заметим, что стандарт на обучающие системы не описывает метод реализации этих характеристик. Это позволяет использовать различные платформы и обеспечить совместимость построенных на них систем.
Основные цели стандартов на метаданные, предложенные рабочей группой IEEE, состоят в следующем:
1. Дать возможность учащимся или преподавателям искать, оценивать и использовать учебные объекты.
2. Разрешить совместное использование и обмен учебными объектами в любой
технологически поддерживаемой обучающей системе.
3. Разрешить разработку учебных объектов блоками, которые могут комбинироваться или разбиваться различным образом.
4. Дать возможность компьютерным агентам автоматически и динамически составлять персонализированные уроки для индивидуальной работы учащегося.
5. Стимулировать развитие рынка учебных объектов, который поддерживает все формы их распространения: бесплатную, некоммерческую и коммерческую.
6. Дать возможность образовательным организациям - государственным, общественным и частным - реализовывать образовательные стандарты на содержание и успеваемость в стандартизованном формате, независимом от содержания.
7. Обеспечить исследователей стандартами, которые поддерживают сбор и совместное использование сравнимых друг с другом данных по применимости и эффективности учебных объектов.
8. Поддерживать необходимый уровень безопасности и аутентификации для распространения и использования учебных объектов.
Разработка учебных материалов, используемых в международных компьютерных обучающих системах, сталкивается с проблемой локализации при их применении в национальных обучающих системах. Стандарт включает процедуры перевода естественного языка, а также более технические проблемы (например, набо-
и б^аимодеЛс&бие с Ним
tefcej равные иНйерфейси.
(¿nteroperabie),
¿fauMOfeucffofiufr рл^лигяих /майем,,,
ры символов и кодировки) и более общие культурные проблемы (например, метафоры пользовательского интерфейса).
Целью разработки стандарта является поддержка глобальной применимости и понимания обучающих технологий. В основном это касается конечных пользователей и представляет особую важность в аспекте межкультурных взаимодействий в рамках распределенных образовательных систем [2].
Разработка спецификаций на метаданные тесно связана с одним из главных требований к обучающему программному обеспечению - интероперабельностью (interoperable), то есть возможностью обеспечивать взаимодействия различных систем, что крайне важно для распределенных учебных сред.
Поясним на примере. Два вуза предоставляют возможность изучать разные курсы, но студент, обучающийся в одном вузе, хотел бы изучить дополнительные курсы, а они предоставляются другим вузом. Таким образом, обмен данными (содержанием курсов, информацией по успеваемости студента, списком изученных тем и т. д.) между вузами был бы очень желателен. В этом и заключается требование к обучающему ПО: различные обучающие системы должны иметь возможность обмениваться данными и «понимать» данные других систем, но при этом эти данные не обязательно должны иметь одинаковый синтаксис.
Большинство из созданных в настоящее время систем реализует требование интероперабельности за счет открытости интерфейсов доступа к своим сервисам путем использования единого формата для
обмена данными, а именно XML, и связанной с ним объектной модели представления документов DOM (Document Object Model), осуществляя, если необходимо, XSL-преобразования [3].
Не углубляясь в эту интересную и большую тему, поясним для тех, кто не знаком c XML, что язык XML позволяет описывать данные произвольного типа и используется для представления специализированной информации. Это означает, что XML может служить мощным дополнением к HTML для распространения в Web «нестандартной» информации. Возможно, в самом ближайшем будущем XML полностью заменит собой HTML.
XML-документ представляет собой обычный текстовый файл, в котором при помощи специальных маркеров создаются элементы данных, последовательность и вложенность которых определяет структуру документа и его содержание. Основным достоинством XML-доку-ментов является то, что при относительно простом способе создания и обработки (обычный текст может редактироваться любым текстовым процессором и обрабатываться стандартными XML-анализаторами) они позволяют создавать структурированную информацию, предназначенную для обработки компьютером.
XML-документы могут использоваться в качестве промежуточного формата данных в трехзвенных системах. Обычно схема взаимодействия между серверами приложений и баз данных зависит от конкретной СУБД и диалекта SQL, используемого для доступа к данным. Если же результаты запроса будут представлены в некотором универсальном текстовом формате, то звено СУБД станет «прозрачным» для приложения.
Практическая работа с XML требует отображения в связанную с ним объектную модель представления документов (DOM-модель, так как практически во всех задачах, где необходимо работать с XML, используют DOM).
В то же время пока практически не существует систем дистанционного обучения, обеспечивающих интероперабельность. Объединению учебных систем различных производителей мешает проблема отсутствия семантических определений.
Это можно было бы сделать за счет использования единого представления данных предметной области, а именно исполь-
зования словаря ключевых слов - терминов, и с его помощью уже описывать данные (онтологии).
После составления такого словаря для представления данных предметной области можно использовать язык web-онтологий OWL (Ontology Web Language) [4], который является одной из самых последних разработок, базирующихся на направлении Semantic Web и поддерживаемых консорциумом W3C.
Расскажем об этом языке подробнее и попробуем привести пример его использования для целей образования.
ЯЗЫК WEB-ОНТОЛОГИЙ
На данный момент существует несколько подходов к описанию объектов предметной области и достаточно большое количество языков их представления, реализующих эти подходы. В языке web-онтологий используется в упрощенном виде один из наиболее популярных сегодня подходов -объектно-ориентированный метод описания. Основы языка OWL - свойства, классы, объекты и ограничения реализуют представление об объектах как о множестве сущностей, характеризуемых некоторым набором свойств. Эти сущности состоят между собой в определенных отношениях и объединяются по определенным признакам (свойствам и ограничениям) в группы (классы).
Создание онтологии начинается с описания иерархий классов понятий, составляющих данную предметную область. Для того чтобы понятия предметной области были наполнены определенным смысловым содержанием, они должны характеризоваться конкретными наборами свойств и состоять в определенных связях друг с другом. Эту задачу в языке OWL решают механизмы свойств и ассоциированных с ними ограничений. Свойства подразделяются на два вида: свойства-характеристики и свойства-связи. Первые - характеризуют объекты (классы) и принимают в качестве своих значений данные определенных типов. Вторые -ассоциируют объекты (классы) друг с другом и соответственно принимают в каче-
стве своих значений объекты (классы). На свойства накладываются ограничения двух типов: глобальные и локальные. К глобальным ограничениям относятся домены (классы, объекты которых могут обладать этими свойствами) и диапазоны (классы, объекты которых могут выступать в качестве значений этих свойств). Локальные ограничения накладываются на свойства в рамках определенного класса и могут еще более сужать диапазоны для свойств в рамках этого класса, определять мощность свойств и их виды. На рисунке 1 представлена диаграмма классов онтологии «История», в листинге 1 приведено ее описание на языке OWL.
Описав все классы, свойства, ограничения и объекты предметной области, мы получим сложную систему иерархий, являющуюся основой для построения программных систем, оперирующих с этой информацией более «интеллектуально».
К этим операциям можно отнести, например, семантический поиск (поиск «по смыслу») или определение целостности и достоверности информации на основе ограничений, заложенных в онтологии (автоматический контроль знаний).
Поясним на примерах.
Определение целостности - действительно ли существуют все объекты, которые являются атрибутами другого объекта; для каждого ли объекта, если он является дочерним объектом, существует родитель.
Определение достоверности - если одно событие является составляющим другого события, то его период времени должен быть меньше или равен родительскому событию (данная семантическая проверка должна осуществлять-
%futc web-ofañoMViuü
Война
Битва
Рисунок 1.
Листинг 1.
<owl:Class rdf:ID="Subject"/> <owl:Class rdf:ID="History"> <rdfs:subClassOf rdf:resource="#Subject"/> </owl:Class>
<owl:Class rdf:ID="Event">
<rdfs:subClassOf rdf:resource="#History"/> <owl:DatatypeProperty rdf:ID="name"> <rdfs:range rdf:resource="&xsd;string"/> </owl:DatatypeProperty>
<owl:DatatypeProperty rdf:ID="beginDate"> <rdfs:range rdf:resource="&xsd;dateTime"/> </owl:DatatypeProperty>
<owl:DatatypeProperty rdf:ID="finishDate"> <rdfs:range rdf:resource="&xsd;dateTime"/> </owl:DatatypeProperty>
<owl:DatatypeProperty rdf:ID="description"> <rdfs:range rdf:resource="&xsd;string"/> </owl:DatatypeProperty> </owl:Class>
Предают
i t
История
i
Событие
Название
Дата начала
Дата завершения
Описание
j 1
ся автоматически при добавлении/модификации атрибутов объекта).
В описанном выше примере у каждого исторического события существует четыре параметра: название, описание, дата его начала и дата окончания.
Следует заметить, что помимо «оси» времени практически каждое историческое событие можно также привязать к «оси» местоположения, указав его географические координаты, и использовать это для интерактивного поиска и наглядного отображения. На рисунке 2 можно увидеть результат поиска данных из получившейся базы исторических онтологий и его отображение на географической карте.
...у клфуого исЛоо^игеасого //фце/Л&у&й
гай—ке Ла^ЗаЛие, ояисаЛие,
фсийа его Лаглха и даийа оио-ЯгаЯи&,
Еще одна задача web-онтологий, связанная с поддержкой их развития и совместного использования, решается при помощи введения специальных механизмов в языке OWL. К ним, в частности, относятся механизмы описания версий онтологий и механизмы агрегирования данных, содержащихся в онтологиях. Первые позволяют описывать ссылки на предыдущие версии он-тологий и изменения, сделанные в данной версии по отношению к предыдущей. Это дает возможность прослеживать эволюцию онтологий, а также оперировать онтологи-ями разных авторов для одной и той же предметной области.
То есть сами смысловые связи становятся предметом для расширения и изменения. Каждый участник общего информационного пространства, объединяющего пользователей данной базы знаний, может внести вклад в ее развитие.
Механизмы агрегирования данных решают задачи объединения различных онтологий, размещенных в среде Интернет, в частности, задачи ссылок из одной онтологии на классы и объекты другой онтологии. Все это позволяет выстраивать онтологии в единую базу знаний, в которую в перспективе и должен превратиться весь Интернет или,
по крайней мере, Интранет-системы организаций. В этом случае программные системы будут способны ориентироваться в глобальной сети и осуществлять различные «интеллектуальные» операции над размещенной в ней информацией [5].
В рамках учебных процессов применение такого рода подхода позволит объединить огромное количество существующей информации в единую базу знаний, которая может сочетать в себе несколько учебных дисциплин и быть фактически распределенной в сети Интернет, что позволит сделать ее независимой от интерпретации конкретного учебного процесса. Роль обучающих систем в таком случае будет сведена к роли интеллектуальных агентов, которые будут производить выборки из базы знаний в зависимости от контекста обучения (также возможно построение агентов для автоматического дополнения или изменения такой базы знаний в связи с новой информацией). Другая немаловажная особенность такой системы построения знаний - это возможность строить тестирующие программные системы, которые будут генерировать контрольные задания, исходя из семантики описанных
Рисунок 2.
онтологий. Очевидно, что такие системы построения контроля знаний намного превосходят существующие на данный момент тесты, ориентированные на выборку одного из нескольких вариантов ответов. В качестве инструмента для описания предметной области система онтологий должна оказаться полезной для всех специалистов, сталкивающихся в своей работе с проблемой поиска, представления и использования знаний.
Литература
1. IEEE P1484.1/D9, Draft Standard for Learning Technology - Learning Technology Systems Architecture.
2. Междисциплинарный центр дополнительного профессионального образования СПбГУ // http://dl.nw.ru/
3. Палюх Б.В., Иванов В.К., Клюшин А.Ю. Использование XML в компонентах архитектуры технологической системы открытого образования // Математические методы в технике и технологиях/ ММТТ-15: Сборник трудов 15 Международной научной конференции. Тамбов: Тамбовский ГТУ, 2002. С. 20-22.
4. Michael K. Smith, Chris Welty, Deborah McGuinness. OWL Web Ontology Language Guide // http://www.w3.org/TR/owl-guide/.
5. Кафтанников И.Л., Коровин C.E. Перспективы использования web-онтологий в учебном процессе // Educational Technology & Society 6(3), 2003. С. 134-138.
Паньгин Сергей Александрович, аспирант кафедры ВМ-2 Санкт-Петербургского государственного электротехнического университета (ЛЭТИ).
iKpt-HtpKn^-inBi
(£) Наши авторы, 2004. Our authors, 2004.