Научная статья на тему 'Подготовка метаописаний образовательных информационных ресурсов'

Подготовка метаописаний образовательных информационных ресурсов Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
109
24
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кузин Д. А.

Object of the investigation is the method of learning object metadata creating. The method based on analyzing Microsoft Word document, containing learning resource. Developing software product generate XML metadata according word document styles layout. The software were developed using Visual Basic and Microsoft DOM.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Подготовка метаописаний образовательных информационных ресурсов»

отсутствие навыков в области коммерциализации научных исследований и оценки инновационного и инвестиционного потенциала т;

неразвитость и неэффективность работы системы научных и технопарков Т2;

проведение научных исследований, не соответствующих перечню критических технологий регионального и федерального уровней Тз.

Время Тзап зачастую также достаточно трудно сократить полностью. Одним из вариантов его полного сокращения является специальный заказ со стороны коммерческих структур на разработку той или иной технической продукции или технологии. В других же случаях, особен-

но в области фундаментальных исследований и, в частности, по физико-техническим направлениям науки, решение вопросов коммерциализации весьма затруднительно. Причиной тому является неочевидность использования полученных фундаментальных достижений, в особенности на начальных этапах, когда открытию или полученному результату не найдено поле практического применения. Данные исследования необходимо поддерживать и стимулировать, и эта задача должна лежать на государстве. Ведь без поддержки фундаментальной науки не будет и прикладных научно-технических достижений.

ПОДГОТОВКА МЕТАОПИСАНИЙ ОБРАЗОВАТЕЛЬНЫХ ИНФОРМАЦИОННЫХ РЕСУРСОВ

Д.А. Кузин, зам. зав. кафедрой Математики и информатики Тел.: 8-916-815-24-98, E-mail: dmitrykuzin@yandex.ru Сургутский филиал Московской Академии предпринимательства при Правительстве Москвы http://www.mosap.ru/filials/surgut.html

Object of the investigation is the method of learning object metadata creating. The method based on analyzing Microsoft Word document, containing learning resource. Developing software product generate XML metadata according word document styles layout. The software were developed using Visual Basic and Microsoft DOM.

Информационные образовательные ресурсы являются важнейшим содержательным элементом информацион-но-образователь-ной среды. До недавнего времени основной проблемой разработки электронных образовательных ресурсов было отсутствие универсального общепринятого формата их представления. На определенном этапе внедрения информационных технологий в образование (1990-2000 гг.) было создано довольно много цифровых образовательных ресур-

сов и программ-оболочек для их обработки и представления, причем какие-либо средства взаимодействия между такими системами отсутствовали. Точно так же отсутствовали общие соглашения относительно форматов представления информации в таких системах. Отсутствие правил организации и формата ресурсов, равно как и специфические правила, определенные локально в конкретной системе, резко уменьшают сферу применимости ресурса. Жизненный цикл ресурса ограничен жизненным циклом самой оболочки, и если она не развивается и не поддерживается должным образом, ресурс просто исчезает.

Использование веб-технологий, получивших в последнее время наибольшее распространение в качестве среды для

создания информационных образовательных ресурсов, отчасти смягчает ситуацию. Среда web, построенная на основе открытых стандартов Интернет, позволяет использовать универсальные идентификаторы ресурсов (URI), стандартизирует форматы представления наиболее распространенных видов информации и необходимый набор средств обеспечения интерактивности (гипертекст).

Вместе с этим, за несколько лет интенсивного развития потенциал существующей версии web оказался в значительной мере исчерпанным. Причиной этому, в первую очередь, являются слабые стороны языка HTML, как основного средства представления данных в web. Эти слабые стороны заключаются, главным образом, в отсутствии метаданных в HTML-документах, которые описывали бы их структурные и семантические (смысловые) свойства. Исключение составляет простейший элемент метаданных в HTML-документе - возможность введения ключевых слов для контекстного поиска. Данное ограничение является следствием того, что HTML-документ ориентирован в основном на графическое представление документа, а не на его содержание. В результате отсутствие поддержки метаданных не позволяет осуществлять эффективный целенаправленный поиск в информации в огромном массиве веб-документов. Созданные для этой цели поисковые сервисы, реализующие технику контекстного поиска, в большинстве случаев оказываются малоэффективными, так как не позволяют проводить поиск с учетом структуры, назначения и других свойств информационных ресурсов. Отсутствие метаданных в HTML-документах не позволяет осуществлять проверку целостности их структуры и содержания.

Другим существенным ограничением языка HTML является его закрытость, то есть невозможность добавления пользователем новых тегов для расширения функциональности языка. Закрытый характер языка приводит также к необходимости периодического пересмотра версий стандарта HTML для расширения его функ-

циональности путем добавления новых тегов или атрибутов тегов.

Решение указанных выше проблем привело к радикальному пересмотру консорциумом W3C основ веб-технологий и созданию комплекса средств, базирующихся на расширяемом языке разметки XML. В разработке XML-платформы важное место занимает создание средств описания свойств информационных ресурсов в виде метаданных, что позволяет говорить о создании web 2-го поколения -«семантического web».

Специфика определения данных на языке XML заключается в том, что он позволяет описывать как конкретные экземпляры XML-документов, так и типы XML-документов. В первом случае свойства XML-документа описываются при помощи тегов разметки, вставляемых в документ (принцип самоописываемости). Во втором случае структура документа описывается при помощи схемы XML-документа (XSD - XML Schema Definition), которая может храниться отдельно от самого документа. Роль схемы XML-документа аналогична роли схемы базы данных.

Принципиально важным качеством языка XML, обеспечивающим новые функциональные возможности, является его расширяемость. Свойство расширяемости XML основано на двух факторах [8]:

1. Язык XML является языком мета-уровня и выполняет функции языка определения данных. Используя его синтаксис, можно определять адекватный набор элементов (тегов) для создания конкретных XML-документов.

2. Использование пространств имен -именованных множеств имен типов и атрибутов элементов, используемых в XML-документах. В одном XML-документе допускается использовать элементы, определенные в различных пространствах имен, путем явного указания пространства имен. Обычно пространство имен идентифицируется при помощи строки URI (универсального идентификатора ресурсов) в Интернет, причем данный URI не обязательно должен ссылаться на су-

ществующий реально ресурс. Цель использования URI - обеспечить уникальность обозначений пространств имен.

Хотя средства платформы XML создавались как средства представления информации в web, они нашли широкое применение в различных областях информационных технологий. К важнейшим направлениям использования платформы XML относятся:

1. Создание специализированных типов XML-документов для использования в различных предметных областях (библиографии, ГИС, медицине, образовании).

2. Базы данных XML - использование XML в качестве языка определения данных.

3. Обмен информацией между системами при помощи web.

4. Интеграция неоднородных информационных ресурсов.

В настоящее время в области стандартизации представления информации в образовательных системах выполнен значительный объем работ. Выработано четкое понимание принципов и подходов, которые необходимо применить при разработке средств и способов представления информации в LMS. Основополагающим принципом представления информации в образовательных системах является использование платформы XML. Применение средств платформы XML для представления образовательной информации базируется на принципе отделения содержания от представления [4], согласно которому логическая, содержательная структура ресурса описывается на языке XML. Описание содержательной структуры документа позволяет автоматизировать создание полиграфического представления документа, а также создавать так называемые профили документа - содержание, предметный указатель, список иллюстраций и т. д.

Другим важным принципом представления образовательной информации является объектно-ориентированный подход, согласно которому информация разбивается на небольшие законченные

фрагменты (пакеты), имеющие определенную структуру и обладающие рядом общих свойств. Такие пакеты получили название образовательных объектов (learning object). Для образовательного объекта обязательным является наличие метаданных. Каждый образовательный объект является самостоятельным ресурсом, но может быть связан с другими объектами и объединен в объект более крупного масштаба (агрегирован).

Данный подход широко признан и подробно изложен в ряде международных стандартов [7,8]. Согласно ему образовательный пакет состоит из двух главных элементов (рис. 1) - манифеста и физических файлов, составляющих образовательный объект. Манифест представляет собой многоуровневое описание данных, в котором присутствуют следующие уровни (рис. 2):

Блок описания ресурсов - последовательное перечисление ресурсов, входящих в образовательный объект, расположенных в произвольном порядке. Каждый ресурс состоит из метаданных ресурса и последовательного перечисления физических файлов, входящих в состав ресурса.

Блок описания логической структуры образовательного объекта - иерархическая организация сущностей, называемых «узел» (item), каждая из которых имеет свои метаданные и ссылается на какой-либо ресурс блока описания ресурсов.

Блок описания образовательного объекта - это метаданные объекта, описывающие его характеристики в целом. К таким характеристикам могут относиться название, автор, классификация, авторские права, ключевые слова и т. д. Метаданные являются важнейшим элементом манифеста и могут встречаться на различных его уровнях. Например, существуют метаданные файла, ресурса, узла, пакета. Все метаданные имеют стандартный формат, не зависящий от типа объекта, и могут использоваться как внутри манифеста, так и вне его. Формат метаданных образовательных объектов описан в [8,9].

Рис. 1. Структура образовательного пакета

Образовательный объект (learning object)

Манифест

-метаданные образовательного объекта -данные стандартного формата, описывающие объект дня его автоматической обработки Контент

- содержательная часть - информационные ресурсы на уровне

файлов

Манифест

Описание объекта в целом (метаданные)

_- общая информация об образовательном объекте_

Логическая организация данных

описание иерархической структуры образовательного объекта с неограниченньпл числом уровней вложенности

Описание ресурсов

Ресурс1

Ресурс 2

Ресурс 3

Рис. 2. Уровневая организация манифеста

Опыт и идеи, заложенные в информационную модель IMS, легли в основу разработки универсальной модели описаний образовательных ресурсов [6], развиваемой в рамках работы по созданию и развитию Российского портала открытого образования http://www.openet.ru. Универсальная модель обеспечивает использование ресурса как в библиотечном контексте (например, в электронных библиотеках и репозиториях), так и в образовательном (в системах управления учебным процессом, системах планирования контента). В настоящее время универсальная модель содержит спецификации описания и упаковки контента образовательных ресурсов, представления информации в тестовых системах, представления информации об обучаемых в формате, совместимом с vCard.

Задача подготовки образовательного ресурса для использования в LMS заключается в:

- подготовке файлов HTML с содержательной частью (контентом);

- подготовке метаописания на языке XML;

- упаковке контента и метаописания в архив для загрузки в LMS.

В рамках работ по стандартизации образовательной информации разработана и находится на этапе опытной эксплуатации в Российской системе открытого образования [2] инструментальная система «МЕТА», предназначенная для разработки образовательных ресурсов. «МЕТА» предоставляет удобный графический интерфейс для заполнения полей метаописа-ния с последующей упаковкой файлов ресурсов и файла метаописания в zip-архив. Однако задача подготовки контента является более сложной. Несмотря на большое количество всевозможных визуальных HTML - редакторов существует несколько сложностей, которые делают задачу подготовки ресурсов весьма трудоемкой. Трудоемкой является задача формирова-

ния блока организаций метаописания. Для того, чтобы структурировать ресурс в виде иерархической организации «содержание», необходимо, чтобы каждый элемент содержания ссылался либо на отдельный HTML-файл, либо на закладку в соответствующем месте HTML-файла, если он один. В первом случае при подготовке ресурса приходится разбивать его содержимое на несколько файлов, что не всегда удобно и не позволяет использовать средства автоматической нумерации разделов документа и т.д., во втором случае создание закладок потребует кропотливой ручной работы. В любом случае создание соответствующих элементов в блоке организации метаописания требует ручного редактирования XML-документа. Выполнить такую работу под силу лишь достаточно квалифицированному специалисту.

В настоящей статье предлагается использовать технологию создания содержательной структуры документа на основе ее полиграфического представления. В настоящее время текстовый редактор Microsoft Word известен большинству пользователей и является стандартным «де-факто». Идея заключается в том, что структура ресурса может быть задана пользователем при помощи уровневой структуры документа Microsoft Word, согласно которой всем элементам документа присваивается значение свойства «уровень». Заголовки документа, имеющие соответствующий стиль (Заголовок 1, Заголовок 2 и т.д.), автоматически относятся к соответствующим уровням 1,2 и т.д., остальные элементы относятся к уровню «основной текст». Проанализировав уров-невую структуру документа, можно сформировать блок организаций метаопи-сания.

Преимуществом такого подхода является то, что пользователь работает с привычным ему текстовым представлением документа, а не с абстрактной структурой образовательного пакета и может использовать все многообразие средств и инструментов, доступных в текстовом редакторе. Ему необходимо лишь освоить операции по применению заранее определен-

ных в шаблоне стилей к соответствующим элементам документа. Так, например, стандартный шаблон документа Word имеет в своем составе стили для выделения заголовков разных уровней. Достаточно просто могут быть созданы стили и для других элементов.

Для реализации поставленной задачи специалистами Центра дистанционного образования СурГУ, осуществляющего эксплуатацию Сургутского виртуального университета (http://surgut.openet.ru), в составе которого функционирует Виртуальное представительство Сургутского филиала Московской Академии предпринимательства, был разработан программный пакет «хМЕТА», который выполняет следующие функции:

- поиск в документе элементов для каждого уровня (количество уровней задается пользователем);

- формирование закладок (bookmarks) для каждого элемента документа, на который будет иметься ссылка в блоке организаций метаописания (известно, что созданные закладки сохраняются и при сохранении документа в HTML-формате);

- сохранение документа в формате HTML;

- создание XML-файла будущего ме-таописания;

- формирование блока организаций метаописания с указанием ссылок на созданные ранее закладки;

- формирование блока ресурсов ме-таописания;

- формирование блока метаданных на основе полей форм, заполняемых пользователем;

- упаковка HTML-документа и мета-описания в архив.

Программа реализована в среде Visual Basic 6.0. Для работы с документом XML используется объектная модель Microsoft XML DOM. Для иллюстрации работы программы по формированию блока организаций манифеста сформируем документ MSWord следующего содержания:

1. Раздел первый

1.1. Тема первая

1.1.1. Подзаголовок

-1' ' I' ' I' ' I' ' I'

Текст Текст Текст Текст Текст

Текст Текст Текст Текст 1.1.2. Подзаголовок

-1' ' I' ' I' ' I' ' I'

Текст Текст Текст Текст Текст Текст Текст Текст Текст

После программной обработки хМета преобразует документ в HTML-файл (при помощи встроенного конвертора Word) с именем content.htm и сформирует его XML-описание imsmanifest.xml. Фрагмент этого описания приведен ниже: <organizations>

<organization identifier="org_ID 1" structure="hierarchical">

<title>Оглавление</title> <item identifier="item_ID1" identifier-ref="res_ID1">

<title>Раздел первый^к^ <item identifier="item_ID2" identifier-ref="res_ID2">

<title>Тема первая</title> <item identifier="item_ID3" identifier-ref="res_ID3">

<title>Подзаголовок</title> </item> <item identifier="item_ID4" identifier-ref="res_ID4">

^^^Подзаголовок^к^ </item>

</item> </item>

</organization>

</organizations>

<resources>

<resource identifler=Mres_ID1M

type=MwebcontentM href="c:\res\content.htm#ID1">

<file href="c:\res\content.htm" /> </resource>

<resource identifier="res_ID2"

type="webcontent" href="c:\res\content.htm#ID2">

<file href="c:\res\content.htm" /> </resource>

<resource identifier="res_ID3"

type="webcontent" href="c:\res\content.htm#ID3">

<file href="c:\res\content.htm" /> </resource>

<resource identifier="res_ID4"

type="webcontent" href="c:\res\content.htm#ID4">

<file href="c:\res\content.htm" /> </resource>

</resources>

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Основы открытого образования / Отв. ред. В.И.Солдаткин. - Т.1. - Российский государственный институт открытого образования. - М.:НИИЦ РАО, 2002. - 676 с.

2. Концепция Федерального портала открытого образования (электронное издание) (http://www.openet.ru).

3. Универсальная инструментальная информационно-образовательная среда системы открытого образования РФ / Лобачев С.Л., Поляков А.А. (электронное издание) (http://www.openet.ru).

4. Открытое образование: стандартизация описания информационных ресурсов / Лобачев С.Л. - (электронное издание) (http://www.openet.ru).

5. Преподавание в сети Интернет: Учеб. пособие /Отв. ред. В.И.Солдаткин. - М.: РГИ-ОО, 2004 (электронное издание) (http://www.openet.ru).

6. Универсальная модель представления информации в образовательных системах. М.: РГИОО, 2004 (электронное издание) (http://www.openet.ru).

7. IMS Content Packaging Specification / IMS 2003. - Version 1.1.3 Final Specification (электронное издание) (http://www.imsprogect.org).

8. IEEE 1484.12.1-2002. Learning Object Metadata standard. - New York: IEEE, 2002.

9. IMS Learning Recourse Meta-data Information Model / IMS 2001. - Version 1.2 Final Specification (электронное издание) (http://www.imsprogect.org).

* * *

i Надоели баннеры? Вы всегда можете отключить рекламу.