Научная статья на тему 'Гипертекстовые энциклопедии и словари'

Гипертекстовые энциклопедии и словари Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
316
36
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Якубайтис Э. А.

The architecture of hypertext encyclopedias and explanatory dictionaries is described in the article.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Гипертекстовые энциклопедии и словари»

Построение учебно-методического плана

Множество гиперребер Р' ММП-графа (рис. 7) определяют отбор из хранилища образовательных модулей для освоения компетенций ММП, а мощность |Р'| - количество таких модулей. Каждый модуль характеризуется суммарной нагрузкой по всем видам занятий, что и определяет вес соответствующего гиперребра - Для вариативного модуля, имеющего множество '(р^ альтернативных вариантов содержания образования, вес гиперребра определяется как 1;(р^ = f С(р^), где f (х) - процедура выбора варианта модуля. Тогда оптимистическая оценка продолжительности подготовки определяется по ММП-графу как: ^=И(Р;) (6)

Ур е Р'

На рис. 8 приведены веса гиперребер ММП-графа из примера № 2: веса установлены после отбора из хранилища МИЦ [1] соответствующих образовательных модулей.

На рис. 8 показаны два дискретных пространства: Q - пространство формирования компетентности обучаемого и 8 - пространство результатов образования (вершина SJ моделирует результат образования для примера № 1). Гиперребро, имеющее в качестве истока - множество вершин Хц в пространстве Q и в качестве стока - вершину SJ в пространстве 8, моделирует следующее испытание результата образования, см. табл. 3. Результатом планирования для примера № 1 будет следующий учебно-методический план подготовки специалиста с профилем пользователя ПК, см. табл. 4.

Литература

1. Васильев В.Н., Лисицына Л.С., Лямин А.В. Методический интернет-центр. - СПб.: Питер, 2005. - 96 с.: ил. (опубликована на сайте www.ito-center.ifmo.ru )

2. Джеймс Андерсен Дискретная математика и комбинаторика/ Пер. с англ. - М.: Изд. дом «Виль-ямс», 2004. - 960с.

ГИПЕРТЕКСТОВЫЕ ЭНЦИКЛОПЕДИИ И СЛОВАРИ

Э.А.Якубайтис, проф., д.т.н. Тел. (371) 710-6221. E-mail: [email protected] Рижский институт транспорта и связи

The architecture of hypertext encyclopedias and explanatory dictionaries is described in the article.

1. Введение

Нарастающие потоки информации, стремление оптимизировать процессы поиска и выдачи нужных сведений привели к созданию новых, компьютерных технологий. Среди них особую роль выполняют электронные гипертекстовые системы, создаваемые в глобальных сетях. Благодаря погружению этих систем в сетевую среду они становятся доступными повсюду. С информацией, предоставляемой такой системой может одновременно работать большое число пользователей. Более того, объединение систем в общую ассоциацию позволяет

создавать крупные распределенные в пространстве хранилища знаний.

Хранилища знаний предоставляют разнообразные сведения по широкому кругу вопросов. Особенно эффетивным является размещение в этих хранилищах энциклопедий и толковых словарей. Важное значение последние приобретают в автоматизации процессов дистанционного обучения. Речь идет не только о подготовке новых специалистов. Техника и технологии сейчас меняются настолько быстро, что необходимо постоянное повышение квалификации сотрудников. Между тем, в базе знаний могут также размещаться справочники, отчеты, обзоры, проекты, учебники, учебные пособия, журналы, альбомы, книги любого другого вида.

Благодаря этому, наряду с традиционными формами появились новые возможности накопления и изучения всего того, что является интеллектуальным богатством со-

временной цивилизации. Созданные технологии дают возможность собирать в хранилищах знаний всю информацию, веками накопленную человечеством.

Современные телекоммуникации, и симбиоз компьютеров с ними привели к созданию ассоциаций глобальных и локальных сетей. В результате стало возможным рис.1 (см. цв. вставку) с одного и того же персонального компьютера работать с хранилищами знаний, расположенными в серверах различных организаций, расположенных на всех континентах. Новый толчек развитию баз знаний дало использование методологии гипертекста [1], позволившей собирать, структурировать знания и хранить информацию в удобной форме. Современные компьютерные технологии сегодня позволяют быстро находить тематически либо ассоциативно связанные блоки информации и создавать из них новые документы.

Ниже излагаются концепция и методики создания систем гипертекстовых электронных энциклопедий, энциклопедических и толковых словарей, далее для краткости именуемых Системами. 2. Гипертекстовые базы знаний

В связи с появлением гипертекста обычный, классический текст, например в книге, стали называть линейным. Этот текст рис.2(см. цв. вставку) состоит из блоков информации, которые читаются (изучаются) в одном порядке — с первого до последнего. Характерной же особенностью гипертекста является то, что его блоки информации могут читаться в любом порядке. В соответствии с этим, первым блоком может быть любой из имеющихся в базе.

Технология гипертекста позволяет указывать ассоциативные (тематические) связи информационных объектов электронных документов друг с другом. Указания связи документов либо их частей называют гиперссылками. В соответствии с этим, электронный документ, в котором установлены и выделены гиперссылки, именуется гипертекстовым.

Энциклопедии и толковые словари являются удобной средой использования всех положительных особенностей гипертекста. С созданием глобальных информационных сетей и, в особенности Всемирной сети (World-Wide-Web), появилась возможность обеспечения взаимосвязи энциклопедий и словарей, созданных различными организациями и находящихся в различных точках планеты. Таким образом возникает общий

глобальный гипертекст, части которого располагаются в различных географических пунктах. Используемое во Всемирной сети программное обеспечение позволяет, указав только на нужную гиперссылку, оказаться в любой базе. 3. Цели и задачи

Целями создания гипертекстовой Системы являются сбор, обработка, упорядочение и удобное предоставление пользователям информации о достижениях науки, техники и технологии, происшедших в мире событиях, союзах, государствах, обществах, предприятиях, организациях, лицах. Использование компьютерных технологий дает возможность Системе выполнять разнообразные функции, к которым в первую очередь, относятся:

гибкое структурированное накопление знаний;

организация ассоциаций статей; создание вторичных документов (статей, обзоров, справок, отчетов,... );

подготовка материалов по индивидуальным заказам;

обеспечение поиска нужной информации;

навигация (вождение) пользователей по статьям;

обучение, в том числе дистанционное; работа с пользователями в режиме диалога;

подсказка и помощь в работе. Важная особенность энциклопедий и словарей, представляемых Системой, заключается в том, что содержащаяся в них информация никогда не стареет. В любое время в каждую энциклопедию и словарь можно добавить новую статью, отредактировать имеющуюся, удалить статью, ставшую ненужной. Кроме этого, статьи могут создаваться и развиваться параллельно любым числом не взаимодействующих друг с другом авторов.

Создаваемые энциклопедии и словари могут содержать не только тексты и неподвижные изображения, но также, движущиеся изображения и фрагменты звука. Между тем, на первых этапах создания целесообразно ограничиться текстами и неподвижными изображениями. Уже на этой основе решаются следующие задачи:

организация баз знаний в виде большого числа взаимосвязанных статей;

предоставление материалов по разнообразным темам;

определение (толкование) используемых терминов;

объяснение специальных обозначений, используемых в публикациях;

расшифровка, перевод и объяснение используемых сокращений;

перевод англоязычных терминов и сокращений на родной язык и обратно;

обеспечение простой и эффективной работы пользователей;

выдача справок на заданные темы; обеспечение дистанционного доступа к Системе через Всемирную сеть.

Очень важной областью применения Системы яаляется дистанционное обучение. С этой целью на основе энциклопедий и словарей легко создавать обучающие комплексы, в которых процессы предоставления знаний зависят от подготовленности и способностей каждого из пользователей. Для этого каждый обучающий комплекс одновременно работает с группой пользователей, но обучает каждого из них по индивидуальному плану.

Особой проблемой обучающих систем является изучение терминологии. В обычных книгах основная масса терминов объясняется в первых главах. Это позволяет читать эти книги. В отличие от этого, в энциклопедиях и словарях пользователь начинает обучение с любой статьи, выбранной им или преподавателем. Но, в тексте этой статьи используются термины, объясняемые в других статьях. Поэтому специальная компьютерная технология определяет стратегию изучения терминов и этот процесс опережает знакомство пользователя с содержимым каждой статьи. 4. Структура системы

Система характеризуется двумя важными особенностями. Во-первых, она является электронной, т. е. располагается в памяти одного либо группы компьютеров, включенных в глобальную сеть. Например, в сеть Интернет. Во-вторых, информацию, хранимую в Системе, пользователи могут просматривать в любом нужном им порядке.

В базе знаний рис.3 (см. цв. вставку) выделяются два раздела. Первый из них образуется текстами статей. Второй содержит изображения, иллюстрирующие и дополняющие содержание статей. Изображения собираются и хранятся отдельно для того, чтобы предоставить возможность обращения к любому из них из нескольких статей. Например, схема упомянута в пяти статьях. Тогда при чтении любой из этих статей про-

грамма вызывает схему и добавляет ее к тексту. Такой прием позволяет не дублировать в базе знаний изображения и сократить объем памяти нужный для их хранения. Вход в базу знаний обеспечивают каталоги содержащейся в ней инфомации. Подсистема управления обеспечивает работу всей Системы.

Открывает энциклопедию либо словарь рис.4 (см. цв. вставку), его адресуемая страница Web, которая является введением. На этой странице рассказывается о целях и задачах Системы, ее особенностях, структуре. Излагаются выполняемые функции, правила и способы работы с информацией. Здесь же объясняется как получать подсказки и помощь в работе.

Основным компонентом Системы является информационный объект. Им является статья, термин, иллюстрация, сокращение, специальное обозначение. Все вместе, объекты образуют базу знаний Системы.

Подсистема управления выполняет следующие комплексы задач:

- управление функционированием Системы;

- взаимосвязь с пользователями Всемирной сети;

- автоматизация процесса предоставления информации пользователей;

- навигации пользователей по базе знаний.

5. Программное обеспечение

Благодаря программному обеспечению Система дает возможность пользователям использовать несколько уровней погружения в содержимое энциклопедии и словаря:

перевод терминов с одного языка на другой (другие);

изучение терминологии;

ознакомление с сокращениями и специальными обозначениями;

чтение статей.

Программное обеспечение каждой Системы делится на три части. Первая часть необходима для функционирования энциклопедии либо словаря на сервере, включенном во Всемирную сеть. Вторая часть определяет функции, выполняемые Системой. В перечень этих функций входит:

- ввод новых статей, редактирование имеющихся статей и удаление ненужных статей.

- поиск нужных пользователям информационных объектов;

- формирование последовательностей статей на заданные пользователями темы;

- обучение пользователей терминологии;

- предоставление пользователям для чтения статей либо лишь их заголовков;

- распечатывание на принтере сведений, необходимых пользователям;

- выдача подсказок при работе;

- ведение учета работы каждого пользователя (множество использованных объектов, порядок их следования, время начала и окончания каждого сеанса);

- осуществление, если нужно, расчетов за время работы и представление счетов к оплате.

Третья часть программного обеспечения нужна для взаимодействия персонального компьютера как с сервером так и самим пользователем. Эти программы дают возможность пользователю осуществлять диалоговое взаимодействие с сервером. 6. Структура энциклопедии и словаря

Тексты статей являются основными объектами. Все остальные — дополинтель-ными, связанными с основными. Все объекты в Системе взаимодействуют друг с другом.

Каталоги содержат алфавитные перечни всех информационных объектов, представляемых в базе знаний.

В проведенных разработках использо-рались четыре каталога:

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ;

ARTICLE DICTIONARY;

ПЕРЕЧЕНЬ СОКРАЩЕНИЙ;

СПЕЦИАЛЬНЫЕ ОБОЗНАЧЕНИЯ.

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ состоит из алфавитного перечня русских и английский названий статей.

ARTICLE DICTIONARY содержит алг-лийский и русский перечни названий статей.

ПЕРЕЧЕНЬ СОКРАЩЕНИЙ представляет в алфавитном порядке сокращения, их расшифровку, перевод (иноязычных) и указание статей, в которых сокращения объясняются.

СПЕЦИАЛЬНЫЕ ОБОЗНАЧЕНИЯ в

алфавитном порядке дают слова и словосочетания, широко используемые в литературе и обозначающие модели, стандарты, методики, технологии, торговые знаки,... В каталоге для каждого специального обозначения указывается статья, в которой оно объясняется.

Во всех каталогах выделяются слова и словосочетания, являющиеся названиями информационных объектов, к которым далее могут отсылаться пользователи.

Текст каждой статьи состоит рис.5 (см. цв. вставку) из заголовка и тела. Заголовок дает название статьи на двух языках, после чего следует определеление этого названия. Оно может состоять из нескольких частей. Тело статьи состоит из текста, предоставляющего сведения по теме, указанной в заголовке. Заголовок и тело являются адресуемыми частями статьи. Это, при необходимости, позволяет просматривать заголовки без чтения основных частей статей.

Важнейшими компонентом заголовка является название (имя) статьи. Его важность заключается в том, что название одновременно является адресом, по которому статья находится в базе знаний. Это название должно, по-возможности, быть кратким. Его употребление в тексте другой статьи и будет адресом и предложением далее, если нужно, перейти к ее чтению.

7. Гипертекстовые ссылки

Соответственно взаимосвязям множеств используемых информационных объектов, выделяются гиперссылки. В адресуемой странице пользователю предлагается выбрать один из четырех имеющихся каталогов. Выбрав каталог, пользователь находит в нем то, что ему необходимо: название статьи, термин, сокращение либо специальное обозначение. Соответственно этому, ему предлагается гиперссылка на статью с выбранным названием.

Перед чтением текста пользователю предлагается сформированный программой перечень терминов, которые нужно знать для понимания содержания статьи. Указывая на незнакомые термины пользователь получает необходимое их объяснение. При чтении статьи пользователь может просматривать имеющиеся иллюстрации. При желании перейти от чтения одной статьи к другой статье пользователь использует соответст-вуюшие гиперссылки.

8. Идентификация объектов

Для осуществления переходов от названий объектов-источников к адресатам они должны идентифицироваться Системой. Сложность этого процесса определяется двумя факторами. Во-первых, название может быть как одно- так и многословным. Во-вторых, в тексте название может употребляться в любом падеже и времени. Более того, название может начинаться как с заглавной, так и со строчной буквы, быть на различных языках. Поэтому один и тот же объект в текстах представляется различны-

ми кодами, используемыми операционной системой.

В принципе идентификация названий статей может быть осуществлена с помощью словаря словоформ. Однако при наличии тысяч названий статей и, причем часто многословных, этот процесс является слишком сложным. Кроме этого, в ряде случаев, этот подход не позволяет осуществить идентификацию. В этой связи при создании гипертекстовых энциклопедий и словарей выбран другой метод идентификации. Он уже успешно работает в Системе, содержащей около 100 000 гмперссылок.

9. Погружение Словаря во Всемирную сеть

Все метки и команды в Системе должны соответствовать стандартному гипертекстовому языку разметки (HTML). Однако, необходимо предоставить возможность писать тексты энциклопедий и словарей различным авторам. Поэтому практически невозможно требовать от всех авторов и редакторов знания языка HTML. Вписывание же специальными редакторами вручную длинных команд HTML является неприятной задачей. Поэтому разработан простой промежуточный Символьный язык, требующий знания лишь нескольких простых знаков. Они:

являются одноразрядными (предельно простыми);

очень редко встречаются в текстах статей;

вводятся в компьютер нажатием одной клавиши.

Символьный язык обеспечивает: выделение статьи среди массива общего текста энциклопедии и словаря;

деление текста статьи на заголовок и тело;

идентификацию статей; фиксацию изображений, сокращений и специальных обозначений;

выделение в статьях гипертекстовых ссылок на другие информационные объекты.

Но главное заключается в том, что форматы Символьного языка достаточно просто преобразуются в форматы языка HTML. Это преобразование выполняется несложной программой. Когда тексты под-Литература

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Э. А. Якубайтис. Вычислительные системы, сети и телекоммуникации: Учебно-практическое пособие . - М., 1999.

2. Гипертекстовый энциклопедический словарь http://www.icsti.su

3. Гипертекстовый энциклопедический словарь http ://www.tsi.lv

4. Гипертекстовый энциклопедический словарь http://www.abc-it.lv

готовлены, то программа автоматически заменяет коды и управляющие символы Символьного языка на метки и команды языка HTML.

10. Синтез новых документов

При навигации (движении пользователя по информационным объектам) ее маршрут запоминается компьютером. Это позволяет пользователю легко возвращаться (по мере надобности) к любому объекту и повторно просматривать имеющуюся в нем информацию. для более глубокого его изучения. Более того, каждый объект гипертекстовой энциклопедии и словаря является страницей информации, запоминаемой компьютером пользователя во время его сеанса с Системой. Поэтому в результате навигации создается многостраничный документ, который может быть посвящен определенной теме. Таким образом после редакторской обработки страниц создаются новые информационные материаы. Например, учебное пособие [1].

11. Заключение

Использование гипертекста для создания Словарей является новым и очень перспективным процессом. Предложенные методики позволяют не только быстро создавать динамические базы знаний, но и вводить их во Всемирную сеть, предоставляя знания по различным отраслям науки.

Словари могут стать центрами, в которых собираются сведения не только по теории, практике, истории отраслей науки, техники, технологии, искусства, но и огромный фактический материал, связанный с политикой, экономикой и социальными процессами, происходящими в различных странах. Здесь же могут быть отражены взгляды и точки зрения на исторические и современные события, развитие мирового сообщества.

Разработанные модели, методики и програмное обеспечение может быть использовано при создании энциклопедий и толковых словарей, на любых языках, в которых слова имеют различные падежные окончания. Создано несколько Словарей. С ними можно ознакомиться на сайтах [2-4].

i Надоели баннеры? Вы всегда можете отключить рекламу.