Научная статья на тему 'Электронная библиотека со встроенной системой поиска'

Электронная библиотека со встроенной системой поиска Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
212
46
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Злыгостев А. С., Злыгостев И. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Электронная библиотека со встроенной системой поиска»

УДК 681.3.007.001.33

А.С.Злыгостев, И.С.Злыгостев

ЭЛЕКТРОННАЯ БИБЛИОТЕКА СО ВСТРОЕННОЙ СИСТЕМОЙ

ПОИСКА

В результате работы над гуманитарной электронной библиотекой Historic.Ru был создан программный комплекс, позволяющий автоматизировать работу электронной библиотеки и реализующий следующие функции: распространение, хранение, поиск и анализ цифровых данных различной природы.

Гуманитарная электронная библиотека Historic. Ru содержит оцифрованные книги и статьи по истории, философии, мифологии и географии. Основными задачами проекта Historic.Ru являются собирание, сохранение, помощь в поиске и предоставление в пользование обществу фонда документов, отражающих знания человечества в области гуманитарных наук и имеющих, прежде всего отношение к истории развития человечества.

Созданный программный комплекс состоит из трёх элементов:

1. Менеджер электронной библиотеки - позволяет добавлять книги в электронную библиотеку и структурирует тематические книжные каталоги. Библиотека строится как набор связанных гипертекстовых документов в виде пригодном для выгрузки на сервер в Интернет.

2. Конструктор CD-версии библиотеки - создаёт сайт для просмотра на локальной машине и формирует индексы страниц для поисковой системы.

3. Поисковик-просмотрщик электронной библиотеки - осуществляет поиск и просмотр документов и изображений библиотеки.

Для ускорения процесса поиска проводится индексирование документов библиотеки, т.е. для каждого документа формируется его поисковый образ, включающий ключевые слова, путь к документу, заголовок документа, краткое описание содержания документа и т.д.

При поиске используется булевская модель с логической операцией AND между ключевыми словами запроса. Все найденные страницы, по запросу пользователя, сортируются в соответствии с оценкой, сформированной при учёте таких факторов как количество повторений ключевых слов в тексте документа, участия ключевых слов в заголовке и описании документа, а также цитируемость документа.

При анализе текстов пропускаются неинформативные единицы текста (предлоги, союзы, частицы, местоимения, вводные слова.). Для того чтобы в разных склонениях слова при поиске не отсекались выделяются основы слов. При выделении основ слов происходит отсечение окончаний и некоторых из суффиксов.

Разработанный программный комплекс был использован в рамках Historic.Ru и при создании библиотеки по философии кафедрой «Истории и Философии» ТРТУ.

i Надоели баннеры? Вы всегда можете отключить рекламу.