УДК 681.3.007.001.33
А.С.Злыгостев, И.С.Злыгостев
ЭЛЕКТРОННАЯ БИБЛИОТЕКА СО ВСТРОЕННОЙ СИСТЕМОЙ
ПОИСКА
В результате работы над гуманитарной электронной библиотекой Historic.Ru был создан программный комплекс, позволяющий автоматизировать работу электронной библиотеки и реализующий следующие функции: распространение, хранение, поиск и анализ цифровых данных различной природы.
Гуманитарная электронная библиотека Historic. Ru содержит оцифрованные книги и статьи по истории, философии, мифологии и географии. Основными задачами проекта Historic.Ru являются собирание, сохранение, помощь в поиске и предоставление в пользование обществу фонда документов, отражающих знания человечества в области гуманитарных наук и имеющих, прежде всего отношение к истории развития человечества.
Созданный программный комплекс состоит из трёх элементов:
1. Менеджер электронной библиотеки - позволяет добавлять книги в электронную библиотеку и структурирует тематические книжные каталоги. Библиотека строится как набор связанных гипертекстовых документов в виде пригодном для выгрузки на сервер в Интернет.
2. Конструктор CD-версии библиотеки - создаёт сайт для просмотра на локальной машине и формирует индексы страниц для поисковой системы.
3. Поисковик-просмотрщик электронной библиотеки - осуществляет поиск и просмотр документов и изображений библиотеки.
Для ускорения процесса поиска проводится индексирование документов библиотеки, т.е. для каждого документа формируется его поисковый образ, включающий ключевые слова, путь к документу, заголовок документа, краткое описание содержания документа и т.д.
При поиске используется булевская модель с логической операцией AND между ключевыми словами запроса. Все найденные страницы, по запросу пользователя, сортируются в соответствии с оценкой, сформированной при учёте таких факторов как количество повторений ключевых слов в тексте документа, участия ключевых слов в заголовке и описании документа, а также цитируемость документа.
При анализе текстов пропускаются неинформативные единицы текста (предлоги, союзы, частицы, местоимения, вводные слова.). Для того чтобы в разных склонениях слова при поиске не отсекались выделяются основы слов. При выделении основ слов происходит отсечение окончаний и некоторых из суффиксов.
Разработанный программный комплекс был использован в рамках Historic.Ru и при создании библиотеки по философии кафедрой «Истории и Философии» ТРТУ.