Scientific Research of the Union of Scientists in Bulgaria - Plovdiv, series B. Natural Sciences and Humanities, Vol. XVII, ISSN 1311-9192, International Conference of Young Scientists, 11 - 13 June 2015, Plovdiv
ЦИФРОВО ХРАНИЛИЩЕ НА ПУ „ПАИСИЙ ХИЛЕНДАРСКИ" Десислав Десев, Силвия Гафтанджиева, Росица Донева Пловдивски университет „Паисий Хилендарски" гр. Пловдив, ул. „Цар Асен" 24 d.desev@gmail.com, sissiy88@uni-plovdiv.bg, rosi@uni-plovdiv.bg
DIGITAL REPOSITORY OF PLOVDIV UNIVERSITY "PAISII HILEN-
DARSKP
Desislav Desev, Silvia Gaftandzhieva, Rositsa Doneva Plovdiv University "Paisii Hilendarski2 "Tsar Asen2 24 str., Plovdiv, Bulgaria d.desev@gmail.com, sissiy88@uni-plovdiv.bg, rosi@uni-plovdiv.bg
Abstract: Current paper describes the necessity of using digital repositories in universities. It observes the approaches of developing digital repositories. The paper presents the process of building the institutional repository of Plovdiv University "Paisii Hilendarski2.
Keywords: institutional repository, digital repository, building an institutional repository, Paisii Hilendarski.
Увод
Всеки университет има нужда от централизирано място за съхранение на научните статии, дипломни работи, дисертации и други резултати от научната дейност, дейността на служителите и студентите на университета. С развитието на електронното обучение в университетите назрява необходимостта и от място за съхранение на учебни е-ресурси, което да позволява съхраняване и многократно използване на ресурси и да осигурява достъп на различни групи потребители. Важни дейности при управлението на цифровите материали са както дългосрочна презервация, така и организирането, достъпността и дистрибуцията им. Университетското цифрово хранилище служи като материален индикатор за качеството на институцията и увеличава нейното присъствие, престиж и публична стойност.
През последната година в ПУ „Паисий Хилендарски" се проведоха редица изследвания, в резултат на които беше внедрено и започна да се развива хранилище за:
• дългосрочно съхранение за научния труд и администриране на авторските права свързани със съхраняваните активи;
• съхранение на учебни ресурси;
• съхранение на документа от системата за управление на вътрешния документооборот;
• съхранение на изследователски данни;
• архивиране на генерирани от университетските системи документа, вторично
генерирани от преподаватели и административен персонал и ръчно заредени в системата за документен оборот документа, сканирани копия съхранени в архивите на организационните структури на ПУ документа.
Избор на платформа за създаване на цифрово хранилище
Съществуват три главни технически подхода при създаване на цифрови хранилища [4]:
• Имплементиране на цифровото хранилище от организацията:
- предимства: създаденото по поръчка решение е съобразено до най-малкия детайл с изискванията на институцията и изисква пълен контрол на всички процеси;
- недостатъци: необходимост от големи ресурси, намалени възможности за регулярни обновявания, дългосрочно обслужване може да се окаже невъзможно, необходимост от специфична поддръжка.
• Използване на стандартна софтуерна платформа за създаване на цифрови хранилища - най-широко използвания подход, като повечето платформи са безплатни:
- предимства: готови решения, вграден голям набор от функционалности, регулярни обновления и възможност за бързо инсталиране;
- недостатъци: регулярните обновления може да изискват повторна персонализация и липса на контрол върху подобренията.
• Използване на външен хостинг на услугата.
- предимства: готови решения, вградени голям набор от функционалности, регулярни обновления, най-бързо инсталиране в сравнение с другите подходи, безпроблемни обновявания и минимално ангажиран състав с обслужването;
- недостатъци: висока цена, липса на контрол върху подобренията и безпокойство за сигурността.
В контекста на създаването на цифрови хранилища на ПУ бяха изследвани характеристики на платформите за създаване на цифрови хранилища според следните изисквания:
• поддържани формати на съхраняваните файлове - да бъдат използвани както стандартизирани учебни компоненти (SCORM, IMS), така и електронни документа под различни формати (PDF, DOC, HTML, AVI ...);
• метаданни поддържането на най-разпространените стандарта за метаданни (Dublin Core, METS) и възможност за създаване на модели на метаданни, която да гарантира оперативната съвместимост с други информационни системи в ПУ и извън него;
• автентикация и ауторизация на потребители - необходимо е поддържането на най-разпространените методи, както при back-end потребителите, така и при крайните потребители на съдържанието;
• поддържане на максимален брой роли - осигурява максимална гъвкавост при поддържане и работа с цифровите хранилища;
• презервация гарантира използваемостта на материалите дори и след дълъг период от време, при което стандартните формати на електронните ресурси ще претърпят множество промени;
• наличие на гъвкав работен поток при депозирането на дигитални ресурси;
• възможност за перманентни връзки към дигиталните ресурси "отвън";
• автоматично извличане и депозиране на метаданни и ресурси;
• възможност за конвертиране от и в други файлови формати;
• REST API необходимо е поради взетото решение, че системите в ПУ ще комуникират посредством REST протокол;
• достатъчно голяма общност стояща зад софтуерната платформа (при избор на готова такава), даваща гаранция за добро развитие и поддръжка на платформата в бъдеще.
При избора на софтуерна платформа за цифрово хранилище беше проучен опитът на други университети и беше извършено сравнение на характеристиките на водещи софтуерни 166
платформи за създаване на цифрови хранилища. Справка в регистъра на академичните цифрови хранилища с отворен достъп OpenDOAR [2] показва съществуването на 6 академични цифрови хранилища в България.
Цифрово хранилище Типове материали Брой материали В ескплоатация от Интерфейс (език) Софтуерна платформа
Бургаски свободен университет Статии, книги 460 2006 г. Български, Английски DSpace
ИМИ - БАН Статии, книги 2085 2007 г. Английски DSpace
ОрепАЖЕ Статии, книги 118 2008 г. Английски DSpace
Медицински университет Статии, дипломни работи, книги, учебни материали 576 2011 г. Български, Английски DSpace
НБУ Статии, книги, учебни обекти 1639 2011 г. Български Английски EPrints
Софийски университет Статии 842 2008 г. Английски DSpace
Таблица 1. Цифрови хранилища в български университети
С оглед наличните ресурси и необходимостта от сравнително бързо имплементиране се взе решения за изграждане на цифрово хранилище на базата на стандартна софтуерна платформа. Проведе се изследване и сравнение между трите най-разпространени платформи за цифрови хранилища според OpenDOARM: DSpace (42,7%) , Eprints (13,9%) и Digital Commons (4,7%). Едно от основните изисквания бе софтуерната платформа да е с отворен код. При това изискване отпадна вариантът за цифрово хранилище да бъде избран варианта Digital Commons. Останалите две платформи бяха изследвани и сравнени (вж. Табл 2).
Характеристики Dspace Eprints
Лиценз Безплатен (BSD) Безплатен (GNU Public)
Поддръжка Безплатна(общност) / Платена Безплатна(общност) / Платена
Поддържани файлови формати при съхранение и депозиране Документи (pdf, doc, ppt .) Изображения (jpeg, gif, png .) Видео (mpeg, avi ..) Аудио (mp3, wav, .) Учебни обекти (scorm ..) Документи (pdf, doc, ppt ...) Изображения (jpeg, gif, png .) Видео (mpeg, avi ..) Аудио (mp3, wav, .)
Поддържани формати метаданни Dublin Core, Qualified DC, METS, Може да внася/изнася съдържание от различни формати метаданни. Dublin Core, MARC, METS, BibTeX, DIDL, EndNote, JSON, MODS, CSV, ORE, OpenURL, RDF, Refer, RefMan, XML
Поддържане на миниатюри при преглед Изображения, видеофайлове, PDF и текст Изображения, видеофайлове, PDF и текст
Многоезична поддръжка Да Да
Преобразуване към XML fla -
Разширено търсене fla fla
Поддържане на RSS/Atom RSS/Atom RSS/Atom
Поддържана допълнителна автентикация LDAP, Shiboleth LDAP
Статистически отчети fla fla
Поддържана операционна система LINUX, UNIX, SOLARIS, Windows, MacOS, Hosted Service. LINUX, UNIX, SOLARIS, Windows, MacOS
Използвани програмни езици Java, JavaScript PERL, JavaScript
Поддържана база данни Oracle, PostgreSQL MySQL, Oracle, PostgreSQL
Интероперативност OAI-PMH, OAI-ORE, SWORD, SWAP, WebDAV, REST, SRU/ SRW, OpenSearch OAI-PMH, OAI-ORE, SWORD, SWAP, RDF, RoMEO
Множествено импортиране/експортиране fla fla
Конфигурируеми работни потоци fla fla
Таблица 2. Сравнение на DSpace и Eprints
На база на извършените проучвания и анализи бе избрана платформата с отворен код DSpace, която се разпространява свободно под формата на BSD лиценз. DSpace разпола-га с най-голямата общност от потребители и разработчици в света, силно преконфигури-руема е (възможност за преконфигуриране на външния облик, формата на метаданните, преглеждането и търсенето в дигиталните ресурси, местния език и др.) и управлява и извършва презервация на почти всички типове дигитални ресурси. След задълбочено проучване за сървърна операционна система бе избрана CentOS, която се поддържа от повечето платформи за виртуализация [3] и е една от най-използваните "guest" Linux операционна система, предлагани от доставчиците ни виртуална инфраструктура (IaaS), което прави цифровото хранилище максимално гъвкаво относно организацията и хардуера, върху който ще работи.
Разработване на университетско цифрово хранилище
Създаденото цифрово хранилище е разположено на адрес http://dspace.uni-plovdiv.bg (вж. Фиг 1). В хранилището са създадени 5 общности и 255 колекции за съхраняване на различни типове университетски документа и учебни ресурс. Към момента в създадените колекции са разположени редица дигитални ресурси, както следва (по общности):
• Нормативни документа и стандарта за ЕДФО - 10 нормативни документа, разработено от Регионалния център за дистанционно обучение в рамките на проект ПеУ [1];
• Стандартизирани мултимедийни елементи - IMS пакети на 132 мултимедийни елемента;
• Стандартизирани учебни е-ресурси - 185 стандартизирани (по стандарта IMS) учебни ресурса в 19 професионални направления, създадени от преподаватели в рамките на проект ПеУ [1];
• Научни постижения - 42 научни публикации на преподаватели от ПУ сред които и автореферати за придобиване на образователна и научна степен (доктор).
Предстои разполагане на документа в колекциите от общност „Университетски е-архив".
168
Фигура 1. Цифрово хранилище на ПУ „Паисий Хилендарски"
Заключение
Предстои добавяне на нови метаданни за описание на разположените в хранилището дигитални ресурси, добавяне на нови групи потребители с определени права на достъп до колекции в хранилището и изследване на възможностите за интегриране на цифровото хранилище с други университетски системи с цел автоматизирано архивиране на документи и ресурси от университетските системи и тяхното повторно използване.
Благодарности
Работата е частично финансирана от проект МУ15-ФФИТ001 „Методика за създаване и динамично обновяване на тестови единици и тестове с автоматизирано оценяване на тях-ното качество" към Фонд „Научни изследвания" при Пловдивски университет.
Използвана литература
[1] ПеУ: национален еталон за провеждане на качествено е-обучение в системата на висшето образование, http://peu.uni-plovdiv.bg/, последно посетен на 24.03.2015 год.
[2] Directory of Open Access Repositories (OpenDOAR), http://www.opendoar.org , последно посетен на 24.03.2015 год.
[3] Kedia P., Nagpal R., Singh T. (2013). A Survey on Visualization Service Providers, Security Issues, Tools and Future Trends.
[4] Setting up a repository, http://www.rsp.ac.uk/start/setting-up-a-repository/technical-ap-proaches, последно посетен на 24.03.2015 год._