УДК 004.65
ОБОСНОВАНИЕ ВЫБОРА ЕСМ-СИСТЕМЫ ALFRESCO В КАЧЕСТВЕ БАЗЫ
ДЛЯ ПОСТРОЕНИЯ СЭДО ВГТУ
И.В. Зубарев, Д.В. Макаров
Обосновывается выбор ЕСМ-системы Alfresco для использования в качестве основы системы электронного документооборота в управленческой деятельности ВГТУ
Ключевые слова: управление, структурированные данные, неструктурированные данные, документооборот, системы управления корпоративным контентом, ЕСМ, СЭДО
Широкомасштабная автоматизация
управленческой деятельности ВУЗа предполагает не простое использование средств ИВТ для делопроизводства, но и применение специальных программных средств для генерации управляющих документов и материалов, их движения по подразделениям ВУЗа и контроля прохождения по всем инстанциям, что позволяет существенно оптимизировать принятие управленческих решений .
В любом ВУЗе существует 2 вида данных: структурированные данные и
неструктурированные данные.
Структурированные это такие данные, которые представлены в виде таблиц, записей и которые хранятся в учётных системах.
Неструктурированные данные (или контент) это всё остальное, что может храниться. Обычно это набор файлов и папок, расположенных на локальных и сетевых дисках, на сайтах в интернете.
Для управления структурированным данными существуют учётные системы (1С, SAP и пр.). Управлением
неструктурированными данными занимается отдельный класс систем.
Так как принято называть неструктурированные данные корпоративным контентом (Enterprise Content), то и системы по управлению таким видом контента называются ECM (Enterprise Content Management).
В отличие от ECM, СЭДО (системы электронного документооборота) - это слишком общее понятие, в которое включают системы, автоматизирующие организационнораспорядительный документооборот
Зубарев Игорь Валентинович - ВГТУ, канд. техн. наук, доцент, тел. (473) 242-76-04, e-mail: zubarev@vorstu.ru Макаров Дмитрий Викторович - ВГТУ, начальник сектора ОТОНИТ, тел. (473) 242-76-04
(регистрация входящих, исходящих,
организационно-распорядительных документов). Такие системы ведут учёт документов и их исполнение. Это в большей степени, учётные системы, а не представители систем класса ECM.
Во всех ECM-системах имеется понятие репозитория - хранилища документов, папок и других объектов. Структура репозитория в подавляющем большинстве систем
представляет иерархию объектов (кабинетов, папок, документов).
Каждый объект репозитория состоит из атрибутов, которые хранятся в базе данных и, собственно, контента, который находится в служебном хранилище на файловой системе. Некоторые объекты могут не иметь контента (например, папки или пользователи).
Основой автоматизации процессов
организационно-управленческой работы в ВГТУ является развёрнутая на базе информационно-вычислительной сети ВУЗа и функционирующая в тестовом режиме система электронного документооборота (СЭДО)
документооборота AcroDoc ECM на движке открытой платформы Alfresco.
Alfresco, как уже неоднократно
говорилось, представляет собой ECM-платформу с открытым кодом, разработчиком которой является компания Alfresco Software Inc (Великобритания). Эта платформа сама по себе не является системой электронного документооборота, но на основе этой платформы возможно такую систему построить, что, собственно и реализовано в СЭДО AcroDoc.
Alfresco имеет несколько редакций -Community (общедоступна и бесплатна), OnPremise и Cloud (распространяются компанией Alfresco и её партнёрами по платной подписке). Alfresco OnPremise (Standard и Enterprise) для размещения в частном облаке, а Alfresco Cloud - в публичном облаке.
Выбор именно этой ЕСМ-системы был обусловлен рядом факторов:
1. 100%-но облачная система, что позволяет существенно сэкономить на инфраструктуре и на комплектации рабочих мест, снизить издержки на внедрение и обслуживание;
2. Система полностью построена на свободном ПО и поставляется по открытой лицензии, что позволяет увеличивать количество рабочих мест, не неся лицензионных издержек;
3. Alfresco - мировой лидер открытых ECM, что позволяет использовать наработки вендора и сообщества при развитии системы, переложив на них большую часть затрат;
4. Система содержит самые современные функции, включая элементы корпоративных социальных сетей;
5. Стабильно работает по протоколу Sharepoint через HTTPS;
6. Дополнительно к возможностям ECM Alfresco, интегрированы такие современные и востребованные возможности, как совместное календарное планирование, поддержка совещаний, управление кейсами (на этой технологии реализовано управление договорами), ЭЦП и др.
Кроме того, в Alfresco есть возможность использовать такие готовые решения, как:
• Alfresco Share - позиционируется как альтернатива Sharepoint. Это средство совместной работы, разработки документов, проектов.
• Alfresco Sync - средство синхронизации локальных файлов с Alfresco.
• Alfresco Workdesk - продукт Alfresco, предоставляющий богатые возможности по управлению контентом на платформах Alfresco и IBM FileNet P8
• Alfresco Transformation Server -серверное ПО для Alfresco, позволяющее преобразовывать MS Office форматы в PDF без потери качества. Использует запущенную копию MS Office для преобразования.
• Alfresco File System Transfer Receiver -серверное ПО, позволяющее выступать в качестве приёмника при репликации контента в Alfresco. Например, можно организовать периодическую выгрузку на хостинг содержимого сайта в виде html/php/css файлов.
Еще одним преимуществом Alfresco является то, что она построена на современных
Java-технологиях, таких как Spring, JSF, Hibernate, Lucene; новые версии будут использовать Spring Surf. Работа пользователей с системой осуществляется через браузер. Возможно также работать с файлами через проводник Windows, как с обычной сетевой папкой (протокол CIFS) или через FTP.
Alfresco является кроссплатформенным программным обеспечением (выпускаются сборки для Microsoft Windows, Linux, Mac OS X; возможна самостоятельная компиляция исходников под OS/400 или OS/2). В качестве СУБД для свободной редакции поддерживаются MySQL и PostgreSQL, в редакции уровня предприятия также поддерживаются Oracle Database, IBM DB2, Microsoft SQL Server.
Alfresco включает в себя такие модули: репозиторий контента, готовый к использованию веб-портал, CMS для управления и использования стандартным содержимым портала, интерфейс CIFS, предоставляющий совместимость с файловыми системами Microsoft Windows и Unix ОС через интернет, систему управления веб-контентом с возможностью виртуализации веб-приложений и статичных сайтов через Apache Tomcat.
Главными техническими особенностями Alfresco являются:
• Для хранения содержимого
используется виртуальная файловая система.
• В ядро системы включена поддержка jBPM для обеспечения управления бизнес-процессами.
• Начиная с версии 4.0 для управления
бизнес-процессами используется
собственный BPM-движок Activiti.
• Индексирование и поиск реализованы
на основе средств Lucene (начиная с версии 4.0 индексирование
производится средствами SOLR).
• Поддержана обработка (выгрузка и загрузка) любых документов в форматах *.docx (Microsoft Office), *.ods (OpenOffice), во внутреннем XML-формате или формате *.PDF.
• В модуле управления документами
реализованы функциональные
возможности системы контроля версий.
Alfresco поддерживает следующие открытые стандарты и соглашения: Java
Content Repository API (JSR 170), портлеты (JSR 168), протоколы Windows Share
(SMB/CIFS), FTP, WebDAV, для аутентификации поддерживаются LDAP и Microsoft Active Directory, доступно внешнее API к системе с привязками для языков Java и PHP, реализованы провайдеры .NET, все функции системы доступны как веб-службы, поддерживается RSS для подписок, потоки операций моделируются на языке BPEL, заявляется полная поддержка OASIS-стандарта CMIS 1.0.
Система, внедряемая в ВГТУ, автоматизирует процессы управления контентом и охватывает полный жизненный цикл следующих видов документов:
• Входящей и исходящей корреспонденции, включая корреспонденцию из различных источников;
• Поручений и задач;
• Приказов и распоряжений;
• Запросов вышестоящих организаций;
• Хозяйственных договоров и связанных с ними документов, включая первичные документы;
• Документов по технике безопасности и охране труда;
• Кадровых договоров и приказов, договоров гражданско-правового характера и т. д.
Каждый тип документа ассоциирован с группой бизнес-процессов, которые снабжены административными регламентами,
разработанными Министерством образования.
Система позволяет расширять свою функциональность с помощью модулей расширений. Модули могут содержать всё что угодно: и бизнес-логику, и стили страниц, и новые страницы, и расширения модели данных, и новые сервисы. Модули расширений могут работать с Alfresco через ряд протоколов, лучше всего поддерживается протокол REST Для интеграции с другим ПО, поддерживаются различные типы
аутентификации, есть возможность соединять их в цепочки. Например, пользователь может попасть в систему с помощью Single sign-on.
Если пытается подключиться
неавторизованный пользователь, то Alfresco попытается его авторизовать (спросит имя пользователя и пароль, или сертификат, в зависимости от того, как настроена система).
В Alfresco очень гибкая модель данных, много возможностей для её расширения. Если вкратце, то стоит упомянуть, что модель поддерживает множественное наследование (с помощью аспектов), причём динамическое, то есть в любой момент можно любому объекту добавить какой-либо аспект, и объект приобретает все свойства данного аспекта.
Доступ к данным и функциональности можно гибко настраивать. Система авторизации оперирует такими понятиями, как: объект данных, разрешение, пользователь, группа, роль. Роли назначаются пользователям и группам во время работы приложения, в том числе можно присваивать роли каскадно, на целое поддерево данных.
Alfresco была выбрана, как единственный вариант ECM-системы с хорошей enterprise-поддержкой, реализацией протокола Sharepoint, наличием примеров внедрения с 1000+ пользователей.
Исходя из нашего опыта, сервера Intel Core 2 2,4 GHz с 8Gb памяти хватит для
обслуживания до тысячи зарегистрированных активных пользователей. При увеличении количества пользователей нужно
анализировать, какие части системы наиболее нагружены. Правильно настроенная система способна надёжно работать и в кластере, обеспечивая целостность и актуальность данных.
Литература
1. Mark R. Gilbert, Karen M. Shegda, Kenneth Chin, Gavin Tay, Hanns Koehler-Kruener. Magic Quadrant for Enterprise Content Management, 2012 (англ.). G00237781. Gartner (18 October 2012).
2. ECM Enterprise Content Management, Ulrich Kampffmeyer. Hamburg 2006, ISBN 978-3-936534-09-8. Definition, history, architecture, components and ECM suites. Publication in English, French, and German.
Воронежский государственный технический университет
ON THE QUESTION OF THE RELEVANCE OF THE USE OF ELECTRONIC DOCUMENT MANAGEMENT SYSTEMS FOR UNIVERSITY MANAGEMENT
I.V. Zubarev, D.V. Makarov
The choice of the Alfresco ECM-system to be used as the basis of a system of electronic document management activities in VSTU
Key words: information technology, management, data, structured data, unstructured data, document management systems, enterprise content management, ECM, SEDO (it is equivalent of ECM-system)