Научная статья на тему 'Особенности работы с документами в информационных системах управления данными'

Особенности работы с документами в информационных системах управления данными Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
189
116
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Вичугова А. А., Вичугов В. Н., Дмитриева Е. А.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Особенности работы с документами в информационных системах управления данными»

некоторых множествах исходных данных и не является непосредственно недостатком метода.

Эффективность использования

предложенного метода поддержки принятия решений

Ограничение возможности уменьшения количества критических этапов, особенно сильно проявляющееся в случае необходимости сохранения структуры проекта, связано с выбором критерия минимизации длительности. При необходимости перевода какого-либо этапа в разряд некритических целесообразно изменить структуру проекта, при этом данная задача возлагается на пользователя, так как сам метод не предусматривает воз-

можность выбора альтернативных вариантов реализации.

В заключение следует отметить, что предложенный метод может использоваться для поддержки принятия решений по управлению любыми проектами, реализуемыми на промышленных предприятиях, но наиболее целесообразно его применение при управлении сложными проектами, структура которых описывается в терминах нестрогих отношений между этапами. Возможности метода для моделирования нелинейных временных потоков ограничены, так как учет ветвлений возможен только путем построения отдельных временных моделей для каждого из альтернативных направлений развития проекта. Разработка методов, позволяющих учесть данный недостаток, - цель дальнейших исследований.

Литература

1. Управление проектами: справоч. пособие / И.И. Мазур, В.Д. Шапиро [и др.]. М.: Высш. школа, 2001. 875 с.

2. Стоянова О.В., Дли М.И., Васицына А.И. Возможности использования временных логик для управления сложными проектами // Нейрокомпьютеры: разработка и применение. 2011. № 8. С. 48-53.

3. Еремеев А.П., Троицкий В.В. Методы представления временных зависимостей в интеллектуальных системах поддержки принятия решений // Изв. РАН. Теория и системы управления. 2003. № 5. С. 75-88.

4. Шапчиц П.А. О проблеме разделяющего мгновения во временной логике // Современная логика: проблемы теории, истории, применения в науке. СПб, 2008. С. 407-410.

5. Буркланов С.А., Бурков В.Н. Математические основы управления проектами. М.: Высш. школа, 2005. 790 с.

References

1. Mazur I.I., Shapiro V.D., Olderogge N.G., Upravlenie Proektami. Spravoch. Posobie (Project Management. A Reference Guide), Moscow, Vysshaya Shkola, 2001, 875 p.

2. Stoyanova O.V., Dli M.I., Vasicyna A.I., Neyrokompju-tery: razrabotka iprimenenie, 2011, no. 8, pp. 48-53.

3. Eremeev A.P., Troitskiy V.V., Izvestiya Rossijskoi Akade-mii Nauk, Teorija i Sistemy Upravlenija, 2003, no. 5, pp. 75-88.

4. Shapchits P.A., Sovremennaja logika: problemy teorii, istorii, primenenija v nauke, St. Petersburg, 2008, pp. 407-410.

5. Burklanov S.A., Burkov V.N., Matematicheskie osnovy upravlenija proektami (Mathematical Foundations of Project Management), Moscow, Vysshaya Shkola, 2005, 790 p.

Сфера приня- Возможности Успешность

тия решения метода операции, %

Планирование Выявление и устранение 70

структуры про- противоречий в струк-

екта туре проекта

Выявление и устранение 90

циклов

Возможность учета 100

сложных отношений

между этапами

Оптимизация Расчет длительности 100

длительности проекта заданной струк-

проекта туры при известных длительностях этапов

Расчет длительности от- 50

дельных этапов при за-

данной длительности

проекта

Повышение Определение критиче- 100

управляемости ских этапов

проектом Уменьшение количества критических этапов без изменения структуры проекта 40

Уменьшение количества 70

критических этапов с

изменением структуры

проекта

УДК 002.53;004.65;62/.63

ОСОБЕННОСТИ РАБОТЫ С ДОКУМЕНТАМИ В ИНФОРМАЦИОННЫХ СИСТЕМАХ УПРАВЛЕНИЯ ДАННЫМИ.

А.А. Вичугова; В.Н. Вичугов, к.т.н.; Е.А. Дмитриева, к.т.н.

(Национальный исследовательский Томский политехнический университет, anya@aics.ru)

Изложены аспекты управления документами в современных многопользовательских информационных системах, которые позволяют автоматизировать структурированное хранение электронной информации и управление ею. Рассмотрены модели данных информационных систем. Проведен анализ понятия «электронный документ», включая метаданные и внутреннее содержимое, а также показаны основные отличия информационных систем управления данными об изделии (PDM) и информационных систем электронного документооборота (ЕСМ) относительно объектов типа «документ». Перечислены возможные состояния жизненного цикла документа в информационной системе.

Рассмотрены особенности методологии управления потоком работ Workflow на примере типовых процессов работы с документами. Приведен фрагмент разработанной модели данных информационной системы управления проектной информацией для примера управления технологическими данными в приборостроительном производстве. Выполнено сравнение возможностей управления документами на примере PDM-системы Enovia SmarTeam производства IBM и Dassault Systems и отечественной ECM-системы DIRECTUM, разработанной одноименной российской компанией.

Ключевые слова: документооборот, модель данных, управление предприятием, информационные системы, автоматизация деятельности.

PECULIARITIES OF WORKING WITH DOCUMENTS IN INFORMATION MANAGEMENT SYSTEMS Vichugova A.A.; Vichugov V.N., Ph.D.; Dmitrieva E.A., Ph.D.

(TomskPolytechnic National Research University of Resource-Efficient Technologies, anya@aics.ru)

Abstract. The article describes aspects of document management in modern multiplayer communication systems that allow you to automate structured electronic information storage and management. Models of these information systems are considered. Analysis of the notion of «electronic document» is performed, including metadata and inner content, as well as the major differences between product data management systems (PDM) and electronic document management systems (ECM) concerning objects of «document» type. Possible states of a document's life cycle in the information system are listed. There are considered features of Workflow management methodology on the example of work with documents. There is a fragment from the developed model of project information management system as an example of the technological data management in instrument manufacture. There are compared document management features on the example of PDM-system Enovia SmarTeam of IBM and Dassault Systems production and domestic ECM-system DIRECTUM, developed by a ho-monymous Russian company.

Keywords: document management, enterprise management, information systems, automation of activity, data model.

Результаты деятельности практически в любой области могут быть формализованы в виде документов. Документы - это и объекты выражения данных, и самое распространенное средство сопровождения работ, обеспечивающее фиксацию и перенос информации от одного исполнителя к другому. Поэтому эффективность деятельности организации во многом определяется скоростью и качеством прохождения документов через ее сотрудников. Однако управление документооборотом подразумевает не только контроль движения документов, но и правила их создания, изменения, хранения и уничтожения.

Автоматизировать управление жизненным циклом (ЖЦ) информации позволяют информационные системы (ИС) управления данными, среди которых выделяют категории систем PDM (Product Data Management - управление данными о продукции) и ECM (Electronic Content Management - управление электронными данными).

Современные ИС указанных категорий являются многопользовательскими и поддерживают одновременную работу нескольких человек с одним документом, сохраняя при этом единство и целостность данных. Это обеспечивается инструментами гибкой настройки прав пользователей согласно их ролям и полномочиям. Полезной функцией PDM- и ECM-систем является возможность существования нескольких версий документа. Однако управление документами в данных ИС реализуется по-разному. По мнению авторов статьи, одна из главных причин данного факта - различные концепции термина «документ» в PDM- и ECM-системах. Рассмотрим данное утверждение более подробно на примере PDM-системы Enovia SmarTeam и ECM DIRECTUM. Эти программные продукты широко распространены на многих российских предприятиях и используются авторами статьи в Томском политехническом университете

уже несколько лет в рамках подготовки специалистов по направлению «Информационные системы и технологии в бизнесе».

Документ и его ЖЦ

Понятие «документ» в ИС управления данными включает две следующие компоненты:

- тело документа - файл различного формата (текст, таблица, расчет, изображение и т.д.);

- метаданные - информация об объекте, хранимая в его карточке (название, назначение, сведения об авторе, дата создания и т.д.).

В ECM-системах, ориентированных на автоматизацию операций делопроизводства, документ является первичной и конечной сущностью. В PDM-системах, предназначенных в первую очередь для управления инженерными данными кон-структорско-промышленных предприятий, первичной считается материальная сущность - проектируемый объект: деталь, блок, часть изделия и т.д. Данная сущность называется элементом. Количество и варианты соединения элементов между собой определяются структурой изделия. Документ является вторичной информационной сущностью, которая сопровождает элемент на различных этапах его ЖЦ (эскизная разработка, конструкторское проектирование и т.д. ). При этом у одного и того же элемента на разных этапах его ЖЦ содержимое документов одинакового назначения может отличаться. Например, спецификация на блок при эскизном проектировании может отличаться от спецификации на этот же самый блок на этапе его запуска в производство. Таким образом, именно уникальные особенности предметной области - процессы создания комплексных инженерных изделий - определяют концептуальную основу PDM-систем: смысл терминов «элемент» и «документ» и отношения между ними (рис. 1).

Первичная материальная сущность - Элемент

Структурированная совокупность элементов -Изделие

Вторичная информационная сущность - Документ

Расчет - файл Таблица Графтеское^екст CAD/CAM/CAE изображение

Рис. 1. Понятие элемента и документа в PDM-системе Enovia SmarTeam

Отмеченная разница концепции термина «документ» в PDM- и ECM-системах отражается в этапах ЖЦ данного объекта и последовательности перехода между ними. ЖЦ практически каждого документа начинается с этапа разработки, затем документ становится действующим и доступным для использования до истечения его срока действия. В силу своей предметной направленности -управление офисным документооборотом - ECM-система DIRECTUM позволяет настраивать этапы ЖЦ и вводить собственные для различных видов документов посредством добавления новых записей в справочники «Виды электронных документов» и «Виды жизненных циклов». Подобная функциональность отсутствует в PDM Enovia SmarTeam: документы могут находиться только в

одном из типовых предопределенных этапов ЖЦ -новый, выпущенный, согласованный и устаревший.

Продолжая сравнение ЖЦ документа в PDM Enovia SmarTeam и ECM DIRECTUM, следует отметить, что при создании документа в DIRECTUM на сервере БД генерируется новая запись в СУБД, в которую вносятся метаданные документа. Тело документа - файл - в зависимости от размера и настроек ИС размещается в файловом хранилище или в СУБД и с этого момента становится доступным всем пользователям ИС, обладающим правами хотя бы на просмотр данного объекта.

В PDM-системе Enovia SmarTeam документ на начальном этапе своего ЖЦ находится локально на компьютере его создателя и становится доступным для других пользователей ИС только на следующем этапе своего ЖЦ, когда он переходит в состояние «выпущенный» и перемещается на сервер. При редактировании выпущенного документа он копируется на компьютер пользователя, осуществляющего эту операцию, и блокируется от просмотра и изменения другими пользователями ИС. По завершении редактирования автоматически создается новая версия документа и размещается на сервере. Далее в зависимости от специфики деятельности предприятия и правил внутреннего документооборота документ может находиться в состоянии «согласованный», при котором невозможно его дальнейшее изменение. По истечении срока действия документ считается устаревшим и перемещается в архив. На рисунке 2 показаны типовые этапы ЖЦ документа в

Рис. 2. ЖЦ документа в PDM-системе Enovia SmarTeam

PDM-системе Enovia SmarTeam и операции по их изменению.

Следует отметить, что в PDM Enovia SmarTeam объект типа «документ» может находиться только в одном из вышеописанных типовых предопределенных этапов ЖЦ, и даже широкий набор инструментов администрирования данной ИС не позволяет задать свои правила ЖЦ для документа. При этом для объекта типа «элемент» существует возможность ввода новых состояний его ЖЦ согласно правилам предприятия и/или последовательности технологических этапов. Таким образом, снова подчеркивается ориентация PDM-систем на управление инженерными данными при проектировании и производстве сложных промышленных изделий. Данная профильная направленность PDM-системы положена в основу ее объектно-ориентированной модели данных, которая хранится в БД. Следует рассмотреть это утверждение в контексте общепринятых терминов: записи являются физическими сущностями в таблицах реляционной БД, в то время как объекты представляют собой абстрактные сущности в объектно-ориентированной модели данных [1, 2].

Модели данных PDM- и ECM-систем

В DIRECTUM, подобно 1С, Business Studio и многим другим ИС, реализована реляционная структура данных: функциональные модули ИС связаны между собой записями справочников -таблиц БД, в которых хранятся объекты с одинаковым поведением. Подобная типизация объектов в Enovia SmarTeam определяется понятием «класс», экземпляры которого характеризуются одними и теми же атрибутами. Наследование классов и механизмов поведения объектов в объектно-ориентированной модели данных Enovia SmarTeam, например, «Управление файлом», «Поведение элемента», «Поведение документа», «Поведение сборки» и т.д., накладывает ограничения на изменение некоторых характеристик классов, к которым относятся и этапы ЖЦ.

Продолжая анализ модели данных PDM Enovia SmarTeam, следует отметить ее структурированность: класс самого верхнего уровня иерархии называется суперклассом. На рисунке 3 показан фрагмент набора классов модели данных PDM Enovia SmarTeam, разработанной авторами статьи для примера управления технологическими данными в приборостроительном производстве.

Следует отметить, что модель данных Enovia SmarTeam является проектно-ориентированной: главным считается суперкласс «Проекты», так как все другие суперклассы и их данные организованы вокруг него. Такая ситуация соответствует специфике применения PDM-систем, поскольку большинство промышленных предприятий используют проектное управление и соответствую-

- Class Browser

- Classes

Пользователи

- Проекты

| Проект

- Бизнес-процесс

- Согласование

Согласование внутри отдела

Согласование в отделении

- Структура изделия

Сборочная единица

Деталь

- Стандартные и прочие изделия

1 Стандартое изделие

| Прочее изделие

Материал

- Документы

Папка

ОРД

- Технологическая документация

1 Документ технолога

+ | Электронная модель

Извещение об изменении

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

НСИ и шаблоны документов

Рис. 3. Фрагмент набора классов модели данных

PDM-системы Enovia SmarTeam

щее распределение работ. Однако в ряде случаев проектно -ориентированная методология Бпоу1а 8шагТеаш, которая предполагает обязательный выбор проекта, затрудняет организацию хранения и доступа к общей информации, используемой в нескольких проектах одновременно, например нормативно-справочные данные (ГОСТы, СТП, инструкции и т.д.). Решить данную проблему можно с помощью объединения подобных объектов в отдельный суперкласс, что позволит реализовать доступ к его экземплярам от любого объекта ИС с использованием связей. В объектно -ориентированной терминологии модели данных Enovia SmarTeam связь между суперклассами -это класс с предопределенным поведением и атрибутами по выбору пользователя. На уровне физической модели данных класс связи, как и другие классы, представляет собой таблицу реляционной БД.

В графическом интерфейсе пользователя Enovia SmarTeam связи между экземплярами различных суперклассов позволяют визуально отследить взаимоотношения между объектами. Например, на рисунке 4 показано дерево проектов, включающее экземпляры суперкласса «Проект», с одним из которых связаны объекты суперклассов «Документ», «Извещение об изменении» и «Пользователи».

Экземпляры суперкласса «Проект»

ел Проекты:

-_Проекты Tree

...i пробный проект

- •/ докг|мет_текст a Preliminary Design^ ■ + ...! Петров И.И. инженер 620 Default r-Q . ИИ_по_до1;

докг|мет_текст PreliminaryDerigrr ...i первый проект проба пера

Экземпляры других — суперклассов, с которыми связан данный экземпляр суперкласса «Проект»

Рис. 4. Связи между экземплярами различных суперклассов в PDM-системе Enovia SmarTeam

В ECM-системе DIRECTUM подобная связь между объектами (записями разных справочников) осуществляется согласно логическим отношениям между соответствующими таблицами в реляционной модели данных. Работа с информацией в визуальном интерфейсе пользователя предполагает заполнение справочников в определенной последовательности. Например, чтобы заполнить справочник «Работники», сначала следует внести данные в справочники «Наши организации» и «Подразделения». Подобная этапность присутствует и в работе с информацией в PDM-системе Enovia SmarTeam: например, для привязки пользователя к документу проекта сначала необходимо добавить пользователя в проект.

Управление работами/задачами

Управление объектами предполагает выполнение определенных работ по их изменению. Перемещение документов между исполнителями в современных ИС реализуется с помощью положений методологии Workflow («поток работ»). При этом, несмотря на принципиальные отличия в назначении PDM- и ECM-систем, Workflow реализуется в них практически одинаково:

- инструменты администрирования ИС позволяют создавать любые визуальные схемы маршрутов документов и сценариев работ (рис. 5, 6);

- после разработки Workflow-диаграммы она тестируется, при отсутствии ошибок ассоциирует-

Уведомление

для участников

Установка напоминаний

Утвердить протокол

Доработка протокола

V

Составление протокола

Утвердить протокол у ^

•[Согласование

На повторное согласование

Создание подзадач по решениям

л

На повторное согласование

Подписание протокола

Утвердить протокол

Рис. 6. Workflow-схема процесса «Совещание» в ECM DIRECTUM

ся с определенной записью соответствующей таблицы БД и становится доступной для использования;

- в интерфейсе пользователя ИС выделено специальное хранилище порученных ему работ, например, приложение SmartBox в PDM Enovia SmarTeam и папки Входящие/Исходящие в ECM DIRECTUM.

Примечательно, что, несмотря на разницу в концепции термина «документ», в PDM- и ECM-системах можно запустить работу на исполнение как отдельно от документа, так и вместе с ним. Таким образом реализуется управление действиями сотрудников предприятия, поскольку время выполнения и состав операций пользователей ИС автоматически протоколируются.

В заключение необходимо отметить, что рассмотрены аспекты управления документами с помощью современных ИС, предназначенных для хранения и обработки больших объемов корпоративных данных. PDM-системы, помимо функционала ECM по управлению офисной документацией, обеспечивают просмотр и оперативную правку файлов различных инженерных форматов (CAD/CAE/CAM), а также выполнение других специфических операций (например, формирование спецификаций и пр.). Для этого многие PDM-системы поддерживают интеграцию с широко используемыми CAD/CAE/CAM-пакетами, например, Windchill и Pro/ENGINEER, Enovia SmarTeam и CATIA, AutoCAD, SolidWorks, DELMIA, Teamcenter и NX, Solid Edge, Tecnomatix и т.д.

В свою очередь, ECM-системы позволяют автоматизировать текущую операционную деятельность - работу делопроизводителей, секретарей и

На согла-

руководителей, связанную с планированием и протоколированием совещаний, вынесением резолюций и поручений, а также канцелярские операции, включая обработку и учет входящих/исходящих документов. Это подтверждается обилием интеграционных решений с офисными приложениями семейств MS Office и Open Office, а также программами типа «органайзер», например MS Outlook.

Резюмируя вышесказанное относительно управления документами средствами ИТ, можно сделать следующие выводы:

- ECM-система может использоваться для автоматизации офисного документооборота и делопроизводства практически на любом предприятии;

- целевая аудитория PDM-систем - множество специалистов различного профиля, участвующих в проектировании и производстве технологически сложных изделий;

- наибольший положительный эффект от применения PDM- и ECM-систем достигается в случае их взаимной интеграции, поскольку они не

являются взаимозаменяемыми из-за различного назначения ИС указанных категорий.

Таким образом, современные PDM- и ECM-системы позволяют оперативно управлять деятельностью предприятия посредством мониторинга и контроля его документопотоков, а также действиями пользователей. При этом очередность внедрения ИС управления данными определяется прежде всего профилем предприятия и спецификой его деятельности, которую решено автоматизировать средствами ИТ.

Литература

1. Дейт К.Дж. Введение в системы баз данных = Introduction to Database Systems. М.: Издат. дом «Вильямс», 2006. 8-е изд. 1328 с.

2. Кодд Э. A Relational Model of Data for Large Shared Data Banks. CACM, 1970. Vol. 13. no. 6.

References

1. Date C.J., Vvedenie v Sistemy Baz Dannykh (Introduction to Database Systems), Moscow, 2006, 8th ed., 1328 p.

2. Codd E., CACM, 1970, Vol. 13, no. 6.

УДК 004.89

КОМБИНИРОВАННЫЙ МЕТОД АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ТОНАЛЬНОСТИ ТЕКСТА

Е.В. Котельников, к.т.н.

(Вятский государственный гуманитарный университет, Kotelnikov.EV@gmail.com)

Статья посвящена проблеме автоматического анализа тональности текста. Анализ тональности используется для решения многих важных прикладных задач, таких как исследование для коммерческой организации отношения потребителей к ее продукции или разработка рекомендательной системы для покупателей определенных групп товаров и услуг.

Предлагается новый метод определения тональности, комбинирующий результаты работы метода опорных векторов (SVM) и метода ключевых слов. SVM является широко известным методом классификации, показывающим хорошие результаты при обработке текстовой информации. Метод ключевых слов основан на подсчете весов входящих в текст признаков. В качестве признаков используются слова и словосочетания, важность которых оценивается на основе релевантной частоты (Relevance Frequency, RF).

Комбинированный метод включает две фазы - обучение и распознавание. На первой фазе на основе размеченной коллекции текстов происходит обучение SVM-классификатора и классификатора на базе ключевых слов. На второй фазе результаты распознавания нового текста обоими классификаторами комбинируются и формируется итоговое решение; при этом учитываются степени уверенности классификаторов в своих результатах.

Каждый метод классификации, используемый в работе (метод опорных векторов, метод ключевых слов, комбинированный метод), имеет свой набор параметров. Подбор оптимальных значений параметров классификаторов осуществляется при помощи скользящего контроля.

Эффективность комбинированного метода подтверждается экспериментами на текстовой коллекции отзывов о фильмах семинара РОМИП-2011. Для оценки используются метрики точности (precision), полноты (recall), правильности (accuracy) и Fl-меры (F1-measure). Значение Fl-меры для предлагаемого метода составляет 79 %, что на два процента превосходит лучший результат, полученный в рамках упомянутого семинара.

Ключевые слова: анализ тональности текста, текстовая классификация, метод опорных векторов, РОМИП.

COMBINED METHOD OF TEXT TONALITY AUTOMATIC IDENTIFYING Kotelnikov E.V., Ph.D. (Vyatka State University of Humanities, Kotelnikov.EV@gmail.com)

Abstract. The article is devoted to the problem of automatic text sentiment analysis. Sentiment analysis is used for many important applications, for example, the research for a commercial organization of the relations of customers to its production, or the development of a recommendatory system for the customers of specified groups of goods or services.

i Надоели баннеры? Вы всегда можете отключить рекламу.