Научная статья на тему 'Аспекты разработки методики управления метаданными документов'

Аспекты разработки методики управления метаданными документов Текст научной статьи по специальности «История и археология»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Вестник ВНИИДАД
ВАК
Область наук
Ключевые слова
документ / метаданные / схемы метаданных / управление документами / управление метаданными / metadata / metadata management / metadata schemas / record / record management

Аннотация научной статьи по истории и археологии, автор научной работы — Ивановский Никита Иванович

Рассматриваются основные аспекты стандартизации и регулирования в рамках задач по разработке методики управления метаданными документов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Aspects of documents metadata management methodology design

The main aspects of standardization and regulation during the documents metadata management methodology design are considered.

Текст научной работы на тему «Аспекты разработки методики управления метаданными документов»

УДК: 651.012.12

Ивановский Никита Иванович

Всероссийский научно-исследовательский институт документоведения и архивного дела г. Москва, Российская Федерация БРШ-код: 9492-0700, АиШогГО: 1122261 ivanovsky@vniidad.ru

Научная статья

АСПЕКТЫ РАЗРАБОТКИ МЕТОДИКИ УПРАВЛЕНИЯ МЕТАДАННЫМИ ДОКУМЕНТОВ

Рассматриваются основные аспекты стандартизации и регулирования в рамках задач по разработке методики управления метаданными документов.

Ключевые слова: документ, метаданные, схемы метаданных, управление документами, управление метаданными.

Для цитирования: Ивановский Н.И. Аспекты разработки методики управления метаданными документов// Вестник ВНИИДАД. 2024. № 3. С. 43-49.

Original article

ASPECTS OF DO CUMENTS METADATA MANAGEMENT METHODOLOGY DESIGN

The main aspects of standardization and regulation during the documents metadata management methodology design are considered.

Keywords: metadata, metadata management, metadata schemas, record, record management. For citation: Ivanovsky N.I. Aspects of documents metadata management methodology design. Vest-nik VNIIDAD = Herald of VNIIDAD. 2024;3:43-49. (In Russian).

Метаданные являются неотъемлемой частью информационной инфраструктуры организации. Они появляются в момент начала эксплуатации любой информационной системы. Однако, определяемые как данные о данных, функционально они

Поступила в редакцию: 31.05.2024 Поступила после рецензирования: 05.06.2024 Принята к публикации: 07.06.2024

существовали в любой организации и архивном учреждении задолго до внедрения информационных технологий и были представлены учетными и отчетными сведениями, в элементах оформления и содержании документации, картотеках и журналах

Received: 31.05.2024 Revised: 05.06.2024 Accepted: 07.06.2024

© Ивановский Н.И., 2024

регистрации, в структуре организации и ее рабочих процессах, законодательстве и локальных нормативных актах. В общем смысле метаданные, являющиеся контекстом деятельности организации, - это любая информация, которая используется для описания существенных характеристик любого объекта, совокупности объектов, функций и операций, информационных или материальных ресурсов и сохраняется организацией в целях учета, классификации, управления и использования этих объектов и сведений о них. Ключевой характеристикой метаданных в общем контексте деятельности выступает именно их описательная функция. Так, требования к составу, связям, формату, форме представления, формирования и хранения метаданных, будучи заложенными в систему управления организацией, реализуются при проектировании информационных систем, предназначенных для работы с документированной информацией.

Допустим, организация или архив только начинает внедрение информационных систем для электронного документооборота или организации хранения дел и документов, включая электронные. Это может быть система электронного документооборота (СЭД), система хранения электронных документов (СХЭД), бухгалтерская или кадровая учетная система, промышленное программное обеспечение, если оно включает функции по формированию, передаче или сохранению каких-либо электронных документов. В ходе формирования технических требований к составу данных, входящих в подлежащие автоматизации бизнес-процессы, закладывается базовая классификационная схема для данных, порядок фиксации их значений в полях и спецификация данных для этих полей. Перечень полей, выполняю -

щих функцию описания для формируемых информационной системой объектов, будь то работники, структурные подразделения, функции или документы, и станет первым перечислением метаданных. Часть метаданных будет играть роль служебной информации для обеспечения функций системы, а часть станет составными элементами для информационных объектов.

С течением времени информационная инфраструктура организации расширяется - обрастает все большим количеством информационных систем. В рамках различных направлений деятельности организации появляются функции, охватываемые одной или несколькими информационными системами. Часть баз данных, использовавшихся для обеспечения утраченных или измененных со временем функций организации, становится основой для актуализации информационных систем и подлежит конвертации, часть остается прикреплена к действующим информационным системам, но не наполняется новыми данными, часть информационных систем заменяется новыми, но они остаются на серверах организации как справочные. В этот момент наступает время для унификации метаданных.

Унификация метаданных как на уровне отдельной организации, так и на уровне отдельного сектора промышленности или области знаний включает несколько ключевых этапов. Отличается только масштаб и правовой статус предлагаемой модели. Во-первых, это унификация имен полей данных буквально таким образом, чтобы одни и те же характеристики подобных объектов имели схожее название по смыслу или вплоть до символа. Во-вторых, это унификация формата данных, то есть значений, привязанных к наименованиям полей. От простого распределения на текстовые и

числовые поля, поля дат [1] и поля наименований географических объектов [2] до более сложных полей с заложенными в них условием или структурой, например, регистрационный номер документа или поле, в которое вложено несколько значений, таких как согласования документа или автор документа.

Следующим этапом унификации метаданных является конструирование моделей данных для определенной сферы деятельности или области знаний. Результатом этой работы становятся схемы метаданных, описывающие какой-либо стандартизируемый объект или группу объектов, которые могут как носить методический характер и быть расширяемыми, так и являться завершенным списком полей, представляя подробную спецификацию файла метаданных. Именно на этом уровне находится большая часть стандартов и нормативных документов, регламентирующих схемы метаданных, - от общих, например, Дублинского ядра - словаря понятий английского языка для унификации элементов метаданных, до более узких, посвященных отдельной области знаний, например, для управления документами - ГОСТ Р 7.0.109-2024 «Система стандартов по информации, библиотечному и издательскому делу (СИБИД). Информация и документация. Управление документами. Логическая структура, состав метаданных документов и требования к их содержанию» [3], а также ряд зарубежных стандартов, например, стандарт «Сохранение метаданных: стратегии внедрения» - PREMIS (PREservation Metadata: Implementation Strategies) [4], ISO 14721:2012 «Космические системы передачи данных и информации. Открытая архивная информационная система. Эталонная модель» (Space data

and information transfer systems - Open archivai information system (OAIS) -Reference modei) и EAD (Encoded Archivai Description - Кодированное архивное описание)1, применяемые при комплектовании и обеспечении сохранности электронных архивных документов и для формирования архивных описаний для цифровых архивных коллекций. Подробный обзор зарубежного опыта стандартизации метаданных документов содержится в статье А.Г. Бороздиной [5]. Более частными примерами унификации состава элементов метаданных являются стандарты на отдельные системы документации, например, для киноархивов - DIN EN 15907:2010 «Идентификация фильмов. Повышение совместимости метаданных. Наборы и структуры элементов» (Film identification - Enhancing interoperability of metadata - Element sets and structures) [6], и большое количество нормативных документов, устанавливающих схемы метаданных для осуществления конкретной функции или для конкретного объекта. Например, «Требования к организационно-техническому взаимодействию государственных органов и государственных организаций», утвержденные приказом Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации и Федеральной службы охраны Российской Федерации от 4 декабря 2020 года № 667/233, закрепляют состав обязательных полей и спецификации значений для электронных сообщений, передающихся в рамках межведомственного электронного документооборота. А приказ Федеральной налоговой службы от 16 февраля 2023 года № ЕД-7-26/115@ «Об

1 См. URL: https://www.loc.gov/ead/ (дата обращения: 25.05.2024).

утверждении XML формата представления договорного документа в электронной форме» устанавливает перечень типовых наименований элементов содержания сделки и предназначен для использования при составлении любого договорного документа (договора, соглашения, дополнительного соглашения, приложений к ним и т.п.) в электронной форме. Таким образом, модели метаданных могут быть как рекомендательными, открытыми и общими, так и нормативно закрепленными и частными. Их общей особенностью является именно способ фиксации требований к элементам метаданных, где каждое поле данных получает статус обязательного или рекомендованного, указываются количество упоминаний конкретного элемента для стандартизируемого объекта и формат данных для каждого элемента, а основным отличием является масштаб регулирования - от информационных технологий в целом, целых областей знаний и систем документации до конкретных функций и форм документов. Заметное сходство в способе регулирования состава полей данных и схем метаданных независимо от их масштаба вызвано, в первую очередь, техническими особенностями этого процесса. Выходные формы файлов метаданных для каждого из приведенных форматов реализуются в формате XML - открытом расширяемом языке разметки документов, форматов, поддерживающих XML, например, семейством форматов PFD/A - нормативно предпочтительным во многих странах, включая Россию, для создания электронных документов. Помимо формата реализации метаданных файлов, важное значение имеет широкое распространение языка UML - унифицированного языка моделирования, принципы которого используются в том числе для моделирования общих и частных схем ме-

таданных, словарей понятий и оказывают значительное влияние на базовые подходы к унификации элементов метаданных, что особенно заметно на примере стандартов Международной организации по стандартизации - ISO (International Organization for Standardization).

Следующий уровень унификации метаданных - это стандарты управления метаданными и в целом информационной инфраструктурой организаций. Ключевым стандартом в области документоведения и архивного дела является ГОСТ Р ИСО 15489-1-2019 «Информация и документация. Управление документами. Часть 1. Понятия и принципы» [7], устанавливающий как цели и задачи организации в управлении метаданными на всех этапах жизненного цикла документации, так и перечень средств управления документами, включая схемы метаданных документов. Общие положения о роли метаданных в управлении документами и принципы, закладываемые в процессы управления метаданными, уточнены в стандарте ГОСТ Р ИСО 23081-1-2008 «Процессы управления документами. Метаданные для документов. Часть 1. Принципы» [8]. Указанные стандарты однозначно определяют управление метаданными как неотъемлемый элемент управления документами, включая организацию оперативной работы и меры по обеспечению их долговременной сохранности.

Однако в унификации и управлении метаданными документов все еще есть непроработанная тема. Российские и зарубежные стандарты и нормативные документы классифицируют рабочие операции и информационные объекты, устанавливают требования к содержанию элементов метаданных и их формат, но не дают организациям подробной инструкции по

практическому внедрению в информационные системы организаций. Источники знаний о методике внедрения стандартов о метаданных и нормативных требований к метаданным занимают отдельную нишу в области управления метаданными. Наиболее применимым и близким к практике источником информации о методике сквозного внедрения схем метаданных, унификации элементов и значений метаданных на данный момент является серия стандартов ГОСТ Р ИСО/МЭК 111791-2010 «Информационная технология (ИТ). Регистры метаданных (РМД)» из пяти частей. Эти стандарты описывают функциональную модель управления метаданными конечным пользователем информационных систем - источников метаданных при помощи специального программного обеспечения для регистрации значений, формата и места в общей схеме классификации данных, в том числе документов для каждого элемента метаданных, а также порядок организации выполнения работ по управлению метаданными и принципы, которыми следует руководствоваться при управлении метаданными в масштабах организации и независимо от количества внедренных информационных систем. Стоит отметить, что серия носит специальный характер и подразумевает труд работников, обладающих квалификацией в составлении словарей, лингвистике, семантике.

Упомянутый выше ГОСТ Р 7.0.109-2024 стал первым стандартом в России для унификации элементов метаданных и спецификации их значений в области докумен-товедения и архивного дела, установив состав метаданных для управления документами на всех стадиях их жизненного цикла. Утверждение этого стандарта поставило вопрос о том, каким образом, какие работ-

ники, с помощью какого рода технологий займутся внедрением изложенных требований. Ответы на эти вопросы на долгое время зададут вектор развития электронного документооборота в России таким образом, чтобы состав и схемы метаданных любых электронных документов организаций были открытыми, унифицированными и отвечали требованиям к обеспечению сохранности электронных документов на протяжении установленных им сроков хранения, включая постоянное хранение. Это позволит сохранять и передавать во времени не только сами электронные документы, но и контекст деятельности, в котором они создавались. Для решения этих задач Всероссийским научно-исследовательским институтом документоведения и архивного дела (ВНИИДАД) ведется разработка Методических рекомендаций по применению национального стандарта «Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Управление документами. Логическая структура, состав метаданных документов и требования к их содержанию» в соответствии с Планом научно -исследовательских и опытно-конструкторских работ, выполняемых на основе государственного задания Федерального архивного агентства на 2024 год2. Издание этого документа станет важной вехой в адаптации сфер документоведения и архивного дела к современной практике управления документами в цифровой сре-

2 Приказ Федерального архивного агентства от 20.12.2023 № 166 «Об утверждении плана научно-исследовательских и опытно-конструкторских работ, выполняемых на основе государственного задания Федерального архивного агентства на 2024 год». URL: https:// vniidad.ru/wp-content/uploads/2023/12/plan-niokr-2024.pdf (дата обращения: 25.05.2024).

де, что, в свою очередь, поспособствует бований, предъявляемых этими областями актуализации и совершенствованию тре- к организациям.

Список источников

1. ГОСТ Р 7.0.64-2018 (ИСО 8601:2004). Система стандартов по информации, библиотечному и издательскому делу. Представление дат и времени. Общие требования // Федеральное агентство по техническому регулированию и метрологии. М., 2018. 32 с.

2. DIN EN ISO 3166-1-2020. Codes for the representation of names of countries and their subdivisions - Part 1: Country code (ISO 3166-1:2020); English version EN ISO 31661:2020 [Коды для представления названий стран и их подразделений - Часть 1: Код страны (ISO 3166-1: 2020); Английский вариант EN ISO 3166-1: 2020] // Российский институт стандартизации. URL: https://www.gostinfo.ru/catalog/Details/?id=6823705 (дата обращения: 25.05.2024).

3. ГОСТ Р 7.0.109-2024. Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Управление документами. Логическая структура, состав метаданных документов и требования к их содержанию // Российский институт стандартизации. М., 2024.

4. The PREMIS Data Dictionary for Preservation Metadata [Словарь данных PREMIS для обеспечения сохранности метаданных] // PREMIS. URL: https://www.loc.gov/standards/ premis/ (дата обращения: 25.05.2024).

5. Бороздина А.Г. Анализ зарубежного опыта по внедрению стандартизированных схем метаданных документов // Вестник ВНИИДАД. 2024. № 1. С. 96-107.

6. DIN EN 15907-2010. Film identification - Enhancing interoperability ofmetadata - Element sets and structures [Идентификация пленки. Повышенная управляемость метаданных. Элементные наборы и структуры] // filmstandards.org. URL: https://filmstandards.org/ fsc/index.php/EN_15907 (дата обращения: 25.05.2024).

7. ГОСТ Р ИСО 15489-1-2019. Система стандартов по информации, библиотечному и издательскому делу. Информация и документация. Управление документами. Часть 1. Понятия и принципы // Федеральное агентство по техническому регулированию и метрологии. М., 2019. 25 с.

8. ГОСТ Р ИСО 23081-1-2008. Система стандартов по информации, библиотечному и издательскому делу. Процессы управления документами. Метаданные для документов. Часть 1. Принципы // Федеральное агентство по техническому регулированию и метрологии. М., 2020. 24 с.

References

1. GOST R 7.0.64-2018 (ISO 8601:2004). Sistema standartov po informacii, bibliotechnomu i iz-dateVskomu delu. Predstavlenie dat i vremeni. Obshhie trebovaniya [ISO 8601:2004, Data Elements and Interchange Formats - Information Interchange - Representation of Dates and Times, MOD]. Federal Agency on Technical Regulating and Metrology. Moscow; 2018. 32 p. (In Russian).

2. DIN EN ISO 3166-1-2020. Codes for the representation of names of countries and their subdivisions - Part 1: Country code (ISO 3166-1:2020); English version EN ISO 31661:2020. Russian Standardization Institute. URL: https://www.gostinfo.ru/catalog/De-tails/?id=6823705 (accessed: 25.05.2024).

3. GOST R 7.0.109-2024. Sistema standartov po informacii, bibliotechnomu i izdateVskomu delu. Informaciya i dokumentaciya. Upravlenie dokumentami. Logicheskaya struktura, sostav metadan-

ny*x dokumentov i trebovaniya k ix soderzhaniyu [System of standards on information, librar-ianship and publishing. Information and documentation. Records management. The logical structure, the composition of metadata for records and the requirements for their content]. Russian Standardization Institute. Moscow; 2024. 10б p. (In Russian).

4. ^e PREMIS Data Dictionary for Preservation Metadata. PREMIS. URL: https://www.loc. gov/standards/premis/ (accessed: 25.05.2024).

5. Borozdina A.G. Analiz zarubezhnogo opyvta po vnedreniyu standartizirovanny'x sxem metadannyvx dokumentov [Analyzing the foreign experience in implementing standardized document metadata schemes]. Vestnik VNIIDAD = Herald of VNIIDAD. 2024;1:9б-107. (In Russian).

6. DIN EN 15907-2010. Film identification - Enhancing interoperability of metadata - Element sets and structures. filmstandards.org. URL: https://filmstandards.org/fsc/index.php/ EN_15907 (accessed: 25.05.2024).

7. GOSTR ISO 15489-1-2019. Sistema standartovpo informacii, bibliotechnomu i izdateVskomu delu. Informaciya i dokumentaciya. Upravlenie dokumentami. Chast* 1. Ponyatiya iprincipy* [System of standards on information, librarianship and publishing. Information and documentation. Records management. Part 1. Concepts and principles]. Federal Agency on Technical Regulating and Metrology. Moscow; 2019. 25 p. (In Russian).

S. GOST R ISO 23081-1-2008. Sistema standartov po informacii, bibliotechnomu i izdatel*skomu delu. Processy * upravleniya dokumentami. Metadanny*e dlya dokumentov. Chast* 1. Principy * [System of standards on information, librarianship and publishing. Records management processes. Metadata for records. Part 1. Principles]. Federal Agency on Technical Regulating and Metrology. Moscow; 2020. 24 p. (In Russian).

MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM lililí

ИНФОРМАЦИЯ ОБ АВТОРЕ

Ивановский Никита Иванович, старший научный сотрудник отдела документоведения Всероссийского научно-исследовательского института документоведения и архивного дела (ВНИИДАД), Москва, Российская Федерация.

MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM Ml мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм мм

INFORMATION ABOUT THE AUTHOR

Nikita I. Ivanovsky, senior researcher of the Department of Document Science of the All-Russian Scientific and Research Institute for Records and Archives Management (VNIIDAD), Moscow, Russian Federation.

MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM Ml MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM MM M

i Надоели баннеры? Вы всегда можете отключить рекламу.