ФОТОДОКУМЕНТ И СОВРЕМЕННЫЕ ТЕХНОЛОГИИ
УДК 930.25
П. А. Кюнг
Сохранение цифрового наследия: особенности работы архивов с электронными архивными документами
В рамках настоящей статьи предполагается проанализировать пути решения задачи сохранения электронных документов (ЭД) в архивах. Предваряя основной анализ, необходимо отметить, что сама задача сохранения документа исходит из его базовой функции «инструмента социальной организации» [1, с. 174]. Сохраняя документы, человечество тем самым сохраняет и следы своего социального существования. Но, управляя процессом сохранения документов, человечество управляет и видением своего прошлого. От взвешенности подходов, от качества формирования архивов зависит и качество формируемой исторической памяти. Вместе с тем на процесс сохранения документов влияет и технология их создания. Особенно это актуально сейчас, когда информация все больше и больше формируется в рамках цифрового представления. Характерным отражением современного значения цифры в человеческом преломлении стало создание цифровых произведений искусства. 11 марта 2021 г. аукционный дом Christie's впервые в своей истории продал как аукционный предмет искусства JPG-файл со склеенными вместе пятью тысячами картин художника Beeple, созданный с использованием технологии NFT [2]. Данная технология позволяет однозначно идентифицировать созданный файл, вне зависимости от его формата и содержимого, — присвоить ему уникальный идентификатор и сделать его цифровым активом. Поскольку создание цифровых объектов на базе NFT основывается на технологиях и платформах создания криптовалют, что обеспечивает им определенную уверенность использования.
Очень важно, что появление цифровых предметов искусства вначале сопровождалось мощнейшей волной интереса к ним, которая выразилась в резком удорожании, а это, в свою очередь, привело к их массовому созданию. Но очень быстро выявились серьезные проблемы с бытованием таких произведений, вызванные самой их природой. Данные проблемы правильнее рассмотреть на контрасте с аналоговыми предметами искусства. Картина, рукопись, архитектурный памятник существуют объективно, они непосредственно доступны наблюдающему их человеку. Можно говорить, что в аналоговом мире ключевую роль несет наблюдатель: от его восприимчивости, уровня его образования зависит адекватность восприятия предмета культурного наследия. Существуют они и без наблюдателя, поэтому давно, казалось, утраченная картина может быть найдена на чердаке, на блошином рынке и возвращена в мир высокой эстетики.
Но и в аналоговом мире мы знаем примеры, когда восприятия человека может быть недостаточно. Картина для полноценного раскрытия авторского замысла может требовать определенного освещения, определенного положения зрителя относительно линии изображения. Миниатюру возможно полноценно воспринять только при использовании увеличительного оборудования. Эти и подобные им исключения лишь демонстрируют общий характер аналогового мира — непосредственность взаимодействия.
Иное дело цифровой мир — человек не в состоянии непосредственно воспринимать цифровую информацию. Между ним и авторским замыслом находятся технологии кодирования информации, формирования видеоизображения на экране, работы матрицы экрана и многие другие. Каждая из указанных промежуточных технологий может внести свой вклад в получение итогового изображения. Кроме того, цифровые объекты эфемерны, поскольку достаточно легкого сбоя компьютерной программы, и, независимо от желания автора, они могут быть изменены. Но также легко они могут быть размножены, и тогда исчезает удовольствие от обладания единственным экземпляром, что во многом привлекает коллекционеров произведений искусства.
Возвращаясь к предметам искусства в формате ОТТ можно говорить об эпатажности указанного явления, но в нем вполне точно и объективно отразились те проблемы, которые уже не первый год волнуют специалистов, работающих над сохранением культурного наследия, — работников музеев и архивов. Проблемы настолько серьезные, что их необходимо обсуждать и находить решения, иначе мы рискуем уже в ближайшее время столкнуться с утратами. Речь идет о возможности утраты и наследия цифровой эпохи, и цифровых копий аналоговых объектов.
Само понятие «цифровое наследие» довольно давно вошло в профессиональный обиход [3]. 15 октября 2003 г. ООН приняло «Хартию о сохранении цифрового наследия». В ней говорится, что цифровое наследие «охватывает ресурсы, относящиеся к области культуры, образования, науки и управления, а также информацию технического, правового, медицинского и иного характера, которые создаются в цифровой форме либо переводятся в цифровой формат путем преобразования существующих ресурсов на аналоговых носителях» [4]. Вместе с тем пока нет возможности говорить о том, что методология хранения цифрового наследия полностью сложилась, т. к. существует
ряд проблем, условно разделяемых на две категории: техническую и понятийную. С технической точки зрения еще не до конца прояснен вопрос, что именно необходимо хранить. Связано это с природой цифрового объекта. В его основе находится определенным образом структурированный бинарный код, прочтение которого возможно лишь в искусственно созданной программно-аппаратной среде. Сама структура этого кода — результат деятельности коллективов программистов, решающих, как правило, утилитарные задачи. В результате мы можем наблюдать множество разнообразных форматов файлов, решающих схожие задачи, но отличающиеся и формой представления информации, и используемым для представления программным обеспечением. Соответственно, пригодность различных форматов видеофайлов к долговременному хранению будет неодинаковой. Отсюда возникает уже проблема понятийного плана: что трактовать в качестве оригинала документа — файл в исходном формате или файл, преобразованный в более приемлемый для долговременного (целенаправленно избегаю слова «постоянного») хранения?
Обе описанные проблемы предполагают целый блок проблемных точек, требующих осмысления и решения.
Важно отметить, что в разных прикладных областях они могут решаться различно, даже на терминологическом уровне. Так, в архивном деле используется термин «электронный документ» [5], как производная от «документ», а в музейном деле — одновременно «электронный документ» и «цифровой предмет» [6].
В данной статье не ставится задача сравнительного анализа архивного и музейного подхода к сохранению цифрового наследия. Поверхностное сравнение правил работы архивов и музеев показывают, что при общих подходах к обеспечению сохранности и защиты от изменений, первые в большей степени декларируют сохранение юридической значимости и аутентичности электронного документа [7, п. 2.32], вторые — долговременную воспроизводимость [6, п. 3.33]. Поэтому задача читаемости архивного документа в большей степени возлагается на его создателя [7, п. 2.31] — организацию, являющуюся источником комплектования государственного архива; для музейного цифрового предмета эталонной версией является файл или файлы, прошедшие процедуру нормализации (конвертации в формат длительного хранения, выбираемый самим музеем) [6, п. 33.9, 33.11].
В настоящее время электронные документы составляют около 0,1 % от всех документов, хранящихся в фондах федеральных государственных архивов Российской Федерации [8]. В 2019 г. 68 % регионов Российской Федерации уже имели примерно 0,02 % электронных документов в составе фондов государственных архивов (в основном это аудиовизуальные документы) [9].
В федеральных, государственных и муниципальных архивах накоплен также довольно большой объем электронных копий архивных документов (таблица).
Как мы видим, объемы электронных документов и электронных копий аналоговых документов в архивах представляют уже довольно существенные объемы. Но пока мы не можем говорить о том, что существует отработанная технология и методология хранения. С чем это связано?
Как правило, те файлы, которые учитываются в архивах в качестве электронных документов, представляют собой принятые на физически обособленных носителях аудиовизуальные документы и, редко, текстовые документы личного происхождения. Электронные копии аналоговых документов представлены чаще всего в
форматах pdf, tiff, jpeg. Есть ряд примеров приема целых массивов электронных копий аналоговых документов в качестве подлинников, например ГАРФ принял графические образы переписных листов Всероссийской переписи населения 2002 г. [10].
В своей работе с электронными документами государственные архивы используют положения Правил организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в государственных и муниципальных архивах, музеях и библиотеках, научных организациях, утв. Приказом Росархива от 2 марта 2020 г. № 24 (далее — Правила 2020). В них присутствует ряд положений, связанных с хранением электронных архивных документов. В основном нормы Правил касаются хранения физически обособленных носителей, положения о хранении в информационной системе даны без конкретизации. Принципиальным положением Правил является требование наличия в архиве технических и программных средств, позволяющих осуществлять воспроизведение, миграцию и конвертацию электронных документов, а также контролировать физическое и техническое состояние носителей.
Помимо электронных аудиовизуальных документов, в организациях образуется все больше и больше управленческих электронных документов с электронной подписью. Сейчас на уровне их создания уже существует обширная нормативная база, обеспечивающая им легитимность:
Федеральный закон от 06.04.2011 N 63-ФЗ «Об электронной подписи».
Правила обмена документами в электронном виде при организации информационного взаимодействия (утв. постановлением Правительства РФ от 25 декабря 2014 г. № 1494).
Порядок создания и проверки метки доверенного времени, утв. приказом Министерства цифрового развития, связи и массовых коммуникаций Российской Федерации от 6 ноября 2020 г. № 580.
Эти и многие другие акты определяют условия создания юридически значимых электронных документов.
В 2015 г. приказом Министерства культуры РФ от 31 марта 2015 г. № 526 утверждены Правила организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в органах государственной власти, органах местного самоуправления и организациях (далее — Правила 2015). В них были включены положения, ориентированные на прием электронных документов, созданных в рамках управленческой деятельности. Во многом положения этих Правил носили экспериментальный характер. В частности, в п. 2.30 обязательными условиями хранения электронных документов были установлены:
наличие в архиве организации не менее двух экземпляров каждой единицы хранения электронных документов (основной и рабочий экземпляры должны находиться на разных физических устройствах);
наличие технических и программных средств, предназначенных для воспроизведения, копирования, перезаписи электронных документов, контроля физического и технического состояния;
обеспечение режима хранения электронных документов, исключающего утрату, несанкционированную рассылку, уничтожение или искажение информации.
В названных правилах (п. 2.31) был установлен формат файлов текстовых электронных документов для передачи на хранение в архив организации, являющейся источником комплектования государственного и муниципального
Фотодокумент и современные технологии Электронные копии архивных документов в архивах Российской Федерации на 1 января 2022 г.
Архивы РФ Оцифровано единиц хранения
Всего В среднем на один архив Средний процент от общего кол-ва арх. документов
Федеральные 2 717 131 209 010 5,41 %
Государственные 4 208 306 50 098 2,82 %
Муниципальные 1 315 106 20 549 2,00 %
архива, — PDF/A. Это положение было развито в Правилах делопроизводства в государственных органах, органах местного самоуправления, утвержденных приказом Федерального архивного агентства от 22 мая 2019 г. № 71. Здесь в п. 7.13 установлено, что при подготовке электронных документов, отобранных к передаче в архив государственного органа, органа местного самоуправления, выполняются следующие процедуры:
преобразование текстовых электронных документов в формат архивного хранения PDF/A-1, если электронный документ был создан или включен в систему в ином формате;
формирование в информационной системе государственного органа, органа местного самоуправления контейнеров электронных документов, включающих: контент и метаданные электронного документа, файлы электронных подписей, визуализированную копию текстового электронного документа в формате PDF/A-1.
В 2021-2022 гг. ВНИИДАД в рамках плана НИОКР подготовил проекты новой редакции Правил 2015 и нового нормативного акта «Порядок приема электронных архивных документов на хранение в государственные, муниципальные архивы». В рамках работ был проведен анализ опыта зарубежных [11] и отечественных [12] архивов по хранению электронных документов. Изучение зарубежного опыта показало, что наибольшее распространение получила модель хранения, основанная на методологии стандарта ИСО 14721:2012 «Системы передачи космических данных и информации. Открытая архивная информационная система. Эталонная модель». Модель основана на передаче транспортного контейнера, представляющего собой ZIP-папку, содержащего ЭД с сопровождающими их метаданными, который после процедуры проверок преобразуется в архивный контейнер. При этом сами ЭД, включенные в пакет, абсолютно неизменны на всем протяжении времени их хранения, меняются лишь их метаданные. Ключевой позицией здесь является именно неизменность содержимого.
Международный и российский опыт показывает, что для гарантированного сохранения электронных документов, включая возможность подтверждения их подлинности и сохранения пригодности для использования на протяжении всего срока их хранения, необходимо использование информационной системы. В Российской Федерации было выявлено две базовые модели построения информационных систем для государственных учреждений по обороту и хранению электронных документов, развиваемые в различных регионах:
в организациях — источниках комплектования региона внедрено единое (типовое) решение системы электронного документооборота (СЭД) и единой системе хранения
электронных документов (СХЭД) организации, из которой может осуществляться передача электронных документов на постоянное хранение в государственную архивную информационную систему ИС;
в организациях — источниках комплектования внедрены различные СЭД, но есть единый (типовой) модуль СХЭД, из которой ЭД поступают в ИС государственного архива (региональную информационную архивную систему).
Но верифицированного российского опыта по долговременному хранению ЭД в информационной системе пока нет, т. к. во всех регионах, в которых начато внедрение подобных систем (Ленинградская область, Московская область и др.), прием электронных документов либо не начинался, либо носил экспериментальный характер. Исключение — прием обязательного экземпляра электронного аудиовизуального документа в информационную систему Государственного архива Республики Татарстан [13].
Разработка проектов вышеуказанных нормативных актов основывается на анализе всех аспектов работы с электронными документами в процессе комплектования архивов в нашей стране и за рубежом. В качестве основы используется модель по стандарту ИСО 14721:2012.
Предполагается прием сформированных в информационной системе организации транспортных контейнеров описей и электронных документов, включенных в описи, при этом мы отказываемся от традиционного для архивного дела формирования документов в более крупные блоки — дела, включая в опись отдельные ЭД с проведением учета каждого файла ЭД.
На основе транспортных контейнеров формируются архивные контейнеры электронных документов путем присвоения транспортным контейнерам соответствующего статуса и подписания архивных контейнеров электронной подписью архива.
В дальнейшем информационная система архива должна обеспечить контроль доступа к электронным документам, переподписание архивных контейнеров электронной подписью архива для сохранения подлинности. Предусматривается возможность формирования непосредственно в архиве транспортных контейнеров ЭД для загрузки в систему электронных архивных документов, созданных не в рамках информационных систем организаций: аудиовизуальных, научно-технических, личного происхождения.
При невозможности приема файлов электронных документов удобных для архивов форматов предусмотрена возможность приема ЭД в исходных (в том числе проприетарных) форматах. При этом государственный, муниципальный архив будет проводить:
исследование формата (техническую экспертизу); конвертацию ЭД и метаданных в формат хранения (если возможность конвертации установлена экспертизой).
Файлы ЭД в исходном формате должны быть помещены в один транспортный контейнер вместе с экземпляром ЭАД, созданным в результате преобразования, с целью сохранения возможности обращения к оригинальному файлу.
Также были разработаны таблицы метаданных ЭД и метаданных описания транспортного контейнера.
В настоящий момент ведется разработка информационной системы хранения электронных документов федерального уровня (ГИС «Платформа ЦХЭД») подведомственным учреждением Министерства цифрового развития Российской Федерации. Она будет состоять из двух модулей:
1. Платформа Центра хранения электронных документов для ГАРФ;
2. Типовое решение «Архив» для источников комплектования.
ГИС обеспечит процессы комплектования, хранения, учета и использования электронных архивных документов с сохранением их юридической значимости.
Важно понимать, что увеличение относительного и абсолютного объема электронных документов не означает отказа от создания документов на «традиционных носителях», а тем более от их хранения. Но развитие технологий оцифрования позволяет архивистам выводить оригиналы документов из пользовательского оборота с целью обеспечения сохранности и работать уже с цифровой копией.
Это открывает широкие возможности в том числе и для реставрации. Сейчас основная задача реставратора архивных документов — вернуть ему его эксплуатационные характеристики. При этом у нас нет ресурсов, чтобы обеспечить плановую реставрацию необходимых объемов.
На мой взгляд, развитие хранения архивных документов пойдет по пути максимальной консервации состояния носителя, его оцифровки, и дальнейшая работа по реставрации для обеспечения информационных потребностей пользователя будет проводится только с цифровым изображением.
Такой подход сейчас активно применяется для фото-и кинодокументов. Для печатных текстов это работа с угасающем текстом. Для фонодокументов оцифровка уже не имеет альтернативы, равно как и в некоторых случаях (газетная бумага 1917-1920-х гг., тексты, выполненные термопечатью 1980-1990-х гг.) для печатных.
Основная проблема: найти при проведении работ по оцифровке баланс между потребностями пользователей в информации и потребностями архивов в сохранении архивного документа как памятника культуры.
В частности, появляется вопрос: проводить однократную оцифровку с максимальным качеством или цифровать в качестве, достаточном для прочтения документа, а при необходимости печати копии высокого качества проводить повторную оцифровку?
В 2022 г. ВНИИДАД подготовил методические рекомендации «Электронный фонд пользования: создание, хранение, учет и использование»; в них мы постарались найти компромисс между потребностями в оцифровке и необходимостью обеспечения сохранности оригинала документа [14].
Хранение электронных документов поставит перед нами новые, пока неисследованные проблемы. В частности, ремонта, реставрации и консервации оптических
дисков, магнитной ленты, жестких дисков и т. п. Скорее всего, здесь мы придем к выводу о том, что в подавляющем большинстве случаев нет смысла восстанавливать их внешний вид. Речь должна идти о необходимом для прочтения ремонте с целью переноса информации.
Потребуется и развитие традиционных исторических дисциплин. К примеру, источниковедению предстоит развивать работу с электронными источниками [15; 16].
Таким образом, пока мы не можем говорить о начале хранения всех типов электронных документов. Основной хранимый в настоящее время массив — фото-, фоно- и видеофайлы на физически обособленных носителях. Это разительным образом отличается от основного массива аналоговых архивных документов, который составляют письменные, в основном делопроизводственные, материалы. Также среди электронных документов, хранящихся в государственных и муниципальных архивах, практически отсутствуют научно-технические документы.
Сейчас перед нами стоят проблемы, для которых мы должны выбрать вариант оптимального решения. Почему я использую именно такую формулировку? На мой взгляд, мы не можем гарантировать правильность нашего решения. При выборе мы будем основываться на некоторых базовых задачах, например обеспечения возможности использования документа без привлечения проприетарного программного обеспечения за счет конвертации файлов в открытые форматы. Такой подход на настоящий день представляется более правильным т. к. удовлетворяет финансовым возможностям архивов, а также защищает документы от возможной приостановки действия лицензии или отключения обновления программного обеспечения производителями по экономическим или политическим причинам. Но в то же время при возникновении, к примеру, судебного разбирательства может появиться вопрос к аутентичности файла: не было ли произведено при конвертации вмешательства в содержимое? Пока у нас нет практики по этом вопросу, поэтому все решения находятся в зоне вариативности.
Основные проблемы, на которые на сегодняшний день нет однозначного решения
Проблема форматов. Производители непрерывно изменяют форматы файлов, некоторые широко распространенные форматы прекращают развиваться и поддерживаться [17]. Помимо форматов файлов, могут меняться и исчезать системы записи [18]. Поэтому для архивистов важен ответ на вопрос: нужно ли хранить электронные документы в формате создания? Если мы понимаем, что не сможем прочитать через несколько лет формат и конвертируем его, то будет ли это тот же документ?
Проблема носителей. Носители электронных документов потенциально недолговечны. Хотя на рынке присутствуют системы долговременного хранения электронных документов, они весьма дорогостоящи, покупка их означает существенную зависимость от одного поставщика, а главное — документы создаются изначально на других носителях. Отсюда возникает вопрос: перенос информации с носителя на носитель — это изменение или нет? Причем если для файлов возможно копирование «один в один», то перенос видеоинформации с Digital Betacam на оптический носитель означает конвертацию видеопотока в файл.
Проблема интерпретации содержимого. Воспроизведение электронного документа зависит в том числе и от используемого программного обеспечения.
Фотодокумент и современные технологии
Именно поэтому в архивных и музейных правилах фигурирует необходимость наличия в архивах программных средств для воспроизведения электронных документов. Но практика показывает, что, по крайней мере для архивов, получать и поддерживать необходимые лицензии на программное обеспечение для работы с графическими, мультимедийными файлами, файлами, созданными в системах инженерного проектирования, сложно, и часто даже невозможно по экономическим причинам. Что делать, если содержимое отображается по-разному?
Решение этих вопросов является насущной задачей.
Литература
1. Двоеносова Г. А. Синергетическая теория документа: дис. ... д-ра ист. наук. М., 2017, С. 174.
2. Селезнев С. Что такое NFT и почему они приносят миллионы // РБК: [сайт]. URL: https://trends.rbc.ru/trends/indust ry/604f3fi39a794797b44b7a70 (дата обращения: 11.08.2023).
3. Шаповалова Г. М. Концепция цифрового культурного наследия и его генезис: теоретико-правовой анализ // Территория новых возможностей. Вестник Владивостокского государственного университета экономики и сервиса. 2017. Т. 9, № 4. С. 159-168.
4. Хартия о сохранении цифрового наследия // Организация объединенных наций: официальный сайт. URL: https:// www.un.org/ru/documents/decl_conv/conventions/digital_ heritage_charter.shtml (дата обращения: 06.08.2023).
5. ГОСТ Р 7.0.8.-2013 Система стандартов по информации, библиотечному и издательскому делу. Делопроизводство и архивное дело. Термины и определения.
6. Приказ Минкультуры России (Министерство культуры РФ) от 23 июля 2020 г. № 827 «Об утверждении Единых правил организации комплектования, учета, хранения и использования музейных предметов и музейных коллекций».
7. Приказ Министерства культуры РФ от 31 марта 2015 г. № 526 «Об утверждении Правил организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в органах государственной власти, органах местного самоуправления и организациях».
8. Презентация к материалам коллегии «Об итогах паспортизации федеральных архивов по состоянию на 01.01.2022». URL: https://archives.gov.ru/press/27-12-2022-kollegiya.shtml (дата обращения: 13.089.2023).
9. Информационно-методическое письмо «Об итогах паспортизации государственных и муниципальных архивов, государственных музеев и библиотек, научных организаций по состоянию на 01.01.2019 и качестве состав-
ления паспортов». URL: https://archives.gov.ru/af.shtml (дата обращения: 13.08.2023).
10. Олейников О. В. Комплектование Государственного архива Российской Федерации электронными документами // Отечественные архивы. 2021. № 1. С. 30-39.
11. Ильина К. Б. Организация передачи электронных архивных документов на постоянное хранение: зарубежный опыт // Вестник ВНИИДАД. 2022. № 3. С. 90-98.
12. Афанасьева Л. П. Организация комплектования государственных архивов электронными архивными документами: опыт российских регионов // Вестник ВНИИДАД. 2022. № 4. С. 21-31.
13. Обязательный экземпляр // Государственный архив Республики Татарстан: официальный сайт. URL: https://www. archives.tatar/about-providing/ (дата обращения: 17.08.2023).
14. Афанасьева Л. П., Нагорная М. Л. Организация работы по созданию электронного фонда пользования в государственных и муниципальных архивах // Вестник ВНИИДАД. 2022. № 3. С. 13-26.
15. Выступление Юмашевой Ю. Ю. Электронные цифровые документы — объект архивного хранения и источниковедения: нарастание проблемы при отсутствии решений // Программа международной научно-практической конференции «Технотронные архивы и документы в информационном обществе» (посвящается 85-летию заслуженного профессора РГГУ Владимира Марковича Магидова). URL: https://www.rsuh.ru/upload/iblock/bd8/ bd8d2d4986b7cc4ebffc7a628e3be506.docx (дата обращения: 14.08.2023).
16. Юмашева Ю. Ю. Машиночитаемые/электронные документы в контексте источниковедения и вспомогательных исторических наук // Историко-культурное наследие в институциональном измерении: материалы II Уральского историко-архивного форума, посвящ. 30-летию подготовки документоведов и 20-летию подготовки специалистов в сфере туризма и гостеприимства в Уральском федеральном университете. Екатеринбург: Изд-во Уральского ун-та, 2022. C. 377-382. URL: http://elar.urfu.ru/handle/10995/119709 (дата обращения: 11.08.2023).
17. Разработчики формата mp3 объявили о его «смерти» // Газета.ш: [сайт]. URL: https://www.gazeta.ru/ tech/2017/05/15/10674785/death_of_mp3.shtml (дата обращения: 11.08.2023).
18. Объявление об окончании срока службы видеокассет HDcam, HDCAM SR, цифровых видеокассета digital BETACAM и видеокассет DVCAM. 26.09.2022 // Компания SONY: официальный сайт. URL: https://pro.sony/ru_RU/press/ hdcam-hdcamsr-digitalbetacam-dvcam-stance (дата обращения: 14.08.2023).