Научная статья на тему 'Электронные копии документов архивного фонда РФ: источниковедческие проблемы'

Электронные копии документов архивного фонда РФ: источниковедческие проблемы Текст научной статьи по специальности «Право»

CC BY
2077
351
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДОКУМЕНТЫ АРХИВНОГО ФОНДА / ИСТОРИЧЕСКИЕ ИСТОЧНИКИ / ИСТОЧНИКОВЕДЕНИЕ / ЭЛЕКТРОННЫЕ КОПИИ / ОЦИФРОВКА / ARCHIVE FUND DOCUMENTS / HISTORICAL SOURCES / SOURCE STUDIES / ELECTRONIC COPIES / DIGITIZATION

Аннотация научной статьи по праву, автор научной работы — Юмашева Юлия Юрьевна

Статья посвящена вопросам представления документов Архивного фонда Российской Федерации исторических источников в электронной среде. Дается обзор международного опыта электронной публикации архивных материалов, а также впервые в отечественной историографии на примере наиболее крупных отечественных проектов, представляющих электронные копии архивных документов, проводится источниковедческий и археографический анализ публикуемых электронных копий, их описаний; выявляются типичные проблемы и намечаются пути их решения. Статья затрагивает вопросы источниковедения, архивоведения, музееведения, библиографии и информационных технологий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Electronic copies of the archives collections of the Russian Federation: source studies problems

The article analyses the submission of documents of the Archive Fund of the Russian Federation the historical sources in the electronic environment. A survey of the international experience of electronic publication of archival materials is given, and for the first time in the national historiography by the example of the largest domestic projects of electronic copies of archive documents is conducted an analysis of published archeografic electronic copies, of their descriptions. The author identifies common problems and outlines their solutions. The article deals with the issues of sources, archival, museum studies, bibliography, and information technology.

Текст научной работы на тему «Электронные копии документов архивного фонда РФ: источниковедческие проблемы»

ВЕСТН. МОСК. УН-ТА. СЕР. 8. ИСТОРИЯ. 2012. № 5

Ю.Ю. Юмашева

(кандидат ист. наук, сотрудник Археографической лаборатории исторического

факультета МГУ имени М.В. Ломоносова)*

ЭЛЕКТРОННЫЕ КОПИИ ДОКУМЕНТОВ АРХИВНОГО

ФОНДА РФ: ИСТОЧНИКОВЕДЧЕСКИЕ ПРОБЛЕМЫ

Статья посвящена вопросам представления документов Архивного фонда Российской Федерации — исторических источников — в электронной среде. Дается обзор международного опыта электронной публикации архивных материалов, а также впервые в отечественной историографии на примере наиболее крупных отечественных проектов, представляющих электронные копии архивных документов, проводится источниковедческий и археографический анализ публикуемых электронных копий, их описаний; выявляются типичные проблемы и намечаются пути их решения. Статья затрагивает вопросы источниковедения, архивоведения, музееведения, библиографии и информационных технологий.

Ключевые слова: документы Архивного фонда, исторические источники, источниковедение, электронные копии, оцифровка.

The article analyses the submission of documents of the Archive Fund of the Russian Federation — the historical sources — in the electronic environment. A survey of the international experience of electronic publication of archival materials is given, and for the first time in the national historiography by the example of the largest domestic projects of electronic copies of archive documents is conducted an analysis of published archeografic electronic copies, of their descriptions. The author identifies common problems and outlines their solutions. The article deals with the issues of sources, archival, museum studies, bibliography, and information technology.

Key words: Archive Fund documents, historical sources, source studies, electronic copies, digitization.

* * *

Бурное развитие и внедрение информационных технологий во все стороны деятельности человечества, начавшееся во второй половине XX в., в настоящий момент достигло очередной критической точки. В цифровой формат переводится максимально широкий круг традиционных источников информации (книг, архивных документов, фото-, фоно-, видео-, киноматериалов, а также других объектов историко-культурного наследия), а оригиналы изымаются из непосредственного обращения. Достаточно назвать цифры объемов перевода документов Архивного фонда России, зафиксированные в государственной программе «Информационное обще-

* Юмашева Юлия Юрьевна, тел.: (495) 697-37-47; e-mail: [email protected]

ство 2011—2020 гг.»1, а это не менее 50% от общего числа единиц хранения к 2020 г., или общественное движение по сбору подписей под петицией президенту США с призывом приступить к концентрации национальных усилий для оцифровки всей общественно значимой информации2.

К сожалению, при этом и пользователи, ратующие за самый широкий доступ к объектам культурного наследия в виде электронных копий, и фондодержатели, активно поддерживающие проекты оцифровки, упускают из вида существенный аспект, а именно — утрату копией части информации, присущей оригиналу исторического источника3. Для копий на микроносителях — это утрата цвета и физической сущности подлинника, для элек-

1 Распоряжение Правительства Российской Федерации от 20 октября 2010 г. № 1815-р «О государственной программе Российской Федерации "Информационное общество (2011—2020 годы)"» // «Российская газета». 2010. 16 ноября.

2 We the People // https://wwws.whitehouse.gov/petitions/ypetition/start-national-effort-digitize-all-public-government-info/15vthgV

В петиции администрации президента США предлагается создать группу или Федеральную комиссию по сканированию, которая в течение одного года должна ответить на шесть вопросов (в кратком изложении они выглядят следующим образом):

1. Каковы объемы историко-культурного наследия народа США? Каковы объемы общественно значимой информации администрации и всех национальных институциональных образований? Каково количество всех документов, изображений, видео и др. объектов?

2. Сколько времени потребуется, чтобы оцифровать все эти материалы?

3. Сколько это будет стоить с учетом современных технологий? Есть ли соответствующие исследования на данную тему, и будет ли экономия от масштабности, которая минимизирует расходы на оцифровку?

4. Какова стратегия для цифрового хранения всех этих материалов? Можно ли избежать цифрового устаревания?

5. Что должно войти в стратегию для выявления ограничений на использование материалов? Как определить и защитить информацию, охраняемую законом, содержащую персональные данные или секретные материалы?

6. Каковы экономические и неэкономические выгоды от усилий масштабной оцифровки?

(Подробнее см.: Yes We Scan // https://yeswescan.org/)

3 Вопрос о существе исторического источника носит методологический характер. В соответствии с традиционным определением «исторический источник» — это материальный объект, являющийся носителем исторической информации.

Однако в связи с появлением таких типов источников, как кино-, фото- и аудиоматериалы возникла проблема несоответствия между количеством самостоятельных обособленных исторических источников, содержащих историческую информацию, и количеством физически обособленных материальных объектов, на которых эти исторические источники представлены (т.е. одним из проявлений физической сущности источника). В конце XX в. эта проблема стала ассоциироваться с машиночитаемыми документами и специализированными носителями электронной информации.

В практике архивного учета для преодоления этого количественного несоответствия используются два термина: единица учета (для документа) и единица хранения (для носителя информации).

тронных копий (на первый взгляд) — «только» утрата физической сущности.

Однако не все так просто. Отношение к использованию копий исторических источников в исторических исследованиях (при наличии оригинала) всегда было неоднозначным. С одной стороны, традиционные методы источниковедческой критики уделяют существенное внимание анализу именно физической сущности источника (носитель информации, методы и материалы фиксации информации и т.п.), которая утрачена в копии. С другой стороны, с позиций учения об информации, копия является самостоятельным объектом, сочетающим в себе информацию оригинала (чаще всего выраженную в символьной форме) с физической формой копии. При этом процесс создания копии — это процесс создания нового исторического источника, аутентичного оригиналу лишь отчасти в семантическом (содержательном) плане и отличного в прагматическом (целевом) аспекте информации.

Исходя из вышесказанного, очевидно, что широкомасштабный переход к цифровым технологиям и «отказ» от работы с оригиналом требуют незамедлительного совершенствования методов источниковедческого анализа, поиска новых подходов и методик, адекватных сложившимся реалиям работы с электронными копиями исторических источников.

Первым шагом в этом направлении должно стать изучение процесса создания электронных копий исторических источников с точки зрения учения об информации, методов источниковедения и практической реализации работ.

Проблема создания качественных электронных копий чрезвычайно сложна и многогранна. Не вызывает сомнений тот факт, что она носит ярко выраженный междисциплинарный характер, а ее решение требует совместных усилий широкого круга специалистов, представляющих разные сферы науки и практической деятельности.

В качестве стартовой площадки для объединения усилий необходимо обозначить тему неразработанности терминологического аппарата, путаницу в дефинициях и в определении существа процессов создания электронных (цифровых) копий архивных документов (и шире — исторических источников любых типов и видов) и их последующего использования. С сожалением придется констатировать, с одной стороны, отсутствие (или противоречивость) нормативно-методических актов, национальных ГОСТов, вводящих единообразие в терминологию, описывающих и регулирующих технологические процессы, а с другой — значительное негативное влияние, оказываемое заимствованием англоязычной технической терминологии, повсеместным распространением неудачных переводов, транслитераций, иногда и «калек», с иноязычных терми-152

нов4. При этом стоит особо подчеркнуть, что за рубежом данная терминология также не является строго унифицированной, а при переносе на отечественную почву трактовки лексических значений заимствованных терминов различаются уже не только у разных авторов, но даже в рамках одного и того же официального документа.

Без выработки единого словаря терминов, одинаково понимаемых как гуманитариями, так и техническими специалистами, без проникновения в специфику работы каждой из вовлеченных в процесс сторон добиться качественного решения проблемы создания электронных копий исторических источников практически невозможно.

Приступая к осуществлению проектов оцифровки и анализу их результатов, необходимо ответить на ряд вопросов, без ответов на которые сложно, а подчас и бессмысленно начинать проведение каких-либо работ. Среди них можно назвать следующие:

Что и в какой последовательности сканируется?

Для чего сканируется?

Каковы требования для электронных копий различного назначения?

С помощью чего сканируется?

Каковы технические требования к оборудованию и персоналу?

Каковы требования к процессу сканирования?

Каковы требования к результирующему файлу (мастер-копии; копии второго и последующих поколений)?

Как обеспечивается аутентичность (адекватность)5 электронной копии оригиналу?

Как заверяется подлинность электронной копии и достоверность ее информации?

Как решаются проблемы авторского права в отношении электронной копии?

Как поступать, если внешний вид оригинала изменился?

Как и где хранятся электронные копии?

4 Например: 1) «digital heritage» (англ.) — термин, который в зависимости от контекста, при переводе на русский язык имеет двойное значение: а) культурное наследие, существующее только в цифровой форме («цифровое наследие»), б) переведенное в цифровой (электронный вид) «отсканированное» или «оцифрованное наследие», т.е. электронные копии исторических документов и артефактов;

2) «сканирование» от «scanning» (англ.) — пример транслитерации;

3) «оцифровка» от «digitalization» (англ.) — калька;

4) Наравне с двумя последними терминами в качестве синонимов часто употребляются также выражения: «создание электронных (цифровых) копий», «перевод в электронную (цифровую) форму».

5 Под аутентичностью (адекватностью) электронной копии оригиналу в данном случае подразумевается максимальное сохранение визуальной информации, присущей подлиннику.

Как обеспечивается информационная безопасность электронных копий?

Как учитываются электронные копии?

Как используются электронные копии?

Как ведется учет их использования?

Нетрудно заметить, что эти вопросы являются взаимосвязанными и их рассмотрение по отдельности не приведет к получению искомого результата, так как решение должно быть комплексным. Более того, это решение должно быть скоординированным, в его формировании должны принять участие все организации, которые хранят исторические источники, — объекты музейного, архивного и библиотечного фондов; осуществляют создание электронных копий, занимаются решением вопросов их дальнейшего использования, и сам пользователи.

К сожалению, крупнейшие российские держатели объектов историко-культурного наследия, которые должны решать данные проблемы, вырабатывая единую национальную методологию и методику оцифровки6, предпочитают действовать самостоятельно и разобщенно.

Этот подход не является эксклюзивно российским, он воспроизводится во многих странах. Однако в мировой практике осуществления проектов оцифровки объектов историко-культурного наследия существует и иной, более прогрессивный способ, предполагающий выработку и применение единых национальных (или международных) стандартов комплексной (т.е. междисциплинарной) организации проектов. Примером единых национальных подходов в области сканирования могут быть стандарты национальной концепции интероперабельности (Испания), размещенные в публичном доступе для общественного обсуждения7. Такое же

6 Приоритетами Подпрограммы 6. «Цифровой контент и культурное наследие» государственной программы Российской Федерации «Информационное общество 2011—2020 гг.» на период до 2015 г. являются: «создание национальной информационно-коммуникационной платформы для распространения цифрового контента; ...обеспечение распределенного доступа к различным отраслевым информационным ресурсам в сети Интернет, к данным о музейных предметах, коллекциях, к документам библиотечного фонда; создание национального библиотечного ресурса с унифицированным каталогом на базе оцифрованных фондов; оцифровка объектов культурного наследия, включая архивные фонды».

7 Cooperación entre administraciones para el impulse de la administración electrónica. Marco institucional de cooperacion en materis de administración electrónica // http:// noticias.juridicas.com/base_datos/Admin/l11-2007.t4.html

В комплексе технических стандартов интероперабельности рассматриваются конкретные вопросы, относящиеся к электронным делам и документам, к сканированию документов, их аутентичному копированию и преобразованию, к политике в области использования электронных подписей, моделям данных, управлению электронными документами, подключения к коммуникационным сетям испанских государственных органов, к моделям информационного обмена между реестрами и

публичное обсуждение Руководства по оцифровке документов (Managing digitisation programs and projects) проекта «Выдержать проверку временем» (Future Proof NSW, начало реализации — 2008 г.), проходит в Австралии (Управление государственных документов штата Новый Южный Уэльс, Австралия, NSW State Records)8.

На последнем документе хотелось бы остановиться особо, так как в нем в концентрированной форме выражены идеи комплексной организации и менеджмента проектов, т.е. всего того, что включается в понятие интероперабельности. В Руководстве, в частности, говорится: «Важно четко определить цели и охват проекта и тщательно отобрать документы. Планирование, методология управления проектами и разумные процедуры должны направлять процесс оцифровки, а персонал должен быть соответственно обучен для того, чтобы исполнять свои обязанности и воспринимать перемены. Должны быть приняты решения о том, проводить ли оцифровку своими силами или передать ее на аутсорсинг, о необходимом оборудовании и о критериях для выбора технических стандартов и метаданных, обеспечивающих пригодность графических образов для решения поставленных задач, а также сохранения ими основных характеристик документов. Должны быть определены и реализованы меры по обеспечению контроля качества оцифровки».

Перечисленные в Руководстве проблемы полностью совпадают с вынесенными в начало статьи вопросами, что еще раз подтверждает мысль о том, что они являются типовыми и для разных стран, и для разных фондодержателей (архивов, библиотек и музеев).

За рубежом координация усилий различных организаций по преодолению стоящих проблем осуществляется Международным советом архивов (МСА)9, который в программном документе «Стратегический курс на 2008—2018 гг.»10 обозначил основные направле-

декларациям о соответствии, решение которых необходимо для обеспечения практических и оперативных аспектов взаимодействия между государственными органами и гражданами. Эти технические стандарты будут разрабатываться и уточняться. Вместе с тем в официальном государственном бюллетене (Boletín Oficial del Estado, BOE, № 182, 30.07.2011 // URL: http://www.boe.es/boe/dias/2011/07/30/) опубликован ряд технических стандартов, среди которых особый интерес вызывают: Стандарт сканирования документов (Norma Técnica de Interoperabilidad de Digitalización de Documentos // http://www.boe.es/diario_boe/txt.php?id=BOE-A-2011-13168); Стандарт процедур аутентичного копирования и конверсии электронных документов (Norma Técnica de Interoperabilidad de Procedimientos de copiado auténtico y conversión entre documentos electrónicos // http://www.boe.es/diario_boe/txt.php?id=BOE-A-2011-13172).

8 State Records // http://www.records.nsw.gov.au/recordkeeping/government-record-keeping-manual/guidance/guidelines/managing-digitisation-programs-and-projects/in-troduction

9 International Council of Archives // http://www.ica.org/

10 ICA Strategic Direction 2008—2018 // http://www.ica.org/3667/reference-docu-ments/ica-strategic-direction-20082018.html

ния своей деятельности. Заметное место среди них отведено «поиску решений проблемы сохранения электронных документов и цифровых копий архивных документов, представляющих историческую ценность», а также «использованию новых технологий (электронных документов и цифровых копий архивных документов на других носителях информации) для улучшения доступа к архивам».

К сожалению, придется признать, что в Российский Федерации, как и на всем постсоветском пространстве, этот зарубежный опыт организации комплексных проектов создания электронных копий исторических источников остался практически не замеченным и не востребованным.

Единственным исключением из общего правила является попытка Федерального архивного агентства (Росархива) начать комплексное решение поставленных вопросов в рамках ведомственной программы информатизации Росархива и подведомственных ему учреждений на 2011—2020 гг.11

Первым шагом в реализации Программы стало тотальное обследование государственных архивов субъектов федерации и создание информационной базы, позволяющей анализировать и проводить мониторинг проектов оцифровки, осуществляемых на местах. База создана в конце 2011 г. Всероссийским институтом документоведения и архивного дела по заказу Росархива в рамках НИР на тему «Изучение опыта оцифровки (сканирования) документов Архивного фонда в архивных учреждениях Российской Федерации». Она обобщает опыт 93 государственных архивных учреждений субъектов федерации по переводу архивных фондов в цифровой вид и позволяет получить определенный срез информации, характеризующий общую ситуацию в вопросах создания электронных копий.

Полученные сведения и сделанные на их основе выводы находятся в фарватере общих тенденций, которые сложились как в отечественной, так и в зарубежной практике оцифровки фондов библиотек, музеев, архивов.

Последнее утверждение основано на анализе многочисленных проектов, осуществляемых различными зарубежными институциями, в том числе в рамках программы ЮНЕСКО «Память мира»12. Одним из направлений этой программы является проект «Память мира в цифровую эпоху: оцифровка и сохранение» («Memory of the

11 Программа информатизации Федерального архивного агентства и подведомственных ему учреждений на 2011—2020 гг. // http://archives.ru/programs/infor-matization.shtml

12 Memory of the World // http://www.unesco.org/new/en/communication-and-m-formation/flagship-project-activities/memory-of-the-world/homepage/

World in the Digital Age: Digitization and Preservation»)13, прямо нацеленный на формирование электронных копий архивных, музейных и библиотечных фондов и развитие нового тренда в мировой историографии, известного под названием Digital History14. Это направление предоставляет широкому пользователю возможность увидеть в режиме он-лайн электронные образы наиболее значимых исторических документов и артефактов, характеризующих конкретную историческую эпоху, событие, персоналию.

Зримым воплощением этой тенденции стали осуществляемые различными общественными, научными и учебными организациями стран Европы и Америки15 проекты по созданию тематических исторических порталов, представляющих базы данных с описанием архивных, библиотечных документов и музейных артефактов, а также электронных образов этих исторических источников.

Опыт реализации этих проектов стал для соответствующих государственных структур многих стран основой для понимания необходимости выработки единых правил, рекомендаций и стандартов, которые должны регулировать процессы создания и функционирования электронных ресурсов на основе оцифровки национальных исторических источников на всем протяжении их жизненного цикла: от момента постановки задачи создания электронной копии до периода обеспечения сохранности и поддержания актуальности данного ресурса (так называемого «сопровождения»)16.

13 Concept of Digital Heritage // http://www.unesco.org/new/en/communication-and-information/access-to-knowledge/preservation-of-documentary-heritage/digital-heritage/concept-of-digital-heritage/

14 Digital History. Using new technologies to enhance teaching and research // http:// www.digitalhistory.uh.edu/

15 Например: Einstein Archives Online (Hebrew University of Jerusalem // http:// www.alberteinstein.info/), Lincoln Archives Digital Project (США) (http://www.lincol-narchives.us/), общеевропейский портал «The International Communist Studies and Archive Internet Portal», проект Йельского университета (США) по оцифровке документов Сталина, проект «Архив Коминтерна» (VFA, Кобленц ФРГ). Федеральные архивы Российской Федерации (ГА РФ и РГАСПИ) вовлечены в реализацию двух последних проектов.

В Российской Федерации (РГАСПИ) осуществлен проект оцифровки документов интербригад Республиканской армии Испании (ф. 545) и представления этого электронного ресурса в сети интернет (http://interbrigades.inforost.org/)

16 К сожалению, надо признать, что данные проблемы по-прежнему остаются вне внимания создателей крупнейших международных проектов, представляющих в интернет культурное наследие человечества: Мировая цифровая библиотека (http://www.wdl.org/ru/background/) и Европеана. В последнем проекте даже в рамках начатого в 2010 г. подпроекта IMPACT (Improving Access to Text // http://www. impact-project.eu/about-the-project/concept), целью которого является преобразование в цифровую форму изданий европейского печатного наследия XV — середины XIX вв., упор делается не на изучение и стандартизацию технологий оцифровывания, обработки и хранения электронной информации, а на удобство ее представления и поиска в каталогах (индексации) и развитие систем оптического распознавания (OCR) с целью перевода средневековых текстов на современные языки для последующего анализа текста.

Сложность осуществления такого подхода, разработки, принятия и поддержания в актуальном состоянии нормативно-методических требований во многом связана с пониманием содержания каждого из этапов этих процессов и существа проблем, возникающих в ходе их реализации.

В качестве иллюстрации последней мысли вернемся к рассмотрению некоторых практических вопросов из списка проблем, связанных с организацией процесса создания электронных копий объектов историко-культурного наследия.

Первый вопрос о приоритетах в оцифровке: что и в какой последовательности сканируется?

Ответ на данный вопрос чрезвычайно актуален для всех организаций, хранящих как письменные, так и вещественные исторические источники. Тем не менее не будет преувеличением сказать, что большинство фондодержателей, активно занимающихся созданием электронных копий хранящихся у них артефактов и документов, не имеют перспективных планов перевода фондов в цифровой вид17.

Удивительно, но факт: даже Президентская библиотека им. Б.Н. Ельцина18, образованная в 2007 г. как «электронная библиотека», для наполнения фондов которой «создан уникальный центр оцифровки и обработки особо ценных старопечатных книг и рукописей, не имеющий аналогов в мире, управляемый специально разработанным программным комплексом», на своем сайте-портале не представляет ни перспективной программы, ни концепции комплектования своих фондов. Возможно, таковые программы имеются у организаций, являющихся «донорами» Президентской библиотеки?19 С уверенностью можно ответить, что и у них таких планов нет.

Первой институцией в Российской Федерации, которая обозначила задачу формирования перспективного поэтапного плана оцифровки с последующим его мониторингом, стало Федеральное архивное агентство. В рамках уже упомянутой Программы информатизации на 2012—2013 гг. предусматривается осуществление работ по определению приоритетов в оцифровке документов и созданию

17 Имеется в виду такой документ, как разработанный и представленный для всеобщего обсуждения НАРА (США) (http://www.archives.gov/comment/nara-digitizing-plan.pdf) «Перспективный план оцифровки архивных материалов для публичного доступа. 2007—2016 гг.» в рамках национального «Стратегического плана: сохранения прошлого для его представления в будущем» (http://www.archives.gov/ about/plans-reports/strategic-plan/)

18 Президентская библиотека им. Б.Н. Ельцина: http://www.prlib.ru/Pages/about. aspx

19 «Источниками комплектования Президентской библиотеки являются фонды Российского Государственного исторического архива, Государственного архива Российской Федерации, Российской государственной библиотеки, Российской национальной библиотеки и региональных библиотек нашей страны» (http://www. prlib.ru/Pages/about.aspx).

перспективного поэтапного плана сканирования документов Архивного фонда20. Очевидно, что Программа информатизации Ро-сархива будет реализовываться не только на федеральном уровне, но и на уровне архивных учреждений субъектов Российской Федерации, и, следовательно, набор перечисленных в ней мероприятий станет типовым для разработки и реализации региональных программ информатизации архивов21.

Но независимо от создания планов, процессы оцифровки уже идут, и в качестве приоритетов для определения последовательности обычно обозначаются:

оцифровка уникальных и особо ценных документов;

оцифровка наиболее востребованных документов;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

оцифровка ветхих документов (документов в плохом физическом состоянии);

оцифровка тематических коллекций (как правило, фотоколлекций, собраний метрических книг, ревизских сказок и т.п. — т.е. те-

20 Для сравнения: в Национальной программе сохранения библиотечных фондов Российской Федерации (Утверждена приказом министра культуры Российской Федерации от 13.09.2000. № 540) и в «Основных направлениях развития деятельности по сохранению библиотечных фондов в Российской Федерации на 2011—2020 годы», одобренных решением коллегии Минкультуры России от 29 ноября 2011 г. № 16 (http://www.mkrf.ru/upload/mkrf/mkdocs2012/09_02_2012_6.doc) ничего не говориться не только о формировании единого перспективного плана перевода библиотечных фондов в цифровой вид, но и о принципах и приоритетах отбора книжных памятников для формирования страхового фонда документов библиотек. (Справедливости ради необходимо сказать, что в п. 7 «Планирование работ по созданию страхового фонда документации» ГОСТ Р 33.505—2003. «Единый российский страховой фонд документации. Порядок создания страхового фонда документации, являющейся национальным научным, культурным и историческим наследием» отмечается, что «При планировании работы по созданию СФД Национального наследия первоочередному копированию подлежат Документы национального наследия, наиболее интенсивно используемые, со слабоконтрастными, трудно читаемыми текстами, содержащие цветные изображения, а также выполненные на нестойком или физически поврежденном носителе. Состав и очередность страхового копирования ДНН устанавливают научно-совещательные органы организаций—держателей оригиналов и утверждают руководители этих организаций» и оформляется в виде ежегодного плана в каждой организации—фондодержателе».)

Это направление (создание перспективного плана оцифровки) не нашло своего отражения и в утвержденной Постановлением Правительства № 186 «О федеральной целевой программе "Культура России (2012—2018 годы)"» (http://fcpkultura.ru/).

21 В некоторых субъектах Российской Федерации уже разработаны и приняты программы информатизации. См., например: Ведомственная целевая программа Комитета по управлению архивами Курганской области «Повышение информационного доступа к документам Архивного фонда Курганской области на 2012— 2016 годы» (http://www.archives.kurganobl.ru/assets/files/doc/2011/Rasporyazh.%20 Gov.%20K0%20Povysheniye%20informac.%20dostupa.pdf); Областная целевая программа «Сохранение и развитие архивного дела в Курской области на 2011—2015 годы» (http://adm.rkursk.ru/index.php?id=31&mat_id=10802), Долгосрочная целевая программа «Развитие информационного общества в Ленинградской области» на 2011—2013 годы (http://www.bestpravo.ru/leningradskaya/ea-pravila/q7v.htm).

матика генеалогии и «датная» тематика, приуроченная к определенной исторической дате).

Этот перечень приоритетов можно экстраполировать на опыт любых учреждений культуры, которые занимаются оцифровкой. Мотивация такого выбора понятна и очевидна: желание архивистов, библиотекарей, музейщиков сохранить оригинал путем его изъятия из непосредственного обращения в читальном зале не подвергается ни сомнению, ни осуждению.

Но при этом за скобками оказывается вопрос: а как себя будет чувствовать оригинал после проведения процедуры оцифрования (сканирования)? То есть вопрос о выборе сканирующего оборудования рассматривается не в связи с задачей работы с оригиналами объектов историко-культурного наследия, а совершенно отдельно.

К сожалению, серьезность проблемы выбора сканирующего оборудования с точки зрения его безопасности для оригинала ускользает от внимания многих участников проектов оцифровки. Тем не менее, ее актуальность находит все большее подтверждение в выступлениях специалистов разных стран на различных форумах22.

Эта тема обсуждалась в течение 2011 г. в рамках конференции в г. Королеве23, на ежегодной библиотечной конференции в г. Судаке24.

Более того, оценив масштаб проблемы, Федеральное архивное агентство в конце 2011 г. сумело силами НИИ репрографии (г. Тула) осуществить научно-исследовательскую работу для оцифровки фондов и распространить по архивным учреждениям страны специальную компьютерную программу и рекомендации по выбору сканирующего оборудования. Это программное обеспечение, построенное на применении метода анализа иерархий, должно хотя бы отчасти помочь в вопросах выбора сканеров25.

22 Вебер Х. Оцифровка как метод обеспечения сохранения? // Научные и технические библиотеки. 1998. № 10; Document Preservation and Publication: Microform vs. Digital. 3.12. 2010 // Ballard M. http://www.matthewrballard.com/Documents/Ballard_ Matthew_Literature_Review_505B.pdf; Коханова И.О. Оцифровка и микрофильмирование как средства сохранения документов // Вестник ХДАК. Вып. 29. 2010.

23 Международная научно-практическая конференция «Оценка и контроль качества сканирования бумажных документов». г. Королев, 19—20 апреля 2011 г.

24 Юмашева Ю.Ю. Создание электронных копий архивных документов: проблемы и возможные решения // Нормативно-технические и технологические аспекты создания электронных копий документов. Материалы Проблемного семинара и круглого стола в рамках 18-й международной конференции «Крым 2011». «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса». 4—12 июня 2011, г. Судак. М., 2011; Кащеев А.А. Воздействие сканирующего оборудования на бумажные первоисточники: мифы и реальность // Материалы проблемного семинара «Создание качественного цифрового документа — проблемы и решения» в рамках 19-й международной конференции «Крым 2012». «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса». 2—9 июня 2012, г. Судак.

25 Отчет Научно-исследовательского института репрографии (г. Тула) о выполнении научно-исследовательской работы (НИР) на тему: «Разработка методических

Справедливости ради следует сказать, что тема негативного воздействия сканеров на оригиналы далеко не исчерпана. Она должна быть изучена с привлечением специалистов многих областей, прежде всего реставраторов. Требует изучения влияние различных существующих и применяющихся моделей сканирующего оборудования на коллекциях эталонов носителей информации (папируса, пергамена, бумаги разных периодов) и писчих материалов с непременным использованием методик старения. Эта экспертная работа должна быть постоянной и налаженной, а через процедуру оценки применимости для работы с объектами культурного наследия должны проходить все модели оборудования, которые предполагается использовать для решения задач оцифровки.

На сегодняшний день без ответа остаются два ключевых вопроса: кто (какое ведомство) создаст рабочую группу, способную решать данные задачи? кто будет осуществлять финансирование этих работ? Еще раз подчеркнем, что решение этих задач входит в круг интересов всех структур, которые так или иначе работают в области оцифровки историко-культурного наследия.

При этом нелишне напомнить, что ответ на вопрос о сохранности подлинников исторических источников и продлении их существования во времени носит не узкопрофессиональный характер, а является мерилом состоятельности и ответственности всего научного сообщества независимо от того, к какому направлению (теоретическому или практическому) научного знания относится тот или иной его представитель.

Второй вопрос. Его следует формулировать, учитывая то, что задачи оцифровки объектов историко-культурного наследия стали всемирным трендом. Итак, вопрос звучит следующим образом: для чего (с какой целью) и для кого (кто является потребителем электронных копий) проводится оцифровка документов?

Вариантов ответа может быть много. Остановимся на самых очевидных. Поскольку электронные копии исторических источников на сегодняшний день не могут рассматриваться в качестве страхового фонда в силу отсутствия соответствующей нормативно-методической базы, следовательно, оцифровка ведется для формирования фонда пользования (в читальных залах, в режиме удаленного доступа).

Необходимо учитывать, что пользовательская аудитория разнообразна. В ней выделяются различные группы, которые предъявляют свои специфические требования к качеству электронных копий исторических источников.

рекомендаций по выбору сканирующего оборудования, способного удовлетворить потребности российских архивов» // http://archives.ru/documents/recomendacii-vybor-scan-oborudovanija-2011.shtml

Абстрагируемся на время от такой пользовательской группы, как интернет-сёрфингисты, для которых вопрос качества копии вообще не является приоритетным, или для тех, кого интересует только символьная составляющая информации, т.е. текст без детализации, внешнего оформления книги, документа, без истории создания, бытования и т.п.

Поговорим об исследователях, трактуя этот термин максимально широко, и причисляя к ним людей, занимающихся не только чистой наукой, но и преподаванием, обучением, просветительством.

Для этой пользовательской аудитории вопрос аутентичности (адекватности) электронной копии оригиналу исторического источника, ее репрезентативности, полноты, достоверности и юридической значимости (в отдельных случаях), т.е. всего того, что также должно быть отнесено к понятию «качества», выходит на первый план. Эти элементы источниковедческого анализа (которые в разных научных дисциплинах могут так не называться) являются обязательной частью любого исследования независимо от области науки.

Значение перечисленных характеристик становится особо критичным в связи с тем, что на практике пользователи работают не с электронными мастер-копиями, сделанными с оригиналов, а с копиями второго и последующих поколений (т.е. преобразованных и специально подготовленных для представления в читальных залах или в режиме удаленного доступа), которые и формируют фонд пользования. Технологическая линейка создания этих копий (в отличие от технологии микрофильмирования, применяемой для создания СФД26), во-первых, не имеет на сегодняшний день разработанных, принятых и действующих стандартов, а во-вторых, включает обязательную процедуру преобразования(ий) (графической обработки, изменения форматов, миграции, интеграции в другие программы и т.п.) электронной мастер-копии в нужный формат, вид и т.п., т.е. предполагает абсолютно не регламентированное вмешательство исполнителя(лей) в электронную мастер-копию или рабочую копию, сделанную с мастер-копии.

В результате жизненно важным является понимание комплексности понятия качества электронных копий и необходимости его (качества) обеспечения одновременно по многим параметрам, среди которых можно выделить:

— качество описания оригинала исторического источника и отдельного, самостоятельного описания его цифровой копии;

— качество сканирования (оцифровки);

— качество графической обработки электронной копии;

— качество хранения и использования электронной копии.

26 Стандарты группы ГОСТ Р 33.

Рассмотрим вопрос на примере письменных исторических источников — архивных документов, книжных памятников, обозначая типовые проблемы, возникающие в большинстве отечественных и зарубежных проектов оцифровки и представления библиотечных, архивных и музейных фондов.

При изучении электронной копии исторического источника, представленного в рамках того или иного ресурса, ключевым становится ответ на вопрос: что видит пользователь?

Чаще всего на экране компьютера представлено некое изображение, снабженное подписью. Создатели ресурса предлагают пользователю поверить, что это электронная копия с оригинала, хранящегося там-то и там-то. Никаких иных механизмов, подтверждающих справедливость этого утверждения, нет.

При более тщательном изучении электронной копии могут быть выявлены следующие типичные проблемы:

На уровне описания

1. Очевидно, что пользователь видит не мастер-копию, а копию второго и последующих поколений. Однако никакой информации об этом, как правило, нет. Не описаны и механизмы создания мастер-копии и ее преобразования для «пользовательского» представления.

2. Описание, сопровождающее электронную копию исторического источника, относится к оригиналу, а не к его электронной копии.

При этом описание оригинала часто производится не по принятым в исторической науке (в источниковедении, археографии и т.п.) или в архивном деле правилам27 описания экземпляра оригинала и не по правилам библиотечного учета28, а по библиографическим правилам29, предполагающим описание типов изданий с использованием стандартов коммуникативньх30 форматов (UNIMARC, RUSMARC, MARC21, EAD, ISAD (g)), или (что часто случается

27 Правила организации хранения, комплектования, учета и использования документов Архивного фонда Российской Федерации и других архивных документов в государственных и муниципальных архивах, музеях и библиотеках, организациях Российской академии наук (приказ Министерства культуры и массовых коммуникаций Российской Федерации от 18.01.2007).

Временный порядок автоматизированного государственного учета документов Архивного фонда Российской Федерации, хранящихся в государственных и муниципальных архивах (приказ Росархива № 64 от 23.10.2000).

28 Инструкция введена в действие Приказом МК от 2.12.1998 г. № 590.

29 ГОСТ 7.1—2003. Библиографическая запись. Библиографическое описание. Общие требования и правила составления.

30 Данные форматы предназначены для обмена библиографическими записями между пользовательскими каталогами крупнейших библиотек и не содержат научного (археографического) описания экземпляра документа.

с музейными предметами31) с использованием разнообразных форматов, основанных на Dublin Core32, что чрезвычайно затрудняет его поиск, соотнесение с другими историческими источниками и дальнейшее использование.

К сожалению, путь дополнения тематическими полями формата библиографического описания RUSMARC, опробованный почти десять лет назад для составления описания старопечатных изданий33 и снова примененный в 2012 г. Национальной службой развития системы форматов RUSMARC в отношении описания архивных документов, не снимает этих проблем, а лишь усугубляет их34, поскольку в описании, как правило, по-прежнему отсутствует значительное количество характеристик (физические размеры оригинала, состав и фактура листов в «сборных» книжных памятниках и т.п.), которые не позволяют проводить источниковедческий анализ представленного объекта в полном объеме.

Еще раз обращаем особое внимание на то, что отсутствует описание электронной копии, что делает невозможным источниковедческий анализ копии с целью установления ее адекватности оригиналу.

Причина отсутствия такого описания очевидна и кроется в проблеме определения набора метаданных (т.е. атрибутов), которые должны сопровождать и описывать именно электронную копию35, как самостоятельную информационную единицу и материальную сущность (и мастер-копию, и копии второго и последующих поколений по отдельности)36.

31 См., например: Lightweight Information Description Objects // http://lido-schema. org; Дремайлов А.В., Браккер Н.В. Разработка международного стандарта музейной документации как средство предотвращения нелегального оборота музейных ценностей // Музейная безопасность и методы реализации Конвенции ЮНЕСКО 1970 г. Материалы. Второй Международный семинар по актуальным вопросам обеспечения безопасности музейного фонда. 4—6 июня 2011 г. М., 2011.

32 The Dublin Core Metadata Initiative // http://dublincore.org/

33 Правила составления библиографического описания старопечатных изданий. Рос. гос. Библиотека / Сост. И.М. Полонская, Н.П. Черкашина (науч. ред.); общ. ред. Н.Н. Каспаровой. М., 2003.

34 Набор элементов данных для описания архивных материалов в формате RUSMARC // http://www.prlib.ru/Documents/contentproccessing/RUSMARCarch-Description.pdf

35 См., например: Metadata Encoding and Transmission Standard (METS) // http://www.loc.gov/standards/mets/

36 Проблема хранения, описания и учета всех «производных» электронных копий должна решаться на уровне применения специализированных систем, предназначенных для работы с медиа-контентом — DAM (Digital Asset Management).

DAM — системы управления медиа-контентом, которые реализуют все стандартные возможности систем управления документами (Document Management), оптимизированы для хранения и обработки медиа-документов (включая метаданные к ним, сохранение версий, протоколы создания версий и т.п.), предназначены

3. Электронная копия может быть изъята из системы, которая именуется архивное дело/опись/фонд с их непременным и обязательным НСА и указателями, и существовать вне исторического контекста. Но документ (в отличие от тиражной продукции) всегда включен как минимум в две системы: первая — это исторический процесс (документы создаются по поводу, в связи, т.е. имеют предшественников, последователей и т.п.), вторая — это система архивного хранения, в которой осуществлена определенная систематизация и оптимизация хранения, описания и представления архивных документов и которая (до определенной степени) моделирует исторический процесс в его документной основе, где разработан разветвленный научно-справочный аппарат — аннотации, исторические справки, указатели и т.п., позволяющий достаточно легко ориентироваться в этой вселенной информации.

Ситуация усугубляется, когда публикуется один документ вне дела. В этом случае в публикации полностью нарушены все связи с другими частями информационного комплекса.

4. Электронная копия исторического источника может быть сделана с другой технотронной копии (например, с копии на микроносителе), при этом пользователь об этом никак не предупрежден, т.к. в описании данного документа, приведенном в электронном каталоге, такая отметка отсутствует.

На уровне процесса создания электронной копии

(сканирования, оцифровки)

5. Еще одна проблема связана с неразработанностью общих методологических подходов к сканированию разновидовых исторических источников и касается вопроса полноты оцифровки. К примеру, электронная копия книги, архивного дела и т.п. воспроизводит не все страницы, имеющиеся в оригинале, что иногда легко установить даже на основе поверхностного анализа описания. Классическими примерами неполноты электронной копии архивного документа являются отсутствие изображений оборотной стороны документа, пустых страниц или страниц со «служебной информацией» (листа с заверительной записью, листа выдачи), публикация отдельных страниц, «вырванных» из книги (дела) и т.п.

6. Отдельного разговора заслуживает применяемая технология «поточного сканирования» — обработка однотипных массовых до-

для решения вопросов управления интеллектуальной собственностью, контроля доступа, распространения и передачи медиа-содержимого, поиска и доставки информации, поддержания различных медиаформатов. Системы ориентированы на эффективное хранение больших объемов информации.

В настоящий момент на рынке представлен достаточно широкий выбор предложений DAM-систем. Однако большинство из них ориентировано на применение в издательском деле и не известно тем, кто работает с электронными ресурсами.

кументов или тиражных изданий. Используемая в этом случае типовая настройка сканирующего оборудования и работа оператора, доведенная до автоматизма, приводят к полному игнорированию случайных особенностей оригинала, нивелируют изображение, «усредняя» его. Однако даже «массовые» документы и книжные издания имеют серьезные различия, обусловленные разнообразными причинами, главной из которых является «история бытования» конкретного экземпляра... К сожалению, при поточном сканировании велика опасность либо не заметить и утратить эту латентно присутствующую информацию, либо получить электронную копию крайне низкого качества и оказаться перед необходимостью осуществления рескана.

7. Серьезной проблемой является выбор технологии сканирования большеформатных объектов (карт, планов, книжных разворотов, изданий формата in folio и т.п.). К сожалению, отсутствие оборудования, соответствующего форматам оцифровываемых документов, не останавливает исполнителей. В результате, например, грамотная технология оцифровки книжных изданий «в разворот» заменяется постраничным сканированием с последующей компьютерной «сборкой», которая приводит к значительной утрате информации, о чем будет сказано ниже.

Еще катастрофичнее выглядят результаты по-фрагментной оцифровки оригиналов с последующей компьютерной «склейкой» («сти-кингом»37) большеформатного картографического и гравированного материала. Компьютерным специалистам, работающим с графическими изображениями, хорошо известно, что на сегодняшний день не существует технологии и программного обеспечения, которые позволяли бы без смещений и информационных утрат осуществлять такую «склейку» изображений.

8. Отдельного разговора заслуживает тема оцифровки «сложных» книг и документов, например: телетайпных и телеграфных лент, книг, выполненных азбукой Брайля, изданий, содержащих филиграни, экслибрисы и т.п. Перечисленные варианты документов, во-первых, являются не такими уж редкими, а во-вторых, требуют либо использования специализированных методов сканирования, либо подробного описания. Однако ознакомившись со значительным числом электронных копий подобных документов, представленных в электронных каталогах на сайтах авторитетных фондодержателей, можно утверждать, что ни первый, ни второй способ решения проблемы ими использован не был.

В перечень особенностей книг, архивных документов и музейных предметов, которые плохо преодолимы в процессе оцифровки,

37 От англ. stick — склеивать.

следует отнести толщину книжного переплета (корешка), «волну» на страницах при раскрытии книги, использование позолоты и серебрения в миниатюрах и в тиснении по коже, наличие навесных печатей с кустодиями, угасающие (просвечивающие) тексты, утраты текста, разноформатность документов, сшитых в одно архивное дело... Этот список может быть продолжен.

К сожалению, методы преодоления38 этих проблем крайне несовершенны и редко дают удовлетворительный результат, а иногда приводят и к ухудшению сохранности оригинала39.

9. Особую обеспокоенность вызывает прямая зависимость между выбором режима сканирования и утратой части информации документа. Речь идет о том, что при цветном режиме оцифровки многие нюансы, присущие документу (угасшие надписи, записи графитным карандашом, исправления в тексте, подчистки и т.п.), в электронной копии не могут быть воспроизведены. Они становятся заметными только при сканировании «под углом»40, что чрезвычайно трудоемко, или в режиме «оттенки серого»41, однако, этот режим не позволяет представлять цветную составляющую информации. Таким образом, чтобы иметь возможность получить максимальное представление о документе, его нужно отсканировать как минимум в двух режимах, т.е. дважды. Очевидно, что такой подход не способствует сохранности оригинала, является чрезвычайно дорогостоящим и на практике не применяется.

10. Существенной проблемой при оцифровке и последующем представлении исторических источников является «двумерность»

38 Книжные колыбели, прижимные стекла, программные средства исправления искажений, бликов и т.п.

39 В случае «расшивки» архивных дел для полистного сканирования документов.

40 Основной принцип, лежащий в основе действия сканирующих систем, — принцип отражения. Свет, идущий от источника освещения, расположенного в сканирующей головке сканера, попадает на оригинал в определенной точке. Отразившись от него, свет попадает на оптическую систему сканера. Она состоит из зеркал и объектива (призмы). Оптическая система фокусирует свет на фотопринимающем элементе, роль которого — преобразование интенсивности падающего света в электронный вид. Таким образом, работа сканера состоит в следующем: в результате преобразования света получается электрический сигнал, содержащий информацию об активности цвета в исходной точке сканируемого изображения. После оцифровки аналогового сигнала цифровой сигнал через аппаратный интерфейс сканера идет в компьютер, где его получает и анализирует программа для работы со сканером. После окончания одного такого цикла (освещение оригинала — получение сигнала — преобразование сигнала — получение его программой) источник света и приемник светового отражения перемещаются относительно оригинала.

41 К сожалению, мнение о том, что подобные детали документа могут быть выявлены при последующей графической обработке цветной электронной копии (например, при программном преобразовании ее в черно-белый режим и/или повышении контрастности), является заблуждением, не находящем подтверждение на практике.

электронного изображения, не позволяющая адекватно воспроизводить такие трехмерные объекты, как книги, фолианты, манускрипты, свернутые в свитки (рулоны, катушки, ролики и т.п.) документы. Представление документа в полностью развернутом («плоском») виде, отсутствие изображения книжного корешка, трех обрезов книги, застежек, невозможность увидеть сгибы документа, делящие информацию на логические фреймы, и т.п., значительно затрудняют его источниковедческий анализ.

Так же печальна участь конвертов, обложек, кофров и прочих видов исторической «упаковки» документов, которая, как правило, не становится объектом оцифровки в силу своей заурядности или, напротив, геометрической сложности и «недоступности» сканирующим системам. В результате утрачивается целостность информационного комплекса «документ — упаковка», а вместе с целостностью исчезает и значительный пласт информации.

Обоснованием всех этих вариантов неполноты представления документов в электронной среде зачастую являются весьма прозаические причины финансового характера, когда организации-фондодержатели (они же заказчики работ по оцифровке своих фондов) экономят средства на сканировании «пустых» страниц, или страниц с «незначимой» (?) информацией, не хотят отказываться от поточного метода оцифровки и применять другие виды оборудования для «нестандартных» объектов.

11. Следующая проблема носит технический характер. В рамках данной статьи уже говорилось о том, что в Российской Федерации отсутствуют нормативные документы по технологии оцифровки (сканирования) и наличествует плюрализм мнений в отношении применяемого оборудования, технических параметров и т.п. Крупнейшие организации страны, вовлеченные в процесс перевода своих ресурсов в цифровую форму, придерживаются разных технологических линеек или вовсе оставляют это вопрос за рамками публичного представления и обсуждения42 в отличие от своих зарубежных коллег43.

Но при этом и организации-фондодержатели, и компании, предоставляющие услуги по сканированию (оцифровке) документов, едины в выборе метода контроля качества электронной копии

42 Подробнее см.: Юмашева Ю.Ю. Создание электронных копий предметов культурного наследия: проблемы и возможные решения // Справочник руководителя организаций культуры. 2011. № 10.

43 Например, технические аспекты оцифровки программы Библиотеки Конгресса США: Technical Notes by Type of Material // http://memory.loc.gov/ammem/ dli2/html/document.html; Стандарты оцифровки Национального Музея Естественной Истории (Смитсоновский институт) // http://anthropology.si.edu/leopold/anthro/ imaging_standards.html

и применяют визуальный контроль44, забывая, что этот вид контроля может быть использован только при одновременном обеспечении множества условий, которые должны гарантировать объективность оценки. Первое место среди них занимает качество сканирующего и воспроизводящего оборудования (профессиональные сканеры, мониторы, видеокарты компьютеров), программное обеспечение, позволяющее контролировать качество цветопередачи и контрастность (калибровщики45). Второе место — профессионализм операторов и выработанные методики оценки.

Автоматизированный контроль качества электронных копий является наиболее объективным методом оценки46. По состоянию на 01.01.2012 г. в мире имелись только две методики, использующие программные средства (специализированное ПО) для оценки качества изображений. Они разработаны и применяются в Библиотеке Конгресса США47 и в Королевской библиотеке Нидерландов — Национальная программа сохранения «бумажного» культурного наследия — проект Метаморфоза48.

Вместе с тем существует и действует система стандартов на тест-объекты для сканирования черно-белых и цветных офисных документов (ISO 12653—1, ISO 29861), которые, не являясь программными средствами, позволяют оценить качество оцифровки современной документации, а при условии применения определенных математических моделей и процедур — качество сканирующего оборудования. Совмещение тест-объектов и математической модели в рамках

44 Цитата из стандартного Технического задания на оцифровку книжных собраний и архивных документов (zakupki.gov.ru): «Используемые технологии оцифровки и соответствующее программное обеспечение должны обеспечивать уровень качества создаваемых графических образов страниц документов не ниже (? — Ю.Ю.) качества исходного материала. Контроль качества графических образов осуществляется по его изображению на мониторе (? — Ю.Ю.). При визуальном контроле изображение на мониторе и исходный материал должны иметь сопоставимый уровень качества (? — Ю.Ю.). В случаях, когда графическое изображение на мониторе имеет качество, существенно более низкое, чем исходное, графическое изображение признается производственным браком».

45 Например, Adobe Gamma или Atrise Lutcurve.

46 См.: Гаврилин А., Завалишин П. Современное состояние проблемы оценки качества сканирования бумажных документов // Нормативно-технические и технологические аспекты создания электронных копий документов. Материалы проблемного семинара и круглого стола в рамках 18-й международной конференции «Крым 2011». «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса». 4—2 июня 2011, г. Судак. М., 2011.

47 ANSI/AIIM MS44-1988 R1993 «Руководящие указания для контроля качества сканеров изображений»

48 Metamorfoze. Preservation. Imaging. Guidelines // Metamorfoze. Nationaal Programma voor het Behoud van het Papieren Erfgoed. Koninklijke Bibliotheek en het Nationaal Archief van Nederland // www.metamorfoze.nl/sites/metamorfoze/files/bestanden/ richtlijnen/guidelinespijune07.pdf

осуществления научно-практической работы позволило сотрудникам НИИ репрографии (г. Тула) разработать и апробировать отечественную методику контроля качества цифровых копий документов, полученных сканированием, а также разработать специализированное программное обеспечение49 и подготовить проект соответствующего ГОСТа.

На уровне графической обработки и последующего представления

электронной копии в специальных программных оболочках

Проблемы, возникающие на этом уровне, наносят, пожалуй, самый ощутимый вред электронным копиям исторических источников и делают их совершенно непригодными для использования.

12. К примеру, в результате проведения графической обработки («обрезки в лист») электронная копия может выглядеть не так, как выглядит оригинал архивного документа, или вообще утратить часть информации (пагинацию или часть текста), что делает саму копию просто неадекватной.

13. Электронная копия может быть помещена в программную оболочку, которая вносит путаницу в нумерацию листов/страниц, т.к. автоматически нумерует все, начиная с обложки, и искажает внешний вид книги, архивного дела50.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

14. Программная оболочка может автоматически «собирать» отсканированные по отдельности электронные копии большефор-матных страниц книги или дела, формируя из них копию «подлинника». В этом случае полностью утрачивается информация об оригинальном переплете и способах крепления страниц, что подчас делает невозможным датировку книги.

15. Электронная копия может быть отретуширована, однако информация о том, что конкретно было исправлено, отсутствует, поскольку, как известно, наиболее часто используемая программа для работы с растровыми изображениями Adobe PhotoShop не хранит протоколы работы с изображением после того, как изображение сохранено в форматах jpeg, tiff и т.п.

49 Клещарь С.Н. Методика «Контроль качества цифровых копий документов, полученных их сканированием». Программа автоматизации основных процессов контроля качества процесса сканирования // ГПНТБ России. Круглый стол «Создание качественных электронных ресурсов в библиотеках, архивах, музеях и других государственных организациях». 21 февраля 2012 г. // http://www.gpntb.ru/ general/index.php?option=com_content&task=view&id=1695&Itemid=177

50 К сожалению, многие библиотеки и архивы предпочитают использовать широко распространенные и разрекламированные программные оболочки (например: InfoLib (http://www.infocom.co.jp/das/index-e.html); DigiBib4 (http://www.versand-as. de/shop/Software-DigiBib-mehr/Digitale-Bibliothek---22_24.html; T-libra (http://www. tlibra.ru) и др.), не обращая внимания и не оценивая критически их функционал и потенциал в вопросах доработки с целью представления не стандартных книг, а изданий (или архивных дел) с более сложной внутренней структурой.

И это при том, что электронные копии могут рассматриваться как факсимильное или фото-воспроизведение исторического источника, а их представление в читальных залах и в сети интернет является формой публикации. В этом случае, по действующим «Правилам издания исторических документов в СССР»51, в сопроводительных материалах к каждому из публикуемых документов (электронной копии №-ного поколения) должно быть указано, какие работы по ретушированию (графической обработке) проводились, что и как корректировалось, а у публикатора (фондодержателя) должна храниться мастер-копия (и желательно) с метаданными, описывающими процедуру ее создания.

В связи с темой ретуши (графической обработки) необходимо напомнить, что любое не регламентированное и не стандартизированное вмешательство в содержание электронной копии может рассматриваться как ее творческая переработка, а результат такого вмешательства является объектом авторского права сотрудника, который проводил графическую обработку. При этом сама преобразованная копия становится самостоятельным продуктом, отдельной материальной сущностью, иначе говоря, — результатом интеллектуальной деятельности, в отношении которой возникает масса вопросов.

Этот аспект приобретает совершенно иное звучание в связи с анализом действующего законодательства, в частности, IV части Гражданского кодекса (ст. 1259. Объекты авторских прав: п. 1. «аудиовизуальные произведения; фотографические произведения и произведения, полученные способами, аналогичными фотографии»; п. 2. «К объектам авторских прав относятся: 1) производные произведения, то есть произведения, представляющие собой переработку другого произведения»; и ст. 1295. Служебное произведение).

Учитывая вышесказанное, необходимо поставить вопрос: так что же в результате графической обработки электронной копии видит пользователь на экране?

16. Электронная копия может быть оцифрована в режиме, не передающем цветность, или из благих побуждений (в целях повышения читабельности) — преобразована в такой режим. Близкий

51 2-е изд., переработанное и дополненное. М., 1990. [Главное архивное управление при СМ СССР], п.150: «Устранение неисправностей изображения кинофотодокументов. Для улучшения качества изображения кинофотодокументов в полиграфии применяется ретуширование различными механическими и фотохимическими способами. Вопрос о сохранении или устранении дефектов кинофотодокументов решается с учетом целей и задач издания и характера публикуемых документов. Так, в научных изданиях публикация кинокадров и фотоснимков должна полностью сохранять все имеющиеся внешние особенности носителя (трещины, царапины, пятна и др.), необходимые для восприятия и анализа документов». См. также п. 232.

данной проблеме вариант мы уже рассматривали в п. 9. Здесь лишь необходимо подчеркнуть, что выбор только одного режима оцифровки ведет к серьезным потерям информации, а сознательное преобразование электронной копии в каких-либо целях без сохранения мастер-копии категорически недопустимо.

В качестве примера оптимального варианта представления электронных копий одного и того же документа с точки зрения качества, полноты и аутентичности оригиналу, можно привести электронные копии «Декларации независимости», опубликованные на двух контекстно связанных сайтах NARA и библиотеки Конгресса США52. Здесь представлена цветная копия лицевой стороны документа, ее переконтращенная копия, «поднимающая текст» для читабельности, и оборотная сторона документа. В «комплект» публикации включен также распознанный машиночитаемый текст «Декларации», переведенный на современный англо-американский язык.

17. Представленная электронная копия является копией №-ного поколения, которая в результате многочисленных миграций и обработок утратила так много информации, что стала просто непригодна для использования, или она специально преобразована для интернет-представления таким образом (уменьшение разрешения, размера электронной копии, формата сжатия и т.п.), что не может рассматриваться в качестве адекватной копии даже самого что ни на есть ознакомительного характера.

18. Отдельной проблемой является поиск ответа на вопрос, что должно происходить с электронной копией объекта культурного наследия, если сам объект уже после оцифровки и публикации изменил свой внешний вид (например, был отреставрирован).

19. Наконец, особо следует выделить проблему предоставления электронных копий в рамках выполнения заказов. Что получает пользователь, оформивший заказ? Ту же копию, что размещена на сайте (в читальном зале), но с чуть лучшим разрешением и сохраненную в формате tiff? Кто подтвердит подлинность предоставленной копии, ее соответствие оригиналу? Кто и каким образом даст гарантии, что при графической обработке этого изображения в него не были внесены исправления, изменения, влияющие на документ?

Ситуация с предоставлением копий усугубляется в связи с теми существенными изменениями, которые внес в Федеральный закон от 22.10.2004 г. № 125 «Об архивном деле в Российской Федерации» Федеральный закон № 227 от 27.07.2010 г. Изменения, в частности, касаются ст. 24 «Доступ к архивным документам» и ст. 26

52 Declaration of Independence // The Charters of Freedom // http://www.archives. gov/exhibits/charters/declaration.html#more

«Использование архивных документов», в которых теперь присутствует формулировка о предоставлении копий документов, в том числе в форме электронных документов53.

На сегодняшний день общий вывод печальный: электронные копии исторических источников из средства, предназначенного для верификации информации, в том числе знаний об историческом прошлом, путем ее открытой публикации и широкого доступа, превратились в нечто, которое многие уже сравнивают с трудами печально знаменитого Министерства правды из романа Дж. Оруэлла.

Более того, для профессиональных историков работа с электронной копией (особенно представленной в интернете) вместо оригинала ведет, с одной стороны, к сокращению «географического расстояния» до архива, хранящего документ, а с другой — к увеличению числа исследовательских процедур, так как необходимо провести источниковедческое изучение и анализ оригинала, а затем — технологически и технически более сложный источниковедческий анализ электронной копии (в частности, установить степень ее аутентичности подлиннику), и только после этого приблизиться к решению исторически содержательной проблемы...

На уровне хранения и использования электронной копии

20. И последнее — как хранятся мастер-копии и производные от них копии следующих поколений? В чем (в каких форматах) и на чем? (на дисках? серверах? ленточных электронных библиотеках?) Кто и как учитывает их использование?

Вообще проблема хранения и сохранности электронного контента заслуживает отдельного подробного разговора. Обеспечение электронной сохранности отличается тем, что, в отличие от «краткосрочной и одноразовой» (в идеале) процедуры сканирования, предполагает активное управление процессом хранения во времени и влияет на «пользовательские» качества электронной копии. Поэтому на обеспечение сохранности электронной информации следует смотреть как на «долгосрочное обязательство», с которым связан обширный круг вопросов: к примеру, необходимо учитывать такие факторы, как технологический прогресс, «электронная коррозия», вопросы хранения и обеспечения целостности данных и даже — жизнеспособность используемой модели финансирования и получения экономической отдачи. Связанные с этим проблемы,

53 Согласно ГОСТ Р ИСО 15489-1-2007 «Управление документами. Общие требования», электронные документы должны иметь ЭЦП и «содержать или постоянно быть связанными с метаданными, отражающими операции, совершаемые с документами в процессе деловой деятельности», т.е. могут существовать только в специализированных системах, являющихся гарантом их целостности, достоверности и аутентичности.

наряду с быстро нарастающими объемами электронного контента, делают электронную сохранность постоянно ускользающей целью.

Как ни парадоксально, но принятие грамотных решений в процессе оцифровки (сканирования) может привести к упрощению и улучшению деятельности и по обеспечению сохранности. Решение на этапе сканирования таких вопросов, как выбор формата файлов и создание необходимых метаданных, может значительно повысить шансы на успешное решение задачи сохранения электронных материалов. То есть, приступая к процессу оцифровки объектов историко-культурного наследия, надо постоянно помнить о следующих этапах, в числе которых не последнее по важности место занимает обеспечение сохранности цифрового контента, и планировать реализацию всех процессов таким образом, чтобы первый шаг (сканирование) поддерживал каждый последующий вплоть до последнего — сохранения.

Однако тема технотронной безопасности электронного контента бледнеет перед проблемой обеспечения его защиты от несанкционированного доступа.

Понятно, что все проблемы, о которых говорилось выше, являются следствием отсутствия регламентов, методических рекомендаций, инструкций и т.п., т.е. той самой комплексной нормативно-методической базы, определяемой термином «интероперабельность», без наличия и применения которой усилия по оцифровке становятся просто бессмысленными. Этот корпус документов должен носить как минимум национальный характер и быть руководством к действию для любых организаций, занимающихся оцифровкой историко-культурного наследия.

Резюмируем: проблема оценки качества электронных копий является, во-первых, комплексной, во-вторых, она носит и методологический, и практический характер. Поэтому существует настоятельная необходимость координации усилий многих структур, организаций, специалистов, которая должна завершиться выработкой корпуса национальных стандартов — нормативно-методической базы — по всему комплексу проблем, относящихся к созданию, описанию, хранению и представлению электронных копий исторических источников — объектов историко-культурного наследия.

В этой работе активное участие должны принять и самые заинтересованные люди — потребители оцифрованной информации — историки, источниковеды, археографы, поскольку от их обоснованной и профессиональной позиции во многом зависит судьба историко-культурного наследия и пути дальнейшего развития исторической науки.

Список литературы

1. Вебер Х. Оцифровка как метод обеспечения сохранения? // Научные и технические библиотеки. 1998. № 10.

2. Гаврилин А., Завалишин П. Современное состояние проблемы оценки качества сканирования бумажных документов // Нормативно-технические и технологические аспекты создания электронных копий документов. Материалы проблемного семинара и круглого стола в рамках 18-й Международной конференции «Крым 2011». «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса». 4—12 июня 2011, г. Судак. М., 2011.

3. Дремайлов А.В., Браккер Н.В. Разработка международного стандарта музейной документации как средство предотвращения нелегального оборота музейных ценностей // Музейная безопасность и методы реализации Конвенции ЮНЕСКО 1970 г. Материалы. Второй Международный семинар по актуальным вопросам обеспечения безопасности музейного фонда. 4—6 июня 2011 г. М., 2011.

4. Кащеев А.А. Воздействие сканирующего оборудования на бумажные первоисточники: мифы и реальность // Материалы проблемного семинара «Создание качественного цифрового документа — проблемы и решения» в рамках 19-й Международной конференции «Крым 2012». «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса». 2—9 июня 2012, г. Судак.

5. Клещарь С.Н. Методика «Контроль качества цифровых копий документов, полученных их сканированием». Программа автоматизации основных процессов контроля качества процесса сканирования // ГПНТБ России. Круглый стол «Создание качественных электронных ресурсов в библиотеках, архивах, музеях и других государственных организациях». 21 февраля 2012 г. // ЬИр://№№^рп1Ь.ги^епега1/тёех.рЬр?ор1:юп=сот_соп1еп1& task=view&id=1695&Itemid

6. Коханова И.О. Оцифровка и микрофильмирование как средства сохранения документов // Вестник ХДАК. Вып. 29. 2010.

7. Юмашева Ю.Ю. Создание электронных копий архивных документов: проблемы и возможные решения // Нормативно-технические и технологические аспекты создания электронных копий документов. Материалы проблемного семинара и круглого стола в рамках 18-й Международной конференции «Крым 2011». М., 2011.

8. Юмашева Ю.Ю. Создание электронных копий предметов культурного наследия: проблемы и возможные решения // Справочник руководителя организаций культуры. 2011. № 10.

i Надоели баннеры? Вы всегда можете отключить рекламу.