Научная статья на тему 'Проблемы электронной археографии'

Проблемы электронной археографии Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1191
283
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭЛЕКТРОННАЯ АРХЕОГРАФИЯ / ЭЛЕКТРОННЫЕ КОПИИ АРХИВНЫХ ДОКУМЕНТОВ / ПУБЛИКАЦИЯ ЭЛЕКТРОННЫХ КОПИЙ В ЦИФРОВОЙ СРЕДЕ / ОПИСАНИЕ ЭЛЕКТРОННОЙ КОПИИ / ELECTRONIC ARCHIVES / ELECTRONIC COPIES OF ARCHIVAL DOCUMENTS / PUBLICATION OF ELECTRONIC COPIES IN DIGITAL ENVIRONMENT / DESCRIPTION OF ELECTRONIC COPIES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Юмашева Юлия Юрьевна

В статье анализируется историография создания нового современного направления археографии в электронной среде. Рассматриваются основные проблемы публикации электронных копий архивных документов в цифровом пространстве; формулируются требования полноты, репрезентативности и адекватности подобных публикаций для использования их в исторических исследованиях в режиме удаленного доступа в качестве замены подлинникам.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Problems of electronic archeography

The article analyzes the historiography of creating a new modern direction archeography in the electronic environment. The main problems of the publication of electronic copies of archival documents in the digital space are considered; the requirements of completeness, representativeness and adequacy of similar publications are formulated to be used in historical studies in the mode of remote access as a substitute for originals.

Текст научной работы на тему «Проблемы электронной археографии»

ВЕСТН. МОСК. УН-ТА. СЕР. 8. ИСТОРИЯ. 2017. № 4

Ю.Ю. Юмашева

(доктор ист. наук, заместитель директора Всероссийского научно-исследовательского института документоведения и архивного дела)*

ПРОБЛЕМЫ ЭЛЕКТРОННОЙ АРХЕОГРАФИИ

В статье анализируется историография создания нового современного направления — археографии в электронной среде. Рассматриваются основные проблемы публикации электронных копий архивных документов в цифровом пространстве; формулируются требования полноты, репрезентативности и адекватности подобных публикаций для использования их в исторических исследованиях в режиме удаленного доступа в качестве замены подлинникам.

Ключевые слова: электронная археография, электронные копии архивных документов, публикация электронных копий в цифровой среде, описание электронной копии.

The article analyzes the historiography of creating a new modern direction — archeography in the electronic environment. The main problems of the publication of electronic copies of archival documents in the digital space are considered; the requirements of completeness, representativeness and adequacy of similar publications are formulated to be used in historical studies in the mode of remote access as a substitute for originals.

Key words: electronic archives, electronic copies of archival documents, publication of electronic copies in digital environment, description of electronic copies.

* * *

Активно ведущиеся процессы оцифровки, представления исторических источников в электронной среде в форме виртуальных выставок или публикаций копий документов1, поддержанные настойчивыми желаниями правительственных структур интегрироваться таким образом в глобальное информационное пространство, архивов — изъять из непосредственного обращения подлинники и тем самым обеспечить их сохранность, а пользователей — получить самый широкий и (по возможности) удаленный доступ к подлинникам в виде электронных копий, сопровождаются массой проблем не только нормативно-методического, но и технологического, правового, источниковедческого и археографического характера.

* Юмашева Юлия Юрьевна, тел. 8-916-688-34-01; e-mail: Juliayu@yandex.ru

1 Журавлева Р.А. Электронные издания, подготовленные на основе архивных документов, — инновационное направление в работе архивистов Чувашии // Вестник архивиста. 2005. № 5-6, С. 453-456.

К сожалению, большая часть этих проблем до сего момента не осознана и не сформулирована в качестве тем научных исследований, а, следовательно, не выработаны единые подходы к публикации электронных копий, что может стать причиной создания и накопления некачественных информационных ресурсов, невостребованных пользовательской аудиторией.

Еще в 1995 г. С. Каннингхэм в статье «Электронные издания сегодня и завтра»2 отмечал, что человечество «стоит у истоков целого направления, которое потребует и от авторов, и от пользователей, все большего профессионализма».

Действительно, научная публикация электронных копий архивных документов (археография3), обладающая характеристиками, необходимыми и достаточными для полноценной презентации архивного документа («замены» подлинника) в электронной среде и выполнения функций исторического источника, представленного в режиме удаленного доступа, на основе которого возможно проведение конкретно-исторических, филологических, лингвистических и иных гуманитарных исследований, должна удовлетворять строгим условиям, которые, к сожалению, еще не определены4.

В настоящее время наиболее распространенным является мнение, что для представления архивного документа (исторического источника) в электронной среде вполне достаточно представить его электронную копию, сопроводив ее краткой информацией о самом источнике5. Этот подход позволяет сравнительно быстро удовлетворить пользовательский интерес, поскольку создание электронных копий поставлено на поток, а описание не выходит за рамки стандартизованного и уже введенного в информационные системы.

Однако апологеты подобного подхода упускают из вида несколько серьезных проблем, связанных как со спецификой электронных копий, так и с особенностями описания6.

2 Каннингхэм С. Электронные издания сегодня и завтра // Открытые системы. URL: http://www.osp.ru/os/1995/05/178734/

3 Теория и методология исторической науки. Терминологический словарь / Отв. ред. А.О. Чубарьян. [М.], 2014. С. 22-24.

4 Kennet M.P. Edition, Project, Database, Archive, Thematic Research Collection: What's in a Name? [Электронный ресурс] // Digital Humanities Quarterly. 2009. Vl. 3. Num. 3. URL: http://digitalhumanities.org/dhq/vol/3/3/000053/000053.html

5 Крайнева И.А. Архивные ИС — инструмент актуализации исторической идентичности и реконструкции биографического нарратива // Материалы XV Международной конференции Ассоциации «История и Компьютер». «Исторические исследования в цифровую эпоху: информационные ресурсы, методы, технологии». Москва—Звенигород 7—9 октября 2016 г. Инф. бюлл. Ассоциации «История и Компьютер». № 45. Октябрь 2016. С. 212—213.

6 Впервые данные проблемы были подняты в выступлениях участников конференции «Археография в XXI в.: люди, идеи, публикации». 21—22 октября 2014 г.

Первая группа проблем носит технологический характер. Ключевой среди них является определенная «незамкнутость» процесса создания электронных копий, позволяющая на любом этапе технологического цикла и представления копии внести в нее изменения, которые практически невозможно обнаружить без доступа к оригиналу. В этой связи особо остро встает проблема аутентичности электронной копии подлиннику.

Проблема является чрезвычайно острой, поскольку электронные копии зачастую позиционируются как факсимильное или фото- воспроизведение исторического источника, а их представление в компьютерных системах читальных залов и в удаленном доступе в сети Интернет приравнивается к научной публикации, которая должна заменить работу с подлинником.

В середине — конце XX в. проблема аутентичности применительно к традиционным (полиграфическим) формам публикации решалась разработанными и обязательными к исполнению «Правилами издания исторических документов в СССР»7. Последний, действующий до настоящего времени, подобный нормативный документ был введен в действие в 1990 г.8 В нем, в частности, предусматривалось в сопроводительных материалах к каждому из публикуемых документов указывать, какие работы по ретушированию проводились, что и как корректировалось, а у публикатора (архива) должна была храниться исходная (не ретушированная) копия с информацией о том, что и как в ней редактировалось. Представляется, что аналогичную процедуру следовало бы ввести и по отношению к процессу создания электронной копии во всех ее видах (первая — мастер-копия и производные от нее копии следующих поколений).

РГГУ. URL: https://vk.com/rgaspi?w=wall-35550076_1066%2Fall; Юмашева Ю.Ю. Археография в электронной среде: к постановке проблемы; Хачатурян Л.В. Документальное наследие русской литературы в цифровом архиве: проблемы электронной публикации. Тезисы докладов не опубликованы.

См. также: Олимпиева Е.В. Проблемы электронных публикаций исторических источников [Электронный ресурс] // URL: https://docviewer.yandex.ru/ ?url=http% 3A%2F%2Felar.urfu.ru%2Fbitstream%2F10995%2F19633%2F1%2Farp-2013-19. pdf&name=arp-2013-19.pdf&lang=ru&c=583085d2bea3&page=1; Батшев М.В. Электронная археография от РВИО [Электронный ресурс] // Историческая экспертиза. 2015. № 3 (4), С. 62—67. URL: http://istorex.ru/page/batshev_mv_elektronnaya_arkheografiya_ ot_rvio.

7 Правила издания исторических документов в СССР / Главархив СССР, ВНИИДАД. АН СССР, Ин-т истории СССР, Археогр. комис. ИМЛ при ЦК КПСС, Гос. ком. СССР по печати, МГИАИ. 2-е изд., перераб. и доп. М., 1990.

8 В 2015 г. в рамках выполнения Плана НИОКР ВНИИДАД выполнил научно-исследовательскую работу по теме 1.5.1. «Исследование практики публикации архивных документов в Российской Федерации (1992—2013 гг.)». К сожалению, в рамках данного исследования не анализировались вопросы публикации электронных копий архивных документов в электронной среде.

Каждая из этих копий должна сопровождаться метаданными, описывающими процедуру ее создания и обработки, чтобы опубликованное изображение не превращалось в загадку, смысл отгадывания которой заключается в определении степени адекватности электронной копии подлиннику, ее полноты, достоверности и репрезентативности.

Не менее запутанной на сегодняшний день является и проблема авторства и авторского права, возникающая в отношении созданных электронных копий9 и прямо влияющая на возможность их правомерной публикации, представления и использования (в том числе и в исследовательской практике). Данный вопрос особо обостряется в связи с темой графической обработки электронной копии, результат которой может рассматриваться, во-первых, как творческая переработка исходного изображения, во-вторых, как объект авторского права сотрудника, который проводил графическую обработку. При этом сама преобразованная копия становится самостоятельным продуктом, отдельной материальной сущностью (фактически «новым» историческим источником), проще говоря, — результатом интеллектуальной деятельности, в отношении которой возникает масса вопросов не только правового и технологического, но, прежде всего, источниковедческого характера...

Следующие проблемы носят комплексный характер и являются производными от разницы, существующей между любым подлинником и его копией.

Если архивный документ (исторический источник) — это целостная информационная система, создание которой было обусловлено необходимостью достижения определенной цели. Каждый элемент этой системы (физический носитель, способы и методы фиксации информации, писчие материалы, содержание, палеографические особенности10, маргиналии и т.п.) несет определенную информационную нагрузку, и результат анализа только одной

9 Семилетов С.И. Формирование коллекций из интернет-документов и проблемы авторского права // Вестник архивиста. 2003. № 5—6. С. 258—273; № 1. С. 237—255.

Данная статья рассматривает проблемы авторского права применительно к интернет-сайтам. Однако в случае с архивными информационными ресурсами, созданными на основе электронных копий архивных документов и представленными в виде сайтов, положения этого материала приобретают особую остроту и актуальность.

10 Методы и способы исследования палеографии средневековых документов на примере их электронных копий и с помощью цифровых технологий активно развиваются в Великобритании: Digital Resource and Database for Paleography, Manuscript Studies and Diplomatic [Электронный ресурс] // DigiPal. URL: http:// www.digipal.eu/about/digipal/

См. также: Havens H. Adobe Photoshop and Eighteenth-Century Manuscripts: A New Approach to Digital Paleography [Электронный ресурс] // Digital Humanities

из этих составляющих (например, только содержания, т.е. текста) без уверенности в подлинности и аутентичности других будет неполон.

Копия является самостоятельным физическим объектом, сочетающим в себе авторство, цели создания (отчасти) и семантическую информацию подлинника с отличными от последнего авторством, физической формой и целями создания копии.

Подобная «двойственная» природа копий (прежде всего электронных и представленных в сети Интернет) и практика их использования исследователями взамен подлинников ведет к увеличению числа источниковедческих процедур и требует незамедлительного совершенствования методов источниковедческого анализа и археографического описания, поиска новых подходов и методик, адекватных сложившимся реалиям работы с электронными копиями исторических источников.

Очевидно, что для профессиональной исследовательской аудитории приоритетным является вопрос качества электронной копии, под которым подразумевается аутентичность (адекватность) ее содержания содержанию (понимаемому в самом широком смысле этого слова) подлинника исторического источника; ее репрезентативность, полнота, достоверность и юридическая значимость (в отдельных случаях), а также функциональность исследовательского инструментария, предоставляемого в рамках ресурса. Эти элементы источниковедческого анализа являются обязательной частью любого исследования независимо от проблемной области, в которой работает тот или иной исследователь.

В цифровой среде качество электронной копии обеспечивается:

— качеством описания подлинника исторического источника11 и отдельного, самостоятельного описания его цифровой копии;

— качеством электронного образа (качеством сканирования или оцифровки)12;

Quarterly. 2014. Vol. 8. Num. 4. URL: http://digitalhumanities.org/dhq/vol/8/4/000187/ 000187.html

11 Князевская O.A., Черных В.А. Научное описание документальных памятников в трудах археографической комиссии // Археографический ежегодник за 1981 год. М., 1982. С. 247—254.

12 Клещарь С.Н. Современное состояние проблемы оценки качества сканирования бумажных оригиналов в России и за рубежом [Электронный ресурс] // Архивные информационные технологии. URL: https://www.aiteh.ru/klechar.html; Международная научно-практическая конференция «Создание электронных копий аналоговых документов. Оценка качества сканирования, методы контроля» [Электронный ресурс] // РГБ. URL: http://www.rsl.ru/ru/s7/s335/s3356060/; Оценка качества сканирования бумажных оригиналов в России и за рубежом / А.П. Гаври-лин, С.Н. Клещарь, Т.Н. Данилова, П.Е. Завалишин // Справочник руководителя учреждения культуры. 2011. № 7. С. 16—21.

— качеством графической обработки электронной копии;

— качеством хранения и использования электронной копии.

Кратко рассмотрим первые две составляющие понятия «качества», поскольку о проблемах графической обработки говорилось выше, а процедуры обеспечения хранения и использования носят в большей степени технический характер.

Первый вопрос: составление и представление полномасштабного археографического описания подлинника, учитывающего не только требования профессионального научного сообщества, но и адаптированного к восприятию неподготовленной аудитории (если электронная копия публикуется в сети Интернет) должен был бы начаться с рассмотрения обширной историографии археографии в целом13. Однако изучение истории археографических исследований выходит за рамки данного исследования. Учитывая это, необходимо подчеркнуть лишь отличительные характеристики, которые должны присутствовать в описании подлинника для его полноценной презентации в электронной среде. К их числу относятся характеристики носителя, его физических размеров, писчих материалов, тех деталей, которые не видны пользователю (например, филиграней)14. С целью максимально точного описания оригиналов архивных документов и книжных памятников может быть также использован опыт описания музейных объектов15.

13 В 2015 г. в рамках реализации работ по теме 1.5.1 Плана НИОКР на 2015 г. ВНИИДАД выполнил «Аналитический обзор "Исследование практики публикации архивных документов в РФ (1992—2013 гг.)"», в котором, были сделаны неутешительные выводы в отношении традиционных, полиграфических форм публикаций (с.114—115): «Несмотря на широту и разнообразие тематики публикаций, в целом уровень археографического освоения истории России — СССР — Российской Федерации не всегда соответствует современным потребностям исторической науки, так как выбор тем для публикаций часто был приурочен к юбилейным датам (прежде всего публикации региональных архивов), а так же порой диктовался запросами политизированной общественности.

При подготовке документальных публикаций составители часто игнорировали "Правила"...». (Имеются в виду «Правила издания исторических документов в СССР» (М., 1990) - прим. Ю.Ю.)

14 The Memory of Paper [Электронный ресурс] // Bernstein. URL: http://www. memoryofpaper.eu/BernsteinPortal/appl_start.disp#

15 Например: Vedute in Czech and Slovak archives created up to 1850. [Электронный ресурс] // Vfedute in Czech and Slovak archives. URL: http://www.veduty.cz/veduty/; Уханова Е.В. Принципы организации информации о средневековых рукописях и старопечатных книгах в компьютерной базе данных фондов ОР ГИМ // Информатизация учетно-фондовой работы. Сб. ст. Труды ГИМ. Вып. 174. М., 2008. С. 102-114; Древнерусские берестяные грамоты [Электронный ресурс] // Древнерусские берестяные грамоты. URL: http://gramoty.ru; Юмашева Ю.Ю. Археографическое описание музейного предмета и его место в системе документации музея // Материалы Международ. науч. конференции «Археография музейного предмета», 16-17 марта 2012 г. М., 2012. С. 196-198.

Второй вопрос: развернутое описание электронной копии, в содержание которого должны быть включены сведения технического и технологического свойства, характеризующие копию как самостоятельный физический объект, информация, об объекте, с которого сделана копия (если это не оригинал), данные, описывающие процедуру создания (редактирования) публикуемой копии.

Фактически этот подход должен быть основан на применении известных стандартов, разработанных Библиотекой Конгресса США, METS и MODS, и дополнен информацией о процедурах графической обработки электронной копии16.

Аналогичный метод описания электронных копий применяет сейчас и Библиотека Ватикана17. Однако в качестве стандарта описания, специалисты Библиотеки выбрали стандарт NASA FITS, специально разработанный для описания цифровых изображений18.

К сожалению, в среду отечественных профессиональных историков и архивистов, осуществляющих работы по подготовке к публикации электронных копий объектов историко-культурного наследия идея создания двух описаний стала проникать сравнительно недавно. Здесь представляется уместным упомянуть два российских проекта.

Первый представляет пока не опубликованную в сети, но активно разрабатываемую в Архиве Российской Академии наук базу данных, включающую как полномасштабное археографическое описание оригиналов архивных документов, так и описание их электронных копий.

Второй является интранет-выставкой, которую готовит Московский областной архив. Ее тема — «Чиновник, управленец, бюрократ в России в 1800-е — 1980-е годы». Авторы выставки сопровождают электронные копии представленных архивных документов двойным описанием, в котором содержится информация о подлиннике (включая указание автора, название документа, характеристику носителя, писчих материалов, физических размеров документа, степени его сохранности, а также архивного шифра) и описание электронной копии, представленной на экране монитора. Кроме обычных метаданных (формат сжатия и размер изображения) для каждого изображения указываются также: модель оцифровывающего обо-

16 Standards at the Library of Congress [Электронный ресурс] // Library of Congress. URL: https://www.loc.gov/standards/

17 Digital Vatican Library [Электронный ресурс] // Цифровая библиотека Ватикана. URL: http://digi.vatlib.it

18 FITS Standard Document. The official reference document that defines the requirements for FITS format data files [Электронный ресурс] // FITS. The Astronomical Image and Table Format. URL: http://fits.gsfc.nasa.gov/fits_standard.html

рудования; дата создания электронной копии; фамилия автора электронной копии, а также информация о графической обработке изображения (если таковая проводилась).

Этот набор реквизитов практически полностью воспроизводит набор метаданных уже упоминавшихся форматов METS, MODS и FITS (отсутствуют только характеристики мастер-копии: указание разрешения при сканировании и цветового режима сканирования).

Очевидно, что составление подобных описаний — дело чрезвычайно сложное, трудоемкое и требующее значительных временных затрат и наличия профессионалов высокого уровня.

Серьезно тормозит этот процесс и отсутствие разработанной отечественной нормативно-методической базы, создание которой должно стать одним из приоритетных направлений научных исследований ближайшего времени.

Подводя итог рассмотрению немногочисленных работ отечественных исследователей в области электронной археографии, необходимо констатировать практически полную неразработанность данной проблематики. Представляется, что это является проявлением определенного отставания отечественной историографии в вопросах научного изучения общемировых тенденций, теории и практики перевода объектов историко-культурного наследия в цифровой формат, анализа результатов реализации подобных проектов, а также запаздывания в отношении выполнения закрепленного в государственных программах и стратегиях Российской Федерации социального заказа на максимально широкое представление электронных копий архивных документов в электронной среде.

Еще раз необходимо подчеркнуть первоочередное значение, актуальность и важность разработки научных подходов, методов и соответствующего инструментария, предназначенных для осуществления полноценной научной публикации описаний архивных документов и их электронных копий в электронной среде с целью их использования в режиме удаленного доступа в качестве полноценной замены подлинникам.

Список литературы

1. Батшев М.В. Электронная археография от РВИО [Электронный ресурс] // Историческая экспертиза. 2015. № 3 (4). URL: http://istorex.ru/ page/batshev_ mv_elektronnaya_arkheografiya_ot_rvio

2. Журавлева Р.А. Электронные издания, подготовленные на основе архивных документов, — инновационное направление в работе архивистов Чувашии // Вестник архивиста. 2005. № 5—6.

3. Каннингхэм С. Электронные издания сегодня и завтра // Открытые системы. URL: http://www.osp.ru/os/1995/05/178734/

4. Клещарь С.Н. Современное состояние проблемы оценки качества сканирования бумажных оригиналов в России и за рубежом [Электронный ресурс] // Архивные информационные технологии. URL: https://www.aiteh. ru/klechar.html

5. Князевская O.A., Черных В.А. Научное описание документальных памятников в трудах археографической комиссии // Археографический ежегодник за 1981 год. М., 1982.

6. Крайнева И.А. Архивные ИС — инструмент актуализации исторической идентичности и реконструкции биографического нарратива // Материалы XV Международ. конференции Ассоциации «История и Компьютер». «Исторические исследования в цифровую эпоху: информационные ресурсы, методы, технологии». Москва—Звенигород, 7—9 октября 2016 г. Инф. бюлл. Ассоциации «История и Компьютер». № 45. Октябрь 2016 г.

7. Международ. науч.-практ. конференция «Создание электронных копий аналоговых документов. Оценка качества сканирования, методы контроля» [Электронный ресурс] // РГБ. URL: http://www.rsl.ru/ru/s7/s335/ s3356060/

8. Олимпиева Е.В. Проблемы электронных публикаций исторических источников [Электронный ресурс] // URL: https://docviewer.yandex.ru/?url= http%3A%2F%2Felar.urfu.ru%2Fbitstream%2F10995%2F19633%2F1%2Fa rp-2013-19.pdf&name=arp-2013-19.pdf&lang=ru&c=583085d2bea3&page=1

9. Оценка качества сканирования бумажных оригиналов в России и за рубежом / А.П. Гаврилин, С.Н. Клещарь, Т.Н. Данилова, П.Е. Завалишин // Справочник руководителя учреждения культуры. 2011. № 7.

10. Семилетов С.И. Формирование коллекций из интернет-документов и проблемы авторского права // Вестник архивиста. 2003. № 5—6.

11. Теория и методология исторической науки. Терминологический словарь / Отв. ред. А.О. Чубарьян. [М.], 2014.

12. Уханова Е.В. Принципы организации информации о средневековых рукописях и старопечатных книгах в компьютерной базе данных фондов ОР ГИМ // Информатизация учетно-фондовой работы. Сб. ст. Труды ГИМ. М., 2008, Вып. 174.

13. Юмашева Ю.Ю. Археографическое описание музейного предмета и его место в системе документации музея // Материалы Международ. науч. конференции «Археография музейного предмета», 16—17 марта 2012 г. М., 2012.

14. Havens H. Adobe Photoshop and Eighteenth-Century Manuscripts: A New Approach to Digital Paleography [Электронный ресурс] // Digital Humanities Quarterly. 2014. Vol. 8. Num. 4. URL: http://digitalhumanities.org/dhq/ vol/8/4/000187/000187.html

15. Kenneth M.P. Edition, Project, Database, Archive, Thematic Research Collection: What's in a Name? [Электронный ресурс] // Digital Humanities Quarterly. 2009. Vol. 3. Num. 3. URL: http://digitalhumanities.org/dhq/vol/3/3/ 000053/000053.html

Поступила в редакцию 15 марта 2015 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.