Межархивная база данных по документам переписи 1897 года: разработка структуры и особенности заполнения
Брюха нова Елена Александровна
кандидат исторических наук
доцент, кафедра документоведения, архивоведения и исторической информатики, Федеральное государственное бюджетное образовательное учреждение высшего образования "Алтайский
государственный университет"
656049, Россия, Алтайский Край край, г. Барнаул, ул. Ленина, 61, ауд. 312
И brelenochka@mail.ru
Статья из рубрики "Базы данных и информационно-поисковые системы"
Аннотация. В статье представлена характеристика задач и структуры источниковедческой базы данных, основной целью которой является аккумулирование сведений о сохранившихся в отечественных и зарубежных архивах документов Первой всеобщей переписи населения Российской империи 1897 г. База данных состоит из двух основных модулей ввода и сохранения данных «Архив» и «НСА». Первый модуль является реализацией идеи о сохранении иерархичной уровневой структуры, характерной для системы архивного хранения (архив - фонд - опись - дело - документ). Второй - отражает историю поиска, т.е. сведения об архивных справочниках, информацию о наличии электронных копий архивных справочников и документов, а также условий доступа к ним. Межархивная база является результатом архивоведческого, документоведческого и источниковедческого анализа как самих документов архивных фондов, так и научно-справочного аппарата к ним. Идея создания подобной источниковедческой системы по материалам Первой всеобщей переписи населения Российской империи представляется оригинальной для российской исторической науки. Для пользователей база данных обеспечивает поиск (в том числе в онлайн режиме) по архивам, фондам, делам, видам документов, а также по административным единицам с учетом не только исторических, но и современных названий.
фонд, источниковедческий анализ, справочник, Российская империя,
межархивный поиск DOI: 10.7256/2585-7797.2017.4.25029 Дата направления в редакцию: 18-12-2017 Дата рецензирования: 18-12-2017
Ключевые слова: перепись, база данных, архив, документоведческий анализ, НСА, электронный
Материалы переписи населения в историографии и информационной среде
Первая всеобщая перепись 1897 г. проходила на всей территории Российской империи и представляла собой крупнейшее отечественное статистическое мероприятие конца XIX -начала XX вв. Благодаря масштабности, обширной программе и комплексной статистической обработке материалы переписи 1897 г. стали одним из самых
востребованных исторических источников. Многие опубликованные результаты переписи были оцифрованы и включены в электронные фонды российских и зарубежных библиотек (ГПИБ, РНБ, РГБ, НЭБ, Библиотека конгресса США). Переведенные в цифровой вид статистические таблицы агрегированных данных стали основой созданной нами интернет-системы «Профессии и занятия населения Российской империи в конце XIX -начале XX вв.» (http://hcod.asu.ru/), а также составили историческую часть некоторых известных онлайн ресурсов - таких, как «ДемоскопWeekly» (http://demoscope.ru) и Электронный архив Российской исторической статистики (https://ristat.org). Но, несмотря на высокий спрос и значительное количество дореволюционных, советских и современных работ, основанных в основном на нормативных документах и результатах переписи, до сих пор не ставилась задача создания комплексного ресурса, объединяющего сведения об опубликованных и архивных материалах, а также о проектах и исследованиях, в которых использовались данные переписи 1897 г.
Особую важность в этом плане представляет выявление и сбор сведений о первичных документах переписи 1897 г., сохранившихся в региональных архивах и представленных в историографии весьма разрознено. Их можно найти, например, в статьях о формировании переписных комиссий Тобольской (С. С. Воропаева-11), Ярославской и Владимирской губерний (Д. А. Разживина-21), об этнических особенностях губерний и уездов (Н. А. Лискевич, А. Х. Машарипова-31, О. В. РодионоваJ41) и др. Можно назвать совсем немного специальных исследований, содержащих источниковедческий анализ архивных материалов переписи по отдельным регионам, например, Курской губернии (Н.
Д. Борщик t51), Якутской области (Т. Т. Курчатова-61), Тобольской (Е. А. Брюханова, В. Н. Владимиров Н. В. Неженцева --81) и Московской (К. Б. Литвак --91) губерниям.
Зарубежные авторы также проявляют интерес к материалам переписи 1897 г. в целях, прежде всего, генеалогических исследований. Так, журнал Avotaynu в 2000 г.
опубликовал статью Т. К. Эдланд (T. K. Edlund)-101, в которой сообщалось о переписных листах, сохранившихся по населенным пунктам Гродненской, Рязанской, Тобольской губерниям, городам Одесса, Санкт-Петербург, Тарту (Юрьев), Екатеринославль, а также населенным местам современных Латвии и Литвы. При этом автор ссылается на оцифрованные файлы переписных листов, хранящихся в Генеалогическом обществе
Штата Юта. В 2008 г. в этом же журнале вышла статья А. Дунаи (A. Dunai)-111, дополнившая представленный список сведениями по Подольской и Киевской губерниям, подтвержденными данными об архивах, фондах и объеме обнаруженных переписных листов. Таким образом, даже краткий обзор показывает, что сохранившиеся в региональных и зарубежных архивах материалы переписи 1897 г. не рассматривались как единый комплекс, более того, в некоторых случаях весьма сложно составить представление о том, какие документы и в каких объемах сохранились в архивах.
Кроме того, следует отметить, что в практике зарубежных исследований существует несколько крупных национальных и международных проектов (NAPP, IPUMS, MOSAIC project и др.) по аккумулированию больших объемов первичных материалов переписей и других регистров населения в единые информационные системы и предоставлению к ним доступа в сети интернет. На современном этапе российской исторической науки такая задача, к сожалению, не ставится. Тем не менее, весьма актуальным представляется поиск и источниковедческий анализ первичных материалов переписей и других форм учета населения, а также обобщение разрозненных данных территориальных архивов в единый информационный массив. Для реализации этих целей нами создается источниковедческая база данных, основной целью которой является аккумулирование
сведений о сохранившихся в отечественных и зарубежных архивах документах Первой всеобщей переписи населения Российской империи 1897 г.
Задачи межархивной базы данных по документам переписи 1897 г.
Источниковедческая межархивная база данных создается как часть информационно-поисковой системы, одной из основных задач которой является обеспечение возможности разноаспектного и многозадачного поиска материалов переписи 1897 г. в онлайн режиме. Представляемая база данных должна обеспечивать поиск: по архивам, фондам, делам, видам документов, а также по административным единица, с учетом не только историчехкие, но и современных названий. Реализация таких возможностей предусматривается как архитектурой базы данных, так и спецификой заполнения.
Одной из основных идей и задач в этом плане стало сохранение иерархичной уровневой структуры, характерной для системы архивного хранения (архив - фонд - опись - дело -документ). Такая структура, с одной стороны, обеспечивает поисковую функцию, с другой, сохраняет «образ» документной системы, в которой отложились оригинальные материалы переписи. Система хранения архивных документов легла в основу модуля «Архив», включающего форму для ввода данных, ряд таблиц и справочников. Иерархичная структура ввода данных модуля «Архив» представлена на Рисунке 1.
Рисунок 1. Структура формы ввода данных модуля «Архив»
Выявление архивов и фондов с материалами переписи 1897 г. осуществляется как по традиционному, так и по электронному научно-справочному аппарату (далее - НСА) органов управления архивным делом и архивных учреждений. Возможность удаленного межархивного и межфондового поиска в пределах архивов Российской Федерации обеспечивается благодаря таким информационным системам, как Центральный фондовый
каталог 1121 и база данных «Путеводители по российским архивам» Наиболее
распространенными видами НСА как отечественных, так и зарубежных архивов являются путеводители, каталоги и описи. Архивные справочники могут быть представлены в традиционной (в виде специального издания) или оцифрованной форме: в формате изображений (например, описи Российского государственного исторического архива или текстов (например, путеводитель Национального архива Республики Саха (Якутия) При этом наибольший интерес для исследователей представляют
информационно-поисковые системы архивов, обеспечивающие возможность онлайн поиска и ознакомления с электронными путеводителями, описями и электронными копиями дел. Такими ресурсами в настоящее время обладает ограниченное количество региональных архивов. Наиболее крупные коллекции оцифрованных дел по переписи
1897 г. представлены в информационных системах Государственного архива в г. Тобольске [16] и Государственного архива Ярославской области При этом в
подобных информационных системах могут быть разные условия доступа к поисковым средствам и собственно электронному архиву. Так, списки фондов и описи дел предоставляются бесплатно, а удаленный доступ к электронным образам документов в ряде архивов осуществляется за плату. Тем не менее, стоит отметить два аспекта при работе с оцифрованными справочниками и электронными системами. С одной стороны, они существенно расширяют поисковые возможности исследователей и позволяют выявлять материалы переписи 1897 г. в «непрофильных» документальных комплексах, т.е. в фондах губернских, уездных, волостных управлений, земских заседателей, полицейских участков и т.д. С другой, наличие межфондового поиска не решает проблемы кратких или неполных заголовков, когда в заголовке дела нет указания на вид помещенных в него документов, отсутствуют связи с переписью населения, а хронологические границы указаны для всего фонда, а не для отдельного дела, т.е. заголовок дела состоит только из названия населенного пункта (смотрите пример заголовка дела на Рисунке 1). В этом случае поиск в информационной системе дает неполные результаты, а выявить оригинальные материалы переписи 1897 г. без дополнительных источников довольно сложно.
В связи с очевидной спецификой и сложностью поискового этапа при разработке архитектуры источниковедческой (межархивной) базы данных было принято решение о сохранении истории поиска, сведений об архивных справочниках, информации о наличии электронных копий архивных справочников и документов, а также условий доступа к ним. Для этих целей был создан модуль «НСА» (Рисунок 2), в который вошли форма для ввода данных, две таблицы («НСА», «Фонды НСА») и два справочника («Вид НСА», «Доступ»). Но при этом для удобства заполнения модуль «НСА» был интегрирован в формы модуля «Архив», т.е. при добавлении данных о фонде можно сразу добавить все виды справочников и информационных систем, в которых встречается информация о фонде, и при необходимости написать для них комментарии. Кроме того, каждый фонд сопровождается аннотациями, заполняемыми в соответствии с официальными архивными справочниками. Отметки о наличии электронных копий и интернет-ссылки были включены в формы/таблицы «Описи» и «Дела», для которых также сохранялись сведения об условиях доступа («свободный», «для зарегистрированных пользователей», «платный» и т.д.) с помощью справочника «Доступ». Модуль «НСА» является не только средством верификации сведений источниковедческой базы данных, но и будет информировать будущих пользователей о возможностях и условиях удаленной работы в электронных архивах.
Рисунок 2. Модуль «НСА»
Еще одной задачей при проектировании межархивной базы данных стала унификация состава материалов переписи 1897 г. на основе документоведческого анализа. Архивные фонды представляют собой поливидовые документные комплексы, в которых наиболее часто встречаются такие виды материалов переписи 1897 г., как организационные документы и переписка (например, копия циркуляра Главной переписной комиссии от 26 марта 1897 г. за №3505 об обеспечении сохранности и
недоступности вторых экземпляров переписи 1897 г. открытые листы и отчеты
счетчиков (например, Открытый лист переписчика Мангишлакского уезда на русском и
киргизском языках хозяйственно-экономические документы и отчеты переписных
комиссий (журналы заседаний, о получении бланков, их рассылке, закупке канцелярии и т.п.). Также в фондах встречаются материалы по подготовке к переписи населения: предварительные обследования, сведения о населенных местах, списки счетчиков и т.д. Наибольший интерес для исследователей представляют материалы первичной статистики (ведомости подсчета населения, обложки) и переписные листы. Все перечисленные документы стали основой справочника «Виды документов». Кроме того, при сравнительном изучении комплексов переписных листов оказалось, что они неоднородны. Речь идет не о различии установленных Центральным статистическим комитетом форм, а о типах переписных документов. Например, в Российском государственном историческом архиве сохранились первые экземпляры переписных листов с разметкой для переноса на счетные карточки, в Государственном архиве в г. Тобольске отложились вторые экземпляры переписных листов, которые передавались в архивы губернского управления, в Центральном архиве Республики Казахстан (г. Алматы) были обнаружены пробные переписные листы 1895 г. с отзывами и предложениями переписчиков; в архивах также встречаются черновые переписные листы, заполненные карандашом и имеющие многочисленные исправления. Все варианты переписных листов и форм первичной статистики составили справочник «Типы документов». Таким образом, унификация не только обеспечивает возможности поиска «по видам документам», но и отражает информацию об особенностях и «качестве» источников.
Следующей задачей при разработке структуры базы данных стала «идентификация» материалов переписи (фондов - дел - документов) в соответствии с административно-территориальным делением. Такая территориальная «привязка» выполняет сразу несколько функций: поисковую, связующую и источниковедческую. Выявление названий поселений и их места в административной иерархии Российской империи позволило сформировать два справочника («Административные единицы» и их «Типы»). Но, так как создаваемая информационная система ориентирована на широкий круг пользователей, можно предположить, что поиск будет осуществляться не только по историческим, но и по современным названиям населенных пунктов. Для корректного выполнения таких запросов справочник «Административные единицы» будет дополнен сведениями о соответствии современным поселениям (в тех случаях, где это возможно) и их административной принадлежности. Связующая функция позволяет при запросе «по административной единице» получить сведения обо всех фондах, делах и документах, в которых есть сведения о данной территории, даже в том случае, если они отложились в разных архивах. Например, материалы о проведении переписи населения в Тобольской губернии сохранились не только в Государственном архиве в г. Тобольске (Ф. 477, 571573), но и в Государственном архиве Тюменской области (Ф. 232-234) и Историческом архиве Омской области (Ф. 414, 418). Территориальная «идентификация», кроме того,
направлена на оценку объема и репрезентативности сохранившихся материалов, что позволяет осуществить их источниковедческий анализ.
Самостоятельной задачей является создание интернет-версии разрабатываемой базы данных и предоставление свободного доступа к собранным материалам. Идея заключается в том, чтобы на интерактивных картах исследователь мог получить, с одной стороны, сведения об архивных учреждениях, в которых сохранились материалы переписи 1897 г. с возможностью выбора отдельных категорий документов (нормативные акты, переписка, подсчетные ведомости, переписные листы и т.д.), а, с другой, сведения по населенным пунктам, о которых сохранились архивные материалы переписи 1897 г. (подсчетные ведомости, переписные листы) с оценкой их объема. Такая задача представляется перспективной и позволит расширить пользовательские возможности благодаря использованию интерактивных карт.
Характеристика таблиц и справочников межархивной базы данных по документам переписи 1897 г.
Для работы с базой данных проекта необходима программа Microsoft Access 2010 и выше, установленная на компьютере, к которому предъявляются следующие системные требования: операционная система Microsoft Windows 7 и выше, 1 гигабайт (32-разрядный выпуск) или 2 гигабайта (64-разрядный выпуск) оперативной памяти и 3 гигабайта свободного места на жестком диске.
На начальном этапе проекта для организации ввода и просмотра данных организован многопользовательский режим с одновременным доступом ко всем записям. Для этого используется метод разделения файла базы данных Access на серверный и пользовательский файлы. Серверный файл содержит только таблицы, пользовательский - формы ввода и представления данных. Файл серверной части размещается на сервере в локальной сети. Пользователи получают доступ к данным из локальной сети или домашней сети с подключением по VPN. В дальнейшем к базе данных будет организован он-лайн доступ.
Структура базы данных, состоящая из 2 форм ввода, 7 таблиц и 7 справочников, представлена на Рисунке 3.
Рисунок 3. Структура форм, таблиц и справочников межархивной базы данных Модуль «Архив» включает 5 таблиц.
Таблица/форма «Архивы» предназначена для сохранения сведений об архивных учреждениях и состоит из полей, отражающих полное официальное и сокращенное
название архива, место его расположения («Регион», «Населенный пункт», «Адрес»), включая электронную ссылку на официальный ресурс архива в сети интернет.
Таблица/форма «Фонды» содержит поля, отражающие основные характеристики архивных фондов: номер, заголовок, крайние даты, объем, а также краткую аннотацию из официальных справочников архива.
Таблица/форма «Описи» направлена на сохранение сведений о номере, крайних датах и количестве дел, внесенных в опись, кроме того, предусмотрены отметки о наличии электронной копии описи, организации доступа к ней и ссылки на официальный ресурс.
Таблица/форма «Дела» включает поля, отражающие основные характеристики архивных дел (номер, заголовок, крайние даты, количество листов), а также предусматривает сохранение информации о наличии электронной копии дела, формата доступа к нему и интернет-ссылки (если есть возможность онлайн доступа).
Таблица/форма «Документ» предусматривает возможность внесения сведений как о всех документах дела в целом, так и информации об отдельных документах, представляющих особый интерес для исследователей, например, переписные листах формы А/Б с переводом на национальные языки. Таблица требует внесения следующих сведений: номера листов, вид, тип, язык документа, административная единица, к которой относится документ, примечания, предусматривающие сохранение информации об особенностях формы и пометах переписного листа (например, «заполнены карандашом», «содержит много правок»), о специфических носителях («на микрофишах, качество изображения плохое», «на микрофильмах, качество изображения хорошее»), физическом состоянии («сохранилась только верхняя часть переписного листа»).
Модуль «НСА» включает 2 таблицы.
Таблица/форма «НСА» предусматривает следующие поля: вид НСА (например, аннотированный реестр описей, традиционная опись дел, электронный архив и т.д.), название НСА (для печатных или оцифрованных изданий указывается полное название с выходными данными, для электронных - название «с экрана»), ссылка (для электронных справочников или доступных онлайн), примечание (могут быть отмечены условия доступа к НСА, например, только в читальном зале архива).
Таблица «Фонды НСА» является сводной и отражает список фондов, а также перечень архивных справочников, в которые внесены сведения о представленных фондах.
Для целей унификации данных и стандартизации ввода были разработаны справочники.
Справочник «Язык» предназначен для таблицы «Документы», для обозначения языка оригинала. Большинство документов выполнено на русском языке, но встречаются документы на узбекском, киргизском, немецком, польском языках.
Справочник «Доступ» служит для отражения в таблицах «Описи» и «Дела» вариантов доступа к НСА и архивным документам (только для зарегистрированных пользователей, платный, свободный, только в читальном зале и т.д.).
Справочники «Типы документов» и «Виды документов» применяются для таблицы «Документы». Под видами мы понимаем различия в целевом назначении документов фондов (журналы, протоколы, выписки из протоколов, списки населенных мест, списки счетчиков, переписные листы и т.д.). Справочник по типам предназначен только для таких форм документов как «переписные листы», «обложки», «ведомости подсчета
населения» и отражает становление данных форм, особенности и варианты их сохранности (пробные 1895 г., вторые экземпляры, первые экземпляры, черновики).
Справочник «Виды НСА» унифицирует виды архивных справочников (путеводитель, опись дел традиционная, опись дел электронная, центральный фондовый каталог и т.д.) для заполнения таблицы/формы «НСА».
Справочники «Административные единицы» (Рисунок 4) и «Типы административных единиц» взаимосвязаны и направлены не только на последующее отражение территориальных данных на интерактивных картах, но и на связь с уже существующей
базой данных по агрегированным данным переписи 1897 г.[20], основанной на аналогичном справочнике. Такая связь позволит оперативно получать сведения о городах и административных центрах.
Рисунок 4. Справочник «Административные единицы»
Заключение.
Таким образом, структура межархивной базы данных по материалам переписи 1897 г. разработана на основе архивоведческого, документоведческого и источниковедческого анализа как самих документов архивных фондов, так и научно-справочного аппарата к ним. База пополняется сведениями по итогам поисковой работы по выявлению и анализу комплексов материалов переписи, отложившихся в архивных учреждениях России и зарубежных стран. А создание онлайн версии межархивной базы данных позволит пользователям в несколько «кликов» получат информацию о том, какие документы, в каком архиве, в каком объеме и о каких населенных пунктах сохранились.
Библиография
1. Воропаева С. С. Формирование и состав переписных комиссий Тобольской губернии при подгото в ке П е р в о й в с е обще й пе ре пис и на се ле ния Р о с с ийс ко й импе рии 1897 года // Вестник Челябинского государственного университета. 2013. № 6 (297). История. Вып. 54. С. 25-30.
2. Разживина Д. А. Заведующие переписными участками всеобщей переписи 1897 г.: обязанности, полномочия, объем работы // Вестник Ленинградского государственного университета им. А. С. Пушкина. 2013. № 2. Том 4. С. 135-143.
3. Лискевич Н. А., Машарипова А. Х. Формирование и расселение групп коми на территории Ялуторовского уезда Тобольской губернии в XIX начале XX в. // Вестник археологии, антропологии и этнографии. 2012. № 2 (17). С. 113-119.
4- Родионова О. В. Русские подданные в Финляндии по данным Первой всеобщей переписи населения 1897 года.(население мыса катаянокка (Katajanokka)// Управленческое консультирование. 2014. № 8 (68). С. 170-176.
5. Борщик Н. Д. История Первой всеобщей переписи населения 1897 г. на примере Курской губернии. Автореф. дис. ... канд.ист.наук. Курск, 2003.
6. Курчатова Т. Т. Материалы переписей населения в Якутской области (конец XIX начало ХХ вв.) как исторический источник // Теория и практика общественного развития. 2015. № 3. С. 116-119.
7. Брюханова Е. А., Владимиров В. Н. Кодирование исторических профессий. Барнаул: Изд-во АлтГУ, 2015.
8. Неженцева Н. В. Статистический учет занятий населения России второй половина XIX - начала XX в.: источники и методы изучения: автореф. дис. ... канд. ист. наук. Барнаул, 2016.
9. Литвак К. Б. Перепись населения 1897 г. о крестьянстве России // История СССР. 1990. № 1. С. 114-26.
10. Edlund T. K. The Russian National Census of 1897 // Avotaynu. 2000. Vol. XVI. N 3. Pp. 29-39.
11. Dunai A. The 1897 All-Empire Russian Census // Avotaynu. 2008. Vol. XXIV. N. 3. Pp. 12-14.
12. Центральный фондовый каталог [Электронный ресурс] // Официальный портал «Архивы России». URL: http://cfc.rusarchives.ru/CFC-search (дата обращения 12.11.2017)
13. Путеводители по российским архивам: база данных [Электронный ресурс]. URL: http://guides.rusarchives.ru/search/basic/BasicSearch.html (дата обращения 04.10.2017)
14. Российский государственный исторический архив. Фонд 1290 «Центральный статистический комитет МВД». Опись 11 (1897-1905) [Электронный ресурс] // Российский государственный исторический архив: официальный сайт. URL: http://rgia.su/imageViewer/img?
url = nouLjcLOz8nKztmMmo2WnpPCzNmQnZWanIvCzcjHzMvHx8jZmI2Qio/Czw = = (дата обращения 12.11.2017)
15. Национальный архив Республики Саха (Якутия)/ путеводитель в 2-х ч. Якутск, 2007. Ч. 1. 1663-1919 [Электронный ресурс]// Национальный архив Республики Саха (Якутия): официальный сайт. URL: http://archivesakha.ru/?page_id = 180 (дата обращения 12.11.2017)
16. Путеводитель по фондам архива и автоматизированные тематические комплексы по документам архива [Электронный ресурс] // Государственный архив в г. Тобольске: официальный сайт. URL: https://tobarhiv.72to.ru/Default.aspx?ReturnUrl = %2f (дата обращения 12.11.2017)
17. АИС Архив [Электронный ресурс] // Государственный архив Ярославской области: официальный сайт. URL: https://ais.yararchive.ru/Default.aspx?ReturnUrl = %2f (дата обращения 12.11.2017)
18. Государственный архив Красноярского края. Ф. 31. Оп. 1. Д. 200. Л. 3.
19. Центральный архив Республика Казахстан. Ф. 40. Оп.1. Д. 562. Л. 19.
20. Профессии и занятия населения Российской империи конца XIX - начала XX века. Анализ данных Первой всероссийской переписи населения 1897 года: информационная система [Электронный ресурс]. URL: http://hcod.asu.ru/ (дата обращения 12.12.2017