УДК 94(47).083:312 ББК 63.3(2)5ю13
Этапы проектирования и создания геоинформационной системы по занятиям населения Российской империи на рубеже XIX-XX вв. (по материалам переписи 1897 г.)*
Е.П. Крупочкин, Е.А. Брюханова
Алтайский государственный университет (Барнаул, Россия)
The Design and Creation of a Geographical Information System on the Employment of the Russian Empire Population at the Turn of the XIX-XX Centuries (Based on 1897 Census)
Е.Р. Krupochkin, Е.А. Bryukhanova Altai State University (Barnaul, Russia)
Рассматриваются технологические вопросы проектирования геоинформационной системы по занятиям населения Российской империи на рубеже XIX-XX вв., которая направлена на создание эффективного инструмента пространственного анализа, а также открытого историко-географического ресурса, доступного и интуитивно понятного другим исследователям и предоставляющего возможности решения пользовательских задач. На основе обзора современных ГИС-технологий делается вывод о том, что для актуальных историко-географических исследований требуется комбинирование технологических приемов. Для представленного проекта в качестве базовой технологии рассматривается классическая, предполагающая использование открытой архитектуры геоинформационной системы. Технологическая схема разработки ГИС-проекта по занятиям населения включает шесть основных этапов, предполагающих подготовку математической основы картографических источников, ввод, геокодирование статистических данных и картографо-статистическое моделирование, позволяющее реализовать пространственный анализ средствами ГИС. Также представлены перспективы использования Web-ГИС-технологий.
Ключевые слова: ГИС, занятия населения, перепись 1897 г., Web-ГИС, Российская империя, картографо-статистическое моделирование.
DOI 10.14258/izvasu(2015)3.2-17
The article deals with technological issues of designing a geographic information system on the employment of the Russian Empire population at the turn of the XIX-XX centuries, which aims to create an effective tool for spatial analysis, as well as an open historical and geographical resource accessible and understandable for other researchers and allow solving users' tasks.
Having reviewed the modern GIS technology, the authors conclude that the topical historical and geographical research needs to combine different technologies. For the proposed project the choice was made of a classic GIS technology with open architecture of geographic information system. The technological scheme of development of GIS-project on employment of the population consists of six main stages, involving the preparation of the mathematical foundations for cartographical sources, input, geocoding statistics and cartography and statistical modeling, allowing realizing spatial analysis using GIS. The article also presents the prospects of development of using Web-GIS technologies.
Key words: GIS, occupations, 1897 Census, Web-GIS, the Russian Empire, mapping and statistical modeling.
Геоинформационные технологии, появившись в арсенале российских историков в конце XX в., нашли применение и как средство визуализации, и как
* Исследование поддержано РФФИ, проект № 15-06-07553а.
инструмент анализа демографических (В.Н. Владимиров, И.Г. Силина, Д.В. Колдаков), социоэкономиче-ских (Л.И. Бородкин, Р.Б. Кончаков) и многих других
аспектов. Вместе с тем развитие геоинформационной области исторических исследований происходит медленно [1, с. 453], а историки, работающие в данном направлении, сталкиваются с трудностями технологического (программное обеспечение, специальные навыки) и источниковедческого (подбор картографического материала, соответствующих статистических или массовых источников, создание базы данных) характера [2]. Решение подобных проблем видится в междисциплинарных проектах, реализация которых расширяет возможности и позволяет следовать международным тенденциям.
Проект по созданию геоинформационной системы (ГИС) по занятиям населения Российской империи на рубеже Х1Х-ХХ вв. является междисциплинарным и направлен на создание, во-первых, эффективного инструмента пространственного анализа демографических, социальных и экономических (по занятиям населения) данных переписи 1897 г., во-вторых, открытого историко-географического ресурса, доступного и интуитивно понятного другим пользователям и предоставляющего возможности решения пользовательских задач. В статье рассмотрены технологические вопросы разработки и создания указанной ГИС.
На современном этапе развития геоинформатики и смежных с ней дисциплин (в частности — исторической науки) достаточно четко сформировались четыре технологии, которые можно рассматривать в качестве ключевых независимо от тематики исследований. К ним относятся: 1) технология полного цикла; 2) классическая технология с закрытой/открытой архитектурой; 3) технология сетевых ГИС; 4) технология реализации Web-ГИС.
Первая технология применялась на ранней стадии становления и развития геоинформационных технологий, когда требовались усилия разных специалистов — от программистов, разработчиков ядра системы и отдельных подсистем (элементов ГИС) до специалистов в области тематики, формулирующих будущие требования к эксплуатации ГИС. В основном такой подход себя исчерпал ввиду нерационального расходования всех возможных ресурсов. Исключения могут составлять крупные национальные проекты для решения научно-технических задач и их сопровождения.
Вторая технология получила широкое распространение и большую известность в основном за счет двух типовых (универсальных) технологических подходов: растрового и векторного. В сфере геоинформационного картографирования и гео-матики (нового научно-технического направления, сочетающего возможности как ГИС, так и дистанционного зондирования) на сегодняшний день распространены оба подхода. Вместе с тем, если смотреть на проблему через призму формируемых потребно-
стей в исторических реконструкциях, для исторического картографирования как наиболее понятной и доступной сферы взаимодействия исторической науки с техническими наиболее востребованным является именно векторный подход. И, несмотря на то, что зачастую векторная технология является таковой только отчасти (вследствие сканирования со всеми последствиями), процедура векторных преобразований для большинства предметно-ориентированных ГИС пока неизменно популярна. Это в полной мере справедливо и для нашей работы, поскольку математическая основа на картах Российской империи, особенно конца XVIII — начала XIX в., оставляла желать лучшего.
Стремление к упорядочению данных, созданию более точной и достоверной цифровой картографической основы для ГИС побудило нас применить именно такую технологию. В плане открытости архитектуры для ГИС все достаточно просто, поскольку в нашем случае речь не идет о создании информационно-технической платформы. Под созданием ГИС мы будем понимать прежде всего тематический проект, но не исключающий по отношению к нему применение современного ГИС-инструментария. Выбор в качестве базового инструментария проприетарного пакета МарШЪРш позволяет в полной мере реализовать весь возможный функционал современных ГИС.
Третья технология построена на использовании сетевых ГИС, работающих под управлением единого сервера, а также на основе сетевых распределенных баз данных. Банк картографических данных, содержащий разномасштабные, разновременные материалы, в том числе статистику, может храниться на сервере, все остальное распределяется в зависимости от конфигурации локальной сети в пределах компании и подчиняется алгоритмам обработки и получения доступа к таким данным в рамках базовой топологии. Технология «клиент-сервер» обеспечивает получение доступа к таким данным, защиту и ограничения в использовании при возникновении необходимости, например, если речь идет о данных с грифом «Для служебного пользования» и т. д. Разработка и использование баз данных, которые рассматриваются как «ядро» ГИС при геоинформационном тематическом картографировании, достаточно полно отражены в статье одного из авторов [3].
Совершенно новые перспективы открывает Web-ГИС-технология, сочетающая, с одной стороны, технологию цифровой картографии, а с другой — инновационную технологию интеграции и публикации данных и карт в сети Интернет. По сути Web-ГИС — это геоинформационная система, работающая в сети, с помощью которой обычные пользователи могут просматривать, редактировать и анализировать пространственно-координированные данные с помощью обычных веб-браузеров. При условии разработки банка
исторических пространственно-временных данных такая ГИС будет историко-географической системой. Например, в Web-ГИС, по сравнению с настольными системами, сделан существенный акцент на картографические возможности. Веб-картография — это область компьютерных технологий, связанная с доставкой пространственных данных конечному пользователю. Поскольку сам термин Web-ГИС достаточно новый, как это часто бывает при переводе и адаптации нового термина, прямого аналога устоявшемуся в России словосочетанию (Web-ГИС) в англоязычных источниках нет. Наиболее близкий термин — «WebmappingServices» (картографические веб-сервисы) [4].
Основными задачами веб-картографии являются: облегчение работы с пространственной информацией в сети, поиск необходимых данных, визуализация актуальных данных с результатами запросов и др. В отношении поставленных в работе задач мы рассматриваем данную технологию (технологию Web-ГИС) в качестве финальной части исследований. Интеграция локальной версии ГИС в Интернет обеспечит доступ потенциальных пользователей к пространственным данным, отражающим состояние Российской империи (военное, экономическое, демографическое, административное и др.). Кроме того, это обеспечит разработчикам составление и редактирование карт с помощью уже знакомых инструментальных средств ГИС в режиме on-line, что является немаловажным с точки зрения наполняемости и обновления такого проекта.
Отличительной особенностью нашей работы является комбинирование технологических приемов, при этом в качестве базовой технологии рассматривается классическая, предполагающая использование ГИС-инструментария известных ГИС-продуктов (MapInfo, ArcGIS и др.), относящихся к классу так называемых открытых (имеется в виду архитектура). По типу создаваемая ГИС на основе данных о заня-
тиях населения Российской империи на рубеже XIX-XX вв. относится к отраслевой, поскольку решаемые задачи привязаны, с одной стороны, к научной сфере, а с другой — должны удовлетворять массовые потребности людей, интересующихся историей страны.
Одна из главных особенностей реализуемого нами ГИС-проекта заключается в подготовке единой математической основы в современных координатах на основе датума WGS84. Поскольку проект не предусматривает специальных работ с созданием или восстановлением рельефа в ретроспективе, система высот не имеет принципиального значения. Таким образом, проблема согласования эллипсоидальной и балтийской систем отходит на второй план.
До XIX в. развитие картографической науки в России происходило довольно хаотично, созданием карт занимались разные ведомства, что не могло не отразиться на их качестве, особенно это касается точности математической основы, детальности и качества прорисовки элементов топоосновы и др. После 1809 г. наметились позитивные тенденции, являющиеся во многом следствием объединения топографических служб России и Финляндии [5]. Более точные топографические данные крупного масштаба сыграли свою роль, позволили в XIX в. повысить качество картографических произведений.
Последовательность и содержание основных этапов работы отражены в технологической схеме (рис. 1).
В качестве исходных картографических данных, подготавливаемых для ввода в ГИС (рис. 1), использованы следующие материалы:
1. Административная карта Российской империи с показанием железных и почтовых дорог с врезками Азиатской России и составных губерний. Автор карты П.Ф. Петиш, масштаб — 100 верст в английском дюйме. Карта содержит: города, станции, пути сообщения, границы (государственные, губернские, уездов).
Ввод и редактирование данных
Подготовка к вводу в ГИС картографических материалов
Согласование слоев и редактирование данных
Анализ и визуализация полученных результатов
Геокодиров ание данных из внешних источников
Картографо-статистическое моделирование
Рис 1. Технологическая схема разработки ГИС-проекта по занятиям населения Российской империи на рубеже XIX-XX вв.
2. Карта Российской империи и сопредельных с нею государств (1892-1902 гг.). Составлена к 10-летию комитета Сибирской железной дороги Э.А. Коверским. Содержит государственные границы и границы вассальных стран, границы внутреннего деления (губернии, области), а также административное деление в других государствах. На данной карте наиболее полно показаны элементы географической основы. Особенностью данной карты является отображение важных стратегических объектов государства.
3. Карта путей сообщения Российской империи (1916 г.). Разработана Отделом статистики и картографии, Москва (масштаб 1 : 12 600 000). Показаны практически все виды границ, отображены внутренние водные пути, существующие почтовые и железные дороги и строящиеся железные дороги, элементы орографии. Особенность содержания карты: указаны расстояния между населенными пунктами.
Второй блок технологической схемы (см. рис. 1) предусматривает непосредственно ввод данных, под которым понимается весь комплекс процедур — от сканирования и яркостных преобразований отдельных элементов картографического изображения до геопривязки и трансформирования в географической (точнее — геоцентрической) системе координат WGS84.
Третий блок схемы не менее важен (по сравнению с первыми двумя), поскольку простой оцифровки элементов трансформированных изображений недостаточно. Требуется тщательное соблюдение правил геометрии в плане, за что отвечают настройки топологии. Топологическая коррекция линейно-полигональных объектов оцифровки (точек, узлов, дуг, сегментов и др.) — важная и неотъемлемая часть работы, требующая большого времени.
Четвертый блок представлен многочисленными статистическим данными, прежде всего это данные переписи 1897 г. ГИС-инструментарий рабочих пакетов содержит встроенные системы управления базами данных (СУБД) и имеет возможность создавать внутренние базы данных (БД), обеспечивает их совместимость и использование для последующего пространственного анализа. Вместе с тем создавать такие БД с нуля непосредственно в самих ГИС довольно неудобно. Кроме того, нужно учитывать, что статистические БД формируются без участия ГИС. База данных переписи 1897 г. по занятиям населения была создана на платформе системы управления базами данных MySQL [6], а пользовательские отчеты формируются в среде MSAccess, MSExcel (рис. 2), а также в качестве таблиц на тематическом интернет-сайте (http://hcod.asu.ru/). Поэтому для ввода таких данных необходимо использовать такие приемы, как геокодирование и генерация новых слоев по массиву входных данных (например, по координатам).
Под геокодированием понимается привязка к электронной карте объектов, расположение которых в пространстве задается сведениями из таблиц (баз данных). Такая информация может быть представлена следующим образом [7]:
— координатами объектов (прямоугольными или географическими), координаты которых получены приемниками глобальной системы позиционирования Глонасс или Navstar;
— адресами объектов в адресной системе урбанизированных территорий;
— почтовыми индексами;
— расстоянием от начала линейных маршрутов и др.
Функция геокодирования позволяет «привязывать» базы данных, в частности статистические дан-
Г А Ш - 1---Ш .Л. G
10 Все го за н. Названия столбцов
Si Названия строк ./ 04. Вооруженные силы 16. Лишенные свободы 17. Сельское шзяиство 19. Животноводство 42. Железные дороги Общни итог
И? ± Амурская |уберння 2944 127 14791 179 12 18053
щ1 - Енисейская |уберння 3238 1823 60959 5610 2326 93956
14 Ачинский округ 290 287 16535 804 537 18453
15 Енисейский округ 143 124 8249 169 4 8689
6 Каннский округ 1436 487 16285 115 797 19120
17 Красноярский округ 1223 761 13820 129 984 16917
10 Минусинский округ 133 161 25807 4134 4 30239
Туруханский округ 10 3 3 244 0 260
20 Усинский округ 3 0 260 15 0 278
21 - ЗаСйнгалыкая область 7207 2696 70120 27433 504 107960
22 Акшинский округ 35 0 2877 2452 0 5364
23 Баргтзинский округ 2 2 1316 2810 33 4163
2. Верхнеудинский округ 781 272 17406 3592 143 22194
25 Нерчинский округ 1875 100 12557 71 144 14747
26 Нерчинск о- Завдской Округ 1197 1584 9030 150 1 11962
27 Селенгинский округ 46 15 10830 7833 13 18737
2! Троицкосавский округ 374 2 3796 659 0 4831
29 Читинский округ 2897 721 12308 9866 170 25962
Ц) - Иркутская губерния 6941 3034 76919 2221 849 89964
Рис. 2. Фрагмент БД «Профессии и занятия населения Российской империи конца XIX — начала XX в. (по материалам Всероссийской переписи населения 1897 г.)», сгруппированной по уездам/губерниям
ные, сгруппированные по уездам, губерниям и областям Российской империи (рис. 2). В этом случае вся группировка присоединяется к объекту на карте с добавлением информации во внутреннюю БД ГИС, т. е. ключом здесь является адресация объектов по наименованиям.
Назначение пятого блока предлагаемой технологической схемы заключается в картографо-статисти-ческом моделировании (КСМ), суть которого состоит в комплексировании двух видов моделей — статистической и картографической. При разработке подобных моделей мы опирались на имеющейся опыт коллег, который напрямую не связан с историей, но имеет непосредственное отношение к пространственному анализу отраслей народного хозяйства с помощью картографического метода [8].
Главная особенность картографо-статистического моделирования состоит в создании и использовании концепции поля как области континуального распределения изучаемых объектов и явлений. Создаваемые на основе главных принципов, сформулированных В.А. Червяковым [9], картографо-статистические модели и средства их наглядной визуализации позволят:
1) снимать количественную информацию в любой точке с детальностью, обусловленной разрешением изображения, и вычислять математико-статистиче-ские показатели с необходимой точностью;
2) упростить получение пространственных статистик особым визуально-картографическим способом, минуя трудоемкие процессы измерительных и вычислительных работ;
3) с помощью точечной дискретизации картографических изображений значительно сократить затраты времени на измерения, вычисления пространственных статистик и на составление производных карт (средних арифметических, средних квадратичных отклонений, корреляционных, плотностных и других показателей);
4) применять принцип динамичности (подвижности) операционных ячеек согласно методу «скользящего кружка»;
5) перейти от планового восприятия исторического процесса к объемному (трехмерному) благодаря «рельефной образности» производных (от КСМ) карт.
Заключительный (шестой) блок технологической схемы предусматривает создание компоновочных листов, оформление электронных карт, составление легенд к картам, создание тематических врезок, пояснений и сопровождающих их графиков. Данный блок схемы не является базовым, тем не менее качество, компьютерный дизайн и наглядность полученных результатов во многом будут определять семантические и прагматические возможности как отдельных произведений, так и ГИС-проекта в целом.
Разработка представленного тематического ГИС-проекта и его репрезентация в сети Интернет актуальны в контексте развития современной исторической геоинформатики [1, с. 455], а использование возможностей геоинфрмационных систем, таких как кар-тографо-статистическое моделирование, позволит расширить методическую базу исторических исследований.
Библиографический список
1. Фролов А.А. Геоинформационные технологии в современных историко-географических исследованиях отечественных историков // Вопросы географии. Сб. 136: Вопросы исторической географии. — М., 2013.
2. Кончаков Р.Б., Баранова Е.В. Геоинформационные системы в исторических исследованиях: современные тенденции // XV Державинские чтения : материалы Об-щерос. научн. конф. / отв. ред. В.В. Канищев. — Тамбов, 2010.
3. Крупочкин Е.П. Актуальные задачи разработки баз данных для целей геоархеологического картографирования // География и природопользование Сибири : сборник статей. Вып. 16 / под ред. Г.Я. Барышникова. — Барнаул, 2013.
4. Веб-ГИС // Компьютерра. № 33. 09.10.2008 [Электронный ресурс]. — URL: http://old.computerra.ru/offline/ 2008/749/371966/
5. Формирование, исследование и картографирование территории России // Национальный Атлас России. Т. 1.
Официальный сайт [Электронный ресурс]. — URL: http:// национальныйатлас.рф^1/30-37.Ыт1
6. Брюханова Е.А., Владимиров В.Н., Иванов Д.Н., Че-крыжова О.И. Информационная интернет-система «Профессии и занятия населения Российской империи конца XIX — начала XX в.» как источник для профессиовед-ческих исследований // Историческая информатика. — 2014. — № 1.
7. Тикунов В.С., Капралов Е.Г. и др. Геоинформатика / под ред. В.С. Тикунова. — М., 2005.
8. Червяков В.А., Крупочкин Е.П., Барышникова О.Н. и др. Теория и технология регионального картографического моделирования: геоинформационные подходы / под ред. В.А. Червякова. — Барнаул, 2005.
9. Червяков В.А. Результаты интеграции картографического и математико-статистического методов в исследованиях географов Сибири // География и природные ресурсы. — 2011. — № 3.