Научная статья на тему 'От количественных к цифровым методам исследований в экономической истории'

От количественных к цифровым методам исследований в экономической истории Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
404
79
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКОНОМЕТРИКА / НОВАЯ ЭКОНОМИЧЕСКАЯ ИСТОРИЯ / КОЛИЧЕСТВЕННЫЕ МЕТОДЫ АНАЛИЗА / ЕСТЕСТВЕННЫЙ ЭКСПЕРИМЕНТ / КОНТРФАКТУАЛЬНАЯ МОДЕЛЬ / МАРКОВСКИЕ ЦЕПИ / МАШИННОЕ ОБУЧЕНИЕ / ГЕОГРАФИЧЕСКАЯ ИНФОРМАЦИОННАЯ СИСТЕМА / CLIOMETRICS / NEW ECONOMIC HISTORY / QUANTITATIVE ANALYSIS METHODS / NATURAL EXPERIMENT / COUNTERFACTUAL MODEL / MARKOV CHAINS / GEOGRAPHIC INFORMATION SYSTEM

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Розинская Наталия Анатольевна, Сорокин Александр Сергеевич

В данной статье анализируются методы и подходы, используемые в литературе по экономической истории на современном этапе. С внедрением цифровых технологий во втором десятилетии XXI в., история экономики, как и другие науки, сталкивается с новыми вызовами и новыми возможностями. Снижение стоимости оцифровки информации, приводящее к накоплению огромных объемов оцифрованных данных, ведет к появлению новых методов исследований, и ряд специалистов уже говорят о методологической революции. Авторы показывают, что в последние десятилетия по мере оцифровки все большего количества исторических текстов: периодических изданий, писем, дневников, личных архивов, книг и т.д., появляются новые методы для анализа этого массива данных. В статье описывается ряд наиболее интересных исторических информационных ресурсов, являющихся основой для многочисленных проектов в области экономической истории как на макроуровне, так и на микроуровне. В этих проектах исследуются данные о ценах и доходах со всего мира, включая данные о реальном и номинальном ВВП, заработной плате, индексах цен, колебаниях индекса Dow Jones с 1885 г., процентных ставках и обменных курсах и многое другое. В статье показано, как в современных исследованиях используются математические, эконометрические и цифровые методы, позволяющие уточнять существующие теории, анализировать гораздо большие объемы данных и, кроме того, способствующие созданию новых теоретических концепций.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Розинская Наталия Анатольевна, Сорокин Александр Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Quantitative and Digital Methods of Research in Economic History

This article analyzes new methods and approaches used in the literature on economic history at the present stage. Introduction of digital technologies in the economic history in the second decade of the 21st century, faces new challenges and new opportunities. Reducing the cost of digitizing information, leading to the accumulation of huge amounts of digitized data, leads to the emergence of new research methods and a number of specialists are already talking about a new methodological revolution. The authors show that in recent decades, as more and more historical texts such as periodicals, letters, diaries, personal archives, books, etc. are digitized, new methods for analyzing the data are emerging. The article describes some of the most interesting historical information resources that form the basis for numerous projects in the field of economic history, both at the macro and micro levels. In these projects data on prices and incomes from all over the world are investigated, including data for real and nominal GDP, wages, price indices, Dow Jones fluctuations since 1885, interest rates and exchange rates, and much more. The article shows how modern research uses mathematical, economic and digital methods that allow, firstly, to clarify existing theories, analyze much larger amounts of data and, in addition, contribute to the creation of new theoretical concepts.

Текст научной работы на тему «От количественных к цифровым методам исследований в экономической истории»

www.hjournal.ru DOI: 10.17835/2076-6297.2019.11.1.115-128

ОТ КОЛИЧЕСТВЕННЫХ К ЦИФРОВЫМ МЕТОДАМ ИССЛЕДОВАНИЙ В ЭКОНОМИЧЕСКОЙ ИСТОРИИ

РОЗИНСКАЯ НАТАЛИЯ АНАТОЛЬЕВНА,

кандидат экономических наук, доцент кафедры истории народного хозяйства и экономических учений

экономического факультета, МГУ им. М. В. Ломоносова, e-mail: rozinskaya@econ.msu.ru;

СОРОКИН АЛЕКСАНДР СЕРГЕЕВИЧ,

кандидат экономических наук, доцент, доцент кафедры математические методы в экономике,

РЭУ им. Г. В. Плеханова, доцент кафедры бизнес-статистики, МФПУ «Синергия», e-mail: alsorokin@mail.ru

В данной статье анализируются методы и подходы, используемые в литературе по экономической истории на современном этапе. С внедрением цифровых технологий во втором десятилетии XXI в., история экономики, как и другие науки, сталкивается с новыми вызовами и новыми возможностями. Снижение стоимости оцифровки информации, приводящее к накоплению огромных объемов оцифрованных данных, ведет к появлению новых методов исследований, и ряд специалистов уже говорят о методологической революции. Авторы показывают, что в последние десятилетия по мере оцифровки все большего количества исторических текстов: периодических изданий, писем, дневников, личных архивов, книг и т.д., появляются новые методы для анализа этого массива данных. В статье описывается ряд наиболее интересных исторических информационных ресурсов, являющихся основой для многочисленных проектов в области экономической истории как на макроуровне, так и на микроуровне. В этих проектах исследуются данные о ценах и доходах со всего мира, включая данные о реальном и номинальном ВВП, заработной плате, индексах цен, колебаниях индекса Dow Jones с 1885 г., процентных ставках и обменных курсах и многое другое. В статье показано, как в современных исследованиях используются математические, эконометрические и цифровые методы, позволяющие уточнять существующие теории, анализировать гораздо большие объемы данных и, кроме того, способствующие созданию новых теоретических концепций.

Ключевые слова: эконометрика; новая экономическая история; количественные методы анализа; естественный эксперимент; контрфактуальная модель; марковские цепи; машинное обучение; географическая информационная система.

© Розинская Н. А., Сорокин А. С., 2019

СП

■н о см

o n

■н ■н

£

ф ш

ш <

о

ш

о <

ее

3

о

СП

■н о см

< tc

X $

ф ш

ш

QUANTITATIVE AND DIGITAL METHODS OF RESEARCH IN ECONOMIC HISTORY

NATALIA A. ROZINSKAYA,

Candidate of Economic Sciences (Ph.D.), Associate Professor of the Department of the History of National Economy and Economic

Studies, Faculty of Economics, Moscow State University M.V. Lomonosov, e-mail: rozinskaya@econ.msu.ru;

ALEXANDER S. SOROKIN,

Candidate of Economic Sciences (Ph.D.), Associate Professor of the Department of Mathematical Methods in Economics,

REU G.V. Plekhanov, Associate Professor of the Department of Business Statistics, Moscow University for Industry and Finance «Synergy»,

e-mail: alsorokin@mail.ru

^ This article analyzes new methods and approaches used in the literature on economic

^ history at the present stage. Introduction of digital technologies in the economic history in the £ second decade of the 21st century, faces new challenges and new opportunities. Reducing the # cost of digitizing information, leading to the accumulation of huge amounts of digitized data, leads to the emergence of new research methods and a number of specialists are already talking about a new methodological revolution. The authors show that in recent decades, as more and o more historical texts such as periodicals, letters, diaries, personal archives, books, etc. are iB digitized, new methods for analyzing the data are emerging. The article describes some of the g most interesting historical information resources that form the basis for numerous projects in ^ the field of economic history, both at the macro and micro levels. In these projects data on prices and incomes from all over the world are investigated, including data for real and nominal GDP, wages, price indices, Dow Jones fluctuations since 1885, interest rates and exchange rates, and much more. The article shows how modern research uses mathematical, economic and digital methods that allow, firstly, to clarify existing theories, analyze much larger amounts of data and, in addition, contribute to the creation of new theoretical concepts.

Keywords: cliometrics; new economic history; quantitative analysis methods; natural experiment; counterfactual model; Markov chains; geographic information system.

JEL: B4; C02; N01; N10

§ Введение

со Целью данной статьи является обзор развития методологических подходов, возникших

< вследствие эконометрической и цифровой революции и последующих связанных с этим о процессом изменений, а также демонстрация того, как эти новые подходы были (и могут з быть в будущем) использованы для решения задач как в традиционных, так и новых областях экономической истории. Фокус работы состоит не в том, чтобы дать полное описание всех технических свойств каждого метода, но в обосновании целесообразности использования данных методов в научных исследованиях. ^ Одной из причин появления в 1960-х гг. «Клиометрики» и роста количественных

^ методов в научных исследованиях являлось распространение компьютеров. Согласно о С. Уильямсону, «эволюция термина (клиометрика) с годами привела к следующему

приемлемому определению: клиометрика — это применение экономической теории и количественных методов для описания и объяснения исторических процессов и явлений в сфере экономического развития» (Уильямсон, 1996). Впервые термин "клиометрика" появился в конце 1960 г. на страницах журнала Journal of Economic History, в публикации Джона Хьюгса, Лансома Дэвиса и Стэна Ритера (автором термина считается Стэн Ритер). А ЭВМ впервые была использована в работе «Первые 1945 британских пароходов» Хьюгса и Ритера, опубликованной в 1958 г. (Уильямсон, 1996).

Однако стоит отметить, что клиометрика второй половины XX в. в основном была сосредоточена на задаче переформулировки неопределенных теорий в строго определенные и проверяемые утверждения, и только новые количественные и цифровые методы, получившие распространение в конце XX в., позволили не только посчитать и количественно представить те взаимосвязи, которые уже ранее были описаны в литературе, но обнаружить и количественно исследовать новые.

С внедрением цифровых технологий во втором десятилетии XXI в., история экономики, как и другие науки, сталкивается с новыми вызовами и новыми возможностями. Снижение стоимости оцифровки информации, приводящее к накоплению огромных объемов оцифрованных данных, ведет к появлению новых методов исследований, и ряд специалистов уже говорят о новой методологической революции, так как эти события в корне меняют процесс научных открытий (King, 2011).

В данной статье авторы анализируют ряд методов и подходов, связанные с цифровизацией (digital-driven methods) и представляющих, по мнению авторов, наибольший интерес.

Возможность использовать цифровые методы распространяется по мере появления новых источников данных. Существует ряд весьма успешных крупных проектов создания баз макроданных. Clio-Infra собрала исторические макроданные для анализа глобального неравенства и благосостояния в мире (Van Zanden, Baten and van Leeuwen, 2014). Также стоит отметить базы данных таких ресурсов, как EH.net, MeasuringWorth. com и Global Price and Income History Group (http://gpih.ucdavis.edu), где можно найти данные о ценах и доходах за период до 1950 г. со всего мира, включая данные для реального и номинального ВВП США (с 1790 г.), Великобритании (с 1300 г.), Японии (с 1879 г.), заработной платы, индексов цен, ежедневных значений закрытия Dow Jones с 1885 г., процентные ставки и обменные курсы, цены на французскую пшеницу в XIX в. со

и даже образцы завещаний из Новой Англии XVII и XVIII вв.. о

Кроме того, становятся доступными подробные данные о регионах, которые ^ раньше крайне редко являлись предметом исследования. Новые исторические данные для Восточной Азии создают новые возможности для историко-экономических исследований в этом регионе. Появляющиеся исторические базы данных о населении позволяют проводить крупномасштабные сравнительные экономико-демографические исследования подобные таким, как «Народонаселение и семейная история Евразии». ф Особый интерес среди многочисленных исследований по Китаю вызывает проект, со предполагающий составление баз данных по государственным служащим и данных о

о с

■н ■н

£

об уровне образования китайских элит. Составители этих баз данных предполагают их |—

использовать для анализа процесса наследования богатства несколькими поколениями, _i

для более глубокого понимания родственных связей в течение нескольких столетий g

в различных исторических контекстах. Также они планируют провести исследование F

изменений, имевших место на рынке труда в различных регионах за этот период: ь

посмотреть, как менялась мотивация для выбора профессий, стратегия карьеры, w

причины повышения и понижения в должности, особенно в периоды кризисов (Dong,

Campbell and Kurosu, 2015; Fourie, 2016). °

Данные базы Seshat: Global History Databank активно используются исследователями ^

для эмпирического тестирования теорий, анализирующих процессы социальной з

о

СП

■н о см

■н ■н

организации индивидов, эволюции государственных структур и др. Авторы оценивают влияние эволюции специализированных структур управления на такие факторы, как население, территориальная экспансия, социальная стратификация, предоставление общественных благ и функционирование информационных систем (Turchin, Brennan and Currie, 2015).

Наиболее интересными нам показались подходы, которые позволили современной экономической истории бросить вызов одному из основных утверждений, что история не может обеспечить научное доказательство, потому что невозможно подвергнуть уникальные исторические события экспериментальному анализу. Напротив, клиометрики показали, что такое экспериментирование возможно путем построения контрфактических моделей, которое может быть использовано для измерения отклонения между тем, что произошло на самом деле, и тем, что могло произойти при разных обстоятельствах, а также путем использования метода естественного эксперимента.

Эти методологические принципы, возможно, наряду с историческим анализом временных рядов, являются самым важным вкладом клиометрики в области социальных наук в целом и экономической истории в частности. Остановимся подробнее на этих двух методах, а затем рассмотрим, как в экономической истории используются цифровые методы, в частности машинное обучение.

Естественный эксперимент

Ставший относительно недавно очень популярным естественный эксперимент (не путать с полевым) является инструментом, с помощью которого можно тестировать ^ прошлое и его связь с настоящим — есть ли причинно-следственная связь, предсказанная Ф теорией и не вызвана ли корреляция, которую мы наблюдаем в данных, обратной или

двусторонней зависимостью (Berger and Frey, 2017). ^ В России естественный эксперимент стал широко известен благодаря работам

m Д. Асемоглу. Так как в российской литературе существует большое количество

< публикаций с изложением нарративной части концепции Д. Асемоглу, в данной статье

0 предлагается описать его эконометрическую модель.

^ К идее естественных экспериментов Д. Асемоглу обратился в поисках доказательства

влияния институтов на развитие. Он попытался показать зависимость роста ВВП в ряде

< африканских стран на современном этапе от уровня смертности европейцев на этих § территориях в колониальный период (Acemoglu, Johnson and Robinson, 2001, p. 1373). j Обращение к прошлому и правильный выбор инструментальной переменной позволили £ ему выявить причинно-следственные связи и решить проблему эндогенности, то есть,

1 использую инструментальную переменную уровня смертности первых европейских

s

< поселенцев, показал направление причинно-следственной связи между качеством te

институтов и экономическим ростом.

Асемоглу выдвинул следующую гипотезу: основной детерминантой роста со экономики развивающихся стран является институциональная система. Современная Q институциональная система бывших колониальных стран зависит от того, какие ¡2 институты были созданы в колониальный период, а это в свою очередь зависело от _i количества европейских переселенцев и продолжительности их пребывания в колониях.

< -.—Ig Последнее, с точки зрения Асемоглу, определялось уровнем смертности европейских

F поселенцев (смертность в колониальный период => количество европейских поселенцев

tz => институты в колониальный период => институты на современном этапе => рост ВВП).

w Данная гипотеза была подтверждена при расчете эконометрической модели на

основе статистических данных (Acemoglu et al., 2001, p. 1369-1401), где в качестве

^ основной инструментальной переменной использовалось значение уровня смертности

2 поселенцев соответствующей колонии. В общем виде спецификацию модели Асемоглу

3 можно представить в виде рекуррентных эконометрических уравнений: о

^ у. = 0О + в Я + в + (1)

Я Л+в с + X'. в+ (2)

С = в + в 5 + X в + (3)

= 0О + 011п М. + Х\02 + (4)

Я 00 + 011п М. + X'. 02 + , (5)

где у — доход на душу населения в стране I в 1995 г.;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Я; — индекс защищенности от экспроприации (уровень развития институтов) в стране I в 1985-1995 гг.;

С{ — уровень развития институтов, т.е. индекс защищенности от экспроприации, в 1900 г.;

— доля европейских поселенцев в 1900 г.;

М. — смертность европейских поселенцев XVII—XIX вв.;

X'. — вектор прочих независимых переменных;

— случайная ошибка.

Проведенные авторами оценки данной модели с помощью двухшагового метода наименьших квадратов (ДМНК) оказались статистически значимыми и позволили установить ряд следующих важных результатов. Во-первых, была подтверждена выдвинутая гипотеза о положительной зависимости между современным экономическим развитием территорий бывших колоний и качеством функционирующих на них институциональных систем, основы которых закладывались колонизаторами исходя из логики выживаемости на данных территориях. В соответствии с подобной логикой, колонии, обладающие благоприятной средой обитания для формирования поселений, с точки зрения низкого уровня смертности получали должное формирование институтов, включая защиту прав частной собственности и ограничение возможностей правительства. В свою очередь, территории с менее благоприятной средой стратегически рассматривались колонизаторами исключительно как источник ресурсной базы, что подразумевало соответствующий стиль управления.

Во-вторых, на основании проведенной оценки модели было установлено, что выбранная инструментальная переменная уровня смертности среди колонизаторов позволяет объяснять более 25% вариации в институциональном развитии современных бывших колоний (коэффициент детерминации уравнения (5) составляет 0,25), более того, полученные результаты оказались устойчивыми при добавлении авторами в виде фиктивных переменных факторов, присущих конкретным территориям, таких как климат, качество почвы и минеральных ресурсов, география происхождения поселенцев, а также их этнолингвистическая фрагментация. В свою очередь, полученные оценки также свидетельствуют о том, что более 50% в вариации исследуемой переменной экономического развития (коэффициент детерминации уравнения (1) составляет 0,5), определяемой в виде дохода на душу населения, объясняется вариацией в развитости современных институтов на территории рассмотренных в работе стран, бывших колониями. ^

В-третьих, важно отметить качество выбранной авторами инструментальной 2 переменной — уровня смертности, позволившей обойти проблему эндогенности, зачастую ¡2 возникающую при проведении историко-экономических исследований. В частности, ¡^ в рамках рассмотренной авторами темы, потенциальным источником эндогенности — может служить тот факт, что более богатые страны могут позволить себе большую развитость нужных институтов, также нельзя отвергать фактор предрасположенности авторов индекса институционального развития к естественному отклонению в пользу более богатых стран. Однако, авторами было показано отсутствие прямой связи между

ш

использованными зависимой и инструментальной переменными, экономическим ростом и уровнем смертности колонизаторов, в то время как последняя оказывает непосредственное воздействие на важнейший предиктор построенной модели — развитость институтов. Подобный подход позволил снизить отрицательное воздействие явления эндогенности на точность полученных в исследовании результатов.

Контрфактуальный анализ

Использование контрфактуальных моделей также приближает экономическую историю к точным наукам, так как позволяет посчитать цену (издержки) альтернативного варианта развития событий.

Попытки анализировать альтернативные варианты появились относительно давно. Одним из первых примеров можно назвать работу 1931 г. «Если бы это случилось иначе» (If It Had Happened Otherwise) (Squire, 1931), среди авторов которой был и Уинстон Черчилль, который попытался ответить на вопрос, что произошло бы, если бы Роберт Э. Ли выиграл в битве при Геттисберге (Churchill, 1961).

Среди наиболее известных историков, пытавшихся смоделировать альтернативное прошлое, оставаясь в рамках нарративного изложения, можно также назвать английского ^ ученого A. Тойнби. Несмотря на то, что его работы отличает от просто воображаемых ° историй серьезность изложения, они представлены в описательной форме без какого-■н либо анализа сценариев, то есть нельзя сказать, что они соответствуют стандартам z: контрафактуальной истории, скорее они ближе к жанру альтернативной истории. ^ Только с началом использования количественных методов альтернативные теории

s приобретают определенную научность. Этот период связан с именем Роберта Фогеля, который использовал контрафактуальную модель, чтобы измерить влияние железной ® дороги на экономический рост в СШA (Фогель, 1964).

'! Следующим шагом в превращении контрфактуальной истории в академическую

^ науку можно назвать публикацию в 1991 г. работы под названием «Правдоподобные

< Миры: Возможность и понимание в истории и социальных науках» (Plausible Worlds: g Possibility and Understanding in History and the Social Sciences) Кембриджским

социологом Джеффри Хоторном, который попытался рассмотреть альтернативные сценарии для трех разновременных исторических сюжетов (Hawthorn, 1991).

К концу 1990-х гг. контрфактуальный метод становится настолько широко распространенным, что попадает в учебники по истории. В первом издании Studying History в 1997 г. существует уже не только упоминание, но целый параграф посвящен контрфактуальной истории (Black and MacRaild, 2016). В этой же работе авторы дают ставшее общепринятым определение контрфактуальному методу исследования истории: контрфактуальная история (counterfactuals) — есть способ исследования прошлого путем предположения того, что могло быть и чего не могло быть (Black and MacRaild, 2016, p. 124). В конце 1990-х сторонником и популяризатором контрфактуального подхода ¡^ становится известный британский историк Найл Фергюсон (автор «Восхождения ^ денег»). Под его редакцией выходит Virtual History: Alternatives and Counterfactuals (Ferguson, 1997), сборник эссе, посвященный различным сценариям и призванный

СГ)

продемонстрировать отсутствие детерминированности исторического процесса. 2 Используя контрфактуальный подход, он пытался показать, что изменения отдельных р конкретных фактов или событий могло радикально изменить дальнейший ход истории.

о5 В 1999 в серии «Что, если?» под редакцией Робертом Коули выходит первая коллекция

^ статей, использующих контрфактуальный подход. Эта работа и последующие выпуски о представляли десятки эссе различных историков о том, «как небольшой поворот судьбы

< в решающий момент мог изменить летописи времени» (Cowley, 1999).

< te

X $

er

3

о

Следующий очередной всплеск интереса и активизация дискуссии о пользе контрфактуальных моделей связан с работой Рэнсона 2005 г. The Confederate States

of America: What Might Have Been, где автор попытался создать модель, в которой конфедераты победили в гражданской войне (Ranson, 2005). Кроме того, главу, основанную на контрфактуальном подходе, можно найти и в книге «Кембриджская экономическая история Европы нового и новейшего времени» (Бродберри и О'Рурк, 2015, с. 367-405). Таким образом, можно сказать, что метод прочно завоевал позиции в академической науке.

Одна из целей создания контрфактуальных моделей — оценить относительную историческую значимость конкретного события или человека. Некоторые ученые утверждают, что контрфактуальный метод — это не столько вопрос того, что происходило в прошлом, но и несогласие в отношении того, какие прошлые события были наиболее значимыми. Например, Уильям Томпсон использует контрафактуальный подход для выявления наиболее значимых событий с точки зрения влияния на глобализацию. Он исследует альтернативные сценарии для ведущих экономик мира последнего тысячелетия от династии Сун в Китае, включая Геную, Венецию, Португалию, Нидерланды, Великобританию и Соединенные Штаты Америки, и утверждает, что каждый действующий фактор сыграл необычайно важную роль в создании структуры лидерства, которая со временем становилась все более глобальной по своим масштабам (Thompson, 2010).

Для контрфактуального моделирования используются различные количественные методы. В России первые контрфактуальные модели появляются в 1990-е гг. в работах И. Д. Ковальченко (1987), в настоящее время в рамках данного подхода работает Бородкин Л. И., строя модели на основе использования марковских цепей (1996). Краткое изложение основных идей авторов можно найти в российской литературе (Латов, 2012), здесь же мы хотели бы остановиться на кратком описании метода, используемого в данных работах.

В общем виде метод марковских цепей состоит в генерации выборок данных, распределение которых в требуемой степени позволяет аппроксимировать распределение исследуемого процесса. В современной литературе представлено множество способов реализации данного метода с помощью различных алгоритмов (Deka, Birklykke and Duwe, 2018). Важнейшей особенностью метода, обуславливающей широкий потенциал его применения в рамках исследований исторического характера, является возможность моделирования динамики рассматриваемого процесса, обладающего значительной случайной составляющей (Bharucha-Reid, 1960; Springer-Verlag, 1999). По своей сути, метод марковских цепей позволяет проводить статистический анализ процесса перемещения системы из одного исторического состояния в другое и, соответственно, строить прогнозы будущих тенденций движения (Lee and Chen, 2006; Mode and Sleeman, 2004). Среди преимуществ данного метода необходимо отметить слабую зависимость от конкретных исторических данных, в частности статистических выбросов, а также высокую степень точности и адаптивности. Значительный потенциал метода применительно к историческим исследованиям может быть проиллюстрирован на примере работ Л. И. Бородкина, в частности — описывающей возможности использования принципа Ш марковских цепей для построения имитационных моделей, реконструирующих отсутствующие или неполные данные рассматриваемого исторического процесса с сохранением логической структуры и временной последовательности его имитируемых составляющих.

Другим интересным примером использования контрфактуального метода в российской литературе является модель Р. Аллена, изложенная в работе «От фермы к фабрике...», где автор c помощью имитационной модели пытается ответить на вопрос, что послужило решающим фактором быстрого индустриального роста в период сталинской индустриализации — государственный террор или субсидирование создания < рабочих мест (Аллен, 2013, с. 202). Подробнее о модели Аллена можно ознакомиться в ^ работе (Латов, 2012, с. 66-68). о

ф

ф

Микроданные в экономической истории

Все более распространенным способом анализа исторических событий является использование оцифрованных микроданных (переписи населения, записи актов о рождении, записи зачисления на военную службу, брачные свидетельства) для оценки причин и следствий мобильности, связи поколений, последствий экономических событий и экономической политики. Например, таких как интегрированная база микроданных для общественного использования IPUMS, которая предоставляет результаты переписей и обследований со всего мира. Или, например, микроданные Североатлантического региона — проект интегрированных общественных микроданных (Ruggles, Roberts and Sarkar, 2011; Ruggles, Genadek and Goeken, 2015), данные которого стали основой для недавних экономико-исторических исследований в области миграционных процессов (Abramitzky, Boustan, and Eriksson, 2014; Long and Ferrie, 2013).

Кроме того, стоит отметить проект LIFE-M, который иллюстрирует возможности использования новых данных, новые методы и новые подходы их анализа. Проект использует данные переписей с 1880 по 1940 г. Цель проекта — исследовать сочетание записей о рождении, военной службе, браке, смерти с данными переписей для создания базы данных из четырех поколений, впервые включая значительное число женщин и 3 различных групп меньшинств (Bailey, Cole and Henderson, 2017).

см Интересными базами для использования микроданных являются оцифрованные

,гН реестры церковных книг, являющихся основой для исследования основных счетных

01

2 навыков населения и, следовательно, базового уровня образования и его влияния ^н на различные переменные и на долгосрочный экономический рост, роль религии

I в формировании человеческого капитала (Becker and Woessmann, 2009), гендерное

^ неравенство (De Moor and Van Zanden, 2010), рынок труда (Charette and Meng, 1998).

Еще одним интересным проектом, основанном на оцифровке микро-данных, можно

I назвать проект Д. Эдельштейна и др., в рамках которого исследователи отслеживают

m социальную сеть европейских ученых в XIX в., изучая, какие изменения данная сеть

< претерпела со временем. Анализ данной сети позволяет проследить развитие идей,

0 влияние одних ученых на других и другие малоизученные аспекты интеллектуальной ^ жизни Европы XIX в.

^ Также стоит отметить работу Х. Мейя, где автор рассматривает взаимосвязь между

< социальными сетями и предпринимательством, создавая динамическую социальную § сеть из архивных записей (Mejia, 2018). Мейя показывает, как сеть, образуемая элитой ^ общества, способствовала модернизации общества, преодолевая сложности, связанные £ с проблемными географическими условиями, неудачами становления рыночной

1 экономики и слабыми государственными институтами, на примере Антиокии конца

< XIX — начала XX вв. (Колумбия). Используя эти данные, он оценивает, как решение о создании промышленных фирм было связано с позицией отдельных участников

ij? социальной сети. Он обнаруживает, что индивиды, принадлежащие к более высоким w слоям общества, объединяющиеся в сеть, более активно участвовали в промышленном предпринимательстве. Обоснование этих результатов заключается в том, что промышленное предпринимательство представляет собой очень сложную деятельность, которая требует широкого разнообразия дополнительных ресурсов. Сети, таким образом, стали заменой рынкам для получения доступа к этим ресурсам. То есть лица, имеющие возможность использовать сети, члены которых располагали широким набором ресурсов, tz имели сравнительные преимущества в промышленном предпринимательстве.

I—

ф

~ Машинное обучение

^ Распознавание текстов с помощью машинного обучения становится важной частью

исследований по экономической истории. Оцифровка книг и создание больших баз данных

3 позволили М. Гентсков и Дж. Шапиро в своих работах использовать технологии машинного Ç обучения. На основании частоты использования в газетах определенных слов, которые более

вероятно используются демократами или республиканцами, они смогли сделать выводы о содержании и идеологической принадлежности газет (Gentzkow and Shapiro, 2011).

Общий принцип машинного обучения состоит в том, чтобы используемые для изучения какого-либо процесса инструментальные программируемые средства позволяли более точно прогнозировать его поведение без введения дополнительной специальной информации. Базовая идея подобного обучения заключается в использовании алгоритма, позволяющего с помощью аппарата статистического анализа на основе вводимых данных строить прогнозы их значений, постоянно обновляемые при поступлении новой информации. Таким образом, принцип машинного обучения является схожим с применяемым в области интеллектуальной обработки и прогнозировании данных и основывается на анализе и выделении исторических паттернов и соответствующей подстройке работы используемой программы. В общем виде процесс машинного обучения может быть описан с помощью следующих 4 шагов (Shalev-Shwartz and Ben-David, 2014):

1. Формулировка задачи обучения. Данная задача может представлять собой классификацию данных, их группировку, прогнозирование новых значений и т.д. В зависимости от постановки задачи выбирается наиболее подходящий для ее решений алгоритм машинного обучения.

2. Сбор данных и их обработка. Качество машинного обучения непосредственным образом зависит от качества используемых данных.

3. Обучение разрабатываемой модели на данных с помощью выбранного принципа.

4. Оценка качества построенной модели. На данном этапе проводится сравнение точности аппроксимации исследуемого процесса построенной моделью. Далее процесс обучения либо завершается, либо, в случае необходимости, производится переход к альтернативной стратегии обучения.

Д. Диттмар и С. Сиболд использовали похожие методы для изучения влияния конкуренции между типографиями, выпускающими разного рода литературу в средневековой Германии в распространении идей протестантизма и институциональных изменений во время протестантской реформации (Dittmar and Seabold, 2015). Авторы выдвинули следующую гипотезу: наличие конкуренции типографий в городах способствовало распространению протестантских идей.

Первоначальной задачей исследователей было классифицировать литературу, со

выпускаемую в этот период (религиозная/нерелигиозная, католическая/протестантская). о

Для этого был составлен словарь фраз, свойственных католическим текстам и ^

отдельно словарь фраз, свойственных протестантским текстам. Затем, используя

мультиноминальную логистическую регрессию, авторы находят, какое количество

протестантской литературы публиковалось в различных городах в исследуемый период.

Далее, используя эти данные, они рассматривают зависимость количества выпущенных

протестантских книг в городе от количества типографий в городе с помощью следующей ф

линейной модели регрессии: ся

ш

protest = afirm + ßx + е, (6)

о с

■н ■н

£

где protest — количество протестантской литературы, выпущенной в конкретном ^

городе за период 1518-1554 гг.; 2

firm — число типографий, функционирующих за период 1508-1517 гг.; ¡2 x — переменная, отвечающая за фиксированный эффект влияния на областные

предпочтения городов в зависимости от их принадлежности тем или иным княжествам —

Ll_

и землям. о

<

Полученные авторами результаты позволили им сделать следующий вывод: если QC бы технология являлась решающим фактором в распространении протестантской о

идеологии, как это считалось ранее, то следовало бы ожидать, что наиболее отчетливая разница будет наблюдаться между городами, где были типографии и городами, где типографий не было. Если решающее значение имела конкуренция, то наиболее разительным будет различие между городами с монополиями (одна типография) и городами с двумя или тремя типографиями. Построенная авторами модель позволила прийти к заключению, что решающим было все же наличие конкуренции.

Выводы

Потенциальные преимущества подходов и методов работы с большими данными (big data) для экономической истории огромны. Правда, стоит отметить, что экономико-исторические данные демонстрируют значительную неоднородность по многим параметрам, что значительно усложняет их анализ. Из основных проблем работы с историческими данными можно отметить следующие: оцифровка больших файлов сложна; первичные данные различаются по языку, пространству, времени, весам и мерам; теоретический анализ на стадии спецификации моделей охватывает огромное количество переменных.

Но, несмотря на все сложности, связанные с использованием больших данных, 3 экономическая история будет становиться все более точной наукой. По мере упрощения см сбора и оцифровки данных среднестатистические экономисты все больше будут ,гН использовать прошлое в качестве естественного эксперимента, чтобы узнать больше об 2 экономике. По мере роста исторических баз данных все больше исследователей смежных дисциплин (экономика, социология, политология) будут обращаться к истории.

■н ■н

^ СПИСОК ЛИТЕРАТУРЫ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

>1 Аллен Р. (2013). От фермы к фабрике. Новая интерпретация советской промышленной

го революции. М.: Российская политическая энциклопедия (РОССПЭН). о Бородкин Л. И. (1996). Математические модели в исторических исследованиях:

< deus ex machina? Математическое моделирование исторических процессов. М.: изд-во g Мосгорархив.

g Ковальченко И. Д. (1987). Методы исторического исследования. М.: Наука.

Кембриджская экономическая история Европы нового и новейшего времени. (2015) / Под ред. С. Бродберри, К. О'Рурк. Т. 2. М.: Издательство института Гайдара.

Латов Ю. (2012). Клио берет калькулятор // Journal of Institutional Studies, Т. 4, № 2, с. 50-73.

Уильямсон С. (1996). История клиометрики в США (перевод А. Н. Полевой) Экономическая история. Обозрение / Под ред. В. И. Бовыкина и Л. И. Бородкина.

I Вып. 1. М.: Обозрение, с. 75-107.

Abramitzky, R., Boustan, L. and Eriksson, K. (2014). A Nation of Immigrants: Assimilation and Economic Outcomes in the Age of Mass Migration // Journal of Political Economy, 122(3), ш 467-506.

§ Acemoglu, D., Johnson, S. and Robinson, J. A. (2001). The colonial origins of comparative

w development: An empirical investigation // American Economic Review, 91(5), 1369-1401. < Bailey, M. J., Cole, C., Henderson, M. and Massey, C. (2017). How Do Automated

о Methods Linking Perform? Evidence from New Ground Truth, unpublished manuscript 3 (http://www-personal.umich.edu/~baileymj/Bailey_Cole_Henderson_Massey.pdf - Дата обращения:17.01.2018).

Becker, S. O., and Woessmann, L. (2009). Was Weber wrong? A human capital theory of о Protestant economic history // Quarterly Journal of Economics, 124(2), 531-596. ^ Berger, T. and Frey, C. (2016). Did the Computer Revolution shift the fortunes of US

cities? Technology shocks and the geography of new jobs // Regional Science and Urban о Economics, 57, 38-45

CD

Berger, T. and Frey, C. (2016). Structural transformation in the OECD: Digitalisation, deindustrialisation and the future of work. OECD Social, Employment and Migration Working Papers, 193, OECD Publishing, Paris.

Berger, T. and Frey, C. (2017). Regional technological dynamism and noncompete clauses: Evidence from a natural experiment. // Journal of Regional Science, 57(4), 655-668.

Bharucha-Reid, A. T. (1960). McGraw-Hill Book Company, Inc; Elements of the Theory of Markov Processes and Their Applications.

Black, J. and MacRaild, D. (2016). Studying History. Macmillan Education UK.

Charette, M. F. and Meng, R. (1998). The determinants of literacy and numeracy, and the effect of literacy and numeracy on labour market outcomes // Canadian Journal of Economics, 31(3), 495-517.

Churchill, W. (1961). If Lee Had Not Won the Battle of Gettysburg // Wisconsin Magazine of History, 44(4).

Cowley, R. (1999). What if. Military History Quarterly.

Deka, B., Birklykke, A., Duwe, H., Mansinghka, V. and Kumar, R. (2014). Markov chain algorithms: a template for building future robust low-power systems // Philos Trans A Math Phys Eng Sci., Jun 28; 372: doi: 10.1098/rsta.2013.0277

De Moor, T. and Van Zanden, J. L. (2010). Every woman counts: A gender-analysis of numeracy in the Low Countries during the early modern period // Journal of Interdisciplinary History, 41(2), 179-208.

Dittmar, J. and Seabold, S. (2015). Media, markets and institutional change: evidence fromthe Protestant Reformation. CEP Discussion Papers, CEPDP1367. Centre for Economic Performance, London School of Economics and Political Science, London, UK.

Dong, H., Campbell, C., Kurosu, S., Yang, W., and Lee, J. Z. (2015). New Sources for Comparative Social Science: Historical Population Panel Data From East Asia // Demography, May, 1-28.

Fogel, R. (1964). Railroads and American Economic Growth: Essays in Econometric History. Baltimore: Johns Hopkins Press.

Fourie, J. (2016). The Data Revolution in African Economic History // Journal of Interdisciplinary History, 47(2), 1-20.

Gentzkow, M. and Shapiro, J. (2011). Ideological Segregation Online and Offline // The Quarterly Journal of Economics, 126, 1799-1839. <j>

Hawthorn, J. (1991). Plausible Worlds: Possibility and Understanding in History and o the Social Sciences. Cambridge University Press. ^

King, G. (2011). Ensuring the Data-Rich Future of the Social Sciences // Science, 331(6018), 719-721.

Long, J., and Ferrie, J. (2013). Intergenerational Occupational Mobility in Great Britain and the United States Since 1850 // The American Economic Review, 103(4), 1109-1137.

Lee, H. and Chen, S. (2006). Why use Markov-switching models in exchange rate prediction. Economic Modelling, 23, 662-668. co

Mejia, J. (2018). Social Networks and Entrepreneurship. Evidence from a Historical q

о с

■н ■н

£

Episode of Industrialization (http://wehc2018.org/wp-content/uploads/2018/07/Mejia.pdf — i—

Дата обращения: 18.08.2018). _j

Nunn, N. and Qian, N. (2011). The Potato's Contribution to Population and g

Urbanizoation: Evidence from a Historical Experiment // The Quarterly Journal of f

Economics, 126, 593—650. Ц

Pomeranz, K. (2006). China, Europe and Industrialization, in Unmaking the West: w

"What-If' Scenarios that Rewrite World History, ed. Philip E. Tetlock, Richard Ned Lebow,

and Geoffrey Parker. University of Michigan Press. °

Ranson, R. (2005). The Confederate States of America: What Might Have Been. New ^

York: W.W. Norton. %

о

< ro

X

U)

Ruggles, S., Roberts E., Sarkar S. and Sobek M. (2011). The North Atlantic Population Project: Progress and Prospects // Historical Methods: A Journal of Quantitative and Interdisciplinary History, 44 (1), 1-6.

Ruggles, S., Genadek, K., Goeken, R., Grover, J. and Sobek, M. (2015). Integrated Public Use Microdata Series: Version 6.0 [Machine-Readable Database]. Minneapolis, Minn.: University of Minnesota.

Shalev-Shwartz, S. and Ben-David, S. (2014). Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press.

Squire, J. (1931). If It Had Happened Otherwise. Longmans, Green.

Springer-Verlag, L. Inc. (1999). Numerical Analysis for Statisticians.

Thompson, W. (2010). The Lead Economy Sequence in World Politics (from Sung China to the United States): Selected Counterfactuals // Journal of Globalization Studies, 1(1),6-28

Turchin, P., Brennan, R., Currie, T., Feeney, K., Francois, P., Hoyer, D., and Manning, J. (2015). Seshat: The Global History Databank // Cliodynamics: The Journal of Quantitative History and Cultural Evolution, 6(1).

Van Zanden, L., Baten, J. and van Leeuwen, P. (2014). The Changing Shape of Global Inequality 1820-2000; Exploring a New Dataset // Review of Income and Wealth Series, 60(2).

Wrigley, E. A. and Schofield, R. S. (1989). The Population History of England 1541-1871.

CD ■H

cm Cambridge University Press.

REFERENCES

s Allen, R. (2013). Farm to Factory: A Re-interpretation of the Soviet Industrial Revolution.

£ M.: Russian Political Encyclopedia (ROSSPEN). (In Russian).

# Borodkin, L. I. (1996). Mathematical models in historical studies: deus ex machina?

Mathematical modeling of historical processes. M.: Publishing House of Moscow City. (In Russian).

o Kovalchenko, I. D. (1987). Methods of historical research. M.: Science. (In Russian).

iB Cambridge Economic History of Europe of a New and Modern Time (2015) / Ed.

g Broadberry, S., O'Rourke, K. T. 2. M.: Gaidar Institute Press. (In Russian). ^ Latov, Y. (2012). Clio takes the calculator. Journal of Institutional Studies. 4(2), 50—73.

(In Russian).

Williamson, S. (1996). History of cliometrics in the United States (translated by A. N. Field) Economic history. Review Ed. V. I. Bovykina and L. I. Borodkina. Issue 1. M.: Review, 75-107. (In Russian).

Abramitzky, R., Boustan, L. and Eriksson, K. (2014). A Nation of Immigrants: Assimilation and Economic Outcomes in the Age of Mass Migration. Journal of Political Economy, 122(3), 467-506.

Acemoglu, D., Johnson, S., and Robinson, J. A. (2001). The colonial origins of comparative development: An empirical investigation. American Economic Review, 91(5), 1369-1401. ljj Bailey, M. J., Cole, C., Henderson, M. and Massey, C. (2017). How Do Automated

§ Methods Linking Perform? Evidence from New Ground Truth. Unpublished manuscript (http://www-personal.umich.edu/~baileymj/Bailey_Cole_Henderson_Massey.pdf — Access < Date: 17.01.2018).

o Becker, S. O. and Woessmann, L. (2009). Was Weber wrong? A human capital theory of

3 Protestant economic history. Quarterly Journal of Economics 124(2), 531—596.

Berger, T. and Frey, C. (2016). Did the Computer Revolution shift the fortunes of US cities? Technology shocks and the geography of new jobs. Regional Science and Urban Economics, 57, 38—45.

Berger, T. and Frey, C. (2016). Structural transformation in the OECD: Digitalisation, deindustrialisation and the future of work. OECD Social, Employment and Migration Working Papers, No. 193, OECD Publishing, Paris.

Berger, T. and Frey, C. (2017). Regional technological dynamism and noncompete clauses: Evidence from a natural experiment. Journal of Regional Science, 57(4), 655-668.

Bharucha-Reid, A. T. (1960). McGraw-Hill Book Company, Inc; Elements of the Theory of Markov Processes and Their Applications.

Black, J. and MacRaild, D. (2016). Studying History. Macmillan Education UK.

Charette, M. F., and Meng, R. (1998). The determinants of literacy and numeracy, and the effect of literacy and numeracy on labour market outcomes. Canadian Journal of Economics, 31(3), 495-517.

Churchill, W. (1961). If Lee Had Not Won the Battle of Gettysburg. Wisconsin Magazine of History, 44(4).

Cowley, R. (1999). What if. Military History Quarterly.

Deka, B., Birklykke, A., Duwe, H., Mansinghka, V. and Kumar, R. (2018). Markov chain algorithms: a template for building future robust low-power systems. Philos Trans A Math Phys Eng Sci. 2014 Jun 28; 372: doi: 10.1098/rsta.2013.0277

De Moor, T., and Van Zanden, J. L. (2010). Every woman counts: A gender-analysis of numeracy in the Low Countries during the early modern period. Journal of Interdisciplinary History, 41(2), 179-208.

Dittmar, J. and Seabold, S. (2015). Media, markets and institutional change: evidence fromthe Protestant Reformation. CEP Discussion Papers, CEPDP1367. Centre for Economic Performance, London School of Economics and Political Science, London, UK.

Dong, H., Campbell, C., Kurosu, S., Yang, W. and Lee, J. Z. (2015). New Sources for Comparative Social Science: Historical Population Panel Data From East Asia. Demography, May, 1-28.

Fogel, R. (1964). Railroads and American Economic Growth: Essays in Econometric History. Baltimore: Johns Hopkins Press.

Fourie, J. (2016). The Data Revolution in African Economic History. Journal of Interdisciplinary History, 47(2), 1-20.

Gentzkow, M. and Shapiro, J. (2011). Ideological Segregation Online and Offline. The Quarterly Journal of Economics, 126, 1799-1839.

Hawthorn, J. (1991). Plausible Worlds: Possibility and Understanding in History and the Social Sciences. Cambridge University Press.

King, G. (2011). Ensuring the Data-Rich Future of the Social Sciences. Science, 331(6018), co 719-721. o

CM

Long, J. and Ferrie, J. (2013). Intergenerational Occupational Mobility in Great Britain ^

and the United States Since 1850. The American Economic Review, 103(4), 1109-1137. o

Lee, H. and Chen, S. (2006). Why use Markov-switching models in exchange rate .

prediction. Economic Modelling, 23, 662-668. ^

Mejia, J. (2018). Social Networks and Entrepreneurship. Evidence from a Historical -g

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Episode of Industrialization (http://wehc2018.org/wp-content/uploads/2018/07/Mejia.pdf - f

Access Date: 18.08.2018). w

Nunn, N. and Qian, N. (2011). The Potato's Contribution to Population and Urbanization: ¡5

Evidence from a Historical Experiment. The Quarterly Journal of Economics, 126, 593- ¡2

650. ^

<

Pomeranz, K. (2006). China, Europe and Industrialization in Unmaking the West: g

"What-If' Scenarios that Rewrite World History, ed. Philip E. Tetlock, Richard Ned Lebow, f

and Geoffrey Parker. University of Michigan Press. t

Ranson, R. (2005). The Confederate States of America: What Might Have Been. New w

York: W.W. Norton. ~

Ruggles, S., Roberts, E., Sarkar, S. and Sobek, M. (2011). The North Atlantic Population °

Project: Progress and Prospects. Historical Methods: A Journal of Quantitative and ^

Interdisciplinary History, 44(1), 1-6. 3

o

Ruggles, S., Genadek, K., Goeken, R., Grover, J. and Sobek, M. (2015). Integrated Public Use Microdata Series: Version 6.0 (Machine-Readable Database). Minneapolis, Minn.: University of Minnesota.

Shalev-Shwartz, S. and Ben-David, S. (2014). Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press.

Squire, J. (1931). If It Had Happened Otherwise. Longmans, Green.

Springer-Verlag, L. Inc.; (1999). Numerical Analysis for Statisticians.

Thompson, W. (2010). The Lead Economy Sequence in World Politics (from Sung China to the United States): Selected Counterfactuals. Journal of Globalization Studies, 1(1), 6-28.

Turchin, P., Brennan, R., Currie, T., Feeney, K., Francois, P. Hoyer, D. and Manning, J. (2015). Seshat: The Global History Databank. Cliodynamics: The Journal of Quantitative History and Cultural Evolution, 6 (1).

Van Zanden, L., Baten, J. and van Leeuwen, P. (2014). The Changing Shape of Global Inequality 1820-2000; Exploring a New Dataset. Review of Income and Wealth Series, 60(2).

Wrigley, E. A., and Schofield, R. S. (1989). The Population History of England 15411871. Cambridge University Press.

cn

■H

o

CM

■H ■H

X CÖ CO

O <

CD <

O

o s X -O x

-O <

CÖ X

o

s J

<

CÖ X

CO LU

CO

_J <

Z O I— 3

I— CD

o

_J <

cc

ZD

o

i Надоели баннеры? Вы всегда можете отключить рекламу.