formation of a sustainable agri-food market in the Russian Federation: statistical studies]. Ed. by prof. V. N. Afanasyev. Moscow, Finance and statistics publ., 2008, 288 p.
3. Afanasiev V. N., Afanasieva A. V. Sovershenstvovanie statisticheskoi metodologii issledovaniia v upravlenii kreditnym riskom [Improvement of statistical methodology of the study in credit risk management]. Vestnik NGUEU [Bulletin ofthe NGUEU], 2012, no. 3, pp. 132-146.
4. Afanasiev V. N., Yuzbashev M. M. Analiz vremennykh ri-adov i prognozirovanie: uchebnik [Time series analysis and forecasting: a textbook]. Moscow, Finance and statistiks publ., 2010, 232 p.
5. Afanasiev V. N., Yuzbashev M. M., Gulyaeva T .I. Eko-nometrika: uchebnik [Econometrics: a textbook]. Ed. by V. N. Afanasyev. Moscow, Finansce and statistiks publ., 2006, 256 p.
УДК 330.43
ПРОСТРАНСТВЕННЫЙ АНАЛИЗ ТЕМПОВ РОСТА ГОРОДОВ РОССИИ
О. С. Балаш
кандидат экономических наук, декан экономического факультета, Саратовский государственный университет E-mail: olgabalash@mail.ru
Введение. Обсуждаются теоретические положения закона Ципфа для распределения городов. Эмпирический анализ. Проводится эконометрический анализ выполнения закона Ципфа по данным переписей населения России за 1897-2010 гг., а также эконометри-ческий анализ выполнения закона Ципфа отдельно для средних и крупных городов, городов и рабочих поселков с населением менее 75 тыс. человек. Приводятся графики распределения городов России по соотношению их ранга и размера по данным переписи населения 1897 и 2010 гг. Результаты. Рассматривается идея выполнения закона Ципфа через закон Гибрата, в этой связи анализируются логарифмы темпов роста городов России по численности населения. Тестируется гипотеза зависимости темпов роста городов от их территориальной привязки. Рассчитывается пространственный коэффициент автокорреляции Морана для логарифмов темпов роста всех городов России. Для визуализации результатов исследования построены пространственные диаграммы рассеивания Морана логарифмов темпов роста городов. Отдельно проводится пространственный анализ темпов роста городов по численности населения с использованием пространственной диаграммы Морана для двадцати крупных городов России. Выводы. Эмпирические исследования подтвердили распределение городов России по соотношению их ранга и размера, а также пространственную кластеризацию городов России по темпам роста численности населения. Ключевые слова: закон Ципфа, анализ пространственных данных, коэффициенты пространственной автокорреляции Морана, Гири, пространственная диаграмма Морана.
Введение
В 1949 г. Джордж Ципф открыл эмпирическую закономерность распределения частоты встречаемости слов для достаточно большого текста, которая была названа законом Ципфа [1]. Полученная закономерность применима к анализу распределения городов по их размеру.
Для большинства стран распределение городов по численности населения соответствует степенной зависимости:
R = a , (1)
где R - ранг города по размеру (№ 1 - самый большой город); S - население городов; % - наклон прямой, близкий к минус единице; а - коэффициент.
Существует достаточно много работ, эмпирически подтверждающих закон Ципфа. Исследования проводились практически для всех стран Европы, Индии, Америки, Канады, Китая. Это работы George Zipf [1], Ioannides, Overman [2], Rosen и Resnik [3], Gabaix [4, 5] и многие другие.
Эмпирический анализ
Уравнение регрессии, соответствующее закону Ципфа, имеет вид:
Ln(Rank)==ß0 + ß1ln(Population)i+e¿,
где Rankt - ранг i - города; ß0, ßi - параметры регрессии; Population t - численность i-города; s¿ -случайная ошибка; i = 1, 2,..., n; n - число городов.
Для построения модели использовались данные переписей населения России с 1897 по 2010 г. При выполнении закона Ципфа оценка коэффициента ßi должна быть близка к единице.
Так, по данным переписи 1897 г., для 549 городов России получена следующая оценка уравнения регрессии:
Ln (Rank) = 12,59 - 0,82 In(Population).
(0,12) (-0,14)
В скобках указано стандартное отклонение. Коэффициент детерминации равен 0,97. Наклон кривой близок к -1.
На рис.1 приведен график, соответствующий построенному уравнению регрессии. Точками изображены города. Самые большие по численности города - Санкт-Петербург (1 264 920 чел.) и г. Москва, изображены внизу справа.
Рассчитанные коэффициенты регрессии по данным переписи с 1897 по 2010 г. представлены в табл.1.
Как видно из данных, приведенных в табл. 1, все коэффициенты значимы на 5%-ном уровне, коэффициенты детерминации показывают хорошее приближение модели к реальным данным. Коэффициенты bi колеблются около -1.
-4 -2 0 2 4 6
Рис. 1. Распределение городов России по соотношению их ранга и размера, по данным переписи населения 1897 г.
Таблица 1
Коэффициенты регрессии соотношения ранга и размера городов России по переписям населения
Перепись населения, год Количество городов, включая поселки городского типа Коэффициент Ь0 Коэффициент Ь1 Стандартное отклонение коэффициента Ь1 Коэффициент детерминации К2
1897 549 12,59 -0,82 0,14 0,87
1926 793 12,7 -0,78 0,009 0,89
1939 824 14,56 -0,9 0,007 0,94
1959 980 13,8 -0,79 0,009 0,88
1970 1005 14,4 -0,82 0,0077 0,91
1979 1014 14,54 -0,83 0,07 0,93
1989 4008 13,69 -0,69 0,002 0,94
2002 3777 13,06 -0,63 0,034 0,89
2010 1110 14,2 -0,8 0,0067 0,92
На рис. 2 и 3 приведены графики регрессии по данным переписи России 2002 и 2010 гг. со-
ответственно, которые практически повторяют данные переписи 1897 г. (см. рис. 1).
Рис. 2. Распределение городов России по соотношению их ранга и размера, по данным переписи населения 2002 г.
Как видно из графиков, в 2010 г. произошел резкий рост самых больших по численности городов: Москвы и Санкт-Петербурга, и их отрыв по численности населения от остальных городов.
Рис. 3. Распределение городов России по соотношению их ранга и размера, по данным переписи населения 2010 г.
Закон Ципфа утверждает, что показатель степени % должен быть равен 1. Однако на всех графиках прослеживается линейность между логарифмом рангов городов и логарифмом численности их населения в нижних двух третях рас-
пределения. В целом данные графиков указывают на нелинейность.
Nitsch [6], Rose [7], Soo [8] в своих исследованиях показали, что закон Ципфа выполняется
для крупных и средних городов в двух третях выборки. Протестируем это предположение для крупных и средних городов России (табл. 2). Все коэффициенты значимы на 1%-ном уровне.
Таблица 2
Коэффициенты регрессии соотношения ранга и размера крупных и средних городов России
Перепись населения, год Количество крупных и средних городов Коэффициент b0 Коэффициент Ципфа b1 Коэффициент детерминации R2
1897 365 15,8 -1,16 0,9856
1926 529 15,48 -1,07 0,9869
1939 549 16,44 -1,084 0,9916
1959 652 16,77 -1,0686 0,9920
1970 669 16,64 -1,0322 0,9897
1979 675 16,52 -1,006 0,9865
1989 2699 14,82 -0,8 0,9800
2002 2517 14,92 -0,814 0,9792
2010 737 16,39 -0,98 0,9843
Как видно из показателей табл. 2, для данных всех переписей населения коэффициент Ципфа стал практически равен единице (0,98), прогнозная сила моделей повысилась. Таким образом, наше предположение о том, что для крупных и средних городов строго выполняется закон Цип-фа, эмпирически подтверждается.
Продемонстрируем выполнение закона Ципфа по данным переписи 2010 г. (рис. 3). Коэффициент Ципфа составил -0,8 по 1110 городам
России. Коэффициент детерминации равен 0,92 (см. табл. 1).
Для 737 крупных и средних городов коэффициент Ципфа стал близок к 1, коэффициент детерминации увеличился до -0.98 (см. табл. 2). Точки на рис. 4 лежат практически на прямой линии, соответствующей уравнению регрессии, кроме самых крупных по численности населения городов - Москвы и Санкт-Петербурга, расположенных в нижнем правом углу.
coef =
1-г
0 2
e( lnpop12 | X )
-.98429218, se = .00457859, t = -214.98
Рис. 4. Распределение городов России по соотношению их ранга и размера, по данным переписи населения 2010 г., для крупных и средних городов
Если построить регрессию только для малых городов с численностью населения менее 17,5 тыс. человек, получим уравнение
Ln (Rank) = 8,74 - 0,21 ln(Population). (0,49) (-0,05)
В скобках указаны стандартные отклонения коэффициентов регрессии. Коэффициент детерминации равен 0,8. Как видно, закон Ципфа не выполняется, коэффициент равен -0,21.
Можно предположить, что закон Ципфа вы-
полняется для средних, малочисленных городов и поселков городского типа. Однако это предположение не подтверждается. Так, для 770 городов с населением менее 47,5 тыс. человек получено следующее уравнение:
Ln (Rank) = 10,96 - 0,45 In(Population).
(0,67) (-0,063)
Коэффициент детерминации равен 0,873.
Таким образом, можно сделать вывод о том, что для малых городов закон Ципфа не выполняется. Объяснить это можно тем, что в небольших городах производственная деятельность менее диверсифицирована и численность рабочей силы ограничена. В крупных городах располагаются различные производственные предприятия, имеется неограниченный приток населения на рынок труда, что влечет большую отдачу от масштаба. Это обеспечивает рост крупных городов не только за счет естественного, но и за счет механического прироста.
Результаты
Gabaix в своих двух работах [4, 5] объясняет закон Ципфа через закон Gibrat [9] как случайный процесс, имеющий стационарное распределение. Закон Gibrat постулируют независимость темпов роста городов от их размеров.
Рассмотрим модель Gabaix, в основе которой лежит закон Gibrat, предполагающий независимость темпов роста городов от их размеров:
Ln(grow)j = ß0+ ß ^(Population) i + ep (2)
где Ln(grow) - логарифм темпа роста городов по численности населения; 1п(РориШюп) - логарифм численности населения базисного года; е1 - случайная ошибка.
Оценка модели (2) рассчитана по данным переписи 2010 г. по 1044 городам России, за базисный взят 2002 г.: ln(grow10) = -0,31 + 0,026 1п(РориШюп2002). (0,025) (0,024) В скобках указаны средние квадратические отклонения оценок уравнения. Как видим, коэффициенты значимы на 1%-ном уровне. Однако коэффициент детерминации, равный 0,1, показывает невысокую степень приближения модели данным и возможную нелинейность, а также влияние пространственного расположения городов.
Россия простирается по большой территории, и одни регионы и города развиваются активнее других. Протестируем гипотезу зависимости темпов роста городов от их территориальной привязки. Для этого рассчитан пространственный коэффициент автокорреляции Морана, который опроверг нулевую гипотезу об отсутствии пространственной автокорреляции для логарифмов темпов роста городов России (I = 0,13).
Диаграмма рассеивания Морана показывает наличие пространственной кластеризации городов по темпу роста численности населения (рис. 5). Диаграмма рассеивания и коэффициент Морана рассчитывались на основании матрицы расстояний между городами по координатам на карте.
Moran scatterplot (Moran's I = 0.129) grow12
-1
0
1
2
3
4
5
6
7
8
Рис. 5. Диаграмма Морана для логарифмов темпов роста населения городов, по данным
переписи 2010 г.
2
0
Первый и третий квадранты характеризуются положительной пространственной автокорреляцией. Города, попавшие в первый квадрант, быстрорастущие в окружении таких же быстрораз-вивающихся. Это города, близко расположенные к г. Москве: Домодедово (177), Химки (89), Балашиха (85), Пушкино (57).
Третий квадрант отражает кластеризацию городов с низкими темпами роста численности населения, окруженных слаборастущими соседями. Это г. Инта Коми АССР (467), г. Малгобек Чечено-Ингушской Республики (475).
Второй квадрант - это кластер городов с низкими значениями темпов роста, окруженных городами с относительно высокими значениями, такие как Рузаевка Республики Мордовия (264), г. Мариинск Кемеровской области (165).
Четвертый квадрант - быстрорастущие города, окруженные городами с низкими темпами роста: Южно-Сахалинск (99), Находка (110), Якутск (67), Ханты-Мансийск (205).
Интересно рассмотреть карту рассеивания, построенную по 20 самым крупным по численности населения городам России (рис. 6).
Могап БсайегрЫ (Могап'в I = 0.035) дгош12
19 11 6
18 8
Рис. 6. Диаграмма Морана для логарифмов темпов роста населения 20 самых больших городов, по данным переписи 2010 г.
10
15
0
3
7
0
2
3
г
Коэффициент Морана также значим, то есть для двадцати крупнейших по численности городов наблюдается пространственная автокорреляция.
Первый квадрант (положительная автокорреляция) - наиболее быстро развивающиеся города с таким же окружением: Москва (1), Санкт-Петербург (2), Красноярск (17), Краснодар (14), Екатеринбург (4), Воронеж (15), Челябинск (9).
Второй квадрант (отрицательная автокорреляция) - слабо развивающиеся города, окруженные быстроразвивающими: Ростов-на-Дону (10), Новосибирск (3), Нижний Новгород (5), Омск
(7), Волгоград (12).
Третий квадрант характеризуется отрицательной автокорреляцией: слаборазвивающиеся в окружении таких же. Этих городов наибольшее количество: Саратов (16), Ульяновск (20), Пермь (13), Ижевск (19), Самара (6), Уфа (11), Казань
(8) и Тольятти (18).
В четвертый квадрант крупные города не попали.
Выводы
Закон Ципфа предполагает, что для большинства стран распределение городов по соотношению их ранга и размера соответствует степенной зависимости. Мы подтвердили эти исследования для городов России по данным всех переписей населения с 1897 по 2010 гг. Для всех периодов коэффициент Ципфа колеблется в пределах -1. Многие исследователи показали, что для крупных и средних городов для различных стран этот коэффициент близок к 1, а для мелких - отличен. Наши эконометрические вычисления также доказали выполнение этих закономерностей и для России.
Х. ваЪа1х предположил, если процесс роста городов подчиняется закону вЛга!:, то распределение городов следует закону Ципфа. Рассматривая расположение регионов и городов России по территории, нами была сделана попытка пространственной кластеризации логарифмов темпов роста городов с помощью коэффициента авторегрессии Морана. Таким образом, исследо-
вания подтвердили выполнение закона Ципфа
для городов, а также пространственную кластеризацию городов России.
Список литературы
1. Zipf G. K. Human behavior and the principle of least effort. Cambridge : MA, Addison-Wesley Press, 1949.
2. Ioannides Y. M., Overman H. G. Zipf's Law for cities: An empirical investigation // Regional Science and Urban Economics. 2003. № 33(1). P. 127-137.
3. Rosen K. T., Resnick M. The size distribution of cities, an examination of the Pareto Law and primacy // J. of Urban Economics. 1980. № 8(2). Р. 165-186.
4. GabaixX. Zipf's Law for Cities : An Explanation // The Quarterly J. of Economics. 1999. Vol. 114, № 3, August. Р. 739-767.
Spatial Analysis of Growth Rates of Cities Russia
5. Gabaix X. Zipf's Law and the Growth of Cities // The American Economic Review, Papers and Proceedings. May 1999. P. 129-132.
6. Nitsch V. Zipf zipped // J. of Urban Economics. 2005. № 57(1). P. 86-100.
7. Rose A. K. Cities and countries // J. of Money, Credit and Banking. 2006. № 38(8). P. 2225-2245.
8. Soo K. T. Zipf's Law for cities: A cross-country investigation // Regional Science and Urban Economics. 2005. № 35(3). P. 239-263.
9. GibratR. Les ine'galite's e'conomiques ; applications : aux ine'galite's des richesses, a" la concentration des entreprises, aux populations des villes, aux statistiques des familles, etc., d'une loi nouvelle, la loi de l'effet proportionnel. Paris : Librairie du Recueil Sirey, 1931.
O. S. Balash
Kandidat of Scince, Dean of the Faculty of Economy Saratov State University
83, Astrakhanskaya str., Saratov, 4100012 Russia E-mail: olgabalash@mail.ru
Purpose. We discuss the theoretical principles of the Zipf law for the distribution of cities. Empirical results. The results of the econometric analysis of the empirical Zipf's law on Russian census data for 1897 and 2010. As well as the results of the econometric analysis of the Zipf law separately for medium and large towns and cities and industrial communities with populations of less than 45,000 people. Results. Explores the idea of the Zipf law through the implementation of the law Gibrat. Analyzes the logarithms of the growth of urban growth of cities in Russia. The hypothesis tested in accordance with the rate of urban growth in their territorial connection. Ranked Moran's spatial autocorrelation coefficient on the growth rate of any city in Russia. Calculate the spatial autoregression Moran for twenty large Russian cities. In addition, to visualize the results of research are constructed spatial Moran scatterplot of the logarithms growth rates of Russian cities. Conclusion. Empirical studies have confirmed the distribution of Russian cities by the ratio of their rank and size, and spatial clustering of Russian cities in the rate of population growth.
Key words: Zipf's law, exploratory spatial data analysis, city-size distribution, spatial autocorrelation Moran, Geary, Moran Scatter Plot.
References
1. Zipf G. K. Human behavior and the principle of least effort. Cambridge, MA, Addison-Wesley Press, 1949.
2. Ioannides Y. M. & Overman H. G. Zipf's Law for cities: An empirical investigation. Regional Science and Urban Economics, 2003, no 33(1), pp. 127-137.
3. Rosen K. T. & Resnick M. The size distribution of cities, An examination of the Pareto Law and primacy, Journal of Urban Economics, 1980, no. 8(2), pp. 165-186.
4. Gabaix X. Zipf's Law for Cities: An Explanation. The Quarterly Journal of Economics, 1999, vol. 114, no. 3, August, pp. 739-767.
5. Gabaix X. Zipf's Law and the Growth of Cities. The
American Economic Review, Papers and Proceedings, 1999, May, pp. 129-132.
6. Nitsch V. Zipf zipped. Journal of Urban Economics. 2005, no. 57(1), pp. 86-100.
7. Rose A. K. Cities and countries. Journal of Money, Credit and Banking, 2006, no. 38(8), pp. 2225-2245.
8. Soo K. T. Zipf's Law for cities: A cross-country investigation. Regional Science and Urban Economics, 2005, no. 35(3), pp. 239-263.
9. Gibrat R. Les ine'galite's e'conomiques; applications: aux ine'galite's des richesses, a' la concentration des entreprises, aux populations des villes, aux statistiques des familles, etc., d'une loi nouvelle, la loi de l'effet proportionnel. Paris, Librairie du Recueil Sirey, 1931.