Научная статья на тему 'Моделирование общей миграции населения на основе регрессионных моделей панельных данных'

Моделирование общей миграции населения на основе регрессионных моделей панельных данных Текст научной статьи по специальности «Экономика и бизнес»

CC BY
773
100
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Экономика региона
Scopus
ВАК
ESCI
Область наук

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Огородников Петр Иванович, Катаева Ирина Николаевна, Самсонова Татьяна Анатольевна

Важнейшими условиями формирования целенаправленной миграционной политики является разработка математических моделей, позволяющих адекватно оценить реальное и потенциальное развитие миграции как в стране, так и в рамках ее отдельных территорий. В статье предлагается рассмотреть две различные спецификации модели панельных данных как по объектам наблюдения, так и по периодам времени. Подтвердить или опровергнуть априорные варианты относительно спецификации модели предлагается с помощью теста Хаусмана проверки гипотезы от ортогональности случайных эффектов и регрессоров. Затем по оценкам индивидуальных эффектов построенной регрессионной модели панельных данных можно провести ранжирование городов и районов области по степени напряженности ситуации с миграцией. При сравнении двух городов или районов области ситуация с миграцией будет сложнее там, где выше значение индивидуального эффекта, аккумулирующего в себе влияние на уровень миграционной подвижности всех неучтенных в модели факторов. Предложенная модель основана на расчете индивидуальных эффектов, позволяет более эффективно определять место каждой в миграционных процессах

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Огородников Петр Иванович, Катаева Ирина Николаевна, Самсонова Татьяна Анатольевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELLING OF THE GENERAL POPULATION SHIFT ON BASIS REGRESSIONAL OF MODELS OF THE PANEL DATA

In article it is offered to consider two various specifications of model of the panel data on objects of supervision, and on the periods of time. To confirm or deny aprioristic variants concerning the specification of model it is offered with the help of test Hausmana of check of a hypothesis from orthogonality of random effects and regressors. And behind that according to individual effects constructed регрессионной ranging of cities and areas of area on a degree of intensity of a situation with migration is possible to carry out models of the panel data. At comparison of two cities or areas of area the situation with migration will be more complex there, where above value of individual effect heat-sink in itself influence on a level of migratory mobility of all factors not taken into account in model. The offered model, is based on calculation of individual effects, allows to determine more effectively a place of each territory in the migration processes.

Текст научной работы на тему «Моделирование общей миграции населения на основе регрессионных моделей панельных данных»

СОЦИАЛЬНО-ЭКОНОМИЧЕСКИЕ ПРОБЛЕМЫ РЕГИОНОВ

МОДЕЛИРОВАНИЕ ОБЩЕЙ МИГРАЦИИ НАСЕЛЕНИЯ НА ОСНОВЕ РЕГРЕССИОННЫХ МОДЕЛЕЙ ПАНЕЛЬНЫХ ДАННЫХ*

Огородников П.И., Катаева И.Н., Самсонова Т.А.

Важнейшими условиями формирования целенаправленной миграционной политики является разработка математических моделей, позволяющих адекватно оценить реальное и потенциальное развитие миграции как в стране, так и в рамках ее отдельных территорий.

В статье предлагается рассмотреть две различные спецификации модели панельных данных как по объектам наблюдения, так и по периодам времени. Подтвердить или опровергнуть априорные варианты относительно спецификации модели предлагается с помощью теста Хаусмана проверки гипотезы от ортогональности случайных эффектов и регрессоров. Затем по оценкам индивидуальных эффектов построенной регрессионной модели панельных данных можно провести ранжирование городов и районов области по степени напряженности ситуации с миграцией. При сравнении двух городов или районов области ситуация с миграцией будет сложнее там, где выше значение индивидуального эффекта, аккумулирующего в себе влияние на уровень миграционной подвижности всех неучтенных в модели факторов.

Предложенная модель основана на расчете индивидуальных эффектов, позволяет более эффективно определять место каждой в миграционных процессах.

Миграция - сложный социально-экономический процесс, связанный, с одной стороны, с пересечением государственных границ (внешняя миграция), с другой стороны, с территориальными передвижениями в пределах одной страны (внутренняя миграция).

Миграция - это серьезная проблема, воздействующая на все стороны жизни населения. Масштабы, формы и направления миграционных потоков создают целый ряд сложных экономических, социальных, политических и морально - психологических проблем. Прежде всего, миграционное движение непосредственно приводит к изменению общей численности и структуры населения, к переменам на рынках труда и жилья, в окружающей природной среде, в производственной и потребительской сферах, в городском и коммунальном хозяйствах, в сфере социальной защиты населения и т.д. Большой приток мигрантов, с одной стороны, в какой-то мере компенсирует естественную убыль населения, с другой стороны, обостряет ситуацию на рынке труда, что влечет за собой рост безработицы среди местного населения. Приток беженцев и вынужденных переселенцев способствует распространению опасных заболеваний, росту преступности, незаконному обороту наркотиков, что создает угрозу демографической и национальной безопасности. Неоспоримой проблемой являются также нерациональные миграционные потоки между сельской и городской местностью. Необходимо отметить, что 90% в объеме чистой миграции из села в город составляет молодежь. В результате усиливается деформация возрастной структуры сельского населения. Это создает трудности в обеспечении сельского хозяйства рабочей силой.

Таким образом, важной составляющей в деятельности государства должно быть

* Работа выполнена при финансовой поддержке гранта РГНФ № 08-02-81204 а/у.

проведение целенаправленной миграционной политики, важнейшими условиями формирования которой должны быть разработка математических моделей, позволяющих адекватно оценивать реальное и потенциальное развитие миграции, в том числе в рамках ее отдельных территорий.

Для современного уровня исследования проблем миграции весьма значимым представляется подход, при котором миграционное движение анализируется при помощи математических методов и моделей, позволяющих провести более глубокий анализ и получить наиболее структурированные и математически обоснованные результаты.

Это обуславливает актуальность изучения проблемы общей миграции населения Оренбургской области, анализа ее приоритетных направлений, форм и методов ее регулирования. Исследование особенностей развития миграционных процессов в области, как одной из важнейших приграничных территорий, ее экономической и демографической обстановки позволит выделить специфические функции и задачи региональных органов управления в миграционной сфере. В большинстве случаев при статистическом анализе миграционной ситуации ограничиваются построением изолированных уравнений регрессии для отдельных характеристик миграционных процессов, не рассматривая влияние этих характеристик на миграцию в течение определенного периода времени и не учитывая изменение характера и направления этого влияния из года в год. Статистическая отчетность по социально-экономическим показателям регулярно фиксируется в заданные периоды или моменты времени. Простое объединение данных за разные годы и применение к ним стандартных математико-статистических методов не всегда оправданно. Его использование обоснованно в стабильных и неизменных условиях. Но в условиях резких изменений экономической конъюнктуры, оказывающей непосредственное влияние на миграционную подвижность, необходимо использовать модели, учитывающие эти особенности. Учитывая сложный и многогранный характер миграционных процессов, множество факторов, на них влияющих и изменяющихся во времени, следует ожидать, что более адекватным может быть их описание с помощью моделей регрессии на На основе панельных данных, содержащих информацию по городам и районам Оренбургской области за период с 2000 по 2007 гг., проведено моделирование уровня миграционной подвижности в году X (у() в зависимости от следующих показателей: xi,! - удельный вес населения в трудоспособном возрасте в году 1:, %; хг, г - обеспеченность населения врачами в году X, на 1000 населения; хзд - обеспеченность населения средним медицинским персоналом в году X, на 1000 населения;

Х4д - обеспеченность населения больничными койками в году X, на 1000 населения; Х5д - среднемесячная номинальная начисленная заработная плата работников в году X, рублей;

Хбд - площадь жилищ, приходящаяся в среднем на одного жителя в году 1;, кв. м; Х7д - среднесписочная численность работников в году X, человек; Х8д - оборот розничной торговли на душу населения в году X, руб.; Х9д - доля населения, ищущего работу, в общей численности среднесписочных работников в году 1;, %;

хюд - объем платных услуг на душу населения в году X, руб.; XI 1д - число зарегистрированных преступлений в году X, на 1000 населения. Для описания зависимости общей миграции населения уг от объясняющих переменных XIд, хгд, хзд, Х4д, Х5д, Хбд, Х7д, Х8д, Хдд, Хкц, X] 1.1 были рассмотрены линейные регрессионные модели панельных данных следующего типа:

- модели с фиксированными эффектами;

- модели со случайными эффектами.

Общий вид модели с фиксированными эффектами имеет вид:

У it = аг + Р\Х\ (1)

где индекс i указывает на номер объекта наблюдения, то есть идентифицирует город или район Оренбургской области;

ai - индивидуальные эффекты;

slt - регрессионные остатки.

Относительно регрессионных остатков предполагается:

1) М(еи) = 0 ;

2) со= ;

[0,г Ф jeeet Ф s

3) cov(e,.t, x] ts ) = 0, j, = 1, и, t,s = 1, T.

Индивидуальные эффекты в модели (1) учитывают влияние на результативный показатель всех (наблюдаемых и ненаблюдаемых) переменных, которые принимают разные значения для разных объектов, но не метаются во времени. К таким переменным относятся специфические характеристики каждого города и района. Эти характеристики могут не только оказывать влияние на результативный показатель - коэффициент миграции, но и быть коррелированными с объясняющими переменными. Если в такой ситуации не учитывать панельную структуру данных и рассматривать обычную регрессию по объединенным данным, то это приведет к смещенным оценкам параметров.

Если предполагается, что ненаблюдаемые переменные не коррелированны с остальными регрессорами, то их влияние учитывается иначе - как компоненты ошибок наблюдения. В этом случае для панельных данных используется модель со случайными эффектами, имеющая вид:

У и =а + Pixut + P2X2jt + Да,, + Р\x4,,t + Р5х5,иРбхбм + щ + eit, (2)

где и; - случайное отклонение (возмущение).

К модели (2) предъявляются следующие требования:

1) м(щ) = ом(щ) = °и2;

2)M(s1) = 0,M(S12) = CJs2;

3) соw(eit,ui}.,) = 0;

4) соy(u1,uJ) = h;2l = J;

[0,/ * j

5) со У(*Л) = К2,=/, ;

[0,/ ^ jeeet ^ s

6) cov(ej(, x] it ) = 0, соw(ui, x] it ) = 0; /, j = 1, и, t,s = 1, T.

Для оценки параметров регрессионных моделей с фиксированными и случайными эффектами воспользуемся пакетом Stata 7.0. Результаты оценивания параметров модели с фиксированными эффектами представлены в табл. 1.

Таблица 1

Результаты модели с фиксированными эффектами

Коэффициент Оценка Среднекв. ошибка 1-статистика Значимость Доверительный интервал

Нижняя граница Верхняя граница

д 2,162327 0,827248 0Д76 0,002 -17,57227 13,24762

д 0,.0145211 0,0051271 0,960 0,000 -0,0152605 0,0443028

Ре 8,626024 4Д985 0,529 0,000 40,7138 23,46175

Л 0,0042585 0,0005884 0,928 0,004 -0,013292 0,0047749

Д -63,70345 23,84107 -1,253 0,000 -163,7971 36,39023

р{к,ыт-ы-к) = гг.. , (з)

Для проверки значимости уравнения регрессии с фиксированными эффектами приметается формула:

(УХУ№ - 1^'1:)/к /М>'''Л' КМТ -И-к)

31 131 _2

где т™ = {Уи-Уд ;

¿=1 ¡=1

ЯББ - сумма квадратов остатков модели с фиксированными эффектами; N - количество объектов; Т - количество периодов времени; к - количество переменных.

В условиях справедливости нулевой гипотезы эта статистика распределена по закону Фишера-Снедекора с к и (1ЧТ - N - к) степенями свободы. Результаты проверки гипотезы представлены в виде таблицы 2.

Таблица 2

Результаты проверки значимости уравнения регрессии

Показатель Значение показателя

Б-критерий 18,79

Вероятность 0,00

Анализируя полученный результат, можно сделать вывод о том, что нулевая гипотеза о незначимости всех коэффициентов уравнения регрессии отвергается, т.е. полученное уравнение регрессии с фиксированными эффектами является значимым. По данным таблицы можно сделать вывод, что значимыми являются следующие коэффициенты: удельный вес населения в трудоспособном возрасте, среднемесячная номинальная начисленная заработная плата работников, площадь жилищ, приходящаяся в среднем на одного жителя, оборот розничной торговли на душу населения, доля населения, ищущего работу, в общей численности среднесписочных работников.

Для того, чтобы доказать оправданность введения в модель фиксированных эффектов, необходимо проверить гипотезу об их различии для разных объектов наблюдения. Если индивидуальные эффекты равны между собой, то модели следует предпочесть обычную регрессию с единственной константой. Выдвигаются следующие гипотезы:

Но: а1 = а} = а для любых ¡, ];

Нь а1 -Ф- а ., хотя бы для одной пары ¡, ].

Для проверки нулевой гипотезы используется статистика:

р = (Ш-ШРЕ)1(Ы-1) ШРЕ/(ЫТ-Ы-к) ' где ЯББ - сумма квадратов остатков обычной регрессии;

КББ11 - сумма квадратов остатков модели с фиксированными эффектами.

В условиях справедливости нулевой гипотезы статистика распределена по Фи-шеру-Снедекору с числом степеней свободы N-1 и N1 - N - к.

Если нулевая гипотеза отвергается, то обычной регрессии следует предпочесть регрессионную модель с фиксированными эффектами. Результаты проверки представлены в таблице 3.

Полученные результаты подтверждают неоднородность городов и районов Оренбургской области и свидетельствуют о необходимости использования панельной структуры данных.

Таблица 3

Результаты проверки гипотезы о различии индивидуальных эффектов

для разных городов и районов области

Статистика Значение статистики

Рнабл 1,46

Ркр(0,05;11;271) 0,1479

Оценки индивидуальных эффектов рассчитаны по следующей формуле:

(5. = у. - Ьг Хц - Ь5 Х5,г - Ъ6 Хб,1 - ¿8 х8,г - Ь9 Х9,г, (5)

где а{ - оценка индивидуального эффекта для ьго объекта;

Ьь Ь5, Ьб, Ь8, Ьэ - оценки соответствующих коэффициентов модели; у 1, XI,,-, Х5,1, Хб,1, Х8,,-, Х9,,- - средние значения соответствующих признаков в модели для I

объекта за все периоды времени.

Результаты оценивания параметров регрессионной модели со случайными эффектами представлены в табл. 4.

Модель со случайными эффектами примет вид: уи =сх + 0,992*,,, + 0,001х5 й + 611,737х6 г, + 0,02х8 г, - 74,622х9 г, + щ + еа,. (6)

Результаты проверки значимости модели со случайными эффектами с помощью критерия Вальда представлены в табл. 5.

Таблица 4

Результаты оценивания модели со случайными эффектами

Коэффициент Оценка С редиски, ошибка статистика Значимость Доверительный интервал

Нижняя граница Верхняя граница

д 0,9922066 0,3957707 0,128 0,002 -14,21262 16,19703

д 0,0014655 0,0006199 0,088 0,000 -0,031109 0,03404

р6 11,73678 4,2888 0,768 0,003 -18,22872 41,70229

А 0,0199903 0,0007107 4,244 0,000 -0,0292232 -0,0107574

-74,62197 29,12692 -1,405 0,001 -178,7488 29,50487

Таблица 5

Результаты проверки значимости уравнений регрессии со случайными эффектами

Показатель Значение показателя

Критерий Вальда 124,99

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Вероятность 0,00

Анализируя полученный результат, можно сделать вывод о том, что нулевая гипотеза о равенстве всех коэффициентов уравнений регрессии нулю отвергается, т.е. полученное уравнение регрессии со случайными эффектами является значимым. Как видно из табл. 4, значимыми являются коэффициенты при следующих переменных: обеспеченность населения врачами, среднесписочная численность работников, оборот розничной торговли на душу населения, объем платных услуг на душу населения.

Для сравнения регрессии по объединенным данным и регрессионной модели со случайными эффектами реализован тест Бреуша-Пагана множителей Лагранжа на гетероскедастичность. Выдвинуты следующие гипотезы:

Н о Я,

= 0 >- 0.

Для проверки нулевой гипотезы применяется следующая статистика:

Ш =

ЫТ

2(Т -1)

(7)

где ей - оценки регрессионных остатков в объеденной регрессии.

В условиях справедливости нулевой гипотезы статистика (7) распределена по закону Хи-квадрат с одной степенью свободы. Высокие значения статистики свидетельствуют о том, что нулевая гипотеза о возможности игнорировать индивидуальные эффекты и объединить данные должна быть отвергнута, и необходимо строить модель со случайными эффектами. Результаты проверки гипотезы с помощью пакета Б1а1а 7.0 представлены в табл. 6.

Таблица б

Показатель Значение показателя

Статистика ЬМ 237,04

Вероятность 0,00

По данным табл. 6 можно сделать вывод, что нулевая гипотеза отвергается, следовательно, для моделирования общей миграции населения необходимо отдать предпочтение регрессионным моделям панельных данных. Таким образом, предлагается рассмотреть две различные спецификации модели панельных данных, позволяющие учесть неоднородность данных как по объектам наблюдения, так и по периодам времени.

Подтвердить или опровергнуть априорные предположения относительно спецификации модели можно с помощью теста Хаусмана проверки гипотезы об ортогональности случайных эффектов и регрессоров. Его подход основан на том, что если гипотеза об отсутствии корреляции верна, то оценки моделей с фиксированными и случайными эффектами являются состоятельными, а оценки модели со случайными эффектами - эффективными. Поэтому при выполнении нулевой гипотезы между оценками нет систематического смещения. При альтернативной гипотезе состоятельны лишь оценки модели с фиксированными эффектами. Для проверки гипотезы используется статистика:

к = [КЕ-ЪШ1[Соу{Ъре)-СОУ{ЪШ)]1[ЪРЕ-ЪШ\ (8)

где Ьбе - оценки параметров модели с фиксированными эффектами;

Ьяе - оценки параметров модели со случайными эффектами;

Соу(Ьм ) и Соу(Ьяе) - оценки ковариационных матриц для параметров моделей с

фиксированными и случайными эффектами.

При выполнении нулевой гипотезы статистика (8) асимптотически подчиняется закону распределения Хи-квадрат с к степенями свободы. Если нулевая гипотеза не отвергается, то необходимо выбрать модель со случайными эффектами, в противном случае - модель с фиксированными эффектами. Результаты реализации теста Хаусмана представлены табл. 7 и 8.

Таблица 7

Показатель Значение показателя

Статистики \¥ 57,79

Вероятность 0,00

Таблица 8

Различия в оценках коэффициентов регрессионных моделей

панельных данных_

Коэффициент Модель с фиксированными эффектами Модель со случайными эффектами Разность

А 2,162327 0,9922066 1,17012

Р5 0,0145211 0,0014655 0,013056

Ре 8,626024 11,73678 -3,11076

А 0,0042585 0,0199903 -0,01573

Р9 -63,70345 -74,62197 10,91852

Анализируя полученные результаты, можно сделать вывод, что нулевая гипотеза отвергается, т.е. предпочтение следует отдать модели с фиксированными эффектами, оценка которой имеет вид:

% = аг + 2,162 ххм + 0,015 х5и + 8,626хб й +0,004 хм -63,703 х9 й . (9)

(0.827) (0.005) (4.299) (0.0005) (23.841)

Оценкам коэффициентов при значимых переменных можно дать следующую интерпретацию:

1) при увеличении удельного веса населения в трудоспособном возрасте в момент времени I на 1 % общая миграция населения возрастет в среднем на 2,162%;

2) при увеличении среднемесячной номинальной начисленной заработной платы работников в момент времени I на 100 рублей общая миграция населения возрастет в среднем на 0,015%;

3) при увеличении площади жилищ, приходящейся в среднем на одного жителя, в момент времени I на 1 кв. м общая миграция населения возрастет в среднем на 8,626%;

4) при увеличении оборота розничной торговли на душу населения в момент времени 1 на 100 рублей общая миграция населения возрастет в среднем на 0,004%;

5) при увеличении доли населения, ищущего работу, не занятого трудовой деятельностью, в общей численности среднесписочных работников в момент времени I на 1% общая миграция населения снизится в среднем на 63,703%.

По оценкам индивидуальных эффектов построенной регрессионной модели панельных данных можно провести ранжирование городов и районов области по степени напряженности ситуации с миграцией. Чем больше значение индивидуального эффекта, тем при прочих равных условиях будет наблюдаться большее значение уровня миграционной подвижности. При сравнении двух городов или районов области ситуация с миграцией будет сложнее там, где выше значение индивидуального эффекта, аккумулирующего в себе влияние на уровень миграционной подвижности всех неучтенных в модели факторов. Результаты ранжирования городов и районов Оренбургской области по степени напряженности ситуации с миграцией населения представлены в табл. 9.

Таблица 9

Результаты ранжирование административно-территориальных образований Оренбургской области по значениям индивидуальных эффектов

№ п/п Города и районы Значение индивидуального № п/п Города и районы Значение индивидуального эффекта

1 г. Оренбург -553,458 25 Ясненский -335,196

2 г. Орск -422,05 26 Новосергеевский -333,807

3 г. Бузулук -411,497 27 Курманаевский -330,835

4 г. Абдулино -403,802 28 Пономаревский -327,732

5 г. Ясный -400,722 29 Шарлыкский -327,055

6 г. Гай -400,549 30 Матвеевский -326,632

7 г. Новотроицк -397,458 31 Кваркенский -320,835

8 Оренбургский -378,003 32 Домбаровский -319,542

9 г. Сорочинск -374,041 33 Саракгашский -318,244

10 г. Медношрск -366,295 34 Кувандыкский -316,739

11 Грачевский -361,38 35 Соль-Илецкий -315,156

12 г. Бугуруслан -360,847 36 Илекский -311,57

13 Новоорский -359,227 37 Александровский -310,277

14 Светлинский -357,154 38 Переволоцкий -307,745

15 Гайский -353,66 39 Первомайский -307,462

16 Октябрьский -351,341 40 Беляевский -306,667

17 Сорочинский -350,144 41 Тонкий -301,596

18 Абдуллинский -349,421 42 Сакмарский -300,362

19 Бугурусланский -348,969 43 Асеекеевский -296,091

20 Северный -348,744 44 г. Кувандык -294,564

21 Буэулукский -344,391 45 Акбу лакский -286,082

22 Красногвардейский -343,219 46 Тюльганский -274,966

23 Таншинский -339,753 47 г. Соль-Илецк -268,752

24 Адамовский -336,352

По результатам ранжирования можно сделать вывод, что наиболее высокий уровень миграционной подвижности наблюдается в городах области. Это объясняется тем, что в городах сосредоточены многочисленные предприятия различных направлений деятельности, отчасти обеспечивающие мигрантов рабочими местами. Более низкий уровень миграционной подвижности наблюдается в сельских районах с низким уровнем развития экономики. Результаты ранжирования наглядно демонстрируют наличие дифференциации миграции в городской и сельской местности Оренбургской области.

i Надоели баннеры? Вы всегда можете отключить рекламу.