Научная статья на тему 'Анализ зависимости рождаемости от уровня бедности и среднедушевого дохода'

Анализ зависимости рождаемости от уровня бедности и среднедушевого дохода Текст научной статьи по специальности «Математика»

CC BY
215
43
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
E-Scio
Область наук
Ключевые слова
MULTIPLE LINEAR REGRESSIONS / MATRIX OF CORRELATION COEFFICIENTS / COEFFICIENT OF DETERMINATION / HALFRED-QUANTUM TEST / DURBIN-WATSON TEST

Аннотация научной статьи по математике, автор научной работы — Миргасимов Дамир Рустамович

Проведен анализ зависимости рождаемости от уровня бедности и среднедушевого дохода. Построена регрессионная модель и проведена оценка модели на наличие автокорреляции и гетероскедастичности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ зависимости рождаемости от уровня бедности и среднедушевого дохода»

УДК 517.9

Экономические науки

Миргасимов Дамир Рустамович, студент, Финансовый Университет при Правительстве РФ, г. Москва, Россия

e - mail: dammirg97@gmail. com

АНАЛИЗ ЗАВИСИМОСТИ РОЖДАЕМОСТИ ОТ УРОВНЯ БЕДНОСТИ И

СРЕДНЕДУШЕВОГО ДОХОДА

Аннотация: Проведен анализ зависимости рождаемости от уровня бедности и среднедушевого дохода. Построена регрессионная модель и проведена оценка модели на наличие автокорреляции и гетероскедастичности.

Ключевые слова: линейная множественная регрессия, матрица парных коэффициентов корреляции, коэффициент детерминации, тест Гольфреда-Кванта, тест Дарбина-Уотсона.

Annotation: Analysis of the dependence of the birth rate from the level of poverty and per capita income. The author builds a regression model and the estimation models for the presence of autocorrelation and heteroscedasticity.

Keywords: multiple linear regressions, matrix of correlation coefficients, the coefficient of determination, Halfred-Quantum test, Durbin-Watson test.

Проведем анализ зависимости рождаемости от уровня бедности и среднедушевого дохода. В качестве показателей будем использовать коэффициент рождаемости (Y), численность населения с доходами ниже прожиточного минимума (X1) и среднедушевой доход (X2).

Таблица 1. Исходные данные [3].

Численность

населения с

доходами

ниже

прожиточного Среднедушевой

год Крожд минимума, % доход, тыс. руб

У Х1 Х2

1999 1,157 28,4 1,66

2000 1,195 29 2,28

2001 1,223 27,5 3,06

2002 1,286 24,6 3,95

2003 1,319 20,3 5,17

2004 1,344 17,6 6,40

2005 1,294 17,8 8,09

2006 1,305 15,2 10,15

2007 1,416 13,3 12,54

2008 1,502 13,4 14,86

2009 1,542 13 16,90

2010 1,567 12,5 18,96

2011 1,582 12,7 20,78

2012 1,691 10,7 23,22

2013 1,707 10,8 25,93

2014 1,750 11,2 27,77

2015 1,777 13,3 30,47

2016 1,762 13,5 30,7384

Построим графики зависимостей Y от X! Y от X2.

Зависимость У от XI

2 1,5

1 0,5

0

Рисунок 1. График зависимости У от Х1 По графику можно сделать вывод что связь между численностью населения с доходами ниже прожиточного минимума (XI) и коэффициентом рождаемости (У) линейная. Коэффициент детерминации, изображенный на графике

5 10 15 20 25 30 35

показывает, что на 70,7% вариация рождаемости зависит от вариации численности населения с доходами ниже прожиточного минимума.

Зависимость У от Х2

2

R2 = 0,9731

1 0,5

0,00 5,00 10,00 15,00 20,00 25,00 30,00 35,00

Рисунок 2. График зависимости Y от X2 По графику можно сделать вывод что связь между среднедушевым доходом (X2) и коэффициентом рождаемости (Y) линейная. Коэффициент детерминации, изображенный на графике показывает, что на 97,3% вариация рождаемости зависит от вариации среднедушевого дохода.

Чтобы проверить связь между всеми факторами, построим матрицу парных коэффициентов корреляции. Будем использовать команду КОРРЕЛЯЦИЯ из встроенного в Excel пакета АНАЛИЗ ДАННЫХ.

Таблица 2 - Матрица парных коэффициентов

y x1 x2

y 1

x1 -0,841 1

x2 0,986 -0,826 1

Связь сильнее между коэффициентом рождаемости и среднедушевым доходом, корреляция равна 0,986. К тому же между факторными признаками присутствует мультиколлинеарность. Корреляционная связь между факторными переменными Х1 и Х2 сильная (-0,826). Это говорит о сильной взаимосвязи между численностью населения с доходами ниже прожиточного минимума и среднедушевым доходом, что может сказаться на качестве постоянной модели.

Для расчета регрессии будем использовать команду РЕГРЕССИЯ из встроенного в Excel пакета АНАЛИЗ ДАННЫХ. Получим уравнение линейной множественной регрессии (см. Приложение1 таб. 1).

Y = 1,23 - 0,003* X1 + 0,019* X 2 (1)

По данному уравнению можно сделать следующий вывод: при изменении числа населения с доходами ниже прожиточного минимума на 1% и неизменном уровне второго фактора, коэффициент рождаемости измениться на 0,003 единицы. При изменении среднедушевого дохода на 1 тыс. рублей и неизменном уровне второго фактора, коэффициент рождаемости измениться на 0,019 единицы.

Верификация уравнения регрессии проводится на основе результатов автоматизированного регрессионного анализа. Экспресс-верификация проводится по следующим показателям: «R2», «Значимость F», «P-значение» (по каждому

параметру регрессии), а также по графикам подбора и остатков [1].

2 2 «R » - показатель детерминации в нашем случае он равняется R =0,975 (см.

Приложение 1 таб. 1). Это означает что на 97,5 % изменения уровня рождаемости

зависит от изменения исследуемых факторов. Т.к. показатель близок к единице,

можно говорить о высоком уровне описания уравнения в целом.

«Значимость F» - Расчетный коэффициент Фишера равен Fpac4 = 294,79 (см.

Приложение1 таб. 1). Табличное значения критерия Фишера равно Fma6n = 3,55.

F > F

расч табл, следовательно, модель в целом признается значимой. Достоверность по уровню значимости критерия Фишера (см. Приложение1 таб. 1 Значимость F) значительно меньше 0,05, значит модель значима.

По графикам остаткам формируются предварительные суждения о выполнимости предпосылок МНК.

Рисунок 3. График остатков для переменной Х1

Переменная X 2 График остатков

0,1 х 0,05

-0,1

♦♦♦

♦ ♦

-0,050,00 10,00 ♦

20,00 30,00

40,00

Переменная X 2

Рисунок 4. График остатков для переменной Х2

Определенная связь между отклонениями отсутствует, это будет свидетельствует об отсутствии гетероскедастичности.

В целом можно сделать вывод, что построенная модель статистически значима и уровень описания уравнения в целом достаточно высок. Рассчитаем критерий Дарбина-Уотсона для нашей модели.

БШ =

_ 0,0215

0,0207

= 1,039

(2)

Автокорреляция отсутствует, если выполняется следующее условие: d1 < DW и d2 < DW < 4 - d2. В нашем случае d1=1,05 и d2=1,53. В нашем случае условия отсутствия автокорреляции не выполняются: 1,05 > DW и 1,53 > DW < 2,47. Можно сделать вывод, что присутствует положительная автокорреляция остатков.

В модели множественной регрессии выбирается переменная, от которой наиболее зависима результативная переменная. В нашем случае наибольшая взаимосвязь с коэффициентом рождаемости наблюдается у фактора Х2 -среднедушевой доход, т.к. коэффициент корреляции между ними равен 0,986 [2].

В данном случае предполагается, что стандартное отклонение ш = пропорционально значению xi переменной X в этом наблюдении, т.е. а^ = а2х2! , i = 1,2,...,п.

Тест Голдфелда-Квандта состоит в следующем:

1. Все п наблюдений упорядочиваются по величине X.

2. Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей к, (п-2к),к.

3. Оцениваются отдельные регрессии для первой подвыборки (к первых наблюдений) и для третьей подвыборки (к последних наблюдений).

4. Для сравнения соответствующих дисперсий строится соответствующая F-статистика:

5. F = S3/S1

6. Построенная F-статистика имеет распределение Фишера с числом степеней свободы VI = v2 = (п - c - 2m)/2.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

7. Если F > Fkp, то гипотеза об отсутствии гетероскедастичности отклоняется.

Этот же тест может использоваться при предположении об обратной пропорциональности между а! и значениями объясняющей переменной. При этом статистика Фишера имеет вид: F = S1/S3.

Упорядочим все значения по величине Х2. Находим размер подвыборки к=(18-4)/2=7. Где с = 4п/15 = 4*18/15 = 4.

Затем оценим регрессию для первой подвыборки. Регрессия для первой подвыборки будет иметь следующий вид:

V = 1,15 + 0,025Х (3)

Найдем дисперсию уравнения регрессии первой подвыборки.

51 = £Г=1(У-Урасч)^ = 0,0089 = о,оо148 (4)

п-т 7-1 у 7

Оценим регрессию для третьей подвыборки. Регрессия третьей подвыборки имеет вид.

V = 1 , 2 4 + 0 , О О 2 2Х (5)

Найдем дисперсию уравнения регрессии третьей подвыборки.

5 з = ^Г-Грасч)* = 0,0032 = о , О О О 5 4 (6)

п-т 7-1 4 7

Число степеней свободы VI = v2 = (п - c - 2m)/2 = (18 - 4 - 2*1)/2 = 6. Fкр(6,6) = 5,99. Строим обратную F-статистику:

F = 0,0 0 148/0,000 54 = 2,74 (7)

Поскольку F<Fкр, то гипотеза об отсутствии гетероскедастичности принимается.

Подведем итог. При изучении зависимости рождаемости от уровня бедности и среднедушевого дохода мы сделали вывод о сильной взаимосвязи рождаемости с данными факторами. По построенному уравнению регрессии можно сделать вывод что, при изменении числа населения с доходами ниже прожиточного минимума на 1% и неизменном уровне второго фактора, коэффициент рождаемости измениться на 0,003 единицы. При изменении среднедушевого дохода на 1 тыс. рублей и неизменном уровне второго фактора, коэффициент рождаемости измениться на 0,019 единицы.

При этом построенная модель статистически значима и уровень описания уравнения в целом достаточно высок.

Однако, критерий Дарбина-Уотсона указывает на присутствие положительная автокорреляция остатков. Критерий Гольдфельда-Квандта указывает на отсутствие гетероскедастичности. Это означает, что наблюдения однородны, то есть дисперсии случайных ошибок модели постоянны.

Библиографический список:

1. Гладилин А.В. Эконометрика [Электронный ресурс]: учебное пособие для вузов [Гриф УМО] / А. В. Гладилин, А. Н. Герасимов, Е. И. Громов. - 3-е изд., стер. - Электрон. текстовые дан. - Москва : КноРус, 2014. - 227 с. (дата обращения 02.12.2017).

2. Новиков А.И. Эконометрика [Электронный ресурс]: учебное пособие для вузов / А. И. Новиков. - Электрон. текстовые дан. - Москва: Дашков и К°, 2013. - 223 с. - Режим доступа: http://elanbook.com/view/book/5670/ (дата обращения 03.12.2017).

3. Федеральная служба государственной статистики [Электронный ресурс] URL: http://www.gks.ru/ (дата обращения 01.12.2017).

Приложение 1.

Таблица 1. Расчетная таблица

ВЫВОД ИТОГОВ

Регрессионная статистика

Множестве нный R 0,987517

R-квадрат 0,97519

Нормирова нный R-квадрат 0,971881

Стандартна я ошибка 0,035437

Наблюдени я 18

Дисперсионный анализ

df SS MS F Значимо сть F

Регрессия 2 0,740406 0,370203 294,79 14 9,12E-13

Остаток 15 0,018837 0,001256

Итого 17 0,759244

Коэффицие нты Стандар тная ошибка t- статист ика P- Значе ние Нижние 95% Верхн ие 95% Нижн ие 95,0% Верхн ие 95,0%

Y- пересечение 1,233632 0,060963 20,23587 2,66E-12 1,103693 1,3635 71 1,1036 93 1,3635 71

Переменная X 1 -0,00274 0,002417 -1,13295 0,2750 21 -0,00789 0,0024 13 0,0078 9 0,0024 13

Переменная X 2 0,019201 0,001507 12,74255 1,89E-09 0,015989 0,0224 12 0,0159 89 0,0224 12

i Надоели баннеры? Вы всегда можете отключить рекламу.