УДК 314.82
Кесаев У.С. студент 2 курса Институт магистратуры Санкт-Петербургский государственный экономический университет Россия, г. Санкт-Петербург КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ ЧИСЛЕННОСТИ НАСЕЛЕНИЯ КРУПНЕЙШИХ ГОРОДОВ РОССИИ
Аннотация: В данной статье рассматривается построение многофакторной модели численности населения крупнейших городов с применением программы для работы с электронными таблицами «Microsoft Excel», оснащенного необходимым набором функций. В качестве факторных признаков взяты следующие: средняя номинальная заработная плата, основные фонды, инвестиции в основной капитал, стоимость ЖКХ, стоимость жилья.
Ключевые слова: многофакторная модель, регрессия, корреляция, демография, население, программа «Microsoft Excel».
Kesaev U.S.
Master
St. Petersburg State University of economics
Saint-Petersburg, Russia
CORRELATION AND REGRESSION ANALYSIS of POPULATION THE LARGEST CITIES OF RUSSIA
Аннотация: This article discusses the construction of multifactor regression models of population largest cities using the Microsoft Excel. Consider the following factor signs: average nominal wage, investment in fixed assets, the cost of utilities, the cost per square meter of housing.
Ключевые слова: multifactorial model, correlation, regression, demography, population, Microsoft Excel
Знания экономической и эконометрической статистики необходимы для решения задач в области социологических и маркетинговых исследований. Статистический анализ позволяет выявить тенденции, вероятные альтернативы, связи между данными, на основе чего целесообразно уже принимать решение. Статистика стремится к объективизации, пытаясь избавиться от субъективной стороны, в этом ее огромное преимущество по сравнению с решениями, принятыми отчасти на интуиции. В условиях сегодняшней рыночной системы знание точной информации, основанной на принципах эконометрики, - важный инструмент для конкурентоспособности на микроуровне и макроуровне. Для специалиста по социологии и экономике умение обращаться с современными компьютерными программами для обработки статистической
информации позволит автоматизировать объемные вычисления.
В данной работе была использована программа для работы с электронными таблицами «Microsoft Excel» для анализа экономико-математической модели. Для обработки статистической информации использовались функции «Регрессия» и «Корреляция» внутри программы.
В качестве исходных данных были взяты следующие показатели по 15 городам России, численность населения которых превышает 1 млн. человек. Показатели взяты за 2016 год. Соответственно результативным фактором стал показатель численности населения. Основываясь на статистических предположениях о взаимосвязях результативного и факторных признаков, в модель были включены следующие переменные (независимые) (см. Таблица 1):
- x1 - средняя начисленная номинальная заработная плата, руб.;
- x2 - наличие основных фондов организаций, млн. руб.;
- x3 - инвестиции в основной капитал, млн. руб.;
- x4 - годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб.;
- x5 - стоимость кв. м. жилья, руб.;
- x6 - обеспеченность ТЦ, кв. м на 1 тыс. жителей;
- y - население, чел. (в качестве наблюдения взяты города -миллионнеры).
Таблица 1 - Исходные данные для проведения корреляционно-регрессионного анализа [1; 2]_
Города (наблюдения) y x1 x2 x3 x4 x5 x6
Волгоград 1016000 29902,4 889610,5 101042, 1 35069 50395 281
Воронеж 1032000 30819,6 713939,3 63260,8 34382 49525 321
Екатеринбург 1444000 41477,7 2496786,3 105644, 1 38004 73539 477
Казань 1217000 34741 1177816 108722, 5 34313 67584 300
Красноярск 1067000 39671,9 830925,7 66542,4 34665 57083 201
Москва 1233000 0 64310 12243250, 7 161151 2 48929 217054 376
Нижний Новгород 1267000 36406,8 974449,1 95743,9 43544 63929 500
Новосибирск 1584000 37093 923633,5 77557,5 31203 61635 230
Омск 1178000 31077,4 592333,5 57710,6 32196 47778 221
Пермь 1042000 36756,3 938139,1 117093, 3 36331 54034 133
Ростов-на-ДонУ 1120000 35394,7 1095005,5 106443, 6 37096 61455 342
Самара 1171000 34234,1 1302540,2 87009,8 34168 62672 562
Санкт-Петербург 5226000 44187 4102243,8 521293 34035 108779 388
Уфа 1111000 35674,1 1196775,8 97286,8 34599 65469 336
Челябинск 1192000 32711 755367,3 81851,8 28147 45718 306
В процессе выполнения работы на первом этапе были собраны исходные данные, основным источник послужили статистические сборники Росстата, но при заполнении данных по обеспеченности городов ТЦ были использованы материалы Cushman & Wakefield. При этом показатель годовой стоимости ЖКХ рассчитывается для площади 45 м2 (годовое потребление электричества = 2400 кВт*ч; горячей и холодной воды по 24 м3).
Далее необходимо провести корреляцию показателей для выяснения мультиколлинеарности связей. Используется следующая «Корреляция». Полученный результат представлен в таблице 2.
Таблица 2 - Данные для определения коллинеарности признаков
y x1 x2 x3 x4 x5 x6
y 1
x1 0,933555 1
x2 0,987431 0,951136 1
x3 0,994962 0,930206 0,991161 1
x4 0,669242 0,728452 0,722351 0,704162 1
x5 0,985535 0,960097 0,992557 0,985598 0,735705 1
x6 0,15987 0,179862 0,217336 0,147032 0,362317 0,23548 9 1
Таким образом, из возможных факторов остается «Средняя начисленная номинальная заработная плата», «Наличие основных фондов», «Инвестиции в основной капитал», «Годовая стоимость ЖКХ», «Стоимость жилья». Факторный признак «Обеспеченность ТЦ» отпадает, показав самую низкую тесноту связи (0,16).
Представим регрессию из оставшихся факторов через функцию «Регрессия». Результаты представлены чуть ниже в таблице 3. R-квадрат равен - 0,87 (очень сильная детерминационная связь).
Таблица 3 - Результаты регрессионного анализа
Регрессионная статистика
Множественный R 0,950999405
R-квадрат 0,904399868
Выходит, что 90% вариации результата объясняется вариацией признаков-факторов. Коэффициент множественной корреляции составил 0,95, что говорит о сильной тесноте связи. Это является достаточным для использования модели.
Также то, что вариант модели является статистически надежным, указывает F-критерий Фишера, который составил 319, 2. Критическим значением для уровня значимости 0,05 при числе степеней свободы 5 и 9 является 3,5.
Дополним нашу модель результатами дисперсионного анализа (см. Таблицу 4).
Таблица 4 - Результаты дисперсионного анализа
Коэффициенты Стандартная ошибка (т а и т Ь) ^статистика а и t Ь)
Y-пересечение 838712,0318 1124581,662 0,745799136
Средняя начисленная номинальная заработная плата, руб. (Х1) 12,4347959 34,84104228 0,356900801
Наличие основных фондов организаций, млн. руб. (Х2) -0,1649883 0,271497465 0,607697387
Инвестиции в основной капитал, млн. руб. (Х3) 6,384169337 1,548116962 4,123828816
Годовая стоимость ЖКХ (исходя из площади в 45 кв.м.), руб (Х4) -52,51125891 22,62490474 2,320949393
Стоимость кв. м. жилья, руб. (Х5) 23,47374156 16,8108889 1,396341485
Таким образом, зная коэффициенты, можно построить уравнение множественной регрессии:
ух = 838712 + 12,4x1 - 0,2x2 + 6,4x3 - 52,5x4 + 23,5x5 (1)
Самую большую тесноту показывает показатель «годовая стоимость ЖКХ». Существенная отрицательная связь с признаком «Годовая стоимость ЖКХ», где коэффициент регрессии равен (-52,51), то есть при увеличении годовой стоимости ЖКХ на 1 руб. уменьшается количество населения 52,5 человека. На первый взгляд, вызывает сомнения положительная величина коэффициента регрессии у показателя «Стоимость квадратного метра», но это можно объяснить просчетами модели: логично предположить, что чем больше населения в городе, тем дороже там жилье. В данном случае результативным фактором мог вполне наоборот выступать показатель
««Стоимость квадратного метра». Наименее оказывающим влияние признаком является наличие основных фондов (-0,16).
Таким образом, использовав в качестве инструмента экономико-математического моделирования корреляцию и регрессию, были определены показатели, которые, возможно выступают как факторный признака по своему влиянию на показатель «Население».
Использованные источники:
1. Обеспеченность торговыми площадями, города России [Электронный ресурс]. - Режим доступа: http://cwrussia.ru/analytics/infographic/office-property-map.html/ (дата обращения: 12.01.2018)
2. Россия в цифрах. 2017: Крат.стат.сб./Росстат- М., - 2017 - 511 с