Построение и анализ эконометрических моделей зависимостей формирования цен на
жилую недвижимость в регионах
Construction and analysis of econometric models of dependence formation of prices for
residential real estate in regions
Маркевич Д.В.
Студент 2 курса, ф-т управления перевозками и логистики, Петербургский государственный университет путей сообщения Императора Александра I,
РФ, г. Санкт-Петербург e-mail: dvmarkevich@gmail. com
Markevich D.
2nd year student, The Faculty of Railway Operation and Logistics, Emperor Alexander I St. Petersburg state transport university,
Russia, Saint-Petersburg e-mail: [email protected]
Аннотация.
Предметом изучения в статье являются математические соотношения для вычисления точечных числовых характеристик случайного вектора в рамках вопросов рыночного ценообразования жилой недвижимости в регионах. В данной работе осуществляется освоение математических соотношений для вычисления по выборочным данным точечных числовых характеристик экономических переменных, построение корреляционного поля случайной двумерной величины, а также освоение математических соотношений для вычисления по выборочным данным числовых характеристик связи (зависимости) экономических переменных в рамках вопросов рыночного ценообразования жилой недвижимости в регионах на примере субъектов РФ, входящих в Северо-Западный федеральный округ. Также, в работе автор обосновывает построение эконометрической модели исследования средней цены на жилую недвижимость в регионе, выполняет расчет параметров модели, оценку качества и статистической значимости построенной модели, рассматривает примеры прогнозирования на основе регрессионной модели.
Annotation.
The subject of the article is mathematical relations for calculating point numerical characteristics of a random vector in the framework of questions of market pricing of residential real estate in the regions. In this work is the development of mathematical relationships to calculate sample data point in the numerical characteristics of economic variables, the construction of correlation fields two-dimensional random variable, as well as the development of mathematical relationships to calculate sample data for the numerical characteristics of the connection (dependence) economic variables within the framework of market-based pricing of residential property in the regions on the example of subjects of the Russian Federation within the northwestern Federal district. In addition, the author justifies the construction of an econometric model for the study of the average price of residential real estate in the region, calculates the parameters of the model, assesses the quality and statistical significance of the model, and considers examples of forecasting based on a regression model.
Ключевые слова: эконометрика, математическая модель, определение корреляции двух переменных, прогнозирование на основе корреляции.
Key words: econometrics, mathematical model, determining the correlation of two variables, forecasting based on correlation.
Вопрос о соотношении цена недвижимости-доходы является остросоциальным и поставлен в России уже давно, ведь, согласно многочисленным опросам, множество граждан не может позволить себе достойное жильё за свои доходы. В связи с этим активно проявляется потребность в методиках прогнозирования развития рынка недвижимости со стороны госорганов, связанную с разработкой и необходимостью обоснования стратегий развития. Исходя из этого тезиса, в статье будут проводиться математические расчёты, позволяющие сделать вывод о том, насколько связаны эти показатели между собой. В информационной базе ЕМИСС были получены следующие данные о значениях показателей субъектов Северо-Западного федерального округа за 2019 год
(Таблица 1).
Таблица 1. Статистические данные по средней цене 1 кв. м. жилой площади квартир всех типов (в тыс. руб.) и
денежных доходов (в среднем на душу), в тыс. руб./мес. [1]
Номер субъекта РФ Наименование субъекта Средняя цена 1 кв. м. жил. площади квартир всех типов, тыс. руб. Денежные доходы (в среднем на душу), тыс. руб./мес.
1 Республика Карелия 48,733 29,150
2 Республика Коми 44,827 33,961
3 Архангельская область 60,093 33,830
4 Ненецкий автономный округ 67,602 78,549
5 Архангельская область (без АО) 58,387 32,054
6 Вологодская область 40,248 26,982
7 Калининградская область 51,835 27,461
8 Ленинградская область 53,634 31,341
9 Мурманская область 67,962 41,564
10 Новгородская область 43,704 25,292
11 Псковская область 37,883 23,880
12 г. Санкт-Петербург 109,346 44,999
При рассмотрении процесса исследования от простого к сложному, стоит начать анализировать цену 1 кв. м. жилой площади в совокупности со среднедушевыми денежными доходами населения и проверять предположения о возможной связи между ними и эти показатели стоит рассматривать в качестве случайных величин.
При отсутствии и к тому же практической невозможности получения информации о вероятностях возможных значений случайной величины невозможно узнать параметры распределения и числовые характеристики данной случайной величины, оценить закономерности ее изменения и связь с другими переменными.
Основными числовыми характеристиками случайных величин являются математическое ожидание, дисперсия, среднеквадратическое отклонение. Дисперсия и среднеквадратическое отклонение случайной величины характеризует ее вариацию (поведение, изменчивость, разброс значений). Именно вариация показателей является предметом нашего анализа.
Каждая республика и область есть отдельное выборочное наблюдение. Стоит обозначить через / -порядковый номер области исследуемого региона (номер выборочного наблюдения), а через у^ - значение средней цены 1 кв. м. жилой площади в 1-ой области, - значение среднедушевого денежного дохода населения в /-ой области.
Для расчета выборочных точечных оценок числовых характеристик средней цены на недвижимость и среднего дохода населения в нем рассчитаем следующую таблицу (Таблица 2):
_Таблица 2. Расчётная таблица
1 У1 Хi У1-У (У1-У)л2 Х1-Х (х1-х)л2 (у1-у)(х1-х)
1 48,733 29,150 -8,288 68,694 -6,605 43,629 54,745
2 44,827 33,961 -12,194 148,698 -1,794 3,219 21,879
3 60,093 33,830 3,072 9,436 -1,925 3,707 -5,914
4 67,602 78,549 10,581 111,954 42,794 1831,305 452,794
1 У1 Хi У1-У (У1-У)Л2 Х1-Х (х1-х)Л2 (у1-у)(х1-х)
5 58,387 32,054 1,366 1,866 -3,701 13,699 -5,055
6 40,248 26,982 -16,773 281,339 -8,773 76,970 147,155
7 51,835 27,461 -5,186 26,896 -8,294 68,795 43,015
8 53,634 31,341 -3,387 11,473 -4,414 19,486 14,952
9 67,962 41,564 10,941 119,702 5,809 33,742 63,553
10 43,704 25,292 -13,317 177,347 -10,463 109,480 139,341
11 37,883 23,880 -19,138 366,269 -11,875 141,022 227,271
12 109,346 44,999 52,325 2737,888 9,244 85,447 483,678
Сумма 684,254 429,063 0,000 4061,562 0,000 2430,499 1637,413
На основании данных таблицы 2 рассчитываются выборочные оценки. Исходя из значения выборочного среднего квадратического отклонения, оценка среднего отклонения цены квадратного метра недвижимости составляет 19,215 тыс. руб. (бу = 19,215), что составляет 34% от его среднего значения (ру = 33,7%). Оценка среднего отклонения денежного дохода населения - 14,865 тыс. руб. (бх = 14,865), что составляет 42% от его среднего значения (ух = 41,6%).
Таким образом, выполненная выборочная оценка средних отклонений на уровне 34% и 42% средних значений показателей, свидетельствует, с одной стороны, о наличии существенной вариации показателей и целесообразности ее исследования и анализа, а, с другой стороны, позволяет предположить однородность выборочных наблюдений.
Следующий этап анализа - проверка предположения о наличии связи (зависимости или взаимозависимости) между показателями. Связь между показателями, которые рассматриваются как случайные величины или хотя бы один из них является случайной величиной, носит стохастический характер.
Для выявления стохастической связи между ценами на жилую недвижимость и денежными доходами населения построим корреляционное поле и рассчитаем коэффициент корреляции (Рисунок 1).
Рисунок 1. Корреляционное поле показателей
Определенная хаотичность расположения точек есть следствие стохастической связи между показателями. При функциональной зависимости точки лежали бы на линии (прямой - при линейной зависимости или кривой - при нелинейной зависимости).
Точки корреляционного поля в основном сосредоточены во II и III квадратах, слегка задевая I квадрат, что свидетельствует о прямой связи показателей - более высокому среднедушевому доходу соответствует более высокая цена на жилую недвижимость. Вытянутое облако точек, их относительная концентрация вокруг отмеченной пунктиром прямой линии (за небольшим исключением), позволяет предположить наличие линейной стохастической связи между доходом населения и ценами на рынке жилья.
Продолжая начатые вычисления, рассчитываются выборочные оценки коэффициентов ковариации и корреляции, значения £ — критерия Стьюдента для оценки связи цены недвижимости и доходов населения (Таблица 3):
Таблица 3. Расчётная таблица
СОУху 1637,413 / (12-1) = 148,856
Г ху 148,856 / (14,865 * 19,215) = 0,521
г (0,521 * ^(12-2)) / ^(1 - 0,5212) = 1,931
tz (^(12-3) / 2) * 1п((1 + 0,521) / (1 - 0,521) = 1,734
а 0,05
г 0,95,10 1,812
Из полученных результатов, вытекают следующие выводы:
1. Положительное значение коэффициента корреляции подтверждает предположение о прямой связи между стоимостью жилой недвижимости и денежными доходами населения.
2. Значение коэффициента корреляции на уровне 0,521 позволяет предположить относительно тесную линейную связь между стоимостью 1 кв. м. жилья и среднедушевыми доходами населения.
3. Выборка в 12 наблюдений относится к категории малых выборок. При уровне значимости а = 0,05 расчетное значение £ —критерия Стьюдента превышает критическое значение £1-а,п-2:
= 1,734 < 1,812 = ^,95,12
Поэтому можно говорить о небольшом статистическом различии коэффициента корреляции и корреляционной связи анализируемых показателей.
Итак, анализ статистических данных, расчет их выборочных числовых характеристик позволяет сделать следующие выводы:
1. Исследуемые свойства рынка недвижимости (соответствующие показатели) могут и должны рассматриваться как случайные величины.
2. Данные случайные величины имеют существенную, но умеренную вариацию. Что говорит, с одной стороны, о целесообразности ее исследования, а, с другой стороны, об однородности данных.
3. Наличие стохастической связи между показателями делает целесообразным использования методов эконометрического моделирования в исследовании поведения цен на жилую недвижимость.
В следующей таблице (Таблица 4) приведены числовые характеристики исследуемых показателей:
Таблица 4. Расчётная таблица
Математические характеристики Средняя цена 1 кв. м. жил. площади квартир всех типов, тыс. руб. Денежные доходы (в среднем на душу), тыс. руб./мес.
Выборочные средние 57,021 35,755
Выборочные дисперсии 369,233 220,954
Выбор. сред. квадр. отклонения 19,215 14,865
Выбор. коэффициент вариации 0,337 0,416
Коэффициент корреляции 0,521
Значение коэффициента гух = 0,521 позволяет сделать вывод насчет связи между ценой 1 кв. м. жилой площади и средними денежными доходами населения, поэтому данные показатели включены в модель парной регрессии.
Задача спецификации модели - выбор математического вида уравнения регрессии. Цена жилья будет рассматриваться нами как результирующий признак (объясняемая, зависимая переменная) у. Денежные доходы населения будут рассматриваться как характеристика его платежеспособного спроса и выступать как фактор (объясняющая, независимая переменная) х.
Итак, проведенный по данным для 12 областей Северо-Западного федерального округа анализ свидетельствует о целесообразности построения модели парной линейной регрессии зависимости цены 1 кв. м. жилой недвижимости от среднедушевых доходов населения региона (Таблица 5).
Таблица 5. Расчётная таблица
Наименование субъекта РФ х У х2 У2 ху Ух = а + Ьх Абсолютные остатки Относительные остатки (х/ -хср)2
Псковская обл. 23,88 37,88 570,25 1435,12 904,65 49,02 11,14 0,29 141,02
Вологодская обл. 26,98 40,25 728,03 1619,90 1085,97 51,11 10,86 0,27 76,97
Новгородская обл. 25,29 43,70 639,69 1910,04 1105,36 49,97 6,27 0,14 109,48
Респ. Коми 33,96 44,83 1153,35 2009,46 1522,37 55,81 10,99 0,25 3,22
Респ. Карелия 29,15 48,73 849,72 2374,91 1420,57 52,57 3,84 0,08 43,63
Калининградская обл. 27,46 51,84 754,11 2686,87 1423,44 51,43 0,40 0,01 68,79
Ленинградская обл. 31,34 53,63 982,26 2876,61 1680,94 54,05 0,41 0,01 19,49
Архангельская обл. (без АО) 32,05 58,39 1027,46 3409,04 1871,54 54,53 3,86 0,07 13,70
Архангельская обл. 33,83 60,09 1144,47 3611,17 2032,95 55,72 4,37 0,07 3,71
Ненецкий АО 78,55 67,60 6169,95 4570,03 5310,07 85,85 18,25 0,27 1831,31
Мурманская обл. 41,56 67,96 1727,57 4618,83 2824,77 60,93 7,03 0,10 33,74
г. СПб 45,00 109,35 2024,91 11956,55 4920,46 63,25 46,10 0,42 85,45
о 2 о 2 , ^^ 220,95 369,23
Sx, Sy 14,86 19,22
Построенная модель линейной регрессии свидетельствует о наличии существенной вариации показателей и целесообразности ее исследования, а также позволяет предположить однородность выборочных наблюдений.
Вычисление оценок коэффициентов линейной парной регрессии зависимости цен на жилую
недвижимость от денежных доходов населения региона осуществляется на основании выполненных промежуточные расчетов (Таблица 2).
Расчет оценок коэффициентов линейной функции регрессии зависимости ср. цены 1 кв. метра от уровня денежных доходов населения выполняется с использованием математических соотношений:
= £Г=1(х—х)(у—у)^ 1161,285 = Е"=1(*г - *)2 1836,105 , а = у-Ьх = 46,902 - 0,632 * 31,099 = 32,933
Оценка уравнения регрессии с учетом найденных оценок его коэффициентов имеет следующий вид:
& = 32,933 + 0,674^
Значение коэффициента регрессии Ь = +0,674 означает:
1) между переменными прямая зависимость, т.е. с ростом денежных доходов в среднем растут и цены на недвижимость,
2) увеличение среднедушевых денежных доходов населения на 1 тыс. руб. в среднем приведет к росту цены 1 кв. м. жилой недвижимости на 674 рубля.
Для каждого выборочного значения уровня денежных доходов населения X; по оцененному уравнению регрессии определяются расчетные значения средней цены 1 кв. м. жилой площади у;. Стоит также рассчитать отклонение выборочных значений цены от ее расчетных значений (у; — у;) (Таблица 6).
Таблица 6. Расчётная таблица
1 У1 Х1 У У1- У
1 48,733 29,150 52,571 -3,838
2 44,827 33,961 55,812 -10,985
3 60,093 33,830 55,724 4,369
4 67,602 78,549 85,851 -18,249
5 58,387 32,054 54,528 3,859
6 40,248 26,982 51,111 -10,863
7 51,835 27,461 51,433 0,402
8 53,634 31,341 54,047 -0,413
9 67,962 41,564 60,934 7,028
10 43,704 25,292 49,972 -6,268
11 37,883 23,880 49,021 -11,138
12 109,346 44,999 63,249 46,097
Сумма 684,254 429,063 - 0,000
Равенство нулю суммы всех отклонений выборочный значений цены от ее расчетных значений — у;) = 0 свидетельствует о правильности выполненных расчетов.
Результаты проверки статистической значимости построенного уравнения регрессии средней цены 1 кв. м жилой площади по среднедушевым доходом населения в графическом формате представлены на рисунке 2. Результаты оценки статистической значимости уравнения регрессии предоставлены в таблице 7.
Рисунок 2. Корреляционное поле данных. Степенная и показательная регрессии
Таблица 7. Результаты оценки статистической значимости уравнения регрессии
Степенная регрессия
Номер субъекта РФ X У Х=Ых Y= ]□> Р XY Пред ска занные значения ГЛ = я - л4 Абсолютные остатки Относительные остатки х¥ Предска занные значена я Абсолю тные остатки Относительные остатки
1 23,880 37,883 3,173 3,635 10,068 13,210 11,532 45,051 7,168 0,159 86,792 48,368 10,485 0,794
2 25,292 43,704 3,230 3,777 10,436 14,269 12,203 46,518 2,814 0,064 95,539 49,078 5,374 0,377
3 26,982 40,248 3,295 3,695 10,858 13,653 12,176 48,227 7,979 0,198 99,700 49,941 9,693 0,710
4 27,461 51,835 3,313 3,948 10,974 15,587 13,079 48,703 3,132 0.060 108,418 50,189 1,646 0,106
5 29,150 48,733 3,372 3,886 11,373 15,104 13,107 50,352 1,619 0.033 113,287 51,071 2,338 0,155
6 31,341 53,634 3,445 3,982 11,868 15,858 13,718 52,430 1,204 0,022 124,806 52,239 1,395 0,088
7 32,054 58,387 3,467 4,067 12,023 16,541 14,102 53,092 5,295 0.091 130,367 52,625 5,762 0,348
33,830 60,093 3,521 4,096 12,400 16,776 14,423 54,713 5,380 0,090 138,564 53,598 6,495 0,387
9 33,961 44,827 3,525 3,803 12,427 14,461 13,406 54,831 10,004 0.223 129,147 53,670 8,843 0,612
10 41,564 67,962 3,727 4,219 13,892 17,800 15,725 61,373 6,589 0,097 175,356 58,051 9,911 0,557
11 44,999 109,35 3,807 4,695 14,491 22,038 17,870 64,153 45,193 0,413 211,249 60,145 49,201 2,233
12 78,549 67,602 4,364 4,214 19,042 17,755 18,387 87,537 19,935 0,295 330,977 85,025 17,423 0,981
Средине значения 35,755 57,021 3,520 4,001 12,488 16,088 14,144 55,582 9,693 0,148 145,350 55,333 10,714 0,612
220,95 369,23 0,11 0,08 Коэффициенты уравнении регрессии j' а г
b 0,5579
14,86 19,22 0,33 0,29 а 7,6720
Коэффициенты уравнении регрессии г = я -й*
Ь 1.01037
а 37.8046
Показательная регрессия
Функция регрессии, которая была построена, дает возможность рассчитывать прогнозные значения средней стоимости жилой площади при заданном значении среднедушевых доходов населения. После проведения расчётов можно сказать, что связь показателей прямая и с увеличением среднедушевых доходов населения, возрастают цены и на жилье.
По предоставленным данным составлены графики линейной функции регрессии и значения опытных данных (Рисунок 3).
Графики и уравнения трендов
30 40 50 60 70 80 90 100 110
Средняя цена 1 квл. иснл. площади квартир ип'\ тнпо к, тыс. |>\и.
♦ Соотношения цена-доходы ■ Центр поля данных
-Линейная (Соотношения цена-доходы) Степенная (Соотношения цена-дохпды)
-Экспоненциальная (Соотношения цена-доходы)
Рисунок 3. Графики линейной функции регрессии и значения опытных данных
Небольшое отличие в значениях коэффициентов уравнения, представленных на диаграмме, с ранее рассчитанными значениями оценок коэффициентов связано с точностью вычисления и не имеет принципиального значения.
Данная диаграмма графически отражает концентрацию выборочных значений цен на недвижимость вокруг оцененного нами уравнения регрессии. Их отклонение от линии регрессии есть результат действия случайной составляющей (действия всех остальных, неучтенных в модели факторов).
Основной идеей дисперсионного анализа регрессионной модели является выделение в общей вариации результирующей (объясняемой) переменной у двух составных частей - вариации, объясненной оцененным уравнением регрессии, и остаточной вариации, необъясненной уравнением и связанной с влиянием неучтенных в модели факторов.
Для проведения дисперсионного анализа можно провести расчеты, представленные в таблице 8.
Таблица 8. Расчётная таблица
1 Ух У;-У (У; - У)2 У; & - у (У; - У)2 Уг -У^ (У; - У;)2
1 48,733 -8,288 68,694 52,571 -4,450 19,802 -3,838 14,732
2 44,827 -12,194 148,698 55,812 -1,209 1,461 -10,985 120,679
3 60,093 3,072 9,436 55,724 -1,297 1,682 4,369 19,087
4 67,602 10,581 111,954 85,851 28,830 831,163 -18,249 333,028
5 58,387 1,366 1,866 54,528 -2,494 6,218 3,859 14,895
6 40,248 -16,773 281,339 51,111 -5,910 34,934 -10,863 117,998
7 51,835 -5,186 26,896 51,433 -5,588 31,223 0,402 0,161
8 53,634 -3,387 11,473 54,047 -2,974 8,844 -0,413 0,171
9 67,962 10,941 119,702 60,934 3,913 15,314 7,028 49,386
10 43,704 -13,317 177,347 49,972 -7,049 49,689 -6,268 39,290
11 37,883 -19,138 366,269 49,021 -8,000 64,005 -11,138 124,052
12 109,346 52,325 2737,888 63,249 6,227 38,781 46,097 2124,968
Сумма 684,254 0,000 4061,562 - 0,000 1103,115 0,000 2958,446
Выполненные расчеты дают следующие значения сумм квадратов отклонений: - общая сумма квадратов
С = ^(у*-у)2 = 4061,562
л - лЛ2
7=1
- сумма квадратов отклонений, объясненных оцененной функцией регрессии
= ^(й - У)2 = 1103,115
¿=1
- остаточная сумма квадратов отклонений, необъясненных оцененным уравнением регрессии
= £?=1(Уг - &)2 = 2958,446.
- общая сумма квадратов разлагается на две составные части - объясненную и остаточную суммы квадратов = + ):
4061,562 = 1103,115 + 2958,446,
что свидетельствует о корректности выполненных расчетов.
Итак, из 4061,562 единиц общей вариации построенное уравнение регрессии объясняет 1103,115 единиц вариации, а 2958,446 единицы не объясняется и относится на влияние прочих факторов, неучтенных в уравнении регрессии.
Рассчитывается коэффициент детерминации оцененного уравнения регрессии:
, Са ЕГ-^-у)2 1103,115
п2 = = '-ч-1У1 ' ' =_' = о 2716
0. £Г-1(У1-У)2 4061,562 ,
Д2 = 0,2716 означает, что 27,16 % от общей вариации результирующей переменной у удается объяснить оцененным уравнением регрессии, зависимостью от фактора х. 27,16% вариации средней цены 1 кв. м. жилой площади в регионе обусловлено влиянием уровня среднедушевых денежных доходов населения.
Осуществляется проверка статистической значимости построенного уравнения регрессии:
1) Выдвигается нулевая гипотеза об отсутствии линейной стохастической зависимости переменной у от фактора х;
2) Для линейной модели парной регрессии количество оцениваемых параметров уравнения (коэффициенты а и Ь) равно 2: т=2. Следовательно, дисперсия общая имеет (п-1) степеней свободы; дисперсия, объясненная регрессией - 1 степень свободы; остаточная регрессия - (п-2) степеней свободы. Результаты расчетов сводятся в таблицу (Таблица 9):
Таблица 9. Расчётная таблица
Источник вариации Сумма квадратов отклонений Число степеней свободы Средние квадраты отклонений
Регрессия 1 103,115 1 1 103,115
Остаточная 2 958,446 10 295,845
Общая 4 061,562 11 -
Рассчитывается выборочное значение Г -статистики Фишера:
я! 1 103,115
Р = — =-= 3 729
' 5е2 295,845 3,729
Поскольку в расчетах выборочное значение Г -статистики не превышает критическое значение:
Р = 3,729 < 4,965 = Р(0,05;1;10) ,
можно сделать вывод о сомнительной статистической значимости построенного уравнения регрессии -
выборочные данные условно подтверждают существование линейной зависимости результирующей переменной
у от фактора х (Таблица 10; Таблица 11; Таблица 12).
Выпуск №6 (46), июнь 2020 Таблица 10. Результаты линейной регрессии
Наименование субъекта РФ Линейная регрессия
У Ух ( У - Уср )2 ( ух - Уср )2 ( У - Ух )2
Республика Карелия 48,733 52,571 68,694 19,802 14,732
Республика Коми 44,827 55,812 148,698 1,461 120,679
Архангельская область 60,093 55,724 9,436 1,682 19,087
Ненецкий автономный округ 67,602 85,851 111,954 831,163 333,028
Архангельская область (без АО) 58,387 54,528 1,866 6,218 14,895
Вологодская область 40,248 51,111 281,339 34,934 117,998
Калининградская область 51,835 51,433 26,896 31,223 0,161
Ленинградская область 53,634 54,047 11,473 8,844 0,171
Мурманская область 67,962 60,934 119,702 15,314 49,386
Новгородская область 43,704 49,972 177,347 49,689 39,290
Псковская область 37,883 49,021 366,269 64,005 124,052
г. Санкт-Петербург 109,346 63,249 2737,888 38,781 2124,968
Среднее значение суммы 57,02 - Q Ql 02
4 061,5618 1 103,1154 2 958,4464
Объем выборки (и) 12
Уровень стат. зн-ти а 0,05
Ртабл^ашша, к1, к2) = 4,96
Число параметров (т) 2
0 = 4 062
01+02 = 4 062
= 338
Рвыб = 26,819
я2 = 0,271598816
Таблица 11. Результаты степенной регрессии
Степнная регрессия
Ух ( У - Уср )2 ( Ух - Уср )2 ( У - Ух )2
52,57 68,694 19,802 14,732
55,81 148,698 1,461 120,679
55,72 9,436 1,682 19,087
85,85 111,954 831,163 333,028
54,53 1,866 6,218 14,895
51,11 281,339 34,934 117,998
51,43 26,896 31,223 0,161
54,05 11,473 8,844 0,171
60,93 119,702 15,314 49,386
49,97 177,347 49,689 39,290
49,02 366,269 64,005 124,052
63,25 2737,888 38,781 2124,968
0 01 02
4 061,56 1 103,12 2 958,45
О = 4 062
01+02 = 4 062
Г^ыб = 26,819
я2 = 0,272
Таблица 12. Результаты показательной регрессии
Показательная регрессия
Ух ( У - Уср )2 ( Ух - Уср )2 ( У - Ух )2
52,57 68,694 19,802 14,732
55,81 148,698 1,461 120,679
55,72 9,436 1,682 19,087
85,85 111,954 831,163 333,028
54,53 1,866 6,218 14,895
51,11 281,339 34,934 117,998
51,43 26,896 31,223 0,161
54,05 11,473 8,844 0,171
60,93 119,702 15,314 49,386
49,97 177,347 49,689 39,290
49,02 366,269 64,005 124,052
63,25 2737,888 38,781 2124,968
О 01 02
4 061,56 1 103,12 2 958,45
О = 4 062
01+02 = 4 062
Гвыб = 26,819
я2 = 0,272
Данные значения соответствуют вычисленным ранее величинам. Итак, построенное уравнение регрессии зависимости цены 1 кв. м. жилой площади от уровня денежных доходов населения уг = 32,933 + 0,674х; показало свою статистическую значимость. Делавшиеся ранее предположения о линейной зависимости цены на жилую недвижимость от уровня доходов населения подтвердились и являются статистически значимыми.
Исходя их достоверности математической модели, можно осуществлять следующие прогнозы. Стоит предположить, что известно значение фактора в некотором новом (не относящемся к исходной выборке) наблюдении - х, На основании оцененной регрессионной модели можно спрогнозировать (предсказать) значение результирующей переменной у,, соответствующее данному значению фактора х*. Прогнозирование может быть как во времени, так и в пространстве (для соседних объектов, не входивших в исходную выборку).
Можно построить предположение по поводу того, что в 2020 году предполагается рост уровня среднедушевых доходов населения в республике Карелия на 2%: х, = 29,150 * 1,02 = 29,733.
Точечный прогноз результирующей переменной у* есть оценка её ожидаемого среднего, рассчитываемая по оцененному уравнению регрессии при подстановке в него предполагаемого значения фактора
X* .
у, = а + Ьх*
Прогноз для Республики Карелия: у, = 32,933 + 0,674 * 24,559 = 49,486.
При увеличении в 2020 г. среднедушевых денежных доходов населения республики на 2 % - до 29,733 тыс. руб. ожидаемое среднее значение цены 1 кв. м. жилой площади прогнозируется на уровне 49,486 тыс. руб.
Значение результирующей переменной лишь случайно может совпасть по факту со своим прогнозным значением. Поэтому точечные прогнозы дополняют интервальными, представляющими собой диапазон значений, в который с априори заданной вероятностью будет попадать прогнозируемая переменная. Расчет интервальных прогнозов основывается на оценке точности прогноза.
Необходимые для построения интервальных прогнозов предварительные расчеты представим в Таблице
13.
Таблица 13. Расчётная таблица
1 X; Х X (X — *)2 Х* Х* Х ( X* х)
1 29,150 -6,605 43,629 29,733 -6,022 36,267
2 33,961 -1,794 3,219 34,640 -1,115 1,243
3 33,830 -1,925 3,707 34,507 -1,249 1,559
4 78,549 42,794 1831,305 80,120 44,365 1968,229
5 32,054 -3,701 13,699 32,695 -3,060 9,365
6 26,982 -8,773 76,970 27,522 -8,234 67,792
7 27,461 -8,294 68,795 28,010 -7,745 59,985
8 31,341 -4,414 19,486 31,968 -3,787 14,345
9 41,564 5,809 33,742 42,395 6,640 44,090
10 25,292 -10,463 109,480 25,798 -9,957 99,150
11 23,880 -11,875 141,022 24,358 -11,398 129,906
12 44,999 9,244 85,447 45,899 10,144 102,895
£ - - 2430,499 - - -
Значение стандартного остатка можно получить путём возвращения массива из десяти рассчитанных величин (помещаются в выделенные десять ячеек) в виде следующей таблицы (Таблица 14):
Таблица 14. Расчётная таблица
Коэффициент Ь 0,673694 Коэффициент а 32,933067
Станд. ошибка Ь 0,348886452 Станд. ошибка а 13,426370599
К2 0,271598816 17,200134983
Р-статистика 3,729 Число степеней свободы 10
Яя 1 103,11537928 0е 2 958,44643439
Стандартный остаток 5е расположено в третьей строке четвёртого столбца: 5е = 17,200134983. Далее, рассчитывается стандартное отклонение прогноза для республики Карелия:
с =5е Ь +1 + С*"-^2 = 17,2 * + 18,025.
■У* и 2;=1(х;-ж)2 12 2430,499
Приняв а = 0,05, т.е. для доверительной вероятности 0,95, и числе степеней свободы (п — 2 = 12 — 2 = 10) определяется £ —статистика Стьюдента: £0.95д0 = 1,8124611.
Далее рассчитываются нижние и верхние границы доверительного интервала для республики Карелия:
- нижняя граница у* - С1-а,п-25у, = 49,486 - 1,8124611 * 18,025 = 20,294
- верхняя граница у* + ^1-а,„-25у, = 49,486 + 1,8124611 * 18,025 = 85,634
Интервальный прогноз имеет вид: 20,294 < у* < 85,634.
При увеличении в 2020 г. среднедушевых денежных доходов населения республики Карелия на 2% - до 24,559 тыс. руб. с доверительной вероятностью 0,95 значение цены 1 кв. м. жилой площади в 2020 году будет лежать в интервале от 31,491 до 54,039 тыс. руб.
Также можно взять данные по республике Карелия и построить доверительный интервал для функции регрессии, то есть для условного математического ожидания, который с заданной надежностью (доверительной вероятностью) у = 1- а накрывает неизвестное значение Мх^) (Таблица 15).
_Таблица 15. Расчётная таблица
Значение переменной х = 29,733
Остаточная дисперсия 02/(п-ш) = 295,845
Дисперсия углового коэффициента Ь [Р2/(п-т)]/сум[(х1-хср)2] = 0,122
Оценка условного мат. ожидания ШХ(У) = 52,964
Дисперсия регрессии [02/(п-ш)][1/п + (х-хср)2/сум[(хгхср)2]] = 29,068
Индивид-ая дисперсия [02/(п-ш)][1 + 1/п + (х-хср)2/сум[(хгхср)2]] = 324,913
Квантиль распр. Стьюдента
/табл(1 - а/2, п - 2) = 2,228
Квантиль распр. х2
Х2табл( а/2, п - 2) = 3,247
Квантиль распр. х2
Х2табл(1 - а/2, п - 2 ) = 20,483
Доверительные интервалы при х = 29,733 Гра инте ницы рвалов
Условного мат ожидания М*(Т) 40,951 64,977
Индивидуального значения У 12,801 93,127
Углового коэффициента ь -0,104 1,451
Дисперсии возмущения о2 173,320 1 093,368
Ср. квад. откл. возмущения с 13,165 33,066
Далее идёт построение доверительного интервала для математического ожидания:
40,951 < МхШ < 64,977
Если найти истинное значение Х = х0, тогда Y = у0- истинное значение величины у0, которое лежит в интервале 40,951 < у0 < 64,977с доверительной вероятность 1 — а = 0,95. Таким образом, если среднедушевые доходы тысяч рублей/месяц будут составлять 29,733, то цена 1 м2 жилой площади будет составлять от 40,951 до 64,977 тысяч рублей, с вероятностью 0,95.
Далее находится доверительный интервал для углового коэффициента:
—0,104 < Ъ < 1,451
Получается, что если среднедушевые доходы увеличиваются, то и цена 1 м2 жилой площади будет изменяться от -0,104 до 1,451 раз с доверительной вероятностью в 0,95.
Аналогично определенные границы доверительных интервалов для остальных областей и республик представлены в Таблице 16.
Таблица 16. Расчётная таблица
1 Предполаг аемое значение фактора Точечный прогноз У* Стандартное отклонение прогноза Нижняя граница интервального прогноза У* — ^1-а,п-2ху* Верхняя граница интервального прогноза У* + ¿1-а,п-2ху*
1 29,733 52,964 18,02534069 20,294 85,634
2 34,640 56,270 17,90669426 23,815 88,725
3 34,507 56,180 17,90776768 23,723 88,637
4 80,120 86,909 23,66589714 44,016 129,803
5 32,695 54,960 17,93427568 22,454 87,465
6 27,522 51,474 18,13146893 18,612 84,337
7 28,010 51,803 18,10524518 18,988 84,618
8 31,968 54,470 17,95116756 21,934 87,005
9 42,395 61,495 18,05173332 28,776 94,213
10 25,798 50,313 18,23642173 17,260 83,366
11 24,358 49,343 18,33877864 16,104 82,581
12 45,899 63,855 18,24891655 30,779 96,930
Теперь можно применить аналогичный алгоритм прогнозирования для предсказания уровня цен на жилую недвижимость в Санкт-Петербурге. Зная значение уровня денежных доходов в Санкт-Петербурге в 2020 году - 45,899 тыс. руб./мес., на основе построенной регрессионной модели рассчитаем точечный и интервальный прогнозы цены 1 кв. м. жилой площади в Санкт-Петербурге в 2020 г.:
Точечный прогноз: у* = 32,933067 + 0,673694 * 45,899 = 63,855.
Интервальный прогноз:
. =5е /1+1+ п(*'-*)22 = 5,913* /1+1+(42'133-31,^^ = 6,339886698
и 2"=10;-х)2 ^ 12 1836,105 '
• нижняя граница у» — С1-а,п-25у4 = 63,855 — 1,812461 * 6,3399 = 52,364
• верхняя граница у* + ^1-а,п-25у, = 63,855 + 1,812461 » 6,3399 = 75,346
Интервальный прогноз имеет вид: 52,364 < у* < 75,346.
При среднедушевых денежных доходах населения Санкт-Петербурга в 2020 г. на уровне 45,899 тыс. руб. в месяц среднее ожидаемое значение цены 1 кв. м. жилой площади составит 63,855 тыс. руб. и с доверительной вероятностью 0,95 ее значение будет лежать в интервале от 52,364 до 75,346 тыс. руб.
Таким образом, в работе были исследованы вопросы математических соотношений для вычисления по выборочным данным точечных числовых характеристик экономических переменных.
В статье была рассмотрена методика, основанная на ранее выполненном исследовании эластичности цен на жилье по среднедушевым доходам. Методика обеспечивает прогнозирование цен на жилье при наличии прогнозов динамики душевых доходов населения.
Понятно, что темпы роста среднедушевых доходов лишь в первом приближении характеризуют темпы роста платежеспособного спроса населения на рынке жилья. Известно, что недвижимость приобретается не за текущие доходы, а за сбережения, однако, повышение темпов роста текущих доходов уменьшает склонность населения к сбережению, а снижение - увеличивает и тем самым приводит к падению платежеспособно спроса на рынке жилья.
Понятно также, что платежеспособный спрос зависит и от объема денежной массы в стране, темпов инфляции, от дополнительного (сверх доходов) вливания денег на рынок через кредитование покупателя (прежде всего ипотечное), от таких факторов, как перелив инвестиционных капиталов на рынок жилья и превращения недвижимости в инструмент их сохранения и преумножения, а также множество психологических, иррациональных факторов, тем не менее, в основу методики прогнозирования средних цен на жилье было
положено сопоставление величин цен на рынке жилья и доходов населения. Остальные факторы способствуют волатильности цен и формируют погрешность прогноза, поддающуюся оценке.
Список используемой литературы:
1. Регионы России. Социально-экономические показатели. 2019 // Федеральная служба государственной статистики (Росстат). М., 2019. URL:
https://www.gks.ru/storage/mediabank/Region_Pokaz_2019.pdf (дата обращения: 20.05.2020).
2. Герасименко П.В. Введение в эконометрику: учебное пособие / П. В. Герасименко, В. А. Ходаковский; ПГУПС.- СПб.: ПГУПС, 2005. - 57 с.
3. Герасименко П.В. Эконометрика: компьютерный практикум по эконометрическому моделированию / П.В. Герасименко; ФБГОУ ВПО ПГУПС.- СПб.: ПГУПС, 2015. - 55 с.
4. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: ЮНИТИ-ДАНА, 2003. - 311 с.
5. Стерник Г. Методика прогнозирования цен на жилье в зависимости от типа рынка // BN: Недвижимость Санкт-Петербурга и Ленинградской области. 2010. URL: https://www.bn.ru/gazeta/articles/75559/ (дата обращения: 21.05.2020)
6. Эконометрика: Учебник / Под ред. И. И. Елисеевой. - М.: Финансы и статистика, 2002. - 344 с.