Научная статья на тему 'ПОСТРОЕНИЕ МНОГОФАКТОРНОЙ РЕГРЕССИОННОЙ МОДЕЛИ ДЛЯ ПРОГНОЗИРОВАНИЯ СТОИМОСТИ КВАРТИР В Г. САМАРА'

ПОСТРОЕНИЕ МНОГОФАКТОРНОЙ РЕГРЕССИОННОЙ МОДЕЛИ ДЛЯ ПРОГНОЗИРОВАНИЯ СТОИМОСТИ КВАРТИР В Г. САМАРА Текст научной статьи по специальности «Экономика и бизнес»

CC BY
5
2
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
The Scientific Heritage
Область наук
Ключевые слова
Регрессия / переменная модели / параметр функции / коэффициент детерминации / критерий Фишера / Regression model variable / function parameter / the coefficient of determination / Fisher test

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Гончаренко Д.В., Картамышева К.В.

В работе рассмотрена актуальная проблема массовой оценки стоимости недвижимости в зависимости от различных параметров. Предложено решение в виде составления регрессионной модели. Переменные в модель выбраны в результате применения апостериорного подхода и последующей регрессионной оценки с использованием критериев Фишера, Стьюдента и коэффициента детерминации.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Гончаренко Д.В., Картамышева К.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE CONSTRUCTION OF MULTIFACTOR REGRESSION MODELS TO PREDICT THE COST OF APARTMENTS IN SAMARA

In the article the actual problem of mass real estate valuation depending on different parameters. The proposed solution in the form of drawing up of the regression model. Variables in the model selected as a result of applying the a posteriori approach and the subsequent regression estimator using the criteria of Fisher, t-test and the coefficient of determination.

Текст научной работы на тему «ПОСТРОЕНИЕ МНОГОФАКТОРНОЙ РЕГРЕССИОННОЙ МОДЕЛИ ДЛЯ ПРОГНОЗИРОВАНИЯ СТОИМОСТИ КВАРТИР В Г. САМАРА»

Гончаренко Д.В.

магистрант;

Картамышева К.В.

магистрант;

Институт экономики и управления, Самарский национальный исследовательский университет им.

академика С. П. Королева, г. Самара

ПОСТРОЕНИЕ МНОГОФАКТОРНОЙ РЕГРЕССИОННОЙ МОДЕЛИ ДЛЯ ПРОГНОЗИРОВАНИЯ СТОИМОСТИ КВАРТИР В Г. САМАРА

THE CONSTRUCTION OF MULTIFACTOR REGRESSION MODELS TO PREDICT THE COST OF

APARTMENTS IN SAMARA

Goncharenko D. V.

undergraduate

Kartamysheva K. V.

undergraduate

Institute of Economics and management, Samara national research University named after academician S.

P. Korolev, Samara

АННОТАЦИЯ

В работе рассмотрена актуальная проблема массовой оценки стоимости недвижимости в зависимости от различных параметров. Предложено решение в виде составления регрессионной модели. Переменные в модель выбраны в результате применения апостериорного подхода и последующей регрессионной оценки с использованием критериев Фишера, Стьюдента и коэффициента детерминации.

ABSTRACT

In the article the actual problem of mass real estate valuation depending on different parameters. The proposed solution in the form of drawing up of the regression model. Variables in the model selected as a result of applying the a posteriori approach and the subsequent regression estimator using the criteria of Fisher, t-test and the coefficient of determination.

Ключевые слова: Регрессия, переменная модели, параметр функции, коэффициент детерминации, критерий Фишера.

Keywords: Regression model variable, function parameter, the coefficient of determination, Fisher test.

Целью данного исследования является формирование модели, позволяющей определить цену жилой недвижимости. Результаты работы будут актуальны для фирм - продавцов, поскольку полученные модели позволят установить реальную цену на предлагаемые квартиры.

К массовой оценке рынка недвижимости в последнее время проявляется большой интерес со стороны экспертов рынка. Было разработано множество моделей, позволяющих определить цену жилой недвижимости.

Существуют стандартные методы оценки недвижимого имущества, к которым относятся: затратный метод, оценка стоимости по доходности, метод сопоставления продаж. Затратный метод предполагает определение стоимости недвижимости как затраты на воссоздание объекта в текущем состояние или на восстановление его свойств. Метод доходности позволяет сформировать цену на недвижимое имущество с помощью оценки будущих выгод, которые можно получить от эксплуатации объекта недвижимости. При использовании метода сопоставления продаж стоимость объекта оценки определяется путем сравнения цен на подобные объекты, по которым была осуществлена реализация.

Также широко применяется экспертный метод, основывающийся на сопоставлении продаж,

ввиду использования экспертом либо субъективных мнений при определении стоимости объекта, либо такого математического метода как статистический анализ, традиционным методом которого является множественный регрессионный анализ -определение значения неизвестных параметров на основе открытых данных. Именно эта методика стала основой исследования.

В данной работе были проанализированы три района, значения основных статистических параметров доказывают адекватность построенных моделей. Значение ^статистики соответствует уровню вероятности не ниже 95% , что свидетельствует о значимости всех включенных факторов.

В качестве источника информации был выбран сайт объявлений «Из рук в руки», интерфейс которого позволяет свободно изменять интересующие нас параметры выбора квартиры. В данной работе для исследования рассматриваются такие пункты как район, общая площадь, жилая площадь, площадь кухни, количество комнат, этаж, санузел (раздельный или совмещенный), наличие лифта. Предметом исследования стали 1, 2 и 3-х комнатные квартиры, предлагаемые как на первичном, так и на вторичном рынке жилья города Самары.

Исследование проводилось на основе априорного метода путем использование наиболее попу-

лярной модели линейного типа. Для удобства исследования коррелируемые параметры были обозначены как xi, i=1,8 с соответствующими индексами: общая площадь - xi, жилая площадь - x2, этаж - x3, количество комнат - Х4, площадь кухни - x5, совмещенный или раздельный санузел - x6, вторичный или первичный тип жилья - x7, район -

Х8.

Ниже представлены уравнения регрессии, полученные с помощью инструмента Анализ данных программного процессора Microsoft Excel, рассчи-y = -1861218 + 96535,56^ - 32088,1х2 + 1454,796х3

танные методом наименьших квадратов. Для оценки адекватности построенных моделей также были рассчитаны коэффициенты детерминации Я2, критерий Фишера Б и ^критерий. Включение переменных уравнение регрессии происходило методом перебора.

При переменных Цена - площадь - жилая площадь - этаж - количество комнат - площадь кухни - санузел - первичный/вторичный вид получено регрессионное уравнение:

- 745087x4 - 8939,85x5 + 348213,6x6 + 1086935x7

Коэф. детерминации - 0,69; Критерий Фишера - 81,61 при табличном значении 2,21; критерий Стьюдента - 11,86; -2,9107; 0,1; -5,02; -0,37; 2,15; 7,1. Сформирована адекватная модель, что подтверждается высоким критерием Фишера, однако параметры при переменных х3 и х5 не совсем кору = 659159,8 + 68890,76х - 608660х4

ректны. Совокупностью данных факторов объясняется 69 % результирующей переменной, что является значимым показателем.

Зависимость цена - площадь - количество комнат описывается уравнением:

Коэф. детерминации - 0,61; Критерий Фишера - 206,07 при табличном значении 3,11; критерий Стьюдента - 17,55; -5,06. Модель подобрана адекватно, коэффициенты переменных значимы, результирующая переменная объясняется подобран-

ными переменными на 61%, что является удовлетворительным результатом.

Зависимость цены от факторов площадь - жилая площадь описывается уравнением:

y = 265128,3 + 77807,21x - 39949,5x2

Коэф. детерминации - 0,60; Критерий Фишера - 197,08 при табличном значении 3,11; критерий Стьюдента -12,74; -4,23, что показывает адекватный выбор модели, удовлетворительный выбор коэффициентов при переменных и объясняет на 60 % зависимую переменную данными факторами.

Модель цена - площадь имеет вид:

у = 328220,6 + 54923,52хг

Коэф. детерминации - 0,57; Критерий Фишера - 353,98 при табличном значении 3,96; критерий Стьюдента -18,81. Критерии показывают удачный выбор модели, поскольку критерий Фишера во много раз превышает табличное значение, адекватный выбор коэффициента при переменной х1 и на 57 % объясняет данной переменной результирующий фактор у.

Зависимость цена - жилая площадь - район

имеет вид:

y = 1093447 + 66373,5x2 + 82408,5x8

Коэф. детерминации - 0,36; Критерий Фишера - 76,5 при табличном значении 3,11; критерий Стьюдента -12,07; 2,39. Коэффициент Фишера выше табличного значения, что показывает удачный выбор модели, однако коэффициент при переменной х8 исходя из показателя критерия Стью-

дента нуждается в корректировке. Выбор переменных в модели позволяет объянсить лишь 36 % переменной у.

Модель зависимости цена - жилая площадь -

этаж:

y = 1311805 + 65691,22x2 + 35732,29x3

Коэф. детерминации - 0,36; Критерий Фишера

- 75,25 при табличном значении 3,11; критерий Стьюдента -11,87; 2,02. Модель в таком составе переменных объясняет 36 % результирующей переменной, что является низким показателем, при этом модель сформирована адекватно, ввиду превышения критерия Фишера табличного значения. Параметры при переменных подобраны удачно.

Регрессионная модель цена - жилая площадь:

У = 1494793 + 66689,56х2 Коэф. детерминации - 0,35; Критерий Фишера

- 144,75 при табличном значении 3,96; критерий

Стьюдента -12,03. Коэффициент детерминации 35 % низок, модель сформирована адекватно, так же параметр при переменной х2 подобран удовлетворительно.

Модель Цена-площадь кухни - санузел имеет

вид:

у = 352271 + 231544Х + 875444,4х6

Коэф. детерминации - 0,33; Критерий Фишера - 65,49 при табличном значении 3,11; критерий Стьюдента -10,26; 4,02. Модель сформирована корректно, ввиду превышения табличного значения критерия Фишера, требует корректировки ко-

эффициент при переменной Хб. Сама модель с имеющимся набором переменных объясняет лишь 33 % зависимой переменной.

Модель Цена -площадь кухни описывается уравнением:

у = 1094461 + 240671,4х5

Коэф. детерминации - 0,29; Критерий Фишера - 108,72 при табличном значении 3,96; критерий

Стьюдента -10,43. Модель выбрана хорошо, поскольку высоко значение критерия Фишера, также удачно подобран коэффициент при переменной Х5, однако само уравнение с данной совокупностью параметров определяет лишь 29 % зависимой переменной. Для переменных цена-район-количество комнат получено регрессионное уравнение.

y = 1607404 + 91944*8 + 873140,3*4

Коэф. детерминации - 0,17; Критерий Фишера

- 27,44 при табличном значении 3,11; критерий Стьюдента -2,33; 7,03.

Коэф. детерминации - 0,29; Критерий Фишера

- 108,72 при табличном значении 3,96; критерий Стьюдента - 10,43, что свидетельствует о хорошем выборе вида модели, правильном расчёте парамет-

ра при переменной, но плохом выборе переменных, включённых в модель, потому что они объясняют результирующий фактор регрессии только на 29%, что является крайне низким показателем

Регрессионная модель: Цена - количество комнат - первичный/вторичный вид жилья:

y = 252713 + 873651,1*4 -307180*

Коэф. детерминации - 0,16; Критерий Фишера - 25,56 при табличном значении 3,11; критерий Стьюдента -6,99; -1,51. Не смотря на адекватность сформированной модели (превышение табличного значения критерия Фишера), описанным уравнением объясняется лишь 16 %переменной у. Кроме того, параметр при х7 ввиду низкого значения коэффициента Стьюдента также нуждается в корректировке.

Зависимость цена- количество комнат описывается выражением:

у = 2066442 + 873651,1л4 Коэф. детерминации - 0,15; Критерий Фишера - 48,63 при табличном значении 3,96; критерий Стьюдента -6,97. Также отмечается низкий коэффициент детерминации, объясняющий 15% искомой переменной, при адекватности модели ввиду превышения табличного показателя критерия Фишера и удачного выбора коэффициента при независимой переменной.

Модель цена - санузел - первичный /вторичный тип жилья

y = 2297758 +1089218*6 - 274907*

имеет следующие показатели: коэф. детерминации - 0,07; Критерий Фишера - 10,11 при табличном значении 3,11; критерий Стьюдента - 4,26; -1,28. Не смотря на правильность выбора модели (превышение эмпирического критерия Фишера над табличным значением), модель показывает очень низкий коэффициент детерминации и низкие показатели критерия Стьюдента для переменных.

Зависимость Цена-район имеет вид:

у = 3351247 + 92430,97х8

Коэф. детерминации - 0,02; Критерий Фишера - 4,67 при табличном значении 3,96; критерий Стьюдента - 2,16. Хотя показатель критерия Фишера говорит о правильном выборе модели, низкий коэффициент детерминации и критерий Стью-

дента не позволяют говорить об адекватности использования модели.

Результаты исследования таковы, что лишь некоторые факторы могут объяснить формирование зависимой переменной у (цена квартиры) в рамках линейной модели регрессии, ввиду удовлетворительного уровня коэффициента детерминации Я2, а именно - фактор Х1 - общая площадь, коэффициент детерминации 0,57, совокупность объясняющих переменных Х1 и Х4 (количество комнат) - Я2=0,6, совокупность факторов общей площади и типа жилья (первичное или вторичное), Я2=0,59, и общая площадь и жилая площадь квартиры - Я2=0,59. Ниже представлены графики линейной регрессии для зависимости цены от фактора общей площади.

7

7

14000000

12000000

10000000

in

а. 8000000

пГ

X 6000000

4000000

2000000

♦ ♦ ♦

♦ и 0,5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Vi и

4ШРГ*

W» 1 ♦ ♦

50 100

Общая площадь, м2

150

200

Рисунок 1-Функциональная зависимость цены от общей площади квартиры

Итоговая модель, включающая в себя все факторы, формирующие конечную стоимость квартиры также показала достаточно высокий коэффициент детерминации и представляет собой линейную функциональную зависимость.

Рассматривая Б-критерий, который во много раз превышает табличное значение, мы определили, что в рамках линейной модели регрессионной зависимости статистически значимыми и надежными факторами, позволяющими определить стоимость квартиры являются:

• В модели регрессионной зависимости цены от площади 57 % стоимости жилой недвижимости определяется влиянием общей площади;

• В модели регрессионной зависимости цены от общей площадь - количество комнат, 61 % стоимости объясняется общей площадью и количеством жилых комнат, однако высокий коэффициент парной корреляции параметров не позволяет включать их в одну модель;

• В модели регрессионной зависимости цены площадь и тип жилья составляют 60 % цены, при этом корреляция между факторами относительно низкая, что позволяет использовать их в одной модели;

• В модели регрессионной зависимости цены от общей площади и размера жилой площади -60%, но коэффициент парной корреляции по параметрам размер общей площади и размер жилой площади равен 0,89, что говорит о сильной прямой

связи между переменными, в результате включение их в одну модель нецелесообразно;

• Корреляция между факторами общая площадь, этаж, количество комнат, площадь кухни, санузел, тип жилья находятся пределах от 0 до 0,33, что позволяет использовать их в одно модели. Набор этих переменных позволяет объяснить стоимость жилья на 69 %.

Таким образом, можно увидеть, что наиболее оптимальной является полученная модель, включающая все факторы. Она позволяет продавцу определить реальную стоимость квартиры на существующем рынке недвижимости и получить наибольшую прибыль при ее продаже.

Из проведенного исследования вытекает, что наиболее оптимальной моделью линейной регрессии на данном этапе является многофакторная модель зависимости цены от факторов общая площадь, этаж, количество комнат, площадь кухни, санузел, тип жилья, что подтверждается высоким коэффициентом детерминации 0,69.

Список литературы

1. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. Руководство для экономистов: пособие / перевод с нем. -М.:Финансы и статистика, 2010.-304 с.

2. С. И. Сенашов, Н. Ю. Юферова Актуальное моделирование стоимости недвижимости в Красноярске, Вестник СибГАУ. № 2(48). 2013

3. Котенко А.П. Эконометрика: интерактивное мультимедийное пособие.-2012.

i Надоели баннеры? Вы всегда можете отключить рекламу.