Гончаренко Д.В.
магистрант;
Картамышева К.В.
магистрант;
Институт экономики и управления, Самарский национальный исследовательский университет им.
академика С. П. Королева, г. Самара
ПОСТРОЕНИЕ МНОГОФАКТОРНОЙ РЕГРЕССИОННОЙ МОДЕЛИ ДЛЯ ПРОГНОЗИРОВАНИЯ СТОИМОСТИ КВАРТИР В Г. САМАРА
THE CONSTRUCTION OF MULTIFACTOR REGRESSION MODELS TO PREDICT THE COST OF
APARTMENTS IN SAMARA
Goncharenko D. V.
undergraduate
Kartamysheva K. V.
undergraduate
Institute of Economics and management, Samara national research University named after academician S.
P. Korolev, Samara
АННОТАЦИЯ
В работе рассмотрена актуальная проблема массовой оценки стоимости недвижимости в зависимости от различных параметров. Предложено решение в виде составления регрессионной модели. Переменные в модель выбраны в результате применения апостериорного подхода и последующей регрессионной оценки с использованием критериев Фишера, Стьюдента и коэффициента детерминации.
ABSTRACT
In the article the actual problem of mass real estate valuation depending on different parameters. The proposed solution in the form of drawing up of the regression model. Variables in the model selected as a result of applying the a posteriori approach and the subsequent regression estimator using the criteria of Fisher, t-test and the coefficient of determination.
Ключевые слова: Регрессия, переменная модели, параметр функции, коэффициент детерминации, критерий Фишера.
Keywords: Regression model variable, function parameter, the coefficient of determination, Fisher test.
Целью данного исследования является формирование модели, позволяющей определить цену жилой недвижимости. Результаты работы будут актуальны для фирм - продавцов, поскольку полученные модели позволят установить реальную цену на предлагаемые квартиры.
К массовой оценке рынка недвижимости в последнее время проявляется большой интерес со стороны экспертов рынка. Было разработано множество моделей, позволяющих определить цену жилой недвижимости.
Существуют стандартные методы оценки недвижимого имущества, к которым относятся: затратный метод, оценка стоимости по доходности, метод сопоставления продаж. Затратный метод предполагает определение стоимости недвижимости как затраты на воссоздание объекта в текущем состояние или на восстановление его свойств. Метод доходности позволяет сформировать цену на недвижимое имущество с помощью оценки будущих выгод, которые можно получить от эксплуатации объекта недвижимости. При использовании метода сопоставления продаж стоимость объекта оценки определяется путем сравнения цен на подобные объекты, по которым была осуществлена реализация.
Также широко применяется экспертный метод, основывающийся на сопоставлении продаж,
ввиду использования экспертом либо субъективных мнений при определении стоимости объекта, либо такого математического метода как статистический анализ, традиционным методом которого является множественный регрессионный анализ -определение значения неизвестных параметров на основе открытых данных. Именно эта методика стала основой исследования.
В данной работе были проанализированы три района, значения основных статистических параметров доказывают адекватность построенных моделей. Значение ^статистики соответствует уровню вероятности не ниже 95% , что свидетельствует о значимости всех включенных факторов.
В качестве источника информации был выбран сайт объявлений «Из рук в руки», интерфейс которого позволяет свободно изменять интересующие нас параметры выбора квартиры. В данной работе для исследования рассматриваются такие пункты как район, общая площадь, жилая площадь, площадь кухни, количество комнат, этаж, санузел (раздельный или совмещенный), наличие лифта. Предметом исследования стали 1, 2 и 3-х комнатные квартиры, предлагаемые как на первичном, так и на вторичном рынке жилья города Самары.
Исследование проводилось на основе априорного метода путем использование наиболее попу-
лярной модели линейного типа. Для удобства исследования коррелируемые параметры были обозначены как xi, i=1,8 с соответствующими индексами: общая площадь - xi, жилая площадь - x2, этаж - x3, количество комнат - Х4, площадь кухни - x5, совмещенный или раздельный санузел - x6, вторичный или первичный тип жилья - x7, район -
Х8.
Ниже представлены уравнения регрессии, полученные с помощью инструмента Анализ данных программного процессора Microsoft Excel, рассчи-y = -1861218 + 96535,56^ - 32088,1х2 + 1454,796х3
танные методом наименьших квадратов. Для оценки адекватности построенных моделей также были рассчитаны коэффициенты детерминации Я2, критерий Фишера Б и ^критерий. Включение переменных уравнение регрессии происходило методом перебора.
При переменных Цена - площадь - жилая площадь - этаж - количество комнат - площадь кухни - санузел - первичный/вторичный вид получено регрессионное уравнение:
- 745087x4 - 8939,85x5 + 348213,6x6 + 1086935x7
Коэф. детерминации - 0,69; Критерий Фишера - 81,61 при табличном значении 2,21; критерий Стьюдента - 11,86; -2,9107; 0,1; -5,02; -0,37; 2,15; 7,1. Сформирована адекватная модель, что подтверждается высоким критерием Фишера, однако параметры при переменных х3 и х5 не совсем кору = 659159,8 + 68890,76х - 608660х4
ректны. Совокупностью данных факторов объясняется 69 % результирующей переменной, что является значимым показателем.
Зависимость цена - площадь - количество комнат описывается уравнением:
Коэф. детерминации - 0,61; Критерий Фишера - 206,07 при табличном значении 3,11; критерий Стьюдента - 17,55; -5,06. Модель подобрана адекватно, коэффициенты переменных значимы, результирующая переменная объясняется подобран-
ными переменными на 61%, что является удовлетворительным результатом.
Зависимость цены от факторов площадь - жилая площадь описывается уравнением:
y = 265128,3 + 77807,21x - 39949,5x2
Коэф. детерминации - 0,60; Критерий Фишера - 197,08 при табличном значении 3,11; критерий Стьюдента -12,74; -4,23, что показывает адекватный выбор модели, удовлетворительный выбор коэффициентов при переменных и объясняет на 60 % зависимую переменную данными факторами.
Модель цена - площадь имеет вид:
у = 328220,6 + 54923,52хг
Коэф. детерминации - 0,57; Критерий Фишера - 353,98 при табличном значении 3,96; критерий Стьюдента -18,81. Критерии показывают удачный выбор модели, поскольку критерий Фишера во много раз превышает табличное значение, адекватный выбор коэффициента при переменной х1 и на 57 % объясняет данной переменной результирующий фактор у.
Зависимость цена - жилая площадь - район
имеет вид:
y = 1093447 + 66373,5x2 + 82408,5x8
Коэф. детерминации - 0,36; Критерий Фишера - 76,5 при табличном значении 3,11; критерий Стьюдента -12,07; 2,39. Коэффициент Фишера выше табличного значения, что показывает удачный выбор модели, однако коэффициент при переменной х8 исходя из показателя критерия Стью-
дента нуждается в корректировке. Выбор переменных в модели позволяет объянсить лишь 36 % переменной у.
Модель зависимости цена - жилая площадь -
этаж:
y = 1311805 + 65691,22x2 + 35732,29x3
Коэф. детерминации - 0,36; Критерий Фишера
- 75,25 при табличном значении 3,11; критерий Стьюдента -11,87; 2,02. Модель в таком составе переменных объясняет 36 % результирующей переменной, что является низким показателем, при этом модель сформирована адекватно, ввиду превышения критерия Фишера табличного значения. Параметры при переменных подобраны удачно.
Регрессионная модель цена - жилая площадь:
У = 1494793 + 66689,56х2 Коэф. детерминации - 0,35; Критерий Фишера
- 144,75 при табличном значении 3,96; критерий
Стьюдента -12,03. Коэффициент детерминации 35 % низок, модель сформирована адекватно, так же параметр при переменной х2 подобран удовлетворительно.
Модель Цена-площадь кухни - санузел имеет
вид:
у = 352271 + 231544Х + 875444,4х6
Коэф. детерминации - 0,33; Критерий Фишера - 65,49 при табличном значении 3,11; критерий Стьюдента -10,26; 4,02. Модель сформирована корректно, ввиду превышения табличного значения критерия Фишера, требует корректировки ко-
эффициент при переменной Хб. Сама модель с имеющимся набором переменных объясняет лишь 33 % зависимой переменной.
Модель Цена -площадь кухни описывается уравнением:
у = 1094461 + 240671,4х5
Коэф. детерминации - 0,29; Критерий Фишера - 108,72 при табличном значении 3,96; критерий
Стьюдента -10,43. Модель выбрана хорошо, поскольку высоко значение критерия Фишера, также удачно подобран коэффициент при переменной Х5, однако само уравнение с данной совокупностью параметров определяет лишь 29 % зависимой переменной. Для переменных цена-район-количество комнат получено регрессионное уравнение.
y = 1607404 + 91944*8 + 873140,3*4
Коэф. детерминации - 0,17; Критерий Фишера
- 27,44 при табличном значении 3,11; критерий Стьюдента -2,33; 7,03.
Коэф. детерминации - 0,29; Критерий Фишера
- 108,72 при табличном значении 3,96; критерий Стьюдента - 10,43, что свидетельствует о хорошем выборе вида модели, правильном расчёте парамет-
ра при переменной, но плохом выборе переменных, включённых в модель, потому что они объясняют результирующий фактор регрессии только на 29%, что является крайне низким показателем
Регрессионная модель: Цена - количество комнат - первичный/вторичный вид жилья:
y = 252713 + 873651,1*4 -307180*
Коэф. детерминации - 0,16; Критерий Фишера - 25,56 при табличном значении 3,11; критерий Стьюдента -6,99; -1,51. Не смотря на адекватность сформированной модели (превышение табличного значения критерия Фишера), описанным уравнением объясняется лишь 16 %переменной у. Кроме того, параметр при х7 ввиду низкого значения коэффициента Стьюдента также нуждается в корректировке.
Зависимость цена- количество комнат описывается выражением:
у = 2066442 + 873651,1л4 Коэф. детерминации - 0,15; Критерий Фишера - 48,63 при табличном значении 3,96; критерий Стьюдента -6,97. Также отмечается низкий коэффициент детерминации, объясняющий 15% искомой переменной, при адекватности модели ввиду превышения табличного показателя критерия Фишера и удачного выбора коэффициента при независимой переменной.
Модель цена - санузел - первичный /вторичный тип жилья
y = 2297758 +1089218*6 - 274907*
имеет следующие показатели: коэф. детерминации - 0,07; Критерий Фишера - 10,11 при табличном значении 3,11; критерий Стьюдента - 4,26; -1,28. Не смотря на правильность выбора модели (превышение эмпирического критерия Фишера над табличным значением), модель показывает очень низкий коэффициент детерминации и низкие показатели критерия Стьюдента для переменных.
Зависимость Цена-район имеет вид:
у = 3351247 + 92430,97х8
Коэф. детерминации - 0,02; Критерий Фишера - 4,67 при табличном значении 3,96; критерий Стьюдента - 2,16. Хотя показатель критерия Фишера говорит о правильном выборе модели, низкий коэффициент детерминации и критерий Стью-
дента не позволяют говорить об адекватности использования модели.
Результаты исследования таковы, что лишь некоторые факторы могут объяснить формирование зависимой переменной у (цена квартиры) в рамках линейной модели регрессии, ввиду удовлетворительного уровня коэффициента детерминации Я2, а именно - фактор Х1 - общая площадь, коэффициент детерминации 0,57, совокупность объясняющих переменных Х1 и Х4 (количество комнат) - Я2=0,6, совокупность факторов общей площади и типа жилья (первичное или вторичное), Я2=0,59, и общая площадь и жилая площадь квартиры - Я2=0,59. Ниже представлены графики линейной регрессии для зависимости цены от фактора общей площади.
7
7
14000000
12000000
10000000
in
а. 8000000
пГ
X 6000000
4000000
2000000
♦ ♦ ♦
♦ и 0,5
Vi и
♦
4ШРГ*
W» 1 ♦ ♦
50 100
Общая площадь, м2
150
200
Рисунок 1-Функциональная зависимость цены от общей площади квартиры
Итоговая модель, включающая в себя все факторы, формирующие конечную стоимость квартиры также показала достаточно высокий коэффициент детерминации и представляет собой линейную функциональную зависимость.
Рассматривая Б-критерий, который во много раз превышает табличное значение, мы определили, что в рамках линейной модели регрессионной зависимости статистически значимыми и надежными факторами, позволяющими определить стоимость квартиры являются:
• В модели регрессионной зависимости цены от площади 57 % стоимости жилой недвижимости определяется влиянием общей площади;
• В модели регрессионной зависимости цены от общей площадь - количество комнат, 61 % стоимости объясняется общей площадью и количеством жилых комнат, однако высокий коэффициент парной корреляции параметров не позволяет включать их в одну модель;
• В модели регрессионной зависимости цены площадь и тип жилья составляют 60 % цены, при этом корреляция между факторами относительно низкая, что позволяет использовать их в одной модели;
• В модели регрессионной зависимости цены от общей площади и размера жилой площади -60%, но коэффициент парной корреляции по параметрам размер общей площади и размер жилой площади равен 0,89, что говорит о сильной прямой
связи между переменными, в результате включение их в одну модель нецелесообразно;
• Корреляция между факторами общая площадь, этаж, количество комнат, площадь кухни, санузел, тип жилья находятся пределах от 0 до 0,33, что позволяет использовать их в одно модели. Набор этих переменных позволяет объяснить стоимость жилья на 69 %.
Таким образом, можно увидеть, что наиболее оптимальной является полученная модель, включающая все факторы. Она позволяет продавцу определить реальную стоимость квартиры на существующем рынке недвижимости и получить наибольшую прибыль при ее продаже.
Из проведенного исследования вытекает, что наиболее оптимальной моделью линейной регрессии на данном этапе является многофакторная модель зависимости цены от факторов общая площадь, этаж, количество комнат, площадь кухни, санузел, тип жилья, что подтверждается высоким коэффициентом детерминации 0,69.
Список литературы
1. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. Руководство для экономистов: пособие / перевод с нем. -М.:Финансы и статистика, 2010.-304 с.
2. С. И. Сенашов, Н. Ю. Юферова Актуальное моделирование стоимости недвижимости в Красноярске, Вестник СибГАУ. № 2(48). 2013
3. Котенко А.П. Эконометрика: интерактивное мультимедийное пособие.-2012.