Известия Тульского государственного университета Естественные науки. 2011. Вып. 1. С. 200-209
= ИНФОРМАТИКА =
УДК 531.5;528.565
Сравнительный анализ эффективности методов прогнозирования на примере рынка недвижимости
А.В. Чертов
Аннотация. Проведен анализ динамики роста цен на жилье в различных регионах, выявлены закономерности динамики роста. Построены эконометрические модели, отражающие динамику изменения цен на рынке жилья в некоторых регионах РФ. Проанализировано поведение цен на рынке жилья и проведено сравнение прогностической силы прогнозных моделей. На основе построенных моделей даны прогнозные значения цены квадратного метра жилья на первые два квартала 2009 года, полученные с использованием различных моделей.
Ключевые слова: временные ряды, точечный прогноз,
доверительный интервал прогноза, автокорреляция остатков временного ряда, тест Дарбина-Уотсона, адаптивные модели прогнозирования, структурные изменения тренда, тест Чоу.
Важнейшей задачей исследования экономического временного ряда является выявление основной тенденции изучаемого процесса, выраженной неслучайной составляющей f (t) (тренда либо тренда с циклической или (и) сезонной компонентой). Для построения тренда были выбраны следующие виды функций [1]: линейная — f(t) = bo + bit и экспоненциальная — f(t) = b0eblt. При обработке временных рядов, как правило, наиболее ценной является информация последнего периода, поэтому в работе были построены адаптивные модели [2] для рынков недвижимости исследуемых регионов. В частности, в работе использован один из классов адаптивных методов — модель Брауна. Также было проведено исследование изучаемого процесса с предположением о наличие структурных изменений, для этого был использован класс кусочно-линейных моделей. Результаты работе анонсированы в [4-6].
Для исследования динамики цен на жилье в городе Москве были взяты данные о цене одного квадратного метра в типовой квартире на вторичном рынке жилья за 7 лет (в период с 2002 по 2008 год). На основе полученных коэффициентов автокорреляции уровней ряда (табл. 1) и построенной
коррелограммы был сделан вывод об отсутствие сезонной составляющей в изучаемом процессе.
Таблица 1
Коэффициенты автокорреляции ряда, отражающего динамику цены
жилья в г. Москве
Лаг
Коэффициент
автокорреля-
ции
Лаг
Коэффициент
автокорреля
ции
Лаг
Коэффициент
автокорреля-
ции
Лаг
Коэффициент
автокорреля-
ции
0,9010
0,4738
0,0660
13
-0,2286
0,7861
0,3831
10
-0,0344
14
-0,2722
0,6724
0,2848
11
-0,1165
0,5632
8
0,1743
12
-0,1840
Основная тенденция, выражающая неслучайную составляющую, получена в виде следующих функций: линейной — /1 (£) = 1665 + 4330£ и экспоненциальной — /2 (£) = 19120е0,0722^. Для полученных моделей коэффициенты детерминации соответственно равны ^2 = 0,932; ^2 = 0,979. Причем обе модели значимы, значение критерия Фишера Еі = 356 > Ез?05;1;26 = 4, 2 и Е2 = 1257 > ^0?05;1;26 = 4, 2.
Для каждой из построенных моделей проведено исследование на наличие автокорреляции в остатках. Фактическое значение критерия Дарбина-Уотсона для линейной модели 1 = 0, 217, для экспоненциальной модели 1 = 1, 517.
При п = 28 критические значения 1Н = 1,33, 1В = 1,48. Изобразим результат Дарбина-Уотсона графически для значения п = 28 (рис. 1).
*0 отвергается (положительная автокорреляция)
Н’д принимается
Зона неопре- (отсутствие Зона неопре-
деленности автокорреляции) деленности
*0 отвергается (отрицательная автокорреляция)
1,48
!,67
Рис. 1. Графическое представление значений для теста Дарбина-Уотсона
при п = 28
Исследование автокорреляции остатков временного ряда опровергло гипотезу Н0 об отсутствии автокорреляции в линейной модели, обнаружено наличие положительной автокорреляции. Для экспоненциальной модели гипотеза Н0 об отсутствии автокорреляции подтвердилась.
Для дальнейшего исследования использован класс адаптивных методов. Важнейшим достоинством адаптивных методов является построение самокорректирующихся моделей, способных учитывать результат прогноза, сделанного на предыдущем шаге.
Построим адаптивную модель и рассчитаем по ней прогнозные значения стоимости квадратного метра жилья на вторичном рынке города Москвы.
5
9
6
7
1. По нескольким первым значениям (по первым 10 значениям) находим методом наименьших квадратов уравнение линейной регрессии, получаем уг = 16972 + 2325£ (для данного уравнения коэффициент детерминации К2 =
= 0, 982, значение ^-критерия: ^ = 442 > ^0)05;1;8 = 5, 3, — следовательно уравнение статистически значимо).
2. Определяем прогноз на один шаг (к = 1):
&(1) = 16972 + 2325 • 1 = 19297.
3. Находим ошибку прогнозирования. При к = 1 получаем:
е(1) = 19403 - 19297 = 106.
4. Производим корректировку параметров модели:
а(г) = а(г - 1) + Ь(г - 1) + (1 - /3)2е(ь) = 16972 + 2325 + (1 - 0, 2)2 • 106 = 19365,
ь(г) = ь(г -1) + (1 - /3)2е(ь) = 2325 + (1 - 0,2)2 • 106 = 2393;
полагая параметр сглаживания а = 0, 8, а коэффициент дисконтирования данных в = 0, 2.
5. По скорректированной модели определяем прогноз на следующий промежуток:
у*(1) = 19365 + 2393 • 1 = 21758 и т.д. Результаты дальнейших вычислений приведены в табл. 2.
Таблица 2
Оценка параметров модели
і Уг А В Уг є(г)
0 16972 2325
1 19403 19365 2393 19297 106
2 22534 22255 2890 21758 776
3 24029 24430 2176 25144 -1115
4 25168 25686 1255 26606 -1438
27 131058 131577 9353 132501 -1443
28 129993 133931 2353 140931 -10938
29 прогноз на 1 квартал 2009 года 136284
30 прогноз на 2 квартал 2009 года 138637
Для полученной адаптивной модели коэффициент детерминации равен Я2 = 0, 980. Причем модель статистически значима Я = 1247 > ^0,05;і;26 = = 4, 2.
На рис. 2 графически представлена полученная модель и исходные данные.
160000 140000 120000 100000 80000 60000 40000 20000
0 Н—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—I—г
1 3 5 7 9 11 13 15 17 19 21 23 25 27
Рис. 2. Графическое представление адаптивной модели для динамики цены жилья в г. Москве
Тест Дарбина-Уотсона для проверки наличия автокорреляции остатков подтвердил гипотезу Но об отсутствии автокорреляции в остатках. Рассчитанное фактическое значение критерия Дарбина-Уотсона для нашей модели 1 = 1,591. По рис. 1 видно, что фактическое значение критерия попадает в интервал, в котором гипотеза Но об отсутствии автокорреляции принимается.
Анализ графического представления данных, отражающих динамику цены жилья в городе Москве за 2002-2008 годы, позволяет высказать предположение о возможности использования кусочно-линейной модели после момента Ь* = 16, поскольку начиная с этого момента происходит изменение характера динамики исследуемого показателя.
Для проверки наших предположений воспользуемся статистическим тестом Г. Чоу. Выдвинем гипотезу Но о структурной стабильности тенденции изучаемого временного ряда.
Выше при построении единого уравнения тренда для всей совокупности данных были получены следующие параметры:
1) линейная модель — /1 (Ь) = 1665 + 4330Ь, остаточная сумма квадратов отклонений линейной модели = 2498462349; значение критерия
Фишера Е1 = 356;
2) экспоненциальная модель — f2 (Ь) = 19120ео,о722г, остаточная сумма квадратов отклонений экспоненциальной модели Б^ЭТС = 1158440078; значение критерия Фишера ¥2 = 1257.
Проведем расчёт аналогичных параметров для кусочно-линейной модели следующего вида:
(.) = Г2089Ь + 18088, при Ь ^ 16, /3 (Ь) = \63147^279, при 1> 16.
Имеем остаточная сумма квадратов отклонений кусочно-линейной модели: Б2оТ = 16965670 + 262920287 = 279885957.
Сравним полученные выше модели: линейную и кусочно-линейную, для чего в соответствии с предложенной Г. Чоу методикой определим наблюдаемое значение Р-критерия:
р = (ЯОст™-32оТ )(п-к1 -ко) = (2498462349-279885957)(28-2—2)
Н= ЯО™ (к1+ко—кз) = 279885957(2+2—2) = '
Поскольку Рн = 95 > Ркр = 3, 4, то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных изменений на динамику цены жилья в городе Москве признаём значимым и следует отдать предпочтение кусочно-линейной модели, чем линейной.
Сравним полученные выше модели: экспоненциальную и кусочнолинейную, определим наблюдаемое значение Р-критерия. Поскольку Рн = 37 > Ркр = 3, 4, то гипотеза о структурной стабильности тенденции отклоняется, а влияние структурных изменений на динамику цены жилья в городе Москве признаём значимым и следует отдать предпочтение кусочно-линейной модели, чем экспоненциальной.
На рис. 3 графически изображены исходные данные и построенная по ним кусочно-линейная модель.
1 /1ПППП
ПЛППЛ ♦ *
1 ¿ииии 1ППППП
шииии ЙПППП
оииии спппп /
оииии /1ПППП
опппп
¿ииии п
и 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 3 5 7 9 11 13 15 17 19 21 23 25 27
Рис. 3. Графическое представление кусочно-линейной модели динамики
цены жилья в г. Москве
Итак, после проведения статистического теста Г. Чоу для оценки значимости структурных изменений можно сделать вывод, что во временном ряде, отражающим динамику цены жилья в городе Москве имеются структурные изменения после Ь* = 16 (1 квартал 2006 года), поэтому при моделировании процесса следует отдать предпочтение кусочно-линейной
модели вида:
(і) Г2089І + 18088
/з(І) І63147^0’279
при і ^ 16, при і > 16.
Проведём статистическую оценку, полученной кусочно-линейной модели: коэффициент детерминации равен Я2 = 0, 992. Причем модель статистически значима = 3388 > Я0)05;1;26 = 4, 2.
Тест Дарбина-Уотсона для проверки наличия автокорреляции остатков подтвердил гипотезу Но об отсутствии автокорреляции в остатках. Рассчитанное фактическое значение критерия Дарбина-Уотсона для нашей модели й = 1, 491. По рис. 1 видно, что фактическое значение критерия попадает в интервал, в котором гипотеза Но об отсутствии автокорреляции принимается.
Доверительный интервал для модели регрессии, т.е. для условного математического ожидания МХ(У), определяется по формуле (1):
У і1—а;к • '*у ^ Мх:{¥') ^ У + і1—а;к • '*уу
\
(х — х)2
1
_ + П
—\ 2
Е X — X)
і=1
(1)
(2)
/
где в^ — стандартная ошибка групповой средней, у, ¿1-а;к — значение ¿-статистики Стьюдента с к = п — 2 степенями свободы, в — выборочная остаточная дисперсия, е^ = у — у^ — выборочная оценка возмущения или остаток регрессии.
Построенная доверительная область для МХ (У) (1) определяет
местоположение модельной линии регрессии (т.е. условного математического ожидания), но не отдельных возможных значений зависимой переменной, которые отклоняются от средней. Поэтому при определении доверительного интервала для индивидуальных значений у0 зависимой переменной необходимо учитывать еще один источник вариации — рассеяние вокруг линии регрессии, т.е. в оценку суммарной дисперсии в| следует включить величину в2. В результате оценка дисперсии индивидуальных значений уо при х = х0 равна (3)
/
1 + _ + п
(х — х)2
\
V
Е (Хі — х)
і=1
(3)
/
а соответствующий доверительный интервал для прогнозов индивидуальных значений у0 будет определяться по формуле (4)
у0 і1-а;п— 2 • *уо ^ у0 ^ у0 + і1—а;п—2 • *уо'
(4)
Вычислим с надежностью 0,95 интервальную оценки прогноза среднего и индивидуального значений цены 1 кв.м. жилья в г. Москве на первые два квартала 2009 года. Рассчитаем прогнозные значения по линейной, экспоненциальной, адаптивной и кусочно-линейной моделям.
Условное математическое ожидание для прогноза по адаптивной модели у(29) = 136284 и у(30) = 138637.
Оценка дисперсии групповой средней: в^=29 = 180 7, вд=30 = 1902.
Интервальная оценка прогноза среднего значения цены по формуле (1) составляет:
132561 ^ у(29) ^ 140007, 134717 ^ у(30) ^ 142557.
Дисперсия оценок индивидуальных значений у* (29) и у* (30), равна:
вт0=29 = 4992, вЩ}=30 = 5027.
Интервальную оценка для индивидуальных значений у* (29) и у* (30) определяется диапазоном
125999 ^ у*(29) ^ 146569, 128280 ^ у*(30) ^ 148994.
Аналогичные интервальные оценки получены для прогноза среднего и индивидуального значения стоимости квадратного метра жилья, полученной с использованием линейной, экспоненциальной и кусочно-линейной модели.
Построены аналогичные модели и рассчитаны интервальные прогнозные оценки для стоимости квадратного метра жилья в городе Москве, Тульской области и Центральном федеральном округе на первый и второй кварталы 2009 года. К настоящему времени опубликованы статистические данные [3] о стоимости квадратного метра жилья за первый квартал 2009 года на вторичных рынках исследованных регионов, поэтому есть возможность провести сравнительный анализ значений стоимости квадратного метра жилья, спрогнозированных с использованием различных моделей, и реальных данных.
В табл. 3 сведены полученные прогнозные значения стоимости жилья в городе Москве, Тульской области и Центральном федеральном округе.
Как видно из табл. 3 стоимость жилья в первом квартале 2009 года в исследуемых регионах оказалась в рамках индивидуального прогнозируемого значения цены для всех моделей. Хотя, очевидно, что линейная модель даёт достаточно большой доверительный интервал прогноза, вследствие чего её нельзя применять на практике. Такой достаточно большой «коридор» доверительного интервала можно объяснить тем, что линейная модель не смогла достаточно чётко уловить общую тенденцию динамики цен, вследствие чего и накопилось высокое значение дисперсии остаточной компоненты. Использование экспоненциальной модели дало достаточно приемлемый доверительный интервал индивидуального прогнозируемого значения цены квадратного метра в исследуемых регионах. Но, как видно из таблицы экспоненциальная модель для Тульской области дала завышенное прогнозируемое
Таблица 3
Средние и индивидуальные значения спрогнозированной цены 1 кв.м. жилья на первый квартал 2009 г. в городе Москве, полученные с использованием различных моделей
Город Москва
Среднее значение Индивидуальное значение
Линейная модель от 119393 до 135077 рублей от 105572 до 148897 рублей
Экспоненциальная модель от 139302 до 149422 рублей от 129711 до 159017 рублей
Адаптивная модель от 132561 до 140007 рублей от 125999 до 146569 рублей
Кусочно-линейная модель от 136684 до 139644 рублей от 135340 до 140988 рублей
Реальная стоимость 139402 рубля
Тульская область
Среднее значение Индивидуальное значение
Линейная модель от 33776 до 38184 рублей от 29887 до 42073 рублей
Экспоненциальная модель от 41900 до 44062 рублей от 39995 до 45968 рублей
Адаптивная модель от 38273 до 40383 рублей от 36414 до 42242 рублей
Кусочно-линейная модель от 39067 до 41025 рублей от 38178 до 41914 рублей
Реальная стоимость 38687 рублей
ЦФО
Среднее значение Индивидуальное значение
Линейная модель от 68566 до 78576 рублей от 59743 до 87397 рублей
Экспоненциальная модель от 79101 до 84497 рублей от 74347 до 89251 рублей
Адаптивная модель от 76088 до 80020 рублей от 72624 до 83484 рублей
Кусочно-линейная модель от 79620 до 81084 рублей от 78955 до 81749 рублей
Реальная стоимость 79782 рубля
значение стоимости жилья. Этот факт можно объяснить тем, что последние два квартала на рынке недвижимости Тульской области имелась тенденция к замедлению роста цен в связи с кризисом; а экспоненциальная модель, уловив общую тенденцию стремительного роста цен за последние 7 лет, не смогла в достаточной степени адаптироваться к изменениям. Основания для применения кусочно-линейных моделей имеются, но есть сложность с определением моментов, когда эти изменения происходят, поэтому здесь приходится полагаться на мнение аналитиков, работающих в сфере недвижимости. Хотя, в нашем случае использование кусочно-линейных моделей дало достаточно узкий «коридор» доверительного интервала прогнозируемых значений стоимости квадратного метра жилья в исследуемых регионах. Прогноз, основанный на использовании кусочно-линейных моделей, оказался верным. Наибольшую прогностическую силу имеют адаптивные модели. Ошибка, накопленная моделью невелика, благодаря тому, что модель учитывает динамичность процесса формирования цен на рынке жилья. Именно поэтому при использовании адаптивных моделей для всех рассмотренных регионов получены индивидуальные прогнозируемые значения, приемлемые для практических исследований. Очевидно, что использование адаптивных и кусочно-линейных моделей даёт приемлемый «коридор» доверительного интервала прогнозируемых индивидуальных значений стоимости квадратного метра жилья.
Сравнивая методы, использованные при прогнозировании, можно проранжировать эти методы по мере убывания их прогностической силы в следующем порядке:
— адаптивные модели прогнозирования;
- прогнозирование с использованием кусочно-линейных моделей (с учётом структурных изменений);
— прогнозирование по тренду (с использованием линейных, экспоненциальных и прочих зависимостей).
Список литературы
1. Кочетыгов А.А., Толоконников Л.А. Основы эконометрики: учеб. пособие. М.: ИКЦ «МарТ», 2007.
2. Кремер Н.Ш., Путко Б.А. Эконометрика: учебник для вузов. М.:
ЮНИТИ-ДАНА, 2002.
3. Официальный сайт Росстата http://www.gks.ru/wps/portal.
4. Чертов А.В., Кочетыгов А.А. Сравнительный анализ различных методов прогнозирования временных рядов на примере рынка жилья // Современные проблемы математики, механики, информатики: матер. междун. научн. конф. Тула: ТулГУ, 2008. C.381-383.
5. Чертов А.В. Исследование динамики цен на российском рынке жилья // Современные проблемы математики, механики, информатики: матер. регион. научн. студенч. конф.. Тула: ТулГУ, 2008. C.140-141.
6. Чертов А.В. Моделирование и учёт структурных изменений временных рядов при исследовании экономических показателей // Современные проблемы математики, механики, информатики: матер. междун. научн. конф. Тула: ТулГУ, 2007. C.241-242.
Чертов Алексей Вячеславович (alexey_chertov@mail.ru), аспирант, кафедра прикладной математики и информатики, Тульский государственный университет.
The comparative analysis of efficiency of methods forecasting by the example of the market of the real estate
A.V. Chertov
Abstract. The analysis of dynamics of a rise of prices on habitation in various regions is carried out, laws of dynamics of growth are detected. The econometric model reflecting dynamics of change of the prices in the market of habitation in some regions of Russian Federation are constructed. The behaviour of the prices in the market of habitation is analysed and the comparison of predicted forces of forecasting models is carried out. On the basis of the constructed models forecasting values of the price of square meter of habitation for first two quarters of the 2009 received with use of various models are given.
Keywords: time series, the dot forecast, a confidence interval of the forecast, residual autocorrelation of time series, Darbin-Watson’s test, adaptive models of forecasting, structural changes of a trend, Chow test.
Chertov Alexey (alexey_chertov@mail.ru), postgraduate student, department of applies mathematics and computer science, Tula State University.
Поступила 26.01.2011