А . Л. Богданов
ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ РЫНКА ПОДЕРЖАННЫХ АВТОМОБИЛЕЙ
Объектом данного исследования является рынок подержанных автомобилей, целью - построение модели формирования цены автомобиля на вторичном рынке с учетом различных факторов. Предложено два подхода к построению такой модели.
Объектом данного исследования является рынок подержанных автомобилей, целью - выявление факторов и оценки степени их влияния на цену подержанного автомобиля. Данные для исследования были получены с Web-сайта auto.ru - одного из крупнейших российских сайтов автомобильной тематики. Выбор этого сайта объясняется, во-первых, тем, что сайт обладает достаточно большой базой предложений, во-вторых, по каждому продаваемому автомобилю в базе имеется подробная информация о его характеристиках.
Размер загруженной с сайта выборки (5 мая 2005 г.) после удаления недостоверных и противоречивых данных составил 47175 записей о более чем 700 моделей 22 фирм-производителей. Большая часть выборки представляет собой предложения из Москвы (40434) и Санкт-Петербурга (4690). О каждом продаваемом автомобиле в выборке имеется следующая информация: название производителя (марка автомобиля), модель автомобиля, год выпуска, пробег, объем двигателя, тип двигателя (бензиновый/дизельный), тип привода (передний/задний/полный), тип кузова, цвет, возможность торга, информация о комплектации автомобиля (наличие магнитолы, подушек безопасности, систем ABS и ESP, сигнализации, центрального замка, отделке салона и т.д., всего 58 пунктов).
Фиктивные переменные Описание
D1 ABS
D2 Airbag боковые
D3 Airbag д/водителя
D4 Airbag д/пассажира
D5 Airbag оконные
D6 ESP
D7 Handsfree
DS Авт. упр. светом
D9 Антипробуксовочная система
D10 Ау диоподготовка
D11 Багажник на крыше
D12 Блокировка заднего диф.
D13 Бортовой компьютер
D14 ГУР
D15 Д/о багажника
D16 Д/о бензобака
D17 Датчик дождя
D1S Иммобилайзер
D19 Катализатор
D20 Климат-контроль
D21 Кондиционер
D22 Корректор фар
D23 Круиз-контроль
D24 Ксеноновые фары
D25 Лебедка
D26 Легкосплавные диски
D27 Люк
D2S Навигационная система
D29 Обогрев зеркал
ОПИСАНИЕ ПЕРЕМЕННЫХ
Введем обозначения: PRICE - цена автомобиля (SUSA); AGE - возраст (число лет); PROBEG - пробег (lO OOO км); DRVOL - объем двигателя; DIZEL - фиктивная переменная, обозначающая тип двигателя (O -бензиновый, 1 - дизельный); PT0, PT1, PTl - фиктивные переменные, обозначающие тип привода (задний, передний, полный привод); NEW - равна 1 для новых автомобилей и 0 - для подержанных; RU - равна 1, если автомобиль российского производства, O - в противном случае; KZ0, KZ1,...,KZ12 - переменные, обозначающие тип кузова (седан, хэтчбек, универсал, купе, пикап, комби, кабриолет, мини-вэн, стретч, родстер, тарга, фургон, вседорожник); MO, M1,...,M22 - фиктивные переменные, обозначающие марку автомобиля (Audi, BMW, Daewoo, Dodge, Ford, Honda, Hyundai, Lexus, Mazda, Mercedes, Mitsubishi, Nissan, Opel, Peugeot, Renault, Subaru, Suzuki, Toyota, Volkswagen, Volvo, ВАЗ, ГАЗ); TORG - равна 1, если продавец допускает возможность торга, и O - в противном случае; Dl, D2,..., D5S - фиктивные переменные, принимающие значение 1 при наличии соответствующей опции в автомобиле и O - в противном случае. Полное описание переменных приведено в табл. 1.
Таблица 1
Фиктивные переменные Описание
D30 Обогрев сидений
D31 Омыватель фар
D32 Отделка под дерево
D33 Парктроник
D34 Подлокотник передний
D35 Противотуманные фары
D36 Разд. спинка задн. сидений
D37 Регул. сид. вод. по высоте
D3S Регул. сид. пасс. по высоте
D39 Регулировка руля
D40 Салон (велюр)
D41 Салон (кожа)
D42 Сигнализация
D43 Сотовый телефон
D44 Тонированные стекла
D45 Фаркоп
D46 Центральный замок
D47 Электроантенна
D4S Электрозеркала
D49 Электропривод вод. сиденья (есть)
D50 Электропривод вод. сиденья (с памятью)
D51 Электропривод пасс. сиденья
D52 Электростекла (все)
D53 Электростекла (передние)
D54 Магнитола (есть)
D55 Магнитола (с ОБ)
D56 Магнитола (с МР3)
D57 СБ-чейнджер (есть)
D5S СБ-чейнджер (с МР3)
ПРОСТАЯ МОДЕЛЬ ЦЕНЫ ПОДЕРЖАННОГО АВТОМОБИЛЯ
Рассмотрим следующее регрессионное уравнение
ln(PRICE) = а + ^ PX +е . (1)
i
Здесь - факторы; а - некоторая константа; Pi -неизвестные параметры; е - случайная составляющая, учитывающая неучтенные в модели факторы и возможные ошибки в данных. Параметры Рг- имеют следующий смысл: при фиксированных значениях остальных факторов изменение i-го фактора на единицу приводит к изменению цены в среднем на Рг- х 100 %
(приблизительно). Параметр а не имеет какой-либо экономической интерпретации. Регрессионное уравнение (1) можно использовать для построения модели цены некоторой определенной автомодели. Построение заключается в оценке неизвестных параметров а и Рг- по методу наименьших квадратов [1 - 3].
Основной проблемой здесь является определение «наилучшего» уравнения регрессии - уравнения, содержащего наибольшее число значащих факторов имеющее наиболее высокое значение коэффициента детерминации и имеющее непротиворечивую экономическую интерпретацию. Для решения этой проблемы можно использовать подходы «от частного к общему» и «от общего к частному» [2, 3], но, как известно [2], ни один из них не гарантирует получения правильной с экономической точки зрения спецификации модели. Поэтому при выборе между альтернативными моделями предпочтение следует отдавать той, что имеет непротиворечивую экономическую интерпретацию.
Процесс построения модели рассмотрим на примере автомобиля ВАЗ 2109. Эта модель выпускается в модификациях с типом кузова седан и хэтчбек. Диаграммы рассеяния цена/возраст и цена/пробег приве- ного коэффициента детерминации равно 0,82, что го-
дены на рис. 1 и 2. ворит о достаточно хорошем качестве подгонки. КоВ качестве первого приближения построим мо- эффициент перед переменной AGE показывает, что с
дель, в которую включим следующие факторы: воз- увеличением возраста автомобиля на один год его цена
раст, пробег, тип кузова и переменную TORG. Ре- при прочих равных условиях уменьшается в среднем
зультаты оценивания параметров в эконометрическом на 9,57%. Коэффициент перед переменной PROBEG
пакете EViews приведены в табл. 2. показывает, что с увеличением пробега на 10000 км
цена автомобиля при прочих равных условиях Таблица 2 уменьшается в среднем на 0,55%. Коэффициент перед переменной KZ1 показывает, что модель с кузовом хэтчбек при прочих равных условиях стоит на 9,16% дешевле модели с кузовом седан. Переменная TORG оказалась незначимой.
Добавим в модель факторы D1, D2,..., D58 и повторно произведем оценку параметров, исключая последовательно незначащие факторы в соответствии с методом «от общего к частному». Результат оценивания приведен в табл. 3. Как видно из таблицы, новая модель получилась лучше предыдущей: скорректированный коэффициент детерминации равен 0,84. Коэффициенты перед переменными AGE, PROBEG и KZ1 остались значимыми и изменились незначительно. Коэффициент перед переменной TORG оказался
Dependent Variable: LOG(PRICE) Method: Least Squares Included observations: 3365
Variable Coefficient Std. Error t-Statistic Prob.
ALPHA AGE PROBEG KZ1 TORG 8,847406 -0,095726 -0,005521 -0,091577 0,012405 0,010334 856,1205 0,000967 -98,97453 0,000784 -7,043760 0,004708 -19,45046 0,008820 1,406509 0,0000 0,0000 0,0000 0,0000 0,1597
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0,823463 0,823253 0,135187 61,40574 1961,463 1,744911 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 8,274289 0,321558 -1,162831 -1,153736 3918,210 0,000000
12000
10000
8000
W
^ 6000 СМ
4000
2000
0 4 8 12 16 20 24
AGE
Рис. 1. Диаграмма цена/возраст
12000 10000 8000
E
^ 6000 см
4000 2000
0 4 8 12 16 20 24
PROBEG Рис. 2. Диаграмма цена/пробег
Как видно из таблицы, значение скорректирован-
Таблица 3
Dependent Variable: LOG(PRICE) Method: Least Squares Included observations: 3365
Variable Coefficient Std. Error t-Statistic Prob.
ALPHA 8,777030 0,011135 788,2484 0,0000
AGE -0,092950 0,000952 -97,66733 0,0000
PROBEG -0,007003 0,000756 -9,262149 0,0000
KZ1 -0,080293 0,004580 -17,53211 0,0000
TORG 0,023634 0,008443 2,799281 0,0052
D10 0,030518 0,005863 5,204758 0,0000
D13 0,034216 0,010227 3,345643 0,0008
D15 0,042650 0,013579 3,140945 0,0017
D22 0,024459 0,007286 3,356796 0,0008
D26 0,038207 0,005461 6,996574 0,0000
D35 0,016877 0,007272 2,320622 0,0204
D44 0,022819 0,004655 4,902135 0,0000
D45 0,027283 0,008625 3,163398 0,0016
D46 0,015448 0,004953 3,118926 0,0018
D47 0,025603 0,011280 2,269820 0,0233
R-squared 0,839828 Mean dependent var 8,274289
Adjusted R-squared 0,839159 S.D. dependent var 0,321558
S.E. of regression 0,128961 Akaike info criterion -1,254171
Sum squared resid 55,71335 Schwarz criterion -1,226885
Log likelihood 2125,143 F-statistic 1254,646
Durbin-Watson stat 1,879215 Prob(F-statistic) 0,000000
МОДЕЛЬ ИНДЕКСА ПОДЕРЖАННОГО АВТОМОБИЛЯ
Пусть Р0 - цена подержанного автомобиля, а Рп - точно такого же нового. Рассмотрим безразмерную величину I = 1п(Р0)/1п(Рп), называемую в дальнейшем индексом. Логично предположить, что изменение индекса связано с процессом старения автомобиля, т.е. зависит от времени и интенсивности использования автомобиля:
I = а + рЛвБ + уРКОББО + е .
Предположим также, что износ со временем автомобилей различных производителей происходит по-разному:
22
I = а + Y, Mß AGE + у PROBEG + e,
(2)
i=1
значимым. Ему можно дать следующую интерпретацию: продавец, указавший в объявлении возможность торга, в среднем заранее завышает цену на 2,36%. Коэффициенты перед переменными из набора комплектация получились значимыми на 5%-м уровне и положительными, что соответствует здравому смыслу (наличие в автомобиле дополнительных опций должно увеличивать его стоимость).
По графику остатков (рис. 3) видно, что ошибки прогноза хаотично расположены вокруг нуля, что свидетельствует в пользу правильной спецификации модели. Средняя ошибка прогноза цены составила 318,73 доллара, или 8,58%. Заметим, что влияние на стоимость автомобиля каждого из факторов TORG, D10, D13, D15, D22,
D26, D35, D44, D45, D46 и D47 по отдельности получилось меньше средней ошибки прогноза, тем не менее все они являются значимыми на 5%-м уровне и не могут быть исключены из модели.
1,2 0,8 -0,4 -0,0 -0,4 -0,8 Н -1,2 -1,6
где Mi - фиктивная переменная, соответствующая марке автомобиля; а, р,- и у - оцениваемые параметры.
Имеющиеся в выборке данные не позволяют рассчитать индекс, так как не удается найти для каждого подержанного автомобиля идентичный новый. Поэтому индекс подержанного автомобиля будем вычислять, рассчитывая величину Рп как средневзвешенную цену новых автомобилей той же марки и модели. В имеющейся выборке индексы удалось рассчитать для 28794 автомобилей. Результаты оценивания параметров модели (2) приведены в табл. 4.
Таблица 4
■ LOG(PRICE) Residuals
Рис. 3. График остатков
Dependent Variable: IDXPRICE Method: Least Squares Included observations: 28794
Variable Coefficient Std. Error t-Statistic Prob.
ALPHA 0,999821 0,000233 4290,870 0,0000
AGE*M0 -0,015290 0,000104 -147,1760 0,0000
AGE*M1 -0,014012 8,93E-05 -156,9820 0,0000
AGE*M2 -0,009440 0,000198 -47,58022 0,0000
AGE*M3 -0,014539 0,000686 -21,19981 0,0000
AGE*M4 -0,009960 0,000137 -72,94191 0,0000
AGE*M5 -0,010939 0,000169 -64,60249 0,0000
AGE*M6 -0,008104 0,000230 -35,22352 0,0000
AGE*M7 -0,011521 0,000216 -53,24322 0,0000
AGE*M8 -0,007242 0,000825 -8,773554 0,0000
AGE*M9 -0,013029 0,000106 -122,6546 0,0000
AGE*M10 -0,010993 0,000108 -101,7212 0,0000
AGE*M11 -0,011134 9,66E-05 -115,2724 0,0000
AGE*M12 -0,011676 8,54E-05 -136,7619 0,0000
AGE*M13 -0,012877 0,000314 -41,04783 0,0000
AGE*M14 -0,010665 0,000174 -61,13954 0,0000
AGE*M15 -0,016336 0,000240 -67,98064 0,0000
AGE*M16 -0,008689 0,000246 -35,28486 0,0000
AGE*M17 -0,011942 9,45E-05 -126,3381 0,0000
AGE*M18 -0,010433 7,76E-05 -134,3959 0,0000
AGE*M19 -0,013430 0,000241 -55,66306 0,0000
AGE*M20 -0,010890 5,55E-05 -196,3888 0,0000
AGE*M21 -0,019084 0,000119 -159,7062 0,0000
PROBEG -0,000795 3,46E-05 -22,98319 0,0000
R-squared 0,844103 Mean dependent var 0,932866
Adjusted R-squared 0,843979 S.D. dependent var 0.053447
S.E. of regression 0,021111 Akaike info criterion -4.877166
Sum squared resid 12,82264 Schwarz criterion -4.870274
Log likelihood 70240,56 F-statistic 6772.848
Durbin-Watson stat 1,350200 Prob(F-statistic) 0.000000
Как видно из таблицы, все коэффициенты получились значимыми. Значение параметра a близко к единице, что соответствует смыслу индекса (новый автомобиль с нулевым пробегом и нулевым возрастом имеет индекс, равный 1). Скорректированный коэффициент детерминации равен 0,S4, средняя ошибка прогноза индекса составила 1,61%.
Полученный результат позволяет построить рейтинг производителей по скорости снижения индекса автомобиля с возрастом: Mazda (-0,0072), Hyundai (-0,0081), Suzuki (-0,0086), Daewoo (-0,0094), Ford (-0,0099), Volkswagen (-0,0104), Renault (-0,0106), ВАЗ (-0,0108), Honda (-0,0109), Mitsubishi (-0,0109), Nissan (-0,0111), Lexus (-0,0115), Opel (-0,0116), Toyota (-0,0119), Peugeot (-0,0128), Mercedes (-0,0130), Volvo (-0,0134), BMW (-0,0140), Dodge (-0,0145), Audi (-0,0152), Subaru (-0,0163), ГАЗ (-0,0190). Таким образом, покупателю автомобиля, планирующему через некоторое время его продать, наиболее выгодным будет покупка автомобиля фирмы Mazda.
ЗАКЛЮЧЕНИЕ
В статье рассмотрено две модели зависимости цены подержанного автомобиля от параметров. Из первой модели следует, что основным фактором, влияющим на цену автомобиля, является его возраст. Остальные факторы оказывают менее значимое влияние, в том числе такой на первый взгляд важный фактор, как пробег, что согласуется с мнением экспертов (http://caragent.ru/info/odometer.shtm1). Тем не менее пренебрегать ими не следует, так как совокупный их вклад может быть существенным. Добавим также, что в выборке отсутствовали и, следовательно, не вошли в модель такие важные факторы, как состояние кузова, двигателя, салона и ходовой части, информация о том, какой хозяин по счету и был ли автомобиль в аварии. Возможно, их учет сделал бы модель более точной.
Вторая модель позволила оценить качественное различие автомобилей разных производителей. По результатам оценивания модели построен рейтинг производителей автомобилей по скорости падения цены с возрастом.
ЛИТЕРАТУРА
1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. М.: Дело, 2004.
2. Доугерти К. Введение в эконометрику. М.: ИНФРА-М, 2004.
3. ДрайперН., Смит Г. Прикладной регрессионный анализ. М.: Статистика, 1973.
Статья представлена кафедрой математических методов и информационных технологий в экономике экономического факультета Томского государственного университета, поступила в научную редакцию «Кибернетика» 31 мая 2005 г.