Научная статья на тему 'Эконометрический анализ рынка подержанных автомобилей'

Эконометрический анализ рынка подержанных автомобилей Текст научной статьи по специальности «Математика»

803
198
Поделиться

Аннотация научной статьи по математике, автор научной работы — Богданов Александр Леонидович

Объектом данного исследования является рынок подержанных автомобилей, целью построение модели формирования цены автомобиля на вторичном рынке с учетом различных факторов. Предложено два подхода к построению такой модели.

Похожие темы научных работ по математике , автор научной работы — Богданов Александр Леонидович,

Текст научной работы на тему «Эконометрический анализ рынка подержанных автомобилей»

А . Л. Богданов

ЭКОНОМЕТРИЧЕСКИЙ АНАЛИЗ РЫНКА ПОДЕРЖАННЫХ АВТОМОБИЛЕЙ

Объектом данного исследования является рынок подержанных автомобилей, целью - построение модели формирования цены автомобиля на вторичном рынке с учетом различных факторов. Предложено два подхода к построению такой модели.

Объектом данного исследования является рынок подержанных автомобилей, целью - выявление факторов и оценки степени их влияния на цену подержанного автомобиля. Данные для исследования были получены с Web-сайта auto.ru - одного из крупнейших российских сайтов автомобильной тематики. Выбор этого сайта объясняется, во-первых, тем, что сайт обладает достаточно большой базой предложений, во-вторых, по каждому продаваемому автомобилю в базе имеется подробная информация о его характеристиках.

Размер загруженной с сайта выборки (5 мая 2005 г.) после удаления недостоверных и противоречивых данных составил 47175 записей о более чем 700 моделей 22 фирм-производителей. Большая часть выборки представляет собой предложения из Москвы (40434) и Санкт-Петербурга (4690). О каждом продаваемом автомобиле в выборке имеется следующая информация: название производителя (марка автомобиля), модель автомобиля, год выпуска, пробег, объем двигателя, тип двигателя (бензиновый/дизельный), тип привода (передний/задний/полный), тип кузова, цвет, возможность торга, информация о комплектации автомобиля (наличие магнитолы, подушек безопасности, систем ABS и ESP, сигнализации, центрального замка, отделке салона и т.д., всего 58 пунктов).

Фиктивные переменные Описание

D1 ABS

D2 Airbag боковые

D3 Airbag д/водителя

D4 Airbag д/пассажира

D5 Airbag оконные

D6 ESP

D7 Handsfree

DS Авт. упр. светом

D9 Антипробуксовочная система

D10 Ау диоподготовка

D11 Багажник на крыше

D12 Блокировка заднего диф.

D13 Бортовой компьютер

D14 ГУР

D15 Д/о багажника

D16 Д/о бензобака

D17 Датчик дождя

D1S Иммобилайзер

D19 Катализатор

D20 Климат-контроль

D21 Кондиционер

D22 Корректор фар

D23 Круиз-контроль

D24 Ксеноновые фары

D25 Лебедка

D26 Легкосплавные диски

D27 Люк

D2S Навигационная система

D29 Обогрев зеркал

ОПИСАНИЕ ПЕРЕМЕННЫХ

Введем обозначения: PRICE - цена автомобиля (SUSA); AGE - возраст (число лет); PROBEG - пробег (lO OOO км); DRVOL - объем двигателя; DIZEL - фиктивная переменная, обозначающая тип двигателя (O -бензиновый, 1 - дизельный); PT0, PT1, PTl - фиктивные переменные, обозначающие тип привода (задний, передний, полный привод); NEW - равна 1 для новых автомобилей и 0 - для подержанных; RU - равна 1, если автомобиль российского производства, O - в противном случае; KZ0, KZ1,...,KZ12 - переменные, обозначающие тип кузова (седан, хэтчбек, универсал, купе, пикап, комби, кабриолет, мини-вэн, стретч, родстер, тарга, фургон, вседорожник); MO, M1,...,M22 - фиктивные переменные, обозначающие марку автомобиля (Audi, BMW, Daewoo, Dodge, Ford, Honda, Hyundai, Lexus, Mazda, Mercedes, Mitsubishi, Nissan, Opel, Peugeot, Renault, Subaru, Suzuki, Toyota, Volkswagen, Volvo, ВАЗ, ГАЗ); TORG - равна 1, если продавец допускает возможность торга, и O - в противном случае; Dl, D2,..., D5S - фиктивные переменные, принимающие значение 1 при наличии соответствующей опции в автомобиле и O - в противном случае. Полное описание переменных приведено в табл. 1.

Таблица 1

Фиктивные переменные Описание

D30 Обогрев сидений

D31 Омыватель фар

D32 Отделка под дерево

D33 Парктроник

D34 Подлокотник передний

D35 Противотуманные фары

D36 Разд. спинка задн. сидений

D37 Регул. сид. вод. по высоте

D3S Регул. сид. пасс. по высоте

D39 Регулировка руля

D40 Салон (велюр)

D41 Салон (кожа)

D42 Сигнализация

D43 Сотовый телефон

D44 Тонированные стекла

D45 Фаркоп

D46 Центральный замок

D47 Электроантенна

D4S Электрозеркала

D49 Электропривод вод. сиденья (есть)

D50 Электропривод вод. сиденья (с памятью)

D51 Электропривод пасс. сиденья

D52 Электростекла (все)

D53 Электростекла (передние)

D54 Магнитола (есть)

D55 Магнитола (с ОБ)

D56 Магнитола (с МР3)

D57 СБ-чейнджер (есть)

D5S СБ-чейнджер (с МР3)

ПРОСТАЯ МОДЕЛЬ ЦЕНЫ ПОДЕРЖАННОГО АВТОМОБИЛЯ

Рассмотрим следующее регрессионное уравнение

ln(PRICE) = а + ^ PX +е . (1)

i

Здесь - факторы; а - некоторая константа; Pi -неизвестные параметры; е - случайная составляющая, учитывающая неучтенные в модели факторы и возможные ошибки в данных. Параметры Рг- имеют следующий смысл: при фиксированных значениях остальных факторов изменение i-го фактора на единицу приводит к изменению цены в среднем на Рг- х 100 %

(приблизительно). Параметр а не имеет какой-либо экономической интерпретации. Регрессионное уравнение (1) можно использовать для построения модели цены некоторой определенной автомодели. Построение заключается в оценке неизвестных параметров а и Рг- по методу наименьших квадратов [1 - 3].

Основной проблемой здесь является определение «наилучшего» уравнения регрессии - уравнения, содержащего наибольшее число значащих факторов имеющее наиболее высокое значение коэффициента детерминации и имеющее непротиворечивую экономическую интерпретацию. Для решения этой проблемы можно использовать подходы «от частного к общему» и «от общего к частному» [2, 3], но, как известно [2], ни один из них не гарантирует получения правильной с экономической точки зрения спецификации модели. Поэтому при выборе между альтернативными моделями предпочтение следует отдавать той, что имеет непротиворечивую экономическую интерпретацию.

Процесс построения модели рассмотрим на примере автомобиля ВАЗ 2109. Эта модель выпускается в модификациях с типом кузова седан и хэтчбек. Диаграммы рассеяния цена/возраст и цена/пробег приве- ного коэффициента детерминации равно 0,82, что го-

дены на рис. 1 и 2. ворит о достаточно хорошем качестве подгонки. КоВ качестве первого приближения построим мо- эффициент перед переменной AGE показывает, что с

дель, в которую включим следующие факторы: воз- увеличением возраста автомобиля на один год его цена

раст, пробег, тип кузова и переменную TORG. Ре- при прочих равных условиях уменьшается в среднем

зультаты оценивания параметров в эконометрическом на 9,57%. Коэффициент перед переменной PROBEG

пакете EViews приведены в табл. 2. показывает, что с увеличением пробега на 10000 км

цена автомобиля при прочих равных условиях Таблица 2 уменьшается в среднем на 0,55%. Коэффициент перед переменной KZ1 показывает, что модель с кузовом хэтчбек при прочих равных условиях стоит на 9,16% дешевле модели с кузовом седан. Переменная TORG оказалась незначимой.

Добавим в модель факторы D1, D2,..., D58 и повторно произведем оценку параметров, исключая последовательно незначащие факторы в соответствии с методом «от общего к частному». Результат оценивания приведен в табл. 3. Как видно из таблицы, новая модель получилась лучше предыдущей: скорректированный коэффициент детерминации равен 0,84. Коэффициенты перед переменными AGE, PROBEG и KZ1 остались значимыми и изменились незначительно. Коэффициент перед переменной TORG оказался

Dependent Variable: LOG(PRICE) Method: Least Squares Included observations: 3365

Variable Coefficient Std. Error t-Statistic Prob.

ALPHA AGE PROBEG KZ1 TORG 8,847406 -0,095726 -0,005521 -0,091577 0,012405 0,010334 856,1205 0,000967 -98,97453 0,000784 -7,043760 0,004708 -19,45046 0,008820 1,406509 0,0000 0,0000 0,0000 0,0000 0,1597

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0,823463 0,823253 0,135187 61,40574 1961,463 1,744911 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 8,274289 0,321558 -1,162831 -1,153736 3918,210 0,000000

12000

10000

8000

W

^ 6000 СМ

4000

2000

0 4 8 12 16 20 24

AGE

Рис. 1. Диаграмма цена/возраст

12000 10000 8000

E

^ 6000 см

4000 2000

0 4 8 12 16 20 24

PROBEG Рис. 2. Диаграмма цена/пробег

Как видно из таблицы, значение скорректирован-

Таблица 3

Dependent Variable: LOG(PRICE) Method: Least Squares Included observations: 3365

Variable Coefficient Std. Error t-Statistic Prob.

ALPHA 8,777030 0,011135 788,2484 0,0000

AGE -0,092950 0,000952 -97,66733 0,0000

PROBEG -0,007003 0,000756 -9,262149 0,0000

KZ1 -0,080293 0,004580 -17,53211 0,0000

TORG 0,023634 0,008443 2,799281 0,0052

D10 0,030518 0,005863 5,204758 0,0000

D13 0,034216 0,010227 3,345643 0,0008

D15 0,042650 0,013579 3,140945 0,0017

D22 0,024459 0,007286 3,356796 0,0008

D26 0,038207 0,005461 6,996574 0,0000

D35 0,016877 0,007272 2,320622 0,0204

D44 0,022819 0,004655 4,902135 0,0000

D45 0,027283 0,008625 3,163398 0,0016

D46 0,015448 0,004953 3,118926 0,0018

D47 0,025603 0,011280 2,269820 0,0233

R-squared 0,839828 Mean dependent var 8,274289

Adjusted R-squared 0,839159 S.D. dependent var 0,321558

S.E. of regression 0,128961 Akaike info criterion -1,254171

Sum squared resid 55,71335 Schwarz criterion -1,226885

Log likelihood 2125,143 F-statistic 1254,646

Durbin-Watson stat 1,879215 Prob(F-statistic) 0,000000

МОДЕЛЬ ИНДЕКСА ПОДЕРЖАННОГО АВТОМОБИЛЯ

Пусть Р0 - цена подержанного автомобиля, а Рп - точно такого же нового. Рассмотрим безразмерную величину I = 1п(Р0)/1п(Рп), называемую в дальнейшем индексом. Логично предположить, что изменение индекса связано с процессом старения автомобиля, т.е. зависит от времени и интенсивности использования автомобиля:

I = а + рЛвБ + уРКОББО + е .

Предположим также, что износ со временем автомобилей различных производителей происходит по-разному:

22

I = а + Y, Mß AGE + у PROBEG + e,

(2)

i=1

значимым. Ему можно дать следующую интерпретацию: продавец, указавший в объявлении возможность торга, в среднем заранее завышает цену на 2,36%. Коэффициенты перед переменными из набора комплектация получились значимыми на 5%-м уровне и положительными, что соответствует здравому смыслу (наличие в автомобиле дополнительных опций должно увеличивать его стоимость).

По графику остатков (рис. 3) видно, что ошибки прогноза хаотично расположены вокруг нуля, что свидетельствует в пользу правильной спецификации модели. Средняя ошибка прогноза цены составила 318,73 доллара, или 8,58%. Заметим, что влияние на стоимость автомобиля каждого из факторов TORG, D10, D13, D15, D22,

D26, D35, D44, D45, D46 и D47 по отдельности получилось меньше средней ошибки прогноза, тем не менее все они являются значимыми на 5%-м уровне и не могут быть исключены из модели.

1,2 0,8 -0,4 -0,0 -0,4 -0,8 Н -1,2 -1,6

где Mi - фиктивная переменная, соответствующая марке автомобиля; а, р,- и у - оцениваемые параметры.

Имеющиеся в выборке данные не позволяют рассчитать индекс, так как не удается найти для каждого подержанного автомобиля идентичный новый. Поэтому индекс подержанного автомобиля будем вычислять, рассчитывая величину Рп как средневзвешенную цену новых автомобилей той же марки и модели. В имеющейся выборке индексы удалось рассчитать для 28794 автомобилей. Результаты оценивания параметров модели (2) приведены в табл. 4.

Таблица 4

■ LOG(PRICE) Residuals

Рис. 3. График остатков

Dependent Variable: IDXPRICE Method: Least Squares Included observations: 28794

Variable Coefficient Std. Error t-Statistic Prob.

ALPHA 0,999821 0,000233 4290,870 0,0000

AGE*M0 -0,015290 0,000104 -147,1760 0,0000

AGE*M1 -0,014012 8,93E-05 -156,9820 0,0000

AGE*M2 -0,009440 0,000198 -47,58022 0,0000

AGE*M3 -0,014539 0,000686 -21,19981 0,0000

AGE*M4 -0,009960 0,000137 -72,94191 0,0000

AGE*M5 -0,010939 0,000169 -64,60249 0,0000

AGE*M6 -0,008104 0,000230 -35,22352 0,0000

AGE*M7 -0,011521 0,000216 -53,24322 0,0000

AGE*M8 -0,007242 0,000825 -8,773554 0,0000

AGE*M9 -0,013029 0,000106 -122,6546 0,0000

AGE*M10 -0,010993 0,000108 -101,7212 0,0000

AGE*M11 -0,011134 9,66E-05 -115,2724 0,0000

AGE*M12 -0,011676 8,54E-05 -136,7619 0,0000

AGE*M13 -0,012877 0,000314 -41,04783 0,0000

AGE*M14 -0,010665 0,000174 -61,13954 0,0000

AGE*M15 -0,016336 0,000240 -67,98064 0,0000

AGE*M16 -0,008689 0,000246 -35,28486 0,0000

AGE*M17 -0,011942 9,45E-05 -126,3381 0,0000

AGE*M18 -0,010433 7,76E-05 -134,3959 0,0000

AGE*M19 -0,013430 0,000241 -55,66306 0,0000

AGE*M20 -0,010890 5,55E-05 -196,3888 0,0000

AGE*M21 -0,019084 0,000119 -159,7062 0,0000

PROBEG -0,000795 3,46E-05 -22,98319 0,0000

R-squared 0,844103 Mean dependent var 0,932866

Adjusted R-squared 0,843979 S.D. dependent var 0.053447

S.E. of regression 0,021111 Akaike info criterion -4.877166

Sum squared resid 12,82264 Schwarz criterion -4.870274

Log likelihood 70240,56 F-statistic 6772.848

Durbin-Watson stat 1,350200 Prob(F-statistic) 0.000000

Как видно из таблицы, все коэффициенты получились значимыми. Значение параметра a близко к единице, что соответствует смыслу индекса (новый автомобиль с нулевым пробегом и нулевым возрастом имеет индекс, равный 1). Скорректированный коэффициент детерминации равен 0,S4, средняя ошибка прогноза индекса составила 1,61%.

Полученный результат позволяет построить рейтинг производителей по скорости снижения индекса автомобиля с возрастом: Mazda (-0,0072), Hyundai (-0,0081), Suzuki (-0,0086), Daewoo (-0,0094), Ford (-0,0099), Volkswagen (-0,0104), Renault (-0,0106), ВАЗ (-0,0108), Honda (-0,0109), Mitsubishi (-0,0109), Nissan (-0,0111), Lexus (-0,0115), Opel (-0,0116), Toyota (-0,0119), Peugeot (-0,0128), Mercedes (-0,0130), Volvo (-0,0134), BMW (-0,0140), Dodge (-0,0145), Audi (-0,0152), Subaru (-0,0163), ГАЗ (-0,0190). Таким образом, покупателю автомобиля, планирующему через некоторое время его продать, наиболее выгодным будет покупка автомобиля фирмы Mazda.

ЗАКЛЮЧЕНИЕ

В статье рассмотрено две модели зависимости цены подержанного автомобиля от параметров. Из первой модели следует, что основным фактором, влияющим на цену автомобиля, является его возраст. Остальные факторы оказывают менее значимое влияние, в том числе такой на первый взгляд важный фактор, как пробег, что согласуется с мнением экспертов (http://caragent.ru/info/odometer.shtm1). Тем не менее пренебрегать ими не следует, так как совокупный их вклад может быть существенным. Добавим также, что в выборке отсутствовали и, следовательно, не вошли в модель такие важные факторы, как состояние кузова, двигателя, салона и ходовой части, информация о том, какой хозяин по счету и был ли автомобиль в аварии. Возможно, их учет сделал бы модель более точной.

Вторая модель позволила оценить качественное различие автомобилей разных производителей. По результатам оценивания модели построен рейтинг производителей автомобилей по скорости падения цены с возрастом.

ЛИТЕРАТУРА

1. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. М.: Дело, 2004.

2. Доугерти К. Введение в эконометрику. М.: ИНФРА-М, 2004.

3. ДрайперН., Смит Г. Прикладной регрессионный анализ. М.: Статистика, 1973.

Статья представлена кафедрой математических методов и информационных технологий в экономике экономического факультета Томского государственного университета, поступила в научную редакцию «Кибернетика» 31 мая 2005 г.