Научная статья на тему 'Использование нейронных сетей для оценки рыночной стоимости недвижимости'

Использование нейронных сетей для оценки рыночной стоимости недвижимости Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
2841
364
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ОЦЕНКА СТОИМОСТИ НЕДВИЖИМОСТИ / НЕЙРОННЫЕ СЕТИ / REAL ESTATE VALUATION / NEURAL NETWORKS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Арефьева Елена Анатольевна, Костяев Дмитрий Сергеевич

Рассматривается вопрос разработки и исследования методики оценки рыночной стоимости недвижимости на основе нейросетевого подхода.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Арефьева Елена Анатольевна, Костяев Дмитрий Сергеевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

USING NEURAL NETWORKS FOR EVALUATION OF MARKET COST OF REAL ESTATE

The article deals with the issue of development and research of methods for estimat-i ng the market val ue of real estate on the basis of the neural network approach.

Текст научной работы на тему «Использование нейронных сетей для оценки рыночной стоимости недвижимости»

УДК 004; 332.8

ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ОЦЕНКИ РЫНОЧНОЙ СТОИМОСТИ НЕДВИЖИМОСТИ

Е.А. Арефьева, Д.С. Костяев

Рассматривается вопрос разработки и исследования методики оценки рыночной стоимости недвижимости на основе нейросетевого подхода.

Ключевые слова: оценка стоимости недвижимости, нейронные сети.

Оценка стоимости недвижимости - процесс определения рыночной стоимости объекта или отдельных прав в отношении оцениваемого объекта недвижимости. Оценка стоимости недвижимости включает: определение стоимости права собственности или иных прав, например, права аренды, права пользования и т.д. в отношении различных объектов недвижимости.

Оценочная практика показывает, что для выполнения отчета об оценке стоимости квартиры специалисту требуется около часа. Автоматизация этого процесса позволит ускорить процесс принятия решения, учесть большее количество факторов оценки, снизить уровень субъективности оценки.

Рассмотрев принципиальную возможность применения эксперт-ныхсистем, баз знаний, мультиагентных систем и нейросетевого подхода для автоматизации определения рыночной стоимости недвижимости, выбор был сделан в пользу нейронных сетей, которые позволяют учитывать неявные факторы формирования стоимости, адаптироваться к специфике территориальных рынков недвижимости.

Целью данной работы является исследование и разработка методики оценки стоимости недвижимости с использованием нейросетевых технологий.

Для достижения указанной цели необходимо решить следующие

задачи:

- предварительный отбор факторов, оказывающих влияние на рыночную стоимость квартир;

- подготовка обучающей выборки для нейронной сети;

- определение оптимального типа и характеристик нейронной сети, а так же метода ее обучения.

Задача оценки недвижимости схематично представлена на рис. 1.

Основным "ЕВ-сайтом для размещения сведений о продаже квартир является http://avito.ru/. Именно из базы данных сайта целесообразно формировать обучающую выборку. На основе анализа работ, исследующих влияние различных факторов на стоимость недвижимости, определен

177

набор параметров для формирования обучающей выборки: район; количество комнат; этаж; количество этажей в доме; тип дома; площадь квартиры; вид реализуемого права.

Рис. 1. Схема использования нейросетевого подхода для оценки

стоимости квартир

Обработка обучающей выборки предполагает отсечение «экстремальных» объектов, имеющих слишком значительное отличие от среднего. В качестве такого показателя выбрана стоимость квадратного метра квартиры, отсекается 10% выборки. Следующий этап - кодирование факторов, таких как район, тип дома, вид реализуемого права.

Обучающая выборка построена для проектирования и обучения нейронной сети «с учителем» (рис. 3, 4), таким образом к реализации предполагается 3 типа сетей: многослойный персептрон (MLP) (табл. 1); сеть радиально-базисных функций (RBF); обобщенно-регрессионная нейронная сеть (GRNN).

В качестве инструментального средства проектирования нейронной сети была выбрана STATISTICA Neural Networks. Для обучения многослойных персептронов в пакете STATISTICA Нейронные сети реализовано пять различных алгоритмов обучения. Это хорошо известный алгоритм обратного распространения, быстрые методы второго порядка - спуск по сопряженным градиентам и Левенберга-Маркара, а также методы быстрого распространения и «дельта-дельта с чертой» (представляющие собой вариации метода обратного распространения, которые в некоторых случаях работают быстрее).

Информационные системы в решении прикладных задач На рис. 2 приведена структура построенной сети.

Рис. 2. Построенный многослойный персептрон

На первом скрытом слое находится 12 нейронов, на втором - 8. На обучение отводится 300 объектов из обучающей выборки, на контроль -30, на тестирование - 31. Обучение производится по методу обратного распространения ошибки.

Таблица 1

Параметры качества многослойного персептрона

Тип Обучение Контроль Тест

Средняя ошибка -7815.854 57316.31 -15922.77

Абсолютная средняя ошибка 149701.1 176512.5 203957

Коэф. Регрессии 0.1977065 0.2695267 0.2080191

Корреляция 0.9802613 0.9632102 0.9784249

Рис. 3. График ошибок обучения

179

ш DISTRICT ROOMS FLOOR FLOORS 1 HOUSE TY AREA TYPE

Rank 6 2 5 4 7 1 3

Error 217192.1 331559.7 222933.4 23S893.5 21073G 1090431 291839.6

Ratio 1.166342 1.780507 1.197173 1.282907 1.131633 5.355713 1.567206

Rank 5 23251t'. 4 2 6 4 7 1 3 392103.8

Error 407481.4 2300ЭВ 245453.9 217162.2 971354.8

Ratio 1.113009 1.950582 1.101413 1.174969 1.039539 4.6498 1.876971

Рис. 4. Анализ чувствительности для многослойного персептрона

Далее рассмотрим сеть радиально-базисных функций.

Обучение состоит из трех этапов: размещение центров радиальных элементов, выбор их отклонений и оптимизация линейного выходного слоя. Для первых двух этапов есть несколько вариантов работы алгоритма, выбор которых осуществляется в окне

Радиальная базисная функция (доступ через меню Обучение); наиболее популярным сочетанием является метод К-средних для первого этапа и К- ближайших соседей для второго. Линейный выходной слой оптимизируется с помощью классического алгоритма псевдообратных матриц (сингулярного разложения).

Программа 8ТЛТ18Т1СЛ Нейронные сети позволяет также строить гибридные РБФ-сети за счет выбора иных функций активации для выходного слоя (например, логистических), и в этом случае для обучения этого слоя можно использовать какой-либо из алгоритмов обучения многослойных персептронов, например, метод сопряженных градиентов.

Далее проиллюстрирована построенная РБФ-сеть (рис. 5, 6, 7, табл. 2).

Рис. 5. Визуализация сети радиально-базисных функций

180

Таблица 2

Показатели качества для сети РБФ

Тип Обучение Контроль Тест

Средняя ошибка -4.168e-09 130071 -60229.71

Абсолютная средняя ошибка 356535.5 397528.1 390934.1

Коэф. Регрессии 0.5297183 0.663065 0.4245094

Корреляция 0.8481737 0.7635921 0.9197465

Рис. 6. График ошибок обучения для РБФ-сети

DISTRICT ROOMS FLOOR FLOORS 1 HOUSE TY AREA TYPE

Rank 3 4 1 2 5 6 7

Error 2428729 4 .724126 1950826 3023525 2805964 1763747 686507 .4 506625 . 8 0.9854392

Ratio 3.794557 5.881068 5 .457888 3.430668 1.335327

Rank 3 4 1 2 5 6 7

Error 2272176 1787529 2978756 2515756 1704742 549649 ,1 499956 , 2

Ratio 4.599251 3.618449 6.029483 5.294713 3.450674 1.112579 1.012053

Рис. 7. Анализ чувствительности для РБФ-сети

Рассмотрим реализацию обобщенно-регрессионной нейронной сети.

Вероятностные (РМЫ) и обобщенно-регрессионные нейронные сети (ОЯМЫ) основываются на статистических методах ядерных оценок плотности вероятности и предназначены соответственно для задач классификации и регрессии. Их визуализация и основные характистики представлены на рис. 8, 9, табл. 3. Для них характерны простые и быстрые алгоритмы обучения, но получающиеся в результате нейросетевые модели оказываются большими и работают сравнительно медленно.

181

Рис. 8. Визуализация ОЯММ-сети

Таблица 3

Показатели качества для СЯМ№сети

Тип Обучение Контроль Тест

Средняя ошибка 30.27681 -22907.96 -339579

Абсолютная средняя ошибка 32448.87 282364.5 551109

Коэф. Регрессии 0.1093958 0.5734317 0.8128172

Корреляция 0.9939984 0.8192535 0.5831827

Q DISTRICT ROOMS FLOOR FLOORS 1 HOUSE TY AREA TYPE

Rank 4 1C779S.i 1.629946 1 3 2 6 7 5 146409.4 1.422172

Error 339620,1 216395,1 233677,2 142511,2 107715.7

Ratio 3,29 9552 2,101992 2.269372 1,324312 1.046312

Rank 4 530S15.3 1.240199 1 7 2 5 5 3 545207,2 1.273S25

Error 555914,4 391Ё30.7 545271,3 415231,3 43S252.5

Ratio 1,502574 0,915475 1.273974 0.9724S4B 1,023935

Рис. 9. Анализ чувствительности для ОЯММ-сети

Проведем совокупное сравнение полученных результатов (табл.

4, 5).

Таблица 4

Сравнение результатов работы различных сетей

Тип Обучение Контроль Тест

М] ЬР

Средняя ошибка -7815.80 57316.31 -15922.77

Абсолютная средняя ошибка 149701.10 176512.5 203957

Коэф. регрессии 0.19 0.26 0.20

Корреляция 0.98 0.96 0.98

РБФ-сеть

Средняя ошибка -4.168е-09 130071 -60229.71

Абсолютная средняя ошибка 356535.5 397528.1 390934.1

Коэф. регрессии 0.5297183 0.663065 0.43

Корреляция 0.84 0.76 0.92

ОК^-сеть

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Средняя ошибка 30.27681 -22907.96 -339579

Абсолютная средняя ошибка 32448.87 282364.5 551109

Коэф. регрессии 0.11 0.57 0.81

Корреляция 0.99 0.82 0.58

Таблица 5

Параметры построенных сетей

Туре 1прШ;8 НЫёеп НШеп(2)

ЯВБ 7 36 -

ОК^ 7 300 2

МЬР 7 12 8

ОЯМЫ-сеть показала очень хорошие результаты на тестовой выборке, в то время как на тестовой выборке ее эффективность оказалась значительно ниже, чему прочих рассмотренных сетей. Наиболее вероятным здесь событием является нерешенная проблема переобучения. То есть минимизировалась не та ошибка, которая ожидается от сети при подаче совершенно новых значений. Другими словами, у данной сети отсутствует способность обобщать результаты работы на новые наблюдения.

РБФ-сеть не продемонстрировала высоких результатов, однако несомненным ее достоинством является более высокая скорость обучения.

Многослойный персептрон является наиболее подходящим вариантом решения задачи определения стоимости жилых квартир. Полученные данные позволяют с достаточной точностью прогнозировать стоимость квартир по заданным параметрам.

Достаточно высокая точность полученных результатов является следствием тщательно сформированной обучающей выборки. Сравнение различных алгоритмов тренировки нейронной сети позволило выявить оптимальный алгоритм для имеющегося набора данных. При этом, следует заметить, что все изучаемые алгоритмы продемонстрировали сравнительно высокую точность предсказания результата.

В результате на основе нейросетевого подхода разработана методика, позволяющая производить определение рыночной стоимости квартир, аппробирована на базе данныхо «новостройках» города Тула.

Рассмотрены и реализованы 3 типа сетей: многослойный персептрон (MLP); сеть радиально-базисных функций (RBF); обобщенно-регрессионная нейронная сеть (GRNN). Многослойный персептрон является наиболее подходящим вариантом решения задачи определения стоимости жилых квартир. Полученные данные позволяют с достаточной точностью прогнозировать стоимость квартир по заданным параметрам.

Предложенный метод позволяет значительно сократить трудозатраты на определение стоимости типовых жилых квартир, учесть специфику территориального рынка недвижимости, снизить уровень субъективизма при принятии решения о стоимости квартиры. Методика может применяться как специализированными оценочными компаниями в своей текущей работе, банками, выдающими ипотечные кредиты, так и обычными пользователями, которые хотят определить возможную рыночную стоимость собственной либо интересующей квартиры. Применение данной системы может не только являться хорошим дополнением в работе эксперта-оценщика, позволяющим, кроме всего прочего, отслеживать возможные ошибки и делать неочевидные выводы. Кроме того, предложенный подход может являться фундаментом для исследования ситуации на рынке и прогнозирования цен на недвижимость.

Список литературы

1. Абдуллин М.В. Экспресс-Анализ Стоимости Недвижимости [Электронный ресурс]. URL: http://srgroup.ru/mc/services/express-analysis (Дата обращения: 10.05.2016).

2. Герасимов С.А. Моделирование нейронных сетей для оценки стоимости аренды объекта офисной недвижимости с наименьшей ошибкой. 2011. 192 с.

3. Сенашов С.И. Информационная система оценки стоимости квартир на вторичном рынке жилья как инструмент управления инвестициями // Вестник Сибирского государственного аэрокосмического университета имени академика М.Ф. Решетнева, 2009. С. 219-222.

4. Климов А.В. Современные методы оценки недвижимости [Электронный ресурс]. URL: http://www.bi-grouplabs.ru/Rech/nedvizh/nedv.html (Дата обращения: 13.05.2016).

5. Нейронныесети. Statistica Neural Networks: пер. с англ.. М.: Горячая линия - Телеком, 2015. 182 с.

6. Портал искусственного интеллекта [Электронный ресурс]. URL: http://www.aiportal.ru/ (Дата обращения 15.03.2017).

Арефьева Елена Анатольевна, доц., ar_el_an@,mail.ru, Россия, Тула, Тульский государственный университет,

Костяев Дмитрий Сергеевич, студент, ar_el_an@,mail.ru, Россия, Тула, Тульский государственный университет

USING NEURAL NETWORKS FOR EVAL UA TION OF MARKET COST OF REAL ESTA TE

E.A. Arefeva, D.S. Kostyaev

The article deals with the issue of development and research of methods for estimating the market value of real estate on the basis of the neural network approach.

Key words: real estate valuation, neural networks.

Arefeva Elena Anatol'evna, docent, ar_el_an@,mail. ru, Russia, Tula, Tula State Univesity,

Kostyaev Dmitriy Sergeevich, student, ar_el_an@,mail. ru, Russia, Tula, Tula State Univesity

i Надоели баннеры? Вы всегда можете отключить рекламу.