Научная статья на тему 'Математическое моделирование процесса оценки стоимости аренды недвижимости с использованием искусственных нейронных сетей'

Математическое моделирование процесса оценки стоимости аренды недвижимости с использованием искусственных нейронных сетей Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
157
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НЕЙРОННАЯ СЕТЬ / DATA MINING / АНАЛИЗ ДАННЫХ / АРЕНДА НЕДВИЖИМОСТИ / РЕГРЕССИЯ / ГЕНЕТИЧЕСКИЙ АЛГОРИТМ / ИНФОРМАТИКА / МАШИННОЕ ОБУЧЕНИЕ / ОЦЕНКА СТОИМОСТИ / МОДЕЛИРОВАНИЕ / ЭКСТРАПОЛЯЦИЯ / NEURAL NETWORK / DATA ANALYSIS / REAL ESTATE RENTAL / REGRESSION / GENETIC ALGORITHM / INFORMATICS / MACHINE LEARNING / COST ESTIMATION / MODELING / EXTRAPOLATION

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Евсина В. А., Евсина В. А., Продан Е. А., Широбокова С. Н.

В данной статье рассматривается проблема определения стоимости аренды недвижимости. Обосновывается идея о минимизации функции абсолютной ошибки с использованием искусственных нейронных сетей. Особое внимание уделено процессу определения входных данных нейронной сети. В частности, рассмотрена проблематика определения таких параметров как благоустройство региона и помещения. В статье выяснены особенности определения весовых коэффициентов для определения технического оснащения помещения с использованием генетического алгоритма. Предложена модель архитектуры нейронной сети. Описана модель изменения весовых коэффициентов. По итогу произведена апробация модели на тестовых данных, а также описана модель корректировки данных с учетом динамики цен.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Евсина В. А., Евсина В. А., Продан Е. А., Широбокова С. Н.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mathematical modeling of the process of assessing the value of rental property using artificial neural networks

This article deals with the problem of determining the cost of renting real estate. The idea of minimizing the absolute error function using artificial neural networks is substantiated. Particular attention is paid to the process of determining the input data of the neural network. In particular, the problems of determining such parameters as the improvement of the region and premises. The article clarifies the features of determining the weight coefficients to determine the technical equipment of the room using a genetic algorithm. A model of neural network architecture is proposed. The model of change of weight coefficients is described. As a result, the model was tested on test data, and the model of data correction taking into account price dynamics was described.

Текст научной работы на тему «Математическое моделирование процесса оценки стоимости аренды недвижимости с использованием искусственных нейронных сетей»

Математическое моделирование процесса оценки стоимости аренды недвижимости с использованием искусственных нейронных сетей

В.А. Евсин, Е.А. Продан, В.А. Евсина, С.Н. Широбокова

Южно-Российский государственный политехнический университет (НПИ) имени М.И. Платова, Новочеркасск

Аннотация: В данной статье рассматривается проблема определения стоимости аренды недвижимости. Обосновывается идея о минимизации функции абсолютной ошибки с использованием искусственных нейронных сетей. Особое внимание уделено процессу определения входных данных нейронной сети. В частности, рассмотрена проблематика определения таких параметров, как благоустройство региона и помещения. В статье выяснены особенности определения весовых коэффициентов для определения технического оснащения помещения с использованием генетического алгоритма. Предложена модель архитектуры нейронной сети. Описана модель изменения весовых коэффициентов. По итогу произведена апробация модели на тестовых данных, а также описана модель корректировки данных с учетом динамики цен.

Ключевые слова: нейронная сеть, data mining, анализ данных, аренда недвижимости, регрессия, генетический алгоритм, информатика, машинное обучение, оценка стоимости, моделирование, экстраполяция.

Оценка недвижимости в настоящее время получает все большее значение для поддержания конкурентоспособности на рынке агентств недвижимости. Основной группой методов при проведении оценки являются методы сравнения, в ходе которых производится оценка недвижимости с точки зрения сравнения ее характеристик с существующими оцененными объектами, подробнее о которых в [1]. Для проведения подобной оценки может быть использован аппарат искусственных нейронных сетей [2-4]. Функционал качества прогноза в данном случае может быть основан на минимизации суммы квадратов отклонений и иметь следующую форму:

1 m ~

J(w) = 2 £ [CT - CT ]2 ^ min,

2 j=1

где CT - стоимость объекта фактическая, CT - стоимость объекта прогнозируемая, которая может быть выражена следующей формулой:

CT = IH * Wj + IR* w2 + DC * w3 + M * w4 + TS * w5 + LN* w6 + LT *w7 + e,

где IH - коэффициент благоустройства помещения, IR - коэффициент благоустройства региона, DC - удаленность от центра, M - материал помещения, TS - коэффициент технического оснащения квартиры, LN -долгота, LT - широта, s - случайная ошибка модели. С учетом представленных параметров функционал приобретает следующую форму:

J(w) = 22! [CT - (IH * w1 + IR * w2 + DC * w3 + M * w4 + TS * w5 + LN * w6 + LT * w7)] ^ min, параметры которой идентичны представленным ранее.

Для выявления интегральной оценки влияния t-го типа объектов инфраструктуры региона на стоимость объекта недвижимости необходимо вывести дифференциальное уравнение, описывающее данный процесс. Рассматривая связь между приращением аргумента AK', который представлен объектами t-го типа инфраструктуры региона, и приращением влияния AIR, можно вывести зависимость. Для восстановления данных следует провести процедуру интерполяции данных формулой Ньютона, подробнее о которой в [5,6], при которой зависимость будет иметь следующий вид:

IR(K) = IR0 + 2^(Ko,...,K)*(K -Kо)*...*(K -K— ),

i=1

где ¡Я' (К) - функциональная зависимость влияния от количества объектов данного типа, ¡Я0 - значение зависимости при отсутствии объектов данного типа, ¡Я'(К0,...,Кг) - разделенная разность /-го порядка для характеристики влияния. Для определения коэффициента благоустройства региона от влияния объектов '-го типа используется следующая зависимость:

т

¡Я = 2М( * е % * Ьп(К,),

'=1

где М - коэффициент влияния от объектов '-го типа, а - функция насыщения объектами '-го типа, г - усредненное расстояние до объектов, К - количество значимых объектов региона.

Интегральная оценка благоустроенности помещения складывается из оценки характеристических показателей помещения, а также показателей состояния предметов в помещении с учетом их качества и имеет вид:

IH = £WU *Cu +£^2, *C2, *(1 -^),

s=1 i=1

где IH - коэффициент благоустроенности помещения, W1s - весовой коэффициент s-го характеристического показателя, C1>s - степень качества s-го характеристического показателя, B2i - весовой коэффициент от наличия i-го предмета, C2ii - степень ценности i-го предмета, a2j - коэффициент износа. Коэффициент технического оснащения квартиры включает следующие данные: газовое обеспечение, наличие интернета, холодное водоснабжение, горячее водоснабжение, водоотведение, электричество. Для определения весовых коэффициентов от наличия каждого из компонент необходимо определить следующий функционал качества:

1 m

J(w) = - £ [CT - (k1* x1 + к2 * x2 +... + k7 * x7)]2 ^ min

2 j=1

0 < xi < 1 ,

£ Xi= 1

i

где i = 1, n - компоненты технического обеспечения, xt - весовой коэффициент i-й компоненты, к - коэффициент наличия i-й компоненты, причем:

(1, если помещение обеспечено i - м компонентом

kt Н .

[ 0, иначе

Данный функционал качества исходит из предположения, что наличие каждой компоненты положительно сказывается на стоимости недвижимости. Для решения данного функционала может быть использован аппарат генетических алгоритмов [7].

Хромосома может быть представлена в следующей форме:

Ch = ß;¿2;...;¿48;¿49],!!b ||= {0,1}.

В качестве начальной популяции принимаются наборы бинарных

данных, которые в десятичном представлении формируют допустимое

множество решений. Фитнес-функция модели имеет следующую форму:

т т ^Вес(Б1пАттау,)

ЕЕ = У (С т, - У---' * р,, ),

¿Г ' 100 "

где ЕЕ - фитнес-функция модели, Вес(БтАггауу) - десятичное представление у'-го параметра хромосомы, р, - значение у'-го параметра 1-й строки набора данных. В качестве модели селекции используется модель элитарного отбора по критерию минимальной фитнес-функции хромосом. Для определения генов новых потомков используется модель четырнадцати точечного кроссовера. Кроме того, с вероятностью 0.7 возникает мутация у рассматриваемой хромосомы. Условие выхода из процесса селекции имеет следующую форму:

Ex =

1

1, если — У | FFB. - FFB | < s или c _ ep = m _ ep

nT j

0, иначе

где FFB. - наиболее приспособленная особь j-й эпохи, FFB - усредненный

показатель наиболее приспособленных особей за последние «-эпох, s-максимальная ошибка модели, c ep - номер текущей эпохи, m_ep -максимальное количество эпох.

При построении нейронной сети используется оптимизация методом стохастического градиентного спуска, который имеет следующую форму:

St =V WJ (wt ), mt =Pmt-1 +(1 -Pi)5t

vt =p2vt_x + (1 в2 ) I ^t 12 ,

П вп (1 -в1

wt+1 = wt-~p=— (в1 wt - —в + л в ) Jvt + s 1 -в 1 -в

где 51 - градиент, т1 - момент расчета, п - темп обучения, Д, в2 - параметры обучения.

Сеть имеет входной, выходной слой, а также 10 скрытых слоев с конфигурацией количества нейронов в каждом: 7/7/64/128/64/8/6/5/4/3/2/1.

В качестве функции активации используется модель БЕЬи (масштабная экспоненциальная линейная единица), которая имеет следующую форму:

ЖШ (х) = Л\

х, если х > 0

\ае - а, иначе

В результате обучения модели сформирован график динамики средней абсолютной ошибки обучения, представленный на рис. 1. Результаты проверки модели на тестовых данных представлены на рис. 2.

Рис. 1. - Динамика изменения абсоютной средней ошибки обучения

Рис. 2. - Диаграмма распределения ошибки прогноза После обучения модели необходимо провести корректировку полученных результатов с учетом динамики средних цен на недвижимость по периодам. Для проведения данной корректировки может быть

использована адаптивная модель прогнозирования Брауна второго порядка, подробнее о которой в [8] и которая имеет следующую форму:

М (г + к) = А0 + А1 * к + А2 * к2, где г - текущее время, к - время упреждения. Порядок модели определяется априорно из предварительного анализа временного ряда и законов развития динамики рынка недвижимости, А0,А],А2 - коэффициенты регрессии. Для формирования модели необходимо определить коэффициенты методом парной регрессии, после чего итеративно исчислять ошибку прогнозирования и корректировать значения коэффициентов. Модель корректировки коэффициентов на каждой итерации имеет следующую форму:

У(г +1) = А0 + Ах*(г +1) + А2 *(г +1)2 е(г +1) = аЫ(у (г +1) - У(г +1))

А0 = А0 (г) + А,*(г +1) + А2*(г +1)2 + (1 -в)2* е(г +1), А1 = А1(г +1) + А2 *(г +1)2 + (1 -в)2 *е(г +1) А2 = А2*(г +1)2 + (1 -в)2* е(г +1)

где У(г +1) - прогнозируемое значение в (г+1) периоде, У (г +1) - реальное

значение в (г+1) периоде, е - ошибка модели, в - коэффициент обучения.

Данная модель позволит провести уточнение стоимости недвижимости с

учетом динамики цен.

Проектируемый модуль может быть использован в информационных системах по управлению недвижимостью, в частности, в распределенном реестре, применение искусственных нейронных сетей и математическое моделирование которого представлено в [9,10]. Дальнейшее проектирование модуля будет направлено на совершенствование модели нейронной сети.

Литература

1. Симионова Н. Е., Шеина С.Г. Методы оценки и технической экспертизы недвижимости. М.: ИКЦ "МарТ", 2006. 448 с.

2. Хайкин С. Нейронные сети. Полный курс. 2 изд. М.: Издательский дом "Вильямс", 2006. 1104 с.

3. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия. Телеком, 2002. 382 с.

4. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208 p.

5. Gautschi W. Numerical Analysis. 2 edition. Basel: Birkhäuser, 2012.

615 p.

6. Богуславский И. А. Полиномиальная аппроксимация для нелинейных задач оценивания и управления. 2 изд. М.: Физматлит, 2006. 208 с.

7. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия - Телеком, 2006. 383 с.

8. Munbaev K. Short-Memory Linear Processes and Econometric Applications. New Jersey: John Wiley & Sons Limited, 2011. 451 p.

9. Евсин В. А., Широбокова С.Н., Продан Е.А. Использование технологии распределенных реестров при проектировании информационной системы «Аренда недвижимости» с применением искусственных нейронных сетей // Инженерный вестник Дона, 2018, №1. URL: ivdon.ru/ru/magazine/archive/n1y2018/4655.

10. Евсин В.А., Широбокова С.Н., Евсина В.А., Продан Е.А. Математическое моделирование распределенного реестра в сфере аренды недвижимости как сети массового обслуживания // Инженерный вестник Дона, 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5078.

References

1. Simionova N. E., Sheina S.G. Metody otsenki i tekhnicheskoy ekspertizy nedvizhimosti [Methods of evaluation and technical expertise of real estate]. M.: IKTs "MarT", 2006. 448p.

2. Hajkin S. Nejronnye seti. Polnyj kurs. [Neural networks. A Comprehensive Foundation]. 2 izd. M.: Izdatel'skij dom "Vil'jams", 2006. 1104p.

3. Kruglov V.V., Borisov V.V. Iskusstvennye nejronnye seti. Teorija i praktika. [Artificial neural network. Theory and practice.] M.: Gorjachaja linija. Telekom, 2002. 382p.

4. Dean J. Big Data, Data Mining, and Machine Learning. Value Creation for Business Leaders and Practitioners. New Jersey: John Wiley & Sons Limited, 2014. 208p.

5. Gautschi W. Numerical Analysis. 2 edition. Basel: Birkhäuser, 2012.

615p.

6. Boguslavskiy I.A. Polinomial'naya approksimatsiya dlya nelineynykh zadach otsenivaniya i upravleniya [Polynomial approximation for nonlinear estimation and control problems]. 2 izd. M.: Fizmatlit, 2006. 208 p.

7. Rutkovskaja D., Pilin'skij M., Rutkovskij L. Nejronnye seti, geneticheskie algoritmy i nechetkie sistemy. [Neural networks, genetic algorithms and fuzzy systems] M.: Gorjachaja linija. Telekom, 2006. 383 p.

8. Munbaev K. Short-Memory Linear Processes and Econometric Applications. New Jersey: John Wiley & Sons Limited, 2011. 451 p.

9. Evsin V.A., Shirobokova S.N., Prodan Е.А. Inzenernyj vestnik Dona (Rus), 2018, №1. URL: ivdon.ru/ru/magazine/archive/n1y2018/4655.

10. Evsin V.A., Shirobokova S.N., Evsina V.A., Prodan Е.А. Inzenernyj vestnik Dona (Rus), 2018, №3. URL: ivdon.ru/ru/magazine/archive/n3y2018/5078.

i Надоели баннеры? Вы всегда можете отключить рекламу.