Научная статья на тему 'Нейросетевые технологии в земельном девелопменте'

Нейросетевые технологии в земельном девелопменте Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
53
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗЕМЕЛЬНЫЙ ДЕВЕЛОПМЕНТ / СТОИМОСТЬ СОТКИ ЗЕМЛИ / ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / НЕЙРОННЫЕ СЕТИ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Петрова Е.А., Солодовник А.В.

Рассматривается процесс создания информационной модели, способной по входным известным рыночным параметрам спрогнозировать стоимость земельного участка в городе, пригороде или Харьковской области. Показано использование метода Data Mining нейронная сеть, для определения стратегии поведения фирмы на рынке земли.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Петрова Е.А., Солодовник А.В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Нейросетевые технологии в земельном девелопменте»

Петрова Е. А. канд. тех. наук, доц., Солодовник А. В., канд. тех. наук, доц.

Харьковский национальный университет строительства и архитектуры

НЕЙРОСЕТЕВЫЕ ТЕХНОЛОГИИ В ЗЕМЕЛЬНОМ ДЕВЕЛОПМЕНТЕ

a.solodovnyk@gmail.com

Рассматривается процесс создания информационной модели, способной по входным известным рыночным параметрам спрогнозировать стоимость земельного участка в городе, пригороде или Харьковской области. Показано использование метода Data Mining - нейронная сеть, для определения стратегии поведения фирмы на рынке земли.

Ключевые слова: земельный девелопмент, стоимость сотки земли, интеллектуальный анализ данных, нейронные сети.

Постановка проблемы.

Уровень аналитической обработки данных в фирмах, занимающихся земельным деве-лопментом, и потребность в получении такими фирмами объективной информации о параметрах, влияющих на целевой показатель земельного девелопмента - стоимость сотки земли, определяет поведение фирмы на рынке. Поэтому актуальной задачей является разработка информационной модели, способной по входным известным рыночным параметрам спрогнозировать стоимость земельного участка в городе, пригороде или Харьковской области. Одним из способов решения такой задачи являются средства и методы обработки данных Data Mining [1,2]. Data Mining - это процесс обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности

[3].

Краткий анализ последних достижений и публикаций. В современных условиях экономического развития Украины за последние десятилетия наблюдался бурный рост компьютерных технологий, методов и моделей искусственного интеллекта, направленный на повышение эффективности и прибыльности бизнеса.

Информационные технологии позволяют решать сложные задачи экономического характера, связанные с анализом данных и принятием обоснованного управленческого решения. Известно, что для решения задач прогноза наряду с классическими методами статистического прогнозирования, моделирования, экспертного поиска решения, успешно используются нейросе-тевые технологии, представляющие перспективное направление развития искусственного интеллекта. Метод обнаружения данных - нейронные сети- используются в банковской сфере, промышленности, экономике, бизнесе, геологоразведке, управлении, транспорте и других областях [4].

Авторами статьи нейросетевая технология используется для повышения эффективности и прибыльности бизнеса. Для любой фирмы, которая занимается развитием земельных участков, актуальность решения задач прогнозирования очень высока, так как успех в рыночных условиях невозможен без ясного представления о перспективах и последствиях принимаемых решений.

В предлагаемой статье авторами использовано концепцию и технологию современного компьютерного анализа данных для прогнозирования цены сотки земельного участка, расположенного в городе, пригороде или области.

Задача прогнозирования решалась методом многослойных нейронных сетей. После эмпирического выбора архитектуры нейросети и ее обучения были получены прогнозные значения результативного признака - цены сотки земельного участка.

Постановка задачи. При использовании метода Data Mining авторы столкнулись с проблемой выбора значимых для модели входных признаков (в зарубежной литературе такая проблема известна как feature selection). Известно, что сокращение числа независимых переменных призвано уменьшить размерность модели не только с тем, чтобы удалить из нее все незначащие признаки, не несущие в себе какой-то полезной для анализа информации, и тем самым упростить модель, но и чтобы устранить избыточные признаки [1]. Авторы предположили, что с использованием нейронной сети формально нелинейный объект можно рассматривать как функцию зависимости цены сотки земли от таких показателей: расположение земельного участка, площадь земельного участка, целевое назначение земельного участка, права собственности на земельный участок, наличие дома, построек, наличие коммуникаций.

Методика нейросетевого прогнозирования стоимости сотки земельного участка представляет совокупность этапов, методов и правил,

которые обеспечивают задачу совершения прогноза.

Представленная база данных земельных участков хранит сведения и позволяет проводит бизнес-операции с недвижимостью. Сведения о цене сотки могут представлять интерес для выработки поведения при покупке земельного участка, исходя из целей покупки, будь-то участок для жилой постройки или для ведения дачного хозяйства, и района расположения участка.

Изложение основного материала. В качестве репрезентативной выборки для обучения

нейросети были выбраны 1000 записей про земельные участки в Харьковской области статистических баз данных ООО ИКК «Проконсул» и ООО «First Capital». С целью повышения эффективности обучения нейросети из характеристик земельных участков в качестве входных параметров отобраны наиболее значимые. В табл. 1 приведены отобранные характеристики земельных участков и их возможные значения или пояснения.

Таблица 1

№ Название Возможные значения

1 Харьков/область область, пригород, Харьков

2 Площадь общая площадь участка в сотках

3 Целевое назначение земельного участка для садоводства, жилая и индивидуальная застройка

4 Право на земельный участок приватизирован, не приватизирован

5 Наличие постройки имеется постройка, постройки нет

6 Коммуникации отсутствуют, рядом, частично и в плохом состоянии, частично, полностью в плохом состоянии, имеются полностью

Обработка исходных данных была проведена предварительно для устранения неточностей связанных с использованием характеристик имеющих большое количество вариантов текстовых значений. Так характеристики Право на земельный участок и Наличие постройки приобрели тип булевых переменных, а значения параметра Коммуникации были приведены к числовым в соответствии с табл. 2.

Таблица 2

Соответствия первоначальных значений обработанных характеристик числовым аналогам

Для моделирования входные данные были представлены в виде файла формата IX и импортированы в аналитическую платформу [1], в которой нейросетевые технологии представлены в виде нейронных сетей и их разновидности - карт Кохонена.

Был использован метод DataMining -нейронные сети, для определения прогнозного значения цены сотки земельного участка города, области и пригорода [2,3]. При импорте данных в аналитическую платформу Deductor в качестве входных полей выбирались: Харьков/область, площадь участка, целевое назначение, право на земельный участок, наличие построек, коммуникации, а выходным полем - цена за сотку.

На рис. 1 приведен фрагмент базы данных после импорта в аналитическую платформу.

Во время использования нейронных сетей предварительная обработка входных данных влияет на достоверность и точность прогноза не менее чем структура нейросети и способ обучения. Поэтому первым этапом сценария было уничтожение аномалий и сглаживание данных, приведенных в таблице (рис.1) с помощью парциальной обработки. На первом этапе нейросетевого прогнозирования цены сотки земельного участка определялись компоненты входного вектора Х и выходной вектор У. В данном случае на выходной показатель влияют такие независимые переменные: место расположения земельного участка, его площадь, наличие коммуникаций и построек на участке, целевое назначение участка, наличие права собственности на участок.

На втором этапе были определены назначения входных и выходного показателя и их нормализация. При построении нейросети настройка назначений полей выполнялась такая же, как и при импорте базы данных.

Первоначальное значение Числовое значение

Характеристика Коммуникации

отсутствуют 0

рядом 1

частично и в плохом состо- 2

янии

частично 3

полностью в плохом состо- 4

янии

имеются полностью 5

Характеристика Право на земельный участок

приватизирован 1

не приватизирован 0

Характеристика Наличие постройки

имеется постройка 1

постройки нет 0

Целью третьего этапа было обучение нейронной сети с выполнением следующих шагов:

]

- разбивка входного набора данных на обучающее и тестовое подмножество;

- обучение нейросети методом обратного распределения ошибок.

Таблица X | Статистика X | Диаграмма X |

м " Г 1,1

► н Ц -

Харьков/область [ лошадь сотка Целевое назначение ЗУ Права на з/у Общая стоимость Цена за сотку НаличиеСЬома.Опост

3 15 1 5500 367

3 21.5 1 П 1ЭЭЭЭ 330 □

3 25 1 □ 10000 400 □

2 6 1 П 7000 1167 □

2 15 1 6000 400 □

2 15 1 П 5000 333 □

2 15,5 1 □ 80000 5161

3 10 1 □ 3000 300 □

3 70 1 □ 100000 1429 □

2 15 1 □ 7300 527 □

3 15 1 ✓ 5200 347 □

3 15 1 □ 4000 267 □

3 17 1 □ 8000 471 □

3 20 1 □ 10000 500 □

3 21 1 □ 6333 333 □

2 10 1 * 11500 1150 □

2 20 1 V 15000 750 □

2 15 1 □ 15000 1000 □

2 25 1 □ 25000 1000 □

3 25 1 □ 10000 400 □

3 25 1 ✓ 8000 320 □

2 10,5 1 8500 810 □

2 15 1 П 6000 400 □

3 25 1 4200 168 □

2 10 П 5000 500 □

2 10 1 □ 10000 1000 □

2 20 1 ✓ 65000 3250 г

2 8 1 □ 16500 2063

2 10 1 □ 3000 300 □

2 14 1 □ 7000 500 □

2 15 1 ✓ 20000 1333 г

2 29 1 □ 16000 552 □

3 41 1 ✓ 45000 1038 □

3 10 1 V 10000 1000 □

3 10 1 □ 8000 800 □

Рис. 1. Импортированная база данных

В результате проведенного моделирования были получены следующие результаты: после обучения корректный прогноз был осуществлен на 98,1 % обучающей выборки и на 98 % тестовой выборки.

На рис.2 представлена нейросеть, в которой в качестве входных показателей использовались

5 показателей. Характеристика Целевое назначение было системой воспринято как неиспользуемое. Это можно объяснить тем, что цена сотки земельного участка, предназначенного под жилую застройку, и постройку дачи отличаются несущественно.

Грач» нейросети X Чтмсян X Обучающий набор X Диаграмма

X Таблш X | Статистика X | Диаграмма X

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Харьков/область

Площадь, сотка

Нал ич иеО дома, 0построек_0

Рис. 2. Граф нейросети

При вычислении прогнозного значения, в исходных данных, влияние которых производит визуализаторе «Что-если», определена вычисление показателя цены У (рис3). зависимость, путем сочетания различных

Граф нейросети X Что-если X Обучающий набор X Диаграмма рассеяния X

$ в/ + М (2 i"

1 из ЭЭЭ

Г»

Поле

Значение

- tjj] Входные

12 Харьков/область 1

9.0 Площадь, сотка 12

% Права на з/у False

a/l НаличиеОдомаД... False

12 Коммуникации 1

Выходные

Выбор модели — это решение. Следующий шаг состоит в том, чтобы использовать модель в реальной жизни. На четвертом этапе, на основании построенной нейросети, строился прогноз изменения цены сотки земельного участка при условии, что

9.0 Цена за сотку 4834,96146366799

Рис. 3. Визуализатор «Что-если» всегда бизнес- земельный участок выбран в пригороде Харькова площадью 15 соток с имеющимися постройками, коммуникациями и отсутствием права собственности на этот участок. Прогнозированное значение цены приведено на рис. 4.

Граф нейросети X

+ -4

Что-если X Обучающий набор X Диаграмма рассеяния X

ft ^ * м (2 Ш В А Ш -

1 из ЭЭЭ

Поле

Значение

й Входные

12 Харьков/область 2

9.0 Площадь, сотка 15

Права на з/у True

% НаличиеОдомаД... True

12 Коммуникации 5

9.0 Цена за сотку 1170,82139934913

Рис. 4. Прогноз нейросети

Харькова площадью 12 соток даже без наличия государственного права собственности, отсутствием построек и коммуникаций стоит в реальной жизни 5000 грн, а спрогнозированное значение равно 4835 грн.

Стоимость сотки выставленных на продажу реальных земельных участков с помощью фильтра отобрано из существующей базы данных и представлено на рис.5,6.

Необходимо отметить, что

спрогнозированное нейросетью значение стоимости сотки земли в пригороде с указанными показателями несущественно отличается от значения стоимости сотки

земельного участка в пригороде, выставленного на продажу (данные реальной базе данных 1333 грн.). Данные визуализатора «Что-если» (рис. 3) также подтверждают правильность работы

нейросети: земельный участок в центре

Операция Поле Условие Значение

9.0 Харьков/область = 2

И 9.0 Площадь, сотка = 8

И ®/l Права на з/у ложь

И НаличиеОдома,Опос... истина

И 9.0 Коммуникации = 51

Учитывать регистр

([Харьков/область] = 2) И ([Площадь, сотка] = 8) И ([Права на з/у] ложь) И | [ Н а л и ч и е Од и м а О п и ст р и е к ] истина) И ([Коммуникации] = )

Рис. 5. Настройка условий фильтра

Граф нейросети X | Что-еслн X Обучающий набор X Диаграмма рассеяния X | Таблица X Статистика X Диаграмма X

Щ " & т ■ - м <* I 1 ^

Целевое назначение ЗУ 1 Общая стоимость Цена за сотку Цена за с от к 01

► 1 □ 16500 2063 ✓ 5 1692,993563*

Рис. 6. Результат фильтрации

Выводы. В данной статье была освещена тема создания прогнозирующей модели на примере определения цены земельного участка и продемонстрировано решение проблем при помощи инструментов Data Mining платформы Deductor. Для построения модели была проведена предварительная обработка данных, а в дальнейшем применен математический метод анализа - нейронная сеть. Построенную модель можно использовать для принятия решений, пояснения причин, оценки значимости факторов, моделирования различных вариантов сценариев в сфере развития земельных участков различных форм собственности в Харькове и Харьковской области.

БИБЛИОГРАФИЧЕСКИМ СПИСОК

1. http ://www .basegroup.ru

2. Дюк В.А., Самойленко А.П. DataMining: учебный курс. СПб.: Питер, 2001. 368 с.

3. Чубукова И. А. Data Mining: Учеб. пособие. М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний, 2006. 382 с.

4. Паклин, Н. Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям (+CD) : учеб. пособие - 2-е изд., перераб. и доп. СПб.: Питер, 2010.704 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.