Научная статья на тему 'Технологии интеллектуального анализа данных как инструмент поддержки принятия решений в оценочной деятельности'

Технологии интеллектуального анализа данных как инструмент поддержки принятия решений в оценочной деятельности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
444
76
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ / БАЗЫ ДАННЫХ / НЕЙРОСЕТИ / ИНСТРУМЕНТЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ / ОЦЕНОЧНАЯ ДЕЯТЕЛЬНОСТЬ / DATA MINING / DATA MINING TECHNOLOGIES / BIG DATA / NEURAL NETWORKS / DECISION SUPPORT TOOLS / EVALUATION ACTIVITIES

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Смирнова Н. В.

В статье актуализирована значимость применения информационных технологий в системе поддержки принятия решений в различных областях экономики. Рассматривается возможность использования технологий интеллектуального анализа данных, как одного из инструментов поддержки принятия решений в оценочной деятельности. Раскрыта сущность и возможности нейросетевых технологий в извлечении и обработке больших данных. На примере оценочной деятельности показана возможность применения нейронных сетей для целей классификации объектов оценки по ценовым факторам и прогнозирования стоимости объекта.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Смирнова Н. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

TECHNOLOGIES OF INTELLECTUAL DATA ANALYSIS AS AN INSTRUMENT OF SUPPORT OF DECISION MAKING IN EVALUATION

Тhe article actualizes the importance of the use of information technology in the decision support system in various areas of the economy. The possibility of using data mining technologies as one of the decision support tools in valuation activities is being considered. The essence and capabilities of neural network technologies in the extraction and processing of big data are disclosed. The example of valuation activity shows the possibility of using neural networks for the classification of valuation objects by price factors and forecasting the value of the object.

Текст научной работы на тему «Технологии интеллектуального анализа данных как инструмент поддержки принятия решений в оценочной деятельности»

УДК 004.996

ТЕХНОЛОГИИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ КАК ИНСТРУМЕНТ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В ОЦЕНОЧНОЙ

ДЕЯТЕЛЬНОСТИ

Н.В.Смирнова

Ивановский государственный химико-технологический университет

В статье актуализирована значимость применения информационных технологий в системе поддержки принятия решений в различных областях экономики. Рассматривается возможность использования технологий интеллектуального анализа данных, как одного из инструментов поддержки принятия решений в оценочной деятельности. Раскрыта сущность и возможности нейросетевых технологий в извлечении и обработке больших данных. На примере оценочной деятельности показана возможность применения нейронных сетей для целей классификации объектов оценки по ценовым факторам и прогнозирования стоимости объекта.

Ключевые слова: технологии интеллектуального анализа данных, базы данных, нейросети, инструменты поддержки принятия решений, оценочная деятельность.

В результате развития информационных технологий количество данных, накопленных в электронном виде, растет быстрыми темпами. Эти данные существуют в различных форматах: тексты, изображения, аудио, видео, гипертекстовые документы, реляционные базы данных и т.д. Однако подавляющая часть доступной информации не несет какой-либо пользы, так как пользователь-специалист в той или иной области не в состоянии переработать такое количество сведений. Возникает проблема извлечения полезной для пользователя информации из большого объема данных [7].

Одним из инструментов, позволяющих решить эту проблему являются технологии DataMining (технологии интеллектуального анализа данных, ИАД) -технологии выявления значимых корреляций и тенденций в больших объемах данных, которые способны работать в условиях неполного описания объекта или процесса; недостаточности информации или ее отсутствии о характере связей между характеристиками объекта (процесса), а также между его характеристиками и внешними факторами; задержек в получении необходимых данных, связанных с нерациональной организацией их

управления (процессами сбора, подготовки и обработки)и пр.

Сейчас, технологии DataMining используются практически во всех сферах деятельности человека, где накоплены ретроспективные данные и, будучи эффективным инструментом поддержки принятия решений, позволяют с определенной степенью точности принимать эффективные управленческие реше-ния.Основные направления применения: банковское дело, финансы, страхование, CRM, производство, телекоммуникации, электронная коммерция, маркетинг, фондовый рынок и другие [9].

Классический пример применения DataMining в банковском деле - решение задачи определения кредитоспособности клиента банка. Без применения технологии DataMining задача решается сотрудниками банковского учреждения на основе их опыта, интуиции и субъективных представлений о том, какой клиент является благонадежным. Системы поддержки принятия решений и на основе методов DataMining на основе исторической (ретроспективной) информации и при помощи методов классификации выявляют клиентов, которые в прошлом не вернули кредит.

В сфере телекоммуникаций достижения DataMining могут использоваться для решения задачи, типичной для любой компании, которая работает с целью привлечения постоянных клиентов, - определения лояльности этих клиентов. Необходимость решения таких задач обусловлена жесткой конкуренцией на рынке телекоммуникаций и постоянной миграцией клиентов от одной компании в другую.

В сфере электронной коммерции DataMining применяется для формирования рекомендательных систем и решения задач классификации посетителей Web-сайтов. Такая классификация позволяет компаниям выявлять определенные группы клиентов и проводить маркетинговую политику, в соответствии с обнаруженными интересами и потребностями клиентов.

Основные задачи DataMining в промышленном производстве: комплексный системный анализ производственных ситуаций; краткосрочный и долгосрочный прогноз развития производственных ситуаций; выработка вариантов оптимизационных решений; прогнозирование качества изделия в зависимости от некоторых параметров технологического процесса; обнаружение скрытых тенденций и закономерностей развития производственных процессов; прогнозирование закономерностей развития производственных процессов; обнаружение скрытых факторов влияния; обнаружение и идентификация ранее неизвестных взаимосвязей между производственными параметрами и факторами влияния; анализ среды взаимодействия производственных процессов и прогнозирование изменения ее характеристик; выработка оптимизационных рекомендаций по управлению производственными процессами; визуализация результатов анализа, подготовка предварительных отчетов и проектов допустимых решений с оценками достоверности и эффективности возможных реализаций. Изучению также могут быть

подвержены динамические процессы, происходящие в региональной экономике по сферам и отраслям жизнедеятельности [1,2,11].

В сфере маркетинга и торговли DataMining находит очень широкое применение, например, алгоритмы поиска ассоциативных правил (для определения часто встречающихся наборов товаров, которые покупатели приобретают одновременно). Выявление таких правил помогает размещать товары на прилавках торговых залов, вырабатывать стратегии закупки товаров и их размещения на складах и т.д.; использование временных последовательностей, например, для определения необходимых объемов запасов товаров на складе; методы классификации и кластеризации для определения групп или категорий клиентов, знание которых способствует успешному продвижению товаров [3].

Современные реалии оценочной деятельности таковы, что развивается не только теория оценки стоимости, но и практические технологии, совершенствуются методы оценки, пополняются и становятся доступными различные базы данных. Современные оценщики вряд ли могут представить проведение оценки без специальных справочников по тем или иным ценовым показателям, информации аналитических агентств и сайтов о ценах и доходности различных активов. Оценка - это, прежде всего, работа с информацией. В оценочной деятельности технологии DataMining, при оценке стоимости объектов, позволят снизить издержки на всех этапах проведения оценочных работ, таких как поиск информации, ввод информации, расчет стоимости, формирование итоговых отчетных документов, экономический анализ результатов.

Таким образом, технологии интеллектуального анализа данных, независимо от области их применения (в производстве, бизнесе, медицине, образовании, оценке, страховании, других областях народного хозяйства) обеспечивают

должностных лиц (или лиц принимающих решение) информацией, необходимой для принятия решений в области его деятельности.

Рассмотрим более подробно технологии интеллектуального анализа данных (ИАД), применяемые в системах поддержки принятия решений.

В качестве первого направления средств ИАД следует выделить методы статистической обработки данных, которые можно разделить на четыре взаимосвязанных раздела:

• предварительный анализ природы статистических данных (проверка гипотез стационарности, нормальности, независимости, однородности, оценка вида функции распределения и ее параметров);

• выявление связей и закономерностей (линейный и нелинейный регрессионный анализ, корреляционный анализ);

• многомерный статистический анализ (линейный и нелинейный дискрими-нантный анализ, кластер-анализ, компонентный анализ, факторный анализ);

• динамические модели и прогноз на основе временных рядов.

Особое направление в спектре аналитических средств ИАД составляют методы, основанные на нечетких множествах. Их применение позволяет ранжировать данные по степени близости к желаемым результатам, осуществлять так называемый нечеткий поиск в базах данных.

Следующее крупное направление развития составляют кибернетические методы оптимизации, основанные на принципах саморазвивающихся систем -методы нейронных сетей, эволюционного и генетического программирования.

Непосредственно к кибернетическим методам ИАД примыкают синерге-тические методы. Их применение позволяет реально оценить горизонт долгосрочного прогноза. Особенный интерес вызывают исследования, связанные с попытками построения эффективных си-

стем управления в неустойчивых режимах функционирования.

К крупному разделу ИАД следует отнести совокупность традиционных методов решения оптимизационных задач -вариационные методы, методы исследования операций, включающие в себя различные виды математического программирования (линейное, нелинейное, дискретное, целочисленное), динамическое программирование, методы теории систем массового обслуживания.

В следующий раздел средств ИАД входят средства, которые условно называют экспертными, т. е. связанными с непосредственным использованием опыта эксперта. Например, подход, связанный с построением последовательного логического вывода - дерева решений, в каждом узле которого эксперт осуществляет простейший логический выбор («да» - «нет»). Одной из разновидностей метода деревьев решений является алгоритм деревьев классификации и регрессии, предлагающий набор правил для дихотомической классификации совокупности исходных данных. Данный метод обычно применяется для предсказания того, какие последовательности событий будут иметь заданный исход.

К экспертным методам следует отнести и предметно-ориентированные системы анализа ситуаций и прогноза, основанные на фиксированных математических моделях, отвечающих той или иной теоретической концепции. Роль эксперта состоит в выборе наиболее адекватной системы и интерпретации полученного алгоритма [4,6].

Более подробно стоит рассмотреть метод нейронных сетей (neuralnetworks) и изучить возможности их применения в оценочной деятельности как инструмента поддержки принятия решения при выведении оценочной стоимости объекта оценки, а именно, для целей классификации объектов оценки по ценовым факторам и прогнозирования стоимости объекта.

Одним из направлений применения оценки в РФ является кадастровая оценка объектов недвижимости и земельных участков для целей, предусмотренных законодательством Российской Федерации, в том числе для налогообложения.

При определении кадастровой стоимости используются методы массовой оценки, при которых осуществляется построение единых для групп объектов недвижимости, имеющих схожие характеристики, моделей определения кадастровой стоимости.

Для моделирования стоимости может быть использована методология любого из оценочных подходов: затратного, сравнительного или доходного. Выбор подхода или обоснованный отказ от его использования осуществляется исходя из особенностей вида разрешенного использования, назначения объектов недвижимости, а также достаточности и достоверности располагаемой рыночной информации, которые определяются по итогам анализа рынка недвижимости.

Сравнительный подход основан на сравнении цен сделок (предложений) по аналогичным объектам недвижимости. Сравнительному подходу отдается предпочтение перед другими подходами к оценке при развитости рынка объектов недвижимости и при достаточности и репрезентативности информации о сделках (предложениях) с объектами недвижимости. Сравнительный подход не используется или используется только для проверки результатов, полученных с применением иных подходов, при оценке объектов капитального строительства (ОКС), а также для отдельных групп (подгрупп) объектов недвижимости при оценке земельных участков и единых недвижимых комплексов (ЕНК) в случае отсутствия рынка недвижимости.

Затратный подход основан на определении затрат, необходимых для приобретения, воспроизводства или замещения

объекта недвижимости. Для использования этого подхода необходимы актуальные и достоверные данные о соответствующих затратах. Затратный подход используется при определении кадастровой стоимости ОКС.

Доходный подход основан на определении ожидаемых доходов от использования объектов недвижимости. Доходный подход рекомендуется применять при наличии надежных данных о доходах и расходах по объектам недвижимости, об общей ставке капитализации и (или) ставке дисконтирования.

С точки зрения применимости подходов и методов к определению кадастровой стоимости, наиболее часто используются методы сравнительного подхода. Сравнительный подход в массовой оценке осуществляется одним из следующих методов: метод статистического (регрессионного) моделирования, метод типового (эталонного) объекта недвижимости, метод моделирования на основе удельных показателей кадастровой стоимости (УПКС), метод индексации прошлых результатов.

Метод статистического (регрессионного) моделирования основан на построении статистической модели оценки. Под статистической моделью оценки понимается математическая формула, отображающая связь между зависимой переменной (кадастровая стоимость) и значениями независимых переменных (цено-образующие факторы объектов недвижимости). При определении кадастровой стоимости для каждой сформированной группы (подгруппы) объектов недвижимости осуществляется построение статистической модели, отражающей сложившиеся на рассматриваемом рынке закономерности ценообразования. Учитывая нелинейный характер большинства зависимостей на больших пространственных рынках, необходимо строить статистические модели с индивидуально определенным для каждого ценообразующего фактора видом функции влияния [6].

Оценку кадастровой стоимости объектов недвижимости можно значительно облегчить с помощью методов нейронных сетей(neuralnetworks).

Нейронная сеть - структура соединенных между собой нейронов, которая характеризуется топологией, свойствами узлов, а также правилами обучения или тренировки для получения желаемого выходного сигнала. С точки зрения машинного обучения, нейронная сеть представляет собой частный случай методов распознавания образов, дискриминантного анализа, методов кластеризации и т. п. С математической точки зрения, обучение нейронных сетей — это многопараметрическая задача нелинейной оптимизации.

Нейронные сети, в отличие от традиционных алгоритмов, не программируются, а обучаются. Возможность обучения является главным преимуществом нейронных сетей. Технический аспект обучения заключается в нахождении коэффициентов связей между нейронами. Во время обучения нейронная сеть самостоятельно способна находить сложные зависимости между входными данными и выходными, а также осуществлять обоб-

щение. Обобщение означает, что в случае удачного обучения нейронная сеть возвращает верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и (или) «зашумленных», то есть искаженных данных [8].

Способность к адаптации является фундаментальным свойством нейронных сетей. Непосредственно процесс обучения нейронной сети может быть рассмотрен как коррекция распределенного информационного поля сети в соответствии с запрашиваемой функциональной зависимостью выходного вектора от значений входного вектора нейронной сети. Изменениям подлежат веса взвешенных связей (в большинстве методов) и топология искусственной нейронной сети.

Интеллектуальный анализ данных (datamining), основанный на нейронной сети, состоит из [5]: подготовки данных, извлечения правил и оценки правил, то есть трех этапов, как показано на рис. 1.

Р..........

Исходные данные

Полезные правила

Рис. 1. Процесс анализа данных, основанный на нейронной сети

?

Оцеша правил

Процесс подготовки данных должен определить и обработать добываемые данные, чтобы сделать их пригодными для конкретных методов интеллектуального анализа. Как правило, подготовка данных включает в себя: очистку данных (заполнить вакантные значения данных, устранить зашумленные данные и исправить несогласованность в данных); выбор данных (определить расположение используемых в данном анализе данных); предварительную обработку дан-ных(расширение процесса очистки данных); выражение данных (преобразование данных после предварительной обработки в форму, которая может быть принята по условию алгоритма анализа данных, основанного на нейронной сети).

Следующий этап - извлечение правил. Существует множество методов извлечения правил, среди которых наиболее часто используются LRE (LimitedRelativeError) метод, метод черного ящика, метод извлечения нечетких правил, метод извлечения правил из рекурсивной сети, алгоритм извлечения правил двоичного входа и выхода (BIO-RE), алгоритм частичного извлечения правил (Partial-RE) и алгоритм полного извлечения правил (Full-RE).

Заключительный этап - правила оценки. Правила оценки могут быть определены в соответствии со следующими задачами:

1) найти оптимальную последовательность извлечения правил. Сделав это, получим лучшие результаты в ряде определенных данных;

2) проверить точность извлеченных правил;

3) определить количество знаний в нейронной сети, которые не были извлечены;

4) определить противоречия между извлеченными правилами и обученной нейронной сетью.[4]

Нейронные сети входят в состав большинства известных библиотек программного обеспечения. Мы воспользу-

емся№ига1Ехсе1 - это аналитическая надстройка для MicrosoftExcel, позволяющая работать с нейронными сетями. Простая в использовании надстройка позволяет быстро сконфигурировать и обучить нейронную сеть прямо в среде MicrosoftExcel. Надстройка позволяет использовать обученные сети как непосредственно в MicшsoftExcel, так и интегрировать их в свои собственные приложения [10].

№ига1Ехсе1 позволяет рассчитывать кадастровую стоимость объектов недвижимости при наличии ценообразующих факторов (входных параметров). Система на основе показателей просчитывает стоимость, затем, при необходимости, ошибка минимизируется и выдается выходной параметр - кадастровая стоимость.

Для выгрузки в нейронную сеть необходимо отобрать данные, оказывающие влияние на кадастровую стоимость. На стоимость объектов недвижимости влияют различные факторы. Цено-образующие факторы - многообразие условий, в которых формируются структура и уровень цены. Все ценообразую-щие факторы разделяются на три группы:

1. факторы, характеризующие внешнюю среду объектов недвижимости;

2. факторы, характеризующие непосредственное окружение и сегмент рынка объектов недвижимости;

3. факторы, характеризующие объект недвижимости.

Для анализа были выбраны следующие ценообразующие факторы, по которым имеется возможность собрать базу данных, отвечающую принципам непротиворечивости, достаточности и репрезентативности рыночной информации: площадь объекта недвижимости, этаж, год постройки, район местоположения.

Вполне очевидно, что при оценке недвижимости площадь является объективной и неоспоримой причиной формирования стоимости, так как во многих случаях цена назначается за квадратный

метр. Чем большей будет жилищная площадь, тем более высокую стоимость недвижимость будет иметь.

Этаж также влияет на стоимость квартиры. Условное разделение этажей на: первый, последний и все остальные. Квартиры, расположенные на первом этаже обычно либо значительно дороже (зависит от расположения дома и от возможности использовать помещение под коммерческие цели), либо на 5-10% дешевле. Дешевизна связана с сыростью и холодом, шумом с улицы, темноты из-за деревьев, а также с повышенной вероятностью кражи имущества. Последний этаж, как правило, дешевле остальных (до 10% стоимости). Стоимость последнего этажа связана с проблемами с крышей и потолками (протекание крыши от дождей и снега).

Остальные этажи в многоквартирном доме - находятся в одном ценовом диапазоне.

Исключения составляют те верхние этажи в новых эксклюзивных домах, из окон квартир которых открываются потрясающие пейзажи (так называемые видовые квартиры).

Год постройки напрямую влияет на износ дома. Чем выше износ, тем дешевле будет стоимость квартиры. Существует категория ветхих домов или домов под снос, цена на квартиры в домах данных категорий в разы ниже средней.

Квартиры, находящиеся в районах с развитой инфраструктурой, пользуются большим спросом и, соответственно, имеют более высокую цену. Также влияет удачное расположение дома, т.е. удаленность от дорог, наличие парковки, близость к паркам и водоемам. Слабо развитая инфраструктура микрорайона, отсутствие возле дома магазинов, аптек,

школ и детских садов, гаражей и автостоянок, замусоренная обстановка, криминальный район и т. д. понижают цены на недвижимость.

Преобразование данных после предварительной обработки в форму, которая может быть принята по условию алгоритма анализа данных, основанного на нейронной сети, необходимо для фактора - «Район». Факторы «Площадь», «Этаж» и «Год постройки» выражаются в числовом значении и преобразования не требуют. Произведем кодировку качественных параметров - присвоим каждому району порядковый номер:

1. Ленинский район - 1

2. Фрунзенский район - 2

3. Советский район - 3

4. Октябрьский район - 4 Таким образом, на основеинфор-

мации из открытых данных Федеральной службы государственной регистрации, кадастра и картографии (Росреестр) сформирована база данных по ценообра-зующим факторам и кадастровой стоимости объектов недвижимости (квартир) г. Иваново, переведенными в количественное выражение и готовыми к загрузке в аналитическую надстройку для MicrosoftExcel, №игаШхсе1, позволяющую работать с нейронными сетями.

Первоначальная база данных состояла из 110 объектов, которая была подвергнута очистке с помощью нейросетевой методики выявления и устранения выбросов.

Таким образом, были обнаружены выбросы - объекты с чрезмерно завышенной или заниженной стоимостью квартир. Очищенное множество (109 объектов) было разбито на обучающую и тестовую выборку (90/10) (рис. 2 и 3).

В *}' Лист Microsoft Office Excel - Excel Работа с диаграммами

Файл Главная Вставка Разметка страницы Формулы Данные Рецензирование Вид Bloomberg Neural Excel Конструктор Формат 9 Что вы хотите сделать?

Примеры данных'

^Доп. Мастер Менеджер обучения нейросетей

Нейронные сети

юлнительнот

Диаграм... т

А в С О Е Р G H I j К L M N О Р Q R

1 площадь этаж год посгр район район (число) стоимость

2 42.7 3 1966 Октябрьский 4 1101430

3 38.8 4 2008 Ленинский 1 1473267

4 52.9 5 1968 Ленинский 1 1592815

5 49.8 4 1975 Ленинский 1 1430386

6 65.3 4 1979 Ленинский 1 2008375

7 72.6 1 1988 Ленинский 1 2064693

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

S 57.1 3 1959 Фрунзенский 2 1 728 263

9 41.4 3 1963 Фрунзенский 2 1326 234

1Ü 42.1 4 1962 Фрунзенский 2 1209 683

И 46.5 1 1951 Фрунзенский 2 1137154

12 66.2 5 1980 Ленинский 1 2150 737

13 31.2 4 1963 Ленинский 1 1099284

14 66.6 3 1996 Ленинский 1 1998137

15 66.2 4 1990 Ленинский 1 2 201455

16 59.5 2 1917 Ленинский 1 875823

17 35.5 3 1975 Ленинский 1 1321249

13 43.1 1 1973 Ленинский 1 1428 352

19 40.9 1 1970 Советский 3 746505

20 43.8 2 1979 Октябрьский 4 1372858

21 44.4 Э 1979 Октябрьский 4 1 302 418

22 59.0 5 1983 Октябрьский 4 1802190

Рис.2 Обучающая выборка

В Л

Файл Главная Вставка Разметка страницы Формулы Данные Рецензирование Вид Bloomberg Neural Excel О

П

ополнительно4

Щд Примеры данных т

Мастер Менеджер обучения нейросетей

Нейронные сети

л А В с Е 13 Ll_ H I J К-

1 площадь этаж год г остр район район (число) стоимость (эталон) стоимость

2 63.0 1 1380 Ленинский 1 1920140 1884240

3 54.3 1 1317 Октябрьский 4 344 312 517997,6

4 41.6 5 2009 Ленинский 1 1467 335 1246794

5 68.2 6 1987 Фрунзенский 2 2129 570 2152291

Рис.3 Тестовая выборка

C помощью NeuralExcel выполнялось проектирование нейронной сети, ее обучение, оптимизация и тестирование. Оптимальная структура нейронной сети

представляла собой персептрон, имеющий 4 входных нейрона, один скрытый слой с 19 нейронами и один выходной нейрон (рис. 4 и 5).

Neural Excel - мастер обучения

X

L

Настройка процесса обучения нейронной сети

Нейроны в слоям Входном:

Скрытых слоев:

Выходном:

№ слоя Нейронов

1 19

Дополнительные параметры

Использовать автоподбор структуры

Кривнзна сигмоиды:

iJr.

1 0.5 0 Сигмоида

; -

5 -4.5 -4 -3.5 -3 -2.5 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

Назад Далее Выход

Рис. 4 Настройка процесса обучения нейронной сети

Тип сети Метод обучения Кривизна сигмоиды Автоподбор структуры

№ слоя Тип слоя

Количество нейронов

№ слоя Тип слоя

Количество нейронов

№ слоя Тип слоя

Количество нейронов

персептрон Resilient Propagation

2

нет

входной

4

скрытый 19

выходнои 1

Рис.5 Конфигурация сети

Слишком большие ошибки получились в примерах с чрезвычайно заниженной либо завышенной стоимостью квартир. Данный факт объясняется тем, что, например, год постройки одного из

домов, в котором выявилась большая ошибка, 1917г., дом считается ветхим и поэтому стоимость на квартиру значительно ниже среднего (рис. 6).

600000 500000 400000 300000 200000 100000 0

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61 65 69 73 77 81 85 89 93 97 101105 Рис. 6 Расхождения стоимости объектов недвижимости

После оптимизации и обучения нейронной сети ее прогностические свойства проверялись на примерах тестирующего множества, которые в процессе

обучения не участвовали. Средняя относительная ошибка тестирования нейронной сети, не превысила 3 %.

Количество эпох обучения 200

Максимальная ошибка 0,18573

Средняя ошибка 0,03187

Рис.7 Итоги обучения

После оптимизации и обучения нейронной сети ее прогностические свойства проверялись на примерах тестирующего множества, которые в процессе обучения не участвовали. При количестве эпох обучения - 200, максимальная ошибка обучения составила 18,6%, средняя относительная ошибка тестирования нейронной сети, не превысила 3%.

Итак, на основе нейронной сети, являющейся одним из инструментов интеллектуального анализа данных, была предпринята попытка использовать нейросетевое моделирование для поддержки принятия решений относительно оценки кадастровой стоимости объектов недвижимости. Речь не идет об отказе от традиционных методов массовой оценки, но дает почву для размышления о воз-

можности использования альтернативных методов с использованием инструментов ИАД для автоматизации оценки с использованием нейросетевых технологий для поддержки принятия решений относительно выведения итоговой величины стоимости объекта.

На основании вышеизложенного можно заключить, что применение методов обработки информации на основе интеллектуального анализа данных предназначенных для поддержки принятия решений в условиях неопределенности, является актуальной и практически значимой задачей.

ЛИТЕРАТУРА

1. Гонова О. В.,Малыгин А. А.,Воробьева О. К. Информационный процесс параметрического мониторинга оценки устойчивости производства продукции сельского хозяйства./ Статистика в цифровой экономике: обучение и использование: Материалы международной научно-практической конференции (Санкт-Петербург, 1-2 февраля 2018 г.), Издательство СПб ГЭУ, 2018. - С. 183-185.

2. Гонова О.В. Методы и модели диагностики устойчивого развития регионального агро-продовольственного комплекса. Автореферат диссертации на соискание ученой степени доктора экономических наук / Ивановский государственный химико-технологический университет. Иваново, 2012. - С.18-20.

3. Дорогов А.Ю., Алексеев А.А., Шестопа-лов М.Ю. Разделяющая мощность слабосвязанных нейронных сетей. // Текст научной статьи по специальности «Математика». [Электронный ресурс].

URL:https://cvberleшnka.щ/article/n/razdelvavuscha уа-пю5с1то51-51аЬо5УУа/аппу1ьпсугоптИ-5с1су (дата обращения 01.05.2019)

4. Корнеев С. Системы поддержки принятия решений в бизнесе. [Электронный ресурс]. // Сети и бизнес №6(25), 2005, URL: http://www.sib.com.Ua/arhiy_2005/6_2005/svstems/s vstems.htm

5. Манжула В.Г., Федяшов Д.С. Нейронные сети Кохонена и нечеткие нейронные сети в интеллектуальном анализе данных // Фундаментальные исследования. [Электронный ресурс] -2011. - № 4. - С. 108-115; URL:https://fundamenta1-

research.ru/ru/artic1e/yiew?id=21239(дата обращения: 08.11.2019)

6. Методология измерений и структурная эволюция региональной экономики: тенденции развития в XXI веке [монография] / А.Н. Ильченко, А.Н. Петров, О.В. Гонова, Н.С. Рычихина, С.В. Кузнецова, Л.Р. Бегларян; Иван.гос.хим.-технол.ун-т. - Иваново, 2018. - С. 9-18, 155-182.

7. Чернышова Г.Ю. Интеллектуальный анализ данных: учеб.пособие для студентов / Саратовский государственный социально-экономический университет. [Электронный ресурс] - Саратов, 2012. - 92 с. URL: http://www.seun.ru/content/learning/4/science/2 /doc/%D0%98%D0%BD%D1%82%D0%B5%D0% BB%D0%BB%D0%B5%D0%BA%D1%82%D1%8 3%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B %D0%B9%20%D0%B0%D0%BD%D0%B0%D0% BB%D0%B8%D0%B7%20%D0%B4%D0%B0%D0 %BD%D0%BD%D1%8B%D 1%85.pdf

8. Чубукова И.А. DataMining. - Курс на платформе национальный открытый университет ИНТУИТ. [Электронный ре-сурс]URL :https://www.intuit.ru/studies/courses/6/6/i nfo

9. Шапот М., Рощупкина В. Интеллектуальный анализ данных в системах поддержки решений. //Открытые системы № 1, 1998 с.30-35

10. NeuralExcel. [Электронный ресурс]. URL: http://www.neurotechlab.ru/software/neural-excel (дата обращения: 01.05.2019)

11. Смирнова Н.В., Сафина О.В. Оценка качества банковских услуг// Современные наукоемкие технологии. Региональное приложение -2017. - №2. - С. 64-68

Рукопись поступила в редакцию 11.09.2019г.

JEL code C45, C81, R 33

TECHNOLOGIES OF INTELLECTUAL DATA ANALYSIS AS AN INSTRUMENT OF SUPPORT OF DECISION MAKING IN EVALUATION

N.Smirnova

The article actualizes the importance of the use of information technology in the decision support system in various areas of the economy. The possibility of using data mining technologies as one of the decision support tools in valuation activities is being considered. The essence and capabilities of neural network technologies in the extraction and processing of big data are disclosed. The example of valuation activity shows the possibility of using neural networks for the classification of valuation objects by price factors and forecasting the value of the object.

Keywords: Data Mining, data mining technologies, Big data, neural networks, decision support tools, evaluation activities.

References

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Gonova O. V.,Malygin A. A.,Vorobeva O. K. Informatsionnyy protsess parametricheskogo monitoringa otsenki ustoychivosti proizvodstva produktsii selskogo khozyaystva./ Statistika v tsifrovoy ekonomike: obuchenie i ispolzovanie: Materialy mezhdunarodnoy nauchno-prakticheskoy konferentsii (Sankt-Peteiburg, 1-2 fevralya 2018 g.), Izdatelstvo SPb GEU, 2018. - S. 183-185.

2. Gonova O.V. Metody i modeli diagnostiki ustoychivogo razvitiya regionalnogo agroprodovolstvennogo kompleksa. Avtoreferat dissertatsii na soiskanie uchenoy stepeni doktora ekonomicheskikh nauk / Ivanovskiy gosudarstvennyy khimiko-tekhnologicheskiy universitet. Ivanovo, 2012. - S.18-20.

3. Dorogov A.YU., Alekseev A.A., SHestopalov M.YU. Razdelyayushchayamoshchnost' slabosvyazanny-hnejronnyhsetej. // Tekstnauchnojstat'ipospecial'nosti «Matematika». [Elektronnyjresurs]. URL:https://cyberleninka.ru/article/n/razdelyayuschaya-moschnost-slabosvyazannyh-neyronnyh-setey (дата обращения 01.05.2019)

4. Korneev S. Sistemypodderzhkiprinyatiyareshenij v biznese. [Elektronnyjresurs]. // Setiibiznes №6(25),

2005, URL: http://www.sib.com.ua/arhiv_2005/6_2005/systems/systems.htm

5. Manzhula V.G., Fedyashov D.S. NejronnyesetiKohonenainechetkienejronnyeseti v intellektual'nomana-lizedannyh // Fundamental'nyeissledovaniya. [Elektronnyjresurs] - 2011. - № 4. - S. 108-115;URL:https://fundamental-research.ru/ru/article/view?id=21239(дата обращения: 08.11.2019)

6. Metodologiya izmereniy i strukturnaya evolyutsiya regionalnoy ekonomiki: tendentsii razvitiya v XXI veke [monografiya] / A.N. Ilchenko, A.N. Petrov, O.V. Gonova, N.S. Rychikhina, S.V. Kuznetsova, L.R. Beglaryan; Ivan.gos.khim.-tekhnol.un-t. - Ivanovo, 2018. - S.155-182.

7. CHernyshova G.YU. Intellektual'nyjanalizdannyh: ucheb. posobiedlyastudentov / Saratovskijgosudar-stvennyjsocial'no-ekonomicheskijuniversitet. [Elektronnyjresurs] - Saratov, 2012. - 92 s. URL:http://www.seun.ru/content/learning/4/science/2/doc/%D0%98%D0%BD%D1%82%D0%B5%D0% BB%D0%BB%D0%B5%D0%BA%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D1%8B %D0%B9%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7%20%D0%B4%D0%B0%D0 %BD%D0%BD%D1%8B%D 1%85.pdf

8. CHubukova I.A. Data Mining. - Kursnaplatformenacional'nyjotkrytyjuniversitet INTUIT. [El-ektronnyiresurs]URL:https://www.intuit.ru/studies/courses/6/6/info

9. SHapot M., Roshchupkina V. Intellektual'nyjanalizdannyh v sistemahpodderzhkireshenij. //Otkrytyesistemy № 1, 1998 s.30-35

10. Neural Excel. [Elektronnyjresurs]. URL: http://www.neurotechlab.ru/software/neural-excel (дата обращения: 01.05.2019)

11. Smirnova N. V., Safina O. V. Assessment of the quality of banking services / / Modern science-intensive technologies. Regional application-2017. - No. 2. - C . 64-68

i Надоели баннеры? Вы всегда можете отключить рекламу.