Хорсова А.В студент 2 курса Экономический факультет Южный Федеральный Университет Россия, г. Ростов-на-Дону ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ
Аннотация: Статья посвящена интеллектуальному анализу данных. Рассматриваются: процесс анализа, модели, основные методы и сферы применения.
Ключевые слова: интеллектуальный анализ данных, информация, ассоциация, искусственный интеллект, статистика, визуализация, прогнозирование.
DATA MINING
Abstract: The article is devoted to data mining. We consider: the process of analysis, models, basic methods and scope.
Keywords: data mining, information, association, artificial intelligence, statistics, visualization, prediction.
С каждым годом количество разнообразной информации увеличивается, в связи с этим возрастает популярность интеллектуального анализа. Работая с большими наборами данных, становится недостаточно относительно простой и прямолинейной статистики. Возникла необходимость перехода от простого поиска и статистического анализа данных к более сложному интеллектуальному анализу данных, который позволит построить такую модель для описания информации, которая в конечном итоге приведет к созданию результирующего отчета.
Интеллектуальный анализ данных (ИАД)— мультидисциплинарная область, на (рис.1) представлена совокупность наук, которые обеспечили возникновение интеллектуального анализа.
интеллектуального анализа данных. [1]
Качественная обработка информации, выявление в ней закономерностей и трендов для принятия правильного своевременного решения - основные задачи интеллектуального анализа. Эти закономерности
и тренды можно собрать вместе и определить, как модель интеллектуального анализа данных. Модели интеллектуального анализа данных применяются к конкретным сценариям (рис.2).
Главным достоинством интеллектуального анализа является возможность представлять результаты вычислений наглядно, это позволяет использовать инструментарий людьми, которые не имеют специальной математической подготовки. Выполнение интеллектуального анализа возможно с непрезентабельными системами баз данных и простыми инструментами, охватывая создание своих собственных, или же с использованием готовых пакетов программного обеспечения.
Прогнозирование
»оценка продаж;
»прогнозирование нагрузки сервера или времени простоя сервера.
Риск и вероятность
»выбор наиболее подходящих заказчиков для целевой рассылки;
»определение точки равновесия для рискованных сценариев;
»назначение вероятностей диагнозам или другим результатам.
Рекомендации
»определение продуктов, которые с высокой долей вероятности могут быть проданы вместе; »создание рекомендаций.
Рисунок 2 - Сценарии для интеллектуального анализа данных [2] На (рис.3) представлена схема процесса интеллектуального анализа данных. Первым шагом является определение проблемы. Особенность процесса ИАД - цикличность.
Рисунок 3 - Схема процесса [1]
Существует множество различных методов для интеллектуального анализа данных, позволяющих описать тип анализа и операцию по восстановлению данных. Рассмотрим основные методы ИАД. [3]
Ассоциация - наиболее простой и распространенный метод. Основывается на сопоставлении двух или более элементов одного и того же типа. Применяется при составлении шаблонов покупок в магазинах - анализ потребительской корзины. Например, отслеживая привычки покупки, можно заметить, что вместе с мобильным устройством обычно приобретают б1ш-карту. Информация, которую можно получить, благодаря такому анализу, поможет выработать маркетинговую или рекламную стратегию. [3]
Классификация - метод используемый для определения типа объектов по его характеристикам. Наиболее часто его применяют к покупателям, например, классифицируя их по полу, возрасту, доходу и социальному статусу.
Кластеризация - метод, который используется для поиска независимых кластеров и их характеристик во всем множестве анализируемых данных. Например, проведение анализа базы клиентов для дальнейшего формирования специальных предложений для выделенной группы.
Прогнозирование - метод, который основывается на анализе прошлых событий для более точного предсказания будущего. Наиболее часто его используют в период сезонных колебаний.
Последовательные модели - метод для анализа долгосрочных данных. Используется для выявления тенденций, или регулярных повторений подобных событий.
Деревья решений - метод, используемый в рамках критериев отбора, или же помощи выбора конкретных данных в рамках совместной структуры. Дерево решений начинается с вопроса, который содержит два или более ответов, затем каждый ответ приводит к следующему вопросу, тем самым этот метод помогает систематизировать и идентифицировать данные или же создавать прогнозы. [3]
На сегодняшний день интеллектуальный анализ везде, где имеются какие-либо данные - торговля, медицина, генная инженерия, телекоммуникации, банковская сфера и др. Он пользуются наибольшим
спросом у коммерческих предприятий, развертывающих проекты на основе информационных хранилищ данных. Благодаря интеллектуальному анализу, аналитики и руководители, получают значительные преимущества в конкурентной борьбе.
Использованные источники:
1. Чернышева Г.Ю. Интеллектуальный анализ данных. - Саратов: СГСЭУ, 2012. - с.92
2. Основные понятия интеллектуального анализа данных/Режим доступа: https://msdn.microsoft.com/ru-ru/librarv/ms174949(v=sql.120).aspx
3. Салмин А.А. Анализ данных. Конспект лекций. - Самара: ФГБОУ ВПО «ПГУТИ», 2013. - с.111
Худайбергенов Я.Г. ассистент кафедра «Географии» МамутовН.К., к.б.н.
доцент
кафедра «Экологии и почвоведения»
Ахмедова З. Т. студент 3 курса специальность «География» Каракалпакский государственный университет им. Бердаха
Республика Узбекистан ИСПОЛЬЗОВАНИЕ ГЕОГРАФИЧЕСКИЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ (ГИС) В ГЕОГРАФИИ
Аннотация
В статье рассматриваются географические информационные системы (ГИС), который с успехом используется для создания карт основных параметров окружающей среды. В дальнейшем, при получении новых данных, эти карты используются для выявления масштабов и темпов деградации флоры и фауны.
Ключевые слова: планирования, землеустройства, информация, технология, мониторинг, эффективность.
С конца 70-х годов нашего столетия в мировой практике и науке стала усиленно развиваться технология по созданию систем для организации и хранения пространственных данных, получившая название "Географические информационные системы" (ГИС). Одновременно с развитием технологии развиваются и области ее применения. Учитывая их многообразие - от высококачественной картографии до планирования землеустройства, управления природными ресурсами, оценки и планирования состояния окружающей среды и т.д. можно с полной определенностью утверждать, что именно ГИС обещает стать одной из наиболее обширных сфер применения новых информационных технологий для решения задач управления.