Научная статья на тему 'МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ'

МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
399
66
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ / МЕТОД КЛАССИФИКАЦИИ? SQL / ДЕРЕВО РЕШЕНИЙ / НАБОР ДАННЫХ / ИСТОЧНИК ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Кирьянова Екатерина Андреевна, Серебрякова Татьяна Александровна

В статье предоставлен обзор различных методов интеллектуального анализа данных, доступных для моделирования поведения. Рассмотрены основные концептуальные положения или принципы, позволяющие сформировать единую теоретическую базу построения систем интеллектуального анализа данных как инструмента управления

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Кирьянова Екатерина Андреевна, Серебрякова Татьяна Александровна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ»

УДК 001.51

Кирьянова Екатерина Андреевна

Магистр

Федеральное государственное бюджетное образовательное учреждение высшего образования

«Тихоокеанский государственный университет» (Россия, г. Хабаровск)

Серебрякова Татьяна Александровна

канд. экон. наук, доцент кафедры экономической кибернетики Федеральное государственное бюджетное образовательное учреждение высшего образования

«Тихоокеанский государственный университет» (Россия, г. Хабаровск)

МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

В статье предоставлен обзор различных методов интеллектуального анализа данных, доступных для моделирования поведения. Рассмотрены основные концептуальные положения или принципы, позволяющие сформировать единую теоретическую базу построения систем интеллектуального анализа данных как инструмента управления.

Ключевые слова: интеллектуальный анализ данных, метод классификации? SQL, дерево решений, набор данных, источник данных.

Развивающиеся информационные технологии увеличивают объем и уровень сложности хранимых информационных баз данных. В ходе чего, происходит ситуация когда с помощью традиционных методов анализа, образованных на теории информационного поиска и математической статистике, сложно извлечь нужную информацию. По этому, возникает надобность в автоматизированном анализе данных больших объемов. Для этого применяют системы интеллектуального анализа данных (ИАД), которые выявляют нетривиальные, скрытые, содержательные закономерности в больших объемах сложно структурируемых данных. ИАД связывает разные технологичные знания с совокупностью методов, присоединяя статистический анализ, методологию машинного обучения и искусственного интеллекта, поиск информации, технологичного построения и организованного построения хранилищ и баз данных, а также методов визуализации информации и модельной верификации. Эти технологии и методы в системах ИАД используются для решения классификационных, прогнозируемых задач, кластерного анализа, поиска подключений, выявления трендов и т.д.

ИАД можно выполнить с обычными системами баз данных и простыми инструментами, созданными собой, или с использованием готовых пакетов программного обеспечения. Сложный ИАД основывается на алгоритмах и прошлом опыте, которые определены с помощью существующего программного обеспечения и пакетов, с различными методами и специализированными инструментами.

Сейчас возможна работа с большими наборами данных и кластерной/крупномасштабной обработкой данных, которые позволяют делать еще более сложные результаты интеллектуального анализа данных по сопоставлениям данных и группам. Сегодня доступны совершенно новые комбинированные системы хранения и обработки данных, включающих спектр инструментов и систем.

Можно рассматривать самые различные наборы данных, с традиционными базами данных SQL, необработанными текстовыми данными, с наборами "ключ/значение" и документальной базой. Кластерные базы данных, такие как Couchbase Server, Hadoop, CouchDB и Cassandra, предоставляют доступ и хранят данные такими способами, которые не отвечают обычной табличной структуре.

Основные методы, которые применяются для ИАД, описывают тип анализа и операцию по восстановлению данных. К сожалению, разные компании и решения не всегда используют одни и те же термины, что усугубляют заблуждение и вероятную сложность.

Изучая более одного атрибута или класса, можно сгруппировать отдельные элементы данных вместе, чтобы получить структурированное заключение. При кластеризации на простом уровне, используется

один или несколько атрибутов в качестве исходных данных для определения кластера схожих результатов. Кластеризация подходит при определении разной информации, так как она коррелируется с прочими примерами, и можно увидеть, где подобия и диапазоны сходятся между собой.

Обширная тема прогнозирования простирается от предугадывания отказов компонентов оборудования до выявления мошенничества и даже прогноза доходов компании. Используясь с другими методами ИАД, прогнозирование предполагает анализ тенденций, сопоставление с моделью, классификацию и отношения. Анализируя исходные данные, прошлые события или экземпляры, можно прогнозировать будущее [3, с. 85].

Последовательные модели часто применяются для анализа долгосрочных данных, - это метод выявления тенденций, или систематичных повторений схожих событий.

Дерево решений связанно с большинством других методов (главным образом, классификации и прогнозирования). Его используют либо для критериев отбора или для поддержки определения некоторых данных в рамках общей структуры. Дерево решений начинается с простого вопроса, который имеет более двух вопросов. Каждый ответ приводит к следующему вопросу, классифицируя и идентифицируя данные.

Сам ИАД основывается на построении подходящей модели и структуры, которые используются для обработки, выявления и создания нужной информации. Информация структурируется и организуется в соответствии с форматом, позволяющим выполнять ИАД с максимально эффективной моделью.

Наиболее легким из всех подходов служит опора на базы данных SQL. SQL (и соответствующая структура таблицы) хорошо понятен, но строение и формат информации не игнорируется. Например, при исследовании поведения пользователей по любым данным в модели данных SQL (и ИАД в целом) существуют два основных формата, которые можно использовать: транзакционный и поведенческо-демографический.

Теперь моделирование - это составная доля общих подходов, которые характерны для современных информационных технологий. Значительно то, что моделирование позволило объединить неформальное и формальное мышление, а также сочетать способность ЭВМ во много раз эффективнее делать арифметические операции, отслеживать логику с удивительными качествами человеческого интеллекта

- интуицией, способностью к ассоциациям. [5, c.143]

Развивающиеся методы интеллектуального анализа данных, которые реализованы в очертании общей информационной системы, усиливают обоснованность принимаемых при управлении решений.

СПИСОК ЛИТЕРАТУРЫ:

1. Дворецкий С.И. Моделирование систем: учебник для студ. высш. учеб. заведений / С.И. Дворецкий, Ю.Л. Муромцев, В.А. Погонин, А.Г. Схиртладзе. - М. : Издательский центр «Академия»,

2009.-320с.

2. Афонин В. В. Моделирование систем.: учеб. практ. пособие для студ. / В.В. Афонин, С.А. Федосин

- М.: БИНОМ. Лаборатория знаний, 2010. - 231с.

3. Васильева Л.Н. Моделирование микроэкономических процессов и систем.: учеб.для вузов / Л.Н. Васильева, Е.А. Деева - М. : КноРус, 2011 .- 400с.

4. Советов Б.Я., Яковлев С.А. Моделирование систем: Учебник для вузов - 4-е изд. - М.: Высш. шк.,

2010. - 343с.

5. Колесов Ю.Б. Моделирование систем. Объектно-ориентированный подход : учеб. пособие для вузов / Ю.Б. Колесов, Ю.Б. Сениченков - СПб. : БХВ-Петербург, 2006. - 192с.

i Надоели баннеры? Вы всегда можете отключить рекламу.