УДК 004.042
Серкебаева Л. Т. старший преподаватель кафедра информационных систем Костанайский государственный университет им.А.Байтурсынова Казахстан, г.Костанай ПРИМЕНЕНИЕ ИНСТРУМЕНТОВ ВИЗУАЛИЗАЦИИ ДЛЯ АНАЛИЗА ДАННЫХ
Аннотация: в статье дается понятие анализа данных; приведены типы методов визуализации; описаны функциональные возможности аналитической системы Deductor Academic: применение методов визуализации для анализа числовых данных в конкретной предметной области.
Ключевые слова: анализ данных, визуализация данных, методы визуализации, аналитическая система, программная обработка данных
Существует достаточно большое количество различных методов анализа данных. Само понятие анализа данных можно рассматривать как процесс обработки информации и выявление в ней тенденций и моделей, которые помогают принимать решения. На сегодняшний день процесс выполнения анализа данных наиболее удобен с применением специализированных программных продуктов. Это, объясняется, в первую очередь экономией времени обработки больших массивов данных, и удобными средствами визуализации анализа.
Методы визуализации могут быть как самые простые (линейные графики, диаграммы, гистограммы и т.п.), так и более сложные, основанные на сложном математическом аппарате. Кроме того, при визуализации могут использоваться комбинации различных методов. Выделяют следующие типы методов визуализации:
- стандартные 2D/3D-образы - гистограммы, графики и т.п.;
- геометрические преобразования - диаграмма разброса данных, параллельные координаты и т.п.;
- отображение иконок - линейчатые фигуры и звёзды;
- методы, ориентированные на пикселы;
- иерархические образы - древовидные карты и наложение измерений.
В процессе анализа данных полезно сочетать вычислительные ресурсы
современных компьютеров с творческим и гибким человеческим мышлением.
Одним из программным продуктов, реализующих современные инструменты визуализации данных, является Deductor Academic.
Deductor - это аналитическая платформа, основа для создания законченных прикладных решений в области анализа данных. Реализованные в Deductor технологии позволяют пройти все этапы
построения аналитической системы: от консолидации данных до построения моделей и визуализации полученных результатов.
В Deductor вся работа ведется с использованием пяти мастеров. Одним из таких мастеров является мастер визуализации.
Визуализатором называется любое представление набора данных в каком-либо виде: табличном, графическом, описательном. Примеры визуализаторов: таблица, дерево, гистограмма, диаграмма, OLAP-куб и т.д.
Базовыми визуализаторами в Deductor являются следующие: таблица, статистика, сведения.
Рассмотрим пример анализа данных с использованием инструментов визуализации в среде Deductor Academic.
Сформируем исходный текстовый файл с числовыми данными для дальнейшего импорта данных в программу и последующего анализа в ней.
Используя мастер импорта данных, импортируем данные. Для 1 столбца «Районы» тип данных определим как строковый, для 2 столбца «Количество загрязняющих веществ» тип данных определим как вещественный. Нажав кнопку «Готово» получим исходные данные, представленные так, как показано на рисунке 1.
Рисунок 1 - Результаты импорта исходных данных
Режим отображения данных «Таблица». В режиме отображения данных «Таблица» активизируем кнопку «Показать онлайн статистику». В результате в нижней части рабочей области отобразится статистическая информация. Среднее количество загрязняющих веществ по Костанайской области в рассматриваемом периоде составило 24763,609 тонн. Проведем
фильтрацию данных с целью подсчета количества районов, в которых количество загрязняющих веществ соответственно ниже и выше среднего показателя по области. Для этого активизируем кнопку «Фильтрация» и настроим его соответствующим образом.
В итоге получаем, что в 18 регионов из 20 рассматриваемых количество загрязняющих веществ ниже среднего показателя по области. Соответственно в 2 регионах из 20 данный показатель выше среднего.
Режим отображения данных «Диаграмма». В данном режиме отображается удельный вес количества загрязняющих веществ каждого региона в процентах от общего по области. По данным диаграммы можно сказать следующее: наибольший удельный вес загрязненности наблюдается в г.Рудном - 77,44% от общего показателя по области и в Житикаринском районе - 16,48%. В г.Костанай - 1,93%, в остальных регионах удельный вес количества загрязняющих веществ ниже 1% от общего показателя по области.
Рисунок 2 - Режим отображения данных «Диаграмма»
Режим отображения данных «Гистограмма»
В режиме отображения данных «Гистограмма» мы группировка произведена по показателю «Количество загрязняющих веществ».
1» / и
11
17
14 1]
12
1»
10
•
в
«
«
4
«
9 □ □
1. U а
0
Я? И М044« №««8 151772 191772.227*» 22Г4» 5ÖJ2Ä «И» 3W5
Иигдодгм «Ii Чв1ы*4сгао_мг«я»м10а#и_вацжта
Рисунок 3 - Режим отображения данных «Гистограмма»
Количество загрязняющих веществ в интервале от 317,92 до 76044,8 тонн имеют 18 регионов области; в интервале от 76044,8 до 151772 тонн - 1 регион, в интервале от 303226 до 378953 тонн - 1 регион.
Таким образом, инструменты визуализации аналитической системы предназначены для оперативного анализа текущих настроек узлов и для поиска возможных ошибок.
Использованные источники:
1. Козлов, А.Н. Интеллектуальные информационные системы: учебник /А.Н. Козлов; Мин-во с-х. РФ, ФГБОУ ВПО Пермская ГСХА. - Пермь: Изд-во ФГБОУ ВПО Пермская ГСХА, 2013.- 278 с.
2. http://www.basegroup.ru - сайт технологий анализа данных.
УДК 544.653.2
Сикачина А.А.
аспирант кафедра химии
Балтийский Федеральный Университет имени И. Канта
Россия, г. Калининград КВАНТОВОХИМИЧЕСКОЕ И СТАТИСТИЧЕСКОЕ ИССЛЕДОВАНИЕ МЕХАНИЗМА ДЕЙСТВИЯ ОРГАНИЧЕСКИХ СОЕДИНЕНИЙ КАК ИНГИБИТОРОВ КОРРОЗИИ В публикуемой статье показана и проанализирована возможность взаимосвязи вычисленных посредством WinGAMESS квантово-химических дескрипторов молекулы и скоростью коррозии стали марки Ст3,