Научная статья на тему 'СУЩЕСТВУЮЩИЙ ПРОГРАММНЫЙ КОМПЛЕКС ПЕРВИЧНОЙ ОБРАБОТКИ И АНАЛИЗА ДАННЫХ'

СУЩЕСТВУЮЩИЙ ПРОГРАММНЫЙ КОМПЛЕКС ПЕРВИЧНОЙ ОБРАБОТКИ И АНАЛИЗА ДАННЫХ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
138
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
«MS EXCEL» / «SPSS» / «SAS» / «STATA» / АНАЛИЗ ДАННЫХ / ДАННЫЕ / ПЕРВИЧНАЯ ОБРАБОТКА ДАННЫХ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Спиридонова К.С.

На сегодняшний день данные являются повсеместным ресурсом. Первичная обработка и анализ данных может быть достаточно трудоемок как по человеческим ресурсам, так и по временным. Целью исследования является анализ существующих программ с точки зрения функционала для первичной обработки и анализа данных. Методом исследования является системный анализ. Итогом исследования стало сравнение программ и вывод о наиболее подходящей системы для первичной обработки и анализа данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «СУЩЕСТВУЮЩИЙ ПРОГРАММНЫЙ КОМПЛЕКС ПЕРВИЧНОЙ ОБРАБОТКИ И АНАЛИЗА ДАННЫХ»

УДК-52

Спиридонова К.С.

Бакалавр, магистр 2-го курса ФГБОУ ВО «МГТУ «СТАНКИН» Москва, Россия

СУЩЕСТВУЮЩИЙ ПРОГРАММНЫЙ КОМПЛЕКС ПЕРВИЧНОЙ ОБРАБОТКИ И АНАЛИЗА ДАННЫХ

Аннотация

На сегодняшний день данные являются повсеместным ресурсом. Первичная обработка и анализ данных может быть достаточно трудоемок как по человеческим ресурсам, так и по временным. Целью исследования является анализ существующих программ с точки зрения функционала для первичной обработки и анализа данных. Методом исследования является системный анализ. Итогом исследования стало сравнение программ и вывод о наиболее подходящей системы для первичной обработки и анализа данных.

Ключевые слова

«MS Excel», «SPSS», «SAS», «STATA», анализ данных, данные, первичная обработка данных.

На данный момент технология извлечения данных Data Mining является очень востребованным направлением анализа априорных данных. Проходя через все этапы предварительного анализа, априорные данные не только подвергаются классифицированию и нормированию, тем самым повышая их качество данных, но и становятся достоверным источником, используемым в IT-системах, на основе которого, применяя методы предиктивной аналитики, становится возможным делать прогнозы и принимать решения.

Однако, процесс интеллектуального анализа данных достаточно трудоемок как по человеческим ресурсам, так и по временным. До 80% этого процесса может занимать именно этап предварительной обработки данных. Именно поэтому актуальность проблемы поиска оптимальных и необходимых методов обработки данных перед анализом достаточно высока.

Для первичной обработки данных в исследовательских компаниях используются такие программы как «SPSS», «Microsoft Excel», «SAS» и «STATA».

«MS EXCEL»

«MS Excel» наиболее востребованная и часто используемая программа для первичной обработки данных. Она позволяет трансформировать и организовывать данные, используя табличный формат. Многие функции, такие как диаграммы, графики и формулы позволяют анализировать и высчитывать необходимые данные.

К плюсам «MS Excel», с точки зрения первичной обработки данных, можно отнести:

• Доступный интерфейс для начинающих.

• Обилие возможностей взаимодействия с данными.

• Расширение функционала с помощью языка VBA.

Минусами же являются:

• Обилие возможностей приводит к затруднению в изучении всей доступной функциональности программы.

• Язык VBA на данный момент является устаревшим и специалистов по нему крайне мало. «SPSS»

«SPSS» представляет собой комплекс программ, предназначенных для анализа данных. У пользователя есть возможность производить много типов анализа данных при большой гибкости форматов данных, преобразование данных и манипуляция с файлами. При использовании этой программы принятие решения остается за исследователем. Программа освобождает от рутинной вычислительной работы, но

интерпретация полученных результатов зависит от опыта и знаний самого исследователя. «SAS»

Система состоит из модулей, каждый из которых выполняет определенный круг задач. Наиболее часто при статобработке используются модули BASE и STAT. В системе «SAS» реализован собственный язык программирования, который по своему синтаксису ближе к Basic. Система позволяет загружать данные из внешних файлов или же вводить их непосредственно в окно терминала. При работе с «SAS», можно проводить статистическую обработку данных разного уровня сложности, в соответствии с поставленными задачами. Взаимодействие с программой возможно как в консольном режиме, так и через графический интерфейс, который представляет собой графическую оболочку для упрощенного ввода команд языка программирования «SAS». «STATA»

«Stata» - это полноценное интегрированное программное решение, обеспечивающее все потребности в области науки о данных - манипулирование данными, визуализацию, статистический анализ и автоматизированную отчётность.

Ввод данных здесь возможен как путем загрузки из внешних файлов, так и с использованием встроенного табличного редактора, который довольно прост, но позволяет выполнять все необходимые манипуляции с таблицами.

Принципы работы с приложением «Stata» не отличаются от таковых при использовании описанных выше программ. Пользователи, которым терминальный режим покажется неудобным, могут использовать меню программы для автоматической генерации команд встроенного языка программирования.

Ниже приведена таблица минимально необходимых функций для первичной обработки данных и их наличие в приведенных выше программах (см. табл. 1).

Таблица 1

Сравнение программ

Функции «MS Excel» «SPSS» «SAS» «STATA»

Импорт/экспорт данных + + + +

Визуализация данных + + + +

Анализ больших данных - + - -

Коннекторы для источников данных + + + -

Источник: разработано автором

Таким образом, исходя из информации данной таблицы, можно сделать вывод, что самыми обширными и удобными программами для первичной обработки данных являются «MS Excel» и «SPSS», где именно «SPSS» поддерживает возможность анализа больших данных, что очень важно также и для первичной обработки данных.

© Спиридонова К.С., 2021

УДК-52

Хайруллин А.А.

Бакалавр, магистр 2-го курса ФГБОУ ВО «МГТУ «СТАНКИН» Москва, Россия

АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ ДЛЯ СЕРВИСА ПОДДЕРЖКИ КЛИЕНТОВ

Аннотация

На сегодняшний день автоматизированные информационные системы внедрены во многих областях

i Надоели баннеры? Вы всегда можете отключить рекламу.