Научная статья на тему 'Аналитическая обработка данных. Обзор BI-платформ'

Аналитическая обработка данных. Обзор BI-платформ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
1748
304
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
BUSINESS INTELLIGENCE / BI PLATFORM ARCHITECTURE / DATA ANALYSIS / BUSINESS INTELLIGENCE APPLICATIONS / DECISION MAKING / BI PLATFORM MARKET / BUSINESS INTELLIGENCE SYSTEMS / BI PLATFORM COMPARISON / АРХИТЕКТУРА BI-ПЛАТФОРМ / АНАЛИЗ ДАННЫХ / ПРИЛОЖЕНИЯ БИЗНЕС-АНАЛИЗА / ПРИНЯТИЕ РЕШЕНИЙ / РЫНОК BI-ПЛАТФОРМ / СИСТЕМЫ БИЗНЕС-АНАЛИЗА / СРАВНЕНИЕ BI-ПЛАТФОРМ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Седойкина Алина Алексеевна

Статья посвящена обзору наиболее популярных систем класса Business Intelligence, представленных на рынке инструментов и средств аналитической обработки данных. Рассматривается область бизнес-аналитики (бизнес-анализа) и ее направления, в том числе современные тенденции развития, средства и методы, а также проводится анализ, описание и сравнение наиболее популярных BI-платформ. Определены достоинства и недостатки BI-платформ.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYTICAL DATA PROCESSING. OVERVIEW OF BI-PLATFORMS

This article reviews the most popular systems of the Business Intelligence class, presented on the market of tools for analytical data processing. The field of business analytics (business analysis) and its areas, including modern development trends, tools and methods, is analyzed, as well as the analysis, description and comparison of the most popular BI platforms. Advantages and disadvantages of BI platforms are identified.

Текст научной работы на тему «Аналитическая обработка данных. Обзор BI-платформ»

УДК 004

Седойкина Алина Алексеевна, магистрант, ФГБОУ ВО «Национальный исследовательский Мордовский государственный

университет им. Н.П. Огарева»

АНАЛИТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ. ОБЗОР BI-ПЛАТФОРМ

Аннотация. Статья посвящена обзору наиболее популярных систем класса Business Intelligence, представленных на рынке инструментов и средств аналитической обработки данных. Рассматривается область бизнес-аналитики (бизнес-анализа) и ее направления, в том числе современные тенденции развития, средства и методы, а также проводится анализ, описание и сравнение наиболее популярных BI-платформ. Определены достоинства и недостатки BI-платформ.

Ключевые слова: business intelligence, архитектура BI-платформ, анализ данных, приложения бизнес-анализа, принятие решений, рынок BI-платформ, системы бизнес-анализа, сравнение BI-платформ.

Sedoikina Alina A., master degree student National Research Mordovia State University, Saransk

ANALYTICAL DATA PROCESSING. OVERVIEW OF BI-PLATFORMS

Abstract. This article reviews the most popular systems of the Business Intelligence class, presented on the market of tools for analytical data processing. The field of business analytics (business analysis) and its areas, including modern development trends, tools and methods, is analyzed, as well as the analysis, description and comparison of the most popular BI platforms. Advantages and disadvantages of BI platforms are identified.

Keywords: business intelligence, BI platform architecture, data analysis, business intelligence applications, decision making, BI platform market, business intelligence systems, BI platform comparison.

В настоящее время успешность предприятия на рынке зависит в большей степени от возможности менеджеров быстро реагировать на динамику рынка. Информация, необходимая для принятия оперативных решений в современной экономической среде становится стратегическим ресурсом фирмы. А знания занимают все больший удельный вес в структуре стоимости товаров и услуг, поэтому владеть просто информацией недостаточно. Необходимо, чтобы она была предварительно обработана и организована в целях быстрого анализа и принятия решений.

Наибольшую пользу управление знаниями способно принести в планировании, обслуживании клиентов, обучении персонала и сотрудничестве в рамках проектов. Одна из центральных идей управления знаниями - использовать более эффективно уже существующее знание.

Системы Business Intelligence - тот класс систем, которые предоставляют возможность преобразовать данные КИС и данные внешних источников в читаемые для менеджеров знания и информацию, необходимые для принятия решений. По общепризнанному определению, Business Intelligence (BI) - это совокупность компьютерных методов и инструментов, обеспечивающих перевод необработанной информации в осмысленную, удобную форму [1].

Сегодня, средства BI весьма разнообразны. Но можно выделить четыре основные направления систем бизнес-анализа (рис. 1).

Рисунок 1 - Направления развития В1-систем.

В1-платформа должна предоставлять пользователям и разработчикам набор специализированных инструментов для создания приложений бизнес-анализа. Все

Представлен Хранение ие данных данных

Анализ Интеграция данных данных

инструменты платформы для бизнес-анализа должны применять общие данные, сквозную модель администрирования, единую объектную модель и общий движок исполнения запросов [6].

Тенденцией среди разработчиков в последние три года стало построение собственных BI-платформ, фундаментом которых является технология Data Discovery (DD). Цель данной технологии - создать инструменты и средства, ориентированные на людей, поддерживающих их работу. Технология DD предоставляет возможность использовать интуицию человека при выделении значимой и полезной информации. Отличие от традиционного бизнес-анализа заключается в том, что представление обработанной информации наиболее наглядно и более высокое по скоростным характеристикам. Цикл технологии представлен на рис. 2.

В связи с развитием мобильных технологий появилась тенденция просмотра данных аналитики в любое время и в любом месте именно с мобильных устройств. Наиболее авторитетные разработчики платформ бизнес-аналитики своевременно отреагировали, выпустив дополнения к BI - приложения для мобильных телефонов и планшетов.

Сейчас на рынке представлено более 20 BI-платформ, и основываясь на уже проведенных исследованиях специалистов в данной области, отзывов аналитиков и авторитетных консалтинговых агентств, проведем обзор наиболее популярных инструментов.

На сегодняшний день первое место на рынке BI-платформ делят компании QlikView и Tableau. В платформе QlikView используется ассоциативный поиск в

* *

Рисунок 2 - Цикл технологии Data Discovery.

оперативной памяти со встроенными средствами ETL (extraction, transformation, loading) [4]. В этом решение уникально, и неудачные попытки конкурентов воссоздать множественные функции QlikView, как правило, заканчиваются неудачей.

Ассоциативная архитектура позволяет поддерживать такие характеристики запросов как гибкость, производительность и ассоциативность на высоком уровне. Что нельзя сказать о традиционной архитектуре, где принятие решений происходит на основе интуитивных связей данных, ухудшая при этом их качество. Место OLAP-куба в BI-платформе QlikView занимает собственный инструмент - Business Discovery.

В целом инструмент имеет модульную архитектуру и состоит из следующих компонент (рис. 3).

Рисунок 3 - Модули платформы QlikView.

К преимуществам BI-платформы можно отнести интерактивную визуализацию, возможность одновременно использовать данные различных типов, проработанные дашборды, геопространственная аналитика и удобная совместная работа пользователей. Следуя современным тенденциям, QlikView представлена на мобильных платформах любого типа. Производительность весьма высокая, но могут возникать замедления при работе с большими объемами данных.

Ещё один лидер BI-решений - Tableau, в основе которого лежат собственные технологии VizQL (интерактивная визуализация данных) и Data Engine (анализ данных). Как и во многих BI-платформах имеется возможность использования данных из различных источников [5]. Ключевая особенность Tableau так

называемое «смешивание данных» - комбинирование данных из различных баз данных и иных источников. Также инструмент предоставляет возможность многопользовательского режима работы над отчетом, формируемом в специальном модуле Desktop. Подобно QlikView реализованы различные способы рассылки отчетов (электронная почта, доступ по ссылке, публикация на сервере Tableau). Tableau-решение из всех представленных на BI-рынке инструментов больше остальных преуспели в упрощении механизма доступа пользователей к анализу данных. Tableau обладает отличной функциональностью, включая периодические обновления карт и дополнительную информацию для целей геопространственной аналитики.

Уникальность следующей BI-платформы состоит в том, что она на 100% находится в облаке, что предоставляет возможность наиболее эффективной обработки данных, и возможность визуализировать данные с изменениями в realtime. Разработка канадской компании Klipfolio Dashboard отличается своей простотой и дружественным интерфейсом. Подобно вышеописанным конкурентам поддерживает данные различных типов как из online источников, так и offline.

К особенностям Klipfolio можно отнести совместимость с различными устройствами (смартфоны, планшеты, Smart TV и др.), многопользовательский режим и аутентификацию.

Онлайн-сервис от Microsoft Power BI также предоставляет возможность подключения данных разных источников. В платформе реализован web-интерфейс, с помощью которого можно создать кастомизированные визуализации, а проводить стандартизацию и очистку данных можно при помощи настольного приложения [3]. BI-платформа, не отличаясь от своих конкурентов, также идет в ногу со временем - реализована мобильная версия Power BI, доступная на различных операционных системах. Нельзя не отметить мощность и стабильность работы, а также то, что это в первую очередь, продукт Microsoft, что означает следование принципам и архитектуре одной из самых распространенных компаний. К ключевым характеристикам можно отнести бесплатную базовую версию,

различные способы импорта данных, изменение данных в реальном времени, рассылка отчетов несколькими способами.

Кратко охарактеризовав самые популярные BI-платформы, результаты обзора представим в виде таблицы для наглядности (таблица 1.).

Таблица 1 - Сравнительная таблица BI-платформ.

Критерий сравнения QlikView Tableau КНрГоИо Power BI

Особенности Ассоциативная модель данных. Широкие возможности визуализации, дополнительные фильтры, понятная интерактивность данных. Мониторинг и контроль в реальном времени непрерывных потоков данных. Поколоночное сжатие данных и вычисления в оперативной памяти.

Ключевые характеристики 1 .Большое количество полезных функций, для создания продвинутых дашбордов. 2.Хранение данных в ОП сервера. Широкие возможности для отправки отчетов и дашборды, поддержка данных из различных источников, интеграция этих данных. Аутентификация, неограниченное количество подключенных пользователй, мобильная версия, возможность добавлять аннотации к отчетам. Преобразование и очистка данных, создание модели; возможность создания визуальных элементов; создание и публикация отчетов.

Удобство использования В дашбордах и отчетах легко разобраться, но их весьма тяжело создавать. Дружественный интерфейс, самые широкие возможности среди BI-платформ. Возможность представить информацию в различном виде, но нужно подготовить данные. Удобный инструмент с использованием естественного языка.

Цена Одна из самых дорогих платформ. Запутанная ценовая политика Облачная платформа бесплатна, с условием хранения решений на сервере. Цена за пользователя 999$ в год. 2-х недельный пробный период, цена за пользователя 19$ в месяц. Несколько видов лицензирования, включая бесплатные. Минимальная цена подписки 624,40 руб. за пользователя в месяц.

Таким образом, можно сделать вывод, что при использовании QlikView стоит обратить внимание на то, что пользователю, не владеющему технической базой будет достаточно сложно. Синтаксис не очевиден, выражения выглядят весьма необычно. Большие сложности с отправкой отчетов и с использованием платформы как рабочего инструмента для всей компании.

При использовании Klipfolio придется довольно долго обучаться базовым и сложным операциям. Нельзя не отметить отсутствие функций для предиктивной аналитики и прогнозирования. Также взимается дополнительная плата за CSS стили.

В Tableau есть необходимость предварительной обработки данных. Также в платформе отсутствует история изменений; и функции/опции могут показаться слишком узконаправленными и ограничивающими.

Power BI обладает ограниченным набором инструментов для обработки и очистки данных. Довольно часто возникают сложности с импортом и обработкой большого количества данных: программа зависает, либо вылетает.

Библиографический список

1. Business Intelligence [Электронный ресурс] / URL: https://ru.wikipedia.org/wiki/Business_Intelligence.

2. Data Mining [Электронный ресурс] / URL: https: //ru.wikipedia. org/wiki/Data_mining.

3. Microsoft Power BI [Электронный ресурс] / URL: https://powerbi.microsoft.com/ru-ru.

4. QlikView [Электронный ресурс] / URL: http://global.qlik.com/ru/landing/go-sm/qlikview/download-qlikview/

5. Tableau [Электронный ресурс] / URL: https://www.tableau.com/products/trial

6. Барсегян А. А. Технологии анализа данных: Data Mining, Visual mining, Text mining, OLAP. Учеб. пособие / А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод. - СПб.: «БХВ Петербург», 2014. - 383 с.

7. Варфоломеева А. О. Информационные системы предприятия. Учебное пособие / А. О. Варфоломеева, А. В. Коряковский, Романов В. П. - М.: НИЦ ИНФРА-М, 2016. - 283 с.

8. Лесковец Р. Анализ больших наборов данных: пер. с англ. Слинкин А. А. / Р. Лесковец, А. Раджараман, Дж. Ульман - М.: ДМК Пресс. - 2016. - 498 с.

9. Методы, модели, средства хранения и обработки данных: учебник / Э. Г. Дадян, Ю. А. Зеленков. - М.: Вузовский учебник: ИНФРА-М, 2017. - 168 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.