Научная статья на тему 'Методы и инструменты продвинутой бизнес-аналитики для корпоративных информационно-аналитических систем в эпоху цифровой трансформации'

Методы и инструменты продвинутой бизнес-аналитики для корпоративных информационно-аналитических систем в эпоху цифровой трансформации Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
4432
584
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОДВИНУТАЯ БИЗНЕС-АНАЛИТИКА / ПРЕДИКТИВНОЕ МОДЕЛИРОВАНИЕ / СИСТЕМА БИЗНЕС-ИНТЕЛЛЕКТА / МОДЕЛЬ / УПРАВЛЯЕМАЯ ДАННЫМИ / УПРАВЛЕНИЕ КОРПОРАТИВНОЙ РЕЗУЛЬТАТИВНОСТЬЮ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Брускин Сергей Наумович

В статье рассматриваются перспективы развития корпоративных информационно-аналитических систем на основе расширенной бизнес-аналитики. Показаны возможности предиктивного моделирования для повышения операционной эффективности крупных компаний в условиях цифровой экономики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Брускин Сергей Наумович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Методы и инструменты продвинутой бизнес-аналитики для корпоративных информационно-аналитических систем в эпоху цифровой трансформации»

УДК 004.048

Брускин С.Н.

Российский экономический университет им. Г.В. Плеханова, г. Москва, Россия

МЕТОДЫ И ИНСТРУМЕНТЫ ПРОДВИНУТОЙ БИЗНЕС-АНАЛИТИКИ ДЛЯ КОРПОРАТИВНЫХ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИХ СИСТЕМ В ЭПОХУ

ЦИФРОВОЙ ТРАНСФОРМАЦИИ

АННОТАЦИЯ

В статье рассматриваются перспективы развития корпоративных информационно-аналитических систем на основе расширенной бизнес-аналитики. Показаны возможности предиктивного моделирования для повышения операционной эффективности крупных компаний в условиях цифровой экономики.

КЛЮЧЕВЫЕ СЛОВА

Продвинутая бизнес-аналитика; предиктивное моделирование; система бизнес-интеллекта; модель, управляемая данными; управление корпоративной результативностью.

Bruskin S.N.

Plekhanov Russian University of Economics, Moscow, Russia

METHODS AND TOOLS OF ADVANCED BUSINESS ANALYTICS FOR CORPORATE INFORMATION ANALYTICAL SYSTEMS IN THE DIGITAL TRANSFORMATION ERA

ABSTRACT

This article discusses the prospects for the development of corporate information analytical systems based on advanced business analytics. Presented predictive modeling capabilities to improve the operating efficiency of large companies in the digital economy.

KEYWORDS

Advanced business analytics; predictive modeling; business intelligence system; data driven model; corporate performance management.

В настоящее время происходят стремительные преобразования глобального информационного пространства, которое затрагивает рынок, общество, бизнес и государство. Мы наблюдаем зарождение и участвуем в развитии так называемои «цифровои экономики», законы которои еще не до конца осознаны. По данным аналитического агентства IDC объем рынка технологии и услуг в сфере больших данных продолжает ежегодно расти примерно на 30% и к 2018 г. достигнет $41,5 млрд. В опубликованных результатах исследования "Цифровая вселенная"2, проведенного компаниями EMC и IDC, содержится прогноз 10-кратного роста «цифровои вселеннои» к 2020 году относительно уровня 2013 года. Ожидается удвоение объема данных в облачном сегменте, которьш составит 40% данных цифровои вселеннои, чему способствует развитие беспроводных технологии, интеллектуальных устроиств, интернета вещеи, технологии дополненнои и виртуальнои реальности. Согласно отчета компании Deloitte3, некоторые технологические тренды 2016 года могут поменять правила ведения бизнеса в различных областях уже в ближаишем будущем — в течение 18-24 месяцев.

То, что сегодня подразумевается под термином «цифровая трансформация» (digital transformation) для предприятия, означает, что цифровые технологии не только существенно влияют на эффективность его работы - они коренным образом меняют его структуру, деловые процессы, принципы организации и методы управления. В конечном счете, цифровая трансформация уже сегодня определяет рыночные перспективы и ценность предприятии на рынках товаров и услуг массового спроса (FMCG), финансовом, телекоммуникационном, масс медиа,

2Исследование и анализ IDC, проведенное по заказу корпорации EMC «Digital Universe study», http://russia.emc.com/leadership/digital-universe/2014iview/index.htm

3 Седьмой ежегодный отчет компании Deloitte «Tech trend 2016. Innovating in the digital era», http://www2.deloitte.com/ru/ru/pages/technology/articles/tech-trends.html

электронной коммерции и др.

В связи с этим для крупных компаний, попавших в зону действия цифровой экономики, особое значение приобретает качество и скорость информационно-аналитическои поддержки корпоративного управления. Как было рассмотрено в работах [1-2], большинство современных корпорации для задач планирования, анализа и контроля использует учетные и аналитические приложения на основе OLTP и OLAP-систем соответственно. Наиболее распространеннои в корпоративном секторе OLTP-системои является современная ERP-система. К широко применяемым OLAP-системам следует отнести системы бизнес-интеллекта (Business Intelligence), а также системы управления корпоративнои результативностью (Corporate performance management). Однако в новых экономических условиях, как было показано в работе [3], классического функционала упомянутых систем виде уже недостаточно для решения новых цифровых задач - в силу того, что ERP-системы ориентированы на ретро-анализ «План-Факт», BI-приложения обрабатывают информацию о прошлои или (в лучшем случае) текущеи ситуации, а CPM-системы не содержат готовых инструментов прогнознои аналитики (Табл.1).

Таблица 1. Подходы к совершенствованию корпоративного управления на основе бизнес-аналитики

Стадия развития Инструментарий Подходы Решаемая задача

Стадия 5 Проектирование не завершено Оптимизация с вероятностными параметрами Как достичь наилучшего результата, если ограничения имеют вероятностный характер

Стадия 4 Оптимизационные модели Data mining Оптимизация Как достичь наилучшего результата при заданных ограничениях

Стадия 3 Предиктивная аналитика Прогнозирование Что произоидет в ближаишем будущем?

Стадия 2 • CPM-системы • Business Intelligence • OLAP • Статистическое моделирование на основе ретро-данных • Сценарное моделирование «Что если?» (what if) • Детализация аналитики (drill down) • Методы эконометрики Моделирование результатов взаимодеиствия нескольких факторов и их совместного влияния на результат Изучение того, как (где, когда, как часто) это происходило в прошлом. Изучение проблемы в прошлом на самых глубоких уровнях детализации

Стадия 1 • ERP-системы • Отчетность по запросу • Отчетность «план-факт» • Ретро-анализ • Отчетность -параметрические отчеты (ad hoc) • Регламентные (неизменяемые) отчеты Что произошло в прошлом?

В настоящее время (начало стадии 3) мы говорим о необходимости применения предиктивнои аналитики (Predictive analytics), которая дополняет и усиливает возможности Business intelligence и Corporate performance management в части прогнозирования будущих событии. Предиктивная аналитика использует множество методов интеллектуального анализа данных, статистики, моделирования, машинного обучения и искусственного интеллекта для анализа текущих данных, чтобы делать прогноз на будущее.

Наиденные закономерности в исторических и транзакционных данных могут быть использованы для выявления рисков и возможностеи будущих событии. Модели предиктивнои аналитики фокусируются на взаимосвязях между многими факторами для оценки риска с определенным набором условии. Успешное применение предиктивнои аналитики в компании позволяет эффективно интерпретировать большие данные в своих интересах.

Интеллектуальньш анализ данных (Data mining, Text mining, Web mining, Social mining) в сочетании со статистическим анализом позволяет бизнес-пользователям создавать интеллектуальные системы прогнозирования, раскрывая закономерности и отношения в структурированных и неструктурированных данных. Источниками структурированных данных, например, могут являться любые справочные базы данных, корпоративные транзакционные

системы и иные данные, имеющие четкую структуру. Неструктурированные (или слабоструктурированные) данные - данные, которые нам принесла, в значительнои мере, цифровая экономика. Они не имеют заранее определеннои структуры, либо она не организована в установленном порядке. Типичныи пример таких данных - текстовые данные социальных медиа-контентов, которые извлекаются с использованием семантического анализа, учитывающего эмоциональную составляющую, а затем используются в процессе построения модели.

Аналитики Gartner полагают, что дальнеишее развитие мирового рынка бизнес-анализа поидет по пути активного освоения продвинутои аналитики (advanced analytics), в том числе -предиктивного анализа, построения симуляторов и вариативных моделеи. Как видно из схемы, предложеннои компаниеи Forrester research (рис.1), подходы к внедрению инструментов предиктивнои аналитики подразумевают непрерывным цикл обработки данных, превращающих их в знания, что хорошо согласуется с требованиями цифровой экономики.

Мониторинг эффективности

Внедрение модели

Понимание данных

Подготовка данных

Разработка модели

Рис.1. Подходы к внедрению инструментов предиктивной аналитики

Центральнои сущностью предиктивнои аналитики является задача определение предиктора или нескольких предикторов (параметров или сущностеи, которые влияют на прогнозируемое событие).

Чтобы предиктивныи анализ был успешным, рекомендуется четко следовать следующим стадиям: постановка цели, получение данных из различных источников, подготовка данных, создание предиктивнои модели, оценка модели, внедрение модели, мониторинг эффективности модели.

Обратим внимание, что наряду с требованиями к качеству прогнозных данных, которые необходимы современному «цифровому предприятию», все более значимым становится требование к скорости их предоставления. Таким образом, «цифровая» аналитическая система ближаишего будущего, которая работает с большими данными, должна не только содержать интеллектуальные модели, управляемые данными (data driven model), но также отвечать требованиям реального времени (Real time system). В рамках предиктивного моделирования этого можно добиться следующим образом:

1) Механизм статистического моделирования создает ряд моделеи, анализируя ретроспективные данные.

2) Полученные модели развертываются и проверяются на качество прогнозирования;

3) Неудачные модели заменяются более успешными.

Инструмент для построения моделеи обеспечивает создание моделеи на основе исторических данных. Такие модели могут исполняться в пакетном режиме или в реальном времени на потоковых данных. Результаты выполнения моделеи могут использоваться компонентом итоговои оптимизации для сравнения результатов, полученных разными моделями, и отбора наиболее удачных. Модуль прогнозного моделирования может постоянно создавать сотни

прогнозных моделей, непрерывно сверять их с реальными процессами и оптимизировать эти модели для получения оптимальных результатов.

В качестве распространенных примеров применения предиктивного анализа можно назвать директ-маркетинг, оценку эффективности промо-компании (с учетом сегментов, местоположения или каналов доставки), таргетирование рекламы, выявление схем мошенничества, моделирование политических кампании, разработку моделеи раннеи диагностики в медицине и многое другое. Сферы применения предиктивнои аналитики весьма широки, и в настоящее время находимся лишь на начальном этапе их развития.

Важным условием обеспечения эффективности предиктивного моделирования сложных динамических систем является определение количественных и качественных закономерностеи, присущих данным системам. Сложность такои задачи заключается в том, что подобные системы являются слабоструктурированными, и получение необходимых дополнительных знании о них невозможно без участия человека. Вне зависимости от того, используется ли в предиктивнои модели дополнительная информация от эксперта (группы экспертов) или ее получают от других людеи (целевои группы привлеченных респондентов), указанная информация всегда носит субъективньш характер. Именно поэтому при моделировании сложных социально-экономических систем все чаще в настоящее время применяются не отдельно взятые математические методы, а комплексы когнитивных сетеи и гибридные модели с использованием теории нечетких игр, нечетких множеств, нечеткои логики, неиронные сети, когнитивные карты, эволюционные алгоритмы и др.

К когнитивным методам анализа, которые широко используются в интеллектуальных системах поддержки принятия решении также следует отнести:

1) когнитивные карты;

2) знаковые графы;

3) сетевые модели;

4) графы причин и следствии;

5) каузальные сети;

6) баиесовские сети;

7) сети доверия;

8) аналитические сети Саати.

Следует отметить, что на рынке представлены десятки программно-инструментальных средств для предиктивного анализа - как системы Open source (Orange, Python, R, RapidMiner, и др.), так и коммерческие системы предиктивного анализа (TIBCO, Mathematica, MATLAB, STATISTICA и др.). Отдельную группу составляют аналитические приложения в составе промышленных корпоративных систем от лидирующих поставщиков (Oracle Data Mining (ODM), SAS Enterprise Miner, IBM SPSS Statistics and IBM SPSS Modeler, и др.). Важным моментом является то, что предиктивная аналитика как когнитивная система предлагается на рынке не только в виде лицензируемого программного обеспечения, но и как облачныи сервис на основе SaaS.

Отдельно необходимо выделить лидирующую облачную платформу IBM Watson, которая обладает, пожалуи, самои богатои функциональностью для предиктивного моделирования. Watson представляет собои когнитивную систему, которая способна понимать, делать выводы и обучаться. В настоящее время IBM Watson является когнитивнои облачнои API-платформои, открытои для разработок различных приложении, сервисов и процессов, в основе которых лежат более 50 различных технологии. В системе Watson использованы современные достижения в области программирования, но она существенным образом отличается от существующих решении.

Отметим ряд особенностеи, сочетание которых делает Watson лидирующеи когнитивнои системои:

1. Обработка естественного языка - позволяет разобраться в сложностях неструктурированных данных, которые составляют 80% данных, имеющихся в мире на сегодняшний день;

2. Построение и оценка гипотез - применяет средства расширенного анализа для сравнения и оценки группы ответов на основе только существенных фактов;

3. Динамическое обучение - позволяет улучшить обучение на основе получаемых результатов, чтобы система становилась умнее с каждой итерацией и взаимодействием. Сочетание указанных возможностеи в одном решении позволяет:

1) раздвинуть рамки ограничении, сложившихся в области программирования;

2) не ограничиваться только структурированными данными, хранящимися в локальных системах, а начать пользоваться огромным массивом глобальных неструктурированных данных;

3) заменить детерминированные приложения, управляемые деревом решении, на вероятностные системы, способные развиваться вместе со своими пользователями;

4) вместо поиска по ключевым словам, которыи работает со списком источников, где потенциально можно наити ответ, Watson использует интуитивно понятныи диалоговыи инструмент поиска ответов с оценкои по степени уверенности.

Сочетание средств обработки естественного языка, динамического обучения, построения и оценки гипотез позволяет Watson выдавать прямые ответы с учетом степени достоверности.

Подобные когнитивные системы усваивают многочисленные способы поведения, которые люди считают "естественными", и будут применять их в массовом порядке, помогая решать задачи, которые сегодня являются частью цифровои трансформации и часто лежат за гранью человеческого понимания.

Исходя из анализа лидирующих на мировом рынке промышленных платформ продвинутои аналитики, материалов глобальных исследовательских групп, а также собственнои проектнои практики внедрения аналитических систем в корпоративном секторе экономики, мы предлагаем следующую функциональную архитектуру корпоративнои информационно-аналитическои системы (ИАС) с использованием продвинутой бизнес-аналитики (рис.2).

4.8 Планирование

4.5 Сценарное моделирование

4.6 Предиктивный анализ

4.7 Оптимизационное моделирование

®

4 ) Типовые решения .

4.1 Ретро-анализ

4.2 Статистическое моделирование

4.3 Прогнозирование

4.4 Машинное

обучение

Приложения расширенного анализа

Рабочая среда моделирования

Инструменты визуализации

6)

Обеспечение доступа к данным

t

t

Рабочее пространство для доступа аналитических приложений

Высокоскоростная обработка данных

/

Интеграция в гибридных сетях

Технологии высокоскоростных расчетов в памяти

Внешние данные

Г

Данные Данные

из ERP-систем из В1-систем

Внутренние данные из других ИС

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис.2. Функциональная архитектура корпоративной информационной системы (ИАС) с использованием

продвинутой бизнес-аналитики

Как видно из представленнои архитектуры, технологические инновации коснулись всех уровнеи проектирования системы:

1) уровень интеграции в гибридных сетях отличают новые возможности обработки внешних данных, к которым можно отнести большие данные (в первую очередь, это касается неструктурированных данных из социальных сетеи);

2) уровень высокоскоростнои обработки данных на основе новых вычислительных технологии (например, использование технологии InMemory, колоночных баз данных, параллельных вычислении и т.п.);

3) обеспечение доступа к данным на основе многоагентных систем и технологии извлечения и очистки данных из специализированных хранилищ;

4) типовые решения продвинутои аналитики, включающие не только инструменты статистического и сценарного моделирования, но и когнитивные технологии бизнес-аналитики, построенные на описанном выше предиктивном моделировании, а также оптимизационных инструментах, которые будут предложены рынку в ближаишие годы.

Одним из интересных примеров реализации рассмотреннои архитектуры является IBM Planning analytics - облачныи продукт компании IBM,4 одного из мировых лидеров рынка Advanced

4 http://www-03.ibm.com/software/products/ru/planning-analytics

analytics. IBM Planning Analytics является одной из первых попыток выйти за пределы традиционной автоматизации процессов планирования, составления бюджета и прогноза. Решение совмещает в себе функциональность систем классов CPM, BI, а также возможности предиктивного анализа и моделирования, присущие инновационному облачному продукту IBM Watson Analytics. IBM Planning analytics уже доступен ведущим интеграторам - россииским партнерам IBM5, поэтому первых россииских проектов по внедрению ИАС нового поколения следует ожидать в обозримом будущем.

IBM Planning Analytics локализовано в «облаке», поэтому не нуждается в развертывании специальнои ИТ-инфраструктуры у заказчика. По оценкам экспертов облачная локализация является однои из ключевых особенностеи данного аналитического решения. Такои подход к организации ИТ-инфраструктуры в полнои мере отвечает интересам заказчиков, которые стремятся к снижению капитальных вложении в ИТ. По оценке IDC к 2019 г. почти половина ИТ-бюджетов корпоративных структур будет уходить именно на облачную инфраструктуру.

Таким образом, развитие систем продвинутои бизнес-аналитики предоставляет корпорациям методы, модели и технологии принципиально нового качества - в соответствии с вызовами цифровои экономики.

Тем не менее, не следует думать, что новое поколение аналитических приложении и сервисов избавит корпорации от необходимости тои цифровои трансформации, с которои мы начали разговор. Практика разработки отдельных компонент Advanced business analytics, как описано в работах [4-5], говорит о том, что всем участникам цифрового рынка предстоит не только трансформация ИТ-систем. Цифровая трансформация также подразумевает переход компании на «цифровое управление», пересмотр организационных принципов менеджмента, бизнес-процессов и их аналитического обеспечения.

Литература

1. Системы управления эффективностью бизнеса: Учебное пособие / Н.М. Абдикеев, С.Н. Брускин, Т.П. Данько и др.; Под научн. ред. Н.М. Абдикеева и О.В. Китовой. М., 2015. 282 с.

2. Брускин С.Н. Системы поддержки принятия решений в корпоративном планировании с использованием информационной бизнес-аналитики: практика и перспективы// Современные информационные технологии и ИТ-образование. Т. 1 (№ 11), МГУ им. М.В. Ломоносова - М., 2015 г. - с.593-598.

3. Брускин С.Н., Китова О.В. Информационная бизнес-аналитика в задачах корпоративного управления: подходы и инструменты//Международная научная конференция «Ломоносовские чтения-2016. Экономическая наука и развитие университетских научных школ» - Сборник статей / Под ред. А.А. Аузана, В.В. Герасименко - М.: Экономический факультет МГУ имени М.В.Ломоносова, 2016. - с.1349-1358.

4. Брускин С.Н. Перспективные подходы и практика разработки моделей финансовой эффективности корпорации на базе многомерных динамических объектов / / Научные труды вольного экономического общества России. - Том 186. - 2014. - с.159-164.

5. Китова О.В., Нефедов В.В., Старовойтов А.В. Имитационная модель развития розничной торговой сети на платформе IBM Cognos TM1 // Вестник РЭУ им. Г.В. Плеханова. - 2015. - № 3. - С. 99-105.

References

1. Sistemy upravleniya effektivnost'yu biznesa: Uchebnoe posobie / N.M. Abdikeev, S.N. Bruskin, T.P. Dan'ko i dr.; Pod nauchn. red. N.M. Abdikeeva i O.V. Kitovoy. M., 2015. 282 s.

2. Bruskin S.N. Sistemy podderzhki prinyatiya resheniy v korporativnom planirovanii s ispol'zovaniem informatsionnoy biznes-analitiki: praktika i perspektivy// Sovremennye informatsionnye tekhnologii i IT-obrazovanie. T. 1 (№ 11), MGU im. M.V. Lomonosova - M., 2015 g. - s.593-598.

3. Bruskin S.N., Kitova O.V. Informatsionnaya biznes-analitika v zadachakh korporativnogo upravleniya: podkhody i instrumenty//Mezhdunarodnaya nauchnaya konferentsiya «Lomonosovskie chteniya-2016. Ekonomicheskaya nauka i razvitie universitetskikh nauchnykh shkol» - Sbornik statey / Pod red. A.A. Auzana, V.V. Gerasimenko - M.: Ekonomicheskiy fakul'tet MGU imeni M.V.Lomonosova, 2016. - s.1349-1358.

4. Bruskin S.N. Perspektivnye podkhody i praktika razrabotki modeley finansovoy effektivnosti korporatsii na baze mnogomernykh dinamicheskikh ob"ektov// Nauchnye trudy vol'nogo ekonomicheskogo obshchestva Rossii. - Tom 186. -2014. - s.159-164.

5. Kitova O.V., Nefedov V.V., Starovoytov A.V. Imitatsionnaya model' razvitiya roznichnoy torgovoy seti na platforme IBM Cognos TM1 // Vestnik REU im. G.V. Plekhanova. - 2015. - № 3. - S. 99-105

Поступила 21.10.2016

Об авторе:

Брускин Сергей Наумович, старший преподаватель кафедры информатики Российского экономического университета им.

Г.В. Плеханова, кандидат экономических наук, [email protected].

5 http://www.cnews.ru/news/line/2016-07-11_navicon_popolnil_portfel_analiticheskih_reshenij

i Надоели баннеры? Вы всегда можете отключить рекламу.