Научная статья на тему 'Анализ экономической эффективности решений класса Big Data в коммерческом банке'

Анализ экономической эффективности решений класса Big Data в коммерческом банке Текст научной статьи по специальности «Экономика и бизнес»

CC BY
1412
293
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЭКОНОМИЧЕСКАЯ ЭФФЕКТИВНОСТЬ ИТ / BIG DATA / БОЛЬШИЕ ДАННЫЕ / DATA MINING / АНАЛИТИЧЕСКИЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Середенко Евгений Сергеевич

Статья представляет собой описание практикума (workshop) по использованию методики оценки аналитических информационных систем применительно к решениям на основе технологий Big Data в частном коммерческом банке. В работе рассматриваются особенности решений класса Big Data и выстраивается методическая основа для проведения оценки целесообразности инвестиций в такие технологии.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Анализ экономической эффективности решений класса Big Data в коммерческом банке»

Середенко Е.С.

ОАО «Альфа-Банк», г. Москва, Руководитель направления аналитических технологий Центра Business Intelligence, ne gwe st@yandex. ru

Анализ экономической эффективности решений класса Big Data в коммерческом банке

КЛЮЧЕВЫЕ СЛОВА

Экономическая эффективность ИТ, Big Data, Большие данные, Data Mining, аналитические информационные системы.

АННОТАЦИЯ

Статья представляет собой описание практикума (workshop) по использованию методики оценки аналитических информационных систем применительно к решениям на основе технологий Big Data в частном коммерческом банке. В работе рассматриваются особенности решений класса Big Data и выстраивается методическая основа для проведения оценки целесообразности инвестиций в такие технологии.

Современные коммерческие предприятия всё активнее внедряют в свою деятельность решения на основе технологий Больших данных (Big Data). При этом класс решений, относимых к технологиям «Больших данных», в настоящее время по-прежнему не чётко определен и меняется в зависимости от контекста. В данной статье под основными признаками решений класса Big Data понимаются:

• необходимость обработки большого объема данных в сравнении с обычным для данной организации массивом анализируемых данных;

• слабая структурированность обрабатываемых данных и изменчивость структуры хранения во времени (в частности, хранение информации в отдельных файлах doc, html, xml и т.п.);

• использование внешних источников, данных (сторонних баз данных, данных интернет-ресурсов, и т.п.);

• применение специфических технологий хранения и обработки данных (таких как Apache Hadoop, In-memory базы данных) и технологий быстрого анализа данных (например, систем Data Mining). Современные предприятия имеют множество вариантов заработка на

технологиях Больших данных. Наиболее характерными их них являются:

1. Оптимизация собственной деятельности, повышения качества своих продуктов и услуг (например, более качественная работа с рисками, более точные целевые маркетинговые кампании и т.п.);

2. Продажа собранных данных или результатов их обработки

(например, продажа аналитических отчетов или досье, собранных из открытых источников и т.п.);

3. Продажа экспертизы (консалтинга) по аналитической обработке больших данных;

4. Передача инфраструктуры (программных и аппаратных технологий хранения и обработки данных).

На практике часто встречаются комбинированные варианты: например, некоторые компании продают свою экспертизу по анализу данных заказчика, при этом обладая большим собственным массивом собранных данных.

В данной статье будут рассматриваться только решения первого класса, т.е. решения, направленные на анализ и повышение эффективности процессов предприятия. Остальные виды коммерциализации технологий Big Data имеют ярко-выраженный экономический эффект, измеряемый обычными инвестиционно-финансовыми методами. При этом экономическая ценность инструментов анализа и повышения эффективности не столь очевидна.

Основной задачей данного практикума является подготовка методической основы для определения целесообразности закупки инструментария Big Data коммерческим банком на горизонте планирования 5 лет (в этот период должна быть достигнута точка окупаемости). Эффективными признаются инвестиции с годовой отдачей не ниже целевого значения отдачи на акционерный капитал, принятого в данной организации. При решении задачи допускается делать разумные допущения о будущей структуре процессов при использовании банком новых технологий. Предполагается, что инструментарий Big Data обеспечит в своём контуре полный набор инфраструктуры, необходимой как для первоначальной исследовательской работы по аналитическим задачам, так и для внедрения результатов в эксплуатацию в виде компьютерных моделей и аппаратного обеспечения.

Ключевой проблемой оценки эффективности ИТ на предприятии является невозможность однозначного связывания результатов применения ИТ и роста производительности фирмы[1]. Можно выделить следующие три вида ценности информационной системы для бизнеса предприятия:

1. Информационная система как неотъемлемая часть конечного продукта (например, операционная система смартфона);

2. Информационная система как инструмент автоматизации и снижения издержек операционной деятельности;

3. Информационная система как инструмент, обеспечивающий информационную поддержку процессов принятия решений.

В данном практикуме делается допущение о том, что в коммерческом банке ценность решений класса Big Data лежит в области аналитического обеспечения бизнес-процессов предприятия, т.е. относится к третьему виду

ценности. Такое допущение позволяет использовать для оценки результативности решений Big Data методику оценки экономической эффективности аналитических информационных систем (далее - методика ЭАИС), представленную в [2].

Методика ЭАИС верхнеуровнево предполагает следующую последовательность сбора информации и вычисления показателя эффективности:

1. Оценка затрат C на аналитическую систему по методике Совокупной стоимости владения. В целом расходы на информационную систему чётко прослеживаются в финансовом учёте предприятия на основе, например, модели совокупной стоимости владения (Total Cost of Ownership, TCO), построенной Gartner Group при условии незначительного изменения структуры бизнес-процессов.

2. Оценка прибыльности W совокупности бизнес-процессов, в которых используется информационная система за рассматриваемый период. В модели ЭАИС экономический результат W - это значение предпринимательской прибыли бизнеса предприятия, представленное денежной величиной, приведенной к выбранному моменту времени.

3. Вычисление вклада di каждого процесса принятия решений в

прибыль ( " = 1 ).

i

4. Вычисление вклада Si исследуемой аналитической системы в каждый процесс принятия решений ('i : 0 < si < 1 ).

5. Вычисление показателя фактической экономической эффективности

информационной системы E = " sidiWC ■

i C

Иными словами, экономическая эффективность рассматриваемой системы вычисляется как доля в прибыли бизнеса на единицу затрат, причем эта доля пропорциональна общей вовлеченности аналитической системы в процессы принятия решений и её «незаменимости» для принятия конкретных решений. Методика допускает незначительные модификации под специфику конкретной задачи инвестиционной оценки (например, в качестве знаменателя иногда выгодно использовать не все затраты на ИТ, а только капитальные инвестиции или наоборот только постоянные операционные затраты).

Представленная методика предназначена для оценки отдельной аналитической системы, основная часть используемых данных представляет собой финансовые показатели, модель учитывает действие неосязаемых выгод на экономический результат, используемые инструменты не требуют экспертной оценки.

Для оценки эффективности аналитической системы необходимо провести анализ бизнес-процессов, в которых есть элементы процессов

принятия управленческих решении и участвует анализируемая система. Данный практикум основывается на допущении, что работа с системами Big Data в исследуемом коммерческом банке будет выстроена на основе стандартной методологии организации проектов в области Data Mining CRISP-DM (рис. 1).

Понимание бизнеса

Внедрение

Оценка результата

Понимание данных

Подготовка данных

Моделирование

Рис.1. Схема модели CRISP-DM (CRoss Industry Standard Process for Data Mining)[3] Методология CRISP-DM предполагает, что процессы интеллектуального анализа данных (Data Mining) при построении аналитической модели и её внедрении устроены определенным циклическим образом. Соответствующий бизнес-процесс содержит целый ряд аналитических задач, для решения которых используется инструментарий Big Data. Кроме того, он предполагает наличие методики оценки результата построенной модели, т.е. оценки экономического результата (прибыльности) применения построенной модели на основе понимания бизнеса.

Табл.1. Переменные модели оценки эффективности технологий Big Data

Переменная Ед. Описание Способ вычисления

Years шт Целевой период окупаемости инвестиций Считаются известными входными параметрами задачи

ROE % Целевое значение возврата на акционерный капитал

CapEx $ Первоначальные инвестиции в Big Data

OpEx $ Ежегодные затраты на Big Data 30% от CapEx

N шт Количество аналитиков (специалистов в области Data Science) Определяется заказчиком (фиксирует уровень риска при

неблагоприятно м развитии событий)

Salary $ Ежегодные затраты на аналитика (data scientist, зарплата и накладные расходы) Рыночная величина

Tasks шт Количество проектов на аналитика в год Рыночная объективная величина

Success % Доля успешных проектов у аналитика

Value $ Средний экономический результат от успешного проекта

BigDataValue % Вклад технологий BigData в получение результата В соответствии с методикой ЭАИС

На основе сделанных допущений для проведения расчёта будущей экономической эффективности комплекса Big Data необходимо сделать прогноз ключевых параметров будущих характеристик проектных активностей, связанных с Большими данными. Описание величин приведено в Таблице 1. Тогда целесообразность закупки определяется следующей совокупностью условий (1).

BigDataValue ■ N ■ Value ■ Success ■ Tasks - N ■ Salary - OpEx > roe

(1)

E=

CapEx

Years ■ {BigDataValue ■ N ■ Value ■ Success ■ Tasks - N ■ Salary -

Наибольшую неопределенность в результат вычислений вносит величина BigDataValue. Для её оценки необходимо определить значения вкладов di и Si методики ЭАИС.

Для вычисления di в данном практикуме целесообразно использовать метод на основе экспертных оценок относительной значимости этапов бизнес-процесса, представленных на рис.1. Для структурирования экспертных оценок в этом случае оптимально построить матрицу попарных сравнений (компонента метода анализа иерархий [4]) и на её основе получить вектор относительной значимости бизнес-процессов.

Для определения значений si в условиях отсутствия статистических данных применяется формула (2), где Pi - вероятность принятия правильного решения аналитиком без использования Big Data. С учётом, что в данном практикуме используются большие слабоструктурированные данные, то разумным допущением для процессов «Понимание данных», «Подготовка данных», «Моделирование» и «Оценка результата» будет оценка Pi = 0 (т.е. вклад аналитика и инструментария в процессы анализа равны, они не могут обойтись друг без друга в равной мере). Для оставшихся процессов для простоты можно считать, что Pi = 0,5 (что означает, что деятельность аналитика в этих процессах возможна и без инструментов Big Data).

1 - P

2

(2)

Представленных параметров и алгоритмов достаточно для проведения расчёта, если известны исходные данные. Для определенности возьмем следующие входные параметры, отражающие возможные решения менеджмента коммерческого банка:

• целевой период окупаемости инвестиций (Years) - 5 лет;

• целевой возврат на акционерный капитал (ROE) - 20%;

• первоначальные инвестиции в Big Data (CapEx) - 16 млн.руб.;

• количество аналитиков (N) - 3 чел.;

• ежегодные затраты на аналитика (Salary) - 4 млн.руб.;

• количество проектов на аналитика в год (Tasks) - 6 шт;

• доля успешных проектов у аналитика (Success) - 40%;

• средний результат успешного проекта (Value) - 7 млн.руб.;

• вклад технологий Big Data (BigDataValue) - 41% (Таблица 2).

Табл.2. Вычисление вклада технологий Big Data

Параметр Пон има ние биз неса Пониман ие данных Подготов ка данных Модел-ние Оценк а рез-та Внедрени е

Матрица попарных сравнений Понимание бизнеса l 2 3 2 S б

Понимание данных Q.S l 2 l 3 4

Подготовка данных Q.33 Q.S l Q.S 2 3

Моделировани е Q.S l 2 l 2 3

Оценка результата Q,2 Q.33 Q.S Q.S l 2

Внедрение Q.l67 Q.2S Q.33 Q.33 Q.S l

Относительная значимость (di) Q.28 Q.2Q Q.l8 Q.l6 Q.Q9 Q.Q9

Вклад в процесс анализа (si) Q.2S Q.S Q.S Q.S Q.S Q.2S

Итого (BigDataValue) " Sidi =41%

Подстановка значений в формулы позволяет увидеть, что отдача от инвестиций составляет 23% (что больше целевого значения 20%). Общий результат экономической деятельности (без учёта изменчивости стоимости денег во времени) в виде разницы между суммарной прибылью и общими расходами за весь период в горизонте планирования 5 лет

положителен и составляет 2.6 млн.руб.

Несмотря на положительный результат не трудно заметить, что данная инициатива с экономической точки зрения находится на грани целесообразности. Незначительные отклонения в целевых значениях приведут к неэффективности инвестиций как с точки зрения ожидаемой доходности, так и с точки зрения периода окупаемости. С другой стороны, внедрение технологий Big Data не ограничивается экономическим эффектом. Внедряя современные технологии, компания получает возможность реализовать конкурентные преимущества в самых разных формах.

Представленная схема оценки демонстрирует основные особенности анализа эффективности решений на основе эффективности Big Data. Как видно из представленного примера, технологии имеют длинный срок окупаемости и часто могут быть не целесообразны (т.к. альтернативные решения, такие как аутсорсинг экспертизы и аренда технологий могут быть более эффективны).

Основным направлением дальнейших работ по теме исследования является выполнение данного практикума на реальных характеристиках российского коммерческого банка при принятии решения о целесообразности инвестиций в технологии Big Data.

Представленный подход оставляет широкие возможности теоретического развития для решения смежных задач планирования инвестиций. Основными линиями такого развития может стать фокус на выбор из нескольких возможных вариантов инвестирования и более широкий анализ структуры сопутствующих экономических выгод.

Литература

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1. Зимин К.В., Маркин А.В., Скрипкин К.Г. Влияние информационных технологий на производительность российского предприятия: методология эмпирического исследования, Бизнес-информатика, № 1, 2012. - с. 41.

2. Середенко, Е.С. Оценка экономической эффективности аналитических информационных систем: дис. ... канд. эконом. наук: 08.00.13 / Середенко Евгений Сергеевич. - М., 2014. -168с.

3. Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T, & Shearer, C., et al. (2000). CRISP-DM 1.0: Step-by-step data mining guide. SPSS. URL: http://www.the-modeling-agency.com/CRISP-DM.pdf.

4. Саати Т. Л. Принятие решений при зависимостях и обратных связях: Аналитические сети. -М.: Издательство ЛКИ, 2008. - 360 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.