УДК 338.124.4; 336(73)
ИНТЕЛЛЕКТУАЛЬНЫЙ АНАЛИЗ ДАННЫХ КАК ИНСТРУМЕНТ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В СИСТЕМЕ БАНКОВСКОГО ФИНАНСОВОГО МЕНЕДЖМЕНТА
В.В. Евсюков
Применяемые в банковской практике инструментальные средства, способствующие решению задач финансового менеджмента, в большей своей части реализуют методы математической статистики, базирующиеся на концепции усреднения по выборке данных. Однако динамизм процессов внешней среды (финансовых рынков, законодательной и нормативной базы, бизнеса клиентов и др.) обусловливает необходимость своевременного выявления изменений тенденций этих процессов в целях оперативного и адекватного управления банковской деятельностью. В статье рассмотрены возможности использования технологий интеллектуального анализа данных в банковском финансовом менеджменте.
Ключевые слова: банковский менеджмент, принятие решения, инструменты моделирования, методы математической статистики, интеллектуальный анализ данных, система поддержки принятия решений.
Особенности подходов к решению задач в системе банковского
финансового менеджмента
Актуальной задачей текущего момента для российской банковской системы в целом является повышение ее конкурентоспособности. Значительная роль в решении данной задачи отводится усилению эффективности финансового менеджмента банков, прежде всего в реализации основных целей банковской деятельности:
• повышение прибыльности при приемлемом уровне риска;
• обеспечение ликвидности при оптимизации объема прибыли;
• снижение рисков, особенно связанных.
Сложность достижения этих целей предопределяется особым местом банков в системе хозяйственных отношений:
• высокой степенью вовлеченности (непосредственно или косвенно) в деятельность многих своих клиентов и контрагентов, что предполагает необходимость регулярного мониторинга и анализа результатов их деятельности (в той или иной степени);
• преимущественным формированием банковского финансового капитала на основе привлеченных клиентских средств, что предопределяет акцентирование внимания на анализе динамики финансовых показателей и потоков денежных средств;
• разносторонним характером взаимодействия с финансовыми рынками, которым свойственно увеличение динамизма процессов изменения ликвидности, что дополнительно усиливает важность своевременного выявления изменений в тенденциях развития процессов.
Системный подход к управлению банковской деятельностью предполагает рассмотрение банка, с одной стороны, как системы взаимосвязанных и взаимозависимых элементов, ориентированных в своей деятельности на достижение общих целей, а с другой стороны, как открытой системы, взаимодействующей с внешней средой посредством многих процессов.
Эти особенности, а также обострение конкуренции на рынке банковских услуг, возрастание рисков банковской деятельности, усиление роли своевременности и оперативности принимаемых управленческих решений с возрастанием значимости прогнозных оценок на временных горизонтах различной длительности обусловливают поиск новых подходов к решению задач финансового менеджмента.
Согласованное управление активами и пассивами, риск-ориентированный, клиенто-ориентированный, процессно-
ориентированный подходы и другие технологические решения отражают результаты непрерывного поиска оптимальных стратегий управления, позволяющих быстро и эффективно адаптироваться к изменениям внешней среды, предвосхищать такие изменения, находить и быстро внедрять в практику конкурентоспособные новации.
Наиболее характерными особенностями современных подходов к реализации задач банковского финансового менеджмента, адекватных нарастанию их сложности, являются:
• повышение роли и ответственности банковского менеджмента за конечные результаты деятельности банка; учет взаимосвязей различных процессов; усиление внимания к управлению и оптимизации сквозных процессов, выполнение которых связанно с участием нескольких структурных подразделений банка;
• системный подход к моделированию бизнеса и управлению им;
• усиление роли прогнозирования на различных временных горизонтах;
• применение современных методик оценки рисков и введение уровня рисков в интегральный критерий качества как частного критерия в задаче управления;
• усиление внимания к клиентам с учетом взаимосвязи оказываемых им услуг (формирование портфеля услуг для конкретного клиента);
• своевременная адаптация процессов управления к изменениям внешней среды и бизнеса.
В целом современные решения организации банковского финансового менеджмента предполагают реализацию интегрированного подхода к управлению, при котором основное внимание концентрируется на конечных финансовых результатах деятельности банка как обобщенных критериях качества в задаче управления. При этом речь идет о согласованном управлении, позволяющем искать оптимизационные для банка решения исходя из необходимости рассмотрения отдельных задач как совокупности
взаимосвязанных задач (аналогично портфельному подходу).
В формализованном виде такой подход к управлению предполагает постановку и решение многокритериальной оптимизационной задачи, когда общий критерий эффективности банковской деятельности определяется суммой взвешенных частных критериев, связанных с оказанием конкретных банковских услуг на долговременной основе.
Однако решение оптимизационных задач в аналитическом виде методами классической математики возможно только в простейших случаях. Из-за характерного для банковской практики влияния большого числа переменных, наличия ограничений, нелинейностей, запаздываний, резких изменений значений переменных и других особенностей, аналитические решения, как правило, могут быть получены только в режиме малых отклонений относительно равновесных точек, что значительно ослабляет практическую ценность результатов для управления реальными процессами. Высокий уровень сложности связанных с банковской деятельностью процессов и систем (в том числе и финансовых рынков), обладающих способностью самоорганизации, предопределяет поиск управленческих решений в условиях, когда математически строгая формализация постановки задачи невозможна [1].
В целом задачи банковского финансового менеджмента относятся к трудно формализуемым или слабо структурированным задачам, которым присущ ряд особенностей:
• их постановка не может быть полностью определена в математической форме и во многом связана со смысловым представлением в рамках конкретной предметной области;
• для них характерны неполнота, неоднозначность, неопределенность, противоречивость как исходной информации, так и используемых правил ее преобразования;
• цели их решения во многих случаях не могут быть выражены в виде одного формально определенного критерия;
• для поиска их решений необходимо применять не только формализованные алгоритмы, но и эвристические и эволюционные процедуры, а также сочетания формализованных алгоритмов с такими процедурами;
• искомые результаты отражают рациональные решения, которые могут быть представлены как в количественной, так и семантической (качественной) форме.
Ввиду отсутствия, как правило, формализованных алгоритмов решения трудно формализуемых задач используемые в этих целях инструментальные средства должны обладать способностью к самообучению, возможностью работы с неполными и неточными данными, обеспечивая при этом приемлемую точность. Поскольку для задач такого уровня сложности во многих случаях возможно формирование ряда приемлемых альтернативных решений, то выбор конкретного (наилучшего) решения в условиях значительной неопределенности является одной из основных
проблем интеллектуальной поддержки принятия управленческих решений.
Процесс принятия управленческих решений как обоснованный выбор варианта действий из множества допустимых вариантов предполагает:
• построение различного рода моделей (экономических, математических и др.) для решаемых задач, адекватно отражающих свойства реальных процессов;
• выбор показателей полезности, описание множества допустимых решений, задание целевой функции;
• определение экстремального значения целевой функции и соответствующего ему решения.
Теория принятия решений (как математическая дисциплина) оперирует с количественными и качественными факторами; поэтому при решении практических задач важно учитывать не только формальные, но и содержательные и методологические аспекты проводимых исследований [2].
СППР в банковском менеджменте
Системы поддержки принятия решений (СППР) первого поколения представляли собой пакеты прикладных программ с динамическим формированием последовательностей SQL-команд на выборку данных из баз данных систем оперативной обработки транзакций, или OLTP-систем (OnLine Transaction Processing), в соответствии с запросом пользователя, не требуя от него знания языка SQL.
Практика построения СППР на базе OLTP-систем, в том числе и в рамках решения задач банковского финансового менеджмента, показала, что они, как правило, отвечают типовым повседневным потребностям обработки данных, просты в применении, содержат в себе предопределенное множество запросов. Формирование запросов, не входящих в состав типового перечня, но затребованных в процессе подготовки управленческих решений, связано с постановкой новых задач для программистов. С позиции оперативности управления системы подобного класса можно отнести к статическим СППР. Тем не менее, функционирование в составе автоматизированных банковских систем (АБС) подсистем с обобщенным названием "Анализ деятельности банка", обеспечивающих получение оперативной информации о состоянии, движении и планируемых перемещениях активов и пассивов банка, зачастую оказывается реализованным именно на базе OLTP-систем. В подобных подсистемах решаются задачи расчета экономических нормативов, подготовки финансовой отчетности банка в соответствии с требованиями Банка России, анализ активов и пассивов по срокам погашения, прогнозирования динамики кредитных ресурсов и кредитных вложений и др. Однако OLTP-системы практически не работают с хранящимися в архивах данными в целях решения задач анализа.
Интенсивному развитию СППР способствовало появление OLAP-систем (On-Line Analytical Processing), реализующих принцип многомер-
ного представления данных, упрощающего проведение многомерного анализа. При этом данные рассматриваются не как отображение отдельных событий, а как их совокупный результат за некоторый период времени. Современные OLAP-системы реализуются на основе хранилищ данных (Data Warehouse), что позволяет разным приложениям оперировать с имеющимися данными в различных разрезах, рассматривать их как временные ряды, как массивы данных, характеризующих территориальное размещение (сеть филиалов) клиентов, банковских продуктов и др.
OLAP-системы обеспечили возможность проведения текущего финансового анализа и других расчетов в режиме реального времени с использованием всего содержимого хранилищ данных. Таким образом, OLAP-системы стали основой динамических СППР, обладающих возможностями выполнения нерегламентированных запросов пользователей (аналитиков, руководителей и др.) в интерактивном режиме работы со всеми доступными данными. В целом оперативная аналитическая обработка данных позволяет:
• использовать многомерную модель данных для анализа финансовых показателей в различных разрезах с несколькими уровнями их агрегирования;
• реализовывать традиционные методы и приемы анализа;
• формировать в диалоговом режиме не регламентные запросы и отчеты, в том числе "на лету";
• исследовать влияние поступающих данных на интересующие пользователя текущие значения финансовых показателей и др.
Основой СППР следующего поколения стали интеллектуальные информационные технологии (ИИТ), обеспечивающие возможности проведения интеллектуального анализа данных (ИАД).
Технологии ИАД ориентированы на выявление скрытых, неочевидных и объективно существующих причинно-следственных взаимосвязей между различными факторами в больших объемах данных (например, в совокупности данных о выданных кредитах и сведениях об их погашении). Эти технологии являются основным инструментом исследования сложных процессов и обнаружения в них фрагментов с однородными свойствами или шаблонов (паттернов), отражающих особенности многоаспектных отношений в данных, которые могут быть компактно выражены в понятной пользователю форме. При этом технологии ИАД позволяют как бы осмыслить данные, оценить их как с количественной, так и с качественной точек зрения.
В западной специализированной литературе для обозначения области разработки систем извлечения информации и знаний из баз и хранилищ данных наиболее широко используются термины "Data Mining" (DM) и "Knowledge Discovery in Databases" (KDD).
Технологии DM ориентированы на выявление в результате обработки больших массивов многомерных данных шаблонов (паттернов), характерных для тех или иных частей этих неоднородных данных; при этом
DM берет на себя задачу формулировки гипотез, сохраняя за пользователем возможность принять или отвергнуть конкретную гипотезу.
Технологии KDD в большей степени соответствуют формированию знаний на основе "заготовок" знаний, полученных в результате применения технологий DM, например формированию ассоциативных правил, логических правил и других моделей знаний, которые непосредственно используются в качестве содержимого баз знаний прикладных систем. В отличие от технологий DM, технологии KDD связаны с широким спектром задач поиска знаний и используются в приложениях более высокого уровня, в том числе и в области искусственного интеллекта. Таким образом, процесс KDD ориентирован на максимально достижимый в современных условиях уровень извлечения знаний из имеющихся данных и создание высокоуровневых моделей для баз знаний, используемых в дальнейшем в системах класса СППР.
Основным свойством технологий ИАД, предопределяющим их эффективные возможности при решении с приемлемой точностью трудно формализуемых задач, является их способность к самообучению.
Алгоритм, являющийся основой решения структурированных задач, превратился в инвариантное программное средство (своего рода программную среду), обеспечивающее поиск приемлемого решения трудно формализуемых задач. Поэтому функционирование систем ИАД во многих случаях организуется на основе алгоритма обработки (реализации) эмпирических правил, а не алгоритма решения задачи (последний строится непосредственно в процессе поиска решения на основе алгоритма обработки правил). По-сути, в основе ИИТ используются рекуррентные алгоритмы оптимизации какого-либо функционала, определяющего качество решения задачи; при этом сам алгоритм определяется как свойствами функционала, так и особенностями обрабатываемых данных. Иногда для обозначения систем ИАД используют термин "системы, управляемые данными", подчеркивая тем самым присущие им гибкие адаптационные возможности настройки процесса поиска под особенности анализируемых данных.
Инструментальные средства ИАД
ИАД как мультидисциплинарная область, возник и развивается на базе достижений прикладной статистики, методов искусственного интеллекта, теории баз данных и других методов, что предопределило обилие методов и алгоритмов ИАД, реализованных в различных прикладных системах.
Инструментарий ИАД включает широкий спектр средств:
• статистические пакеты;
• деревья решений;
• нейронные сети;
• генетические алгоритмы;
• нечеткую логику и др.
Методы математической статистики и реализующие их статистические пакеты обычно включают в инструментарий систем ИАД. Однако ис-
пользование этих методов, как правило, предполагает наличие априорных допущений о типах моделей анализируемых данных, соответствие данных нормальному закону распределения, предобработку данных (например, нелинейное преобразование с целью их соответствия нормальному закону распределения), профессиональную интерпретацию получаемых результатов (необходима специальная подготовка пользователей) и др.
Кроме того, системы этого класса требуют больших объемов данных для получения достоверных результатов анализа, что не всегда возможно в банковской практике. В то же время большие объемы данных во многих случаях не облегчают проведение анализа, поскольку на значительных временных интервалах они описывают изменяющиеся тренды и различные фазы развития процессов, что из-за концепции усреднения по выборке данных может приводить к операциям с малосодержательными или фиктивными величинами (средними остатками, оборотами, платежами и др.). Концепция усреднения также затрудняет исследование внутренней структуры данных (т.е. проведение структурного анализа), что снижает, в конечном счете, оперативность управления процессами.
Под термином "деревья решений" подразумевается семейство алгоритмов, основанных на создании в процессе поиска решения древовидной иерархической структуры, и обеспечивающих принятие решения на основе классифицирующих правил типа "ЕСЛИ ... ТО ..." Подобные алгоритмы формируют ряд уровней последовательного разделения данных, разбивая группы (ветви дерева) более высокого уровня на мелкие с учетом системы конкретных признаков.
Алгоритмы построения деревьев решений позволяют предсказать значение какого-либо параметра для заданного случая, например, возвратит ли вовремя заемщик, ранее выданный ему кредит, на основе большого количества данных о других подобных случаях (в частности, на основе сведений о других лицах, которым выдавались кредиты). Однако при построении сложных разветвленных последовательностей проявляется влияние проблемы значимости, когда при большом числе частных случаев не хватает необходимого количества конкретных обучающих примеров, что, в свою очередь, снижает достоверность выводов.
Поэтому при решении широкого круга задач банковского финансового менеджмента целесообразно использовать непараметрические методы анализа, к которым относятся и методы искусственного интеллекта, изначально не требующие априорного знания о свойствах анализируемых данных и работоспособные на малых выборках данных. Снятие ограничений на анализируемые данные приводит к определенной потере информативности выводов, однако при этом возрастает их надежность и обоснованность.
Нейросети образуют большой класс систем, в которых реализуются попытки эмуляции механизмов работы нейронов, аналогично их функционированию в мозге человека Нейросеть представляет собой параллельную,
распределенную, адаптивную систему, которая восстанавливает скрытые закономерности и развивает свои способности по обработке информации в результате обучения. После обучения нейросеть аппроксимирует с требуемой точностью заранее неизвестные функциональные зависимости, решающие правила (распознавание образов, диагностика состояний, прогнозирование ситуаций и др.) и другие скрытые закономерности. Таким образом, нейросеть извлекает (в процессе обучения) знания из обучающих выборок (массивов) данных и реализует оптимизацию собственной структуры на их основе. Тем самым функционирование нейросети осуществляется на основе принципа эвристической самоорганизации, подразумевающего существование оптимальной нейросетевой структуры, обеспечивающей заданное значение критерию качества, дальнейшее усложнение которой приведет к ухудшению качества принятия решений.
Нейросеть не может представить знания в аналитической форме; в результате обучения она строит модель исследуемого процесса и в дальнейшем воспроизводит его поведение (в том числе и для нелинейных процессов), оставаясь при этом "черным ящиком" для пользователя.
Применение нейросетевых технологий в ряде практических приложений показывает достаточно высокую эффективность, например, при исследовании динамики финансовых рынков и прогнозировании ценовых колебаний финансовых инструментов, определении оптимального портфеля ценных бумаг, предсказаниях банкротств финансовых учреждений, определении кредитных рисков и др.
Генетические алгоритмы - это методы случайного глобального поиска, копирующие механизмы естественной биологической эволюции, позволяющие накапливать удачные решения для сложных систем, состоящих из относительно независимых подсистем.
Эти алгоритмы хороши при решении задач высокой размерности со сложными внутренними связями, для которых невозможно получить решение в аналитическом виде; при этом генетические алгоритмы обеспечивают высокую скорость и эффективность решения задач.
Генетические алгоритмы представляют собой метод параллельного поиска наилучшего (оптимального) решения, при котором одновременно анализируются несколько вариантов возможных решений, что практически исключает вероятность "зависания" алгоритма (попадания в локальный экстремум целевой функции).
Данные алгоритмы находят применение при формировании инвестиционного портфеля с оптимизацией доходности и учетом риска, при разработке бизнес-плана с оптимизацией прибыли и учетом потенциальных издержек, финансовом планировании с оптимизацией налоговых платежей с учетом будущих доходов и др.
Относительно новым направлением для российской банковской практики является использование аппарата нечеткой логики при подготовке управ-
ленческих решений. Ее применение позволяет в большей мере оперировать качественными параметрами, отражающими основные особенности функционирования объектов при неточных (зашумленных) и противоречивых данных, описывающих их поведение. В целом аппарат нечеткой логики позволяет сократить время настройки (адаптации) системы управления и обеспечить приемлемый уровень точности в условиях значительной неопределенности.
Нечеткая логика в определенной степени распространяет постулаты булевой логики на область действительных чисел. В основе нечеткой логики лежит определение нечеткого множества, т.е. класса с множеством степеней принадлежности, принимающих значения в диапазоне между 0 и 1. Во многом функция принадлежности нечеткого множества схожа с функцией плотности вероятности. Это позволяет определить количественную оценку значения так называемой "частичной" истины (в отличие от двух противоположных значений "истинно" или "ложно"), находящейся в указанном диапазоне.
В ряде западных банков внедрены экспертные системы на основе нечеткой логики для оценки кредитоспособности заемщиков, принятия решений на рынке ценных бумаг и раскрытия финансовых злоупотреблений, осуществляется оценка риска при лизинге автомобилей.
К основным типам закономерностей, отражающих проявления причинно-следственных связей в массивах данных, эффективно выявляемых на основе инструментария ИАД, относятся: ассоциация, последовательность, классификация, кластеризация, прогнозирование.
Ассоциация имеет место в случае, когда несколько событий каким-либо образом связаны друг с другом. Технологии ИАД позволяют выявлять паттерны типа ассоциативных правил, которые далее могут использоваться для формирования продукционных баз знаний в СППР. Актуальными приложениями анализа ассоциаций являются решения задач, связанных с выполнением банками требований Федерального закона №115 ФЗ, выявлением связанных заемщиков в рамках кредитной деятельности с целью минимизации кредитного риска, обнаружением и блокированием мошеннических операций с платежными картами и др.
Последователъностъ проявляется при наличии цепочки связанных во времени событий. Например, получение кредита на приобретение нового оборудования во многих случаях влечет за собой потребность в дополнительных кредитах для пополнения оборотных средств. Выявление последовательностей способствует, в частности, оптимизации формирования портфелей банковских услуг для различных групп клиентов.
Классификация нацелена на решение задачи отнесения отдельного события, конкретной ситуации, данных к одному из классов, множество которых фиксировано. Одна из наиболее востребованных задач в этой области - анализ финансового состояния банков и их классификация в заданной системе показателей (активы, пассивы и др.).
Кластеризация используется при поиске конечного числа категорий,
разделяющих множество данных на, возможно, непересекающиеся подмножества (группы, классы). При этом элементы формируемых подмножеств должны характеризоваться схожими свойствами внутри каждого подмножества и отличаться от элементов других подмножеств. По существу кластеризация есть инструмент разделения данных на классы без предварительного задания классифицирующих атрибутов. На практике часто множество данных (объектов) сначала разделяется на кластеры, а затем определяется множество классифицирующих правил, соответствующих проведенной кластеризации. В рамках банковской деятельности типовой задачей кластеризации является группировка потенциальных заемщиков по категориям надежности.
Прогнозирование - один из важнейших факторов, определяющих эффективность решения всего спектра задач банковского финансового менеджмента, поскольку любое управление должно быть прогностическим. Для банка важно прогнозирование на различных временных горизонтах как состояния банковского макроокружения, так и финансовых показателей, характеризующих его собственную деятельность.
В целом для технологий ИАД характерны следующие особенности:
• возможность общения с пользователем на языке, свойственном его профессиональной деятельности;
• способность выполнения произвольных запросов пользователя в диалоговом режиме;
• относительно невысокие требования к квалификации пользователей в области математической статистики и информационных технологий;
• направленность на решение слабоструктурированных, плохо формализованных задач; возможность использования разнотипной информации; формирование выводов на малых выборках данных; работоспособность на зашумленных данных; учет индивидуальных особенностей исследуемых объектов;
• выявление в результате обработки больших объемов данных объективно существующих причинно-следственных связей, значимых корреляций, ассоциаций; формирование по результатам обработки данных базы знаний и ее использование в процессе подготовки управленческих решений; способность к саморазвитию на основе накапливаемого в процессе решения задач опыта;
• формирование ряда допустимых альтернативных решений с оценкой их качества (степени пригодности) в целях эффективного управления объектами (процессами);
• использование широкого спектра методов (математических, индуктивных, эвристических и др.) при поиске решения задачи;
• возможность выявления внутренней структуры анализируемых данных и повышения благодаря этому точности и обоснованности формируемых выводов;
• реализация алгоритмов параллельной обработки данных, уско-
ряющих поиск решения и обеспечивающих во многих случаях формирование результатов в реальном времени;
• использование гибридных технологий в целях повышения эффективности управления.
В то же время следует отметить, что для успешного применения инструментария ИАД необходимы специалисты в области современных методов обработки и анализа данных, способные оптимизировать настройку используемых в системах технологий для решения конкретных бизнес-задач и оказывать (при необходимости) помощь в интерпретации получаемых в процессе решения результатов.
Таким образом, в настоящее время технологии ИАД являются одним из наиболее перспективных направлений разработки интегрированных информационных технологий, призванных обеспечить нетривиальный анализ разнородных данных в целях извлечения из них скрытых знаний, и их использования в СППР при решении широкого спектра задач банковского финансового менеджмента в условиях непрерывного изменения экономических реалий.
Список литературы
1. Евсюков В.В. К вопросу достижимости оптимальных решений в банковском менеджменте. // Известия ТулГУ. Экономические и юридические науки. Вып.1. Ч.1 - Тула: Изд. ТулГУ, 2014. с. 215-225.
2. Федунец Н.И., Куприянов В.В. Теория принятия решений. М.: Изд. МГГУ, 2005. 218 с.
Евсюков Владимир Васильевич, канд.техн.наук, доц., доцент Тульского филиала Финуниверситета, Россия, Тула, Финансовый университет при Правительстве Российской Федерации
DATA MINING AS A TOOL FOR DECISION SUPPORT IN THE BANKING SYSTEM
FINANCIAL MANAGEMENT
V. V. Evsujkov
Applied in banking practice tools, contributing to the decision of tasks of financial management, for the most part implement the methods of mathematical statistics, based on the concept of averaging over the sample data. However, the dynamism of the processes in the external environment (financial markets, legislative and regulatory framework, business clients and others) necessitates timely detection of changes in these processes in order to provide efficient and adequate management of banking activities. The article considers the possibility of using data mining technology in banking and financial management.
Keywords: banking management, decision making, modeling tools, methods, mathematical statistics, data mining, system decision support.
Evsujkov Vladimir Vasilevech, candidate of technical science, docent, evsvl@yandex.ru, Russia, Tula, FinUniversity