Научная статья на тему 'Применение гибридных систем в задачах скоринговой оценки кредитоспособности юридических лиц'

Применение гибридных систем в задачах скоринговой оценки кредитоспособности юридических лиц Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
636
173
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КРЕДИТНЫЙ СКОРИНГ / ГИБРИДНЫЕ СИСТЕМЫ / НЕЧЕТКИЙ НЕЙРОГЕНЕТИЧЕСКИЙ АЛГОРИТМ / CREDIT SCORING / HYBRID SYSTEMS / FUZZY NEIROGENETIC ALGORITHM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Рындин А. А., Ульев В. П.

В статье рассматриваются аспекты задачи скоринговой оценки кредитоспособности юридических лиц. Рассмотрены цели и требования к экспертной системе. Рассмотрены современные методики реализации экспертных систем с использованием технологий искусственного интеллекта. Предложен подход построения гибридной нечеткой нейрогенетической экспертной системы принятия решений. Приводится пример компоновочной блок-схемы алгоритма гибридной нечеткой нейрогенетической скоринговой системы оценки кредитоспособности юридических лиц

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF HYBRID SYSTEMS IN PROBLEMS SCORING CREDIT RATING OF CORPORATE CLIENTS

The article deals with aspects of the problem scoring credit ratings of legal persons. Examined whether the chain-and the requirements for an expert system. The modern methods of implementation of expert systems with the use of artificial intelligence technologies. We propose an approach for constructing hybrid fuzzy expert neyrogeneticheskoy-term decision-making system. Is an example of building block-scheme of algorithm of hybrid fuzzy neurogenic-optical scoring system credit assessment of corporate clients

Текст научной работы на тему «Применение гибридных систем в задачах скоринговой оценки кредитоспособности юридических лиц»

УДК 004.891

ПРИМЕНЕНИЕ ГИБРИДНЫХ СИСТЕМ В ЗАДАЧАХ СКОРИНГОВОЙ ОЦЕНКИ КРЕДИТОСПОСОБНОСТИ ЮРИДИЧЕСКИХ ЛИЦ

А.А. Рындин, В.П. Ульев

В статье рассматриваются аспекты задачи скоринговой оценки кредитоспособности юридических лиц. Рассмотрены цели и требования к экспертной системе. Рассмотрены современные методики реализации экспертных систем с использованием технологий искусственного интеллекта. Предложен подход построения гибридной нечеткой нейрогенетической экспертной системы принятия решений. Приводится пример компоновочной блок-схемы алгоритма гибридной нечеткой нейрогенетической скоринговой системы оценки кредитоспособности юридических лиц

Ключевые слова: кредитный скоринг, гибридные системы, нечеткий нейрогенетический алгоритм

Принятие решения о кредитовании потенциального заемщика основывается на оценке такого показателя заемщика как его кредитоспособность. Этот показатель определяет способность потенциального заемщика полностью и в срок рассчитаться по долговым обязательствам и является важнейшим фактором в системах принятия решений по кредитованию. Суть скоринговой системы принятия решений состоит в определении некой оценки или балла кредитоспособности потенциального заемщика, позволяющей произвести его категори-рование и выработать решение о кредитовании.

Важной задачей кредитного скоринга в условиях крупного производства является построение централизованной системы оценки и принятия решения, что предполагает решение следующих подзадач:

- разработка и оптимизация скоринговых моделей;

- управление кредитными продуктами - задание соответствий между моделями и типами кредитных продуктов, использование для различных целевых групп различных моделей оценки;

- создание стратегии принятия решений -создание правил интерпретации скоринго-вого результата, формирование принципов стратегии принятия решения по кредитной заявке.

- мониторинг принятых решений на основе1 скоринговых оценок.

Базовым элементом любой скоринговой системы является скоринговая модель - математическая модель, позволяющая сопоставить характеристикам заемщика численное значение, удельный вес или скоринговый рейтинг, представляет собой набор финансово-экономических и иных показателей потенциального заемщика, которые предположительно оказывают влияние на итоговую скоринговую оценку. Проблематика выбора скоринговой модели

Рындин Александр Алексеевич - ВГТУ, д-р техн. наук, профессор, тел. (473) 243-77-04, e-mail: [email protected] Ульев Виталий Петрович - ВГТУ, соискатель, тел. 8(903) 850 49 37, e-mail: u [email protected],

заключается в определении оптимального набора показателей, оказывающих наибольшее влияние в заданных условиях на итоговую оценку. Каждый из показателей может оказывать соответственно сильное или слабое влияние, или не оказывать его вовсе. Использование же избыточного набора показателей в целом усложняют процесс анализа, непосредственно приводит к увеличению времени анализа, а также вносит некий момент зашумления итогового результата. Таким образом, целевая функция определения лучшей скоринговой модели должна определяться следующими критериями: минимальное количество используемых показателей, выбранных исходя из их наибольшей значимости, определяющих минимальную погрешность оценки относительно эталонного результата.

Каждая скоринговая модель, как часть общей системы имеет свой жизненный цикл, который состоит из следующих этапов: разработка, внедрение и корректировка. При разработке скоринговой модели определяется ее назначение, цель и условия функционирования, или целевая генеральная совокупность. Цели могут быть общими и специальными, и в целом осуществляют категорирование моделей. Назначение модели будет влиять на решения, начиная от определенного результата и заканчивая применением. Условия функционирования определяют ограничения, в рамках которых модель будет результативна, т.е иметь значение функции в ожидаемых пределах. В свою очередь, задание ожидаемых значений целевой функции определяется совокупностью цели и назначения модели.

Особенно важное место в процессе разработки скоринговой модели занимает определение независимых переменных, или критериев оценки. Важно не только определить их минимально необходимый набор для достижения порога актуальности оценки, но и задать коэффициент влияния, или удельный вес критерия оценки.

Скоринговая карта - это набор утвержденных кредитной организацией определенных характеристик заемщика и соответствующих весовых коэффициентов исходя из экономической политики самой кредитной организации и задачи, для решения которой данная карта будет применена. Скоринго-

вых карт обычно несколько, поскольку они сильно зависят от кредитных продуктов, категорий заемщиков и преследуемых задач оценки. Скоринговая модель для решения определенной задачи должна использовать соответствующую скоринговую карту.

Итак, процесс построения скоринговых моделей предполагает решение следующих задач:

- определение цели и назначения модели;

- определение условий функционирования или ограничений исследования;

- определение минимально необходимого набора критериев оценки;

- определение коэффициента влияния каждого критерия оценки;

- определение порога актуальности оценки.

Прогнозирование эффективности работы скоринговой модели производится путем использования ее на некой ограниченной выборке с известным результатом. В рамках простого анализа эффективности достаточным будет определение количественного показателя успешности прогнозирования, выраженного в процентах от общего числа рассмотренных кредитных дел.

Преодоление порога субъективности экспертной оценки коэффициентов влияния характеристик заемщика, а также автоматизация самого процесса выработки удельных весов, решается с помощью инструментов Data mining. Методики Data Mining позволяют выделить слабые закономерности и взаимосвязи в наборе данных. Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний.

Методы Data Mining можно условно разделить на статистические и кибернетические (или итерационно-логические). Под статистическими понимаются разнообразные виды и варианты статистического анализа: регрессионный, факторный, корреляционный, дисперсионный и так далее. Под итерационно-логическими методами понимаются искусственные нейронные сети (далее НС), генетические алгоритмы (далее ГА), нечеткая логика (далее НЛ), деревья решений. Условность разделения методов на две категории объясняется применением в той или иной степени статистических методов в математическом аппарате реализации итерационно-логических методов.

Каждый из описанных методов имеет свои преимущества и недостатки. Рассмотрим существующие распространенные кибернетические технологии Data Mining: нейронные сети, нечеткие системы и генетические алгоритмы.

Технология нейронных сетей в своей основе преследует цель независимости алгоритма решения от самой задачи. Здесь можно выделить такие преимущества как универсальность алгоритма для решения различных задач, т.е возможность переобучения алгоритма под конкретную задачу, параллелизм вычислений, простота описания единичного блока нейросети (нейрона), возможность формирования сложных нейросетей из элементарных бло-

ков, устойчивость нейросети к «зашумлению» данных, возможность категоризации данных. К недостаткам нейросетей относят проблему выбора оптимальной топологии и количества нейронов сети, проблему динамического оптимального развития (эволюционирования) нейросети, проблему контроля и прогнозирования работы нейросети.

Технология нечетких систем основана на идеи оперирования множествами, не имеющими четких границ и измерений. Основной задачей теории нечетких множеств, согласно основополагающей работе Л.Заде «Fuzzy sets», является возможность описания и определения явлений и понятий, имеющих многозначный и неточных характер, возможность получения некой точной оценки исходя из совокупности начальных неточных определений и правил. В какой-то степени, теория нечетких множеств также как и теория нейронных сетей, является некой попыткой реализации процесса человеческого мышления, оперирующего не только числовыми и строго определенными данными, но и неточными и многозначными понятиями. Подходы теории нечетких множеств наиболее удачным образом предоставляют возможность реализовать механизм экспертной оценки кредитоспособности, основанный на системе экспертных рассуждений и правил, лежащих в плоскости нечетких условий. Используя накопленный опыт, эксперт производит преобразование точных числовых показателей кредитоспособности к неточным лингвистическим выражениям, например, значение уровня рентабельности производства потенциального заемщика 15% преобразуется к неточному значению «высокий». Оперируя совокупностью показателей, выраженными в неточных единицах измерений «высокий», «низкий», «средний» эксперт способен определить показатель кредитоспособности потенциального заемщика. Аппарат теории нечетких множеств позволяет формализовать данную возможность экспертной оценки с математической точки зрения, обеспечивая с одной стороны возможность использования модели экспертных рассуждений и мнения и, с другой стороны, снизить степень их субъективности. К недостаткам нечетких систем следует отнести достаточную степень субъективности, заложенную при определении функций принадлежности исследуемых параметров и их возможных значений, в том числе лингвистических.

Также достаточно интересным представляется технология генетических алгоритмов. Суть подхода генетического моделирования заключена в постоянной модернизации исследуемых объектов до некоторого целевого уровня. Свойства исследуемых объектов описываются в виде некоторого набора данных, как правило бинарного, и оценивается их функция приспособленности. Наиболее приспособленные объекты (особи) отбираются, и из них формируется новое поколение объектов. Для формирования нового поколения объектов применяются математические алгоритмы, описывающие по сути происходящие в природе явления: скрещивание и мутации. Тем самым, в новом поколении форми-

руются объекты с наилучшим набором характеристик и большим значением функции приспособленности. К основным недостаткам данного подхода, собственно как и в живой природе, можно отнести следующее: возможность развития тупиковой ветви эволюции, последовательный итерационный процесс эволюции, сильно зависящий от размерности популяции и набора свойств изучаемых особей.

Системы, использующие различные технологии в целях улучшения качества результата, за счет снижения недостатков одних технологий посредством использования преимуществ других технологий, называются гибридными. Вернемся к основным задачам, которые должна реализовывать ско-ринговая система оценки кредитоспособности юридических лиц.

Скоринговая система должна обеспечивать:

- расчет скоринговой оценки кредитоспособности юридических лиц;

- возможность построения и обработки различных скоринговых моделей оценки кредитоспособности;

- возможность самоконтроля корректности результирующей оценки;

- возможность обучения на основе исторических данных;

- возможность ввода и учета экспертной оценки кредитоспособности, а также общей политики условий кредитования;

- возможность самостоятельного эволюционирования в целях обеспечения более качественной оценки кредитоспособности и выявления слабых связей между финансовыми показателями.

Исходя из поставленных задач и возможностей их реализации, предлагается разработать гибридный математический аппарат, сочетающий в себе такие области изучения искусственного интеллекта как нейронные сети, теория нечетких множеств и генетические алгоритмы. Нейронные сети способны к обучению и решают задачу категорирования данных, генетические алгоритмы применимы в рамках изучения возможности развития системы, а механизм нечетких множеств позволит построить альтернативную оценку кредитоспособности с учетом экспертного участия и в целом возможности влияния на итоговый результат. Используя совокупность разных научных подходов в решении задачи, появляется возможность перекрытия слабых мест одних подходов за счет сильных сторон других. Так, например, проблему построения и развития эффективной топологии нейронной сети можно возложить на механизм генетических алгоритмов. Результатом работы блока нечеткой логики можно оценивать корректность выхода нейросетевого блока, тем самым внося возможность экспертного участия в процессе и определении глобальной политики оценки кредитоспособности.

Согласно наиболее общей классификации гибридных систем по уровню интеграции можно выделить следующие типы систем:

- автономные системы;

- трансформационные системы;

- слабосвязанные системы;

- сильносвязанные системы;

- полностью интегрированные системы.

Автономные системы состоят из независимых

программных компонентов, обрабатывающих один набор данных разными методами. Главным недостатком данных гибридных систем является необходимость модификации всех компонентов системы в случае изменения исходных данных. Трансформационные гибридные системы по существу являются автономными, с отличием в том, что используемый компонент фактически подбирает наилучший метод обработки данных по заданному критерию. Слабосвязанные системы характеризуются набором отдельных компонентов, взаимосвязь между которыми осуществлена off-line (например, через файлы данных). Сильносвязанные гибридные системы отличаются on-line взаимодействием между компонентами и, исходя из своего названия, имеют достаточно быструю природу межкомпонентного взаимодействия. Полностью интегрированные системы совместно используют общие структуры данных и представлений знаний, а взаимосвязь между компонентами достигается посредством двойственной природы их структур.

При проектировании нечеткого нейрогенетиче-ского (ННГ) аппарата воспользуемся методикой интеграции, применяемой в сильносвязанных системах, известной как «доска объявлений». Данный подход проектирования интересен тем, что позволяет использовать различные компоненты (процессоры), совместно решающие одну задачу и использующие «доску объявлений» как рабочее место для выработки решения. При этом, использование в системе каждого компонента влияет на качество результата, а не на его наличие в целом. При данном подходе обеспечивается модульность системы и независимость ее отдельных компонентов.

На рисунке представлена блок-схема нечеткой нейрогенетической скоринговой системы.

Блок-схема нечеткой нейрогенетической (ННГ) скоринговой системы

В общем случае, задача оценки кредитоспособности потенциального заемщика состоит в определении набора финансовых, экономических и иных показателей, в целом характеризующих его кредитоспособность, и выявлении силы их влияния на конечный результат. Достаточно удобно привести задачу оценки кредитоспособности к решению уравнения со многими неизвестными, т.е определению функции регрессии вида:

у = ±к*,

г=1

где х1 - 1-ый показатель, к1 - удельный вес 1-ого показателя.

Тем самым на входе в систему имеем совокуп-

П

ность показателей ^к{х{ . Для решения постав-

1=1

ленной задачи предлагается воспользоваться несколькими методами.

С одной стороны, для решения данной задачи хорошо подходит методика нейронных сетей, позволяющая категоризировать объект с заданными свойствами (заемщика и его показатели) исходя из накопленной исторической статистики, т.е отнести заемщика к определенному классу кредитоспособности. Учитывая множество различных подходов построения нейросетей, а также их практическую значимость и результативность, целесообразно и достаточно реализовать многослойный персептрон с обратным распространением ошибки. Обучение нейросетевого блока должно проводиться на обучающей выборке, актуальной на заданный период времени.

С другой стороны, данную задачу интересно также решить аппаратом нечеткой логики. Таким образом, одна задача решается двумя независимыми потоками с несколько разными аспектами. Ней-росетевой модуль получит выход с позиции накопленной статистики, тогда как блок нечеткой логики реализует экспертную политику кредитной организации. При этом предполагается, что отрицательные моменты, связанные с общностью статистики и субъективностью экспертных правил нечеткой логики, взаимно компенсируются.

Блок сравнительного анализа выводов решающих блоков реализует смещение оценки кредитоспособности в заданном направлении. При этом предусматривается обратная связь, влияющая на обучающий алгоритм нейросетевого модуля и его аппарат эволюционирования - генетический модуль развития топологии нейросети.

Таким образом, комбинируя имеющиеся методики построения экспертных систем открывается возможность моделирования гибкой системы принятия решений, развивающейся в процессе обработки данных.

Литература

1. Д. Рутковская, М. Пилинский, Л. Рутковский. Нейронные сети, генетические алгоритмы и нечеткие системы /: Пер. с польск. И.Д. Рудинского. - М.: Горячая линия - Телеком, 2006. - 452 с.

2. Ярушкина Н.Г. Основы теории нечетких и гибридных систем: учеб.пособие. -М.: Финансы и статистика, 2009. -320 с.

3. Э.Мэйз. Руководство по кредитному скорингу.-Минск: гревцов Паблишер, 2008.- 464 с.

Воронежский государственный технический университет

APPLICATION OF HYBRID SYSTEMS IN PROBLEMS SCORING CREDIT RATING

OF CORPORATE CLIENTS

A.A. Ryndin, V.P. Ulyev

The article deals with aspects of the problem scoring credit ratings of legal persons. Examined whether the chain-and the requirements for an expert system. The modern methods of implementation of expert systems with the use of artificial intelligence technologies. We propose an approach for constructing hybrid fuzzy expert neyrogeneticheskoy-term decision-making system. Is an example of building block-scheme of algorithm of hybrid fuzzy neurogenic-optical scoring system credit assessment of corporate clients

Key words: credit scoring, hybrid systems, fuzzy neirogenetic algorithm

i Надоели баннеры? Вы всегда можете отключить рекламу.