Научная статья на тему 'Байесовские сети и надежность банка'

Байесовские сети и надежность банка Текст научной статьи по специальности «Экономика и бизнес»

CC BY
527
94
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАДЕЖНОСТЬ / БАНК / БАЙЕСОВСКИЕ СЕТИ / КЛАССИФИКАТОР / АНАЛИЗ / МОДЕЛИРОВАНИЕ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Пшеничный С.И.

В статье представлены сведения о применяющихся в России и за рубежом методах оценки надежности банков. Предлагается к рассмотрению метод байесовских сетей для быстрого и эффективного определения надежного банка. Приведен пример байесовской сети, описан алгоритм работы байесовского классификатора.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Пшеничный С.И.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Байесовские сети и надежность банка»



БАИЕСОВСКИЕ СЕТИ И НАДЕЖНОСТЬ БАНКА

С. И. ПШЕНИЧНЫЙ,

аспирант кафедры математического моделирования экономических процессов E-mail.pshen2010@yandex.ru Финансовая академия при Правительстве Российской Федерации

В статье представлены сведения о применяющихся в России и за рубежом методах оценки надежности банков. Предлагается к рассмотрению метод байесовских сетей для быстрого и эффективного определения надежного банка. Приведен пример байесовской сети, описан алгоритм работы байесовского классификатора.

Ключевые слова: надежность, банк, байесовские сети, классификатор, анализ, моделирование.

В условиях современного мира все большую роль играет такой ресурс как информация. Наличие полной и достоверной информации об экономическом объекте помогает участникам системы принять правильные решения о будущих действиях. Так как банковская система является одной из наиболее значительных частей современной экономической системы, то для всех участников экономических отношений будет важна доступность информации о ней. При выборе банка любой субъект будет основываться на имеющейся информации о нем и на соответствующих выводах из этой информации. Определяющим фактором, на основе которого субъект выбирает банк, при прочих равных условиях является надежность этого банка. Надежность банка в самом общем смысле определяется как способность банка отвечать по всем принятым на себя обязательствам.

Очевидно, что при отсутствии каких-либо личных мотивов субъект будет стремиться строить финансовое взаимоотношение с наиболее надежным банком, так как чем более надежен банк, тем меньшему риску подвергается основная деятельность субъекта. По отношению к конкретному банку формируются ожидания, имеющие характер доверительных, если этот банк представляется надежным. Эти ожидания всегда должны быть реализованы в поведении, которое в данном случае выражается в открытии и обслуживании вклада в банке. Основу доверительных ожиданий составляет оценка объекта доверия как надежного.

Для оценки надежности банка используют различные рейтинговые показатели. Известны как отечественные методики, так и зарубежные.

В таблице представлены некоторые наиболее распространенные методики оценки надежности банков с общей характеристикой, отражающей их достоинства и недостатки. Таблица построена на основе анализа сведений об используемых методах [1,2].

С некоторыми различиями многие из методов представляют собой оценку, в той или иной степени основанную на применении интегральных показателей. В основном разница заключается лишь в широте охвата, степени разбиения первичных агрегированных показателей на отдельные составляющие и присвоении тех или иных весовых коэффициентов.

Помимо этих методик существует еще множество методов для выделения надежных банков. Для выбора надежных банков могут быть использованы различные методы классификации, такие как дерево принятия решений, методы машинного обучения, нейросети, статистические методы.

Согласно исследованиям [5, 6, 7] наибольшей точности в классификации достигают методы, основанные на применении байесовских сетей.

В рамках этого подхода определение надежности банка уточняется. Надежность банка — это вероятность банка быть надежным, т. е. вероятность того, что банк выполнит взятые на себя обязательства. Это определение подразумевает, что надежный банк находится в определенном состоянии — состоянии «надежного банка». Это состояние зависит от множества наблюдаемых факторов.

Байесовская сеть или байесовская сеть доверия — это вероятностная модель, представляющая собой множество переменных и их вероятностных зависимостей. Это полная модель для всех переменных и их отношений. Она может быть использована для того, чтобы давать ответы на вероятностные

Методики оценки надежности банка

Методика

Показатель Группы надежности ЦБ Коммерсант АЦФИ Кромонова CAMEL УаЯ

База для опреде- Балансовые дан- Балансовые Балансовые Балансовые Экспертные Рыночные

ления показателя ные, выполнение данные данные данные суждения данные

надежности нормативов

Возможность вклю- Да Нет Нет Нет Только Нет

чить экспертную экспертные

информацию, качес- данные

твенные показатели

Обоснованность Закреплены инс- Нет Нет Нет Субъективно Да, в рамках

выбора факторов трукцией принятой методики

Прозрачность Нет Нет Нет Да Нет Да

Классифицирующий Интегральный Интег- Интегральный Интегральный Средний балл Величина мак-

показатель показатель, экс- ральный показатель показатель по результа- симально воз-

пертный вывод показатель там суждений экспертов можных убытков с заданной вероятностью

Возможность обо- Да Нет Нет Нет Да Да

собленного расчета

по банку

Информативность Нет Нет Нет Нет Нет Нет

Простота примене- Нет Нет Нет Нет Нет Нет

ния, доступность

информации

вопросы. Байесовская сеть дает представление о состоянии некоторых переменных по наблюдениям за другими переменными. Такая вероятность состояния, вычисленная по наблюдениям, называется апостериорной, а сам процесс определяется как вероятностный вывод.

Байесовские сети доверия применяются в тех случаях, когда требуется получить описание системы в условиях неопределенности. Причем неопределенность системы как таковая может иметь самую различную природу. Причина может быть в присутствии в системе случайных факторов или недоступности полной информации по всем или какому-либо одному фактору.

На основе различного рода отчетностей можно выявить набор числовых показателей работы банков, которые бы описывали их состояние и величины которых оказывали бы значимое влияние на их надежность.

Согласно рекомендациям [3] по перечню факторов, от которых зависит надежность банка, можно построить байесовскую сеть. Вариант такой байесовской сети представлен на рисунке. Пунктирными стрелками показана возможность взаимных зависимостей факторов.

Включение показателей работы банка в байесовскую сеть можно производить на основе вывода

о значимости влияния того или иного показателя на надежность банка. Значимость можно проверять с помощью теста Колмогорова—Смирнова.

Байесовская сеть дает возможность вычислить вероятность пребывания банка в надежном состоянии при наличии о нем информации по набору других факторов.

Основным инструментом расчета вероятности банка быть надежным в байесовских сетях является формула Байеса.

Пусть известны п гипотез об условиях опыта: С1, С2,...,Сп, образующих полную группу и непересекающихся. Вероятности гипотез до опыта Р (С1),...,Р (Сп) известны. В результате опыта появилось событие И. Необходимо определить вероятности гипотез с учетом этого факта: апостериорные Р (С^) ,1 = 1,...,п .

Для гипотезы С;. определяется вероятность произведения с учетом правил умножения.

Р (С, • ъ) = Р (С)■ Р (^\С) = Р (Ъ) • Р (С\^),

Р (Ъ)• Р (С)\Л) = Р (С)• Р (ъС).

Для определения Р (С ), 1 = 1,..., п, обе части делятся наР(С)

Р (С1) • Р (Ъ|С,) Р (С1) • Р (Ъ|С,)

P (Ct\F) =-

P (F)

±P (C,)• P (F\Ct)

ЭКОНОМИЧЕСКИЙ АНАЛИЗ:

49

,=1

мофелирь&лКие 10(175)-2010

Байесовская сеть надежности банка

Пусть п = 2. Тогда, например, для /=1

Р (С \А) Р (С') •Р {^

^ Р (Сх) ■ Р (^|С,) + Р (С2) • Р (^|С2)

1

1+

Р (С2) ■ Р (^С2)

Р (Сх) ■ Р (^|С1)

Если С1 событие, состоящее в том, что банк надежен, С2 — событие, состоящее в том, что банк ненадежен. Р— событие, состоящее в том, что была выделена информация т (О).

Р (Банк надежен| т (О.)) =

1

является надежным. Соответственно, вероятность Рь — это вероятность того, что исследуемый банк, при полном отсутствии о нем какой-либо информации, является ненадежным.

При условии, что все объясняющие факторы, включенные в байесовскую сеть, являются независимыми для определения надежного банка по имеющимся наблюдениям можно пользоваться наивным байесовским классификатором. Вероятностная модель для классификатора — это условная модель р(С\Р1,...,.Рп) над зависимой переменной класса С с небольшим количеством результатов или классов, зависимая от нескольких переменных

1 + -

Р, Р {т (О.) Банк ненадежен}

Р..Е

1 п

Ре Р {т (О) | Банк надежен}

Вероятности Р, Ръ в байесовском подходе называют априорными, их значения необходимо определить до начала проведения анализа из некоторых «особых» соображений. Вероятность Р — это вероятность того, что исследуемый банк, при отсутствии о нем какой-либо информации,

р (С|^,...,.^) =

р (С) р (*;,..., ¥\С)

р №,..., рп )

Для дальнейшего анализа нужен только числитель дроби, так как знаменатель не зависит от С и значения свойств ¥1 даны, так что знаменатель — константа.

Числитель эквивалентен совместной вероятности модели: р (С,Рп).

Ее можно выразить следующим образом, используя повторные приложения определений условной вероятности:

p (C,Fl,...,Fn) = p (C) p (FFn\C) =

= p (C) p (F|c) p (Fl,...,Fn\CF) = = p (C) p (F|c) p (F2|C,Fi)p (F3,...,Fn\C,Fl,F2) и т.д. Теперь, используя наивные предположения условной независимости, выводится, что каждое свойство Fi условно независимо от любого другого свойства F. при i Ф j. Это означает:

p (F\C, Fj ) = p ( f|c ). 7

Таким образом, совместная модель может быть выражена:

p (C,Fi,...,Fn) = p (C)]Jp (F|C).

1=1

Это означает, что из предположения о независимости условное распределение по классовой переменной С может быть выражено так:

1n

p (C|F,..., Fn ) = - p (C )П p ( F\C ),

Z и

где Z— масштабный множитель, зависящий только от F,, . .,F ,т. е. является константой, если значения

1n

переменных известны.

Преимуществом наивного байесовского классификатора является требование к размеру выборки.

В построенной ранее байесовской сети наивный байесовский классификатор принимает следующий вид:

р (Надежен |Параметр1,...,Параметрn) =

__1_

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Р (Параметр1...Параметрn)

n

р (Надеженр (Параметр i | Наджен), i=i

где Параметр ( — реализация каждой из выбранных переменных в построенной байесовской сети доверия (см. рисунок).

Вероятность р {Надежен) — это вероятность того, что исследуемый банк, при отсутствии о нем какой-либо информации, является надежным.

Если же априори известно, что в банковском сообществе всего присутствует п1 надежных и п2 ненадежных банков, то в формуле Байеса следует

п

положить р (Надежен) =-1—.

п1 + п2

Наивный байесовский классификатор является одним из самых эффективных способов обработки данных. Результаты классификации, полученные при применении наивного байесовского классификатора, могут удивлять, так как в повседневной жизни редко встретится ситуация, удовлетворяющая предположению о независимости параметров модели.

Однако согласно многим исследованиям [4,6,7], наивный байесовский классификатор может производить классификацию на классы с высокой точностью и во многих случаях, когда наблюдается существенная зависимость между факторами. Метод байесовских сетей позволяет получить не только градацию банков по степени надежности, но и получить численное выражение вероятности быть надежным. Результатом работы байесовского классификатора будет конкретное значение вероятности принадлежности банка к надежным. Если вероятность более 0,5, то банк признается надежным, в противном случае — нет.

Метод байесовских сетей выгодно отличается от других методик тем, что позволяет провести обособленный расчет по банку по уже полученным ранее априорным данным, а не производить расчет по всей совокупности банков. Метод байесовских сетей может быть использован для анализа показателей работы банков с целью определения надежности банка. В зависимости от контекста исследования байесовская сеть обладает гибкостью. Метод может быть легко реализован на вычислительных машинах и не требует больших временных затрат. В других областях метод используется для решения различных проблем, например: в медицинской диагностике, в классификации целей при сканировании радаром, в борьбе со спамом и т. д. Очень перспективно применение байесовских сетей и в финансовом анализе.

Список литературы

1. Об оценке экономического положения банков: указание Центрального банка РФ от 30.04.2008 № 2005-У.

2. Сидоренко М. ^Банковские рейтинги //URL: http://www. cfin. ru/finanalysis/banks/bank_ratings. shtml.

3. A. H. O. van Soest, A. A. Peresetsky, A.M. Karminsky. AN ANALYSIS OF RATINGS OF RUSSIAN BANKS. No. 2003-85.

4. GargA., Roth D. Understanding Probabilistic Classifiers. Department of Computer Science and the Beckman Institute University of Illinois, Urbana, IL. 61801, USA, ELM, 2001.

5. Kononenko I. Comparison of inductive and naive Bayesian learning approaches to automatic knowledge acquisition. In Wielinga, В., ed., Current Trends in KnowledgeAcquisition. IOS Press. 1990.

6. Pazzani M.J. Search for dependencies in Bayesian classifiers. In Fisher, D., and Lenz, H. J., eds., Learning from Data: Artificial IntelligenceandStatisticsV. SpringerVerlag. 1996.

7. Quinlan J. C4.5: Programs for Machine Learning. Morgan Kaufmann: San Mateo, CA. 1993.

ЭКОНОМИЧЕСКИЙ АНАЛИЗ: жго7>ъЯ-Ъ.'Н?>?4'К'ШЪ.Ъ4

51

i Надоели баннеры? Вы всегда можете отключить рекламу.