Научная статья на тему 'Методы и показатели для кластеризации коммерческих банков'

Методы и показатели для кластеризации коммерческих банков Текст научной статьи по специальности «Экономика и бизнес»

CC BY
456
89
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАНКОВСКАЯ СИСТЕМА / КЛАСТЕРИЗАЦИЯ / МЕТОД К-СРЕДНИХ (K-MEANS) / EM-МЕТОД / МЕТОД РАСПРОСТРАНЕНИЯ СХОДСТВ (AFFINITY PROPAGATION) / BANKING SYSTEM / CLUSTERING / K-MEANS METHOD / EM-METH-OD / AFFINITY PROPAGATION METHOD

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Станик Наталья Андреевна, Крайнюков Николай Иванович

Выделение однородных групп (кластеризация) из всей совокупности банков для оценки динамики кластеров банковской системы и ее дальнейшего анализа является актуальной задачей. В статье представлены подходы и методы для кластеризации коммерческих банков, такие как метод К-средних (K-means), EM-метод, метод распространения сходств (Affinity propagation), отмечены преимущества и недостатки каждого метода. Проведена кластеризация с использованием метода К-средних (K-means) как наиболее релевантного для кластеризации банковской системы с использованием как абсолютных, так и относительных финансово-экономических показателей. Отмечена разница в формировании кластеров на основе абсолютных и относительных показателей, которая в особенности ярко проявляется для ПАО Сбербанк. Полученные результаты кластеризации зависят от представления данных и чувствительны к методам кластеризации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS AND INDICATORS FOR CLUSTER ANALYSIS OF RUSSIAN BANKING DATA

The selection of homogeneous groups (clustering) from the entire set of banks to assess the dynamics of the banking system clusters and its further analysis is an important goal. The article presents approaches and methods for cluster analysis of Russian banking data, such as K-means method, EM method and Affinity propagation method. Advantages and disadvantages of each method are noted. Banking-data were processed with K-means as the most relevant method. Clustering was carried out using the K-means method (K-means) as the most relevant for clustering the banking system using both absolute and relative financial and economic indicators. Different forms of clusters were noted in the formation of clusters based on absolute and relative indicators, which is especially mentioned for Sberbank PJSC. The results of clustering depend on the presentation of data and are sensitive to clustering methods.

Текст научной работы на тему «Методы и показатели для кластеризации коммерческих банков»

методы и показатели для кластеризации коммерческих банков

Станик Наталья Андреевна,

кандидат экономических наук, доцент, Департамент финансовых рынков и банков, Финансовый университет при правительстве Российской Федерации E-mail: nstanick@fa.ru

Крайнюков Николай Иванович,

кандидат технических наук, независимый аналитик-консультант

E-mail: nik9kr@gmail.com

Выделение однородных групп (кластеризация) из всей совокупности банков для оценки динамики кластеров банковской системы и ее дальнейшего анализа является актуальной задачей. В статье представлены подходы и методы для кластеризации коммерческих банков, такие как метод К-средних (K-means), EM-метод, метод распространения сходств (Affinity propagation), отмечены преимущества и недостатки каждого метода. Проведена кластеризация с использованием метода К-средних (K-means) как наиболее релевантного для кластеризации банковской системы с использованием как абсолютных, так и относительных финансово-экономических показателей. Отмечена разница в формировании кластеров на основе абсолютных и относительных показателей, которая в особенности ярко проявляется для ПАО Сбербанк. Полученные результаты кластеризации зависят от представления данных и чувствительны к методам кластеризации.

Ключевые слова: банковская система, кластеризация, метод К-средних (K-means), EM-метод, метод распространения сходств (Affinity propagation).

введение

В настоящее время в России действуют около 400 банков1. Банк России проводит большую работу по обеспечению и поддержанию устойчивости банковской системы: определен и утвержден перечень, состоящий из 11 системно значимых банков2, предусмотрено разделение банков по выданным лицензиям (универсальные и базовые)3.

Выделение однородных групп (кластеризация) из всей совокупности банков для оценки динамики кластеров банковской системы и ее дальнейшего анализа является актуальной задачей.

Кластеризация кредитных организаций (далее - КО) может проводиться по бизнес-моделям (универсальные банки федерального и регионального масштаба, иностранные дочерние структуры, розничные банки, монолайнеры, кэптивные банки, кредитные агрессоры, банки с неопределённой степенью бизнес-модели и др.) с использованием как абсолютных, так и относительных показателей. Если для кластеризации используются абсолютные показатели, то, очевидно, что из всех банков ПАО Сбербанк будет единственным представителем в кластере. При кластеризации по относительным показателям в кластер вместе с ПАО Сбербанк попадут и другие банки.

Актуальными являются такие вопросы, как и по каким экономическим и финансовым показателям и какими алгоритмами проводить кластеризацию всей совокупности банков банковской системы, какие методы кластеризации можно применить в этом случае и как оценить адекватность использования различных методов кластеризации.

Введение Базеля III4 окажет большое влияние на банковскую систему и на ее ресурсные возможности. Кластеризация может являться инструментом оценки этого влияния. Анализ динамики кластеров во времени и мониторинг статистики значений показателей позволят в агрегированном виде получать оценки такого влияния.

1 По состоянию на 1.01.2020 в России функционировали 442 кредитные организации, в том числе 402 банка.

2 Указание Банка России от 22.05.2015 № 3737-У «О методике определения системно значимых кредитных организаций». Так, на долю системно значимых КО приходится более 60% совокупных активов российского банковского сектора.

3 Инструкция Банка России № 135-И от 02.04.2010 «О порядке принятия Банком России решения о государственной регистрации кредитных организаций и выдаче лицензий на осуществление банковских операций».

4 Внедрение итогового набора регуляторных требований к банкам, включающего в себя все изменения Базеля III, а также подходов к оценке рыночного риска, планируется к вступлению в силу с 2022 года.

сз о

со £

m Р

сг

от А

Обзор литературы

Задача кластеризации банков рассматривалась многими авторами. Разбиение банков на кластеры проводилось различными методами, такими как метод k-средних (k-means) и иерархической кластеризацией, с использованием различных критериев (CAMELS) и нейронных сетей Кохонена.

Так, рядом исследователей использовался метод кластеризации k-средних (k-means) и нейронные сети Кохонена [5]. В выборке участвовали 836 российских КО, основные банковские показатели для анализа: капитал банка, депозиты, кредиты и межбанковские кредиты. В результате было выделено 11 кластеров. В дальнейшем банки в соответствующих кластерах были разделены по бизнес-моделям.

Другими авторами была проведена кластеризация австралийских банков. Кластеризация позволила выделить 5 банковских бизнес-моделей [6].

С помощью регрессионного анализа зарубежными экономистами 48 польских банков были разделены на 5 бизнес-моделей: универсальные банки, корпоративные банки, ипотечные банки, региональные банки и банки, занимающиеся автомобильным кредитованием [6].

С помощью методики CAMELS1 российские авторы оценивали финансовую устойчивость КО и проводили рейтингование банков [2]. Аналогичную методику предложили эксперты Банка России для оценки финансовой устойчивости банка2, которая подразумевает оценку КО по группам показателей: собственные средства (капитал), качество активов, доходность, ликвидность, показатели качества управления банком и показатели прозрачности и структуры собственности.

В материалах российских ученых проводилась кластеризация и рейтингование банков с помощью нейронных сетей (нейронной сети Кохонена) [1]. Для кластеризации были выбраны следующие показатели: сумма активов, собственные активы, банковские активы, средства в банке, прибыль. В результаты были выделены 4 кластера. Авторы отмечают возникшую проблему при кластеризации - в один из кластеров попали более 75% банков. После модификации нейронной сети было выделено 8 кластеров и центры кластеров оказались близки к средним значениям показателей банков входящих в соответствующие кластеры. В этом смысле кластеризация с помощью нейронных сетей оказалась похожей на известный метод кластеризации к-средних (k-means).

Другими экономистами использовался метод иерархической кластеризации [3]. Совокупность банков, имеющих структурные подразделения, была разделена на шесть кластеров. В каждом

^ 1 Система рейтингования CAMELS разработана в 1978 году

= Федеральной резервной системой США для рейтинговой оцен-

© ки банков.

О 2 Указание Банка России от 11.06.2014 № 3277-У «О мето-сэ диках оценки финансовой устойчивости банка в целях признать ния ее достаточной для участия в системе страхования вкла-z дов».

кластере были рассчитаны средние значения показателей для банков, входящих в кластер. Кластеры были объединены в 3 класса: мультифили-альные банки (ПАО Сбербанк и АО «Россельхоз-банк»), многофилиальные банки (всего 34 банка) и банки с малым количеством филиалов (остальные банки). По мнению авторов, подобная кластеризация/классификация банков может служить составляющей подсистемой в системе принятия решений в сфере регулирования банковской деятельности в России.

Рядом ученых предлагаются определения и рассматриваются критерии выделения системного уровня банковской системы [4]. На основе предложенных критериев выделены пять иерархически связанных системных уровней банковской системы: Банк России - верхний уровень, системно значимые банки, банки с универсальной лицензией, банки с базовой лицензией, небанковские кредитные организации. По мнению автора, Банк России как мегарегулятор должен обеспечить развитие и регулирование банковской системы как единого целого, обеспечивая взаимодействие всех уровней банковской системы с учетом их специфики.

Таким образом, анализ зарубежных и российских материалов, содержащих подходы к кластеризации, не позволяет выделить однозначно наилучший и релевантный метод кластеризации. В этой связи, в настоящей статье авторами предпринимается попытка рассмотреть различные подходы к кластеризации банковской системы, включая выбор данных и сложности применения различных методов кластеризации.

Обзор методов и подходов к кластеризации

Относительно теоретических подходов к кластеризации

Задача кластеризации выборки полученных данных - это организация структуры или разбиение заданной выборки объектов (наблюдений) на подмножества, называемые кластерами, так, чтобы каждый кластер состоял из схожих объектов, а объекты разных кластеров существенно отличались.

В каком смысле объекты из одного кластера похожи и в чем объекты разных кластеров отличаются друг от друга зависит от задачи, поставленной перед исследователем.

Если выборка содержит большое число объектов, то, выбирая из кластера наиболее «представительный» объект, можно существенно сократить анализ всего набора объектов выборки, сравнивая характеристики представителей и анализируя присущие ему показатели.

Анализ отдельного кластера и его представителей может позволить выявить внутренние связи между отдельными кластерами, что важно для определения кластерной структуры всего набора данных.

Разработано большое количество методов кластеризации. Для одних необходимо задавать ко-

личество кластеров (K-means), для других этого не требуется (Affinity propagation).

Теоретической основой для разработки методов кластеризации являются статистические методы, теория Марковских цепей, теория графов.

Обычно выборка данных представляет собой набор N векторов x1,x2,...xN, каждый вектор описывает объект данных xi е RD , где RD - пространство признаков объекта, D -размерность

пространства признаков.

N

Обозначим Obj = {xi}=1 как множество объектов

выборки, где х, =(t{, t'2,...t'D)еRd , где ti - признак, j - номер признака, i - объекта выборки.

Задача кластеризации состоит в том, чтобы построить множество кластеров Clusters ={c1,c2,...cK}

и для каждого объекта {xs назначить соответствующий кластер ему из множества кластеров Clusters , F :Obj ^Clusters , где F - функция присваивающая объекту данных xi номер соответствующего кластера cm е{1,2,...,K}, где K - количество кластеров.

Кластер cm содержит объекты х, е cm и xj ecm, если для выбранной меры сходства (похожести) d(x,xj) <e , e - порог близости элементов одного кластера.

Обычно в качестве меры близости d(xi,xj) выбирают расстояние между объектами xi,xj (евклидово расстояние, чебышевское расстояние, расстояние Махалонобиса и т.д.).

Качество кластеризации зависит от структуры данных и алгоритма. Рассмотрим ряд методов кластеризации.

Относительно кластеризации методом К-средних (K-means)

Перед началом кластеризации выбирается количество кластеров - K и произвольно выбираются K центров кластеров ц. В кластер объединяются объекты xi наиболее близко расположенные к соответствующему центру. Таким образом,

N

множество объектов Obj = { xt}=1 разбивается на K кластеров Clusters ={c1,c2,.cK} .

Центр ц кластера cj вычисляется по формуле:

A(Clusters ,O bj) = ZZI (xt е cj) d (цj, xt)

j=1i=1

Затем центры кластеров пересчитываются и процедура повторяется до тех пор, пока не начнет выполняться критерий остановки.

Критерий остановки - изменение целевой функции после n шага процедуры:

|An (Clustersп ,0bj) - An-1 (Clustersn_1,0 bj )| < e , где a - выбранное значение критерия (точности).

Отметим, что преимуществами метода К-сред-них (K-means) является понятность и относительная простота реализации. Для небольшого числа объектов несложно применить и интерпретировать полученные результаты. Сложности в использовании данного метода возникают при выборе количества кластеров и тем, что метод чувствителен к отдельно расположенным объектам вытянутой формы.

Относительно кластеризации методом EM-методом (Expectation-Maximization)

С содержательной точки зрения данный алгоритм кластеризации является методом статистической оценки скрытых параметров смеси распределений случайных величин методом максимального правдоподобия.

Основное статистическое предположение

о распределении объектов состоит в том, что мно-

N

жество объектов выборки Obj = { xi}=1 имеет распределение, представляющее смесь K распределений. Смесь распределений состоит из K компонент, т.е. K кластеров Clusters ={c1,c2,.cK} с параметрами распределения E ={wj,8j}, , где wj -априорная вероятность кластера cj, 8j - оцениваемые параметры смеси распределений:

р (x ) = £wj х Pj (x )

j=1

P (x )=ф(8 j; x)

ц I =

Z N=1I (x ecj) xi Z NJ (* е Cj)

EM - алгоритм состоит из последовательного выполнения двух шагов до тех пор, пока не будет достигнут порог точности e и будет выполнено условие остановки алгоритма.

Рассмотрим первый шаг.

E -шаг (expectation). Находим:

где I(х е ^) - индикаторная функция принадлежности объекта х1 кластеру ^ . Центр кластера определяется как среднее значение признаков, принадлежащих кластеру объектов. Этим объясняется название метода кластеризации - метод К - средних.

Целевая функция для текущего выбора кластеров минимизируется, выбирая принадлежность объектов х к ближайшему центру кластера.

Целевая функция имеет вид:

test si,j

Sij =

w

Р (x)

Z m=1wm х Pm (xi )

где i = 1,...N, j = 1,...K , Pj(x) - плотность распределения j - кластера

сз о со от m Р от

от А

max^ge - g41<e условие прекращений вычислений. Второй шаг:

M -шаг (maximization). Определение методом максимального правдоподобия параметров 8j:

max

Х.j -P(x), j =

1 N

Щ = —Т& , 1 = 1, • -К

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Для обоснования формул на М - шаге алгоритма запишем функцию правдоподобия для смеси распределений:

max

©

При условии:

ТЩ =1

1=1

Для решения задачи поиска максимума с ограничениями используем метод множителей Лагран-жа:

L(Ж,©) = ¿/«¿щ х Рк (X/;©) -X х ( £щ -

/=1 к=1 ^ 1=1 у

Частные производные лагранжиана:

dL (W .©)=E Pj (Xj ;©)

dw.

1E -P (Xj ;©)

--X = 0

dL (W ,©)

d8„

=E

w,

5

K —-— Pi (x ;©) = 0

1 EK=w - P (x, ;©) A' ;

1=1,-К

Для того, чтобы найти X умножим обе части щ и просуммируем по 1, в результате получим:

Wj-pj(x;©) .

EE EtiWfc- Pk (x ;©) ^

Так как сумма wj равна единице:

W,

P (x, ;©) 1

Ewi = i и E~ к

j=i j=i E k=1w. - Pk (x ;©)

Получаем, что

N

Х1 = ^,и X = N

w,

g/. j =

<i> (x,)

РассмТшим теперь выражение, полученное выше для производной лагранжиана по 0в, умножая и числитель, и знаменатель на Р1 (х/) получаем:

E

j

- Pi (xi) д / Ч

' AJ ^ln(pj(x;©))=

1ХK=w - P (x, ;©)

=Хи -J- ln(pj (x ;©))=0

=1 д8г

Это условие совпадает с условием максимума функции правдоподобия:

axln(F(W.©)) = In^P(x ;©) = ElnEwj - Pj (x, ;©)

© ,=1 ,=1 j=1

Egu - PJ (x) , j = 1.

max

На первом шаге (E - expectation) мы оцениваем параметры gttj, которые на втором шаге (M -maximization) считаем зафиксированными, и при фиксированных параметрах оцениваем параметры распределения методом максимального правдоподобия. Цикл повторяется до тех пор, пока не будет достигнута заданная точность оценки.

Данный метод имеет следующие преимущества. EM-метод позволяет разделить смесь распределений, формулы упрощаются в предположении смеси нормальных распределений. Данный алгоритм имеет достаточно быструю сходимость при оптимальном выборе начальных значений. Отмечаются следующие недостатки EM-метода. Предположение о нормальности распределений не всегда выполняется. При неудачной инициализации сходимость алгоритма может оказаться медленной. Алгоритм может остановиться в локальном минимуме и дать квазиоптимальное решение.

Расчеты с использованием рассмотренных методов

Кластеризации проводилась с использованием следующих показателей:

- капитал КО,

- кредиты физическим лицам,

- кредиты предприятиям и организациям,

- количество структурных подразделений КО,

- системно значимая КО.

Представим данные по капиталу банков на рисунках 1 и 2.

Форма гистограммы (рис. 2) показывает, что распределение количества банков по капиталу не является нормальным распределением. Остальные показатели также не описываются нормальным распределением (см. диагональ на рис. 3).

Визуальная оценка попарного взаимовлияния показателей друг на друга представлена далее.

Ое

Таким образом, получаем

1N

W = N Х

i =1

Рис. 1. Банки, упорядоченные по капиталу на 01.01.2019

Рис. 2. Гистограмма ось X-Log (Capital), ось Y-количество банков

Рис. 3. Scatter-диаграмма попарного влияния показателей банков

Проведем кластеризацию различными методами: методом к-средних (K-Means), методом иерархической агломеративной кластеризации (Agglomerative clustering) (рис. 4).

Рассмотрим, как меняется сумма расстояний в зависимости от количества кластеров (рис. 5).

•• . •. • •*•

•••• :

V."

А

!\\вТБ

\ЧС6ер6анк России •'"..;:'V-

ХГазпромбанк

Рис. 4. Кластеризация методом к-средних (7 кластеров)

Рис. 5. График критерия в зависимости от количества кластеров

Качество кластеризации и количество кластеров можно оценить, изменяя количество кластеров и проводя кластеризацию для различного числа кластеров. Из рис. 5 видно, что при увеличении количества кластеров критерий минимума расстояния почти не уменьшается после выбора семи кластеров, поэтому мы в целях кластеризации банков выбрали 7 кластеров.

В таблице 1 приведен список банков, попавших в первые пять кластеров, остальные банки распределились в 6 и 7 кластере.

Таблица 1. Распределение банков по кластерам

номер кластера название банка

1 ПАО Сбербанк

2 Банк ВТБ (ПАО)

3 Банк ГПБ (АО)

4 АО «Россельхозбанк»

4 АО «АЛЬФА-БАНК»

4 ПАО «Московский Кредитный Банк»

5 ПАО Банк «ФК Открытие»

5 ПАО «Промсвязьбанк»

5 АО ЮниКредит Банк

5 АО «Райффайзенбанк»

5 ПАО РОСБАНК

5 АО «АБ «РОССИЯ»

5 ПАО «Совкомбанк»

и

I

При иерархической агломеративной кластеризации распределение банков аналогично, как при кластеризации методом к-средних (рис. 6).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Q.

е

о

сч о сч

Рис. 6. Иерархическая кластеризация банков

Крупные системно значимые банки, такие как ПАО Сбербанк, Банк ВТБ (ПАО) и Банк ГПБ (АО) являются единственными представителями в своем кластере. Вероятно, что такая кластеризация по абсолютным значениям представленным выше показателям не позволяет сравнивать между собой такие крупные банки. Как отмечалось выше, метод k-средних чувствителен к отдельно расположенным объектам вытянутой формы, поэтому крупнейшие банки являются единственными представителями в собственном кластере. Вопросы применимости различных методов и оценки чувствительности полученных результатов оценивания и моделирования от входных данных являются очень важными для практического применения этих методов [9,10].

Для того, чтобы «увидеть» банки в собственных, присущих только этому банку единицах, надо выбрать единую финансово-экономическую характеристику банка, некоторую масштабную единицу, в которой можно оценить показатели банка и в этих относительных единицах построить еще раз кластеры и классифицировать (кластеризовать) банки. В качестве такой единицы предлагается выбрать капитал банка и на величину капитала нормировать финансово-экономические параметры банка.

Далее приведены результаты кластеризации методом к-средних, активы и кредиты были нормированы на капитал банка (рис. 7).

Таким образом, мы видим, что использование относительных показателей банков позволило выделить две ярко выраженных группы кластеров (табл. 2).

Рис. 7. Кластеры для относительных показателей банков

Таблица 2. Набор кластеров для относительных показателей банков

Номер кластера Название банка

1 ПАО Сбербанк

1 АО «Россельхозбанк»

1 АО «АЛЬФА-БАНК»

1 Банк «ФК Открытие»

1 АО ЮниКредит Банк

1 АО «Райффайзенбанк»

1 Банк «ВБРР»(АО)

1 ПАО «АК БАРС»БАНК

1 АО «Тинькофф Банк»

1 АО «Банк Русский Стандарт»

1 ООО «ХКФ Банк»

1 ПАО Банк ЗЕНИТ

1 ПАО «МТС-Банк»

1 ООО «Русфинанс Банк»

2 Банк ВТБ (ПАО)

2 Банк ГПБ (АО)

2 ПАО «Московский Кредитный Банк»

2 ПАО РОСБАНК

2 ПАО «Совкомбанк»

2 Банк «Санкт-Петербург»

2 ПАО «БАНК УРАЛСИБ»

2 АО КБ «Ситибанк»

2 ПАО АКБ «Связь-Банк»

2 Банк «Возрождение» (ПАО)

Следующим этапом может быть проведен статистический анализ кластеров: среднее значение и дисперсия финансово-экономических показателей банков в каждом кластере. Полученные оценки позволят более точно проанализировать влияние ключевой ставки Банка России на финансово-экономическое состояние банковской системы

[11]. Направлением дальнейших исследований авторов будет сравнение показателей для различных кластеров в динамике и соответствующие выводы о развитии банковской системы и каждого банка в кластере относительно средних значений финансово-экономических показателей этого кластера. Кластеризация с учетом внутренней структуры объектов в относительных показателях позволяет сформировать более однородные группы кластеров по своим характеристикам и, тем самым, увеличить чувствительность метода кластеризации.

выводы

Рассмотрены различные варианты кластеризации коммерческих банков по абсолютным и относительным показателям.

Полученные результаты кластеризации зависят от представления данных (абсолютных или относительных) и чувствительны к методам кластеризации.

Для описания однородных объектов в смысле общей среды существования (банковской системы - в нашем случае) и похожим способом существования (генерация прибыли, кредиты и депозиты), но отличающихся масштабом, естественно выбрать то общее, что присуще этим объектам и то эти объекты объединяет и рассматривать кластеризуемые объекты в перспективе выбранного масштаба.

литература

1. Аникин В.И., Карманова А.А. Кластеризация и рейтингование банков с помощью нейронной сети Кохонена в среде MS EXCEL. / XV Всероссийская конференция по математическому моделированию и информационным технологиям. Тюмень, 2014.

2. Велиева И.С., Комардина О.Н., Финансовая устойчивость российских банков: размер или специализация? / ЭКСПЕРТ-РА, 2007, <http:// raexpert.ru/researches/banks/bank7/#result>.

3. Долгова Е.В., Васильева Е.Е. Математическое описание категории многопрофильных банков РФ на основе кластерного анализа. / Вестник ПНИУ. Социально-экономические науки. 2016. № 1.

4. Крылова Л.В. Структура банковского сектора: кластеризация или системные уровни./ Банковское дело № 5, 2019 стр. 14-21.

5. Vagizova V., Lurie K., Ivasiv I. Clustering of Russian banks: business models of interaction of the banking sector and the real economy /Problem and Perspectives in Management, Volume 11, Issue, 4, 2013

6. Ferstl, R., Seres D., Clustering Austrian banks' business models and peer groups in the European Banking Sector, Financial Stability Report, 24, p. 79-95.

7. Halaj G., Ochowski D. Strategic groups and banks' performance, Financial Theory and Practice, 33 (2), pp. 153-186.

8. Brechler J., Hausenblas V., Komárková Z., Plasil M., Similarity and Clustering of Banks: Application to the Credit Exposures of the Czech Banking Sector /Research and policy notes 4, Czech National Bank, 2014, ISSN1803-7097

9. Станик Н.А., Крайнюков Н.И. Экономическая динамика: оценка чувствительности экономических переменных в макроэкономических моделях, / Журнал Динамика систем, механизмов и машин. Том: 7 Номер: 4 Год: 2019 Стр. 14715, ISSN: 2310-9793

10. Stanick N.A, Kraynyukov N.I. Equilibrium Shifts and Shocks in Dynamic Systems Published under licence by IOP Publishing Ltd Journal of Physics: Conference Series, Volume 1441, conference 1, 2020

11. Станик Н.А., Крайнюков Н.И. Действие трансмиссионного механизма денежно-кредитной политики в российской практике Научно-практический журнал «ЭКОНОМИКА. НАЛОГИ. ПРАВО» № 1/2020 г. - [Электронный ресурс]. -Режим доступа: URL: http://www.fa.ru/org/div/ edition/enp/SiteAssets/Pages/now/20200%20N° 1. pdf

methods and indicators for cluster analysis of Russian banking data

stanick N.A., Kraynyukov N.I.

Financial University under the Government of the Russian Federation; Independent analyst-consultant

The selection of homogeneous groups (clustering) from the entire set of banks to assess the dynamics of the banking system clusters and its further analysis is an important goal. The article presents approaches and methods for cluster analysis of Russian banking data, such as K-means method, EM method and Affinity propagation method. Advantages and disadvantages of each method are noted. Banking-data were processed with K-means as the most relevant method. Clustering was carried out using the K-means method (K-means) as the most relevant for clustering the banking system using both absolute and relative financial and economic indicators. Different forms of clusters were noted in the formation of clusters based on absolute and relative indicators, which is especially mentioned for Sberbank PJSC. The results of clustering depend on the presentation of data and are sensitive to clustering methods.

Keywords: banking system, clustering, K-means method, EM-method, Affinity propagation method.

References

1. Anikin V.I., Karmanova A.A. Clustering and rating banks using the Kohonen neural network in MS EXCEL. / XV All-Russian Conference on Mathematical Modeling and Information Technology. Tyumen, 2014.

2. Velieva IS, Komardina ON, Financial stability of Russian banks: size or specialization? / EXPERT-RA, 2007, <http://raexpert.ru/ researches/banks/bank7/#result>.

3. Dolgova E.V., Vasilieva E.E. A mathematical description of the category of multidisciplinary banks of the Russian Federation based on cluster analysis. / Vestnik PNIU. Socio-economic sciences. 2016. No. 1.

4. Krylova L.V. The structure of the banking sector: clustering or system levels. / Banking No. 5, 2019. p. 14-21.

5. Vagizova V., Lurie K., Ivasiv I. Clustering of Russian banks: business models of interaction of the banking sector and the real economy / Problem and Perspectives in Management, Volume 11, Issue, 4, 2013

6. Ferstl, R., Seres D., Clustering Austrian banks 'business models and peer groups in the European Banking Sector, Financial Stability Report, 24, p. 79-95.

C3

о

CO

от m Р от

от А

IE

7. Halaj G., Ochowski D. Strategic groups and banks 'performance, Financial Theory and Practice, 33 (2), pp. 153-186.

8. Brechler J., Hausenblas V., Komarkova Z., Plasil M., Similarity and Clustering of Banks: Application to the Credit Exposures of the Czech Banking Sector / Research and policy notes 4, Czech National Bank, 2014, ISSN1803-7097

9. Stanik N.A., Krainyukov N.I. Economic dynamics: assessment of the sensitivity of economic variables in macroeconomic models, / Journal of Dynamics of systems, mechanisms and machines. Volume: 7 Number: 4 Year: 2019 Pages 147-15, ISSN: 2310-9793

LQ S Q.

e

CS CM

o

CM

10. Stanick N.A., Kraynyukov N.I. Equilibrium Shifts and Shocks in Dynamic Systems Published under license by IOP Publishing Ltd Journal of Physics: Conference Series, Volume 1441, conference 1, 2020

11. Stanik N.A., Krainyukov N.I. The action of the transmission mechanism of monetary policy in Russian practice. Scientific and practical journal "ECONOMY. TAXES. LAW "No. 1/2020 g. - [Electronic resource]. - Access mode: URL: http://www.fa. ru/org/div/edition/enp/SiteAssets/Pages/now/2020%20№ 1.pdf

i Надоели баннеры? Вы всегда можете отключить рекламу.