Relarm: рейтинговая модель на основе относительных РСА-атрибутов и k-кластеризации

Ирматова Эльнура Анваровна

РОССИЙСКОЕ ПРЕДПРИНИМАТЕЛЬСТВО

Том 18 • Номер 10 • май 2017 ISSN 1994-6937 Russian Journal of Entrepreneurship

издательство

Креативная экономика

RELARM: рейтинговая модель на основе относительных РсА-атрибутов и k-кластеризации

Ирматова Э.А. 1

1 Российская академия народного хозяйства и государственной службы при Президенте РФ, Москва, Россия

АННОТАЦИЯ:_

В статье, следуя широко используемой в распознавании образов концепции относительных атрибутов, дается определение относительных PCA атрибутов для класса объектов, заданных векторами своих параметров. Построена новая рейтинговая модель, RELARM, использующая ранковые функции относительных PCA атрибутов для описания рейтинговых объектов и алгоритм k-кластеризации. Отнесение каждого рассматриваемого объекта к соответствующей его свойствам рейтинговой категории происходит в результате проецирования центров кластеров на специально выбранный рейтинговый вектор. На тестовой модели кредитоспособности суверенных государств показан высокий уровень аппроксимации рейтингов рейтинговых агентств S&P, Moody's и Fitch рейтингами RELARM. Данное исследование было проведено в рамках Межкафедральной лаборатории финансово-экономических исследований, РАНХиГС при Президенте РФ.

КЛЮЧЕВЫЕ СЛОВА: рейтинговая модель, относительные PCA атрибуты, кредитный рейтинг, метод главных компонент, k-кластеризация

RELARM: A rating model based on relative pcA attributes and k-means clustering

Irmatova E.A. 1

1 The Russian Academy of National Economy and Public Administration under the President of the Russian Federation, Moscow, Russia

введение

Рейтинговые агентства играют важную роль в обеспечении финансового рынка индикативной и предсказательной информацией, способствующей увеличению рыночной эффективности. Одним из ключевых факторов при выборе агентства является доверие кредиторов к его оценкам, поэтому каждое агентство борется за увеличение прозрачности их методологий для конченых пользователей. Следует отметить, что особенно важной упомянутая задача является для вновь созданных агентств во время становления их репутации, когда аудитория (ком-

пании, инвесторы, заинтересованные лица) тщательно изучает принципы работы и формирования оценок. В связи с этим при создании рейтинговой методологии всегда возникает проблема объективности итоговой оценки. Объективность методологии в данном контексте означает минимальное присутствие факторов, оцениваемых исключительно с помощью экспертных суждений.

Важно отметить, что одной из приоритетных задач рейтингового агентства является выбор модели, наиболее точно описывающей рейтинговый объект, с минимальным использованием субъективной экспертной составляющей.

Модели скорингового типа являются основными моделями рейтинговых агентств для оценки кредитоспособности. Скоринговая модель предполагает получение интегрального численного показателя на основе количественных и качественных параметров, каждый из которых имеет определенное влияние, выраженное конкретным весовым коэффициентом, на конечную кредитоспособность исследуемого рейтингового объекта. Они могут создаваться с использований эконометрических инструментов (начиная от простейшей линейной регрессии до логит и пробит моделей), мультипликативного дискриминантного анализа, нейронных сетей, метода опорных векторов или на основе экспертных суждений [1-4].

Отличие перечисленных подвидов состоит в разных подходах к обработке базы данных рейтинговых объектов, разнообразных конструкциях и инструментах создания модели, различной степени автоматизации получения весовых коэффициентов.

Так, к примеру, в модели с экспертным суждением веса факторов модели определяются экспертным сообществом, в остальных же видах веса определяются, исходя из специализированного модельного обучения. Следует отметить, что показатели

ABSTRACT:_

Following the concept, which is widely used in visual recognition of relative attributes, the article defines the relative PCA attributes for a class of objects defined by their parameter vectors. We built a new rating model (RELARM) using ranking functions of the relative PCA attributes for the description of rating object and k-means clustering algorithm. Assignment of each rating object to a rating category occurs as a result of the projection of cluster centers on a specially selected rating vector Using the test model of sovereign states solvency we showed a high approximation level of the ratings assigned by rating agencies, such as S & P, Moody's and Fitch RELARM rating.

KEYWORDS: rating model, relative PCA attribute, credit rating, principal component analysis, k-means clustering.

Received: 04.05.2017 / published: 31.05.2017

CITATION:_

Irmatova E.A. (2017) RELARM: reytingovaya model na osnove otnositelnyh RSA-atributov i k-klasterizatsii [RELARM: A rating model based on relative PCA attributes and k-means clustering]. Rossiyskoe predprinimatelstvo. 18. (10). - 1597-1614. doi: 10.18334/rp.18.10.37967

создаваемой модели всегда являются предметом выбора экспертов, причем подбор осуществляется в соответствии с принципом наибольшего охвата характеристик анализируемого объекта.

постановка проблемы

Чаще всего в практической деятельности рейтинговых агентств встречаются именно модели с большой долей субъективной экспертной составляющей и малую часть составляют модели, основанные на эконометрических инструментах. Здесь экспертная часть заключается в выявлении степени влияния факторов на конечную оценку модели, а также в определении интервалов значений факторов модели для присвоения им баллов.

Основной трудностью таких рейтинговых методологий является то, что, к сожалению, экспертные методы не всегда бывают транспарентны для конечных пользователей рейтинговых оценок, так как всегда существует множество мнений по поводу веса того или иного показателя/блока модели, а также вариантов для интерпретации его численных значений. Помимо этого, построение и калибровка модели, основанной исключительно на экспертном суждении на практике может привести к структурным сдвигам в результатах. Например, экспертный подбор весов факторов может явиться причиной значительной неточности в итоговом рейтинге в связи с возможным высоким уровнем взаимозависимости между показателями.

С другой стороны, выбор эконометрического метода построения модели или моделирование нейронной сети предполагает наличие обширной базы данных по рейтингам для обучения и настройки рейтинговой модели. В противном случае, возможны значительные ошибки в присвоении и прогнозировании новых рейтинговых оценок. Таким образом, недостаток доступа к полным базам данных является второй основной трудностью в построении автоматизированной и точной рейтинговой модели.

Помимо перечисленных вопросов стоит обратить внимание на то, что существующие модели в научной литературе и на практике, по сути, предлагают определение рейтинговых оценок объекта вне зависимости от изменений остальных объектов системы, хотя на практике такого рода трудности купируются экспертными решениями рейтингового комитета.

ОБ АВТОРЕ:_

Ирматова Эльнура Анваровна, младший научный сотрудник, аспирантка (e1nura-irmatova0mai1.ru)

ЦИТИРОВАТЬ СТАТЬЮ:_

Ирматова Э.А. RELARM: рейтинговая модель на основе относительных РСА-атрибутов и k-кластеризации // Российское предпринимательство. - 2017. - Том 18. - № 10. - С. 1597-1614. doi: 10.18334/rp.18.10.37967

Новая рейтинговая модель на основе относительных РСА атрибутов

В настоящей статье вводится новая рейтинговая модель на основе относительных PCA (PCA - principal component analysis, метод главных компонент) атрибутов и k-кластеризации (далее RELARM: Relative Attributes Rating Model), обладающая следующими отличительными особенностями:

• определение рейтинга с наиболее полным учетом всех взаимозависимостей объектов системы;

• простота обучения и расчетов модели на небольшом, но релевантном массиве данных;

Предлагаемая модель направлена на определение кредитоспособности (финансовой надежности/устойчивости), именно исходя из принципа «живого организма», где изменение любого элемента будет иметь определенное отражение на состоянии остальных. Введение нового для рейтинговых моделей понятия относительных атрибутов обеспечивает наиболее полное описание характеристик анализируемых объектов. Необходимо выделить, что при правильно выбранных параметрах модели обеспечивается устойчивость присвоенных рейтингов по данной методологии.

Последняя особенность модели основывается на возможности использования данных об исследуемом рейтинговом объекте с горизонтом от 1-2-х лет. При этом становится необязательным обучение модели на огромной выборке - 10, 20, 30 лет и т.д. Настройка модели будет происходить все более точно с увеличением глубины периода и соответствующим увеличении количества данных по выбранным факторам модели. Однако адекватные и соответствующие реальности результаты можно получить и с минимальным объемом данных.

Необходимо подчеркнуть, что RELARM подходит для построения как контактных, так и дистанционных рейтинговых моделей. (Контактный рейтинг присваивается на основании договора с рейтингуемым лицом и с использованием информации, предоставляемой заказчиком, дистанционный рейтинг присваивается без договора на основании открытых данных)

Таким образом, предлагаемая в статье рейтинговая модель (RELARM) позволит рейтинговым агентствам строить свои методологии на принципах объективности, адекватности и прозрачности даже с учетом ограниченности горизонта данных.

В разделе 1 исследования приведены статьи, связанные с исследуемой проблематикой данной работы, в разделе 2 приводится описание предлагаемой рейтинговой модели, в разделе 3 проводится тестирование модели.

1. Связанные работы - теоретические предпосылки

В настоящее время тема рейтингов очень популярна в научной литературе. В целом, существует большое количество работ по моделированию рейтингов, кредитного скоринга и определения кредитного качества

В данном разделе приводится частичный обзор статей по рейтинговому моделированию, отражающих актуальность исследуемой тематики и разнообразие инструментов, возможных к применению в данной области.

Для большей наглядности будем условно делить существующую литературу на 3 типа:

• модели с использованием экспертного суждения,

• модели с использованием эконометрических инструментов,

• модели с использованием методов машинного обучения.

Модели с использованием экспертного суждения

В деятельности рейтинговых агентств часто используются модели, основанные на экспертном суждении.

Для определения значимости факторов рейтинговой модели экспертным путем может применяться метод анализа иерархий (МАИ). В статье [5] МАИ используется совместно с Грей анализом (grey relation analysis; GRA). Схожий подход представлен в [6], где исследуется кредитное качество с использованием модифицированного Грей анализа, Метода анализа иерархий (Analytic Hierarchy Process, AHP) и анализа TOPSIS (the technique for order performance by similarity to ideal solution). В работе [7] описывается модель кредитного риска, основанная на динамической мультикритериальной модели принятия решений (Dynamic Multiple Criteria Decision Making Model); веса факторов находятся по МАИ, а для определения итогового балла используется функция полезности - метод UTADIS (UTilites Additives Discriminantes).

Модели с использованием эконометрических инструментов

Регрессионные модели - следующий вид после моделей, основанных на экспертном мнении, которые встречаются в практике рейтинговых агентств. Необходимо отметить, что наиболее часто используется форма логистической регрессии, так, к примеру, общие принципы можно найти в работе [8] (Wei Y., Xu S., Meng F.), где строится и тестируется модель с добавлением качественных параметров. В статье [9] (Sohn S.Y., Kim D.H., Yoon J.H., 2016) предлагается использование нечеткой логистической регрессии для построения кредитного скоринга. Другой вариант создания модели рассматриваемого типа можно увидеть в исследовании [10] (Fernandez-Navarro F., Campoy-Munoz P., Paz-Marin M, Hervas-Martinez C., Yao X., 2013), где авторы используют порядковую регрессию (ordinal regression).

Модели с использованием элементов машинного обучения

В последнее десятилетие методы машинного обучения (создание нейронных сетей, использование метода опорных векторов) интенсивно развивались и нашли применение как при создании систем распознавания изображений, так и в моделях кредитных рейтингов, а также определения кредитного риска и качества. В статьях [11-13] (Chen W., Li JM., 2009) предлагаются методы с использованием опорных векторов (SVM; support vector machine) и их модификации. В исследовании [14] описана модель на основе нейронной сети.

Вместе с тем, довольно часто можно встретить внедрение метода главных компонент в модель кредитного рейтинга. [15-18] (ZhangM., Zhou Z., 2010).

2. Теоретическое описание рейтинговой модели RELARM

Рейтинговая модель RELARM состоит из четырех блоков:

Нормирование исходных параметров модели - приведение факторов модели к сопоставимому виду с помощью линейного масштабирования.

Вычисление ранковых функций относительных РСА атрибутов, отображение нормированных векторов параметров в пространство значений ранковых функций относительных РСА атрибутов и формирование рейтингового вектора.

K-кластеризация векторов пространства значений ранковых функций относительных РСА атрибутов с нахождением центров полученных кластеров.

Определение рейтинговых категорий объектов с помощью проекции на рейтинговый вектор.

В пункте 2.1 описывается процедура нормирования. Далее в 2.2 дается определение относительных PCA атрибутов и ранковых функций для характеризации объекта. Также определяется отображение в пространство значений ранковых функций относительных PCA атрибутов. В 2.3 показано применение k-кластеризации для данной модели.

2.1. Нормирование параметров модели RELARM

Допустим, в рейтинговой модели исследуется N параметров и в совокупности рассматривается M рейтинговых объектов. В целях унификации и сравнимости выбранных показателей модели производится процедура их нормирования методом линейного масштабирования.

Обозначим через pi;-, где £ £ [M~\,j Е [Л/], исходное значение^-го параметра ¿-го рейтингового объекта. Определим нормированное значение 6. пор:,-,! е [Af],j £ [W], в зависимости от влияния j-го параметра на конечное исследуемое свойство.

Положим

(1)

если увеличение показателя р^ оказывает положительное влияние на конечный рейтинг этого объекта и

Л £ [Af],j £ [N],

ру—гитару

(2)

если значение показателя ру оказывает отрицательное влияние на конечное рассматриваемое свойство.

В результате (1) и (2) рейтинговый объект будет описываться вектором-строкой нормированных параметров размерности (1 х п):

Пусть множество нормализованных параметров:

(4)

2.2. Характеризация объекта значениями ранковых функций относительных РСА атрибутов

В настоящем пункте описывается реализация второго блока создания модели, а именно, построение отображения нормированных векторов ЪI £ [М]в пространство значений ранковых функций относительных РСА атрибутов.

Понятие атрибутов широко используется в задачах построения систем распознавания изображений. Чаще всего рассматривалась идея распознавания по бинарному признаку (наличию или отсутствию характеристики), к примеру, улыбки на фотографиях с людьми или определения типа пейзажа. Однако применение такого алгоритма имеет очень ограничительный характер и чаще всего приводит к неоднозначному распознаванию или полному игнорирования признака. Позднее в работе [19] (Parikh D., Grauman К, 2011) предложено использование относительных атрибутов, обеспечивающих семантически более полное описание объектов, которое основывается на сравнение признаков у объектов относительно друг друга. Концепция относительных атрибутов для одного из объектов исследуемой совокупности индицируют релятивную силу наличия признаков анализируемого объекта в сравнении с другими объектами.

Определение относительного РСА атрибута и его ранковой функции

Пусть

(5)

т.е. ¿.,-нормированные РСА компоненты множества В (4) с собственными значениями ^Лх > А2 > ■■■ > (principal component variances).

Определение: р-м относительным РСА атрибутом вектора b, е В i = 1,2, ...М : = . 2 ..' назовем вектор AJp :

Aip = (biiwi p > bi 2 w pbiNwNp), p

= 1....,N.

(6)

В дальнейшем, если это не будет вызывать двойного толкования, p-й относительный РСА атрибут вектора будем называть p-м главным атрибутом вектора. В соответствие с концепцией статьи [19] (Parikh D., Grauman К, 2011) мы скажем, что p-й главный атрибут имеет более сильное присутствие в векторе Ь, чем в векторе ь.> если ^-норма вектора А - больше ¿^нормы вектора А - , т.е.

•¡к hp |

Соответственно, ранковый вектор для p-го главного атрибута будет вектор \~Тр :

К =( W1 p\>-\wNp I), (8)

а ранковая функция определяется по формуле [19] (Parikh D., Grauman K., 2011):

Гр (Ъ) = WTpbi.

Определим дг x d матрицу W'-

Обозначим рейтинговый вектор А как: Л: = (Л,,Я2,. ,

(9)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(10)

(11)

Зададим отображение f■в -> й"3, множества В в пространство значений ранковых функций относительных РСА атрибутов й1* по формуле:

(12)

Здесь:

Для г-го рейтингового объекта каждая координата вектора аТ показывает степень влияния изменений параметра рейтингового объекта относительно соответствующей главной компоненты.

2.3. Определение рейтинговых категорий на основе k-кластеризации

В данной работе выбран алгоритм k-кластеризации [20-21] (Lloyd S.P., 1982) для отнесения рейтинговых объектов к определенным рейтинговым категориям.

Необходимо отметить, что в качестве меры расстояния между точками данных и центрами кластеров в данной работе будет браться квадрат Евклидова расстояния, однако на практике возможно применение других вариантов, подходящих для решения задачи.

Разбиение на рейтинговые классы включает 4 этапа:

Применение алгоритма k-кластеризации на полученных в пункте 2.2 векторах пространства значений ранковых функций относительных РСА атрибутов (13). Полученные центры кластеров обозначим как CCqlq G (1,2, ...,Jt);

Проекция центров кластеров на рейтинговый вектор Л (11);

Ранжирование проекций кластеров по убыванию (чем выше значение - тем лучше рассматриваемое качество объектов - кредитоспособность);

Отнесение рейтинговых объектов к определенной категории на основании 1 и 3.

Модуль проекции центра q-го кластера на рейтинговый вектор Л (11) вычисляется по формуле:

PRq = |(cC4,A)|j4e(l,2.....к}. (14)

Замечание. Интуитивно мы можем считать, что l-е собственное значение рейтингового вектора Л пропорционально вероятности того, что сравнение по ранковой функции 1-ото главного атрибута является правильным. Соответственно, pr мы можем рассматривать как аналог модуля математического ожидания рейтингового значения объекта.

Полученные значения PRq, q е (1,2,...,&) ранжируем по убыванию, и на основании этого производим формирование списка рейтинговых объектов по рейтинговым классам.

3. Тестирование и расчет по модели RELARM

Основываясь на теоретическом представлении модели в предыдущем пункте, здесь будет приведен эмпирический опыт построения рейтинговой модели RELARM.

Для целей нашего эксперимента было решено провести тестовую разработку модели оценки кредитоспособности суверенных государств. Основными причинами выбора для анализа именно суверенных государств является то, что:

• во-первых, большое количество релевантных данных по странам возможно собрать в открытых базах данных;

• во-вторых, оценку кредитоспособности стран можно построить с большим упором на экономико-финансовые показатели и меньшей составляющей экспертной оценки, тогда как при создании, к примеру, рейтинговой модели для предприятий немалую роль играет анализ качественных показателей.

Второй пункт особо важен для пробного тестирования, так как минимизация экспертного мнения в данном случае необходима для наибольшей нейтрализацией результатов и возможности сравнения итогов с существующими рейтингами.

«Адекватность» полученных результатов будет сопоставлена с рейтингами кредитоспособности суверенных государств, присвоенных рейтинговыми агентствами Standard & Poor's1, Moody's2 и Fitch3.

3.1. Данные и критерии

Первоначальным и фундаментальным этапом построения рейтинговой модели является отбор наиболее важных показателей, характеризующих исследуемый объект максимально полно в рамках оценки определенного свойства (пр.: кредитоспособность, надежность, эффективность, качество и т.д.). Именно от выбора состава критериев во многом зависит отсутствие выбросов в результатах рейтинговой модели.

1 https://www.standardandpoors.com/

2 https://www.moodys.com/

3 https://www.fitchratings.com/

В следствие этого, для реализации экспериментальной модели были выбраны часть показателей оценки кредитоспособности суверенных государств, используемых рейтинговыми агентствами Standard & Poors, Moody's и Fitch. Необходимо также отметить, что выбор данных критериев также основан на новизне данных - брались только те показатели, сведения по которым уже размещены за 2016 год, и при важности включения критерия, но отсутствии значений за текущий период - за 2015 год.

Таким образом, были отобраны 9 финансово-экономических показателей, являющихся основными для описания экономики страны. Они представлены в таблице 1.

Помимо финансово-экономических показателей в создаваемую модель также будет включен экспертный фактор, имеющий распределение [0,1] (как и все другие показатели после нормирования) и отражающий мнение эксперта относительно силы экономики страны, возможности ее поддержки со стороны других стран, «мягкую силу» государства, а также прогнозную силу экономики.

Для построения нашей тестовой модели были отобраны 30 стран со всего мира.

Данные по выделенным критериям по странам брались из публичных статистических баз: Всемирный Банк, Международный Валютный Фонд, база данных «The World Factbook», данные статистических органов стран, центральных банков и ведомств государств и других источников.

3.2. Расчет модели RELARM

После того как были отобраны необходимые для модели критерии оценки, определен состав стран, входящих в тестовую выборку, а также собраны требуемые данные, производится их нормирование.

Прежде всего, важно определить влияние каждого показателя на исследуемый признак, то есть кредитоспособность (табл. 2).

Далее нормированные значения для каждого фактора рассчитываются по формулам (1) и (2). В таблице 3 приведен пример расчета нормированных значений.

Матрица нормированных значений по 30 странам приведена в таблице 4.

На основе матрицы нормированных значений страновых показателей (табл. 4) с учетом введенного экспертного фактора определяется количество главных компонент d и матрица W (10) (табл. 5).

Далее для каждой страны производится переход в пространство R^ значений ранковых функций относительных РСА атрибутов (12). В нашем случае были отобраны 6 главных компонент, которые обеспечивают сохранение 96% накопленной информации.

Также был определен вектор Л (11) (табл. 6):

Таким образом, в пространстве значений ранковых функций относительных РСА атрибутов находятся 30 векторов, соответствующих каждой стране и далее производится кластеризация по механизму, описанному в пункте 2.3. Учитывая то, что в нашем эксперименте рассматриваются всего 30 стран, кластеризация программировалась на определение 7 (k=7) общих рейтинговых классов без учета подкатегорий:

Таблица 1

описание показателей для тестирования

название показателя краткое описание период для проведения эксперимента какими агентствами используется*

1.Средний рост ВВП В общем смысле рост ВВП является показателем экономического развития, снижение - спадом. В расчете за 7 лет: 6 предыдущих лет и настоящее время. Moody's Fitch

2.Индекс конкурентоспособности Всемирного Экономического Форума Экономическая конкурентоспособность, способность стран обеспечивать высокий уровень благосостояния своих граждан по версии Всемирного Экономического Форума. Текущий период Moody's

3.ВВП на душу населения Определяет уровень экономического развития, роста экономики страны Текущий период Moody's Fitch

¿.Отношение государственного долга к ВВП В общем смысле чем выше уровень государственного долга, тем больше риск дефолта. Тем не менее зависимость не столь линейна и ее необходимо рассматривать в связке с другими показателями. Текущий период Moody's Fitch

5.Отношение сальдо государственного бюджета к ВВП В общем смысле большой дефицит государственного бюджета показывает несостоятельность фискальной политики государства и при прочих равных может привести к увеличению долговой нагрузки. Текущий период Fitch

¿.Уровень инфляции В общем понимании, низкий уровень инфляции и экономический рост ведут к более стабильной позиции кредитоспособности и наоборот. Текущий период Moody's Fitch

7.Волатильность уровня инфляции В общем смысле высокий уровень волатиль-ности инфляции свидетельствует о несостоятельности монетарной политики и наоборот. В расчете за 5 лет: 4 предыдущих года и настоящее время. Moody's

8.Отношение суммы сальдо счета текущих операций и прямых зарубежных инвестиций к ВВП Характеризует возможность покрытия дефицита текущего счета - чем выше этот показатель, тем меньше вероятность увеличения долговой нагрузки и, соответственно, снижения кредитоспособности. Текущий период Moody's Fitch

9.Объем золотовалютных резервов «Подушка безопасности» страны при различного рода шоках. В общем понимании, чем выше показатель, тем более стабильна страна к различного рода кризисам. Текущий период Fitch

Источник: составлено автором.

* В соответствии с методологиями оценки кредитоспособности суверенных государств рейтинговых агентств Standard & Poors, Moody's и Fitch, июль 2016 года.

Таблица 2

Влияние факторов на исследуемое моделью свойство - кредитоспособность

Название показателя Влияние

1.Средний рост ВВП Позитивное*

2.Индекс конкурентоспособности Всемирного Экономического Форума Позитивное

3.ВВП на душу населения Позитивное

¿.Отношение государственного долга к ВВП Негативное**

5.Отношение сальдо государственного бюджета к ВВП Позитивное

¿.Уровень инфляции Негативное

7.Волатильность уровня инфляции Негативное

8.Отношение суммы сальдо счета текущих операций и прямых зарубежных инвестиций к ВВП Позитивное

9.Объем золотовалютных резервов Позитивное

Источник: составлено автором.

^Позитивное влияние - чем больше значение показателя, тем выше значение исследуемого

признака.

**Негативное влияние - чем больше значение показателя, тем ниже значение исследуемого признака.

Таблица 3

Пример расчета нормированных значений показателей

Страна: Россия

Показатель Значение Минимальное зна- Максимальное зна- Нормированное

чение критерия по выборке из 30 стран чение критерия по выборке из 30 стран значение

Индекс конкурентоспособности Все- 4,44 3,3 5,76 0,4634

мирного Экономического Форума

Уровень инфляции 7,5% -1,3 180,9 0,9517

Источник: составлено автором.

AAA, AA, A, BBB, BB, B, CCC. Для проведения теста выбрано евклидово расстояние. k-кластеризация позволила сгруппировать страны в однородные по свойствам группы и определить следующие центры кластеров (табл. 7).

Полученный рейтинг был сравнен с рейтингами для выбранных стран по состоянию на 31.07.2016 года (источник Thomson Reuters Eikon), присваиваемых рейтинго-

Таблица 4

Матрица нормированных значений по 30 странам

Страна Сред- Индекс ВВП на Гос. Сальдо Уровень Вола- (Сальдо Объем

ний конку- душу долг/ госбюд- инфля- тильность счета золо-

рост ренто- населе- ВВП жета/ ции уровня тек. това-

ВВП способности ВЭФ ния ВВП инфляции лютных резервов

Швейцария 0,45 1,00 1,00 0,86 0,67 1,00 1,00 1,00 0,17

Норвегия 0,43 0,86 0,93 0,87 1,00 0,97 0,99 0,57 0,02

США 0,49 0,94 0,68 0,55 0,52 0,99 1,00 0,20 0,03

Германия 0,47 0,91 0,49 0,69 0,71 0,99 0,99 0,48 0,02

Австрия 0,42 0,74 0,52 0,63 0,60 0,99 0,99 0,31 0,00

Финляндия 0,37 0,87 0,50 0,73 0,51 0,99 0,99 0,40 0,00

Великобритания 0,49 0,87 0,52 0,62 0,41 0,99 0,99 0,08 0,04

Франция 0,41 0,74 0,43 0,58 0,46 0,99 1,00 0,22 0,02

Бельгия 0,42 0,77 0,48 0,54 0,52 0,98 0,99 0,05 0,00

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Южная Корея 0,61 0,69 0,31 0,85 0,49 0,99 1,00 0,39 0,11

Китай 1,00 0,65 0,06 0,81 0,53 0,98 1,00 0,34 1,00

Чешская Респу- 0,46 0,57 0,18 0,83 0,65 0,99 0,99 0,24 0,02

блика

Япония 0,41 0,88 0,38 0,00 0,32 1,00 0,99 0,22 0,36

Эстония 0,59 0,59 0,18 0,96 0,69 1,00 0,97 0,21 0,00

Саудовская 0,70 0,72 0,22 1,00 0,53 0,97 1,00 0,57 0,18

Аравия

Мексика 0,58 0,40 0,07 0,82 0,47 0,98 1,00 0,21 0,05

Казахстан 0,68 0,48 0,09 0,90 0,60 0,90 0,92 0,34 0,01

Болгария 0,44 0,41 0,04 0,88 0,55 1,00 0,98 0,35 0,01

Венгрия 0,44 0,39 0,11 0,68 0,56 0,99 0,97 0,33 0,01

Румыния 0,50 0,41 0,07 0,84 0,63 1,00 0,97 0,25 0,01

Португалия 0,29 0,50 0,20 0,44 0,41 0,99 0,99 0,18 0,00

Турция 0,75 0,43 0,07 0,86 0,60 0,95 1,00 0,09 0,03

Российская 0,43 0,46 0,07 0,93 0,52 0,95 0,94 0,34 0,10

Федерация

Бразилия 0,40 0,32 0,06 0,72 0,07 0,94 0,98 0,15 0,11

Черногория 0,47 0,37 0,04 0,74 0,26 1,00 0,97 0,20 0,00

Беларусь 0,44 0,35 0,03 0,90 0,77 0,93 0,70 0,00 0,00

Египет 0,59 0,15 0,00 0,61 0,00 0,92 0,97 0,21 0,00

Аргентина 0,59 0,20 0,12 0,79 0,35 0,77 0,74 0,22 0,01

Греция 0,00 0,29 0,19 0,23 0,25 1,00 0,99 0,12 0,00

Венесуэла 0,28 0,00 0,12 0,79 0,00 0,00 0,00 0,32 0,00

Источник: составлено автором.

Таблица 5

Матрица W по тестируемой выборке из 30 стран

РС1* РС2 РС3 РС4 PC5 PC6

0,0037331 0,1495590 0,0802628 0,1350172 0,0779327 0,0581565

0,1952260 0,0439502 0,0002582 0,0511073 0,0582012 0,0306353

0,1771148 0,0104838 0,1769460 0,0015549 0,1137436 0,0310753

0,0364766 0,2201364 0,0834812 0,0725665 0,1303886 0,1465127

0,0986781 0,1619003 0,0091527 0,1438917 0,0726696 0,2638306

0,0752998 0,0564140 0,1891941 0,1034713 0,0916144 0,0351023

0,0785673 0,0574330 0,1900024 0,0780202 0,1206648 0,0985294

0,0535689 0,1 192260 0,1548306 0,0770953 0,1318564 0,1213022

0,0154986 0,0669336 0,0888243 0,3118414 0,0039790 0,1098994

0,2658367 0,1 139637 0,0270476 0,0254341 0,1989497 0,1049565

Источник: составлено автором. **РС - главная компонента.

Таблица 6

Вектор Л, полученный по тестируемой выборке из 30 стран

A(transposed) 0,49 0,16 0,12 0,09 0,07 0,03

Таблица 7

Центры кластеров по тестируемой выборке из 30 стран

№ кластера Строки соответствуют векторам кластеров

1 0,259918 0,36576 0,476832 0,324568 0,368703 0,323598

2 0,068437 0,255082 0,159704 0,120411 0,180846 0,174925

3 0,541449 0,721616 0,693901 0,83454 0,625795 0,67663

4 0,468673 0,440418 0,518884 0,366315 0,507716 0,40509

5 0,455239 0,57652 0,556856 0,463086 0,546149 0,534525

6 0,852695 0,720394 0,76527 0,557884 0,816989 0,721204

7 0,70372 0,563184 0,610649 0,457141 0,661138 0,542587

Источник: составлено автором.

выми агентствами S&P, Moody's и Fitch. При этом успехом эксперимента является совпадения рейтинга по тестовой модели с одним из рейтингов перечисленных агентств. Так как мы разбивали страны на 7 кластеров без подкатегорий, рейтинг страны по тестовой модели является совпадающим с существующим рейтингом реального агентства, если он соответствует общей рейтинговой категории (Пр.: Рейтинг страны по тестовой модели АА, а по Fitch АА+: тестовый рейтинг совпадает с реальным).

Таким образом, на основе метода RELARM был получен результат, представленный в таблице 8.

Таблица 8

Сравнение результатов по тестовой модели [ЗЕ1АРМ и реальных рейтингов

Страна Рейтинговая категория s&p Moodys Fitch

Швейцария AAA + + +

Норвегия AAA + + +

Германия AAA + + +

США AA + - -

Австрия AA + + +

Финляндия AA + + +

Великобритания AA + + +

Франция AA + + +

Бельгия AA + + +

Южная Корея AA + + +

Чешская Республика AA + - -

Япония AA - - -

Китай A - - +

Эстония BBB - - -

Саудовская Аравия BBB - - -

Мексика BBB + - +

Казахстан BBB + + +

Болгария BBB - + +

Венгрия BBB - - +

Румыния BBB + + +

Турция BBB - + +

Российская Федерация BBB - - +

Беларусь BBB - - -

Португалия BB + + +

Бразилия BB + + +

Черногория B + + Нет рейтинга

Египет B + + +

Аргентина B + + +

Греция B + - -

Венесуэла CCC + + +

Источник: составлено автором.

Как видно из таблицы 8, метод ЯЕЬЛЯМ хорошо аппроксимирует рейтинги ведущих агентств (86% аппроксимации). При этом необходимо отметить, что такой результат был получен на основе малого количества факторов, лишь частично описывающих экономическое состояние страны. Грамотное использование показателей

и правильная настройка модели и механизма кластеризации могут обеспечить еще большую возможность для уточнения результатов. Помимо этого, полученное распределение стран по рейтинговым категориям является рекомендацией рейтинговому комитету агентства для определения категории. Фактическое решение об уровне рейтинга всегда является экспертным.

Подводя итог, результат можно оценить, как адекватный и рекомендовать модель для имплементации в практическую деятельность рейтинговых агентств.

Заключение

В настоящей работе представлена новая рейтинговая модель на основе относительных PCA атрибутов и k-кластеризации.

RELARM обеспечивает наиболее полное описание анализируемых объектов с помощью введения понятия относительных РСА атрибутов для вектора параметров рейтингуемого объекта.

Проведенное тестирование модели показало высокий процент аппроксимации итогов с реальными рейтингами. Правильный выбор факторов, эффективная настройка модели и кластеризации обеспечат высокий уровень точности результатов. Вместе с этим простота расчетов и обучения модели позволяют рекомендовать RELARM для введения в практическую деятельность рейтинговых агентств.

Благодарность

Автор выражает глубокую благодарность А.А. Ирматову за ценные комментарии и внимание к данной статье.

ИСТОЧНИКИ:

1. Novotna M. 2012. The use of different approaches for credit rating prediction and

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

their comparison. 6th International Scientific Conference Managing and Modelling of Financial Risk. VSB-TU Ostrava

2. Chen H., Chen Y. 2010. A comparative study of discrimination methods for credit scoring.

Computers and Industrial Engineering (CIE), 2010 40th International Conference on: 1-5. DOI: 10.1109/ICCIE.2010.5668170

3. Huang S.C., Day M.Y. 2013. A Comparative Study of Data Mining Techniques for

Credit Scoring in Banking. Information Reuse and Integration (IRI), 2013 IEEE 14th International Conference on: 684-691. DOI: 10.1109/IRI.2013.6642534

4. Hsu C.F., Hung H.F. 2009. Classification methods of Credit Rating - A Comparative

Analysis on SVM, MDA and RST. Computational Intelligence and Software Engineering, 2009. CiSE 2009. International Conference on: 1-4. DOI: 10.1109/CISE.2009.5366068

5. Hongli, Junchen. 2010. The Credit Rating of Small and Medium-sized Enterprises Based on

the Grey Hierarchy Evaluation Model. The 2nd International Conference on Information Science and Engineering: 3247-3250. DOI: 10.1109/ICISE.2010.5689927

российское предпринимательство № 102017 (май)

1613

6. Wang H. 2011. Rating of Credit Risk Utilizing Improved GRA with Compound Weight.

Artificial Intelligence, Management Science and Electronic Commerce (AIMSEC), 2011 2nd International Conference on: 3196-3200. DOI: 10.1109/AIMSEC.2011.6011178

7. Lou C., Peng Y., Kou G., Ge X. 2010. DMCDM: A dynamic multi criteria decision making

model for sovereign credit default risk evaluation. Software Engineering and Data Mining (SEDM), 2010 2nd International Conference on: 489 - 494

8. The Listed Company's Credit Rating Based on Logistic Regression Model Add non-

financial Factors Wei Y., Xu S., Meng F. 2010. The Listed Company's Credit Rating Based on Logistic Regression Model Add non-financial Factors. Modeling, Simulation and Visualization Methods (WMSVM), 2010 Second International Conference on: 172175. DOI: 10.1109/WMSVM.2010.69

9. Sohn S.Y., Kim D.H., Yoon J.H. Technology credit scoring model with fuzzy logistic

regression // Applied Soft Computing. - 2016. - № 43. - p. 150-158. - doi: 10.1016/j. asoc.2016.02.025.

10. Fernandez-Navarro F., Campoy-Munoz P., Paz-Marin M, Hervas-Martinez C., Yao X. Addressing the EU Sovereign Ratings Using an Ordinal Regression Approach // IEEE Transactions on Cybernetics. - 2013. - № 43. - p. 2228-2240. - doi: 10.1109/ TSMCC.2013.2247595.

11. Chen W., Li JM. A model based on factor analysis and support vector machine for credit risk identification in small-and-medium enterprises // International Conference on Machine Learning and Cybernetics. - 2009. - p. 913-918. - doi: 10.1109/ ICMLC.2009.5212433.

12. Jilani T.A., Burney S.M.A. 2008. Multiclass Bilateral-Weighted Fuzzy Support Vector Machine to Evaluate Financial Strength Credit Rating. Computer Science and Information Technology, 2008. ICCSIT '08. International Conference on: 342-348. DOI: 10.1109/ICCSIT.2008.191

13. Gangolf C, Dochow R, Schmidt G, Tamisier T. 2014. SVDD: A proposal for automated credit rating prediction. Control, Decision and Information Technologies (CoDIT), 2014 International Conference on: 048-053. DOI: 10.1109/CoDIT.2014.6996866

14. Liu C, Xia X. 2010. The credit rating of small and medium enterprises based on neural network. Information Engineering and Electronic Commerce (IEEC), 2010 2nd International Symposium on: 1-4. DOI: 10.1109/IEEC.2010.5533285

15. Xiang D. 2010. The Listed Company's Financial Evaluation Based on PCA-Logistic Regression Model. Multimedia and Information Technology (MMIT), 2010 Second International Conference on: 168-171. DOI: 10.1109/MMIT.2010.148

16. Xue X-h, Xue X-f. 2010. Research of electronic commercial credit rating based on Neural Network with Principal Component Analysis. Internet Technology and Applications, 2010 International Conference on: 1-4. DOI: 10.1109/ITAPP.2010.5566121

17. Jianfeng L, Tianshan M. 2010. An Comprehensive Rating Model of Manufacturing Enterprise's Credit Risk Based on Logistics Finance. 2010 International Conference on

Computer Application and System Modeling (ICCASM 2010): V15-290 -V15-293. DOI: 10.1109/ICCASM.2010.5622102

18. Zhang M., Zhou Z. A Credit Rating Model for Enterprises Based on Principal Component Analysis and Optimal Partition // Emergency Management and Management Sciences (ICEMMS): DOI: 10.1109/ICEMMS.2010.5563423. 2010. - p. 379-382.- doi: 10.1109/ ICEMMS.2010.5563423.

19. Parikh D., Grauman K. Relative Attributes // Proceedings of the International Conference on Computer Vision. - 2011. - p. 503-510.

20. Lloyd S.P. Least Squares Quantization in PCM // IEEE Transactions on Information Theory. - 1982. - № 28. - p. 129-137.

21. Arthur D, Vassilvitskii S. 2007. K-means++: The Advantages of Careful Seeding. SODA '07: Proceedings of the Eighteenth Annual ACM-SIAM Symposium on Discrete Algorithms: 1027-1035

REFERENCES:

Chen W., Li JM. (2009). A model based on factor analysis and support vector machine for credit risk identification in small-and-medium enterprises International Conference on Machine Learning and Cybernetics. 913-918. doi: 10.1109/ ICMLC.2009.5212433.

Fernandez-Navarro F., Campoy-Munoz P., Paz-Marin M, Hervas-Martinez C., Yao X. (2013). Addressing the EU Sovereign Ratings Using an Ordinal Regression Approach IEEE Transactions on Cybernetics. 6(43). 2228-2240. doi: 10.1109/ TSMCC.2013.2247595.

Lloyd S.P. (1982). Least Squares Quantization in PCM IEEE Transactions on Information Theory. (28). 129-137.

Parikh D., Grauman K. (2011). Relative Attributes Proceedings of the International Conference on Computer Vision. 503-510.

Sohn S.Y., Kim D.H., Yoon J.H. (2016). Technology credit scoring model with fuzzy logistic regression Applied Soft Computing. (43). 150-158. doi: 10.1016/j. asoc.2016.02.025.

Zhang M., Zhou Z. (2010). A Credit Rating Model for Enterprises Based on Principal Component Analysis and Optimal Partition Emergency Management and Management Sciences (ICEMMS). 379-382. doi: 10.1109/ICEMMS.2010.5563423.

Relarm: рейтинговая модель на основе относительных РСА-атрибутов и k-кластеризации Текст научной статьи по специальности «Экономика и бизнес»

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Ирматова Эльнура Анваровна

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Ирматова Эльнура Анваровна

RELARM: A rating model based on relative PCA attributes and k-means clustering

Текст научной работы на тему «Relarm: рейтинговая модель на основе относительных РСА-атрибутов и k-кластеризации»