Научная статья на тему 'Создание виртуальной клиентской базы для анализа кредитоспособности российских предприятий'

Создание виртуальной клиентской базы для анализа кредитоспособности российских предприятий Текст научной статьи по специальности «Экономика и бизнес»

CC BY
223
92
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Финансы и кредит
ВАК
Область наук
Ключевые слова
КЛАССИФИКАЦИОННЫЙ АНАЛИЗ / ОБУЧАЮЩАЯ ВЫБОРКА / КЛАСТЕРНЫЙ АНАЛИЗ / ДИСКРИМИНАНТНЫЙ АНАЛИЗ / НЕЙРОННЫЕ СЕТИ / ЛИНГВИСТИЧЕСКАЯ ШКАЛА / РЕНТАБЕЛЬНОСТЬ / ПЛАТЕЖЕСПОСОБНОСТЬ / ТЕОРИЯ НЕЧЕТКИХ МНОЖЕСТВ

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Шевченко И. В., Халафян A. A., Васильева Е. Ю.

В настоящее время особо актуальной является проблема определения риска банкротства предприятия. Решение проблемы возможно путем использования статистических классификационных и эвристических методов, которые требуют наличия обучающей выборки совокупности данных по предприятиям, уровень риска банкротства которых изначально известен. На практике сбор такой информации является весьма трудоемким и доступ к ней либо ограничен, либо вообще отсутствует. В статье предложен метод создания виртуальной клиентской базы, который основан на выявленных закономерностях значений финансовых показателей предприятия. При помощи клиентской базы посредством таких методов, как дискриминантный анализ, деревья классификации, нейронные сети, можно оценить величину риска банкротства любого предприятия, если известны определенные показатели его экономической деятельности.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Шевченко И. В., Халафян A. A., Васильева Е. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Создание виртуальной клиентской базы для анализа кредитоспособности российских предприятий»

Оценка кредитоспособности

создание виртуальной клиентской базы для анализа кредитоспособности российских предприятий

И. В. ШЕВЧЕНКО, доктор экономических наук, профессор, декан экономического факультета, заведующий кафедрой мировой экономики E-mail: decan@econ. kubsu. ru

А. А. ХАЛАФЯН, кандидат технических наук, доцент, профессор кафедры прикладной математики E-mail: khaliphyan@kubannet. ru

Е. Ю. ВАСИЛЬЕВА, аспирант кафедры прикладной математики E-mail: katrins_notes@mail. ru Кубанский государственный университет

В настоящее время особо актуальной является проблема определения риска банкротства предприятия. Решение проблемы возможно путем использования статистических классификационных и эвристических методов, которые требуют наличия обучающей выборки -совокупности данных по предприятиям, уровень риска банкротства которых изначально известен. На практике сбор такой информации является весьма трудоемким и доступ к ней либо ограничен, либо вообще отсутствует. В статье предложен метод создания виртуальной клиентской базы, который основан на выявленных закономерностях значений финансовых показателей предприятия. При помощи клиентской базы посредством таких методов, как дискриминантный анализ, деревья классификации, нейронные сети, можно оценить величину риска банкротства любого предприятия, если известны определенные показатели его экономической деятельности.

Ключевые слова: классификационный анализ, обучающая выборка, кластерный анализ, дискриминантный анализ, нейронные сети, лингвистическая шкала, рентабельность, платежеспособность, теория нечетких множеств.

В настоящее время существует проблема информационной неопределенности предприятий

как объекта исследований. Наиболее существенной данная проблема является для кредитных организаций при определении уровня риска клиента в процессе осуществления финансового мониторинга.

Вопрос кредитоспособности предприятия на данный момент является актуальным. Существует можество различных методов и подходов для определения уровня риска банкротства. Но далеко не все эти методы являются приемлемыми из-за недостатка исходных данных и неутойчивости финансовых показателей предприятия (параметров). Очевидно, что значения финансовых показателей не только изменяемы во времени, но и зависимы от территориального фактора самого предприятия. Объясняется это тем, что условия развития предприятий в различных регионах страны различаются. Например, широко известный метод Альтмана по определению уровня риска предприятия не является устойчивым к вариациям исходных данных, так как эти данные обладают сильной динамикой изменения как во времени, так и в пространстве.

Наиболее удачным способом решения проблемы выбора устойчивых во времени и в про-

странстве финансовых показателей является метод комплексного финансового анализа предприятий, предложенный в статье [2]. Авторами был получен ряд самых общих закономерностей, которым подчиняются финансовые показатели российских предприятий. Это связано с тем, что комплексные финансовые оценки были выбраны авторами работы из поля качественных, а не количественных признаков. В основе метода [2] лежит понятие «нечетких множеств», что позволяет установить логическую связь количественных значений показателей с некоторым комплексным показателем, характеризующим финансовое состояние в целом. Взаимосвязь комплексного показателя и количественных признаков проанализирована в статье [3]. В работе [1] впервые были предложены показатели, наилучшим образом характеризующие состояние предприятий в условиях российской экономики. Они отражают мнения руководителей коммерческих предприятий (по результатам их опроса) или входят в состав методики Федерального управления по делам несостоятельности (банкротства) и моделей Альтмана. После анализа собранных авторами материалов ими были отобраны 16 показателей [1]. Позже, уже дополненные и расширенные, они легли в основу метода оценки финансового состояния предприятий, описанного в статье [2].

Целью настоящей работы является генерация виртуальной клиентской базы предприятий на основе метода оценки финансового состояния, построенного на нечетких множествах. База предприятий может служить обучающей выборкой для методов классификационного анализа при определении уровня риска реально существующего предприятия. Имея клиентскую базу, в которой присутствуют виртуальные предприятия, принадлежащие к различным группам риска, можно такими методами, как нейронные сети, деревья классификации, или дискриминантный анализ, прогнозировать принадлежность предприятия к той или иной группе риска. Далее в статье будет показано, что созданная база как совокупность предприятий может быть корректно разбита на уровни выбранной лингвистической шкалы параметров предприятия.

При рассмотрении параметров предприятий необходимо учесть, что используемый метод для создания виртуальной клиентской базы применим в случае макроэкономической стабилизации, т. е. периода, когда наблюдается стабильный рост валового внутреннего продукта (ВВП) одновременно с низкими уровнями колебания курса доллара/евро

и процента инфляции. Произведя анализ показателей, представленных на сайте Международного валютного фонда [5], был выделен период с 2000 г. (высокий показатель инфляции) по III квартал 2008 г. включительно (мировой финансовый кризис). Данный период дает возможность говорить об однородной финансовой статистике. Здесь однородность подразумевается как наличие незначительных изменений, а не как равенство показателей.

Для создания клиентской базы были использованы 16 наиболее весомых экономических показателей, образующих четыре группы [2].

Группа 1 — рентабельность:

R1 — общая рентабельность [балансовая прибыль/выручка от продаж + внереализационные доходы, %];

R2 — рентабельность активов [чистая прибыль/средняя балансовая стоимость активов, % за квартал];

R3 — рентабельность собственного капитала [чистая прибыль/ капитал и резервы (за вычетом собственных акций, выкупленных у акционеров) — целевое финансирование и поступления + доходы будущих периодов, % за квартал];

R4 — рентабельность продукции [прибыль от продаж/выручка от продаж, %];

R5 — рентабельность оборотных активов [чистая прибыль/средняя стоимость активов, % за квартал].

Группа 2 — ликвидность и платежеспособность:

L1 — быстрый коэффициент ликвидности [(оборотные активы — запасы — налог на добавленную стоимость по приобретенным ценностям — долгосрочная дебиторская задолженность) /краткосрочные обязательства (не включая доходы будущих периодов), безразмерная величина];

L2 — коэффициент покрытия запасов [(оборотные собственные средства + краткосрочные займы и кредиты + краткосрочная кредиторская задолженность) /средняя величина запасов, %];

Р1 — текущий коэффициент ликвидности [(оборотные активы — долгосрочная дебиторская задолженность) /краткосрочные обязательства (не включая доходы будущих периодов), безразмерная величина].

Группа 3 — деловая активность:

А2 — оборачиваемость активов [выручка от продажи (за вычетом налога на добавленную стоимость, акцизов и др. обязательств) / средняя стоимость активов, один раз за квартал);

14

ФИНАНСЫ И КРЕДИТ

А4 — оборачиваемость кредиторской задолженности [выручка от продажи без учета коммерческих и управленческих расходов/средняя кредиторская задолженность, один раз за квартал];

А5 — оборачиваемость дебиторской задолженности [выручка от продажи (за вычетом налога на добавленную стоимость, акцизов и др. обязательств) / (дебиторская задолженность на конец отчетного периода — задолженность учредителей по вкладам в уставной капитал на конец отчетного периода), один раз за квартал];

А6 — оборачиваемость запасов [себестоимость/ средняя величина запасов, один раз за квартал].

Группа 4 — финансовая устойчивость:

F1 — коэффициент финансовой зависимости [долгосрочные обязательства + краткосрочные обязательства (не включая доходы будущих периодов) / (капитал и резервы (за вычетом собственных акций, выкупленных у акционеров) — целевое финансирование и поступления + доходы будущих периодов), безразмерная величина];

F2 — коэффициент автономии собственных средств [капитал и резервы (за вычетом собственных акций, выкупленных у акционеров) — целевое финансирование и поступления + доходы будущих периодов/внеоборотные активы + оборотные активы, безразмерная величина];

F3 — обеспеченность запасов собственными оборотными средствами [собственные оборотные средства/запасы, безразмерная величина];

F4 — индекс постоянного актива [(внеоборотные активы + долгосрочная дебиторская задолженность) / (капитал и резервы (за вычетом собственных акций, выкупленных у акционеров) — целевое финансирование и поступления + доходы будущих периодов), безразмерная величина].

Для качественной и более наглядной интерпретации уровней выбранных показателей необходимо воспользоваться лингвистической шкалой [4] — пенташкалой, т. е. пя-

тиуровневым классификатором, где уровни интервальных значений параметров представлены в пяти вариациях: «очень низкий» (ОН); «низкий» (Н); «средний» (Ср); «высокий» (В); «очень высокий» (ОВ). Лингвистическая шкала является наиболее наглядной для принятия решения специлистом. Наряду с пятиуровневым классификатором также используют бинарные «Низкий — Высокий» и три-нарные «Низкий — Средний — Высокий» шкалы. Преимущество петашкалы в нашем случае заключается в том, что она является более развернутой, чем бинарные и тринарные шкалы, и в то же время четко определяет степень выбора того или иного решения. Шкалы, состоящие из семи элементов, сильно рассеивают внимание и являются более громоздкими. Именно поэтому при определении уровня риска предпрития наиболее оптимальным является пятиуровневый классификатор.

Для пенташкалы была построена система функций, которые соответствуют нечетким подмножествам. Простейшим способом задания является система трапециевидных нечетких чисел. На рис. 1 приведен пример такой системы с нормированным значением экономического показателя (т. е. диапазон изменения значения финансового показателя находится в пределах от 0 до 1 по оси абсцисс).

Чем ниже уровень этого показателя (имеет вид трапеции), тем выше уровень риска банкротства предприятия. Трапеции классификатора, являю-

1.0

0.9 0.8 0.7 0.6

ц= 0,5

0.4 0.3 0.2 0.1 0

О

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

X

рис. 1. Пример системы пенташкалы с нормированным значением экономического показателя: ось ОХ — нормированное значение экономического показателя; ось OY — вероятность отнесения специалистом исследуемого предприятия к соответствующей группе уровня риска

щиеся функциями пенташкалы, попарно пересекаются в точках, у которых совпадают ординаты (0,5). Ось абсцисс отражает величину значения параметра, а ось ординат — уверенность специалиста в принятии решения. В точках пересечения прямой ^ = 0,5 и трапеций достигается максимум информационной неопределенности, когда соседние качественные свойства обладают одинаковой различимостью. Для остальных точек, лежащих на оси ординат, можем наблюдать нарастание силы одного из качественных признаков и одновременное убывание (в том же темпе) смежного качественного признака. Данная шкала, как шкала Поспелова, является непротиворечивым и полным классификатором [4], а значит, и лингвистический анализ на ее основе непротиворечив.

С помощю рассмотренной классификации было выделено пять групп уровня риска:

1-я группа - предприятия очень высокого уровня риска банкротства, которым соответствуют очень низкие уровни классификатора каждого из 16 рассматриваемых параметров (табл. 1);

2-я группа - предприятия, находящиеся в зоне высокого риска банкротства, которым соответствует низкий уровень значений классификатора параметров;

3-я группа - предприятия, находящиеся в зоне среднего риска банкротства, соответствующие среднему уровню значений классификатора параметров;

диапазон значений экономических

4-я группа - предприятия, находящиеся в зоне низкого риска банкротства, соответствующие высокому уровню значений классификатора параметров;

5-я группа - кредитоспособные предприятия, которым можно выдать кредит, соответствующие очень высокому уровню значений классификатора параметров.

Используя пенташкалу для каждого из показателей, была составена таблица финансовых показателей, четко определяющих принадлежность предприятия к той или иной группе. Так как ось ординат отражает уверенность специалиста при отнесении параметра к одному из пяти уровней, то для формирования четких классов приписывали значение параметра к тому уровню, у которого ордината соответствующей трапеции для данного значения больше. Если ординаты совпадали, то значение параметра относили к «более низкому» лингвистическому уровню из них.

В табл. 1 приведен диапазон значений финансовых показателей, соответствующих каждому из уровней кредитоспособности предприятия.

Из 16 представленных показателей значения F1 и F4 являются инверсными по отношению ко всем остальным показателям, так как с ростом количественных уровней этих параметров финансовое положение предприятия ухудшается

При помощи средств программы Statistica 6 функцией генерации нормально распределенных

Таблица 1

казателей по группам уровня риска

Группа уровня риска Экономические показатели

L1 L3, % P1 F1 F2 F3 F4 R1, %

Очень высокий риск 0,1-0,2 40-77 0,1-0,4 2,70-2,50 0,25-0,31 -2,00...-1,66 1,60-1,51 0-1

Высокий риск 0,2-0,6 77-144 0,4-0,8 2,50-1,70 0,31-0,54 -1,66...-0,33 1,51-1,18 1-5

Средний риск 0,6-1,2 144-267 0,8-1,5 1,70-1,17 0,54-0,83 -0,33.0,92 1,18-0,83 5-16

Низкий риск 1,2-2,0 267-454 1,5-2,4 1,17-0,90 0,83-0,93 0,92-1,84 0,83-0,56 16-27

Очень низкий риск 2,0-2,2 454-580 2,4-2,8 0,90-0,50 0,93-0,95 1,84-3,50 0,56-0,20 27-30

Продолжение табл. 1

Группа уровня риска Экономические показатели

Ы2, % за R3, % за R4, % R5, % за A2, раз в A4, раз в A5, раз в A6, раз в

квартал квартал квартал квартал квартал квартал квартал

Очень высокий -3,00.-2,50 -4,00.-3,33 0-1 -5,00.-4,42 0,06-0,08 0,40-0,50 0,60-0,70 1,0-1,3

риск

Высокий риск -2,50.-0,50 -3,33.-0,66 1-5 -4,42.-0,58 0,08-0,15 0,50-0,90 0,70-1,10 1,3-2,3

Средний риск -0,50.-1,57 -0,66.3,17 5-15 -0,58.2,58 0,15-0,24 0,90-1,54 1,10-1,74 2,3-3,5

Низкий риск 1,57-4,34 3,17-7,84 15-27 2,58-10,27 0,24-0,29 1,54-2,07 1,74-2,27 3,5-5,5

Очень низкий 4,34-8,00 7,84-20,00 27-46 10,27-18,00 0,29-0,58 2,07-5,80 2,27-5,80 5,5-15

риск

случайных чисел были занесены в базу значения для 1 000 предприятий пяти классов (уровней) риска по всем показателям. При введении аргументов данной функции генерации в качестве математического ожидания были вибраны середины интервалов, указанных в табл. 1, а в качестве среднеквадратического отклонения — разность между верхней границей интервала и средним значением, деленная на три. При создании базы искусственно генерировали по 200 предприятий каждого класса.

Чтобы убедиться в том, что полученные данные определяют принадлежность к обозначенным классам, был проведен кластерный анализ, смысл которого заключается в разбиении множества исследуемых объектов и признаков на однородные в некотором смысле группы, или кластеры.

Задача заключалась в проверке схожести предприятий, принадлежащих одному классу, и максимальной различимости предприятий различных классов. Для этого был проведен кластерный анализ с различным заданием количества кластеров. При разбиении был учтен критерий оптимальности: каждое предприятие должно принадлежать одному и только одному подмножеству разбиения (кластеру); предприятия, принадлежащие одному и тому же кластеру, должны быть сходными; предприятия, принадлежащие разным кластерам, должны быть разнородными.

Этот критерий представляет собой целевую функцию — функционал, выражающий уровни желательности различных группировок. Сходство и разнородность объектов определяются при помощи m-мерного евклидо-вого расстояния между векторами измерений.

Для анализа использовали метод k-средних (k-means clustering), предполагая, что число максимально различных групп/кластеров т по всей совокупности 1 000 наблюдениий (предпри-

ятий). В качестве значения т было взято число 5. Результат анализа показал, что все предприятия попали в кластеры, каждый из которых соответствует определенному классу уровня риска, число которых также равно 5. На рис. 2 изображены графики средних значений всех 16 показателей для каждого из 5 кластеров.

На рис. 2 показано, что средние значения всех показателей значительно отличаются друг от друга: расстояние между средними характеристиками кластеров большое, и общее расстояние между центрами кластеров значительно. Это свидетельствует о качественном разбиении на группы при т = 5, а значит, и об успешной кластеризации.

Средства программы Statistica 6 [6] позволили в файле сохраненных результатов кластерного анализа каждой из групп присвоить соответствующее значение лингвистической шкалы. Сравнение процесса генерации виртуальной базы предприятий с полученным разбиением на кластеры позволило убедиться, что была проведена 100 %-ная успешная кластеризация: все предприятия попали в кластеры,

Y

2.5 2.0 1.5 1.0 0.5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0

-0.5 -1.0 -1.5 -2.0 -2.5

_

¿r-TT-jy

_

fa

4

м « 111»

-w

а

а ¥

-л.

^ + ^

Ж*

о L3

Кластер 1

< > Кластер 2

•-- Кластер 3

< > Кластер 4

•-- Кластер 5

F1

F3

R1

R3

R5

A4

A6

X

рис. 2. Графики средних значений показателей по кластерам: ось OX — экономические показатели; ось OY — средние значения экономических показателей

а у

а

= а

«

к =

а

о

а =

о =

с с U

Экономические показатели A6 1,072 1,187 1,622 1,801 2,711 2,673 4,852 4,807 13,795 10,467

3 0,631 0,655 0,743 0,850 1,464 1,461 1,892 2,087 3,195 4,180

A4 0,452 0,465 0,612 0,674 1,261 1,213 1,860 1,697 5,252 5,130

A2 0,066 0,065 0,102 0,099 0,172 0,169 0,264 0,278 0,443 0,390

2 -4,664 -4,628 -2,407 -2,572 0,368 5 сл 0, 8,166 5,400 12,511 14,397

2 0,451 0,369 2,264 3,345 8,362 8,736 24,470 21,198 36,434 35,281

R3 -3,533 -3,848 -1,462 -2,344 1,423 1,288 5,052 6,523 10,370 12,274

R2 -2,800 -2,709 -1,068 -1,196 -0,053 0,000 -0,529 -0,484 6,995 6,092

2 0,422 0,350 3,579 3,573 13,354 11,667 21,001 22,461 29,050 28,846

■ч- tu 1,567 1,561 1,360 1,329 1,022 0,968 0,711 0,607 0,273 0,377

т tu -1,821 -1,846 -1,304 -0,968 0,484 0,492 1,531 1,216 2,411 2,721

<s tu 0,269 0,277 0,391 0,388 0,679 0,693 0,843 0,849 0,940 0,943

Е 2,576 2,594 1,844 1,929 1,328 1,573 1,035 1,087 0,659 0,565

E 0,327 0,184 0,627 0,508 1,335 1,311 1,842 2,040 2,585 2,473

►J 46,427 69,882 100,754 88,041 161,788 168,287 400,141 376,547 507,283 527,547

E 0,129 0,121 0,459 0,458 0,977 0,961 1,593 1,570 2,055 2,100

Группа уровня риска Очень высокий риск Очень высокий риск Высокий риск Высокий риск Средний риск Средний риск Низкий риск Низкий риск Очень низкий риск Очень низкий риск

№ предпр. в общей базе - сч о 2 2 о 2 о 4 2 о 4 о 6 2 о 6 о 8 2 о 8

соответствующие пяти классам уровней риска. В табл. 2 приведены примеры 10 предприятий из результирующего файла (по 2 предприятия каждого уровня риска).

В работе были изучены и учтены положительные и отрицательные стороны различных лингвистических оценок, что позволило выбрать наиболее оптимальный классификатор для решения поставленной нами задачи. Для выбранного классификатора была составлена таблица интервалов значений финансовых показателей предприятий. На основе данных была сгенерирована виртуальная клиентская база данных по 1 000 предприятиям, которая позволит решить проблему информационной неопределенности в процессе определения уровня риска реально существующего предприятия. После проведения кластерного анализа базы был сделан вывод, что сгенерированные данные качественно определяют принадлежность предприятий к обозначенным классам.

Данные исследования были проведены для макроэкономического периода с 2000 по IV кв. 2008 г., но они могут являться шаблоном для проведения аналогичных исследований любого другого макроэкономического периода. При анализе нового макроэкономического периода необходимо будет произвести новое качественное разбиение финансовых показателей на группы лингвистической шкалы согласно новой сложившейся макроэкономической обстановке в стране. Для этого потребуется повторный анализ показателей предприятий, анологичный тому, что был уже произведен в работе [1]. Такой анализ возможен только по истечении времени, необходимого для сбора статистической информации о предприятиях.

список литературы

1. Давыдова Г. В., Беликов А. Ю. Методика количественной оценки риска банкротства предприятий // Управление риском. 1999. № 3. С. 13-20.

2. Недосекин А. О., Бессонов Д. Н, Лукашев А. В. Сводный финансовый анализ российстких предприятий за 2000-2003.

3. Недосекин А. О. Применение теории нечетких множеств к задачам управления финансами // Аудит и финансовый анализ. 2000. № 2.

4. Недосекин А. О., Фролова С. Н. Лингвистический анализ гистограмм экономических факторов.

5. Сайт Международнго валютного фонда. URL: http:// www.mvf.su.

6. Халафян А. А. STATISTICA 6. Статистический анализ данных: учебник. Изд. 3-е. М. : Бином-

i Надоели баннеры? Вы всегда можете отключить рекламу.