Научная статья на тему 'Применение многослойного персептрона при прогнозировании банкротства компаний отрасли оптовой торговли'

Применение многослойного персептрона при прогнозировании банкротства компаний отрасли оптовой торговли Текст научной статьи по специальности «Экономика и бизнес»

CC BY
271
29
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
нейронные сети / банкротство / многослойный персептрон / компании оптовой торговли. / neural networks / bankruptcy / multi-layered perceptron / wholesale companies

Аннотация научной статьи по экономике и бизнесу, автор научной работы — И И. Лихенко

В данной статье приведена попытка построения нейронной сети для прогнозирования банкротства компаний отрасли оптовой торговли с помощью программы STATISTICA. Подробно на практическом примере рассмотрен вопрос формирования выборки и определения включаемых показателей. Предложено использование показателей динамики и отмечена возможность использования пертурбации данных как способа решения «перекоса» данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MULTILAYER PERCEPTRON APPLICATION IN PREDICTING BANKRUPTCY OF WHOLESALE COMPANIES

This article presents an attempt to build a neural network to predict the bankruptcy of wholesale companies using the program STATISTICA. The question of sample formation and definition of included indicators is considered in detail on the practical example. The use of indicators of dynamics is offered and possibility of use of data perturbation as a way of the decision of "skew" of data is noted

Текст научной работы на тему «Применение многослойного персептрона при прогнозировании банкротства компаний отрасли оптовой торговли»

ПРИМЕНЕНИЕ МНОГОСЛОЙНОГО ПЕРСЕПТРОНА ПРИ ПРОГНОЗИРОВАНИИ БАНКРОТСТВА КОМПАНИЙ ОТРАСЛИ

ОПТОВОЙ ТОРГОВЛИ

И.И. Лихенко, студент

Новосибирский государственный университет экономики и управления (Россия, г. Новосибирск)

DOI: 10.24411/2411-0450-2019-11118

Аннотация. В данной статье приведена попытка построения нейронной сети для прогнозирования банкротства компаний отрасли оптовой торговли с помощью программы STATISTICA. Подробно на практическом примере рассмотрен вопрос формирования выборки и определения включаемых показателей. Предложено использование показателей динамики и отмечена возможность использования пертурбации данных как способа решения «перекоса» данных.

Ключевые слова: нейронные сети, банкротство, многослойный персептрон, компании оптовой торговли.

Проблема банкротства появилась с развитием рыночных отношений. Причины возникновения банкротства компаний обычно связывают с тем, что доходы экономических субъектов не могут быть гарантированы, а результаты деятельности становятся известными только после реализации товара [1].

Рост числа банкротств приводит к потере кредиторов части своего капитала, может привести к снижению инвестиционной активности, возникновению цепочки последующих банкротств, сокращению рабочих мест. Зачастую рост наблюдается в кризисные и посткризисные годы. Так, в России, по данным доклада Центра макроэкономического анализа и краткосрочного прогнозирования, число банкротств сохраняется на уровне кризисных 2014-2015 годов, причём почти половина из них приходится на отрасли строительства и торговли.

Данной проблеме посвящено много работ в силу существенности негативных последствий, оказываемых случаями бан-

кротства компаний. Были созданы количественные и качественные способы предсказания банкротства. В количественных моделях наиболее популярны статистические модели (например, методы дискри-минантного анализа, ргоЬк- и 1о§к-модели, скоринговые модели), рейтинговые системы, экспертные методы, коэффициентный анализ и в последнее время нейронные сети. Широко используются качественные методы, в частности, Аргенти-счёт, методика В.В. Ковалева.

Перспективным направлением в области изучения инструментов прогнозирования банкротства является нейросетевое моделирование. Широкое использование данного инструмента стало возможным с повышением доступности вычислительных мощностей. Принцип действия нейро-сетевого моделирования сформирован на основе работы человеческого мозга.

Базовым элементом каждой нейронной сети является искусственный нейрон (далее - нейрон). Модель нейрона представлена на рисунке [2].

Рисунок. Модель искусственного нейрона

Xj означает подаваемый на него признак. Каждый признак суммируется нейроном с соответствующим признаку весом Wj, получившееся значение NET проходит через функцию активации и преобразуется в OUT. Интересна аналогия действия функции активации с биологическим процессом: к примеру, если подаваемая на нейрон через дендриты информация не оказывает достаточного «возбуждения» 6, то нейрон не активируется, но данный случай является примером лишь одной функции возбуждения - биполярной. Существует множество функций активации: например, биполярная, линейная, логистическая сигмоида, при этом не существует четких алгоритмов по выбору нужной [2].

Нейроны делятся на типы в зависимости от исполняемых ими функций на: входные, промежуточные и выходные. Входные принимают информацию из внешней среды и определенным образом распределяют её дальше по слоям. На промежуточные нейроны возлагается основная функция в обработке информации. Выходные же формируют итоговый ответ сети.

Далее, в общем случае, итоговый ответ сравнивается с истинным и происходит корректировка весов с помощью специальных алгоритмов обучения. Среди них для многослойных персептронов наиболее популярны градиентный спуск, метод сопряжённых векторов, алгоритм Бройдена-Флетчера-Гольдфарба-Шанно. Однако их всех объединяет постепенный спуск по той или иной плоскости ошибки, при этом нужно задать шаг обучения - на какую величину этот спуск будет происходить.

Специалист, желающий применить нейронные сети в своём анализе, столкнется со следующими проблемами [3, 4]:

1. Определение набора исследуемых показателей - необходимо выбрать те, что несут полезную информацию. Если наблюдается избыток, то данных может не хватить для точной работы. Для решения этой проблемы существует эвристическое правило, согласно которому величина выборки должна быть в 10 раз больше числа весов нейронной сети [5]. Число весов рассчитывается по формуле 1.

п = (А + С) * В (1)

где А - число входных признаков;

В - число нейронов на скрытом слое;

С - число выходных нейронов.

2. Сбор данных, формирование обучающей и тестовой выборки. Тестовая выборка необходима для того, чтобы не произошло переобучение - ситуация, при которой нейронная сеть не выявляет закономерности, что позволяет применять её на практике, а «запоминает» набор данных и просто воспроизводит их в своих ответах.

3. Предобработка данных - данный аспект может включать в себя приведение подаваемых на вход нейронной сети данных к определенному интервалу, позволяющему использовать выбранную функцию активации.

4. Конструирование и обучение сети -необходимо определить число слоёв нейронов и количество собственно нейронов на этих слоях, функцию активации и метод обучения.

5. Диагностика сети подразумевает проверку нейронной сети на реальных данных - объектах, не включенных в тестовую или обучающую выборку, но с известными истинными характеристиками.

В целом, решение приведенных проблем при использовании нейронных сетей для прогнозирования банкротства освящается в работах отечественных авторов, однако формированию выборки и предобработке данных уделяется мало внимания. Интересной особенностью приведенного ниже хода решения проблем использования нейронной сети в прогнозировании банкротства является подход к отбору компаний, входящих в выборку, и использование в качестве данных, подаваемых на нейронную сеть, финансовых характеристик организаций в динамике.

Первое, с чем придётся столкнуться исследователю, желающему применить нейронные сети - выбор их вида. Нами было принято решение об использовании многослойного персептрона, поскольку он широко доступен в силу его реализации во многих статистических программах (например, 8ТАТ1БТ1СА), при этом позволяет относительно быстро решать нелинейные

задачи и обладает способностью к экстраполяции данных [6].

В итоговую выборку вошли организации с основной деятельностью по ОКВЭД «оптовая торговля». Были выгружены данные бухгалтерского баланса и отчета о финансовых результатах по РСБУ за 2015 и 2016 годы. Среди организаций рассматривались только акционерные общества и общества с ограниченной ответственностью.

К каждой компании было рассчитано по 130 финансовых коэффициентов за 2016 год и темп прироста этого коэффициента по сравнению с 2015 годом. В сумме число показателей составило 259, один из коэффициентов был рассчитан только за 2016 год.

Рассчитанные показатели охватывали ликвидность, рентабельность в зависимости от продаж, финансовую устойчивость, рентабельность в зависимости от инвестиций, показатели деловой активности, две VBM модели, структуру баланса, показатель манипулирования. В них, так или иначе, вошли коэффициенты, использующиеся в моделях математического дис-криминантного анализа.

Также были скорректированы расчетные показатели темпов прироста. Ошибки при их расчёте, возникающие при условии, что абсолютные показатели равнялись нулю как в 2015, так и в 2016 году, были заменены на ноль. Если в 2015 году абсолютный показатель равнялся нулю, а в 2016 нет, то темпы прироста стали равны 100%. В случае отрицательной величины в

2015 и положительной в 2016 темпы прироста были бы отрицательны, хотя на самом деле значение выросло, аналогично, когда величины отрицательны в 2015 и

2016 годах, но растут по модулю, в данном случае темпы прироста взяты по модулю. Если наоборот, размер по модулю уменьшается, но показатели в каждом году отрицательны, темп прироста был бы меньше нуля, хотя фактически значение увеличилось. Было исправлено сменой знака.

Поскольку вертикально интегрированная компания может оставаться «на плаву»

и при плохих показателях отчетности отдельных её подразделений, с помощью сервиса «Система комплексного раскрытия информации «СКРИН»»

были отсечены организации с материнскими и дочерними компаниями с долей вклада в уставном капитале от 20%. Кроме того, для исключения фактически не действующих компаний и компаний, имеющих очевидные риски банкротства, был введен дополнительный фильтр на наличие выручки у рассматриваемых организаций от 1 рубля в течение 2014, 2015, 2016 годов, не было убытка по итогам более, чем одного года.

Среди прошедших через фильтры организаций были проверены на факт банкротства с помощью картотеки арбитражных дел те, у которых в графе руководитель имелась пометка, что он является внешним или конкурсным управляющим. Среди этих организаций были отсечены обанкротившиеся не в течение 2017 года, датой банкротства считалось начало дела. Всего банкротов получилось 187, не-банкротов 1612, в сумме 1799.

Предпринимались попытки отсечь показатели посредством реализованного в программном продукте STATISTICA инструменте понижения размерности с помощью вероятностных сетей, однако они не увенчались успехом: в силу такого сильного превышения числа не-банкротов над банкротами программой принимались за бесполезные все показатели. Вследствие этого было принято решение размножить банкротов посредством пертурбации, то есть добавить такой шум, что его математическое ожидание равнялось бы нулю.

В целом, идея добавления шума в выборку может как помочь решить проблему с существенным превышением числа небанкротов над банкротами, так и улучшить способность нейронной сети к обобщению [7]. Корректировка дисперсии, представленная в таблице 1, достаточно сильная, поскольку величина дисперсии некоторых показателей банкротов была неадекватно большой, на уровне десятков миллионов.

Таблица 1. Величина дисперсии шума в зависимости от величины дисперсии показателя

Величина дисперсии показателя за 2016 год Величина дисперсии темпов прироста Величина дисперсии шума

x>1000 - Ln(x)/200

1000>x>100 - x/2000

x<100 x<1 x/200

- x>1 1/200

В итоге получилось 3229 объектов, из них 1612 изначальных не-банкротов, 57 изначальных банкротов и 1560 примеров, размноженных на основе 130 из 187 изначальных банкротов. В тестовую выборку вошли 312 случайно отобранных организаций с соотношением банкротов и небанкротов 1:1. В обучающую выборку вошли 2805 организаций, из них 1399 небанкротов и 1406 банкротов.

Не смотря на увеличение выборки, эвристическое правило не выполнялось -даже при наличии только одного нейрона

Таблица 2. Отобранные показатели

на промежуточном и двух на выходном размер выборки был больше числа весов менее, чем в 10 раз. Именно поэтому была проведена следующая попытка отсечь показатели с помощью программы STATISTICA, и она была успешна, так как не было сильного «перекоса» в сторону небанкротов. Выбор «бесполезных» показателей происходил путем последовательного включения. Результаты отбора показателей представлены в таблице 2. Вид показателя ТПР означает темп прироста, АБС -абсолютный показатель 2016 года.

Расчёт показателя Расчёт показателя по строкам бухгалтерской отчетности Вид показателя

1 2 3

((Оборотные активы-Запасы)-Краткосрочные обязательст-ва)/Валюта баланса ((1200-1210)-1500)/1700 ТПР

(Собственные оборотные средства-Запасы)/Валюта баланса ((1300-1100)-1210)/1700 ТПР

Валовая прибыль/Выручка 2100/2110 АБС

Себестоимость продаж/Выручка 2120/2110 АБС

Валовая прибыль/Валюта баланса 2100/ср1700 ТПР

Проценты к уплате, скорректированные на налоговый щит/Заемный капитал 2330*(1 -2410/2300)/ср( 1400+1500) ТПР

COD/CODсреднеотр Среднеотраслевой COD в 2015 году составил 0,039, в 2016 году 0,014. 2410 2330 * (1 ?чпп) СОБ = ¿зии ср(1400 + 1500) ТПР

NTC /365 ср(1210 + 1230 - 1520) 2110 ТПР

Продолжение таблицы 2.

1 2 3

Выручка за 2 года/Валюта за 2 года 2110о + 2110! ^1700_!+1700о^+ ^1700о+ 1700^ АБС

Среднее значение денежных средств/В ыручка ср1250/2110 АБС

Денежные средства/Оборотные активы 1250/1200 АБС

(Денежные средства+Финансовые вло-жения)/Оборотные активы (1250+1240)/1200 АБС

Дебиторская задолженность/Валюта баланса 1230/1700 ТПР, АБС

Денежные средства/Валюта баланса 1250/1700 АБС

(Запасы+Дебиторская задолженности/Валюта (1210+1230)/1700 АБС

(Валюта-Основные средства-Денежные средства)/Валюта (1700-1250-1150)/1700 АБС

Сигнальный показатель 1. А=CODnotadj -среднеотраслевой СОБпйаф; В=Коэффициент общей ликвидности-Коэффициент общей ликвидности среднеотраслевой. Если А<0 и В<0, то итоговое значение = 0. Если А>0 и В>0, то итоговое значение = 1. В любом другом случае 0,5. 2330 СООпоГаф^^^; Коэффициент общ. ликвидности = ((1240 + 1250 + 0,5 * 1230 + 0,3 * (1210 + 1220 + 1260) - (1520 + 0,5 * 1510+1540+1550+0,3*1400)/1700 ТПР; АБС

Коэффициент общ. ликвидности = ((1240 + 1250 + 0,5 * 1230 + 0,3 * (1210 + 1220+ 1260) - (1520 + 0,5 * (1510 + 1540+ 1550) + 0,3 * 1400))/1700

Сигнальный показатель 2. А= ROA-ROAсреднеотр; В=Коэффициент общей ликвидности-Коэффициент общей ликвидности среднеотраслевой. Если А<0 и В<0, то итоговое значение = 1. Если А>0 и В>0, то итоговое значение = 0. В любом другом случае 0,5. 2400 ЙОЛ = сР1700; Коэффициент общ. ликвидности = ((1240 + 1250 + 0,5 * 1230 + 0,3 * (1210 + 1220+ 1260) - (1520 + 0,5 * (1510 + 1540+ 1550) + 0,3 * 1400))/1700 АБС

Среднеотраслевой ROA в 2015 году составил 0,057, в 2016 году 0,073. Среднеотраслевой коэффициент общей ликвидности в 2015 году составил -0,159, в 2016 году -0,144. Среднеотраслевой CODnotadj в 2015 году составил 0,046, в 2016 году 0,017.

40% отобранных показателей составили темпы прироста, 60% - абсолютные значения 2016 года. В них вошли два сигнальных показателя, первый помечает как единицу организации, у которых, не смотря на высокую ликвидность, наблюдается боль-

шая стоимость заёмного капитала. Второй показатель помечает единицей организации, у которых, не смотря на низкую ликвидность, наблюдается низкая доходность.

Предобработка данных, в частности приведение значений к универсальному интервалу [0;1], осуществляется по формуле 2. Из-за того, что рассчитываемые показатели могли быть измерены в шкале отношений, всё шкалирование сводилось к добавлению в анализ категориальных переменных банкротов и не-банкротов, а также значений сигнальных показателей.

Vi =

(Xj xmjn)

(2)

где yi - масштабированное значение; xi - изначальное значение; xmax - максимальное значение показателя по выборке;

xmin - минимальное значение показателя по выборке.

В исследовании использовалась реализация многослойного персептрона с одним скрытым слоем (двуслойного) в программном продукте STATISTICA. В итоге, по числу классов на выходной слой были добавлены два нейрона, на вход подавалось 20 признаков. Необходимо было выявить границы численности нейронов на скрытом слое, и, согласно эвристическому правилу, их число лежало между 1 и 13. Расчет был произведен по формуле 3.

В <

10*N-A*C

(3)

где N - объем выборки.

Поскольку по большей части оптимальный выбор функции активации, величины коэффициента регуляризации, функции ошибки и числа нейронов определяется опытным путём, в программе заложен алгоритм их подбора. Подбирались число нейронов на скрытом слое - от 1 до 13, функция ошибки (сумма квадратов или кросс-энтропия), функция активации нейронов скрытого слоя (линейная, логистическая сигмоида, гиперболический тангенс, экспоненциальная).

Также был применен относительно новый способ решения проблемы переобучения - регуляризация весов. Он реализуется через минимизацию суммы функции ошибки и квадратов вектора весов, умно-

женных на устанавливаемый коэффициент. По сути, регуляризация «штрафует» нейронную сеть за вектора весов со слишком большими значениями [8]. Величина коэффициента регуляризации на скрытом и выходном слое устанавливалась случайно от 0,001 до 0,01.

После перебора нескольких тысяч вариантов, оптимальной конфигурацией обучения нейронной сети была признана следующая:

- число нейронов на скрытом слое: восемь;

- функция активации нейронов на скрытом слоев: линейная с коэффициентом, равным единице;

- функция активации нейронов на выходном слое: softmax (обобщенная логистическая функция). Представлена формулой 4.

Р =

2Uez

(4)

где zi - выход 1-го нейрона.

- функция ошибки: кросс-энтропия;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

- алгоритм обучения: алгоритм Бройде-на-Флетчера-Гольдфарба-Шанно.

Итоговая нейронная сеть была диагностирована с помощью валидационной выборки. В валидационную выборку вошли 112 организаций, не использованных в качестве основы для размножения выборки, из них 55 не-банкротов и 57 банкротов. Результаты работы построенной нейронной сети представлены в таблице 3. В целом, точность прогноза варьируется слабо, держится на уровне 70%, на валидацион-ной выборке она несколько ниже.

Таблица 3. Точность прогноза итоговой нейронной сети

Вид выборки Точность прогноза

Обучающая 73,5%

Тестовая 76,7%

Валидационная 71,4%

Одним из самых популярных методов прогнозирования банкротства является модель дискриминантного анализа в силу

его автоматического расчета в программах по ведению бухгалтерского учета от компании «1С». Если в исследовании Федоро-

вой Е.А., Довженко С.Е., Фёдорова Ф.Ю. ного по отраслям, то получим данные из взять средние значения общей прогнозной таблицы 4 [9]. силы различных моделей дискриминант-

Таблица 4. Средняя прогнозная сила моделей дискриминантного анализа

Название модели Среднее значение общей прогнозной силы, %

Модель Альтмана 77

Модель Фулмера 78

Модель Спрингейта 75

Модель Таффлера 79

Модель Змиевского 80

Модель Сайфуллина-Кадыкова 63

Модель ИГЭА 64

Модель Зайцевой 66

Если сравнить итоговую точность нейронной сети с представленными моделями дискриминантного анализа, становится очевидным, что хотя её точность и превышает прогнозную силу большинства оте-

нению с зарубежными. В тоже время, точность нейронной сети может быть повышена с увеличением выборки и включением в расчеты показателей, построенных на основе данных, сформированных на осно-

чественных, но несколько отстаёт по срав- ве кассового метода.

Библиографический список

1. Львова О.А., Пеганова О.М. Факторы и причины банкротства компаний в условиях современной экономики // Государственное управление. Электронный вестник. - 2014. -№44. URL: https://cyberlenmka.m/artide/n/faktory-i-prichiny-bankrotstva-kompaniy-v-usloviyah-sovremennoy-ekonomiki (дата обращения: 31.07.2019)

2. Персептрон. Многослойный персептрон. Функции активации нейронов [Электронный документ] URL: http://apsheronsk.bozo.ru/Neural/Lec2.htm

3. Телипенко Е.В., Яворский М.Р. Оценка риска банкротства предприятия на основе нейросетевых технологий // Экономика и предпринимательство. - 2014. - № 7. - С. 509514.

4. Лихенко И.И. Проблемы применения многослойного персептрона при прогнозировании банкротства компаний // Экономика и бизнес: теория и практика. - 2019. - № 7. -С.113-116.

5. Нейронные сети [Электронный документ] URL: http://statsoft.rU/home/textbook/modules/stneunet.html#radial

6. Сумская Т.В. Нейросетевые модели и технологии в финансовом анализе: курс лекций

- Новосибирск: НГУЭУ, 2015. - 84 с.

7. Добавление шума в обучающие выборки [Электронный документ] URL: http://stu.scask.ru/book_ns.php?id=38

8. Регуляризация - борьба с переобучением и оценивание качества [Электронный документ] URL: https://www.coursera.org/learn/supervisedlearning/lecture/k2VxN/rieghuliarizatsiia

9. Фёдорова Е.А., Довженко С.Е., Фёдоров Ф.Ю. Модели прогнозирования банкротства российских предприятий: отраслевые особенности // Проблемы прогнозирования. - 2016.

- № 3. - С. 32-40

MULTILAYER PERCEPTRON APPLICATION IN PREDICTING BANKRUPTCY OF

WHOLESALE COMPANIES

I.I. Lihenko, Student

Novosibirsk State University of Economics and Management (Russia, Novosibirsk)

Abstract. This article presents an attempt to build a neural network to predict the bankruptcy of wholesale companies using the program STATISTICA. The question of sample formation and definition of included indicators is considered in detail on the practical example. The use of indicators of dynamics is offered and possibility of use of data perturbation as a way of the decision of "skew " of data is noted.

Keywords: neural networks, bankruptcy, multi-layered perceptron, wholesale companies.

i Надоели баннеры? Вы всегда можете отключить рекламу.