Научная статья на тему 'Использование аппарата нейронных сетей для создания модели оценки и управления рисками предприятия'

Использование аппарата нейронных сетей для создания модели оценки и управления рисками предприятия Текст научной статьи по специальности «Экономика и бизнес»

CC BY
9649
1041
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УПРАВЛЕНИЕ РИСКАМИ / НЕЙРОННЫЕ СЕТИ / ПРЕДСКАЗАНИЕ БАНКРОТСТВА

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Корнеев Д. С.

Рассматривается один из подходов к анализу и управлению рисками, основанный на нейросетевых технологиях. Во введении обосновывается необходимость разработки различных методов прогнозирования рисков в условиях рыночной экономики, объясняется важность эффективного риск-менеджмента для современного предприятия. В работе приводится одна из возможных классификаций рисков, а также выделены области прогнозирования рисков, в которых применение нейронных сетей представляется наиболее эффективным. Описаны традиционные методы анализа рисков, особое внимание уделено эконометрическим методам. Выделены преимущества недостатки нейронных сетей для задач прогнозирования и классификации. Разработана архитектура нейронной сети для решения задачи прогнозирования банкротства и приведено ее сравнение с методом линейного дискриминантного анализа.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Корнеев Д. С.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Использование аппарата нейронных сетей для создания модели оценки и управления рисками предприятия»

ИСПОЛЬЗОВАНИЕ АППАРАТА НЕЙРОННЫХ СЕТЕЙ ДЛЯ СОЗДАНИЯ МОДЕЛИ ОЦЕНКИ И УПРАВЛЕНИЯ РИСКАМИ ПРЕДПРИЯТИЯ

Корнеев Д.С.

(Московский Государственный Технический Университет имени Баумана, Москва) dmkom@,list.ru

Рассматривается один из подходов к анализу и управлению рисками, основанный на нейросетевых технологиях. Во введении обосновывается необходимость разработки различных методов прогнозирования рисков в условиях рыночной экономики, объясняется важность эффективного риск-менеджмента для современного предприятия. В работе приводится одна из возможных классификаций рисков, а также выделены области прогнозирования рисков, в которых применение нейронных сетей представляется наиболее эффективным. Описаны традиционные методы анализа рисков, особое внимание уделено эконометрическим методам. Выделены преимущества недостатки нейронных сетей для задач прогнозирования и классификации. Разработана архитектура нейронной сети для решения задачи прогнозирования банкротства и приведено ее сравнение с методом линейного дискриминантного анализа.

Ключевые слова: управление рисками, нейронные сети, предсказание банкротства.

1. Введение

Риск присущ любой форме человеческой деятельности, что связано с множеством условий и факторов, влияющих на положительный исход принимаемых людьми решений. Исторический опыт показывает, что риск неосуществления намеченных целей особенно проявляется при всеобщности товарно-денежных отношений, конкуренции участников хозяйственного оборота.

Результатами процессов глобализации в экономике, финансах, обществе стали взрывной рост сложности современных финансовых и социально-организационных систем, и, как следствие, возрастание их неустойчивости и неопределенности. Социальные и экономические институты все чаще подвергаются воздействию внешних и внутрисистемных событий, приводящих к значительным и даже катастрофическим потерям. В связи с этим является актуальным повсеместное внедрение в процедуры управления этими институтами механизмов регулирования чувствительности к событиям риска и ограничения, вызванных рисками потерь.

Организации монетарного сектора экономики с его динамичной конъюнктурой, со спецификой работы с высоколиквидными активами, с высокой степенью окупаемости и краткосрочностью проектов быстро смогли накопить достаточно ресурсов для инвестиций в разработку риск-менеджмента для своего сектора экономики. Все это позволило им в кратчайшие сроки внедрить некоторые базовые принципы минимизации рисков, а также получить обоснованности и выгоды от принятых решений.

В реальном же секторе экономики длительные сроки реализации проектов, недостаточный объем инвестиций, низкая оборачиваемость и окупаемость средств, относительно низкий уровень экономической грамотности административноуправленческого персонала препятствуют объективной оценке преимуществ концепции снижения рисков в деятельности предприятия. В свою очередь, это ведет к неэффективному управлению финансовыми потоками, отсутствию прогнозирования результатов финансово-хозяйственной деятельности, ошибочному стратегическому планированию развития предприятия.

Основная цель статьи состоит в раскрытии содержания проблемы управления рисками предприятия и в разработке механизма управления рисками предприятия в современных условиях хозяйствования.

Методологическую основу исследования составили концепции и взгляды отечественных и зарубежных экономистов, жур-82

нальные статьи, материалы научных семинаров и конференций, связанные с проблемами риска.

2. Классификация рисков и обзор существующих методов их анализа

Риск - возможное нежелательное событие (или класс возможных нежелательных событий), под действием которого объект управления может перейти в нежелательное состояние (называемое рисковой ситуацией). При этом под реализацией риска понимается появление события риска и переход объекта управления в нежелательное состояние под влиянием этого события.

Устоявшейся классификации рисков не существует. В данной работе для разбиения всего множества рисков на подгруппы воспользуемся методологией, предложенной профессором А.И. Орловым [3].

Всю совокупность хозяйственных рисков предлагается разделить на группы, взяв за основу в качестве упорядочивающего принципа движение от частного к общему. Тогда можно выделить следующие классы рисков:

• производственные риски, связанные непосредственно с деятельностью предприятия;

• коммерческие риски, вызванные неполной предсказуемостью динамики рынка;

• финансовые риски, определяемые макроэкономической ситуацией;

• риски, возникающие на уровне государства и Земли в целом.

Среди производственных рисков можно выделить:

■ риск выпуска дефектной продукции;

■ риск нарушения технологических процессов;

■ риск ошибки при проектировании продукции;

■ социальные риски.

Среди коммерческих рисков можно выделить:

■ риск потери поставщиков;

■ риск изменения предпочтений потребителей;

■ региональные риски, обусловленные состоянием отдельных регионов;

■ информационные риски.

Среди финансовых рисков можно выделить:

■ инфляционные риски;

■ валютные риски;

■ инвестиционные риски;

■ законодательные - изменение действующих норм с выходом новых законодательных и нормативных актов, например, ухудшающих положение компании (введение новых налогов, отмена налоговых льгот, повышение налоговых ставок и др.).

Среди рисков, возникающих на уровне государства и Земли в целом, можно выделить:

■ политические - связаны с политической обстановкой в стране и деятельностью органов государственной власти (революция, военные действия, национализация частной собственности, конфискация имущества и др.);

■ отраслевые - зависят от тенденций развития отрасли;

■ внешнеэкономические;

■ риски, связанные с природными явлениями.

Система классификации рисков профессора А.И. Орлова представляется наиболее удобной.

Теория управления рисками (страхование и риск-менеджмент) занимается выявлением источников потерь, исследованием логики и вероятности возникновения событий риска, а также разрабатывает механизмы компенсации сопутствующих им потерь.

Основным механизмом управления рисками и потерями от них является хеджирование. Под хеджированием понимается динамическая стратегия управления объектом, подверженным влиянию рисков (стратегия хеджа), обеспечивающая с заданной степенью точности количественную оценку возможности попа-84

дания объекта управления в рисковую ситуацию и ограничивающая в случае реализации риска размеры потенциальных потерь до заданного уровня [12]. Анализ развития математических методов и средств измерения и управления финансовыми рисками, применяемых ведущими мировыми корпорациями, показывает, что с начала 90-х гг. наблюдается массовое внедрение в практику статистических моделей оценки потерь от рыночного риска VAR (Value At Risk) [6, 12, 14].

В настоящее время при компьютерном и математическом моделировании для описания неопределенностей чаще всего используют такие математические средства, как:

• вероятностно-статистические методы;

• методы статистики нечисловых данных, в том числе интервальной статистики и интервальной математики, а также методы теории нечеткости;

• методы теории конфликтов (теории игр);

• методы теории искусственного интеллекта (нейронные сети, генетические алгоритмы и т.д.)

Тем не менее, формальные методы оценки рисков во многих случаях не могут дать однозначных рекомендаций. Поэтому, наряду с формально-экономическими методами, обязательным является применение экспертных методов прогнозирования и соответствующих методов из теории экспертных оценок [3].

Границы применимости статистических моделей риска были осознаны во время кризиса 1998-99 гг., сопровождавшегося крахом некоторых крупных финансовых организаций, полагавшихся на статистические модели риска [14].

Одним из перспективных подходов к управлению рисками является применение аппарата нейронных сетей для классификации и прогнозирования рисков. В следующем разделе будут разобраны преимущества и недостатки существующих эконометрических моделей и описаны достоинства нейросетевой технологии.

3. Нейронные сети и их преимущества для решения задачи оценки рисков

3.1 СТАТИСТИЧЕСКИЕ И НЕЙРОСЕТЕВЫЕ МЕТОДЫ УПРАВЛЕНИЯ РИСКАМИ

На практике при анализе рисков часто встречаются задачи, связанные с наблюдением случайных величин. Для подобных задач не удается построить детерминированные модели, поэтому применяется принципиально иной, вероятностный подход. Параметры вероятностных моделей - это распределения случайных величин, их средние значения, дисперсии и т.д. Как правило, эти параметры изначально неизвестны, а для их оценки используются статистические методы, применяемые к выборкам наблюдаемых значений (историческим данным).

При статистическом прогнозировании исходят из задания временного ряда, т.е. функции, определенной в конечном числе точек на оси времени. Основными решаемыми задачами в данном случае являются интерполяция и экстраполяция. В простейшем случае используется метод наименьших квадратов, применяются также метод наименьших модулей и другие методы экстраполяции. Для оценки точности прогноза используются параметрические и непараметрические (на основе Центральной Теоремы теории вероятностей) оценки и доверительные границы для него [2].

Основным на данный момент эконометрическим аппаратом прогнозирования является многомерная регрессия. При этом возможен отказ от предположения о нормальности погрешностей измерения и отклонений от линии регрессии; для этого необходимо использовать математический аппарат, основанный на Центральной Теореме теории вероятностей. В этом случае используются методы непараметрической оценки плотности вероятности [2].

Нерешенной остается проблема сокращения множества факторов модели.

Методы статистики нечисловых данных используются при прогнозировании на основе информации, имеющей нечисловую природу. Частными случаями регрессионного анализа в рамках статистики нечисловых данных являются дисперсионный анализ и дискриминантный анализ.

Применение нейросетевой технологии уместно в случаях, когда формализация процесса решения трудна или вообще невозможна. Они являются очень мощным инструментом моделирования, поскольку нелинейны по своей природе. Линейное моделирование долгое время являлось основным в большинстве областей, поскольку для него существует большое число методов оптимизации. Однако в задачах анализа рисков методы линейного моделирования в подавляющем большинстве случаев неприменимы. Кроме того, для нейронных сетей не существует проблемы «проклятия размерности», не позволяющей моделировать линейные зависимости от большого числа переменных.

Нейронная сеть применяется в первую очередь тогда, когда неизвестен точный вид связи между входом и выходом. Достаточно лишь точно знать, что связь между входными и выходными данными существует. При этом сама зависимость будет выведена в процессе обучения нейронной сети.

По сравнению с традиционными технологиями нейронные сети обладают следующими достоинствами [3, 8]:

• Универсальность. Нейронные сети не зависят от свойств входных данных, для них не существует требования к определенному типу распределения исходных данных, либо требования к линейности целевых функций.

• Простота. Использование нейронных сети не требует специальной подготовки, для практического применения нет необходимости глубоко вникать во внутренние механизмы работы сети, в отличие от статистических методов, требующих фундаментальных знаний из области теории вероятностей и математической статистики.

• Не существует проблемы «проклятия размерности». Они

способны моделировать зависимости в случае большого числа переменных.

• Ускоряют процесс нахождения зависимости за счет одновременной обработки данных всеми нейронами [7]. Особенности построения нейронных сетей рассматриваются далее. В тоже время нейронные сети обладают рядом серьезных

недостатков. Ключевыми из них являются следующие:

• Сложность построения архитектуры сети для конкретной задачи. Для подавляющего большинства реальных задач не разработано стандартных схем, в результате в каждом случае конструирование приходится начинать «с нуля».

• Сложность интерпретации результатов обучения. Особенности построения нейронной сети будут рассмотрены дальше. Пока же можно отметить, что значения параметров элементов сети почти всегда невозможно объяснить в терминах решаемой задачи, в результате нейронная сеть остается «черным ящиком» не только для пользователей, но, отчасти, и для разработчиков.

Несмотря на то, что нейронные сети способны решить практически любые задачи, во многих случаях их применение не является целесообразным. Для решения многих проблем более эффективным оказывается применение других математических моделей. В то же время нейронные сети особенно хорошо зарекомендовали себя при решении задач классификации, прогнозирования, кодирования и декодирования информации [8].

3.2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ НЕЙРОННЫХ СЕТЕЙ

Исторически первой работой, заложившей теоретический фундамент для создания искусственных моделей нейронов и нейронных сетей, принято считать опубликованную в 1943 г. статью Уоррена С.Маккаллока и Вальтера Питтса «Логическое исчисление идей, относящихся к нервной активности» [10]. Главный принцип теории Маккалока и Питтса заключается в

том, что произвольные явления, относящиеся к высшей нервной деятельности, могут быть проанализированы и поняты, как некоторая активность в сети, состоящей из логических элементов, принимающих только два состояния ("все или ничего"). При этом для всякого логического выражения, удовлетворяющего указанным авторами условиям, может быть найдена сеть логических элементов, имеющая описываемое этим выражением поведение.

Рис 1. Функциональная схема формального нейрона Маккалока и Питтса

В качестве модели такого логического элемента, получившего в дальнейшем название «формальный нейрон», была предложена схема, приведенная на рис. 1 [10]. С современной точки зрения, формальный нейрон представляет собой математическую модель простого процессора, имеющего несколько входов и один выход. Вектор входных сигналов (поступающих через «дендриды») преобразуется нейроном в выходной сигнал (распространяющийся по «аксону») с использованием трех функциональных блоков: локальной памяти, блока суммирования и блока нелинейного преобразования.

Вектор локальной памяти содержит информацию о весовых множителях, с которыми входные сигналы будут интерпретироваться нейроном. Эти переменные веса являются аналогом

89

чувствительности пластических синаптических контактов. Выбором весов достигается та или иная интегральная функция нейрона [7].

В блоке суммирования происходит накопление общего входного сигнала (обычно обозначаемого символом NET), равного взвешенной сумме входов:

(1) NET = Х W,x,

i=1

В модели Маккалока и Питтса отсутствуют временные задержки входных сигналов, поэтому значение net определяет полное внешнее возбуждение, воспринятое нейроном. Отклик нейрона далее описывается по принципу «все или ничего», т. е. переменная подвергается нелинейному пороговому преобразованию, при котором выход (состояние активации нейрона) Y устанавливается равным единице, если

(2) NET > Q

и Y устанавливается в 0 в обратном случае. Значение порога Q (часто полагаемое равным нулю) также хранится в локальной памяти.

Формальные нейроны могут быть объединены в сети путем замыкания выходов одних нейронов на входы других, и такая кибернетическая система с надлежаще выбранными весами может представлять произвольную логическую функцию. Для теоретического описания получаемых нейронных сетей предлагался математический язык исчисления логических предикатов.

На данный момент исчерпывающей теории синтеза логических нейронных сетей с произвольной функцией, по-видимому, нет. Наиболее продвинутыми оказались исследования в области многослойных систем и сетей с симметричными связями [8, 13]. Большинство моделей опираются в своей основе на различных модификациях формального нейрона. Важным развитием теории формального нейрона является переход к аналоговым (непрерывным) сигналам, а также к различным типам нелинейных

переходных функций. Опишем наиболее широко используемые типы переходных функций [8]

(3) Y = F(NET):

1. Пороговая функция

[1, NET > Q,

(4) Y = F (NET) = •!

[0,NET £ Q.

2. Линейная функция, а также ее вариант - линейная функция с погашением отрицательных сигналов:

[NET, NET > Q,

(5) Y = F (NET) = •!

[0,NET £ Q.

3. Сигмоидальная функция:

(6) Y = F (NET) 1

1 + exp(-(NET - Q))'

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Сигмоидальная функция обладает избирательной чувствительностью к сигналам разной интенсивности, что соответствует биологическим данным. Наибольшая чувствительность наблюдается вблизи порога, где малые изменения сигнала NET приводят к ощутимым изменениям выхода. Напротив, к вариациям сигнала в областях значительно выше или ниже порогового уровня сигмоидальная функция не чувствительна, так как ее производная при больших и малых аргументах стремится к нулю.

В последнее время также рассматриваются математические модели формальных нейронов, учитывающие нелинейные корреляции между входами. Для нейронов Маккалока и Питтса предложены электротехнические аналоги, позволяющие проводить прямое аппаратное моделирование.

3.3 ОБЛАСТИ ПРИМЕНЕНИЯНЕЙРОННЬХ СЕТЕЙ В УПРАВЛЕНИИ РИСКАМИ

Для управления рисками автором предлагается использование нейронных сетей в следующих областях:

• Оценка производственных рисков. Прогнозирование необходимого запаса сырья. Оптимальное планирование производства.

• Оценка инвестиционных рисков. Анализ организационно-экономической устойчивости предприятий и прогнозирование банкротств.

• Оценка валютных рисков. Прогнозирование котировок на валютном рынке.

• Оценка кредитных рисков. Прогноз эффективности кредитования.

• Оценка торговых рисков. Исследование фактора спроса. Прогнозирование и анализ цен. Прогнозирование продаж.

4. Пример разработки модели нейронной сети для анализа риска наступления банкротства предприятия

4.1 КРАТКОЕ ОПИСАНИЕ ТРАДИЦИОННЬХМЕТОДОВ ПРЕДСКАЗАНИЯ БАНКРОТСТВА

Первые попытки разработать модель предсказания банкротства, используя методы одномерной статистики, были предприняты Бивером в 1966 году. Ключевыми этапами в разработке таких моделей стали многомерный анализ Альтмана (1968) [4], многомерный дискриминантный анализ Эдмистера, рекурсивный разделяющий алгоритм, описанные в [5].

При применении традиционных методов математики испытывают трудности в определении и оценке подходящей модели. Зачастую они солидарны лишь в том, что это модель является сложной. Скорее всего, выбор наилучшей модели для прогнозирования является неразрешимой задачей. Существует ряд факторов осложняющих определение и оценку лучшей модели:

1. Сложность существующих моделей ограничена используемыми способами оценки. Поэтому эти способы выступают как ограничения, которые являются препятствием для ана-

литиков при выборе оптимальной модели. Выбор с пользу той или иной модели порой осуществляется исходя из вычислительной сложности алгоритма, а не точности модели. Так, например, линейность зачастую «навязывается» исходным данным не потому, что было проведено детальное исследование с целью выяснения зависимости между переменными, а просто из-за простоты существующей для таких исходных данных процедуры оценки.

2. Стандартные методы оценки работают при условии нормального распределения совокупности исходных данных. Многочисленные исследования показывают, что финансовые коэффициенты, используемые в прогнозировании несостоятельности, не распределены по закону Гаусса.

В рамках данной работы автором разработана конфигурация на базе известной модели нейронной сети для оценки инвестиционных рисков. Проведено сравнение нейросетевой модели и статистической модели на основе линейного дискриминантного анализа.

4.2 АНАЛИЗ ФИНАНСОВОЙ УСТОЙЧИВОСТИ С ПОМОЩЬЮ ЛИНЕЙНОГО ДИСКРИМИНАНТНОГО АНАЛИЗА

Дискриминантный анализ является разделом многомерного статистического анализа, который позволяет изучать различия между двумя и более группами объектов по нескольким числовым характеристикам объекта одновременно [16]. Дискриминантный анализ - это общий термин, относящийся к нескольким тесно связанным статистическим процедурам. Эти процедуры можно разделить на методы интерпретации межгрупповых различий (дискриминации) и методы классификации объектов по группам.

Задача дискриминации состоит в определении "вклада" каждой из числовых характеристик объекта в различение групп объектов, и построении дискриминантных функций. Дискриминантная функция есть функция от числовых характеристик

объекта, значение которой дает возможность отнести объект к одной из групп.

Другой целью применения дискриминантного анализа является проведение классификации. С этой точки зрения ДА является методом распознавания образов с обучением. Методы дискриминантного анализа вырабатывают некоторые решающие правила, позволяющие классифицировать объекты.

Проанализировав объекты обучающей выборки, необходимо выработать правило, согласно которому каждый новый объект будет отнесен к одному из двух классов. В рамках линейного дискриминантного анализа это правило можно построить так. Пусть

(10) ^(Х) = Я0 + 1 *1 + Я2Х2 + ... + ^„Хт .

Линейная функция от ^ исходных признаков, для которой

(11) ^) > 0

Если объект относится к первому классу, и

(12) Fх{) < 0

в противном случае. Задача дискриминантного анализа сводится к поиску такой разделяющей (или дискриминантной) функции, которая наилучшим образом осуществляет разделение объектов обучающей выборки. Формально решается задача вычисления оптимальных коэффициентов 11,12,..., 1т, определяющих классификационную ценность признаков.

Геометрически задача сводится к определению положения новой оси в многомерном пространстве признаков, такой, чтобы проекции объектов обоих классов на эту ось оказались, возможно, более разделенными.

Воспользуемся моделью на основе дискриминантного анализа, разработанной Альтманом [4]. Индекс Альтмана представляет собой функцию от некоторых показателей, характеризующих экономический потенциал предприятия и результаты его работы за истекший период. В общем виде индекс кредитоспособности ^-счет) имеет вид:

(13) 2 = 1,3х1 +1,4 х2 + 3,3х3 + 0,6 х4 +1,0 х5

х1 - оборотный капитал/сумма активов; х2 - нераспределенная прибыль/сумма активов; х3 - операционная прибыль/сумма активов; х4 - рыночная стоимость акций/задолженность; х5- выручка/сумма активов.

Другим эффективным эконометрическим методом прогнозирования является непараметрический дискриминантный анализ на основе использования непараметрических оценок плотностей, описанный в книге профессора Орлова [1]. В следующих работах предполагается провести сравнительный анализ этого метода с нейронными сетями применительно к анализу и управлению рисками.

4.3 МОДЕЛЬ НЕЙРОННОЙ СЕТИ ДЛЯ ПРЕДСКАЗАНИЯ ФИНАНСОВОЙ НЕСОСТОЯТЕЛЬНОСТИ ОРГАНИЗАЦИИ Для построения нейронной сети необходимо разработать ее топологию, определить механизм обучения и процедуру тести-

Рис 2. Трехслойный персептрон

рования. Кроме того, для обучения нужны входные данные -выборка компаний с достоверной финансовой отчетностью и рассчитанные на ее основе коэффициенты.

На основании анализа задачи было принято решение остановиться на модели трехслойного персептрона (см. рис. 2) и алгоритме обратного распространения в качестве обучающего.

Этот тип нейронных сетей довольно хорошо исследован и описан в научной литературе. Он был предложен в работе Ру-мельхарта и подробно обсуждается почти во всех учебниках по нейронным сетям [13, 15]. Каждый элемент сети строит взвешенную сумму своих входов с поправкой в виде слагаемого и затем пропускает эту величину активации через передаточную функцию, получая, таким образом, выходное значение этого элемента. Элементы организованы в послойную топологию с прямой передачей сигнала. Такую сеть легко можно интерпретировать как модель вход-выход, в которой веса и пороговые значения (смещения) являются свободными параметрами модели. Сеть может моделировать функцию практически любой степени сложности, причем число слоев и число элементов в каждом слое определяют сложность функции. Определение числа промежуточных слоев и числа элементов в них является важным вопросом при конструировании многослойных нейронных сетей. Количество входных и выходных элементов определяется условиями задачи.

Использован самый известный вариант алгоритма обучения нейронной сети - т.н. алгоритм обратного распространения [3]. В алгоритме обратного распространения вычисляется вектор градиента поверхности ошибок. Этот вектор указывает направление кратчайшего спуска по поверхности из данной точки, поэтому если мы «немного» продвинемся по нему, ошибка уменьшится. Последовательность таких шагов (замедляющаяся по мере приближения к дну), в конце концов, приведет к минимуму того или иного типа. Определенную трудность здесь представляет вопрос о том, какую нужно брать длину шагов.

При большой длине шага сходимость будет более быстрой, но имеется опасность «перепрыгнуть» через решение или уйти в неправильном направлении. Классическим примером такого явления при обучении нейронной сети является ситуация, когда алгоритм очень медленно продвигается по узкому оврагу с крутыми склонами, прыгая с одной его стороны на другую. Напротив, при маленьком шаге, вероятно, будет схвачено верное направление, однако при этом потребуется очень много итераций. На практике величина шага берется пропорциональной крутизне склона (так что алгоритм замедляет ход вблизи минимума) с некоторой константой, которая называется скоростью обучения. Правильный выбор скорости обучения зависит от конкретной задачи и обычно осуществляется опытным путем; эта константа может также зависеть от времени, уменьшаясь по мере продвижения алгоритма.

Таблица 1. Конфигурация сети

Общие параметры Параметры скрытого слоя Параметры выходного слоя

Количество узлов во входном слое:10 Коэффициент обучения: 0.25 Коэффициент обучения: 0.01

Число узлов в скрытом слое:10 Коэффициент инерции: 0.6 Коэффициент инерции: 0

Число узлов в выходном слое: 1 Затухание:0 Затухание:0

Алгоритм обучения: Обратное распространение

Функция активации: сигмоидальная

Точность подбора этих параметров определяет способность сети к обучению. Входные узлы соответствуют финансовым

коэффициентам, используемым для предсказания несостоятельности. Значение единственного узла выходного слоя - показатель финансовой состоятельности предприятия. Единичное значение соответствует состоянию банкротства, нулевое - полному финансовому благополучию. В качестве активационной функции выбрана сигмоидальная.

В качестве входных данных используется разработанный автором набор финансовых коэффициентов. Базовые параметры модели Альтмана [5] были дополнены набором собственных. При этом при выборе параметров модели основное внимание уделялось не соответствию расчета выбранных коэффициентов общепринятым методикам финансового анализа, а влияние исходного набора данных на качество обучения сети и, как следствие, эффективность ее прогнозирования.

Таблица 2. Входные параметры сети___________________________

к\ = Оборотный капитал/Активы к2 = Нераспределенная прибыль/Активы к3 = Прибыль до налогообложения/Активы к4 = Объем продаж/Активы

к5 = Рыночная стоимость собственного капитала/Активы

к6 = Чистый денежный поток/Активы

к7 = Чистый денежный поток/Общая задолженность

к8 = Оборачиваемость активов/ Текущие обязательства

к9 = Оборачиваемость активов/Выручка

к\0 = Общая задолженность/Активы

Как уже было сказано, коэффициенты обучения и инерции являются параметрами алгоритма обратного распространения и определяют скорость и точность определения весов, минимизирующих ошибку предсказания. Большие значения этих параметров позволяют алгоритму сходиться за меньшее число итераций, но при этом возрастает риск “проскочить” оптимальное решение. Слишком малые значения, хотя и позволяют с высокой

вероятностью определять глобальный минимум, неоправданно увеличивают время работы алгоритма. Экспериментальным путем были подобраны оптимальные значения для данной конфигурации многослойного персептрона.

В рассматриваемой задаче прогнозирования банкротства наряду с выбором модели и конфигурации важным моментом является сбор статистики по предприятиям. При этом необходимо понимать, что выбор тех или иных предприятий зависит от цели обучения. При рассмотрении компаний одной отрасли на фиксированном временном отрезке, вероятно, что сеть хорошо научится предсказывать финансовую несостоятельность предприятий данного типа в рассматриваемом временном диапазоне, но будет несостоятельна в оценке компаний других областей. В случае обобщенной выборки (предприятия разных отраслей в произвольном временном периоде) точность прогнозирования будет падать.

Данная конфигурация нейронной сети разрабатывалась для промышленных предприятий. Ее меньшая пригодность для прогнозирования банкротства компании финансового сектора вызвана особенностями ведения бухгалтерского учета. Как следствие, ряд входных параметров разработанной модели не несет в себе значимой информации для организаций непромышленной сферы.

В качестве исходных данных бралась финансовая отчетность 100 компаний (в качестве источника данных использовалась база данных Compustat Industrial Database). Все компании были разбиты на 2 одинаковых множества по 50 компаний -обучающее множество и тестирующее множество. Деятельность организаций рассматривалась в период с 1993 по 1997 год, что позволило включить в модель влияние различных внешних факторов. Соотношение обанкротившихся и финансово устойчивых предприятий в каждой выборке не было равным. Данный фактор негативным образом мог сказаться на качестве обучения сети.

Для оценки правильности модели была собрана статистика по фирмам за 3 года до их банкротства (для благополучных компаний - за 3 года предшествующих произвольной дате существования предприятия) и нейронная сеть обучена на данных финансовой отчетности каждого года. Цель теста была увидеть, насколько хорошо модель прогнозирует состояние организации через год, через 2 года и через 3 года. Как уже было сказано, обучение проводилось с использованием данных отчетности 50 предприятий, эти же данные были включены в обучающее множество, на котором проводился первый этап тестирования. На основании финансовой информации об оставшихся 50 предприятиях было сформировано тестирующее покрывающее множество, которое использовалось для оценки “обобщающей способности” модели. Были получены следующие результаты:

Таблица 3. Точность прогнозирования банкротства нейронной сетью

Обучающее множество

Общий показатель Для благополучных компаний Для несостоятельных

Год 0 97% 49% 48%

Год 1 87% 44% 43%

Год 2 83% 43% 40%

Тестирующее множество

Общий показатель Для благополучных компаний Для несостоятельных

Год 0 88% 40% 48%

Год 1 77% 37% 40%

Год 2 61% 32% 29%

Как и ожидалось, модель показала высокие результаты для обучающего множества и значительно более низкие для тестирующего множества. Особенно интересным в анализе результатов прогнозирования для компаний из тестирующего множест-

ва, представляется факт высокой вероятности предсказания банкротства в первые два года. Требуется дальнейшее исследование для определения причин этого явления.

Модели на базе линейного дискриминантного анализа и на основе нейронной сети в данном случае показали примерно одинаковые результаты. Это указывает на то, что архитектура нейронной сети требует дальнейших усовершенствований. Возможным вариантом является применение принципиально других подходов, например использование самоорганизующихся карт Кохонена [8].

5. Заключение

В докладе были рассмотрены различные методики анализа и оценки рисков. Особое внимание было уделено преимуществам и недостаткам нейросетевых методов. Нейронные сети не являются панацеей, во многих случаях более эффектным будет использование традиционных методов статистики. Несмотря на это, во многих областях управления рисками нейронные сети зарекомендовали себя как более рациональное решение и требуются дальнейшие исследования в данной области.

Литература

1. БОРИСОВ Ю., КАШКАРОВ В., СОРОКИН С. Нейросе-тевые методы обработки информации и средства их программно-аппаратной поддержки // Открытые системы. — 1997, №4.

2. ОРЛОВ А.И. Эконометрика. М.: Экзамен, 2004. - 576 с.

3. ОРЛОВ А.И. Менеджмент. М.: Изумруд, 2003. - 298 с.

4. ALTMAN E., MARCO G., VARETTO F. Corporate Distress Diagnosis: Comparisons Using Linear Discriminant Analysis and Neural Networks. Journal of Banking and Finance 18, 1994, P. 505-29.

5. ALTMAN E, EDWARD I. Corporate Financial Distress. New York: John Wiley and Sons, 1983.

6. Amendment to the Capital Accord to incorporate market risks // Basel Committee on Banking Supervision, Bank for international settlements, January, 1996.

7. HERTZ A., KROGH R.G., PALMER L. Introduction to the Theory of Neural Computation. Addison-Wesley Reading, Mass., 1991.

8. HAYKIN S. Neural Networks: A Comprehensive Foundation. MacMillan College Publishing Co., New York, 1994.

9. HOPFIELD J. Neural Networks and Physical Systems with Emergent Collective Computational Abilities. Proc. National Academy of Sciences, USA 79, 1982, P. 254-258.

10. MACCULLOCH W., PITTS W. A logical Calculus of Ideas Immanent in Nervous Activity. Bull. Mathematical Biophysics, Vol. 5, 1943, P. 115-133.

11. MINSKY M., PAPERT S. Perceptrons: An Introduction to Computational Geometry. MIT Press, Cambridge, Mass., 1969.

12. Risk Management - A Practical Guide // J.P. Morgan-Reuters Risk Metrics, LLC, 1998.

13. ROSENBLATT R. Principles of Neurodynamics. Spartan Books, New York, 1962.

14. The New Basel Capital Accord // Basel Committee on Banking Supervision at the Bank for International Settlements, -January, 2001.

15. WIDROW B., RUMELHART D, LEHR M. Neural networks: Application in industry, business and science, Communications of the ACM, 1994, P. 93-105.

16. http://www.statsoft.ru/home/textbook/modules/stdiscan.html# general

i Надоели баннеры? Вы всегда можете отключить рекламу.