Научная статья на тему 'Оценка и анализ стоимости корпорации при помощи методов машинного обучения'

Оценка и анализ стоимости корпорации при помощи методов машинного обучения Текст научной статьи по специальности «Экономика и бизнес»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
оценка бизнеса / стоимость капитала / управление стоимостью / машинное обучение / денежные потоки / business valuation / cost of capital / cost management / machine learning / cash flow

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Галкин Илья Николаевич

Оценка стоимости бизнеса занимает одно из ключевых мест в теории финансов. Усложняющиеся экономические условия и развитие новых технологий стимулируют поиск и апробацию новых методов оценки стоимости капитала. Перспективным и малоизученным направлением в данной области является использование моделей машинного обучения. В статье проводится обзор существующих исследований в данной области и эмпирическое исследование оценки стоимости бизнеса при помощи методов машинного обучения. В рамках исследования было построено 4 модели машинного обучения, решающих задачу регрессии стоимости компании, на основе данных финансовой отчетности 650 российских и американский публичных корпораций, а также проведен анализ финансовых показателей, наиболее сильно влияющих на оценку стоимости капитала. В результате исследования сделан вывод о технической возможности использования методов машинного обучения для решения подобных оценочных задач, при этом, среди рассмотренных факторов, на стоимость компании наиболее сильно влияет величина чистого денежного потока от операционной деятельности.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ESTIMATION AND ANALYSIS OF CORPORATE VALUE USING MACHINE LEARNING METHODS

Estimating the value of a business occupies one of the key places in the theory of finance. Increasingly complex economic conditions and the development of new technologies stimulate the search and testing of new methods for assessing the cost of capital. A promising and little-studied direction in this area is the use of machine learning models. The article reviews existing research in this area and empirically studies business valuation using machine learning methods. As part of the study, 4 machine learning models were built to solve the problem of regression of company value, based on financial statements of 650 Russian and American public corporations, and an analysis of the financial indicators that most strongly influence the assessment of the cost of capital was carried out. As a result of the study, a conclusion was made about the technical feasibility of using machine learning methods to solve such valuation problems, while, among the factors considered, the value of the company is most strongly influenced by the amount of net cash flow from operating activities.

Текст научной работы на тему «Оценка и анализ стоимости корпорации при помощи методов машинного обучения»

Оценка и анализ стоимости корпорации при помощи методов машинного обучения

Галкин Илья Николаевич,

аспирант кафедры финансов, Санкт-Петербургский государственный экономический университет E-mail: iljagalkin@ro.ru

Оценка стоимости бизнеса занимает одно из ключевых мест в теории финансов. Усложняющиеся экономические условия и развитие новых технологий стимулируют поиск и апробацию новых методов оценки стоимости капитала. Перспективным и малоизученным направлением в данной области является использование моделей машинного обучения. В статье проводится обзор существующих исследований в данной области и эмпирическое исследование оценки стоимости бизнеса при помощи методов машинного обучения. В рамках исследования было построено 4 модели машинного обучения, решающих задачу регрессии стоимости компании, на основе данных финансовой отчетности 650 российских и американский публичных корпораций, а также проведен анализ финансовых показателей, наиболее сильно влияющих на оценку стоимости капитала. В результате исследования сделан вывод о технической возможности использования методов машинного обучения для решения подобных оценочных задач, при этом, среди рассмотренных факторов, на стоимость компании наиболее сильно влияет величина чистого денежного потока от операционной деятельности.

Ключевые слова: оценка бизнеса, стоимость капитала, управление стоимостью, машинное обучение, денежные потоки.

а. в

Оценка стоимости бизнеса является одним из краеугольных камней корпоративных финансов и финансового менеджмента. Оценка стоимости корпоративного капитала актуальна для решения многих практических и теоретических задач, начиная тактическим и стратегическим повышением эффективности компании и заканчивая управлением портфелем инвестиций. Теоретики и практики оценки бизнеса выделяют различные подходы к оценке стоимости (доходный, затратный, сравнительный, иногда в качестве отдельного подхода выделяют опционный), и в рамках этих подходов выделяются различные методы (см, например, [2], [4], [5], [6]). Методы и подходы к оценке бизнеса различаются между собой теоретическим обоснованием и нюансами практической имплементации; при этом теория и практика оценки бизнеса не стоит на месте и развивается сообразно развитию и усложнению экономических систем: ученые и практики разрабатывают, внедряют и улучшают новые методы оценки бизнеса.

Перспективным и малоизученным направлением в области оценки бизнеса является использование методов машинного обучения и искусственного интеллекта. Существующие немногие исследования в данной области (см. [1], [3]) обладают следующими схожими чертами: фокусируются на исследовании рынка акций США, ограничиваются анализом прогнозирования краткосрочной динамики стоимости акций (на основе технических факторов - исторической динамики цен) или малым числом фундаментальных факторов (только показателями отчета о прибылях и убытках), отсутствует содержательная интерпретация моделей и их результатов. Среди подобных исследований качественно выделяется исследование Коклева: российский ученый провел исследование оценки стоимости бизнеса с использованием методов машинного обучения на основе большого числа финансовых показателей компаний, и выделил наиболее сильно влияющие факторы; тем не менее, и это исследование полностью основано на показателях компаний, входящих в американский индекс S&P 500 [10]. В своем исследовании на близкую тематику (прогнозирование среднесрочной динамики капитализации с использованием данных финансовой отчетности) мы использовали похожий инструментарий, и пришли к выводу о том, что наиболее влияющими факторами являются маржинальность по чистой прибыли и операционная рентабельность компании [7].

Препятствиями к широкому внедрению методов машинного обучения в оценку стоимости биз-

неса являются следующие факторы: сложность создания данных моделей (как с точки зрения самого моделирования, так и с точки зрения сбора и обработки больших данных), недостаток наработанного теоретического и практического опыта в данной области, низкая интерпретируемость методов машинного обучения с точки зрения анализа факторов, влияющих на стоимость. Тем не менее, на наш взгляд данные препятствия не являются непреодолимыми: многие модели машинного обучения поддерживают решения, занимающиеся интерпретацией факторов модели и их прогнозов (см. [11], [13]). В то же самое время, сложность данных моделей может «окупиться», позволив ученым и практикам при помощи методов машинного обучения по-новому оценить факторы стоимости бизнеса и получить принципиально новые знания и инструменты.

В рамках данного исследования мы собрали данные финансовой отчетности и стоимости капитала (капитализации) 7 российских и 643 американских публичных компаний. В качестве зависимой (прогнозируемой) переменной мы использовали капитализацию компании, список объясняющих (влияющих) переменных представлен в Таблице 1, данные по американским компаниям собраны через информационный портал SimFin, по российским компаниям собраны с официальных сайтов.

Таблица 1. Объясняющие переменные модели

Задача машинного обучения была поставлена как задача регрессии: в рамках исследования, основываясь на финансовых показателях за полный 2022 год, мы пытаемся оценить капитализацию на конец периода, выраженную в стоимостном выражении. В качестве метрики качества модели мы будем использовать R-квадрат - показатель, широко используемый для оценки качества регрессионных моделей, который отражает, какой % вариации зависимой переменной может быть объяснен влияющими факторами.

Для моделирования мы выбрали наиболее популярные алгоритмы и широко используемые алгоритмы машинного обучения. Для оценки качества модели мы разделили данные рандомным (случайным) образом на 2 выборки: тренировочные данные, на которых обучалась модель (80% от общего количества наблюдений) и тестовые данные (20% от общего количества наблюдений), на основе которых мы можем понять, насколько хорошо модель справляется с оценкой стоимости новых компаний, не вошедших в исходную выборку. Моделирование выполнялось при помощи языка программирования Python с использованием библиотеки Scikit-learn. Показатели качества использованных алгоритмов машинного обучения приведены в Таблице 2. Оптимальные гипермараметры моделей подбирались методом «поиска по сетке» (grid search).

Таблица 2. Показатели качества построенных моделей

№ Название переменной Тип переменной

1 Выручка Численная

2 Операционная прибыль (ЕВ1Т) Численная

3 Чистая прибыль Численная

4 Активы Численная

5 Обязательства Численная

6 Капитал Численная

7 Чистый денежный поток от операционной деятельности Численная

8 Чистый денежный поток от инвестиционной деятельности Численная

9 Чистый денежный поток от финансовой деятельности Численная

10 Рынок Булева (рынок США или России)

11 Сектор Булева (индустриальный сектор к которому относится компания)

Таким образом, объясняющие переменные включают в себя данные ключевых 3 форм финансовой отчетности, а также качественные данные относительно рынка компании и индустриального сектора. Финансовые показатели американских компаний представлены в соответствии со стандартами US GAAP, финансовые показатели российских компаний - в соответствии с МСФО. Для сопоставимости финансовые показатели выражены в долларах США.

Алгоритм

Градиентный бустинг

Случайный лес

Метод ближайших соседей

Стохастический градиентный спуск

Оптимальные гипермараметры

n_estimators = 100, loss = «huber»

n_estimators = 100, criterion = «friedman_ mse»

n_neighbors = 4, weights = «distance»

loss = «epsilon_ insensitive»

R-квадрат на тренировочных данных (80% выборки)

0,98

0,92

1,00

-0,08

R-квадрат на тестовых данных (20% выборки)

0,

0,87

0,95

-0,05

Как видно из приведенных выше данных, стохастический градиентный спуск не походит для решения подобных задач; остальные 3 использованных алгоритма продемонстрировали удовлетворительные показатели качества на тестовых данных. Визуальным инструментом оценки качества модели может служить точечная диаграмма, где по одной оси представлены фактические значения, а по другой прогнозные; визуализация эффективности метода ближайших соседей на тестовой выборке представлена на Рисунке 1.

сз о

со £

m Р сг

СТ1 А

2

3

4

Q. в

700 000

i -

600 000 H 500 000

I <

| g 400 000

H к 300 000

| 200 000

| 100 000 в

0

И"!

0 200 000 400 000 600 000 800 000

Спрогнозированная капитализация, млн долл. США

Рис. 1. Фактическая и прогнозная капитализация компаний на основе тестовых данных при помощи метода ближайших соседей

Продемонстрированные выше результаты расчетов позволяют сделать выводы о том, что оценка стоимости компаний при помощи моделей машинного обучения с допустимым уровнем качества технически возможна. Тем не менее, теоретиков и практиков финансов интересует прежде всего содержательная интерпретация расчетных моделей. Для такой интерпретации мы можем применять различные инструменты. Одним из них является метод feature importance («важность объясняющих переменных») в рамках библиотеки Scikit-learn языка программирования Python. Данный инструмент позволяет выделить наиболее важные (сильно влияющие) зависимые переменные в безразмерных величинах. Этот инструмент недоступен для моделей, построенных по методу ближайших соседей, но доступен для модели случайного леса (которая продемонстрировала удовлетворительное качество на тестовых данных). Рассчитанная важность объясняющих переменных для модели случайного леса представлена на Рисунке 2.

ЧДП от опер. деятельности Активы

ЧДП от инвест. деятельности Капитал Чистая прибыль ЕВ1Т Выручка

ЧДП от фин. деятельности Обязательства Прочие факторы

Рис. 2. Важность объясняющих переменных модели случайного леса (Scikit-learn)

Согласно расчетам моделирования, наиболее важными переменными, определяющими стоимость капитала корпорации на публичном рынке, являются чистый денежный поток от операционной деятельности и величина совокупных активов.

Другим инструментом, широко используемым для анализа и интерпретации моделей машинного обучения, является библиотека SHAP, реализованная на языке программирования Python. В основе этой библиотеки лежат векторы Шепли - инструмент из теории кооперативных игр; в рамках данного подхода прогноз, выполненный моделью машинного обучения, является результатом кооперативной игры, а объясняющие факторы - игроками, между которыми при помощи векторов Шепли и распределяется «выигрыш» (результат). Особен-

ностью данного инструмента является то, что с его помощью мы можем построить график относительного вклада объясняющих переменных в безразмерных величинах, подобный тому, что строится при помощи библиотеки Scikit-learn, что позволит нам сравнить и провалидировать 2 подхода между собой. Кроме того, при помощи инструмента SHAP мы сможем построить график влияющих переменных в формате каскадной диаграммы в абсолютных величинах по каждому прогнозному наблюдению (в данном случае - по каждой компании).

ЧДП от опер. деятельности Чистая прибыль ЕВ1Т Активы Капитал

ЧДП от инвест. деятельности ЧДП от фин. деятельности Выручка Обязательства Прочие факторы

Рис. 3. Важность объясняющих переменных модели случайного леса (SHAP)

Важность объясняющих переменных модели случайного леса при помощи библиотеки SHAP представлена на Рисунке 3. В отличие от анализа при помощи Scikit-learn, в рамках этого подхода чистая прибыль является более значимым фактором. Тем не менее, оба подхода выделяют чистый денежный поток от операционной деятельности в качестве самого важного фактора.

Далее рассмотрим возможность анализа индивидуальной оценки стоимости при помощи библиотеки SHAP на примере компании American Electric Power Company с листингом на бирже NASDAQ (биржевой тикер - AEP). На конец анализируемого периода капитализация компании составляла 47 млрд долларов США, в то время как наша модель случайного леса оценила её выше рынка на 51 млрд долларов США. Композиция стоимости капитала рассматриваемой компании в формате графика «водопада» представлена на Рисунке 4.

Итоговая прогнозная стоимость Прочие факторы ЧДП от фин д-ти ЧДП от инвест д-ти ЧДП от опер д-ти Капитал Обязательства Активы Чистая прибыль ЕВ1Т Выручка Базовое значение

30 000 40 000

Рис. 4. Анализ оценки стоимости компании АЕР при помощи библиотеки SHAP, млн долл. США

«Базовое значение», которое мы видим на графике - это некая усредненная оценка стоимости компаний по всей выборке. Мы видим, что основными факторами, положительно повлиявшими на оценку стоимости компании, являются чистый денежный поток от операционной деятельности, величина собственного капитала и активов компании.

о

2

4

7

0

0

0 000

20 000

50 000

60 000

Таким образом, по результатам моделирования капитализации компаний при помощи методов машинного обучения, а также анализа этого моделирования мы можем сделать следующие выводы:

1. Рассмотренные модели продемонстрировали R-квадрат на уровне 86% - 95%, что является удовлетворительным показателем качества и свидетельствует о наличии технической возможности использования методов машинного обучения для оценки стоимости компании.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

2. Рассмотренные методы интерпретации моделей (библиотека SHAP, метод feature importance библиотеки scikit-learn) позволяют повысить прозрачность оценок, полученных при помощи моделей машинного обучения.

3. Наиболее сильно влияющим фактором на стоимость рассмотренных компаний является чистый денежный поток от операционной деятельности, что соответствует теории оценки бизнеса (доходному подходу), которая рассматривает стоимость компании как функцию от её будущих денежных потоков. В то же самое время, достаточно интересно, что данный показатель показал объясняющую способность выше, чем классические показатели отчета о прибылях и убытках (EBIT, чистая прибыль). Несмотря на сделанный вывод о большом потенциале рассмотренных моделей применительно к задаче оценки стоимости компании, необходимо понимать, что на данном этапе развития методы машинного обучения не могут (и не должны) заменить профессиональное суждение оценщика, аналитика или ученого, и данные модели не являются заменой классическим методам оценки и финансового анализа, а только дополняют их и помогают осмыслить по-новому. В качестве перспективных дальнейших исследований в данной области мы видим расчет и анализ большего числа моделей на данных различных финансовых рынков, построение моделей по компаниям одной отрасли, что позволит включить большее количество объясняющих переменных, в том числе специфических для данного сектора, а также построение прогнозных моделей с лагом относительно объясняющих переменных.

Литература

1. Cao K., You H., Fundamental Analysis Via Machine Learning // HKUST Business School Research Paper. - 2020. - 61 p.

2. Damodaran A. Valuation approaches and metrics: A survey of the theory and evidence // Hanover, MA: Now Publishers Inc. - 2007. - 104 p.

3. Huang Y., Capretz L.F., Ho D. Machine Learning for Stock Prediction Based on Fundamental Analysis // IEEE Symposium Series on Computational Intelligence. - 2022. - P. 1-10.

4. Miciuta I, Kadtubek M, St^pien P. Modern Methods of Business Valuation - Case Study and New Concepts // Sustainability. - 2020. - № 12 (7). - 22 p.

5. Pinto J.E., Robinson T.R., Stowe J.D. Equity valuation: A survey of professional practice // Review

of Financial Economics. - 2019. - № 37 (2). -P.219-233.

6. Володина А.О., Траченко М.Б. Совершенствование оценки стоимости собственного капитала компании // Научные труды Вольного экономического общества России. - 2019. - № 3. -С.334-345.

7. Галкин И.Н. Потенциал применения методов искусственного интеллекта для анализа долгосрочной динамики стоимости собственного капитала публичных компаний // Повышение конкурентоспособности отечественной науки: развитие в условиях мировой нестабильности: материалы научной конференции аспирантов СПбГЭУ. Санкт-Петербург, 18 мая 2023 г. / под науч. ред. д-ра экон. наук, проф. Е.А. Горбаш-ко; редкол.: А.Г. Бездудная [и др.]. - СПб.: Изд-во СПбГЭУ, 2023. - С. 9-15.

8. Галкин И.Н. Современные методы фундаментального анализа акций на основе моделей машинного обучения // Право, экономика и управление: теория и практика: материалы IV Всеросс. науч.-практ. конф. - 2022. - 5 с.

9. Информационный портал SimFin [Электронный ресурс]. URL: https://simfin.com/ (Дата обращения: 15.01.2024).

10. Коклев П.С. Оценка стоимости компании с использованием методов машинного обучения // Финансы: теория и практика. - 2022. - № 5. -С.132-148.

11. Неустроев Д.Д. Интерпретируемость моделей машинного обучения / Д.Д. Неустроев, Д.И. Курманова // Язык в сфере профессиональной коммуникации: сборник материалов международной научно-практической конференции преподавателей, аспирантов и студентов. - 2019. - С. 484-488.

12. Официальная документация библиотеки SHAP [Электронный ресурс]. URL: https://shap. readthedocs.io/en/latest/index.html (Дата обращения: 25.01.2024).

13. Перминов Н.К. Интерпретация результатов машинного обучения для задачи регрессии // Информатика: проблемы, методы, технологии - Материалы XXII Международной научно-практической конференции им. Э.К. Алгазино-ва. - 2022. - С. 1185-1196.

ESTIMATION AND ANALYSIS OF CORPORATE VALUE USING MACHINE LEARNING METHODS

Galkin I.N.

St. Petersburg State University of Economics

Estimating the value of a business occupies one of the key places in the theory of finance. Increasingly complex economic conditions and the development of new technologies stimulate the search and testing of new methods for assessing the cost of capital. A promising and little-studied direction in this area is the use of machine learning models. The article reviews existing research in this area and empirically studies business valuation using machine learning methods. As part of the study, 4 machine learning models were built to solve the problem of regression of company value, based on financial statements of 650 Russian and American public corporations, and an analysis of the financial indicators that most strongly influence the assessment of the cost of capital was carried out. As

C3

о

CO £

m Р СГ

CT1 А

IE

a result of the study, a conclusion was made about the technical feasibility of using machine learning methods to solve such valuation problems, while, among the factors considered, the value of the company is most strongly influenced by the amount of net cash flow from operating activities.

Keywords: business valuation, cost of capital, cost management, machine learning, cash flow.

References

1. Cao K., You H., Fundamental Analysis Via Machine Learning // HKUST Business School Research Paper. - 2020. - 61 p.

2. Damodaran A. Valuation approaches and metrics: A survey of the theory and evidence // Hanover, MA: Now Publishers Inc. -2007. - 104 p.

3. Huang Y., Capretz L.F., Ho D. Machine Learning for Stock Prediction Based on Fundamental Analysis // IEEE Symposium Series on Computational Intelligence. - 2022. - P. 1-10.

4. Miciuta I, Kadtubek M, St^pien P. Modern Methods of Business Valuation - Case Study and New Concepts // Sustainability. -2020. - No. 12 (7). - 22 p.m.

5. Pinto J.E., Robinson T.R., Stowe J.D. Equity valuation: A survey of professional practice // Review of Financial Economics. -2019. - No. 37 (2). - P. 219-233.

6. Volodina A.O., Trachenko M.B. Improving the assessment of the value of a company's equity capital // Scientific works of the Free Economic Society of Russia. - 2019. - No. 3. - P. 334345.

7. Galkin I.N. The potential of using artificial intelligence methods to analyze the long-term dynamics of the cost of equity capi-

tal of public companies // Increasing the competitiveness of domestic science: development in conditions of global instability: materials of the scientific conference of graduate students of St. Petersburg State Economic University. St. Petersburg, May 18, 2023 / under scientific. ed. Doctor of Economics sciences, prof. E.A. Gorbashko; Editorial Board: A.G. Bezdudnaya [and others]. - St. Petersburg: Publishing house of St. Petersburg State Economic University, 2023. - P. 9-15.

8. Galkin I.N. Modern methods of fundamental analysis of stocks based on machine learning models // Law, economics and management: theory and practice: materials of the IV All-Russian. scientific-practical conf. - 2022. - 5 p.

9. Information portal SimFin [Electronic resource]. URL: https:// simfin.com/ (Date of access: 01/15/2024).

10. Koklev P.S. Assessing the value of a company using machine learning methods // Finance: theory and practice. - 2022. - No. 5. - P. 132-148.

11. Neustroev D.D. Interpretability of machine learning models / D.D. Neustroev, D.I. Kurmanova // Language in the field of professional communication: collection of materials of the international scientific and practical conference of teachers, graduate students and students. - 2019. - pp. 484-488.

12. Official documentation of the SHAP library [Electronic resource]. URL: https://shap.readthedocs.io/en/latest/index.html (Accessed: 01/25/2024).

13. Perminov N.K. Interpretation of machine learning results for a regression problem // Informatics: problems, methods, technologies - Proceedings of the XXII International Scientific and Practical Conference named after. E.K. Algazinova. - 2022. -P. 1185-1196.

a.

e

i Надоели баннеры? Вы всегда можете отключить рекламу.