Научная статья на тему 'Оценка финансовых деривативов нейронной сетью на основе биномиального дерева'

Оценка финансовых деривативов нейронной сетью на основе биномиального дерева Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
3
1
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
оценка опционов / биномиальное дерево / модель CRR / сверточная нейронная сеть / option pricing / binomial tree / CRR model / convolution neural network

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — С Г. Шорохов

На основе модели оценки опционов Кокса-Росса-Рубинштейна построены архитектуры нейронных сетей прямого распространения для аппроксимации стоимости европейских и американских опционов пут. Для европейского опциона пут первым скрытым слоем нейронной сети является полносвязный слой с функцией активации ReLU, последующие слои являются сверточными с 1D фильтром размера 2 и тождественной функцией активации. Для американского опциона пут первый скрытый слой нейронной сети также является полносвязным с функцией активации ReLU, последующие слои имеют функцию активации maxout и зависят как от выхода предыдущего слоя, так и от выхода входного слоя (цены-страйк). Слои обеих нейронных сетей имеют количество нейронов, уменьшающееся на единицу с каждым последующимся слоем вплоть до одного нейрона в выходном слое. Показано, что нейронная сеть для европейского опциона пут может быть упрощена до нейронной сети прямого распространения из двух слоев.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Derivative pricing with a neural network based on the binomial tree

Based on the Cox-Ross-Rubinstein option pricing model, forward-propagation neural network architectures are built to approximate the value of European and American put options. For the European put option, the first hidden layer of the neural network is the dense layer with the ReLU activation function, the subsequent layers are convolutional with a 1D filter of dimension two and the identity activation function. For the American put option, the first hidden layer of the neural network is also dense with a ReLU activation function, subsequent layers have a maxout activation function and depend on both the output of the previous layer and the output of the input layer (the strike price value). The layers of both neural networks have the number of neurons decreasing by one with each subsequent layer up to one neuron in the output layer. It is shown that the neural network for the European put option can be simplified to a two-layer feed-forward neural network.

Текст научной работы на тему «Оценка финансовых деривативов нейронной сетью на основе биномиального дерева»

Оценка финансовых деривативов нейронной сетью на основе биномиального дерева

С. Г. Шорохов

Аннотация— На основе модели оценки опционов Кокса-Росса-Рубинштейна построены архитектуры нейронных сетей прямого распространения для аппроксимации стоимости европейских и американских опционов пут. Для европейского опциона пут первым скрытым слоем нейронной сети является полносвязный слой с функцией активации КеЬи, последующие слои являются сверточными с Ш фильтром размера 2 и тождественной функцией активации. Для американского опциона пут первый скрытый слой нейронной сети также является полносвязным с функцией активации КеЬи, последующие слои имеют функцию активации шахои и зависят как от выхода предыдущего слоя, так и от выхода входного слоя (цены-страйк). Слои обеих нейронных сетей имеют количество нейронов, уменьшающееся на единицу с каждым последующимся слоем вплоть до одного нейрона в выходном слое. Показано, что нейронная сеть для европейского опциона пут может быть упрощена до нейронной сети прямого распространения из двух слоев.

Ключевые слова—оценка опционов, биномиальное дерево, модель СКв, сверточная нейронная сеть.

I. Введение

Одной из наиболее важных задач в финансах является задача оценки справедливой стоимости опционов, для решения которой необходимо строить модель динамики цены базисного актива.

В наиболее известной модели оценки опционов -модели Блэка-Шоулза [1, 2] время изменяется непрерывно, а цена базисного актива моделируется стохастическим дифференциальным уравнением с начальным условием.

В модели Блэка-Шоулза справедливая цена дериватива, являющаяся функцией цены базисного актива и времени, должна удовлетворять уравнению с частными производными Блэка-Шоулза-Мертона [1, 2], при этом учитываются граничные (терминальные) условия в зависимости от вида дериватива. Для европейских опционов колл и пут краевая задача для уравнения Блэка-Шоулза-Мертона имеет точные аналитические решения, определяемые формулами Блэка-Шоулза [1].

Кроме точных аналитических методов, задача оценки опционов может решаться при помощи численных методов, к которым относятся, в частности, методы конечных разностей [3], преобразование Фурье [4], метод Монте-Карло [5] и пр.

В настоящее время основным трендом в финансах является применение глубокого обучения для решения широкого круга задач [6]. Для аппроксимации цен

опционов нейронные сети применяются достаточно давно, начиная с работ [7, 8], обзор подходов к нейросетевой аппроксимации цен опционов приводится в [9]. Нейронные сети могут также применяться для аппроксимации цен опционов в моделях локальной волатильности [10], когда волатильность о является функцией цены базисного актива 5 и времени £ [11].

Альтернативой модели Блэка-Шоулза является биномиальная модель оценки опционов Кокса-Росса-Рубинштейна [12] (далее модель CRR), в которой время и цена базисного актива изменяются дискретно.

II. Биномиальное дерево допустимых цен

Пусть {0 и 50 - текущие время и цена базисного актива соответственно. Рассматривается европейский опцион пут с ценой-страйк К, погашаемый в момент времени Т > £0. Платежная функция такого опциона в момент погашения равна

и(Б, Т) = шях(К — 5, 0), (1)

где 5 - цена базисного актива.

Пусть срок до истечения опциона т = Т — Ь0 разделен на п равных частей (периодов) продолжительностью АЬ = т/п, таким образом, время £ принимает дискретные значения = Ь0 + I АЬ, I = 0, п.

В модели CRR предполагается, что цена базисного актива ) в течение периода времени с началом в момент либо увеличивается до значения и • и > 1, либо уменьшается до значения й • ), й <1. Обозначая допустимые значения цены базисного актива в момент ^ через 5^', получим

S{ = S0 и' di—j, i = 0, п, j = 0, i.

(2)

Допустимые цены базисного актива Б] формируют биномиальное дерево (см. рис. 1).

Здесь для узлов биномиального дерева также использовано обозначение 5^'.

В случае риск-нейтральности финансового рынка [13] указанные выше множители и и й равны [12]

и = еа4Ш, d = е—а4Ш,

(3)

где о - постоянная волатильность базисного актива, при этом (псевдо)вероятности увеличения и уменьшения цены базисного актива равны [12]

е' —d . и—е

П„ = -—, nd = 1 -Пи =

u—d

u—d

(4)

S,2

У 71— 1

t = t0

t = tx

t = t2

"t — in

t - t>n

VJ1 = max(K - sp, 0), j = 0, n.

(5)

V/ = е^'^Ц+Ц + паУ/+1), I = 0, п — 1, ] = 0, {. (6)

Обратный метод вычисления текущей стоимости европейского опциона [12] состоит в том, чтобы, зная стоимость опциона в момент погашения для различных

допустимых значений цены базисного актива согласно формуле (5), находить дисконтированную ожидаемую стоимость опциона для предыдущих периодов времени, применяя формулу (6) достаточное число раз. В результате получим стоимость опциона для

начального момента времени Ь0 и текущей цены базисного актива 50.

Рисунок 1. Допустимые цены базисного актива в биномиальной модели.

Построение биномиального дерева на рис. 1 производится начиная с корневого узла S0, соответствующего текущей цене базисного актива (S00 = S0) и моменту времени t0, по направлению к листьям SJ1, j = 0, п, соответствующим значениям базисного актива в момент погашения опциона Т.

Биномиальное дерево также может быть построено и для моделей локальной волатильности, однако в этом случае процедура построения дерева является более сложной и неоднозначной [14].

III. Оценка европейского опциона в биномиальной

МОДЕЛИ

Рассмотрим европейский опцион пут с ценой-страйк К и сроком погашения Т на базисный актив, не приносящий дохода (дивидендов) на временном интервале [0, Т].

Европейский опцион пут исполняется в момент погашения Т с платежной функцией (1). Обозначим через Vjl стоимость европейского опциона в узле Sj биномиального дерева, а именно, в момент времени tt при цене базисного актива Sj. Стоимость опциона в узлах биномиального дерева в момент погашения опциона(при t = Т)равна

= пик (К -

SZ.0)

V« ,= тах; К - ££ „0|

Vi" = max (К - Sf, 0)

Vf = max (К - SJ, 0)

vig-

max {К - SS, 0)

f=fo f=f, ... f=f1 1=^1... 1=1„

Рисунок 2. Расчет цены европейского опциона пут в биномиальной модели.

Таким образом, при вычислении текущей стоимости европейского опциона пут биномиальное дерево проходится в обратном порядке от листьев к корню дерева, как показано на рис. 2, с вычислением стоимости опциона в листьях дерева по формулам (5) и во внутренних узлах по формулам (6).

IV. Нейронная сеть для оценки европейских опционов

Построим на основе биномиального дерева цен (рис. 1) и алгоритма оценки европейского опциона пут (рис. 2) следующую глубокую нейронную сеть прямого распространения со сверточными слоями [15].

Линейная свертка (свертка Ш) [16] вектора х 6 Ет и фильтра №бКк(т> к), обозначаемая х представляет собой вектор размерности п — к + 1 с компонентами

(х * w)i = Y>j=iXi+i-i Wj, i = 1, m-к + 1.

Для момента времени предшествующего моменту погашения опциона (при I < п), стоимость опциона V} равна дисконтированной ожидаемой стоимости опциона в следующий момент времени а именно:

При т = к значением линейной свертки х *w является скалярное произведение векторов х и w.

Пусть входной слой hn+1 состоит из одного узла, получающего на входе цену-страйк К оцениваемого опциона. Первый скрытый слой hn с п + 1 нейроном получает от входного слоя hn+1 в качестве входных данных цену-страйк К, которая затем преобразуется в выходной вектор Vn £ Rn+1 при помощи нелинейной функции активации ReLU (Rectified Linear Unit) [17] и линейного преобразования с вектором весов wn и вектором смещений Ьп

\п = ReLU (wnK + b"),

где ReLU (х) = max(x, 0), wn £ Rn+1, Ьп £ Rn+1.

(7)

В скрытых слоях L',i = 1, n — 1, содержащих i + 1 нейрон, выход V'+1 6 Ш'+2 предыдущего слоя L'+1 преобразуется в выход V1 6 Ш'+1 слоя L' при помощи линейной свертки вектора V'+1 и фильтра W 6 Ш2

yl = yl+:L * щ

(8)

У = V1 *w.

(9)

Построенная таким образом нейронная сеть £ изображена на рис. 3 и содержит (кроме входного слоя 1,п+1, не производящего каких-либо действий над данными) один полносвязный слой 1,п с функцией активации ReLU и п сверточных слоев !,п-1,..., 1,° с тождественной функцией активации.

входной слон L"

О

cnotiL"

спой L"

ООО о о

»"К + Ь" ReLU

Vf

о о о о

V" DW

id

V" 1

слой L1

выходной спай L*

о о о id

V2

о о

V2 DW

V1

о

V 1 DW id

выходе аппроксимацию стоимости опциона, совпадающую с оценкой европейского опциона пут в модели CRR, если параметры , Ъп, Ш нейронной сети £ выбраны (обучены) следующим образом:

w"

(1.....1) е

(10)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и тождественной функции активации (1ф.

В выходном слое I0 выход V1 Е Е2 последнего скрытого слоя I1 преобразуется в выход уЕК W нейронной сети при помощи линейной свертки с фильтром Ш и тождественной функции активации

bn = (-SJJ.....-SS), Sn = S0 (2j—n), j = 0, n, (11)

0

-rAt

fe-rAtu—1 1—e-rAtd\

= {^—T, 1—r), u =

.a-Jàt d = e—öVÄt

(12)

Доказательство теоремы 1. Если на вход нейронной сети £ поступает цена-страйк К, то результатом вычислений в слое !.п будет вектор Vй, определяемый согласно (7). Если векторы и Ьп задаются согласно (10) и (11) соответственно, то вектор Уп будет иметь компоненты, равные стоимости опциона в узлах (листьях) биномиального дерева в момент исполнения опциона (при £ = Т) согласно формулам (5).

В сверточных слоях 1/,1 = 0, п — 1 для входного вектора У+1 будет выполняться линейная свертка с фильтром № согласно (8) и (9). Если фильтр Ш задается формулой (12), то операция свертки в слое нейронной сети будет эквивалентна операции дисконтирования ожидаемой стоимости опциона в биномиальном дереве по формуле (6).

Таким образом, выход нейронной сети £ будет равен ожидаемой дисконтированной цене опциона для начального момента времени 10 и текущей цены базисного актива 50 в соответствии с моделью CRR. □

Замечание 1. Выход у Е Е нейронной сети £ можно связать с входом К Е Е при помощи следующей явной формулы

y = ReLU(wnK + bn ) *W* ... * W

(13)

n раз

Для фильтра Ш = (м^, ш2) по индукции можно доказать, что справедлива формула

W * ... * W

= (w5\ nwn—1w2,..., (") wS—j w2,..., wn),

Рисунок 3. Структура нейронной сети для оценки европейского опциона пут.

Параметрами нейронной сети £ являются веса шп и смещения Ьп полносвязного слоя , а также веса фильтра Ш, применяемого во всех сверточных слоях 1п-1,..., I0.

Теорема 1. Нейронная сеть прямого распространения £, состоящая из входного слоя Ьп+1 и п +1 слоев Ип, Ип-1,..., И1,10, где:

- первый скрытый слой 1,п - полносвязный слой, состоящий из п + 1 нейрона, с функцией активации ЯеЬи, вектором весов Е Еи+1 и вектором смещений Ьп Е Еи+1,

- скрытые и выходной слои I/, ! = п — 1, .,0 -сверточные слои, состоящие из I + 1 нейрона, с фильтром Ш Е Е2, нулевым смещением и тождественной функцией активации,

при поступлении на вход цены-страйк К выдает на

п раз

где

С) =

п!

■ - число сочетании из п по ].

(п-])\]\

Поэтому нейронная сеть £ из п + 1 слоев может быть свернута в нейронную сеть £ из двух слоев:

1) первого скрытого слоя 1,п - полносвязного слоя, состоящего из п + 1 нейрона, с функцией активации ReLU, векторами весов Е Еи+1 и смещений Ъп Е Еи+1,

2) второго (выходного) полносвязного слоя состоящего из одного нейрона, с тождественной функцией активации, вектором весов ш Е Еи+1 и (нулевым) смещением,

в которой выход у Е Е связан с входом К Е Е соотношением

у = w ReLU(wnK + bn).

(14)

V. ОЦЕНКА АМЕРИКАНСКОГО ОПЦИОНА В БИНОМИАЛЬНОЙ МОДЕЛИ

Биномиальная модель может использоваться для оценки

практически всех видов деривативов, включая американские опционы [12].

Если при помощи модели CRR оценивается американский опцион пут, то в методе оценки опциона на биномиальном дереве (рис. 4) произойдут следующие изменения [12]. Будем обозначать через стоимость американского опциона пут в узле Б,-.

Рисунок 4. Расчет цены американского опциона пут в биномиальной модели.

Исполняя опцион в момент его погашения, держатель опциона получает платеж

V/1 = max(K — Б]1, 0), ] = 0~п, (15)

равный стоимости опциона в соответствующем узле Б™ биномиального дерева.

Для значений времени ^, предшествующих сроку погашения опциона Т (при I < п), у держателя американского опциона есть две альтернативы: досрочно исполнить опцион или продолжать его удерживать.

Досрочное исполнение американского опциона пут имеет экономический смысл только в том случае, когда цена-страйк К больше текущей стоимости базисного актива Б} (К > Б}), при этом держатель опциона получит платеж К — Б}-, т.е.

V/ = K — Б}.

При удержании опциона согласно формуле (6) его стоимость в узле Б] будет равна дисконтированной ожидаемой стоимости опциона в момент времени Ь1+1:

V/ = е-^(у{:1пи + \/}+1пй).

Рациональный держатель американского опциона будет выбирать стратегию, максимизирующую финансовый результат, поэтому стоимость опциона в узле Б- составит

= max(e-rAt(^п» + У/+1па), К — Б}). (16)

Обратный метод вычисления цены американского

опциона пут [12] состоит в том, чтобы, зная стоимость опциона в момент погашения согласно (15), в каждом промежуточном узле Sj находить максимум из дисконтированной ожидаемой стоимости опциона в следующий период времени и стоимости опциона при досрочном исполнении согласно (16). Применяя формулу (16) достаточное число раз, получим текущую цену американского опциона пут t/0 для начального момента времени t0 и текущей цены базисного актива

VI. Нейронная сеть для оценки американских опционов

Метод оценки американских опционов в модели CRR можно также интепретировать в терминах глубокого обучения с определенными изменениями в архитектуре нейронной сети.

Нейронная сеть для оценки американского опциона пут £ (рис. 5) будет состоять из входного слоя с одним узлом, п скрытых слоев с количеством нейронов, уменьшающимся от п + 1 до двух, и выходного слоя с одним нейроном. обозначим слои нейронной сети символами IL', i = 0, п + 1 с индексом i = п + 1 для входного слоя и индексом i = 0 для выходного слоя.

американского опциона пут.

Первый скрытый слой Ип нейронной сети £ аналогичен первому скрытому слою нейронной сети £ и получает на входе значение цены-страйк К, которое преобразуется в выходной вектор Мп 6 Еи+1 при помощи нелинейной функции активации ReLU и линейного преобразования с вектором весов 6 Еи+1 и вектором смещений Ьп 6 Еи+1

Уп = ReLU(wnK + Ьп). (17)

В скрытом слое И' Л = 1, п — 1, выход У+1 6 Е'+2 предыдущего слоя И,'+1 и выход входного слоя К

преобразуются в выходной вектор V1 Е Ш'+1 слоя IL' по формуле

SLl = max(V'+1 * W, w1 К + Ы) (18)

с применением линейной свертки вектора Vl+1 и фильтра W Е Ш2 и нелинейной функции активации maxout [18], где w1 Е Ш'+1, Ь' Е Ш1+1.

В выходном слое L0 выход нейронной сети у Е Ш формируется по формуле, аналогичной (22), а именно:

у = max(V1 * W, w0K + b0), (19)

где w0 Е Ш, b0 Е Ш.

Построенная нейронная сеть £ содержит (кроме входного слоя Ln+1, не производящего какие-либо действия над данными) один полносвязный слой Ln с функцией активации ReLU и п слоев Ln-1,...,L0 с линейной сверткой и функцией активации maxout. Нейронная сеть £ не имеет последовательной структуры, так как слои Ln-1,..., L0 зависят как от выхода предыдущего слоя, так и от выхода входного слоя (значения цены-страйк К опциона). Параметрами нейронной сети £ являются веса w",..., w0 и смещения Ьп,..., Ь° слоев L", ...Д°, а также веса фильтра W, применяемого в слоях Ln-1,..., L0.

Теорема 2. Нейронная сеть прямого распространения £, состоящая из входного слоя hn+1 и п + 1 слоя Ln,..., IL0, где:

- первый скрытый слой hn - полносвязный слой, состоящий из п + 1 нейрона, с функцией активации ReLU, вектором весов wn Е Ши+1 и вектором смещений Ьп Е Ши+1,

- скрытые и выходной слои И/, i = n — 1, .,0, состоящие из i + 1 нейрона, с функцией активации maxout, применяемой к линейной свертке выхода V'+1 предыдущего слоя L'+1 с фильтром W и линейному преобразованию выхода К входного слоя с вектором весов w1 и вектором смещений Ь',

при поступлении на вход цены-страйк К выдает на выходе аппроксимацию стоимости опциона, совпадающую с оценкой американского опциона пут в модели CRR, если параметры wn,..., w0, Ьп,..., b0, W нейронной сети £ выбраны (обучены) следующим образом:

w1 = (1,... ,1) Е Ш1+1, i = 0~п, (20)

b* = (-S0.....— Si), Sj = S0 е°ш(2>-i\ j = 0Л, (21)

W

=

u—d

u—d

£), «=

, d = e

(22)

будет вычисляться линейная свертка 'Vl+1*'W, для входного значения К будет выполняться линейное преобразование wlK + b' и затем вычисляться выход слоев по формулам (18) и (19). Если фильтр W задается формулой (22), а w' и b' - формулами (20) и (21) соответственно, то применение слоя IL' к входным значениям V'+1 и К будет эквивалентно операции дисконтирования ожидаемой стоимости опциона в биномиальном дереве по формуле (16) для интервала времени fo, ti+1].

Таким образом, выходное значение нейронной сети £ получается последовательным применением слоев Ln, L"-1, _, L1, L0 к значению цены-страйк К и будет равно ожидаемой дисконтированной цене американского опциона пут в методе CRR для начального момента времени t0 и текущей цены базисного актива S0. □

VII. Обучение нейронной сети

В качестве иллюстрации обучим нейронную сеть для оценки европейских опционов пут со следующими параметрами:

S0 = 0.5, t0 = 0, Т = 1, г = 0.05, а = 0.25.

Количество периодов времени п в модели CRR выбрано равным 9, поэтому нейронная сеть £ будет состоять из 11 слоев. Цены-страйк К будут выбираться случайным образом из диапазона [0.25, 0.75] пакетами по 500 значений. Соответствующие ценам-страйк цены европейских опционов пут получены при помощи формулы Блэка-Шоулза [1]. Обучение нейронной сети состоит из 200 эпох по 10 шагов градиентного спуска для каждого пакета значений цен-страйк и соответствующих цен опционов. В качестве функции потерь использована среднеквадратичная ошибка -среднее арифметическое квадратов разностей между ценами опционов, предсказанными нейронной сетью, и ценами опционов согласно формуле Блэка-Шоулза [1].

Для реализации нейронной сети использован фреймворк TensorFlow [19]. В качестве алгоритма оптимизации нейронной сети выбран оптимизатор Adam [20] с начальным шагом обучения а = 0.01.

Результаты обучения нейронной сети показывают, что предсказанные нейронной сетью значения цен европейских опционов пут (метка NN) близки к ценам опционов согласно формуле Блэка-Шоулза (метка BS) и ценам опционов в модели CRR (метка BT) (см. рис. 6).

Доказательство теоремы 2. Если на вход нейронной сети £ поступает цена-страйк К, то результатом вычислений в слое будет вектор Vй, определяемый согласно (21). Если векторы и Ьп задаются согласно (20) и (21) соответственно, то вектор ~Мп будет иметь компоненты, равные стоимости опциона в узлах (листьях) биномиального дерева в момент исполнения опциона (при £ = Т) согласно формулам (15).

В слоях И,', 1 = 0, п — 1 для входного вектора У+1

0.5

Strike-price К

Рисунок 6. Цены европейских опционов пут в моделях Блэка-Шоулза, CRR и нейросетевой модели.

Однако при рассмотрении отклонений предсказанных цен опционов от точных значений согласно формуле Блэка-Шоулза (см. рис. 7) видно, что несмотря на обучение нейронной сети на точных теоретических значениях цен опционов (с точностью до ошибок при проведении операций с плавающей запятой) предсказанные нейронной сетью цены (метка NN скорее соответствуют ценам опционов в модели CRR (метка ВТ), чем точным ценам опционов в модели Блэка-Шоулза (метка BS). Это связано с тем, что архитектура нейронной сети основана на биномиальном дереве и модели СЯЯ, поэтому нейронная сеть склонна вопроизводить цены опционов в модели СЯЯ.

Strike-price К

Рисунок 7. Отклонение цен европейских опционов пут в биномиальной и нейросетевой моделях.

VIII. Заключение

В работе показано, что вычисление справедливых стоимостей европейских и американских опционов пут при помощи модели CRR может быть представлено в виде вычисления выхода нейронных сетей прямого распространения специальной архитектуры. Для европейского опциона пут нейронная сеть имеет последовательную структуру с первым скрытым полносвязным слоем с функцией активации ReLU и последующими сверточными слоями с 1D фильтром размера 2 и тождественной функцией активации. Для американского опциона пут нейронная сеть не имеет последовательной структуры, при этом в первом скрытом полносвязном слое также применяется функция активации ReLU, а в последующих слоях используется функции активации maxout, которая применяется к свертке выхода предыдущего слоя с 1D фильтром размера 2 и линейному преобразованию выхода входного слоя (цены-страйк опциона).

Теория опционов имеет обширные применения в финансах, начиная от оценки справедливой стоимости проектов, бизнеса и ценных бумаг и заканчивая оценкой и управлением рыночными [21] и кредитными [22] рисками. Предложенные в работе архитектуры нейронных сетей могут быть доработаны для использования в моделях локальной волатильности и применены при решении различных задач в финансах.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Библиография

[1] Black F., Scholes M. The Pricing of Options and Corporate Liabilities // Journal of Political Economy, vol. 81, pp. 637-654, 1973. doi:10.1086/260062

[2] Merton R. C. Theory of Rational Option Pricing // The Bell Journal of Economics and Management Science, vol. 4, pp. 141-183, 1973. doi:10.2307/3003143

3] Schwartz E. The Valuation of Warrants: Implementing a New Approach // Journal of Financial Economics, vol. 4, pp. 79-94, 1977. doi:10.1016/0304-405X(77)90037-X

4] Carr P., Madan D. Option valuation using the fast Fourier transform // The Journal of Computational Finance, vol. 2(4), pp. 61-73, 1999. doi:10.21314/jcf.1999.043

5] Boyle P. Options: A Monte Carlo Approach // Journal of Financial Economics, vol. 4(3), pp. 323-338, 1977. doi:10.1016/0304-405x(77)90005-8

6] Schmidhuber J. Deep learning in neural networks: An overview // Neural Networks, vol. 61, pp. 85-117, 2015. doi:10.1016/j .neunet.2014.09.003

7] Malliaris M., Salchenberger L. A neural network model for estimating option prices // Applied Intelligence, vol. 3(3), pp. 193-206, 1993. doi:10.1007/BF00871937

8] Hutchinson J. M. et al. A nonparametric approach to pricing and hedging derivative securities via learning networks // Journal of Finance, vol. 49(3), pp. 851-889, 1994. doi:10.3386/w4718

9] Liu S., Oosterlee C. W., Bohte S. M. Pricing Options and Computing Implied Volatilities using Neural Networks // Risks, vol. 7, p.16, 2019. doi:10.3390/risks7010016

10] Dupire B. Pricing with a smile // Risk Magazine, vol. 7(1), pp. 18-20, 1994.

11] Shorokhov S. On Deep Learning for Option Pricing in Local Volatility Models // In: Proceedings of the 9th International Conference "Distributed Computing and Grid Technologies in Science and Education"(GRID'2021), Dubna, Russia, July 5-9, 2021. pp. 381-386. doi: 10.54546/mlit.2021.17.84.001.

12] Cox J. C., Ross S. A., Rubinstein M. Option pricing: A simplified approach // Journal of Financial Economics, vol. 7(3), pp. 229-263, 1979. doi:10.1016/0304-405X(79)90015-1

13] Cox J. C., Ross S. A. The Valuation of Options for Alternative Stochastic Processes // Journal of Financial Economics,vol. 3(1-2), pp. 145-166, 1976. doi:10.1016/0304-405x(76)90023-4

14] Chriss N. Black Scholes and Beyond: Option Pricing Models. McGraw Hill Professional, 1997. 496 с.

15] Lecun Y., Bottou L., Bengio Y., Haffner P. Gradient-based learning applied to document recognition // Proceedings of the IEEE, vol. 86(11), pp. 2278-2324, 1998. doi: 10.1109/5.726791

16] Damelin S., Miller W. The Mathematics of Signal Processing. Cambridge University Press, 2011. doi:10.1017/cbo9781139003896

17] Fukushima K. Visual feature extraction by a multilayered network of analog threshold elements // IEEE Transactions on Systems Science and Cybernetics,vol. 5(4), pp. 322-333, 1969. doi:10.1109/TSSC.1969.300225

18] Goodfellow I., Warde-Farley D., Mirza M., Courville A., Bengio Y. Maxout Networks // Proceedings of the 30th International Conference on Machine Learning, PMLR, vol. 28(3), pp. 1319-1327, 2013.

19] Abadi M. et al. TensorFlow: a system for large-scale machine learning // In: OSDI'16: Proceedings of the 12th USENIX conference on Operating Systems Design and Implementation, 2015. pp. 265283.

20] Kingma D. P., Ba J. Adam: A method for stochastic optimization // In: Y. Bengio, Y. LeCun (Eds.), 3rd International Conference on Learning Representations, ICLR 2015, San Diego, CA, USA, May 79, 2015, Conference Track Proceedings. 2015. URL http://arxiv.org/abs/1412.6980

21] Шорохов С.Г. Введение в модели количественной оценки рыночных рисков // М.: РУДН, 2017.

22] Шорохов С.Г. Введение в модели количественной оценки кредитных рисков // М.: РУДН, 2018.

Статья получена 15 ноября 2023. Публикация выполнена в рамках проекта №002092-0-000 Российского университета дружбы народов им. Патриса Лумумбы.

С. Г. Шорохов - Федеральное государственное автономное образовательное учреждение высшего образования "Российский университет дружбы народов имени Патриса Лумумбы, Москва, Россия (e-mail: shorokhov-sg@rudn.ru). доцент кафедры математического моделирования и искусственного интеллекта, кандидат физико-математических наук, доцент

Derivative pricing with a neural network based

on the binomial tree

S. G. Shorokhov

Abstract — Based on the Cox-Ross-Rubinstein option pricing model, forward-propagation neural network architectures are built to approximate the value of European and American put options. For the European put option, the first hidden layer of the neural network is the dense layer with the ReLU activation function, the subsequent layers are convolutional with a 1D filter of dimension two and the identity activation function. For the American put option, the first hidden layer of the neural network is also dense with a ReLU activation function, subsequent layers have a maxout activation function and depend on both the output of the previous layer and the output of the input layer (the strike price value). The layers of both neural networks have the number of neurons decreasing by one with each subsequent layer up to one neuron in the output layer. It is shown that the neural network for the European put option can be simplified to a two-layer feedforward neural network.

Keywords — option pricing, binomial tree, CRR model, convolution neural network.

References

[1] Black F., Scholes M. The Pricing of Options and Corporate Liabilities // Journal of Political Economy, vol. 81, pp. 637-654, 1973. doi:10.1086/260062

[2] Merton R. C. Theory of Rational Option Pricing // The Bell Journal of Economics and Management Science, vol. 4, pp. 141-183, 1973. doi:10.2307/3003143

[3] Schwartz E. The Valuation of Warrants: Implementing a New Approach // Journal of Financial Economics, vol. 4, pp. 79-94, 1977. doi:10.1016/0304-405X(77)90037-X

[4] Carr P., Madan D. Option valuation using the fast Fourier transform // The Journal of Computational Finance, vol. 2(4), pp. 61-73, 1999. doi:10.21314/jcf.1999.043

[5] Boyle P. Options: A Monte Carlo Approach // Journal of Financial Economics, vol. 4(3), pp. 323-338, 1977. doi:10.1016/0304-405x(77)90005-8

[6] Schmidhuber J. Deep learning in neural networks: An overview // Neural Networks, vol. 61, pp. 85-117, 2015. doi:10.1016/j .neunet.2014.09.003

[7] Malliaris M., Salchenberger L. A neural network model for estimating option prices // Applied Intelligence, vol. 3(3), pp. 193-206, 1993. doi:10.1007/BF00871937

[8] Hutchinson J. M. et al. A nonparametric approach to pricing and hedging derivative securities via learning networks // Journal of Finance, vol. 49(3), pp. 851-889, 1994. doi:10.3386/w4718

[9] Liu S., Oosterlee C. W., Bohte S. M. Pricing Options and Computing Implied Volatilities using Neural Networks // Risks, vol. 7, p.16, 2019. doi:10.3390/risks7010016

[10] Dupire B. Pricing with a smile // Risk Magazine, vol. 7(1), pp. 18-20, 1994.

[11] Shorokhov S. On Deep Learning for Option Pricing in Local Volatility Models // In: Proceedings of the 9th International Conference "Distributed Computing and Grid Technologies in Science and Education"(GRID'2021), Dubna, Russia, July 5-9, 2021. pp. 381-386. doi: 10.54546/mlit.2021.17.84.001.

[12] Cox J. C., Ross S. A., Rubinstein M. Option pricing: A simplified approach // Journal of Financial Economics, vol. 7(3), pp. 229-263, 1979. doi:10.1016/0304-405X(79)90015-1

[13] Cox J. C., Ross S. A. The Valuation of Options for Alternative Stochastic Processes // Journal of Financial Economics,vol. 3(1-2), pp. 145-166, 1976. doi:10.1016/0304-405x(76)90023-4

[14] Chriss N. Black Scholes and Beyond: Option Pricing Models. McGraw Hill Professional, 1997. 496 c.

[15] Lecun Y., Bottou L., Bengio Y., Haffner P. Gradient-based learning applied to document recognition // Proceedings of the IEEE, vol. 86(11), pp. 2278-2324, 1998. doi: 10.1109/5.726791

[16] Damelin S., Miller W. The Mathematics of Signal Processing. Cambridge University Press, 2011. doi:10.1017/cbo9781139003896

[17] Fukushima K. Visual feature extraction by a multilayered network of analog threshold elements // IEEE Transactions on Systems Science and Cybernetics,vol. 5(4), pp. 322-333, 1969. doi:10.1109/TSSC.1969.300225

[18] Goodfellow I., Warde-Farley D., Mirza M., Courville A., Bengio Y. Maxout Networks // Proceedings of the 30th International Conference on Machine Learning, PMLR, vol. 28(3), pp. 1319-1327, 2013.

[19] Abadi M. et al. TensorFlow: a system for large-scale machine learning // In: OSDI'16: Proceedings of the 12th USENIX conference on Operating Systems Design and Implementation, 2015. pp. 265283.

[20] Kingma D. P., Ba J. Adam: A method for stochastic optimization // In: Y. Bengio, Y. LeCun (Eds.), 3rd International Conference on Learning Representations, ICLR 2015, San Diego, CA, USA, May 79, 2015, Conference Track Proceedings. 2015. URL http://arxiv.org/abs/1412.6980

[21] Shorokhov S.G. Introduction into quantitative models of market risk valuation (in Russian) // Moscow: RUDN, 2017.

[22] Shorokhov S.G. Introduction into quantitative models of credit risk valuation (in Russian) // Moscow: RUDN, 2018.

i Надоели баннеры? Вы всегда можете отключить рекламу.