Научная статья на тему 'Разработка модели персонализированного банковского продукта эконометрическими методами'

Разработка модели персонализированного банковского продукта эконометрическими методами Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
90
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
БАНКОВСКИЙ ПРОДУКТ / BANKING PRODUCTS / КРЕДИТНЫЕ ОРГАНИЗАЦИИ / CREDIT INSTITUTIONS / ЭКОНОМЕТРИЧЕСКАЯ МОДЕЛЬ / ECONOMETRIC MODEL

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шульгина Е.Л., Богомолов А.И.

Разрабатывается алгоритм работы системы максимально индивидуализированного банковского продукта, заключающийся в создании автоматизированного алгоритма работы системы, принимающей персонифицированные решения банковского продукта для каждого клиента. Была построена эконометрическая модель, которая будет задавать индивидуальные для каждого клиента переменные, прогнозировать его потребительское поведение и поведение, связанное с банковским продуктом, и делать выводы по своей собственной спецификации, более индивидуализируя продукт, опирающийся на данную модель.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE DEVELMENT OF A MODEL OF PERSONALIZED BANKING PRODUCTS BY ECONOMETRIC METODS

Developing of algorithm of the system of individualized banking product, which creates an automated algorithm of the system, receiving personalized banking product solutions for each client.Construction of econometric model, which will be set individually for each client variables to predict consumer behavior and its behavior associated with the banking product, and to draw conclusions on their own specifications, more than individualizing the product, based on this model.

Текст научной работы на тему «Разработка модели персонализированного банковского продукта эконометрическими методами»

• Наблюдается положительная автокорреляция случайных остатков

• Ковариация между ценой на нефть и случайным остатком равна 0.

В ходе работы была составлена модель зависимости цены на бензин АИ-95 от цены окончания торгов по фьючерсам на нефть Brent на бирже ICE. Были проведены тесты для проверки данной спецификации на адекватность, качественность и соответствие предпосылкам теоремы Гаусса-Маркова. Спецификация успешно прошла все тесты, кроме проверки на автокорреляцию и гомоскедастичность случайных остатков. Причину «провала» этих тестов можно выявить не до конца правильной спецификации. Цена на бензин не может зависеть только от цены на нефть.

Вероятнее всего, большое влияние на цену бензина оказывает курс валют, транспортные издержки продавца и множество других факторов. Кроме того, никто не запрещает производителям бензина закупать нефть по дешевым ценам и продавать бензин дешевле остальных. Еще один вариант ценообразования бензина - продажа нефти дочерней компании ниже рыночной цены, например, по себестоимости, что делает возможность производить бензин намного дешевле, чем конкуренты.

Данная модель является примером построения учебной эконометрической модели и не учитывает неадекватность некоторых показателей, которые были описаны выше.

Достичь более точных результатов можно введя большее количество переменных и проведя более тщательный анализ ценообразования бензина Список используемых источников

1. База данных по курсам валют. Банк России. [Электронный ресурс]. Режим доступа: http ://www. cbr. ru/currency_base/dynamics.aspx (Дата обращения 13.12.2016 год)

2. Экономико-математические методы в примерах и задачах: Учеб. пос. / А.Н. Гармаш, И.В. Орлова, Н.В. Концевая и др.; Под ред. А.Н. Гармаша - М.: Вузовский учебник: НИЦ ИНФРА-М, 2014 - 416с.

3. Финансовый портал Ru.Investing [Электронный ресурс]. Режим доступа: http://ru.investing.com/commodities/brent-oil-historical-data. (Дата обращения 12.12.2016 год)

4. Невежин, В.П. Практическая эконометрика в кейсах: учеб. пособие /В.П. Невежин, Ю.В. Невежин. - М.: ИД «ФОРУМ»: ИНФРА-М, 2017. -317 с.

5. [Электронный ресурс]. Режим доступа: http://www.finam.ru (дата обращения 15.12.2016)

6. [Электронный ресурс]. Режим доступа: http://www.petrolplus.ru (дата обращения 15.12.2016)

V V

УДК: 336.717.0

РАЗРАБОТКА МОДЕЛИ ПЕРСОНАЛИЗИРОВАННОГО БАНКОВСКОГО ПРОДУКТА

ЭКОНОМЕТРИЧЕСКИМИ МЕТОДАМИ

Шульгина Е.Л., студентка Богомолов А.И., к.т.н., доцент Финансовый университет при Правительстве Российской Федерации, г. Москва

Аннотация. Разрабатывается алгоритм работы системы максимально индивидуализированного банковского продукта, заключающийся в создании автоматизированного алгоритма работы системы, принимающей персонифицированные решения банковского продукта для каждого клиента. Была построена эконометрическая модель, которая будет задавать индивидуальные для каждого клиента переменные, прогнозировать его потребительское поведение и поведение, связанное с банковским продуктом, и делать выводы по своей собственной спецификации, более индивидуализируя продукт, опирающийся на данную модель.

Ключевые слова: банковский продукт, кредитные организации, эконометрическая модель

THE DEVELMENT OF A MODEL OF PERSONALIZED BANKING PRODUCTS BY

ECONOMETRIC METODS

Shulgina E.L., Bogomolov A.I. Financial University under the Government of the Russian Federation, Moscow

Abstract. Developing of algorithm of the system of individualized banking product, which creates an automated algorithm of the system, receiving personalized banking product solutions for each client.Construction of econometric model, which will be set individually for each client variables to predict consumer behavior and its behavior associated with the banking product, and to draw conclusions on their own specifications, more than individualizing the product, based on this model. Keywords: banking products, credit institutions, econometric model

Информационные технологии проникают в сферу бизнеса прогрессирующими темпами, давая использующим их компаниям прорывные конкурентные преимущества в любой отрасли. Это особенно касается банковской сферы, переживающей на данный момент кризисные времена, выраженные в недостатке активов, отсутствии их долгосрочных видов, большой конкуренцией с небанковскими кредитными организациями и отраслью fintech. Довольно часто именно информационные технологии, дающие организациям большую мобильность и оптимальность функционирования, выступают ключевым драйвером в бизнесе банковской системы.

Трансформируясь к клиент-ориентированной модели, банки стремятся предлагать своим клиентам комплексное решение, являющееся множеством классических банковских продуктов, в своей совокупности полностью удовлетворяющих целевые индивидуальные потребности каждого клиента. На данный момент технологии не предоставляют возможности перехода на абсолютно индивидуализированные предложения, однако имеющаяся на настоящее время сегментация клиентов общепринята всем банковским бизнесом и не представляет собой конкурентного преимущества. Издержки от ручной работы с абсолютно каждым клиентом непомерны для бюджета любого банка (лишь определённые группы лиц, в т. ч. государственные организации и клиенты с исключительно большими денежными суммами, работают с банками абсолютно

индивидуализировано), поэтому необходима автоматизация процесса создания индивидуального продукта для каждого клиента банка. Исключая технические и организационные части создания такого банковского продукта, основной целью является разработка алгоритма поведения системы.

Таким образом, целью данной работы является разработка алгоритма работы системы максимально индивидуализированного банковского продукта, заключающаяся в создании автоматизированного

алгоритма работы системы, принимающей персонифицированные решения банковского продукта для каждого клиента.

Создание продукта, соответствующего поставленным целям, возможно за счёт алгоритма построения математической модели каждого конкретного клиента, прямо связанной с основными параметрами банковских продуктов, интересных клиенту. Так как данная модель должна учитывать изменчивость и гибкость физического лица и его индивидуального множества потребностей, связанных с деятельностью банка, она должна иметь механизмы самообучения, выражающиеся в добавлении новых переменных-факторов, значимых при составлении банковского продукта. Самообучение одновременно с ростом совпадения банковского профиля клиента (его модели) с его действительными потребностями, а также возможность составления долгосрочного решения на будущие сроки для клиента возможны только за счёт использования прогнозирования. Поэтому модель клиента должна являться эконометрической.

Таким образом, первостепенная задача -построение эконометрической модели, которая будет задавать индивидуальные для каждого клиента переменные, прогнозировать его потребительское поведение и поведение, связанное с банковским продуктом, и делать выводы по своей собственной спецификации, более индивидуализируя продукт, опирающийся на данную модель.

Исходя из общей классификации эконометрических моделей, модель должна быть множественной регрессионной с показателем времени. Для выполнения поставленной цели модель должна также содержать панельные данные -"прослеженные во времени пространственные микроэкономические выборки, то есть они состоят из наблюдений одних и тех же экономических единиц, которые осуществляются в последовательные периоды времени"[5]. Именно за счёт такого типа данных можно будет делать вывод о закономерностях

в поведении клиента, потому что внешние факторы постоянно и в большом количестве влияют на конкретного индивида, и чтобы выявить их закономерности, необходимо рассматривать наименьшие периоды из возможных для анализа. Установив тип статистических данных, рассмотрим разработки эконометрических моделей для панельных данных в России и мире.

Исходя из типа данных и ресурсов работы, первичная разработка модели будет проходить для линейной модели с одним уравнением. При дальнейшей работе, модель может приобрести качественно иной характер, не только являясь нелинейной, но и составляясь из нескольких взаимосвязанных уравнений. Также после получения оценок несколькими способами помимо основной проверки необходимо сравнение полученных оценок для более точного оценивания. Данная операция будет занесена в алгоритм работы продукта.

В первичной модели банковский продукт будет опираться на следующие экзогенные переменные: доходы клиента и процентная ставка по депозитам. Цель банковского продукта в данном случае - на основе доходов клиента и ставки по депозитам определить максимально возможный доход для будущих периодов и предложить его клиенту.

Для работы алгоритма необходимы реальные данные, собранные с наименьшим возможным промежутком с действий каждого отдельного клиента. Способы сбора таких данных относятся к технологии BigData и находятся в постоянной разработке. Для показания работы алгоритма статистические данные могут браться из двух источников, возможных в России:

1) Данные "Росстат" по потреблению (построение на основе данных модели потребления одного индивида): простой доступ, возможность рассмотрения данных на макроуровне.

2) РМЭЗ (Российский мониторинг экономического положения и здоровья населения) НИУ ВШЭ: большие массивы данных, которые невозможно открыть в Excel, панельные данные с наименьшим интервалов из всех аналитик панельных данных в России.

За неимением должного программного обеспечения для первичной разработки модели воспользуемся данными "Росстат". Для проведения необходимого анализа воспользуемся следующими допущениями:

1) Человек, модель которого строится, получает доход в размере среднедушевого дохода России

2) Продукт в своём алгоритме опирается на соотношение расходов клиента с внешними показателями, не связанными с денежными затратами. Для моделирования будет использоваться следующая ситуация: клиент имеет долгосрочный депозит в размере 50 процентов от дохода 2008 г. по наиболее выгодному условию с динамичной процентной ставкой. Наиболее выгодным условием для клиента является текущая ставка рефинансирования ЦБ (Коммерческий банк выдаёт кредит без комиссии).

3) Человек получает заработную плату, равную средней.

Неучтённые в модели внешние факторы будут отражаться в виде случайной величины и!

Данные по процентной ставке берутся из официальной статистики центрального банка.

Допустим, что совокупные доходы текущего периода (Я) зависят от двух показателей - заработной платы клиента и процента по депозиту (Р). График их взаимосвязи представлен на Рисунке 1.

Рисунок 1 - Динамика заработной платы, совокупного дохода и ключевой ставки

Спецификация будет иметь вид:

Rt=ao+ai*Wt+a2*Dt+Ut

Характеристики случайной величины ut заданы из условия теоремы Гаусса-Маркова. Случайная величина а0 закладывает в себя другие источники дохода.

Для определения зависимости показателей измерим значимость параметров с помощью коэффициента детерминации R2.

Для определения параметров a0, ab a2 воспользуемся средством Microsoft Excel - функцией ЛИНЕЙН.

Линейная оценка

-717,430894 0,82101345 5529,440547

386,8023569 0,10815071 5709,803531

0,526762068 4558,56384 #н/д

51,75924105 93 #н/д

2151166262 1932586900 #н/д

Получаем следующую оценку модели (оценки в дальнейшем могут быть получены другими способами, после чего их можно будет сравнить и выбрать наиболее эффективную) Rt=5529+0,82*Wt-717,43*Dt+ut

Значение ошибки Sa0 велико относительно параметра-свободного члена, что свидетельствует о недостатке переменных в модели. В данном случае запрограммированный алгоритм должен был бы выявить дополнительный фактор, влияющий на доход клиента, опираясь на полученные статистические данные о клиенте.

Коэффициент детерминации равен 0,526, что свидетельствует о среднем качестве параметров и статистики: Данные параметры объясняют доходность на 52,6%.

Проверим модель на адекватность. В качестве контролирующей выборки берём 3 значения:

Критическая выборка

май. 08 14344,9 17290 10,50

авг.12 23403,8 26909 8,00

ЯНВ, 16 21402,8 32660 10,00

Найдем qb q2 и q3 по формуле для моделей множественной регрессии. Из расчётов в Excel получаем:

0,144859222

Sql

Sq2 Sq3

4825,96 ql 4807,034 q2 4040,175 q3

0,135896828 -0,197611189

Следующим шагом рассчитаем Ткг, которое равно 1,985

С помощью оценённой модели рассчитаем значения R. Получаем следующие значения для q1, q2 и q3 соответственно:

из оценённой модели 12191/

,73873

21882,64435 25169,43092

Далее У mm = Уо

- г.

крит.

г max

= Уо + т1

крит,

по

* So

*s0

формулам

находим интервалы для каждого q:

Лтт 2610,996 12339,4761 17

Ртах 21772,48 31425,8126 33

Значения из критической выборки входят в полученные интервалы, что позволяет сделать вывод об адекватности модели.

Проверим модель на качественность. Что касается коэффициента детерминированности, то он показал значение 0,53, соответствующее средней мощности объяснения доходности двумя другими величинами. Для более детального анализа воспользуемся F-тестом.

С помощью функции ЛИНЕЙН в MS Excel рассчитаем F=51,75

C помощью функции БРАСШБР(0,05;1;96) получаем Fkr=3,09

F>Fkr => спецификация оказывается качественной Проверка условий теоремы Гаусса-Маркова 1. E(u)=0

Рассчитаем по формуле R-a0-a1*W-a2*D случайную величину u для каждого периода. Математическое ожидание полученных величин находим по формуле MS Excel СРЗНАЧ (при допущении, что вероятности наступления случайной величины в каждом периоде одинаковы). Таким образом, E(u)=-0,00000000003, что примерно равно 0. Первая предпосылка теоремы выполнена.

2. Дисперсия ошибок одинакова и равна для всех ошибок одной и той же постоянной величине сл2. Для проверки этой предпосылки воспользуемся тестом GQ. Проведём его для каждого регрессора отдельно. Для каждого регрессора построим отдельный массив данных при упорядочении регрессоров по возрастанию. Далее разделим массивы на 3 части по n/3=96/3=32 периода каждый. Найдём функцию ЛИНЕЙН для четырёх крайних массивов по формуле

по значениям функций получим значения GQ:

GQ(W) 1,389098813 GQ(D) 0,1131571

1/GQ(W) 0,719891192 1/GQ(D) 8,8372677 С помощью функции FРАСПОБР(0,05;32;32) рассчитаем Fkr=1,804

1/GQ(W)<Fkr, GQ(W)<Fkr => случайные остатки гомоскедастичны

1/GQ(D)>Fkr, GQ(D)<Fkr => случайные остатки гетероскедастичны

Исходя из оценок обоих регрессоров, случайные остатки являются гетероскедастичными,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

следовательно 2 предпосылка теоремы не выполнена.

3.Для проверки спецификации на неколлерируемость случайных остатков воспользуемся тестом DW.

Рассчитаем значение показателя по формуле: ГГ-1Чк, , - «О2

DW

DW=2,499 для 95 наборов значений

Найдём значения интервала dl и du по таблице Дарбина-Уотсона с уровнем значимости 5%. Количество регрессоров - 2, п=95

Таким образом, DW входит в интервал М3, что не позволяет сказать о наличии или отсутствии ковариации случайных остатков. Однако значение более близко к отсутствию ковариации, чем к её явному наличию. График говорит о том же:

График рассеивания случайных остатков

10 000,00 15000,00 10000,00 5000,00 0,00 ■5000,00 -10000,00 -15000,00

Рисунок 2. График остатков

4. Предпосылка о ковариации проверяется функцией КОВАР в М$Ехев1. Наблюдается значительная ковариация между регрессорами и случайными остатками, что свидетельствует о недостаточности параметров клиента, взятых при анализе.

Таким образом, построенная модель несёт теоретический характер за неимением достаточных статистических данных для создания должной спецификации. Однако зависимость между исследуемыми показателями выявлена, и, с другой стороны, показывает зависимость между уровнем дохода, заработной платой и ставкой рефинансирования: данные связи можно объяснить тем, что большую часть доходов населения составляет именно заработная плата. Влияние процента рефинансирования кредитных организаций напрямую сказывается на процентах по основным операциям

банка и физическими лицами, что сказывается в немалой мере на доходах населения - приблизительно в два раза меньше, чем заработная плата сказывается на исследуемом показателе.

В рамках исследуемой проблемы данные можно проанализировать следующим образом - депозит в средней мере влияет на величину дохода клиента, поэтому модель, запрограммируемая на недостаточные значения, выявит другие параметры, влияющие на доходность клиента в данном случае. Чем больше данных модель соберёт о клиенте, тем более точными будут её решения как на будущий так и на текущий периоды. Таким же образом, возможно, проанализировать и расходы клиента. Задача дальнейшей разработки модели уже решается не только эконометрическими методами, но и кодированием на языках программирования R или С.

Список используемых источников

1. Сайт ассоциации российских банков. - URL: arb.ru.

2. Сайт Банка России. - URL: https://www.cbr.ru/

3. Федеральная служба статистики Росстат. - URL: www.gks.ru.

4. Klycheva, V.V. Construction of econometric model on the basis of money market function of macroeconomic model of the U.S. economy // Mathematical and methods of economics. - 2014. - № 8.

5. Ратникова, Т.А. Введение в эконометрический анализ панельных данных // Экономический журнал Высшей школы экономики. - 2006. - №2. 7.

6. Барлиани А.Г., Барлиани И.Я. Оптимальный метод отбора факторов-признаков в эконометрических моделях на основе рекурсивного алгоритма псевдообращения матриц // Интерэкспо Гео-Сибирь. - 2014. - №1. 9.

7. Киселёв Н.А., Алексахина В.Г. Оценка качества эконометрических моделей в виде системы одновременных уравнений // Вопросы региональной экономики. - 2014. - №1.

8. Невежин, В.П. Практическая эконометрика в кейсах: учеб. пособие /В.П. Невежин, Ю.В. Невежин. - М.: - М.: ИД «ФОРУМ»: ИНФРА-М, 2017. -317 с.

i Надоели баннеры? Вы всегда можете отключить рекламу.