Научная статья на тему 'РАЗРАБОТКА АРХИТЕКТУРЫ ГИБРИДНОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ ДЛЯ ФИНАНСОВОГО АССИСТЕНТА'

РАЗРАБОТКА АРХИТЕКТУРЫ ГИБРИДНОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ ДЛЯ ФИНАНСОВОГО АССИСТЕНТА Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
60
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФИНАНСОВЫЙ АССИСТЕНТ / ФИНАНСОВОЕ ПЛАНИРОВАНИЕ / УПРАВЛЕНИЕ ИНВЕСТИЦИОННЫМ ПОРТФЕЛЕМ / СЕГМЕНТАЦИЯ АУДИТОРИИ / МАШИННОЕ ОБУЧЕНИЕ

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пилявская Ирина Михайловна

Целью данной работы является разработка архитектуры гибридной рекомендательной системы, которая позволит учесть широкий спектр данных для построения рекомендаций финансовых инструментов и стратегий для финансового ассистента. В результате данной работы удалось достичь поставленных целей. Архитектура предусматривает использование всех необходимых данных, а также решает проблему «холодного старта».

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пилявская Ирина Михайловна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DEVELOPMENT OF THE ARCHITECTURE OF A HYBRID RECOMMENDER SYSTEM FOR A FINANCIAL ASSISTANT

The purpose of this work is to develop the architecture of a hybrid recommender system, which will take into account a wide range of data to build recommendations for financial instruments and strategies for a financial assistant. As a result of this work, it was possible to achieve the set goals. The architecture provides for the use of all the necessary data, and also solves the problem of "cold start".

Текст научной работы на тему «РАЗРАБОТКА АРХИТЕКТУРЫ ГИБРИДНОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ ДЛЯ ФИНАНСОВОГО АССИСТЕНТА»

A UNiVERSUM:

№ 5 (98)_-V, r - - ._май. 2022 г.

DOI - 10.32 743/UniTech.2022.98.5.13566

РАЗРАБОТКА АРХИТЕКТУРЫ ГИБРИДНОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ

ДЛЯ ФИНАНСОВОГО АССИСТЕНТА

Пилявская Ирина Михайловна

руководитель Аналитики, Тинькофф Банк РФ, г. Москва E-mail: irakatc@gmail. com

DEVELOPMENT OF THE ARCHITECTURE OF A HYBRID RECOMMENDER SYSTEM

FOR A FINANCIAL ASSISTANT

Irina Piliavskaia

Head of Analytics, Tinkoff Bank Russia, Moscow

АННОТАЦИЯ

Целью данной работы является разработка архитектуры гибридной рекомендательной системы, которая позволит учесть широкий спектр данных для построения рекомендаций финансовых инструментов и стратегий для финансового ассистента. В результате данной работы удалось достичь поставленных целей. Архитектура предусматривает использование всех необходимых данных, а также решает проблему «холодного старта».

ABSTRACT

The purpose of this work is to develop the architecture of a hybrid recommender system, which will take into account a wide range of data to build recommendations for financial instruments and strategies for a financial assistant. As a result of this work, it was possible to achieve the set goals. The architecture provides for the use of all the necessary data, and also solves the problem of "cold start".

Ключевые слова: финансовый ассистент, финансовое планирование, управление инвестиционным портфелем, сегментация аудитории, машинное обучение.

Keywords: financial assistant, financial planning, investment portfolio management, audience segmentation, machine-learning.

Главной задачей финансовых ассистентов являются правильные рекомендации подходящих финансовых инструментов и стратегий. Все эти инструменты сильно зависят от финансового положения пользователя и его психологического портрета.

Рекомендательная система в таком случае должна опираться на широкий спектр данных:

• данные о финансовом портрете пользователя;

• данные о финансовом инструменте;

• данные пользовательских оценок.

Для решения поставленной задачи наиболее подходит гибридный вид рекомендательной системы, которая позволит учесть все доступные данные и избавится от ряда проблем, например, от проблемы «холодного старта».

В ходе разработки архитектуры гибридной рекомендательной системы различные идеи были совмещены в одну систему, имеющую несколько этапов работы. На каждом этапе используются различные подходы, методы и алгоритмы, которые наиболее подходят для решения поставленной задачи.

Архитектура гибридной системы состоит из различных этапов:

1) Генерация начального списка возможных рекомендаций на основе похожести пользователей;

2) Расширение этого списка похожими финансовыми инструментами;

3) Прогнозирование рейтингов для финансовых инструментов;

4) Сортировка по рейтингу;

5) Усечение отсортированного списка.

Таким этапы обоснованы следующими причинами:

• на начальном этапе формируется список рекомендаций, который не требует выставление рейтингов (решение проблемы «холодного старта»). По этой причине могут использовать системы типа Top N, которые сложно использовать в более обобщенных случаях. И, так как верхняя граница рекомендаций выбирается только исходя из вычислительной сложности системы, то она может быть очень высока. Благодаря этому, отпадает необходимость строго следить за числом выдаваемых рекомендаций;

Библиографическое описание: Пилявская И.М. РАЗРАБОТКА АРХИТЕКТУРЫ ГИБРИДНОЙ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ ДЛЯ ФИНАНСОВОГО АССИСТЕНТА // Universum: технические науки : электрон. научн. журн. 2022. 5(98). URL: https://7universum.com/ru/tech/archive/item/13566

• в обычных подходах к построению рекомендательных систем для формирования и выдачи рекомендации необходимо вычислять рейтинговую оценку для каждого объекта, число которых непрерывно растет и требует все больше и больше вычислительных ресурсов. Этапы 1-3 решают эту проблему, так как там не требуются прогнозы;

• для каждого из этапов можно использовать различные метрики оценки качества.

Для реализации рассматриваемой архитектуры необходимо определенные требования к данным.

Первый этап требует функции сравнения профилей пользователей

з1тизег (щ, иД где /,/ - номера пользователей.

Второй этап требует функции сравнения профилей финансовых инструментов з1т1пзЬгитепЬз (иI, щ), где /,/ - номера финансовых инструментов.

На третьем этапе требуются векторные представления профилей пользователей и финансовых инструментов. Так как неструктированные данные легко поддаются сравнению, но тяжело преобразуются в вектора, то можно их использовать на первых двух этапах, а на этом - нет.

Для учета оценок пользователей необходима матрица рейтингов И = {г^} размера пизегз х Птзьгитешз, где п^егз - количество пользователей, ПтБ^таМБ - количество финансовых инструментов, Гу - оценка, поставленная /-ым пользователем/-ому инструменту.

На этапе формирования начального списка возможных рекомендаций используются данные по фи-

нансовому портрету пользователей и данный рейтингов, чтобы создать как можно больший список возможных рекомендаций.

В результате должно быть множество финансовых инструментов I1 = i1, i2, ..., in. Эти инструменты будут рекомендоваться пользователю в первую очередь.

Для обработки данных матрицы рейтингов R будет использоваться item-based коллаборативная фильтрация.

Метрика и составление векторов товаров будут использованы те же, что и в случае сравнения пользователей.

Сначала формируется список IibCF - потенциально рекомендованных финансовых инструментов, в который добавляются товары с очень высоким порогом схожести.

Item-based коллаборативная фильтрация отлично подходит для этого по ряду причин:

• легкость реализации;

• очень высокая скорость работы в режиме realtime;

• формируются не тривиальные рекомендации;

• используется разреженность данных;

• подход проверен во множестве исследований.

Проблема «холодного старта» будет решена на

других этапах гибридной системы.

Информация о финансовом типе пользователя определяется после анкетирования и математически формализуется в вектор оценок PersonalityTypes. Подобие пользователей вычисляется в два этапа:

• Подобие по финансовому типу пользователей u1 и u2 вычисляется по косинусному сходству (1).

simPersonalityTypes (и1, и2)

£j=1PersonaiityTypesulj • PersonalityTypesu2j Xj-^PersonalityTypesulj2 PersonalityTypesu2j2

(1)

где т - количество экспертных оценок (т = 5);

Реп,опаИ(уТуре^,и1/ - /-ая оценка финансового портрета пользователя ии.

• Каждому выбранному параметру профиля соотносится его числовое значение индекса финансовой грамотности на основе данных таблиц 3, 4, 5, 6. Вектор значений профиля пользователя SimProfile

состоит из нормализованных значений индекса финансовой грамотности. Подобие по профилю пользователя, вычисляется аналогично подобию по финансовому типу (2):

simProfile (и1, и2) = ■

Ej=1 simProfileulj • simProfileu2j 12 ji simProfileul j2 simProfileu2 j2

(2)

где т - количество различных данных о профиле пользователя (т = 5);

з1тРго1еиг/ -/-ое нормализованное значение индекса финансовой грамотности пользователя ии.

Окончательное подобие вычисляется как (3):

з1тизег(щ, и2) = к1 • з1тРегзопаШуТурез(щ, и2) + к2 • Б1тРго/Ие(и1, и2) ,

где к1 + к2= 1.

Таким образом, формируется список финансовых инструментов If. Для рекомендации пользователю u1 выбирается n (параметр алгоритма) таких, у кого simUser (и1,и2) максимальна.

Затем для n ближайших пользователей формируется множество финансовых инструментов Ifi, которые получили положительные оценки от этих пользователей.

Благодаря такому подходу используются следующие достоинства:

• легкость реализации;

• очень высокая скорость работы в режиме real-time;

• используется финансовый портрет пользователей;

• вместе с Item-based коллаборативной фильтрацией решается проблема «холодного старта» для пользователей;

• параметр п подбирается легко и не нуждается в аккуратной подборке.

Ко множеству финансовых инструментов Ь добавляются все финансовые инструменты, получившие положительную оценку от пользователя - 1шег.

В итоге, множество рекомендованных финансовых инструментов Ь формируется объединением множеств из предыдущих шагов, а именно ¡¿ЬСр и

и ^изег.

Последний элемент, влияющий на список рекомендаций - данные о финансовых инструментах.

Для каждого инструмента I Е Сформируется множество Simi из п (параметр алгоритма) финансовых инструментов с наибольшим значением Б1тРгойис1(11, ¿2). Где подобие между финансовыми инструментами вычисляется двумя этапами:

• Подобие между финансовыми профилями (4)

FinEvaluation(i1,i2) = \Z™=1(FinEvaluation (i1) — FinEvaluation (i2))

(4)

где т - количество финансовых инструментов • Подобие между текстовыми корпусами (5)

simTag(i1, i2) =

X1J=1s imT ад 11j • s imT ag 12 j

simTagil]2 Ylj=i simTagi2¡2

(5)

где т - количество финансовых инструментов Окончательное подобие вычисляется как (6):

2

simProduct(i1, i2) = k1 • simFinEvaluation(i1, i2) + k2 • simTag(i1, i2)

(6)

где k1 + k2 = 1

По итогу создается множество финансовых инструментов 12 =

Достоинства такого подхода:

• легкость реализации;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• решение проблемы «холодного старта» для финансовых инструментов;

• используются данные профиля финансовых инструментов

• параметр п подбирается легко и не нуждается в аккуратной подборке.

В соответствии с методами, описанными выше, мы получаем соседние пользовательские наборы, оценки пользователей и оценки финансовых инструментов. На входе подается множество 12 =

12,... Лп], а на выходе должно получиться множество пар финансовый инструмент - рейтинг: = {(h,^>~l), (12,Г2),.,(1\12\,Г1,21)}.

Главным достоинством разрабатываемой технологии является то, что множество 12 достаточно небольшое и размер его можно регулировать.

Поэтому для прогнозирования рейтинга можно использовать достаточно вычислительно-сложные системы, которые все равно будут предлагать рекомендации быстро.

Основной сложностью при прогнозировании рейтингов является необходимость использовать

все данных, полученных на предыдущих этапах, а именно: профиля пользователей, профиля финансовых продуктов и рейтинги.

Таким образом, формула прогноза рейтинга пользователя выглядит следующим образом:

• Прогнозирование рейтинга пользователя рассчитывается на основе весовой функции и оценок и-ближайших пользователей (7)

^ £уеЦ 51тЦ5ег(и,у)*(ЯР}1-ЯР)

иЛ = и Т,УЕи51ти5ег(и,г) , (7)

• Прогнозирование рейтинга продукта (8)

р, _ + Zae,simProduct(m,a)*(Ru a-Ra) m'j т ZaelsimProduct(m,a) , ( )

• Прогнозирование рейтинга финансового инструмента m для пользователя и (9)

Ru,m = Л • Ru,i + (1 — Л) • Rmj

(9)

где Я - коэффициент объединенных значений рейтинга.

№ 5 (98)

А1

В качестве рекомендуемого набора используются первые несколько элементов с высшими оценками в прогнозируемых рейтингах.

В результате данной работы удалось проработать архитектуру гибридной рекомендательной системы для решения задачи рекомендаций финансовых

май, 2022 г.

инструментов и стратегий для финансового ассистента.

Архитектура предусматривает использование всех необходимых данных, а так же решает проблему «холодного старта».

Список литературы:

1. Intelligent Virtual Assistant Market Size, Share & Trends Analysis Report By Product (Chatbot, Smart Speakers), By Technology, By Application (BFSI, Healthcare, Education), By Region, And Segment Forecasts, 2020 - 2027 Grand View Research - 4/1/2020 - 130 Pages - ID: GV16217098 URL: https://www.marketresearch.com/Grand-View-Research-v4060/Intelligent-Virtual-Assistant-Size-Share-13187162/.

2. Markets R.A. Intelligent Virtual Assistant (IVA) Market - Growth, Trends, and Forecast (2020 - 2025) [Электронный ресурс]. - Режим доступа: https://www.researchandmarkets.com/reports/4845914/intelligent-virtu-alassistant-iva-market (дата обращения: 05.02.2021).

3. Statista - Personal Finance [Электронный ресурс]. - Режим доступа: https://www.statista.com/outlook/dmo/fintech/personal-finance/worldwide (дата обращения: 05.01.2021).

4. Personal Finance Topics: Best Personal Finance Apps [Электронный ресурс]. - Режим доступа: https://www.the-balance.com/best-personal-finance-apps-4170650 (дата обращения: 10.01.2021).

5. Olivia AI [Электронный ресурс] - https://www.olivia.ai (Дата обращения: 22.01.2021).

6. You Need a Budget Features [Электронный ресурс] - https://www.youneedabudget.com/features/ (Дата обращения: 22.01.2021).

7. Personal Capital Wealth Management [Электронный ресурс] - https://www.personalcapital.com/wealth-manage-ment (Дата обращения: 22.01.2021).

8. Prism by BillGo Product Description [Электронный ресурс] - https://www.prismmoney.com/ (Дата обращения: 22.01.2021).

9. Hello Digit, Inc. [Электронный ресурс] - https://digit.co (Дата обращения: 22.01.2021).

10. Spendee Pricing [Электронный ресурс] - https://www.spendee.com/pricing (Дата обращения: 22.01.2021).

11. EveryDollar Product Description [Электронный ресурс] - https://www.everydollar.com (Дата обращения: 22.01.2021).

12. Royal Bank of Canada Website [Электронный ресурс] -https://www.rbcroyalbank.com/mobile/feature/nomi/index.html (Дата обращения: 22.01.2021).

13. Hornyak A. 2015.: Attitudes and Competencies Among High School Students Regarded as Potential Banking Clients. PhD Thesis. Sopron: University of West-Hungary, Faculty of Economics.

14. Rosenberg M.J. 1960.: An analysis of affective-cognitive consistency. In: M.J. Rosenberg - C.I. Hovland - W.J. McGuire - R.P. Abelson - J.W. Brehm (ed.): Attitudee organization and change. New Haven: Yale University Press.

15. Goldberg, H. - Lewis, R. 1978.: Money Madness. London: Springwood Books.

i Надоели баннеры? Вы всегда можете отключить рекламу.