Вестник Института экономики Российской академии наук
4/2020
ФИНАНСЫ, ДЕНЕЖНОЕ ОБРАЩЕНИЕ
И КРЕДИТ
И.Л. КИРИЛЮК
научный сотрудник Центра институционально-эволюционной экономики и прикладных проблем воспроизводства ФГБУН Институт экономики РАН
МЕТОДЫ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ И РЕГУЛИРОВАНИЕ ЦИФРОВОЙ ТРАНСФОРМАЦИИ ФИНАНСОВОГО СЕКТОРА В РОССИИ И В МИРЕ1
В статье рассматриваются различные возможности применения методов искусственного интеллекта, получения и обработки больших массивов данных, построения моделей в финансовом секторе, в деятельности центральных банков, проблемы, которые при этом возникают. Обсуждаются особенности нормативного регулирования в этой области, влияние финансовых технологий на перспективы трансформации отрасли.
Ключевые слова: Банк России, кредитно-денежная политика, финтех, искусственный
интеллект, машинное обучение, большие данные.
JEL: C10, C80, E42.
DOI: 10.24411/2073-6487-2020-10048
1. Введение
В настоящее время так называемые технологии Big Data - получения и обработки больших массивов данных - применяются многими коммерческими банками в России и за рубежом, центральными банками разных стран [1; 2], и Банку России, для того, чтобы достойно выгля-
1 Работа выполнена при финансовой поддержке РФФИ, грант № 20-510-00009 Бел_а «Трансформация системы монетарного регулирования России и Беларуси в условиях цифровизации экономики».
деть в такой конкурентной среде, нужно прилагать усилия в освоении новейших методов анализа и обработки больших объемов данных.
Еще в 70-х годах XX в. происходили попытки применять методы искусственного интеллекта в экономике, в том числе, в банковском деле. В СССР разработками методов интеллектуального анализа данных активно занимались в институтах Академии наук (например, в Вычислительном центре, в Институте проблем управления и т. д.). Во второй половине XX в. советским кибернетиком академиком В. Глушковым продвигался проект «Общегосударственная автоматизированная система учета и обработки информации» - ОГАС [3], который предполагал централизованный сбор данных, характеризующих экономику страны, активное использование математики, статистики, искусственного интеллекта в управлении народным хозяйством по единым стандартам. Проект не был воплощен в том масштабном виде, в котором предлагался инициаторами, но его методология оказала заметное влияние на организацию экономики страны. В Чили подобный проект, называемый Киберсин, играл определяющую роль в период правления Сальвадора Альенде с 1970 по 1973 гг. Проектом руководил один из крупнейших специалистов по системному анализу, автор «модели жизнеспособной системы» Стаффорд Бир [4]. Проект прервался в связи с государственным переворотом, но некоторый позитивный опыт за время его существования был получен. Концепции, лежащие в основе ОГАС и Киберсин, не получили в достаточной степени воплощение в тот период, когда они были предложены, прежде всего потому, что вошли в конфликт с традиционными социальными институтами. В США подобные идеи по управлению обществом при помощи искусственного интеллекта популяризовал, например, футуролог Жак Фреско. Перечисленные проекты предполагают не только исследование экономики посредством математического моделирования, но и непосредственное влияние математических моделей и расчетов на функционирование экономики. Они дали интересный опыт, который стоило бы не забывать и развивать и в настоящее время, но вспоминают о них не часто. Очевидно это связано с тем, что данные проекты разрабатывались для плановой, социалистической экономики, а в настоящее время доминирует экономика рыночная.
Однако в последние десятилетия и в странах с рыночной экономикой интерес к использованию искусственного интеллекта в управлении постоянно возрастает. Исследованиями и разработками в этом направлении активно занимаются коммерческие структуры, в частности, банки и компании в области информационных технологий. Все большее внимание этой теме уделяют государственные финансовые организации, в том числе, Банк России,
выпуская аналитические обзоры по этой теме, например, [5]. Тем не менее, накопление и обработка данных в настоящее время существенно менее централизованы, чем это предлагалось в рамках проектов ОГАС и Киберсин.
Далее будут описаны особенности работы с большими данными в финансовой отрасли, модели и методы обработки данных с использованием технологий искусственного интеллекта, направления их применения, возникающие при этом проблемы и риски, возможные пути решения проблем, а также особенности государственного регулирования в этой области.
2. Накопление, хранение и инструменты обработки данных
Коммерческие банки накапливают существенно большее количество данных по сравнению со многими другими видами организаций, в том числе, по сравнению с другими финансовыми организациями, такими, как некредитные финансовые организации и стартапы в области финансовых технологий (финтеха). И они заинтересованы в обработке этих данных, в первую очередь с целью обеспечения своей устойчивости и получения прибыли.
По данным ведущего поставщика информации и консультационных услуг на рынке IT, телекоммуникаций и потребительской техники International Data Corporation (IDC) доходы от решений для больших данных и бизнес-аналитики будут расти в течение периода прогноза на 2018-2022 гг. с пятилетним совокупным годовым темпом роста в размере 13,2%. IDC ожидает, что к 2022 г. выручка от этого направления по всему миру составит 274,3 млрд долл. [6].
Существуют также оценки и прогнозы развития рынка больших данных (Big Data) для России. По информации Анны Серебряниковой, президента Ассоциации участников рынка больших данных (АБД), на март 2019 г. по разным оценкам, он составлял от 10 до 30 млрд руб. К 2024 г. объем достигнет 300 млрд руб., согласно прогнозу Ассоциации, а рост выручки всех индустрий в России за счет использования больших данных за этот период может достичь 0,5-1,5% ВВП [7].
Задача извлечения пользы из данных не является тривиальной. Они могут сохраняться как для вычислений, значение результатов которых для выработки стратегии банков уже понятно, так и на тот случай, если полезность этих данных станет понятна позднее. При этом важно, чтобы прибыль от применения полезных на данный момент данных окупала бы с избытком затраты на хранение остальных. Кроме того, для получения адекватной информации из данных должен выполняться ряд требований к их качеству: например, данные
должны иметь приемлемую точность, быть достоверными, актуальными, доступными для обработки.
Согласно [8] объем накапливаемых человечеством больших данных растет экспоненциально и в период 2018-2025 гг. должен увеличиться с 33-1021 до 175-1021 байт. Стоимость хранения данных постоянно снижается, при этом растет частота взаимодействия клиентов с банками, что увеличивает скорость накопления финансовых данных. Короткий (пока) период их интенсивного накопления затрудняет анализ долгосрочной экономической динамики с их использованием. Традиционные экономические модели разрабатывались и верифицировались с учетом использования на относительно малых наборах данных, но теперь ситуация существенно меняется, растет потребность в моделях, описывающих большие наборы данных.
Возможность накапливать большие данные зависит не только от уровня технологий, но и от численности населения стран, а также от количества клиентов организаций. Поэтому, например, Китаю, население которого почти в 10 раз больше, чем население России, легче быть в числе лидеров в этом процессе. Важным фактором является уровень понимания населением ценности данных. Поскольку финансовые организации заинтересованы в получении не только внутренних, но и внешних данных, формируется рынок продажи и обмена данными. Количество и разнообразие получаемых данных также увеличивается при развитии на базе банков экосистем с разнообразными дополнительными сервисами. Это позволяет банкам иметь дело с актуальными данными, поскольку в развивающейся мировой экономике постоянно происходят изменения, и важно делать модели с учетом наиболее свежих данных.
Накапливать данные в настоящее время существенно проще, чем их обрабатывать. Объем накапливаемых данных растет более быстрыми темпами, чем производительность процессоров. Обработка больших объемов данных, или применение таких часто требовательных к вычислительным ресурсам методов, как, например, методы Монте-Карло, широко используемые в рамках машинного обучения, и предполагающие генерацию большого числа симулированных данных, иногда требуют проведения параллельных вычислений на суперкомпьютерах.
Для ускорения выполнения определенных математических задач могут быть полезны вычисления с помощью интегральных микросхем с особыми специализированными архитектурами (application-specific integrated circuit - ASIC). Эти специализированные микросхемы могут решать меньшее число задач, чем обычные компьютеры, но решают их существенно быстрее. Наиболее известно использование таких микросхем для майнинга криптовалют, однако, этой сферой их применение далеко не ограничивается. Например, Google разрабатывает ASIC для задач машинного обучения [9].
3. Модели, применяемые в финансовой отрасли и машинное обучение
В настоящее время в финансовой отрасли (в том числе Центральными банками) используется разнообразный математический аппарат. Широко распространенными моделями являются динамические стохастические модели общего равновесия (для их обозначения часто используется английская аббревиатура ОБСЕ). Они базируются на принципах микроэкономической теории и в состоянии учесть рациональные ожидания экономических агентов относительно будущего развития экономики. С ними конкурируют эконометрические модели векторной авторегрессии (обозначающиеся также английской аббревиатурой УЛИ). Кроме того, применяется имитационное моделирование [10]. Наличие множества альтернативных подходов обусловлено тем, что макроэкономические системы слишком сложны, чтобы надеяться их описать конкретной моделью, например, ЭБСЕ настолько же точно, насколько например механика описывает движение космических кораблей. Четкой границы между машинным обучением и другими подходами нет, возможны комбинированные варианты применения разных подходов.
Машинное обучение возникло на базе синтеза методов математической статистики и математической теории оптимизации. Это направление в рамках теории искусственного интеллекта, описывающее модели, способные обучаться на данных. Считается, что методы машинного обучения имеет смысл применять в тех случаях, когда не известны достаточно точные теоретически обоснованные модели, описывающие изучаемые процессы. При этом применимость этих методов универсальна. Они используют как строго обоснованные математические теории, так и эвристические приемы. Наиболее известным направлением в рамках машинного обучения являются нейросети. Популярным в последние годы является глубокое обучение, основанное на использовании особых многослойных нейросетей. Однако, ней-росетями набор алгоритмов далеко не исчерпывается, и существуют методы, работающие в определенных ситуациях лучше нейросетей. Например, нейросети требуют для своего обучения достаточно больших объемов данных (как правило, не меньше тысяч примеров), если же доступные объемы недостаточно велики, применяются другие методы. Кроме того, недостаток нейросетей заключается в том, что, как правило, не ясно, каким образом их использование приводит к нужным результатам. Альтернативные же методы, например, метод, называемый «решающий лес», являются более интерпретируемыми.
Популярным подходом является использование для решения задач сразу нескольких альтернативных методов машинного обучения, или
комбинирование их в более сложные алгоритмы для увеличения точности результатов. Даже на основе комбинации относительно слабых по точности алгоритмов можно создать достаточно точный алгоритм, если их ошибки слабо коррелируют между собой.
Создание алгоритмов машинного обучения само по себе является автоматизируемым процессом. Разработки в области автоматического машинного обучения (AutoML) осуществляет, например, компания Google [11].
4. Модельные риски
Рост популярности и сфер применения методов искусственного интеллекта при сложности соответствующей теории и дефиците квалифицированных специалистов увеличивает модельные риски -такие риски, которые непосредственно определяются применением математических алгоритмов. Характерной особенностью использования методов интеллектуального анализа данных является то, что они применяются специалистами в самых различных областях, но при этом требуют высокой квалификации и в области искусственного интеллекта, а также в области математической статистики и ряда других разделов математики, чтобы учесть все предпосылки, при которых возможно корректное использование каких-либо методов. Поэтому часто случается, что получаемые даже в научных публикациях результаты являются некорректными именно из-за некорректного использования математических методов. Рост популярности методов машинного обучения не только в науке, но и в бизнесе, увеличивает возможность возникновения информации, полученной в результате некорректных расчетов. Однако, наиболее успешные фирмы заинтересованы, и в состоянии нанимать для разработки алгоритмов и проведения нужных им вычислений высококвалифицированных специалистов.
Особенностью многих экономических, и финансовых показателей является то, что их распределения по величине существенно отличаются от нормального (гауссова) распределения, и порой проблематично установить конкретные аналитические формулы таких распределений. Увеличение вычислительных мощностей компьютеров позволило для таких случаев широко внедрить в практику методы непараметрической статистики, играющие существенную роль в машинном обучении. В тех же случаях, когда известно, что величины распределены по закону, достаточно хорошо аппроксимирующемуся нормальным, или другим известным распределением, лучше работают параметрические методы, использующие конкретные формы распределений. Однако нормальность распределений часто предпо-
лагается там, где она на самом деле не имеет место, или, по крайней мере, не доказана с нужным уровнем достоверности.
Особые сложности возникают, когда какие-либо показатели описываются распределениями, образно называемыми «распределениями с толстыми хвостами» (типичный представитель - распределение Ципфа-Парето), то есть, такими распределениями, для которых вероятность возникновения аномально отклоняющихся от типичных значений показателя высока, и ей нельзя пренебречь. Примером является распределение населения земли по доходам.
Одной из основных проблем в машинном обучении является переобучение, когда при избыточном количестве параметров модель начинает обучаться не на закономерностях, а на шуме. В задачах регрессии также надо учитывать явление мультиколлинеарности, когда часть признаков сильно коррелируют между собой, что уменьшает точность вычисления регрессионных коэффициентов. Кроме того, надо иметь ввиду, что при большом количестве обрабатываемых данных увеличивается вероятность получения каких-либо аномалий, которые можно принять за закономерности, но на самом деле они являются артефактами (это называется проблемой множественного тестирования).
Чтобы уменьшить риски, применяемые методы сначала отрабатываются банками на таких задачах, где ошибки не могут привести к серьезным последствиям. Но постепенно происходит рост сложности задач, доверяемых искусственному интеллекту, что может повлечь обострение проблемы модельных рисков.
5. Применение технологий искусственного интеллекта в финансовой сфере
Методы искусственного интеллекта и машинного обучения могут применяться для обработки самых различных типов данных. Например, в обработке текстов и голосовых сообщений при работе с клиентами, в обработке потоков цифровых данных о деятельности коммерческих банков. Искусственный интеллект используется финансовыми организациями в чат-ботах, в кредитном скоринге (то есть, в оценке кредитоспособности клиентов), в контроле за наличностью в банкоматах, в определении целесообразности открытия новых отделений и их оптимального расположения, в оценке деятельности сотрудников банков, при найме новых сотрудников, при биометрической идентификации клиентов, в борьбе с мошенничеством и т. д.
Распространено утверждение, что в банковском секторе искусственный интеллект может заменить только малоквалифицированные должности, тех, где не требуется принятие самостоятельных решений, однако, во-первых, в банках не слишком много реально
креативной деятельности, во-вторых, уже сейчас, например, при ско-ринге искусственный интеллект принимает решения. С другой стороны, использование искусственного интеллекта создает дополнительные возможности для оппортунистического поведения сотрудников-людей, которые могут например отказывать в клиенту в обслуживании, ссылаясь на то, что так «решил» искусственный интеллект, даже когда это не является правдой, или когда в их власти принять решение самостоятельно.
Важным для коммерческих банков является развитие моделей прогнозирования отзывов лицензий центральными банками. Такие модели используются на практике также российским агентством по страхованию вкладов. В ранних работах для решения этих задач использовался линейный дискриминантный анализ. В основной массе известных автору работ применены панельные логит-модели, также применяются модели множественного выбора [12]. Однако в последние несколько лет появились работы, где задача решается с помощью более широкого спектра методов машинного обучения. Так, в [13] показано, что очень высокой прогнозной силой обладает так называемый алгоритм «случайного леса». В [14] применена технология вычисления коллективных решений по наборам алгоритмов распознавания. Наряду с логистической регрессией там используется алгоритм вычисления оценок, три варианта «решающего леса» и метод статистически взвешенных синдромов. Разработанная в [14] методология позволяет не только делать прогноз, но и выявлять показатели, наиболее тесно связанные с решением об отзыве лицензии.
Эффективная монетарная политика во многом обуславливается умением с высокой точностью предсказывать инфляцию. В последние несколько лет вышел ряд публикаций об использовании различных методов машинного обучения для прогнозирования инфляции [15-18]. Эти методы позволяют в частности учесть наличие нелинейных связей между переменными и инфляцией. Применение методов машинного обучения с использованием больших данных позволяет более детально понять, какие именно показатели в наибольшей степени обуславливают будущую инфляцию. Точность предсказания зависит как от используемой модели, так и от количества доступных данных, растущего, например, за счет того, что становится удобнее использовать интернет для отслеживания цен на товары в реальном времени. Можно прогнозировать инфляцию, исследуя поисковые запросы [19]. Показано, что применение некоторых методов машинного обучения увеличивает точность прогнозирования по сравнению с применением более традиционных методов. При этом эффективность методов может различаться для краткосрочного и долгосрочного прогнозирования, а также зависит от конкретного набора используемых данных.
6. Нормативное обеспечение работы с данными в финансовой отрасли
Инновационная активность коммерческих банков определяется не только величинами процентных ставок, устанавливаемыми Центробан-ками, но также разного рода нормативными документами. Поскольку деньги играют основополагающую роль в функционировании и развитии общества, финансовая сфера на мировом уровне является одной из самых зарегулированных. Тем не менее, в настоящее время существует некоторый дефицит в стандартах и в законодательстве в области работы с данными, разработки и применения алгоритмов, поскольку это активно развивающееся направление. Существенной трудностью является то, что в новых отраслях финтеха нормативы различаются и по странам, и между организациями. При этом растет число международных транзакций.
Для работы с данными разрабатывается специальная стандартизованная методология. Широкой популярностью пользуется стандарт СШБР-ЭМ. Он определяет не только методы моделирования, но и особенности понимания бизнес-целей, изучение и подготовку данных, оценку, внедрение результатов для увеличения эффективности компаний. Существуют и российские нормативные документы2, определяющие работу с данными применительно к финансовой сфере.
Процесс перехода от бумажной к цифровой документации медленный, накоплено большое количество бумажных документов, которые на практике затруднительно использовать. Стоит вопрос о целесообразности перехода от отчетности коммерческих банков на основе форм к отчетности на основе данных, что может увеличить доступ регуляторов к не агрегированным данным. Это может одновременно избавить коммерческие банки от чрезмерной бюрократической нагрузки и увеличить актуальность информации, которой располагают центробанки. Однако, при этом возникает вопрос о том, какие данные, алгоритмы являются интеллектуальной собственностью коммерческих банков, которые они могут не раскрывать посторонним лицам, в том числе, регуляторам. При работе с данными остается открытым вопрос о том, где проходит граница таких понятий, как персональные данные, банковская тайна, тайна связи. Принадлежат ли анонимные данные социальных сетей, представляющие интерес для банков пользователям, или сетям. Особенно эта проблема
2 В качестве норматива по работе с финансовыми данными, используемого в России, можно привести, например, Положение Банка России от 06.08.2015 № 483-П (ред. от 15.04.2020) «О порядке расчета величины кредитного риска на основе внутренних рейтингов» (вместе с «Требованиями к качеству данных, используемых банками для создания и применения моделей количественной оценки кредитного риска для целей расчета нормативов достаточности капитала») (зарегистрировано в Минюсте России 25.09.2015 N 38996).
касается биометрических данных, которые уже сейчас используются банками, получившими на это соответствующие лицензии.
В области использования искусственного интеллекта новой проблемой является ответственность за возникновение сбоев, аварий. Если аварийная ситуация возникла по причине применения технологий искусственного интеллекта, труднее определить виновных, чем в случаях, когда такие проблемы возникают непосредственно по вине человека. Для повышения его надежности при использовании, искусственный интеллект очевидно предпочтительно развивать, используя парадигму Open source, чтобы в его разработках могло участвовать больше специалистов. По этим же причинам целесообразно продвигать концепции открытых данных и размещения научных публикаций по рассматриваемым направлениям в открытом доступе.
Чтобы успешно регулировать деятельность финансовых организаций, центробанки должны отслеживать фактически в реальном времени данные и корректировать модели на их основании, поскольку темпы изменения факторов, влияющих на макроэкономику, в последние годы все более ускоряются. В новых моделях нужно учитывать развитие альтернативных банковскому способов кредитования. Велика вероятность, что в скором будущем существенную роль в экономике будут играть криптовалюты, что может ослабить возможности управления финансовой сферой для центральных банков, и к этим рискам нужно быть подготовленными.
Издавая законы и распоряжения, регулятору следует учитывать, что применение искусственного интеллекта в банковском секторе, финансовые технологии - направления относительно новые, еще не установившиеся, активно развивающиеся. Поэтому, целесообразно внимательно наблюдать за развитием этих направлений, не допуская при этом их чрезмерной зарегулированности. Понимая это, Банк России создал так называемую регулятивную песочницу, в рамках которой можно апробировать новые прогрессивные технологии без риска нарушений действующего законодательства и получения соответствующих санкций (при условии уведомления клиентов о рисках и ограничения этих рисков) [20].
7. Заключение
Не претендуя на полноту, кратко резюмируем значимые технические и социальные проблемы, возникающие в процессе разработки и применения технологий искусственного интеллекта в финансовой отрасли, а также возможные (с нашей точки зрения) способы их решения.
Проблемы, возникающие при разработке и использовании моделей:
- трудности получения полезных данных, часть из которых являются доступными лишь узкому кругу лиц (могут быть преодо-
лены договоренностями о совместном использовании данных, выкладыванием данных в открытый доступ);
- слишком медленная скорость обработки накапливаемых данных (скорость можно увеличивать посредством применения распределенных вычислений, а также посредством разработки и использования микросхем типа ASIC, специализированных конкретно для задач финансовой отрасли);
- непрозрачность работы некоторых алгоритмов (характерна, например, для нейросетей), то есть, трудность в понимании того, как именно алгоритмы находят решение задач. Проблема может решаться посредством разработки и использования при необходимости более прозрачных алгоритмов;
- недоступность исходного кода моделей по причинам проприетарности (решается переводом в моделей в Open source, или созданием конкурирующих моделей);
- применение устаревших алгоритмов (решается сравнительными исследованиями эффективности алгоритмов, соревнованиями альтернативных алгоритмов в решении задач);
- некорректное применение алгоритмов, модельные риски (решается посредством выявления типовых ошибок и повышением грамотности исследователей). Здесь могут оказаться полезны заимствования опыта из других предметных областей, использующих интеллектуальный анализ данных, и математическую статистику. Например, В.П. Леоновым [21] на основании 1562 источников (диссертаций, статей и т. д.) изучались типовые ошибки применения статистики в медицине, в результате чего им сделан вывод, что только около 10% клинической информации подвергается корректному статистическому анализу. В области экономики подобные исследования автором не найдены, хотя и представляются весьма актуальными.
Социальные и экономические проблемы, возникающие при внедрении технологий искусственного интеллекта:
- рост социальной неоднородности (обусловлено тем, что те, кто уже имеют данные и умеют зарабатывать на них проще могут получать дополнительные данные и финансы, чем те, кому приходится начинать с нуля). Аналогично: тот факт, что преимущества в доступе к данным, вычислительным мощностям и к алгоритмам имеют крупные компании, ставит под вопрос перспективы выживания существующих и появление новых малых компаний. Уменьшить проблему могут меры по государственной поддержке малых компаний, предоставление по возможности важных для их развития данных в открытый доступ;
- ответственность за аварии, произошедшие в системах, использующих технологии искусственного интеллекта (общего рецепта
здесь видимо на данный момент нет, многое зависит от конкретных ситуаций, хотя развитие технологий в целом должно приводить к уменьшению аварийности);
- нехватка квалифицированных специалистов в области интеллектуального анализа данных. В условиях дефицита квалифицированных кадров банки активно проводят конкурсы, соревнования по обработке данных, хакатоны с целью выявления специалистов и привлечения их к сотрудничеству. Очевидным способом решения проблемы является внедрение соответствующих дисциплин в образовательный процесс. Кроме того, развитие автоматизированного машинного обучения AutoML могло бы ослабить требования к квалификации сотрудников, работающих в области обработки данных. При этом, заменять многие функции, не требующие от человека особой квалификации, искусственный интеллект уже научился. Более того, существует тренд постепенного освоения им все более квалифицированной работы. Обсуждается даже перспектива замены центральных банков на системы искусственного интеллекта с соответствующими функциями [22];
- рост безработицы из-за автоматизации процессов. Так, например, в Банке Америки сокращения к 2018 г. составили примерно треть сотрудников, около 100000 человек [23].Частично проблема может быть решена посредством увеличения числа рабочих мест в специальностях, связанных с интеллектуальным анализом данных, поскольку востребованность специалистов в этой области в настоящее время велика;
- конкуренция банковского сектора с криптовалютами и с альтернативными формами финансовых организаций, со стартапами в области финтеха, с такими крупными компаниями, как Facebook, Google, Amazon, Apple и др. Одним из решений является создание банками экосистем. В Тинькофф-банке и Сбербанке на уровне руководства поднят вопрос о том, что есть резон отказаться от позиционирования себя в качестве банков, поскольку сфера их деятельности постепенно становится существенно более универсальной [24].
Таким образом, развитие технологий искусственного интеллекта может качественно улучшить ситуацию в финансовой отрасли, но их разработка и внедрение требуют большой аккуратности. Сейчас намного более высокий уровень технологий, чем был в те времена, когда происходили попытки воплощения проектов ОГАС и Кибер-син, гораздо выше скорость обработки данных, ниже стоимость их хранения, однако, преимущества технологий искусственного интеллекта в управлении экономикой и финансами по прежнему используются далеко не в полной мере. В рамках рыночной экономики труднее реализовывать большие проекты объединенными в масштабах стран
и мира силами, организации вынуждены решать проблемы, в том числе, возникающие при использовании технологий искусственного интеллекта своими силами в конкурентной среде, и от государств требуется помощь в координации этих процессов для блага общества3.
ЛИТЕРАТУРА
1. Chakraborty C, Joseph A. Machine learning at central banks. Staff Working Paper. 2017. No. 674, September.
2. The use of big data analytics and artificial intelligence in central banking. IFC Bulletin No 50. May 2019. Proceedings of the IFC - Bank Indonesia International Workshop and Seminar on "Big Data for Central Bank Policies / Building Pathways for Policy Making with Big Data" Bali, Indonesia, 23-26 July 2018.
3. Глушков В.М., Валах В.Я. Что такое ОГАС? Серия: Библиотечка Квант. Вып. 10. М.: Наука, 1981.
4. Beer S. Brain of the Firm; Allen Lane, The Penguin Press, London, Herder and Herder, USA, 1972.
5. Обзор регулирования финансовых рынков. №5. 18.11.2016-31.01.2017. Москва, Банк России.
6. IDC Forecasts Revenues for Big Data and Business Analytics Solutions Will Reach $189.1 Billion This Year with Double-Digit Annual Growth Through 2022.www.idc. com/getdoc.jsp?containerId=prUS44998419 (дата обращения: 01.06.2020).
7. Березина Е. Рынок больших данных за пять лет вырастет в 10 раз. rg.ru/2019/03/25/ rynok-bolshih-dannyh-za-piat-let-vyrastet-v-10-raz.htm.l (дата обращения: 01.06.2020).
8. Reinsel D, Gantz J., Rydning J. Data age 2025. The Digitization of the World. From Edge to Core. An IDC White Paper - #US44413318.
9. Ализар А. Специализированный ASIC от Google для машинного обучения
в десятки раз быстрее GPU. habr.com/en/post/402955 (дата обращения: 01.06.2020).
10. Salle I, Yidizoglu M., Senegas M. Inflation targeting in a learning economy: An ABM perspective // Economic Modelling. 2013. August. 34. Pp. 114-128.
11. Андерсон Дж. «Скайнет» уже рядом: Google создает искусственный интеллект, способный к самостоятельному развитию. oko-planet.su/science/scienceday/583845-skaynet-uzhe-ryadom-google-sozdaet-iskusstvennyy-intellekt-sposobnyy-k-samostoyatelnomurazvitiyu.html (дата обращения: 01.06.2020).
12. Пересецкий А.А. Модели причин отзыва лицензий российских банков / Препринт #WP/2010/085. М.: Российская Экономическая Школа, 2010.
13. Синельникова-Мурылева Е., Горшкова Т., Макеева Т. Прогнозирование дефолтов в российском банковском секторе // Экономическая политика, 2018. Т. 13. № 2. С. 8-27.
14. Zhuravlev Yu.I., Sen'ko O.V., Bondarenko N.N., Ryazanov V.V., Dokukin A.A., Vinogradov A.P. A Method for Predicting Rare Events by Multidimensional Time Series with the Use of Collective Methods // Pattern Recognition and Image Analysis. 2019. Vol. 29. No. 4. Pp. 763-768.
3 Автор выражает искреннюю благодарность д.э.н. С.А. Андрюшину, А.П. Свиридову, д.ф.-м.н. О.В. Сенько за полезные обсуждения.
15. Garcia M.G.P., Medeiros M.C., Vasconcelos G.F.R. Real-time inflation forecasting with high-dimensional models: The case of Brazil // International Journal of Forecasting. Elsevier. 2017. Vol. 33(3). Pp. 679-693.
16. Medeiros, M. C, Vasconcelos, G. F, Veiga, A, & Zilberman, E. Forecasting Inflation in a Data-rich Environment: the Benefits of Machine Learning Methods // Journal of Business & Economic Statistics. 2019. Pp. 1-22.
17. Yadav O., Gomes C., Kanojiya A, Yadav A. Inflation Prediction model using Machine Learning // International journal of information and computing science. May 2019. Vol. 6. Issue 5. Pp. 121-128.
18. Байбуза И. Прогнозирование инфляции с помощью машинного обучения // Деньги и кредит. Декабрь 2018. Т. 77. № 4. С. 42-59.
19. Петрова Д.А. Прогнозирование инфляции на основе интернет-запросов // Экономическое развитие России. Ноябрь 2019. Т. 26. № 11. С. 55-62.
20. Вопросы и направления развития регуляторных и надзорных технологий (RegTech и SupTech) на финансовом рынке в России. Доклад для общественных консультаций. Центральный банк Российской Федерации. Октябрь 2018.
21. Леонов В.П. Классификация ошибок применения статистики в отечественной медицины // Приложение к журналу «Информатика и системы управления». Материалы научной конференции «Системный анализ в медицине» (САМ 2007). 2007. № 1(13). С. 18-21
22. Дун Хэ. Денежно-кредитная политика в цифровую эпоху. Из-за криптоактивов спрос на деньги центральных банков может однажды снизиться // Финансы
и развитие. Международный валютный фонд, июнь 2018 г.
23. Hugh Son. Bank of America CEO Moynihan says he cut jobs equal to the workforce of Delta Air Lines. www.cnbc.com/2018/10/17/bank-of-america-ceo-brian-moynihan-on-cutting-100000-jobs.html (дата обращения: 01.06.2020).
24. Еремина А. Сотрудников «Тинькофф банка» попросили не называть свое место работы банком. www.vedomosti.ru/finance/articles/2019/06/16/804284-sotrudnikov-tinkoff-banka (дата обращения: 01.06.2020).
ABOUT THE AUTHOR
Kirilyuk Igor Leonidovich - Scientifiс Associate of the Federal State Budgetary Institution of Science - Institute of Economics of the Russian Academy of Sciences (the RAS), Moscow, Russia
METHODS OF DATA MINING AND REGULATION OF THE DIGITAL TRANSFORMATION OF THE FINANCIAL INDUSTRY IN RUSSIA AND IN THE WORLD
The article discusses various possibilities of using artificial intelligence methods, obtaining and processing big data, modeling for the financial sector, for central banks, and related problems. The features of normative regulation in this area, the influence of financial technologies on the prospects for the transformation of the industry are discussed. Keywords: Bank of Russia, monetary policy, fintech, artificial intelligence, machine learning, big data.
JEL: C10, C80, E42.