вопросы инновдционнои экономики
Том 9 • Номер 3 • Июль-сентябрь 2019 ISSN 2222-0372 Russian Journal of Innovation Economics
> Первое
экономическое издательство
выбор источника финансирования методами машинного обучения
Мартынова Ю.А. 1
1 Санкт-Петербургский государственный университет аэрокосмического приборостроения, Санкт-Петербург, Россия
АННОТАЦИЯ:_
Приведены результаты выбора финансового учреждения для обслуживания организаций с использованием технологий, применяемых в машинном обучении, в частности, нейронных сетей и нечеткой логики. В условиях недостаточной информации традиционные способы решения такого рода задач работают недостаточно надежно, поэтому в работе демонстрируется метод определения лучшего банка посредством указанных технологий. Для поиска нужного решения выполнено моделирование случайных значений тех параметров, которые отвечают, по мнению автора, за выбор банка. Такая база примеров, которую можно назвать «игрушечной», участвует в обучении нейронной сети. Кроме того, показана возможность получения оценки эффективности выбранного учреждения для обслуживания организации с помощью нечеткой логики.
ФИНАНСИРОВАНИЕ. Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-010-00338.
КЛЮЧЕВЫЕ СЛОВА: машинное обучение, нейронная сеть, нечеткая логика, оценка эффективности.
selection finance's source by method of machine learning
Martynova Yu.A. 1
1 Saint-Petersburg State University of Aerospace Instrumentation (SUAI) , Russia
введение
Выбор финансового учреждения, обслуживающего организацию, представляет собой важную и актуальную задачу, поскольку число сотрудников может достигать нескольких тысяч, и финансовые потери при неправильном выборе могут оказаться значительными. При выборе банка необходимо обосновать перечень показателей, по которым оценивается качество обслуживания, предложить наиболее пригодный метод решения задачи, оценить эффективность банковского обслуживания. При отборе способа решения используются методы машинного обучения, которые, по существу, формируют модель из данных. Однако ситуация осложняется тем, что выбор банка осуществляется на этапе, когда еще нет данных по прежним решениям. В такой ситуации представляется возможным формирование «игрушечных»
наборов данных, по которым (при отсутствии реальных данных) моделируется ситуация и принимается решение.
Далее статья построена следующим образом. Вначале рассматриваются методы машинного обучения, которые могут применяться при решении задачи выбора финансового учреждения. Затем кратко описывается предобработка данных с помощью метода главных компонентов, рассматривается принцип работы нейронных сетей, даются основы функционирования систем нечеткого вывода. В завершающей части статьи обсуждаются полученные результаты и указываются пути дальнейших исследований.
Х.Методология
Анализ любых данных и работа с ними подразумевает построение модели по наблюдениям и ее дальнейшее использование, например, при классификации, прогнозировании и т.п. Подходящим средством для формирования модели является машинное обучение [1-3] (Alpaydin, 2010; Shalev-Shwartz, Ben-David, 2014). По определению, данному в [1], машинное обучение (МО) - это метод, который формирует модель из данных. Здесь данные означают информацию: документы, аудио, изображения и т.д. Таким образом, модель - это конечный продукт МО, который подходит для задач, связанных с интеллектом, в частности, в ситуациях, где физические законы или математические уравнения не дают возможности построить модель.
ABSTRACT:_
The results of choosing a financial institution for servicing organizations using the technologies used in machine learning, in particular, neural networks and fuzzy logic, are presented. In the conditions of insufficient information, traditional methods of solving such tasks do not work reliably enough; therefore, the work demonstrates a method for determining the best bank using these technologies. To search for the desired solution, the simulation of random values of those parameters that are responsible, in the opinion of the author, for the choice of a bank, was performed. Such a database of examples which can be called "toy" is involved in the training of the neural network. In addition, it is shown the possibility of obtaining an assessment of the effectiveness of the selected institution for servicing the organization using fuzzy logic.
KEYWORDS:machine learning, neural network, fuzzy logic, performance evaluation
JEL Classification: C45, C65, D81
© Author(s) / Publication: PRIMEC Publishers For correspondence: Martynova Yu.A. (juli_ko@list.ru)
CITATION:
Received: 20.08.2019 / Published: 30.09.2019
Martynova Yu.A. (2019) Vybor istochnika finansirovaniya metodami mashinnogo obucheniya [Selection finance's source by method of machine learning]. Voprosy innovatsionnoy ekonomiki. 9. (3). - 1037-1048. doi: 10.18334/vinec.9.3.41177
Как то лько процесс МО находит модель по да нным,можно применить эту модель к фактическим данным. Процесс построения модели из обучающих данных показан на рисунке 1.
Input Data
Рисунок 1. Построение модели из данных Источник: [1]
Вертикальные стрелки на рисунке 1 определяют процесс обучения, а горизонтальные - указывают на использование модели. Необходимо подчеркнуть, что данные для построения модели и ее применения являются различными .
Ниже кратко описаны некоторые методы МО, которые используются в этой работе. В [4, 5] (Krichevskiy, Dmitrieva, Martynova, 2018; Krichevskiy, Martynova, 2018) нами было показано применение приемов МО в иных задачах менеджмента. В частности, в [4] (Krichevskiy, Dmitrieva, Martynova, 2018) для выявления компетенций персонала применялась нейросетевая технология в совокупности c инструментом имитационного моделирования Simulink, ч то позволило оценивать компетенции перс онала путем отнесения их к заранее выделенным классам: высокому и низкому уровням. В [5] (Krichevskiy, Martynova, 2018) оценка эффективности инвестиционного проекта была получена с использованием нейронечеткой системы типа ANFIS (Adaptive Neuro-Fuzzy Infeeence System). В данной работе методы МО будут использоваться деля решения задачи но выбору финансоеого учреждения для обслуживания организаций.
ОБ АВТОРЕ:_
Мартынова Юлия Анатольевна, доцент кафедры менеджмента наукоемких производств, кандидат эко-но миаескио еаук, доцент (ju[i_ko(3 [ist.ru)
ЦИТИРОВАТЬ СТАТЬЮ:_
Мертыоову Ю.А. Выбор источника финансировании еетодами машинеого обученая // Воп росы инновационной экономики. - 2019. - Том 9. - № 3. - С. 1037-1048. doi: 10.18334/vinec.9.3.41177
1.1. Предобработка - метод главных компонентов
Метод главных компонентов (ГК) - один из самых важных и мощных методов для предварительной обработки данных. Цель введения ГК заключается в объяснении дисперсии наблюдаемых данных через линейную комбинацию исходных данных [6, 7]. При наличии исходных переменных х1,х2,...,Xjбольшая доля дисперсии данных может быть описана малым числом новых переменных (главных компонентов): Z1, Z2, ... , Zj, линейно связанных с исходными наблюдениями. Однако при этом переходе остается такое же количество ГК J, как и число исходных переменных. Следующий шаг заключается в выборе таких первых Р главных компонентов (P < J), которые сохраняют высокую долю кумулятивной дисперсии исходных данных.
Метод позволяет представить многопризнаковые объекты в пространстве меньшей размерности, выявить между ними сходство и различие по набору признаков, сформировать предварительные выводы о наличии групп (классов) объектов. Этому можно дать следующее объяснение. В наборах данных со многими параметрами группы переменных часто перемещаются вместе. Одна из причин этого заключается в том, что более чем одна переменная может измерять один и тот же принцип, управляющий поведением системы. Во многих системах таких движущих сил немного, поэтому можно упростить задачу, заменив группу переменных одним новым агрегированным параметром, в частности, ГК.
Все главные компоненты ортогональны друг другу, поэтому нет избыточной информации. Первый ГК - это одна ось в пространстве. При проецировании каждого наблюдения на эту ось результирующие значения образуют новую переменную. Дисперсия этой переменной является максимальной среди всех возможных вариантов выбора первой оси. По аналогии второй ГК - это ось в пространстве, перпендикулярная оси первого ГК. Проецирование наблюдений на эту ось создает другую новую переменную. Продолжая процесс таким же образом, получаем, что главные компоненты образуют ортогональную основу для пространства данных.
1.2. Нейронные сети
Нейронная сеть (НС) - это «черный ящик», который отражает ситуацию с полностью неизвестным процессом, но в наличии есть наблюдения (примеры). Здесь известны входы и выход, но требуется база примеров, по которой обучается сеть. В общем случае НС представляет собой машину, моделирующую способ обработки мозгом конкретной задачи [8]. Такая сеть реализуется с помощью электронных компонентов или моделируется программой, выполняемой на компьютере. Благодаря своим возможностям обучения и обобщения нейронные сети могут быть выражены как математическое отображение архитектуры мозга человека [9] (Nielsen).
Поясним принцип нейросетевой технологии на однослойной сети с R входами и S нейронами в слое [10]. В этой сети каждый элемент входного вектора р соединен с каждым входным нейроном через матрицу весов W (рис. 2). Нейрон с индексом i
Вход Слои нейронов
1
Ч_У
а— Г(\Ур I Ь
Рисунок 2. Однослойная сеть с R входными элементами Источник: [10]
имеет сумматор, на который поступают взвешенные входы и смещения для формирования г-го скалярного выхода п(г). Различные п(г) объединяются вместе, образуя 5-й элемент входного вектора п, которые являются аргументами функции активации В итоге на выходе сети формируется выходной вектор-столбец а.
1.3. Нечеткая логика
Понимание большинства физических процессов основано, главным образом, на неточных человеческих рассуждениях. Эта неточность (по сравнению с точностью, необходимой для компьютеров), тем не менее, является формой информации, которая может быть весьма полезна для людей. Способность к внедрению таких рассуждений в неразрешимые и сложные проблемы является критерием, по которому оценивается эффективность нечеткой логики. Требование точности в инженерных моделях означает высокую стоимость и длительные сроки производства и разработки. Для простых систем затраты пропорциональны точности: большая точность влечет за собой более высокую стоимость. При рассмотрении вопроса использования нечеткой логики для данной проблемы инженер или ученый должен подумать о необходимости использования допусков на неточность [11].
Основная идея нечеткой логики (НЛ) состоит в том, что интеллектуальный способ рассуждений, опирающийся на естественный язык общения человека, не может быть описан в рамках традиционных математических формул. Формальному подходу присуща строгая однозначность интерпретации, а все, что связано с применением естественного языка, имеет многозначную интерпретацию. Существует много проблем, где попытки построения традиционных математических моделей оказываются неудачными из-за сложности описываемых явлений.
В противоположность точным математическим уравнениям модели НЛ используют нечеткие множества для управления и описания неточных и сложных явлений.
Нечеткие множества и нечеткая логика, применяемые к задачам управления, образуют область знаний, которую можно назвать управляемой нечеткой логикой (fuzzy logic control). Эта часть НЛ особенно эффективна, когда не требуется высокая точность, а объект управления имеет параметры, доступные для измерения или оценки.
Нечеткий вывод - это метод, который интерпретирует значения во входном векторе и, основываясь на базе правил, присваивает значения выходному вектору. С помощью инструментов НЛ можно создать набор правил, определить функции принадлежности и проанализировать поведение системы нечеткого вывода [12].
2. Результаты
В качестве показателей, которые оказывают влияние на выбор банка, примем следующие: х1 - средняя стоимость расчетно-кассового обслуживания (РКО) в месяц; х2 - минимальная стоимость РКО с зарплатой; х3 - территориальная доступность в регионах; х4 - место в рейтинге надежности.
Для создания базы примеров, которая потребуется в дальнейшем для обучения нейронной сети, возможно использование двух подходов:
1) применение реальных данных;
2) использование «игрушечных» наборов данных.
В машинном обучении важно научиться правильно применять игрушечные наборы данных, так как обучение алгоритма на реальных данных сопряжено с трудностями и может закончиться неудачей [13, 14] (Ramsundar, Zade, 2019; Shakla, 2019). Игрушечные наборы данных играют решающую роль для понимания работы алгоритмов. При наличии простой синтетической выборки данных достаточно просто оценить, обучился алгоритм нужному правилу или нет. На реальных данных получить такую оценку сложно. Здесь воспользуемся методом Монте-Карло для формирования игрушечной выборки данных. Примем, что рассматривается ситуация с выбором банка для финансирования малых предприятий с числом работников менее 100 человек. Тогда средняя стоимость расчетно-кассового обслуживания в месяц может составить от 10 до 50 тыс. руб. Диапазоны изменения всех переменных приведены в таблице 1.
Таблица 1
Диапазоны изменения переменных
Параметр х1, тыс. руб. х2, руб. х3, число филиалов (банкоматов) х4, рейтинг
Диапазон 10-50 0-2000 100-10000 1-50
Источник: составлено автором.
Общий объем смоделированных данных составляет 40 вариантов: 20 - для «хорошего» (класс 1) и 20 - для «плохого» (класс 2) банка. Фрагмент смоделированной базы данных приведен в таблице 2.
Таблица 2
смоделированная база данных
х1 х2 х3 х4 class
40,5 405,3 7,6 4 1
38,8 229,9 8,5 19 1
48,1 28,8 8,3 5 1
33,0 492,3 9,3 6 1
32,8 235,3 10,0 9 1
39,9 212,2 7,0 2 1
Источник: составлено автором.
2.0 -1-1--г1—
1,5 1.0
» O.fi <ч
ев щ
<ч 0.0 о t
О -0,5 1.0 -1.5 -2.0
4 -3 -2 -1 0 1 2 3 4 6
Фактор 1: 34,68%
Рисунок 3. Наблюдеиия в плоскости первых двух ГК Источник: составлено автором.
Метод главных компонентов позволяет сократить размерность пространства признаков, совершая в рассматриваемом случае переход от четырех исходных признако в до двух агрегированных показателей (для представления на плоскости). На рисунке 3 показаны все 40 наблюдений - строк разыгранной матрицы данных, представленные в плоскости первых двух ГК.
Как видно из рисунка 3, данные образуют два четко разделенных кластера банков, что является результатом условий моделирования.
Потеря информации при переходе к ГК определяется через собственные числа матрицы корреляций исходных признаков. Фрагмент значений собственных чисел показан в таблице 3.
Таблица 3
Значения собственных чисел
Собственные значения Доля общей дисперсии,% Кумулятивная оценка собственных значений Кумулятивная оценка диспер-сии,%
33,387362 84,68405 3,387362 84,6840
0,276663 6,91658 3,664025 91,6006
0,217555 5,43889 3,881581 97.039Ц
0,118419 2,96049 4, 000000 10 0,5000
Источник: составлено автором.
Рисунок 4. Архитектура нейронной сети Источник: составлено автором.
Name
data}
Value-
[«,187991 405,270516
7,61043226-1
4,1
A Data: networfcl.outputs
Value
Q OK О Cancel
Name
data II Data: retwork1_outputs
Value
[50
200 10 30]
Value
OK
I Cancel
а) б)
Рисунок 5. Классификация наблюдений Источник: составлено автором.
Как видно из таблицы 3, потеря информ ации при переходе к ГК меньше 9%, но при этом можно визуализировать многомерные наблюдения на пл оскости.
Теперь с помощью нейронных сетей оценим возможность выбора банковских структур. В программе Ыа&аЪ 2018Ь создадим сеть типа многослойного персептрона, в котором установим число нейронов скрытого слоя, равным 10. На рисунке 4 показана архит ектура нейронной сети, которая имеет 4 нейрона во входном , 10 - в скрытом и 1 - в выходном слоях.
После обучения сеть готова к решению задачи по выбору банковского учреждения. Вначале проверим работу сети на тех данных, которые сеть «видела» при обучении. При введении первой строки данных из таблицы 2 на вход сети последняя вырабатывает ответ: класс 1 (рис. 5а). Это правильный ответ, так как данные соответствуют первому классу. Теперь подадим новые данные: результат - на рисунке 5б, т.е. сеть относит этот банк ко второму классу.
Таким обр азом, НС может использоваться для отбора банка, пригодного для обслуживания.
Теперь перейдем к задаче оценки эффективности банковского обслуживания, которую решаем посредством нечеткой логики. При тех же входных переменных, что и в задаче выбора банка, создадим систему нечеткого вывода, состоящую из четырех входных: перемгноых и одной выходной (эффективность обслуживания) (рис. 6).
Рисунок 6. (Система нечеткого вывода Источник: составлено автором.
Далее задача решается традиционным способом: для каждой переменной задаются диапазон изменения, число градаций, функции принадлежности, затем составляется база правил. Результат решения определяется через опцию просмотра правил (View -Rules). На рисунке 7 показан фрагмент решения. При указанных входных данных эффективность обслуживания составляет 85 баллов по 100-балльной шкале, поэтому услуги этого банка приемлемы для организации.
3. Обсуждение
Описанный в работе подход к выбору финансового учреждения выполнен на смоделированных данных и представляет собой, по существу, методологию решения
В Rule Viewer: МЮА1
File Edit View Options
Стоимость = 16.2 Обслуживание = 0.2Б9 Банкомат = 9.15е+Ю Рейтинг = 6.91 Эффективность=35.2
Рисунок 7. Оценкаэффектнвности при указанных входных переменных Источник: составлено автором.
подобных задач. В конкретной ситуации необходимо обосновать выбор тех параметров банка, которые оказывают наибольшее влияние на финансовую деятельность организации, сформировать реальную выборку данных и решить задачу с помощью указанных методов машинного обучения.
Дальнейшие работы в этом направлении могут включать анализ зарплатных проектов банков и выбор can более птигодносо банка с тмчки зрения обслуживаемой омга-низации. Но и в этом случае описанные в статье приемы окажут несомненную пользу заинтересованным лицам.
Зттлтчение
В работе показано, что для оценки эффективности банковского обслуживания и выбора банка можно использовать нейронные сети и нечеткую логику. Подобные шаги, по мнению автора, могут служить исходными элементами при переходе к цифровой экономике. Выводы, полученные с использованием синтезированных игрушечных наборов данных, могут быть трансформированы и на реальные ситуации.
БЛАГОДАРНОСТИ:
Автор благодарит проф. Кричевского М.Л. за помощь в подготовке и обсуждении материала.
ИСТОЧНИКИ:
1. Kim P. MATLAB Deep Learning: With Machine Learning, Neural Networks and Artificial
Intelligence., Soul-t'ukpyolsi, Seoul, 2017
2. Alpaydin E. Introduction to Machine Learning. - Massachusetts:MIT Press Cambridge,
2010.
3. Shalev-Shwartz S., Ben-David S. Understanding Machine Learning: From Theory to Algorithms. - New York: Cambridge University Press, 2014.
4. Кричевский М.Л., Дмитриева С.В., Мартынова Ю.А. Нейросетевая оценка компе-
тенций персонала // Экономика труда. - 2018. - № 4. - с. 1101-1118. - doi: 10.18334/ et.5.4.39488.
5. Кричевский М.Л., Мартынова Ю.А. Инструменты искусственного интеллекта при
оценке эффективности инвестиционного проекта // Креативная экономика. - 2018. - № 8. - с. 1105-1118. - doi: 10.18334/ce.12.8.39265.
6. Jolliffe I.T. Principal component analysis. Springer, New York, 2002
7. Principal Component Analysis. Acadgild. [Электронный ресурс]. URL: https://acadgild.
com/blog/principal-component-analysis ( дата обращения: 19.05.2019 ).
8. Haykin S. Neural Networks and Learning Machines, Pearson Education, New York, 2009
9. Nielsen M. Neural Networks and Deep Learning. [Электронный ресурс]. URL: http://
neuralnetworksanddeeplearning.com ( дата обращения: 12.04.2019 ).
10. Neural Network Toolbox. User's Guide. The MathWorks, Inc., MA, 2015
11. Ross T. Fuzzy logic with engineering applications, John Wiley & Sons Chichester, 2010
12. Fuzzy Logic Toolbox. MatLab. Mathworks. [Электронный ресурс]. URL: https://www. mathworks.com/products/fuzzy-logic.html?BB=1 ( дата обращения: 12.05.19 ).
13. Рамсундар Б., Заде Р. TensorFlow для глубокого обучения. - СПб.: БХВ-Петербург, 2019.
14. Шакла Н. Машинное обучение и TensorFlow. - СПб.: Питер, 2019.
REFERENCES:
Alpaydin E. (2010). Introduction to Machine Learning Massachusetts: MIT Press Cambridge.
Fuzzy Logic Toolbox. MatLabMathworks. Retrieved May 12, 19, from https://www.
mathworks.com/products/fuzzy-logic.html?BB=1 Krichevskiy M.L., Dmitrieva S.V., Martynova Yu.A. (2018). Neyrosetevaya otsenka kompetentsiy personala [Neural network assessment of personnel competencies]. Russian Journal of Labor Economics. 5 (4). 1101-1118. (in Russian). doi: 10.18334/et.5.4.39488. Krichevskiy M.L., Martynova Yu.A. (2018). Instrumenty iskusstvennogo intellekta pri otsenke effektivnosti investitsionnogo proekta [Instruments of artificial intelligence in assessment of effectiveness of investment project]. Creative economy. 12 (8). 11051118. (in Russian). doi: 10.18334/ce.12.8.39265. Nielsen M. Neural Networks and Deep Learning. Retrieved April 12, 2019, from http://
neuralnetworksanddeeplearning.com Principal Component AnalysisAcadgild. Retrieved May 19, 2019, from https://acadgild.
com/blog/principal-component-analysis Ramsundar B., Zade R. (2019). TensorFlow dlya glubokogo obucheniya [TensorFlow for deep learning] SPb.: BKhV-Peterburg. (in Russian).
Shakla N. (2019). Mashinnoe obuchenie i TensorFlow [Machine learning and
TensorFlow] SPb.: Piter. (in Russian). Shalev-Shwartz S., Ben-David S. (2014). Understanding Machine Learning: From Theory to Algorithms New York: Cambridge University Press.