Научная статья на тему 'Построение имитационной нейронной сети для оценки ожидаемых банковских результатов на основании ряда демографоэкономических данных местности'

Построение имитационной нейронной сети для оценки ожидаемых банковских результатов на основании ряда демографоэкономических данных местности Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
158
52
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ИМИТАЦИОННАЯ МОДЕЛЬ / БАНКОВСКИЕ МОДЕЛИ / НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ / SIMULATION MODEL / BANKING MODEL / NEURAL NETWORK MODELING / BANKING MODELS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Контос (Жукова) Е.Г.

В рамках данного исследования были подобраны наборы демографо-экономических и банковских показателей для которых удалось создать алгоритм автоматического построения оптимальных нейронных сетей имитирующих выбранные показатели банковских результатов на основании заданных демографо-экономических индикаторов местности. Этот алгоритм был апробирован на пакете МATLAB для 12-и стран Европейского содружества. В результате чего были отобраны 12 лучших нейронных сетей с погрешностью полной симуляции от 1.2% (для Австрии и Швеции) до 4.5% (для Ирландии) что является допустимым уровнем достоверности математических моделей. В процессе работы были также выявлены общие черты таких специализированных нейронных сетей и способы подготовки наборов данных для их успешного обучения и работы.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Контос (Жукова) Е.Г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

BUILDING A SIMULATION OF A NEURAL NETWORK TO ESTIMATE THE EXPECTED RESULTS OF BANKING BASED ON A SERIES DEMOGRAPHIC-ECONOMIC DATA LOCALITY

As a part of the study, a few demographic, economic and banking indicators were collected and combined in incoming and outgoing datasets for 12 European Union countries. An algorithm for automatic construction of simulating neural networks was created and tested on MATLAB tool for available datasets. As the result a top 12 neural networks were selected with a mean squared error of a full simulation of 1.2% (for Austria and Sweden) to 4.5% (for Ireland), which is an acceptable level of reliability of mathematical models. During the process, a few common features of such specialized neural networks were identified (together with a few rules of dataset’ preparation) for successful network learning, adaptation and further operating.

Текст научной работы на тему «Построение имитационной нейронной сети для оценки ожидаемых банковских результатов на основании ряда демографоэкономических данных местности»

баланса, утверждение и доведение утвержденных показателей и согласование с ними исходных показателей планирования;

2. В части управления дебиторской и кредиторской задолженностью (обязательствами) компании: учет остатков дебиторской-кредиторской задолженности, установление лимитов её возникновения и погашения, оперативный учет движения задолженности, контроль соблюдения её лимитов в разрезе расчетов с конкретными контрагентами;

3. В части оперативного планирования и управление платежами: сбор и консолидацию заявок на платежи, формирование и оптимизацию платежного календаря, оперативный учет движения денежных средств, перепланирование календаря платежей по результатам его фактического исполнения, формирование распоряжений на оплату, обеспечение требуемого уровня платежеспособности предприятия;

4. В части анализа выполнения финансового плана, финансовый анализ: сбор и обобщение фактических данных, формирование отчетности об исполнении финансовых планов, анализ отклонений фактических показателей.

Для оптимального функционирования перечисленных бизнес-процессов необходимо, чтобы внутрихолдинговый расчетный центр выполнял цели, представленные на рисунки 4.

Таким образом, внутрихолдинговый расчетный центр должен стать эффективным инструментом достижения положительных предпринимательских эффектов за счетпостроения централизо-ванногоуправления и контроля надкорпоративными финансами и финансовым документооборотом в холдинге «РЖД».

Литература:

1. Авдашева С.Б. Российские холдинги: проблемы управления (свидетельства выборочного обследования предприятий) // Проблемы теории и практики управления. - 2006. - №8.

2. Распоряжение ОАО «РЖД» от 27.12.2004 г. № 4185р «Об утверждении Положения о порядке проведения операций по банковским счетам открытого акционерного общества «Российские железные дороги»;

3. Якунин В.И. Основные направления совершенствования корпоративного управления// Мир транспорта - 2004. - № 2.

ПОСТРОЕНИЕ ИМИТАЦИОННОМ НЕЙРОННОЙ СЕТИ ДЛЯ ОЦЕНКИ ОЖИДАЕМЫХ БАНКОВСКИХ РЕЗУЛЬТАТОВ НА ОСНОВАНИИ РЯДА ДЕМОГРАФО-ЭКОНОМИЧЕСКИХ ДАННЫХ МЕСТНОСТИ

Контос (Жукова) Е.Г., аспирант МИЭПП

В рамках данного исследования были подобраны наборы демографо-экономических и банковских показателей для которых удалось создать алгоритм автоматического построения оптимальных нейронных сетей имитирующих выбранные показатели банковских результатов на основании заданных демографо-экономических индикаторов местности. Этот алгоритм был апробирован на пакете МATLAB для 12-и стран Европейского содружества. В результате чего были отобраны 12 лучших нейронных сетей с погрешностью полной симуляции от 1.2% (для Австрии и Швеции) до 4.5% (для Ирландии) что является допустимым уровнем достоверности математических моделей. В процессе работы были также выявлены общие черты таких специализированных нейронных сетей и способы подготовки наборов данных для их успешного обучения и работы.

Ключевые слова; имитационная модель, банковские модели, нейросетевое моделирование (banking models, neural network modeling).

BUILDING A SIMULATION OF A NEURAL NETWORK TO ESTIMATE THE EXPECTED RESULTS OF BANKING BASED ON A SERIES DEMOGRAPHIC-ECONOMIC DATA

LOCALITY

Kontos (Zhukova) E., the post-graduate student, MIEPP

As a part of the study, a few demographic, economic and banking indicators were collected and combined in incoming and outgoing datasets for 12 European Union countries. An algorithm for automatic construction of simulating neural networks was created and tested on MATLAB tool for available datasets. As the result a top 12 neural networks were selected with a mean squared error of a full simulation of 1.2% (for Austria and Sweden) to 4.5% (for Ireland), which is an acceptable level of reliability of mathematical models. During the process, a few common features of such specialized neural networks were identified (together with a few rules of dataset' preparation) for successful network learning, adaptation and further operating.

Keywords: simulation model, banking model, neural network modeling (banking models, neural network modeling).

1. Сокращения

GDP - GrossDomesticProduct

ВНП - Валовый Национальный Продукт

ЕС - ЕвропейскоеСодружество

OECD - Organization for Economic Co-operation and Development

МВФ - Международный Валютный Фонд

BE - Бельгиа DE - Германия AT - Австрия FR - Франция IT - Италия ES - Испания SE - Швеция DK - Даниа LU - Люксембург NL - Нидерланды IR - Ирландия FI - Финляндия

2. Введение

В рамках исследования по-поводу «Моделирование результатов банковской деятельности на основании демографо-экономических показателей страны или региона» были выделены следующие подзадачи:

1) Подбор подходящей и однородной (из года в год) статистической информации включающей демографо-экономические и банковские показатели.

2) Построение имитационной нейронной сети для оценки ожидаемых банковских показателей, натренированной на реальных данных конкретной местности(в нашем случае, страны)за десятилетний период:

■ демографо-экономических данных использованных в качестве составляющих входного потока

■ банковских показателей, характеризующих тенденции развития банковского сектора в конкретных условиях, использованных в качестве составляющих входного потока

■ финансовых показателей банковских результатов использованных в качестве выходного потока

3) Определение наиболее эффективных функций и методов построения и тренировки нейронной сети для имитации отдельных банковских показателей на наборе демографо-экономических данных определённого типа.

3. К вопросу о подборе и классификации данных

В настоящем исследовании для подбора данных мы руководствовались двумя основными критериями. Во-первых, данные должны быть однотипными в разные промежутки времени и на разных объектах исследования. Во-вторых, все они должны быть

одинаково доступны (например систематически публиковаться). В результате, объектом исследования были выбраны страны ЕС на временном отрезке от 2000 до 2009 года на базе годичной статистики по причинам:

1) Общедоступности свода статистических данных по отдельно взятой стране.

2) Единых требований к формированию банковского результата и представлению таких данных для всех стран ЕС

3) Единых требований к формированию резервных фондов в банковском биснесе

Приступая к построению конкретных входных и выходных выборок данных для математического моделирования оценки влияния демографо-экономических показателей страны (или другой ограниченной географической зоны) на формирование суммарных результатов банковской деятельности, мы задавались двумя главными вопросами:

1) Какие из индикаторов банковской деятельности могут быть использованы в качестве примера показателей состояния рынка банковских услуг?

2) Какие демографо-экономические данные могут оказывать влияние на рынок банковских услуг?

Рассматривая и сопоставляя регулярно публикуемые данные банковских балансовых сводов, мы пришли к заключению что бессмысленно брать чистые сводные цифры статей баланса чтобы оценить уровень процесса развития банковской системы т.к. исходные данные в разных странах/регионах будут существенно отличаться. Даже если рассматривать отдельно взятую страну, данные одного типа но разных лет также невозможно сравнивать в чистом виде. Представляется более правильным, в большинстве случаев, рассматривать относительные сводные показатели результатов финансовой деятельности, так называемые рейтинги (ratios) в виде процента от суммы активов (представленной статьёй баланса «End-year total») или процента от суммы собственных финансовых средств и резервов (представленной статьёй баланса «Capital and reserves») в зависимости от цели осуществляемого анализа. Кроме того, как в случае рейтингов, так и в случае непосредственных "чистых" значений, наибольший интерес представляют процентные оценки динамики изменения этих показателей в сравнении с предыдущим годом.

Исследуя всевозможные общедоступные в международной сети источники банковских статистических данных, наиболее полными и достоверными были признаны и использованы:

1) Данные Европейского центрального банка1

2) Статистические данные МВФ2

3) Данные Организации экономической кооперации и развития : OECD3

4) Мировые Данные об оценках просроченных задолженностей собранные на основании индикаторов мирового развития представляемых регулярным отчётом «Global Financial Stability Report» в МВФ4

Подобно банковским показателям, демографо-экономические показатели тоже оказалось нецелесообразным использовать в чистом виде по тем же выше приведённым причинам. Более оправданными к использованию в данном исследовании выглядят либо рейтинги этих показателей по отношению к ВНП (GDP), либо процентные оценки динамики изменения этих показателей в сравнении с предыдущим годом, либо комбинация рейтингов и оценок динамики.

Исследуя всевозможные общедоступные в международной сети

источники демографо-экономических данных, наиболее полными и достоверными были признаны и использованы данные европейской комиссии, регулярно представляемые такими изданиями как:

1) «Statistical Annex of European Economy»5

2) European Commission/ EuroStat/Statistic Tables66European Commission/ EuroStat/statistic Tables

http://epp.eurostat.ec.eur

opa.eu/poital/page/poital/statistics/search_database

На данном этапе исследования нашей целью являлось выяснение самой возможности построения нужной нам нейронной сети. Для этого, наборы входных и выходных показателей могут варьировать в пределах их смысловой идентичности конкретно заданной цели. Поэтому, в данном случае таких наборов может быть несколько. Нами было исследовано два смысловых набора показателей, каждый из которых включает по 14 входных и 5 выходные потоков.

4. Построение имитационной нейронной сети с помощью MatLab

Рассматривая вторую подзадачу (о построении имитационной нейронной сети для оценки ожидаемых банковских показателей для стран Европейского содружества) более подробно, можно отметить, что сложность и новизна этого конкретного моделирования заключается в том что между входными и выходными данными невозможно установить какой-либо видимой логической связи. Вернее, возможно такая связь и могла бы поддаться каким-либо умозрительным предположениям, но в любом случае она вряд ли может быть формализована даже на уровне нечёткой логики. Поэтому, в качестве первой попытки, показалось интересным, используя готовый арсенал функций известного пакета MATLAB (в той его части которая специализирована на инициации и тренировке нейронных сетей), попытаться найти такое их(функций) сочетание, которое бы автоматически построило наилучшую имитационную нейронную сеть(одну или несколько) на конкретном наборе входных и выходных данных. Это значит что мы попробовали двигаться в направлении обратном общепринятому в создании нейронных сетей. Необходимость такой тактики диктовалась ещё и количеством доступных данных.

Дело в том что вопрос о количестве наблюдений для обучения сети, часто оказывается непростым. Известен ряд эвристических правил, которые устанавливают связь между количеством необходимых наблюдений и размерами сети. Простейшее из них гласит, что количество наблюдений должно быть в 10 раз больше числа связей в сети. На самом деле это число зависит от сложности того отображения, которое должна воспроизводить нейронная сеть. С ростом числа используемых признаков количество наблюдений возрастает по нелинейному закону, так что уже при довольно небольшом числе признаков, скажем 10, может потребоваться огромное число наблюдений. Эта проблема носит название "проклятие размерности".7

В нашем случае, демографо-экономическая и банковская статистика разных стран представлена сравнительно большим набором стабильных показателей и небольшим (с точки зрения вышеупомянутых эвристических правил) количеством лет публикуемой статистики. Это значит, что какую бы мощную нейронную сеть мы бы не сконструировали теоретически, натренировать её должным образом на столь ограниченных временных циклах было бы крайне проблематично.

Оставалось исследовать имеющиися наборы данных на всех доступных комбинациях функций (воплощающих большинство

1European Central Bank. Statistical Data Warehouse: http://sdw.ecb.europa.eu/browse.do?node=4586742и в частности: http://sdw.ecb.europa. eu/browseSelection.do?DATASET=0&sfl2=4&REF_AREA=*EU&sfl3=4&SSIJNDICAT0R=N30&node=9484387

2European Central Bank /Monetary and financial statistics. Lists of financial institutions : http://www.ecb.int/stats/money/mfi/general/html/ index.en.html

30ECD.StatExtracts (Organization for Economic Co-operation and development):http://stats.oecd.org/0ECDStat_Metadata/ShowMetadata.as hx?Dataset=BPF1&Show0nWeb=true&Lang=en

4The World Bank Data.Bank nonperforming loans to total gross loans (%)http://data.worldbank.org/indicator/FB.AST.NPER.ZS

5Main Economic Indicators_1961_2011 in Annual percentage change(unless otherwise stated)/ данныеEuroStat/ :http://ec.europa.eu/economy_ finance/publications/european_economy/2012/pdf/2012-05-11-stat-annex_en.pdfhttp://epp.eurostat.ec.europa.eu^tgm/refreshTableAction.do;jsessi onid=9ea7d07e30e6ee2fa3c58d9941b1a59ae4fflcd8548f5.e34MbxeSahmMa40LbNiMbxaMb3q0e0?tab=table&plugin= 1&pcode=tec00001&language=en

'European Commission/ EuroStat/statistic Tables http://epp.eurostat.ec.europa.eu/portal/page/portal/statistics/search_database http://epp.eurostat. ec.europa.eu^portal/page/portal/product_details/publication?p_product_code=CH_05_2011_XLS

'Степанов Л.В. Моделирование конкуренции в условиях рынка. Монография, параграф 2.3 Выбор функции активации и обучение нейронной сети.Изд. "Академия Естествознания " 2009 ISBN 978-5-91327-073-3 ( http://www.rae.ru/monographs/65-2465)

8HeikkiN.Koivo :BasicUsingMATLAB. Neural Network Toolbox,2008: http://pis.unicauca.edu.co/moodle-2.1.2/pluginfile.php/30258/mod_ folder/content/1/clase_29/AS-74_3115_neural_networks_-_basics.pdf?forcedownload=1

из специальных алгоритмов и методов представленных в нашей предыдущей статье [1]) создания, тренировки и обучения нейронных сетей) с целью нахождения тех немногих их комбинаций, которые бы давали нужные результаты (результаты с оценками ошибок, меньшими чем параметрически заданные величины) на конкретных входных и выходных наборах данных, априори полагая что требуемая нейронная сеть должна быть обучаемой. Программа нахождения оптимального сочетания функций построения и тренировки такой нейронной сети (имитирующей выбранные показатели результатов банковской деятельности на заданных демографо-экономических показателях) была написана по ниже приведённому алгоритму.

4.1. Алгоритм нахождения оптимального сочетания функций

Для каждой из шести(6) функций инициализации нейронной сети (предположительно подходящих к условиям конкретной задачи) осуществлялись вложенные друг в друга циклы переборов по следущим переменным:

1. Training fonctions: Девятнадцать (19) функций тренировки нейронной сети.

2. Performance fonctions: Семь (7) функции исполнения и оценки ошибки.

3. Adaptive fonctions: Пятнадцать (15) функций обучающей адаптации.

4. Transfer fonctions: Тринадцать (13) трансферных функции активации синапсов.

5. Layer Initiation fonctions: Две (2) функции инициации слоёв сети.

6. Number of layers: Количествослоёв от двух (2) до четырёх

(4).

7. Nomber of repetitions: Количество тренировочных итераций на каждой комбинации всех выше перечисленных переменных.

Каждая комбинация всех выше перечисленных переменных автоматически встроена в текущую (исследуемую на данном этапе) нейронную сеть. Тренировочные и обучающие функции представляют собой математические процедуры, используемые для автоматической настройки весов синапсов и их смещений. Тренировочные функции определяют глобальный алгоритм настройки, который влияет на все веса и смещения данной сети, в то время как функции обучения могут быть применены к отдельным весам и смещениям в сети.

Наилучшее назначение связей между слоями (Layer Connections) было найдено методом проб и ошибок.

Оба набора (входной и выходной) временных множеств автоматически разделяются на три случайно построенные части: тренажерную (примерно 70% всех данных) для использования в процессе тренировки сети и его оценки (perf), проверочную (около 15%) для использования в процессе оценки результата обученности сети (vperf), и тестовую (около 15%)для использования в качестве независимого набора данных для оценки ошибки результирующего прогноза сети (tperf). Процентное отношение между этими тремя частями задаётся параметрически.

Каждая тренировка такой (параметрически подготовленной) нейронной сети начинается со случайно определённых значений весов синапсов и их смещений и включает в себя параметрически заданное максимальное количество эпох (итерационных попыток определения оптимальных значений весов синапсов и их смещений

на этапе текущей тренировки). В соответствии с матрицами весов и смещений, установленных для конкретной эпохи, на данном тренировочном наборе входных данных, вычисляется соответствующий набор выходных данных. Затем вычисленные выходные данные сравниваются с их ожидаемыми значениями (из тренировочного выходного набора), тем самым определяя значение ошибки на этапе тренировки для каждого показателя на каждом временном этапе.8 В соответсвии с выбранной комбинацией выше перечисленных функций, происходит сравнение выходного набора расчитанного посредством построенной нейронной сети с ожидаемыми результатами (заданными выходным потоком данных)на конкретной эпохе. Каждая новая эпоха тренировки автоматически подправляет (пересчитывает) веса и смещения синапсов в соответствии с алгоритмами реализованными в конкретных выбранных (и параметрически заданных) функциях. Тренировочный процесс останавливается в следствие либо допустимой оценки ошибки результата на этапе тренировки сети(в случае положительного исхода), либо перегрузки параметрически заданных тренировочных характеристик (в случае отрицательного исхода).

Не смотря на это, как показал опыт, имеет смысл последовательно повторить один и тот же тренировочный процес несколько раз для достижения наименьшей ошибки тренировки. При этом, каждое последующее повторение будет начинать тренировочный процесс уже не со случайных значений весов и смещений синапсов а с их наилучшими значениями(в смысле оценки ошибки) которые были найдены в процессе предшествующей тренировки.

4.2. Подготовка наборов данных

В большинстве источников по нейронным сетям упоминается что наилучшие результаты достигаются когда все наборы данных «нормализованы» или «масштабированы», что в данном случае означает представлены в интервале от -1 до 1. Но вот каким образом эта нормализация должна происходить и насколько «плох» результат полученный на «не нормализованных» наборах данных зависит от каждой конкретной задачи и доступных наборов данных.

К примеру, в нашем конкретном случае, используя «не нормализованные» наборы данных, удалось найти оптимальные сочетания функций с неожиданно низким уровнем ошибки на этапе тренировки (10-32) что не могло не настораживать. И действительно, симуляция результатов на некоторых отренированных нейронных сетях и его оценка на тестовой выборке, как и предполагалось, дала 100% ошибку. Этот известный эффект (очень хороший результат на этапе тренировки в сочетании с очень плохим на этапе тестирования), с которым иногда сталкиваются в процессе обучения нейронной сети, называемый «over fitting», чаще всего случается на малых обучающих выборках и на данных с большим разбросом значений. В таких случаях нейронная сеть просто каким-то образом запоминает имеющиеся данные вместо того чтобы обучиться обобщающим правилам.

В случае с демографо-экономическими данными разброс значений по разным показателям слишком велик даже для того чтобы говорить о какой-либо их (показателей) сопоставимости. Поэтому, стандартные методы автоматической нормализации тоже не принесли нужного результата.

Для лучшей сопоставимости показателей в единой нейронной

Таблица 1. Пример Начального набора входных данных и нормализующих делителей

2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 Ннрми.111-штор

60,5000 59,9000 59,9000 59,6000 60,3000 61.1000 61,0000 62,0000 62,4000 61.6000 100

6,9000 6,6000 7,5000 8,2000 8,4000 8,5000 8,3000 7,5000 7,0000 7,9000 10

¡07.9000 92,1000 92,1000 92,1000 94,2000 92,1000 88,1000 84,2000 89,8000 96,7000 1000

24574,2791 25163,9108 26019,7047 26624,194 27973,569 28991,8908 30267,1904 31657,9832 32343,7081 31540,9166 100000

70651,7787 77924,1310 76852,4556 ■52279,522 89377,249 102798,883 1 10277,977 124063,783 1 ¡6354,905 105097,975 1000000

2576,3127 2925.2456 3027,1305 3047.4129 2972,4402 2996,3923 3529,8399 5348,9737 4388,4984 4491,4745 10000

287,5030 309,6662 295,3625 309,0404 319,5061 354,5781 364,3482 391,8878 359,7451 333,2115 1000

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нормализованный iiaóop входных данных

0,605 0,599 0,599 0,596 0.603 0,611 0,61 0.62 0.624 0,616

0.69 0,66 0,75 0,82 0,84 0,85 0,83 0,75 0,7 0,79

0,1079 0,0921 0,0921 0,0921 0,0942 0,0921 0,0881 0,0842 0,0898 0,0967

0,24574279 0,25163911 0,26014705 0,2662419 0,2797357 0,28991891 0,3026719 0.3165798: 0,3234370í 0,31540917

0,07065178 0.07792413 0.0768524( 0,0822795 0.0893773 0,10279888 0,11027798 0.1240637Í 0.1163549 0,10509797

0,25763127 0,29252456 0,30271305 0,3047413 0,297244 0,29963923 0,35298399 0,5348973' 0,43884984 0,44914745

0,287503 0.3096662 0.2953625 0,3090404 0,3195061 0.3545781 0,3643482 0,3918878 0,359745 1 0,3332115

Таблица 2. Показатели Оптимальных Нейронных Сетей построенных для каждой из стран.

Страна Оценка ошибки результата на tnuinr тренировки (perfl* Оц.ош. peí. на ли. проверки Оц.нш. peí. на ли. теста Оценка ошибки полной симуляции Функция Тренировки Функция шшцнац. сети Функ Инициации слоев сети Функ. испил/я и оц-ки погреши. 0yHKU Ooytenm •'udunmuniiu ТрвнсфернШ функц. Актив/и синапс. Кол. Сл/в Кол-воПоет.

DE 7.847145e-07 0.123 0.267 0.039 trainlm newc Г inilnw ш se learn som hardi ims 2 12

BP. 2.088768е-09 0.042 0.108 0.015 Irainiш newcf inilnw m se leamfldtn loi!sii> 3 9

Ff( 8.32986е-<16 0.111 0.084 0.019 trainlm newcf initwb 111 sc learn somb sat! in 3 4

NL 2.795 52е-06 0.086 0.147 0.023 trainlm rtewc Г inilwb ш se adapt wb compel 3 5

SE 9.79656е-08 0.061 0.057 0.012 train 1 111 newc Г inilnw m se tearnli compel 2 18

FI 4.31521е-0б 0.093 0.037 0.013 trainlm newc f inilnw m se learn yd m tansig 3 Ig

IT 3.54954е-07 0.186 0.031 0.022 trainlm newcf inilnw m se [earn fit! m tan si g 3 18

F,S 4.73638e-033 0.044 0.119 0.033 trainlm newc Г inilnw m se learn k radbas 2 14

IE 9.71421e-033 0.039 0.145 0.045 trainlm newcf inilnw ni se leamgdm radbas 2 IK

LU 6.25047е-07 0.097 0.061 0.018 trainlm newcf inilwb ni se leamh hardlim 3 19

AT 8.50l01e-05 0.027 0.075 0.012 trainlm newel' inilnw mse learn h sat lins 3 3

l>K б.50493е-06 0.0019 0.149 0.015 trainlm newcf iniiwh m se leamydm compel 2 11

*Обозначение «е-08» в данном случае означает умножение предлежащего значения на 10-8

сети нам показалось интересным нормализовывать каждый из них по-отдельности, в ручную (или автоматически) подбирая для каждого отдельного показателя собственный уровень нормализации что сделало их порядки сопоставимыми и привело в результате к искомому решению. Пример данных и нормализующих делителей к ним приведён в таблице 1.

4.3. Апробация алгоритма и оптимальные сочетания функций

Программа была отработана на представленных выше типах входных и выходных потоков данных за 9, 10 и11-летний периоды для стран Европы, таких как Бельгия, Германия, Австрия, Франция, Италия, Испания, Швеция, Даниа, Люксембург, Нидерланды, Ирландия, Финляндия.

Предварительно, реальные данные были "нормализованы" (в данном случае в ручную) и представлены значениями в интервале от -1 до+1 для лучшей соотносимости отдельных синапсов (а значит и показателей) и для лучшего контроля над оценкой устойчивости результата.

Учитывая тот факт что начальные значения весов сети и смещений всегда случайны, лучшие результаты создания обсуждаемых нейронных сетей будут варьировать для каждого нового запуска программы. Можно лишь проследить общие, стабильно повторяющиеся, тенденции оптимальных комбинаций функций.

По результатам работы этой программы, наилучшие результаты были достигнуты, к примеру, на комбинациях функций (или методов, реализованных в этих функциях) представленных в Таблице 2.

Если вспомнить формулу синапса (подробно описанную в статье [1]):

(1)

Тогда примеры структур соответствующих нейронных сетей (представленных таблицей 2) показаны схемами на рисунках 1-2 где:

1. Цифрами обозначено количество нейронов-синапсов каждого слоя (Layer) также как и входного(1при1) и выходного(Ои1ри1) потоков. Количество входных и выходных нейронов (также как и количество нейронов последнего слоя) предопределено входным и выходным наборами данных и не может быть изменено параметрически. Оптимальное количество нейронов внутренних слоёв нейронной сети было найдено методом проб и ошибок.

2. Буквами w(weight) и b(bias) выделены отдельные составляющие весов и смещений полученные от каждого связанного слоя

3. Трансферной функцией выходного слоя по умолчанию является линейная функция (purelin) которая предопределена системой и не может быть изменена параметрически.

На рисунках 1 и 2 представлены примеры схематического МАТЛАБ-представления построенных оптимальных сетей:

[!E_6nlNfl0lt4fwCF_ 19(152013 (vfew)

Output

S

purelin

DE_Bef[NetOnNtuCF: in it" mtnïv ! p*rf= miaf train" trainlm f adapt« I tant во m J vperf= 0 À23267 Général petfornianee " 3.89779Эе-02

Рис. 1. Нейронная сеть для Германии

Рис. 2. Нейронная сеть для Бельгии

Как видно из Таблицы результатов 4 и рисунков 1-2, погрешность полной симуляции на отдельных нейронных сетях составила от 1.2% (для Австрии и Швеции) до 4.5% (для Ирландии) что является допустимым уровнем достоверности построенных нейронных сетей (математических моделей).

4.4. Интерпретация результатов

Не смотря на то, что имеются и другие таблицы «успешных» комбинаций функций с их собственными оценками погрешностей, мы обнаружили что приведённые ниже тенденции являются общими и могут быть взятыми за основу при создании обучаемых нейронных сетей имитации результатов банковской деятельности на основании демографо-экономических параметров местности:

1. Предпочитаемым типом нейронной сети должен быть выбран тип с прямой-каскадной связью от входа к выходу и с обратным распространением ошибки (Cascade-Forward backpropagation: к примеру, воплощённый в функции инициирования сети newcf пакета MATLAB)

2. При любой комбинации типов и функций организации нужной нам нейронной сети процесс обучения сети должен всегда осуществляться по алгоритму Левенберга - Марквардта (LMA-Levenberg-Marquardt Algorithm: к примеру, воплощённому в функ-

ции trainlm пакета MATLAB)* обратного распространения ошибки (англ. Backpropagation).

3. Независимо от типа нейронной сети, инициация её слоёв может происходить как по алгоритму Нгуена - Видроу (Nguyen-Widrow: к примеру, воплощённому в функции initnw), так и по общему алгоритму случайной инициации весов и смещений (Weights & Biases: к примеру, воплощённому в функции initwb).

4. Оценка поведения созданной нейронной сети должна осуществляться на основании подсчёта среднеквадратичной ошибки или погрешности (Mean squared error: к примеру, воплощённому в функции mse)

5. Спектр допустимых трансферных фукций достаточно широк.

6. Спектр допустимых адаптационных функций также широк.

5. Заключение

В результате исследования возможности построения оптимальной нейронной сети для имитации значений некоторых результатов банковской деятельности на основании выбранных демографо-экономических показателей местности нам удалось придти к следующим выводам:

1. При малом (или недостаточном) объёме статистических данных (количестве временных циклов) для выбранных входных и выходных переменных, оптимальная нейронная сеть(если таковая вообще существует) может быть найдена/построена автоматически, используя какой-либо готовый аппарат нейро-сетевого моделирования (к примеру широко известного пакета MATLAB) путём простейшего перебора всех комбинаций доступных (реализованных в функциях данного пакета) алгоритмов и методов инициации, тренировки, адаптации (и других функций)нейронных сетей до достижения наилучшего результата.

2. Предложенный подход позволяет обойтись минимальным багажом теоретических знаний в области нейросетевого моделирования, так как аппарат специализированных пакетов (таких как, к примеру, МАТЛАБ) достаточно оснащён автоматическими проверками совместимости сочетаемых методов между собой и, в случае недопустимой их комбинации, производит автоматические

замены. Это позволяет сконцентрироваться на экономическом содержании модели в максимальной степени.

3. «Нормализация» данных по показателям с большим разбросом значений должна осуществляться не для всего набора в целом, но индивидуально и независимо по каждому из них (показателей). Результат такой «нормализации» должен удовлетворять двум критериям:

a. все данные должны лежать в интервале значений от -1 до 1

b. порядок значений по каждому из показателей должен быть сопоставим с порядками значений по всем другим показателям

4. Во избежание эффекта «over fitting», результирующая нейронная сеть должна быть оценена по следующим четырём показателям:

a. Оценка ошибки результата на тренировочном наборе данных (как например значение perf в пакете MATLAB)

b. Оценка ошибки результата на проверочном наборе данных (как например значение vperf в пакете MATLAB)

c. Оценка ошибки результата на тестовом наборе данных (как например значение tperf в пакете MATLAB)

d. Оценка ошибки результата на полном (об'единенном) наборе данных (как например значение функции «perform» в пакете MATLAB).

5. Попытки оптимизации нейронной сети должны продолжаться до тех пор пока оценка ошибки результата на полном наборе данных не составит меньше четырёх-пяти процентов.

Литература:

1. Контос Е.Г. «Новые Методы Прикладного Математического Моделирования в Банковской сфере» публикация в электронном научном журнале "Управление экономическими системами", №7, 2013 год

2. Demuth H., Beale M. «Neural Network Toolbox For Use with MATLAB» User's Guide, Version 4, 2002 год

3. Technologic: Команды функции и операторы ппп neural network toolbox (http://nejroseti.ru/komandy-funkcii-i-operatory-ppp-neural-network/)

МЕТОДИКА АНАЛИЗА ЗАТРАТ НА ОБЕСПЕЧЕНИЕ ФУНКЦИОНИРОВАНИЯ СРЕДСТВ

СВЯЗИ

Ломакин М.И., д.э.н., профессор Миронов А.Н., д.т.н., профессор Бакасов С.Р.

В статье предложена методика анализа затрат на обеспечение функционирования средств связи, в рамках которой выполняется совместное рассмотрение процедур анализа затрат и показателей надежности средств связи, включая оценивание степени влияния составляющих затрат на показатели готовности с последующим ранжированием составляющих затрат по степени влияния на показатели надежности.

Ключевые слова: анализ, затраты, функционирование, средства связи, надежность.

COST ANALYSIS METHOD FOR PROVIDING MEANS OF COMMUNICATION

Lomakin M., Doctor of Economics, Professor Mironov A., Doctor of Engineering Science, Professor Bakasov S.

The paper proposed a method for analysis of the costs of running the means of communication, through which runs a joint review of procedures for the analysis of costs and the reliability of communication , including the evaluation of the degree of influence on the performance of cost components of readiness rankings , followed by cost components in terms of impact on reliability.

Keywords: analysis, cost, function, connectivity, reliability.

Обеспечениеэффективношфункционированияразличныхсредствсвязи (СС) предполагаетанализвложений средстввподдержаниерабо-тоспособногофункционирования СС. В связи с этим возникает задача разработки методики анализа затрат на обеспечение функционирования СС. Данная методика предполагает совместное рассмотрение процедур мониторинга затрат и показателей надежности СС, включая оценивание степени влияния составляющих затрат на показатели готовности с последующим ранжированием составляющих затрат по степени влияния напоказатели надежности.

Основными задачами методики являются:

- анализ структуры затрат;

- выделение переменных составляющих затрат;

- оценивание взаимных корреляционных функций между временными рядами показателей надежности и затрат;

i Надоели баннеры? Вы всегда можете отключить рекламу.