Научная статья на тему 'О применении метода главных компонент в задачах финансового мониторинга'

О применении метода главных компонент в задачах финансового мониторинга Текст научной статьи по специальности «Экономика и бизнес»

CC BY
637
145
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МЕТОД ГЛАВНЫХ КОМПОНЕНТ / ПРОТИВОДЕЙСТВИЕ ОТМЫВАНИЮ ПРЕСТУПНЫХ ДОХОДОВ / УПРАВЛЕНИЕ В СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ СИСТЕМАХ / НАЦИОНАЛЬНАЯ ЭКОНОМИЧЕСКАЯ БЕЗОПАСНОСТЬ / ФАКТОРНЫЙ АНАЛИЗ / ФИНАНСОВЫЙ МОНИТОРИНГ / PRINCIPAL COMPONENT ANALYSIS / ANTI-MONEY LAUNDERING / MANAGEMENT IN SOCIAL ECONOMIC SYSTEMS / NATIONAL ECONOMIC SECURITY / FACTOR ANALYSIS / FINANCIAL MONITORING

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Денисенко Андрей Сергеевич, Крылов Григорий Олегович, Корнев Иван Александрович

Эффективное развитие национальной экономики требует своевременного реагирования и мониторинга обстановки. В задаче оценки эффективности предпринимаемых экономических и законодательных мер могут помочь объективные характеристики исследуемых объектов. Ранжирование объектов (компаний) по степени их бизнес-активности позволит выделять и проводить мониторинг динамики её изменения. В работе исследован процесс и результаты анализа методом главных компонент данных по финансовым потокам компаний и аффилированных с ними лиц отдельной отрасли экономики, синтезированы рейтинговые оценки активности в отраслях экономики в разрезе регионов. Результаты интегрированы в процесс визуально-сетевого анализа отрасли экономики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Денисенко Андрей Сергеевич, Крылов Григорий Олегович, Корнев Иван Александрович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ADAPTATION OF PRINCIPAL COMPONENT ANALYSIS TO FINANCIAL MONITORING TASKS

National economics needs well-timed reacting and situation monitoring for effective growing. Objective characteristics of prototype system may help in an evaluation task of effectivity of acceptable economical and legislative measures. The ranking of objects (companies) according to their business activity will allow to choose and carry out monitoring of dynamics of their changing. The process and results of the principal component analysis of data on financial streams of companies and affiliated with them organisations in separate sector of economy are investigated and the ranking evaluations of activity in economic sectors are synthesized in this work. The results have been integrated into the process of visual-net analysis of economical sector.

Текст научной работы на тему «О применении метода главных компонент в задачах финансового мониторинга»

УДК 519.25

О ПРИМЕНЕНИИ МЕТОДА ГЛАВНЫХ КОМПОНЕНТ В ЗАДАЧАХ ФИНАНСОВОГО МОНИТОРИНГА

© 2015 А.С. Денисенко, Г.О. Крылов, И.А. Корнев

Федеральная служба по финансовому мониторингу, г.Москва

Поступила в редакцию 30.07.2015

Эффективное развитие национальной экономики требует своевременного реагирования и мониторинга обстановки. В задаче оценки эффективности предпринимаемых экономических и законодательных мер могут помочь объективные характеристики исследуемых объектов. Ранжирование объектов (компаний) по степени их бизнес-активности позволит выделять и проводить мониторинг динамики её изменения. В работе исследован процесс и результаты анализа методом главных компонент данных по финансовым потокам компаний и аффилированных с ними лиц отдельной отрасли экономики, синтезированы рейтинговые оценки активности в отраслях экономики в разрезе регионов. Результаты интегрированы в процесс визуально-сетевого анализа отрасли экономики. Ключевые слова: Метод главных компонент, противодействие отмыванию преступных доходов, управление в социально-экономических системах, национальная экономическая безопасность, факторный анализ, финансовый мониторинг.

1. ПРОБЛЕМАТИКА

В качестве исходного массива были использованы статистические показатели по финансовым потокам компаний рыбопромышленного комплекса. Кроме того, в массив признаков включены сведения о транзакциях руководителей компаний, их учредителях. Требуется получить количественные оценки об уровне финансовой активности компаний в заданной отрасли экономики региона.

Каждый из объектов задан упорядоченным набором показателей. Практика часто сталкивается с подобными задачами, поскольку результаты наблюдения, как правило, представлены векторами:

X = (X, X, ...,X), где X = (x.(1), x.(2),...,x.(p))T (1) - вектор значений анализируемых признаков (свойств) x.(1), x.(2),...,x.(p), присущих i-му объекту.

Здесь мы сталкиваемся с фундаментальной проблемой: в математике операция сравнения векторов по принципу «больше-меньше» не определена. Следовательно, требуется скаляризация векторных показателей.

Разрешением ситуации может являться переход от x(1), x(2),...,x(p)к z'(1), z'(2),...,z'(p),p"«p [1]. Существует ряд методов по снижению размерности исходных данных. Часть информации теряется, однако грубые оценки оказываются вполне достаточными и позволяют быть корректно интерпретированными. Этому способствуют следующие предпосылки [2]:

Денисенко Андрей Сергеевич, аспирант НИЯУ МИФИ. E-mail: real_lkr@mail.ru

Крылов Григорий Олегович, доктор физико-математических наук, профессор Финансового университета при Правительстве Российской Федерации. Корнев Иван Александрович, аспирант НИЯУ МИФИ.

• дублирование информации коррелированных признаков;

• низкая информативность признаков, имеющих малую вариабельность;

• возможность агрегирования, т.е. простого или «взвешенного» суммирования по некоторым признакам.

2. КРАТКИЙ ОБЗОР МЕТОДОВ СНИЖЕНИЯ РАЗМЕРНОСТИ

Методы, основанные на экспертных оценках (экспертно-статистически методы)

Основной идеей методов данной группы является скалярное снижение размерности многокритериальной системы.

Главным недостатком метода является то обстоятельство, что получение интегрального показателя связано не со статистической информацией об объектах, но на использовании экспертных оценок анализируемого свойства. Экспертные оценки являются субъективными в силу ряда причин, среди которых: политизированность экспертов, их квалификация и личные симпатии, что неизбежно сказывается на конечном результате.

Многомерное шкалирование

Многомерное шкалирование представлено набором методов, позволяющих по заданной информации о мерах различия (близости) между объектами рассматриваемой совокупности приписывать каждому из этих объектов вектор характеризующих его количественных показателей; при этом размерность искомого координатного пространства задается заранее, а «погружение»

в него анализируемых объектов производится таким образом, чтобы структура взаимных различий (близостей) между ними, измеренных с помощью приписываемых им вспомогательных координат, в среднем наименее отличалась бы от заданной в смысле того или иного функционала качества. Процедуры многомерного шкалирования применяются, когда данные заданы в виде матрицы попарных расстояний между объектами или удаленностей или их порядковых отношений.

В этом случае исследователь располагает в качестве массива исходных статистических данных матрицей размера п 'п, если рассматриваются характеристики попарной близости объектов или р 'р (если рассматриваются характеристики попарной близости признаков вида

Р = (рц) ¡, ] = 1,2...т, т = п или т = р. (2)

где величины г.. интерпретируются либо как расстояния между объектами (признаками) г и/, либо как ранги, задающие упорядочение этих расстояний. Задача многомерного шкалирования состоит в том, чтобы «погрузить» наши объекты (признаки) в такое р'-мерное пространство (р'«шт(р, п)), то есть так выбрать координатные оси 0т(1), ...,0т(р') чтобы исходная геометрическая конфигурация совокупности анализируемых точек-объектов (или точек-признаков), заданных с помощью (1) или (2), оказалась бы наименее искаженной в смысле некоторого критерия средней «степени искажения» взаимных попарных расстояний.

Метод экстремальной группировки признаков и метод корреляционных плеяд

Метод экстремальной группировки предполагает объединение совокупности исходных показателей в заданное число таких р' групп Б, ...,Бр,, что признаки, принадлежащие одной группе, были бы взаимокоррелированы сравнительно сильно, в то время как признаки, принадлежащие к разным группам, были бы коррелированы слабо. Одновременно решается задача замены каждой (г-й) группы сильно взаимокоррелированных исходных показателей одним вспомогательным «равнодействующим» показателем т<{), который, естественно, должен быть в тесной корреляционной связи с признаками своей группы. Метод корреляционных плеяд, так же как и метод экстремальной группировки, предназначен для нахождения таких групп признаков—«плеяд», когда корреляционная связь, т. е. сумма модулей коэффициентов корреляции между параметрами одной группы (внутриплеяд-ная связь) достаточно велика, а связь между параметрами из разных групп (межплеядная) — мала. По определенному правилу по корреляционной матрице признаков образуют чертеж—граф, который затем с помощью различных приемов разбивают на подграфы. Элементы, соответствующие каждому из подграфов, и образуют плеяду.

Факторный анализ

Методы факторного анализа основаны на общей базовой идее, в соответствии с которой структура связей между ранализируемыми признаками x(1), x(2),..., x(p) может быть объяснена тем, что все эти переменные зависят (линейно или как-то иначе) от меньшего числа других, непосредственно не измеряемых («скрытых», «латентных») факторов f(1), f(2),..., f(p') (р' <р), которые принято называть общими (common factors) и которые в большинстве моделей конструируются так, что они оказались взаимно некоррелированными. При этом в общем случае, естественно, не постулируется возможность однозначного (детерминированного) восстановления значений каждого из наблюдаемых признаков x(j) по соответствующим значениям общих факторов f(1), f2),..., f(p') (в предположении, что мы их умеем вычислять): допускается, что каждый из исходных признаков зависит также и от некоторой «специфической» (для него) остаточной случайной компоненты u(j), которая и обуславливает статистический характер связи между x(j) с одной стороны, и f(1), f2),..., fp,) - с другой.

Модель факторного анализа объясняет структуру связей между исходными показателями x(1), x(2),..., x(p) тем, что поведение каждого из них статистически зависит от одного и того же набора общих факторов/1, f2),..., fp,)

где „ - «нагрузка» общего фактора на исходный показатель х^, аи'^ остаточная «специфическая» случайная компонента, причем М[ /Ы] = 0, = 0,0[/и,::'] = 1, ир,р, и<»,

и<2>,..., н®попарно не коррелированы.

Метод главных компонент

Во многих задачах обработки многомерных наблюдений и, в частности, в задачах классификации исследователя интересуют в первую очередь лишь те признаки, которые обнаруживают наибольшую изменчивость (наибольший разброс) при переходе от одного объекта к другому. С другой стороны, для описания состояния объекта, не обязательно использовать какие-либо из исходных, непосредственно замеренных на нём признаков. Так, например, для определения специфики фигуры человека при покупке одежды достаточно назвать значения двух признаков (размер, рост), являющихся производными от измерений ряда параметров фигуры. Если при конкретизации постановки задачи снижения размерности в качестве класса допустимых преобразований определить всевозможные линейные

ортогональные нормированные комбинации исходных показателей, т.е. [3]

¿}\Х = су1(Х1) + ... + ср{Хр) -м{р)) ;

1^ = 1, ] = 1,2,..., р;

У=1

р

I с]У скх

v=l

СЛ = 0, У,к = 1,2,---Р У* к>

здесь т(п>=Е[х(п>] - математическое ожидание х(п), а в качестве меры информативности I (2) вы-

брать выражение Iр ( Z( X) =

I о-

/ =1

(здесь Э

I о

1 =1

X

означает знак вычисления дисперсии соответствующей случайной величины), то мы перейдём к р'главным компонентам и определим метод главных компонент.

Таким образом, МГК является совокупностью линейных ортогональных преобразований. Целью метода является снижение размерности многомерных данных, сохраняя максимально возможную информативность. При анализе данных методом главных компонент анализу подвержен только массив исходных данных (разновидность методов «без учителя», без каких-либо указаний целевых параметров).

Первой главной компонентой т(1)(Х) исследуемой системы показателей Х =(х(1), х(2),..., х(р))' называется такая нормированно-центрированная линейная комбинация этих показателей, которая среди всех прочих нормированно-центрирован-ных линейных комбинаций переменных х(1), х(2), ..., х(р) обладает наибольшей дисперсией. И далее: к-й главной компонентой (к = 2,..., р) исследуемой системы показателей Х называется такая норми-рованно-центрированная линейная комбинация этих показателей, которая не коррелирована с к — 1 предыдущими главными компонентами и среди всех прочих нормированно-центрирован-ных и не коррелированных с предыдущимик — 1 главными компонентами линейных комбинаций переменных х(1), х(2),..., х(р) обладает наибольшей дисперсией. Главные компоненты могут использоваться при решении следующих основных типов задач анализа данных [4]:

1) упрощение, сокращение размерностей анализируемых моделей статистического исследования зависимостей или классификации с целью облегчения счета и интерпретации получаемых статистических выводов;

2) наглядное представление (визуализация) исходных многомерных данных, получаемое с помощью их проецирования в пространство, натянутое на первую, первые две или первые три главные компоненты;

3) предварительная ортогонализация объясняющих переменных в задачах построения регрессионных зависимостей как средство устранения мультиколлинеарности;

4) сжатие объемов хранимой статистической информации;

Вышеприведённые достоинства положительно выделяют этот метод среди прочих методов снижения размерности.

За пределами рассмотрения остались методы снижения размерности путём выбора наиболее информативных показателей при использовании различных статистических методов, таких как дискриминантный анализ и регрессионный анализ, так как они не являются универсальными.

Интерпретация метод главных компонент заключается в переходе к новой системе координат, где осями служат главные компоненты распределения. Простейший двумерный случай представлен на графике.

Указанные свойства положительно выделяют метод главных компонент перед другими методами снижения размерности.

Геометрическая интерпретация МГК состоит в перемещении начала координат в центр рассеяния. Главными компонентами являются полуоси гиперэллипсоида. График (рис. 1) демонстрирует простейший двумерный случай.

Рис. 1. Геометрическая интерпретация метода главных компонент

При реализации метода главных компонент важнейшее значение имеет интерпретация полученных результатов, интерпретация найденных главных компонент.

Ниже представлена корреляционная матрица исходных признаков (табл. 1).

Наблюдается сильная корреляция между переменными, характеризующими финансовую составляющую деятельности руководителя компании. На основе этой матрицы получены дисперсии 5 главных компонент, а также коэффициенты корреляции (табл. 2) исходных показателей с главными компонентами (внутренними факторами).

Таблица 1. Корреляционная матрица

Company Manager Founders

Pip Jùtizr а Ь с foreign cu гтгпгу opérât in n s a Ь с d foreign сигтеп су с peratnna a b t foreign сигтеп су с peratnni

Рсри ati= г ' КЮЮ 0<II№)3 ■fl.dÈJîTt 0<И2ИЗ 0 №й73 С WXd'i a OIEÎIS омпнг Û OOW O0USH (i Û D1ÜI7J ■j OÏÏ7H

а Й.«17М! 1 WKÍ4 O.UÍÍIÉ G изунз t.JMÎU □.IMÛ5 ».(КЯЗТ t mu O.HrtSi (.«7ÍSI 0 POPOW? моя tll№

Ь i.WWS Í.WU15 Vi™ O.MÏSJS í.mjjt Ц.ШИМ Í.WKW ■о.игиг ».m щ t.wiws (ИП17 ■d.WHMÎ P.WP5W M1JW7

Com рагу с ■o.Kssre ЩВИ 0.ИН1! 1«™ 0.2(39» 0.2ЭММ 4.15H17 O.OÍ7W2 (№5*7 OOÙHfl O.tfjffil 0070716

foreign currency с peratnn s J.ilMli H.SÍBMi &.1UÍÜ frÜHM 1.UÚC0Ú (.mili ■4.MM1Í it. mm íhWVHí Î.OJ3Ï17 l.№№ D 31ÍS31 ЛМ1401

а -и.юят: Í.1KWI1 ОПИИ в.гщетч l.HÜJJ !.№»« Л75Ж1 ».л«« 1.W)7Ï2 (.0ИЛ1Т P.Í377 57 (.(7D5Ç1 4ЦШ2Л

Ь -í.fffiirí Í.HJ1SI в.тие ».НИИ J.WW1S H.ÎHW i.wmxi 1.К71И5 Uit* мши (.«ISSU (.(7ИЙ OM:HI

Manaçier с noiasis um ».«гит Î.ÎÎ7172 С W0S12 Q.IU321 tana 1МПИ ДОЯМ -».««ni 0 01S22 Í.MTOJ C.OMMJ Htm

d -И.В1ВЩ lim« Í.1711S5 USCHI я пали Ü.3WHIS ».»11» g.raw 1 (КНЮМ 1.ИИИ5 «.КПП B.B11H6 l.tTîlls 00ЩВГ1

foreign currency operations в J10ÎK í. Ч!«3 Í.MIM3 í.osrare 127 WS WW! «DK» ■а.ния! 1.00ИИ (171Кв g.wnw (SM) 0.13ÜÍ7

a ипм íjKmi rillifl o ti vir a.gmir OÚlfcSiJ ЩЩЯ iesirn HTlMO 1 fiVttW Í.ÍSÍSS! Í.HÍI71 0 lííiilfi

Founders b ■ D D1J4IS D.ngïtiçç -D.W1HH i.wwgï а.мгем: П.ПЗГГЕ7 D.HÇJ7T U.U.','33 IJ.ÜI141B P.WWQ1 o.íWW 1.ШИИ» n.jMBra LIÜIEÄJ

с íüiaiTj ciujîje OJWÜW 0.0TB83 a o uw i í.[74Kt DLHtUS Л.«470) №м 0.221МЭ 0ÍM171 0¿Í«7É 1.Ю00Ю 02392 TU

foreign currency с peratnn s ■0 0ЛТ35 0 OIMO? о.вн™ OOOÜCí ■0.в«»1 Л. МИШ ■a.Mtifflr S 0&Л7: îinui 11S6HS д.ини 1ЖЛ 1 OHIO«

Таблица 2. Оценки коэффициентов корреляции между исходными признаками и главными компонентами

PCI PC2 PC3 PC4 PCS

Company a о.звзгзг 0,555072 0,630701 0,295075 -0,013248

b 0.365293 0.514337 0.582604 0.389123 0,174214

c 0,484944 0.175408 0,210193 ■0,042923 -0,406711

foreign currency operations 0,212330 0.343185 0.321652 -0,339027 -0,249639

Manager a 0 833183 -0.379216 -0.048119 0.032023 0,023212

b 0,033784 ■C .446771 ■0,092744 0 088446 0,023651

c 0.809568 -С .435356 -0,091851 0.069343 0,017623

d 0,499476 0.063103 0.135004 0,377423 0.246909

foreign currency operations 0,233785 0,390075 0.036852 -0,660422 0,169638

Founder a 0,257546 0.573406 -0,556946 0,137181 -0,065336

b 0,195031 0.413292 -0,600666 0,335025 -0,040844

c 0,234392 0.516553 -0,582977 0.015005 0,092575

foreign currency operations 0,103180 0.256319 -0,208605 -0,367998 0,033155

population -0,02+475 0.005908 0С62Э49 0.107544 0,822029

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В результате применения метода главных компонент выделены 12 главных компонент. Диаграмма иллюстрирует вклад каждой компоненты в общую дисперсию данных (рис. 2).

Согласно критерию Кайзера, первые 5 главных компонент являются наиболее информативными. Они описывают более 73% общей дисперсии в данных.

Согласно матрице факторных нагрузок можно сделать следующие предварительные выводы.

Анализ исходных данных позволил провести интерпретацию факторов.

1-я главная компонента биполярна. Наблюдается её положительная корреляция со всеми переменными, характеризующими её финансовую активность. Наибольшая положительная

Рис. 2. Вклад главных компонент в общую дисперсию

корреляция наблюдается с признаками руководителя (0,5 - 0,84), и малая отрицательная - с численностью населения в регионе регистрации компании. Подобная корреляция может быть интерпретирована следующим образом: при равных показателях финансового потока, чем меньше население, тем выше на душу населения региона активность компании и аффилированных с ней лиц.

2-я главная компонента биполярна: положительно коррелирует с переменными учредителя и безналичными переводами на добывающую компанию, и, вместе с тем, отрицательно с руководителем. Имеет место предположение о том, переменная отражает характер распределения поступающих в отрасль средств: чем больше средств поступает на учредителя и добывающую компанию, тем меньше их поступает на руководителя. Меньшее значение главной компоненты характеризует большее поступление средств на руководителя.

3-я главная компонента также биполярна: имеет отрицательную корреляцию с переменными учредителя и руководителя, и положительную - с переменными добывающей компании. Следовательно, чем больше значение главной компоненты, тем больше объёмы поступлений на счета добывающей компании и меньше поступлений в адрес её руководителя и учредителей.

4-я ГК биполярна: характеризует валютные операции всех участников, причём валютные операции коррелируют с операциями с наличностью, что закономерно, поскольку определённая часть операций руководителя с наличными является валютно-обменными операциями.

5-я ГК преимущественно коррелирует с переменной населения региона.

Таким образом, 1-я главная компонента, характеризующая 23% дисперсии, является внутренним фактором, который описывает

именно ту часть дисперсии, которая является информативной с точки зрения отражения уровня активности компании, её руководителя и учредителей, с учётом численности населения региона регистрации компании. Её вклад в общую дисперсию - 23%.

Решение обратной факторной задачи

Синтезируем рейтинговые оценки уровня бизнес-активности (финансово-хозяйственной активности) компаний с использованием 1-й главной компоненты.

Каждая главная компонента является неким новым общим свойством всех объектов исследуемой выборки. Каждая компонента является функцией особенностей каждого из изучаемых объектов. Обычно исследователь имеет дело с ситуацией, когда одна главная компонента связана с одним или несколькими признаками. Таким образом, особенно важно получение значений главной компоненты для каждого наблюдения. Это позволит ранжировать и классифицировать объекты по полученным рейтинговым оценкам.

Обратимся к модели метода главных компонент и развернём равенство:

п

у = I a ]Г fr для ¡-ого признака:

г=1

уЦ*...*^

Выразим значения главных компонент через значения признаков. Для г-й компоненты [24]:

1

f = h ^У + ^2 ^пУП .

Ниже представлены синтезированные рейтинговые оценки уровня бизнес-активности каждой компании в отрасли, полученные с использованием 1-й главной компоненты по формуле, приведённой выше.

Таблица 3. Матрица счетов (1-я главная компонента)

№ Company Score

1 OOO Компания 1 69.35441

2 OOO Компания 2 22.06919

3 OAO Компания 3 15.75709

4 OOO Компания 4 11.84502

5 OAO Компания 5 10.41410

6 OOO Компания 6 9.53931

OOO Компания 7 9.29094

Идентификация компаний, имеющих наивысшую активность

1-я главная компонента характеризует уровень бизнес-активности. Чем выше её значение для отдельной компании, тем выше уровень её активности.

Интерес представляют компании, имеющие наивысшую активность. Научный смысл задачи заключается в определении доверительного интервала для мат.ожидания. Поскольку по определению метода главных компонент = О, оценка доверительного интервала для среднего ц выборки может быть оценена по формуле:

11 ±^¿ = 0,00 ±0,069.

Диапазон между границами доверительного интервала содержит около 90% компаний. Эти компании имеют наименьшую активность. Следовательно, оставшиеся 10% компаний имеют наибольшую активность.

Анализ природы распределения идентифицированной совокупности

Положим за гипотезу о зависимости количества компаний от их рейтинговых оценок (Н0) предположение, что выборка может быть асимптотически аппроксимирована логнормальной функцией:

Гипотеза подтверждается критерием хи-квадрат и критерием согласия Колмогорова. График (рис. 3) демонстрирует, что кривая

логнормальной теоретической функции асимптотически аппроксимирует дискретные эмпирические данные.

Другим известным методов иллюстрации корректности гипотезы является график К-К (квантиль-квантиль, рис. 4). График ниже иллюстрирует квантили эмпирических данных и теоретической логнормальной функции.

Физический смысл логнормального распределения тесно связано с повторяющимся делением целого на части [5].

В качестве классической задачи, иллюстрирующей природу распределения, можно привести следующую. Предположим, землевладелец делит имущество среди наследников. Далее эти наследники делят то же имущество среди своих наследников, и так из поколения в поколение. Какое распределение будет иметь размер состояния через несколько поколений? В среднем состояние становится, конечно, меньше, нам интересен характер распределения. Если Т. - случайная величина размера состояния в ¡-м поколении, то ы.+1 — доля состояния отца, которая достаётся случайно выбранному наследнику следующего поколения. Если пропорции деления наследства в некоторой мере случайны и существует требуемая независимость между поколениями, то на основании изложенного можно ожидать, что распределение будет асимптотически логнор-мальным. Аналогичную аргументацию можно применить при рассмотрении повторяющегося деления любой количественно выраженной величины. Например, общество при изучении делится на все более мелкие группы, численность которых в пределе имеет приближённо логнормальное

Рис. 3. Асимптотическая аппроксимация эмпирических данных логнормальной функцией

Рис. 4. Квантили эмпирических данных и теоретической логнормальной функции

распределение. Как отмечено Айтинсоном и Брауном (1957), эти идеи приводят к разработке теории группирования, в соответствии с которой группы получают путём последовательного деления. Например, при изучении контингента рабочих они вначале подразделяются по уровню квалификации, по полу, затем по уровню физического труда и т.д. Распределение численности рассматриваемых групп может быть асимптотически логнормальным.

Таким образом, чем выше уровень бизнес-активности представляет группа компаний, тем меньше компаний в этой группе. Убывание количества компаний в группах с ростом рейтинговых оценок может быть асимптотически аппроксимировано логнормальной функцией.

4. ИСПОЛЬЗОВАНИЕ РЕЗУЛЬТАТОВ

Использование результатов анализа данных методом главных компонент при визуально-сетевом анализе

Экономические отношения между компаниями анализируемой отрасли визуализированы в виде неориентированного графа. Компании объединены в кластеры в зависимости от их специализации в отрасли. Наиболее активные компании отмечены красным цветом на схеме ниже (рис. 5).

Результаты МГК на детальной схеме при проведении анализа отдельных объектов представлены на рисунке ниже (рис. 6).

Положительным эффектом от полученных ре-

зультатов также является повышение оперативности анализа объектов - аналитику не требуется выявлять наиболее активных объектов «вручную» - они уже отмечены на схеме.

Таким образом, процесс анализа отрасли может быть существенно упрощён за счёт препро-цессорной обработки данных методом главных компонент.

Применение метода главных компонент позволило раскрыть роли и положение компаний идентифицированной совокупности в схемах цепочек собственников (рис. 7).

Успешное применение метода главных компонент для синтеза рейтинговых оценок уровня бизнес-активности позволило получить оценки регионального уровня (макроаналитические оценки).

Финансовые потоки данных по компаниям были агрегированы по регионам их регистрации. В результате анализа корреляционной матрицы выделены три главных компоненты. Для решения задачи синтеза интегральных оценок по регионам была выбрана 1-я главная компонента (как проекции показателей по каждому региону на 1-ю главную компоненту).

Визуальное представление информации является одним из наиболее эффективных путей её восприятия. По этой причине проведено цветовое кодирование оценок и их представление на карте региона (рис. 8). Карта содержит «снимок» активности компаний региона за определённый период. Регулярный мониторинг данных и их последующий анализ методом главных компо-

Рис. 6. Наиболее активные компании (результаты МГК) отмечены красным на схеме

Рис. 7. Роли компаний на схеме цепочек собственников

Рис. 8. Цветовое кодирование оценок регионов

нент позволит проводить анализ динамики интегральных показателей активности, что, в свою очередь, способствует решению задачи анализа эффективности предпринимаемых экономических и законодательных мер.

5. ВЫВОДЫ

В данной статье авторами проанализировано применение метода главных компонент для анализа данных о финансовых потоках компаний определённой отрасли. В ходе анализа выделены, интерпретированы главные компоненты. Обоснован выбор компоненты для решения обратной факторной задачи, в результате чего синтезиро-

ваны рейтинговые оценки бизнес-активности компаний. Кроме того, идентифицированы компании, имеющие наибольшую активность в отрасли. Авторами проанализирована природа их распределения в результате чего установлено, что зависимость между количеством компаний в группе и уровнем их активности (значением их рейтинговых оценок) может быть асимптотически аппроксимировано логнормальной функцией.

Получены интегральные оценки активности на уровне регионов в результате анализа методом главных компонент данных по региональным финансовым потокам.

В результате проведённого исследования авторы пришли к выводу об эффективности и

целесообразности применения метода главных компонент в качестве препроцессорного обработчика в решении различных прикладных экономических задач.

СПИСОК ЛИТЕРАТУРЫ

1. Бартоломью Д. Стохастические модели социальных процессов. М.: Финансы и статистика, 1985. 296 с.

2. Dubrov A.M., Mhitarian V.S., Troshin L.I.

Multidimensional statistic methods, M.: Finance and statistics, 1998.

3. Dubrov A.M. Data processing with the principal components analysis. M.: Statistics, 1978.-130p.

4. Andrukowich P.F. a. o. Abstract painting as a specific -Generale - Language. A Stat. Appr. To the problem// Metron XXIX. 1971. N 1-2.

5. Колмогоров A. H. О логарифмически нормальном законе распределения размеров частиц при дроблении. Докл. АН СССР. 1941. Т. 31, № 2. С. 99-101.

ADAPTATION OF PRINCIPAL COMPONENT ANALYSIS TO FINANCIAL MONITORING TASKS

© 2015 A.S. Denisenko, G.O. Krylov, I.A. Kornev

Federal Financial Monitoring Service, Moscow

National economics needs well-timed reacting and situation monitoring for effective growing. Objective characteristics of prototype system may help in an evaluation task of effectivity of acceptable economical and legislative measures. The ranking of objects (companies) according to their business activity will allow to choose and carry out monitoring of dynamics of their changing. The process and results of the principal component analysis of data on financial streams of companies and affiliated with them organisations in separate sector of economy are investigated and the ranking evaluations of activity in economic sectors are synthesized in this work. The results have been integrated into the process of visual-net analysis of economical sector.

Keywords: Principal component analysis, anti-money laundering, management in social economic systems, national economic security, factor analysis, financial monitoring.

Andrey Denisenko, Postgraduate, National Research Nuclear UniversityMEPhl. E-mail: real_lkr@mail.ru Grigory Krylov, Doctor of Physical and Mathematical Sciences, Professor of Financial University under the Goverment of the Russian Federation.

Ivan Kornev, Postgraduate, National Research Nuclear University MEPhl.

i Надоели баннеры? Вы всегда можете отключить рекламу.