Научная статья на тему 'Анализ паттернов в статике и динамике, часть 2: примеры применения к анализу социально-экономических процессов'

Анализ паттернов в статике и динамике, часть 2: примеры применения к анализу социально-экономических процессов Текст научной статьи по специальности «Экономика и бизнес»

CC BY-NC-ND
1269
201
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Бизнес-информатика
ВАК
RSCI
Область наук
Ключевые слова
ПАТТЕРНЫ ДАННЫХ / ДИНАМИЧЕСКИЙ АНАЛИЗ ПАТТЕРНОВ / КЛАСТЕРНЫЙ АНАЛИЗ / DATA PATTERNS / DYNAMIC PATTERN ANALYSIS / CLUSTER ANALYSIS

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Алескеров Ф. Т., Белоусова В. Ю., Егорова Л. Г., Миркин Б. Г.

Приводится обзор работ по анализу паттернов в применении к макроэкономическому анализу стран в динамике, к анализу банковских систем Турции и России, электорального поведения в Великобритании и Финляндии, инновационного развития регионов России в долгосрочной перспективе.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

METHODS OF PATTERN ANALYSIS IN STATICS AND DYNAMICS, PART 2: EXAMPLES OF APPLICATION FOR SOCIAL AND ECONOMIC PROCESSES ANALYSIS

A survey of pattern analysis applications for dynamic macroeconomic analysis of countries, analysis of banking systems in Turkey and Russia, electoral behavior in the United Kingdom and Finland as well as long-term innovative development of regions in Russia is presented.

Текст научной работы на тему «Анализ паттернов в статике и динамике, часть 2: примеры применения к анализу социально-экономических процессов»

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

АНАЛИЗ ПАТТЕРНОВ В СТАТИКЕ И ДИНАМИКЕ, ЧАСТЬ 2: ПРИМЕРЫ ПРИМЕНЕНИЯ К АНАЛИЗУ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ

Ф.Т. Алескеров,

доктор технических наук, руководитель Департамента математики факультета экономики Национального исследовательского университета «Высшая школа экономики», заведующий лабораторией Института проблем управления имени В.А. Трапезникова РАН

В.Ю. Белоусова,

кандидат экономических наук, заведующий отделом методологии бюджетного планирования Института статистических исследований и экономики знаний, доцент кафедры банковского дела Департамента финансов факультета экономики, с.н.с. Банковского института Национального исследовательского университета «Высшая школа экономики»

Л.Г. Егорова,

преподаватель Департамента математики факультета экономики Национального исследовательского университета «Высшая школа экономики»

Б.Г. Миркин,

доктор технических наук, профессор кафедры анализа данных и искусственного интеллекта отделения прикладной математики и информатики факультета бизнес-информатики Национального исследовательского университета «Высшая школа экономики»

E-mail: alesk@hse.ru, vbelousova@hse.ru, legorova@hse.ru, bmirkin@hse.ru Адрес: г. Москва, ул. Мясницкая, 20

Приводится обзор работ по анализу паттернов в применении к макроэкономическому^ анализу стран в динамике, к анализу банковских систем Турции и России, электорального поведения в Великобритании и Финляндии, инновационного развития регионов России в долгосрочной перспективе.

Ключевые слова: паттерны данных, динамический анализ паттернов, кластерный анализ.

1 Работа выполнена при финансовой поддержке Минобрнауки России по государственному контракту от 14.06.2012 г. № 07.514.11.4144 в рамках ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы». Исследование осуществлено в рамках программы фундаментальных исследований НИУ ВШЭ в 2012 году. Работа авторов была также поддержана рядом лабораторий НИУ ВШЭ: Лаборатория анализа и выбора решений (Алескеров Ф.Т., Белоусова В.Ю., Егорова Л.Г., Миркин Б.Г.), Лаборатория алгоритмов и технологий анализа сетевых структур (Егорова Л.Г., Миркин Б.Г.). Мы благодарны за эту поддержку.

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г.

3

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

1. Введение

В данной работе термин «паттерн» используется для обозначения комбинаций параметров значимых признаков, характерных для определённых групп объектов, соответствующих отличающимся от других типам поведения. В предыдущей части мы сделали обзор литературы в каждом из трёх основных аспектов этого понятия: использование понятия паттерн в науке и технике, методы кластер-анализа, динамика многомерных объектов, а также предложили уточнение этого понятия в эквивалентных, но когнитивноразличающихся терминах параллельных координат, конъюнктивных описаний и геометрических «боксов». Для данных о динамике функционирования социально-экономических объектов предложено использовать типологию функционирования объектов по частоте смены паттерна. Этот подход в данной части статьи будет применён к анализу реальных данных на основе использования формализма параллельных координат. В частности, будут рассмотрены проблематика сопоставительного макроэкономического анализа, функционирование банковского сектора в Турции и России в современных условиях, паттерны поведения избирателей в условиях многопартийной системы и проблемы инновационного развития регионов РФ в долгосрочной перспективе. Следует иметь в виду, что многие из конкретных исследований, отражённых в статье, были выполнены ещё до того, как в полной мере сложилось понятие паттерна, развиваемое в данной работе.

2. Анализ паттернов в параллельных координатах

Как было определено в первой части данной статьи [16], паттерн — это такая совокупность объектов, которая характеризуется определенной комбинацией значений показателей объектов.

Для визуального отображения процесса анализа и поиска паттернов в я-мерном пространстве обычно используется система параллельных координат [12, 13], состоящая из я параллельных линий, вертикальных и равномерно распределенных. Каждая из этих параллельных осей отражает один из я выбранных для кластеризации признаков. Каждый объект X (точка в я-мерном пространстве признаков) представляется в виде ломаной с вершинами на параллельных осях (помеченных названиями показателей); положение вершины на г-й оси

соответствует г-й координате точки, т.е. значению г-го показателя. Таким образом, для M объектов будет построено M ломаных линий.

Сами числа, то есть конкретные значения параметров, характеризующие объект, не всегда важны для выделения паттернов. Гораздо более важной часто является информация о соотношении параметров. Чтобы проиллюстрировать это, рассмотрим возможные результаты голосования на выборах в трех округах по данным табл. 1 [9].

Таблица 1.

Гипотетические результаты выборов

Партия 1 Партия 2 Партия 3

Округ 1 40 20 40

Округ 2 45 10 45

Округ 3 20 60 20

Объектами в этом случае являются округа, признаками — уровень поддержки трех политических партий, участвовавших в этих выборах. Эти данные изображены на рис. 1 в системе параллельных координат. Значения показателей были нормированы к 100% и представляют собой доли голосов, полученных партиями в ходе выборов.

Рис. 1. Результаты гипотетических выборов

Очевидно, что первый и второй округа голосуют больше за первую и третью партии, в то время как третий округ поддерживает вторую партию. Эти результаты разделяют все округа на две группы схожих объектов: в первой группе будут округа 1 и 2, показывающие практически одинаковый результат голосования, а во второй группе — только округ 3.

4

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Таблица 2.

Иллюстративная информация о банках

Доля привлеченных депозитов в активах банка Доля выданных кредитов в активах банка Доля валютных операций в активах банка

Банк 1 40 20 40

Банк 2 45 10 45

Банк 3 20 60 20

Если целью исследования является, например, оценка деятельности банка (табл. 2), тогда можно предложить следующую интерпретацию результатов. Рассмотрим основные операции коммерческого банка: привлечение депозитов, предоставление кредитов и расчетно-кассовые операции, из которых наиболее востребован обмен валюты. Показателями, измеряющими активность банков в области оказания данных услуг, будут соответственно доли привлеченных депозитов, выданных кредитов и валютных операций в активах банка. В табл. 2 на пересечении строк и столбцов находятся значения параметров, характеризующих деятельность банка на определенный момент времени. Так, 20% активности первого банка приходится на кредитные и 40% - на валютные операции, 40% суммарных обязательств банк финансирует за счет привлечения депо-

зитов. Если изобразить эти данные на параллельных осях (рис. 2), то можно видеть, что первые два банка похожи, в то время как банк 3, очевидно, следует иной модели поведения [17]. Здесь показатели были также нормированы к 100% и представляют собой доли этих операций в активах банка.

Далее на выборке объектов, представленных в виде векторов в пространстве признаков или в виде ломаных в системе параллельных координат, проводится кластеризация и получается разбиение всех объектов выборки по кластерам-паттернам. Напомним, что объекты внутри одного кластера-паттерна должны быть схожими, а объекты разных паттернов — различными.

На рис. 3 представлен пример двух различных паттернов, полученных в [4, 6-7]. Объектами в данной задаче являются филиалы одного банка, в качестве признаков для оценки эффективности деятельности филиала были выбраны такие критерии, как менеджмент (MNG), маркетинг (MKT), активность банка на рынках депозитов (DEP), кредитов (CRE) и операций с валютой (FX).

Кластер 1 (слева) содержит 207 объектов, кластер 2 (справа) содержит 9 объектов. Видно, что объекты внутри каждого кластера обладают сходными оценками по всем признакам и, следовательно, относятся к одному классу. Паттерны кластеров между собой заметно разнятся и очевидно, что характер деятельности филиалов банка из первого паттерна отличается от характера деятельности филиалов из второго паттерна.

В классических терминах кластерного анализа задачу определения типов паттернов можно представить следующим образом.

Пусть Х — множество объектов, Y — множество номеров (имён, меток) кластеров. Для формального описания понятия близости объектов задается функция расстояния (метрика) р(х,х') между объектами х,х'еХ. Для рассматриваемой конечной выборки объектов Хт ={xl,...,xm\czX требуется разбить ее на непересекающиеся подмножества, на-

Рис. 3. Пример кластерных кривых различных паттернов

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

5

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

зываемые кластерами, так, чтобы каждый кластер состоял из объектов, близких по метрике р, а объекты разных кластеров существенно отличались. При этом каждому объекту х. е Xm приписывается номер кластера у. .

Анализ паттернов — это такой кластер-анализ, при котором получаемые кластеры вполне адекватно описываются конъюнкциями некоторых значений или более точно — интервалов значений — некоторых признаков.

Как упоминалось выше, значения признаков в анализе паттернов не абсолютизируются — визуально паттерн определяется не столько положением объектов на осях, сколько углами наклона соответствующих линий. Чтобы выделить однородные группы среди всех объектов, необходимо оцени-вать объекты не по абсолютным значениям их признаков или параметров, а по углам наклона ломаных кривых, обозначающих объекты в системе параллельных координат. Такой алгоритм формирует кластеры, в которых система показателей для разных объектов имеет одну ту же структуру, хотя и отличается по абсолютному размеру. Например, если два изучаемых объекта А и В характеризуются векторами параметров (20; 50; 60) и (2; 5; 6), то при традиционной схеме кластерного анализа эти два объекта попадут в различные кластеры. Однако, если в кластеры объединяются объекты, похожие по структуре, то А и В попадут в один кластер [2-4, 6].

В частности, объекты выборки здесь могут характеризоваться не векторами значений, а кусочно-линейными функциями, характеризующими ломаные линии, проходящие через параллельные оси. Формально этот подход, впервые предложенный в [2], заключается в следующем.

Пусть X — множество объектов. Каждому объекту x е X поставим в соответствие я-мерный вектор Zx = jzf,.характеризующий объект x по я признакам, то есть его признаковое описание.

Построим по каждому вектору Zx ломаную, которая проходит через точки zx,—,Z^, то есть кусочнолинейную функцию

fx(t) ={kxt + ax,eaiu /< / < г'+l},

kxi + ax=zx, (j)

К (* + !) + < = Z-+X,i = —1.

Теперь каждому интервалу [i, i + 1] поставим в соответствие пару Vх = (**Х), и каждой функции

— вектор Vх = [V*В качестве расстояния между точками Vх' и Vх2 можно использовать евклидово расстояние, расстояние городских кварталов (манхэттенское расстояние) и др.

Далее одним из методов кластерного анализа проводим разбиение множества объектов {X. } так, чтобы ломаные внутри кластеров были похожи, а в разных кластерах находились «далеко» друг от друга в смысле выбранного расстояния. Для нахождения разбиения {X.}, можно использовать различные методы кластерного анализа (см. часть 1 данного обзора).

Кроме того, анализ паттернов данных позволяет не только получать информацию о текущем состоянии исследуемых объектов, но также и отслеживать происходящие с течением времени изменения и иметь наглядное представление о динамике развития объектов с учетом всех признаков, характеризующих паттерны.

Если доступна информация о количественных характеристиках объектов, измеренная в последовательные моменты времени t = 1, 2, ..., к, то задача выделения паттернов данных может быть выполнена для каждого момента времени. Тогда каждому объекту выборки х. е X ставится в соответствие последовательность номеров кластеров (траектория) {у) ,у* ,—,у\ г—гУ* }, к которым данный объект х. принадлежал в момент времени t. На основании полученных «траекторий развития» можно выделять динамические группы объектов, демонстрирующих одинаковое поведение и сходные характеристики в динамике.

Предположим, что в примере с результатами гипотетических выборов есть паттерны, построенные на итогах нескольких последовательных выборов. Каждый паттерн содержит линии, которые описывают определенный тип электоральной поддержки в округе, например, больше голосов отдается правым партиям и меньше — левым и националистам, или одинаковая поддержка правых и левых партий вместе с низким уровнем голосов за националистские партии. Если мы применим алгоритм кластерного анализа к результатам нескольких выборов, то получим паттерны для каждого голосования, и, возможно, типы электоральной поддержки, связанные с каким-то паттерном, будут повторяться, хотя этим паттерном в разные годы может описываться голосование в разных округах. Пусть в примере выборов из табл. 1 в момент времени T найдено два паттерна. Предположим, что на следующих выбо-

6

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

рах в момент времени T + 1 были другие результаты голосования (табл. 3).

Таблица 3.

Гипотетические результаты выборов в момент времени T + 1

Партия 1 Партия 2 Партия 3

Округ 1 35 30 35

Округ 2 38 24 38

Округ 3 40 20 40

Теперь уже второй и третий округ голосуют схожим образом, в то время как в округе 1 на выборах T + 1-го года произошли значительные изменения, и теперь распределение голосов между партиями в этом округе уже не подходит к первому паттерну, как, впрочем, и ко второму. На этих выборах появился новый паттерн электоральной поддержки.

После получения всех возможных паттернов поддержки избирателей на выборах интересно проанализировать, какой паттерн был выбран каждым округом в начале анализируемого периода, как он менял свои паттерны на последующих выборах. На рис. 4 по горизонтальной оси отложен год выборов, на вертикальной — паттерны.

Легко увидеть, что округ 1 сменил паттерн с 1 на 3, округ 2 остался верен паттерну 1, а округ 3 поменял паттерн 2 на паттерн 1. Для целей анализа и планирования предвыборных стратегий очень важно понять, какие округа сохраняют свои предпочтения, а какие меняют их с течением времени и почему. Применение методологии динамического анализа паттернов к результатам голосований на парламентских выборах в Велико -британии и к результатам финских муниципальных выборов описано в разделе 5 [1, 9, 20].

3 -

2 -

Паттерны

/\ округ 1

округ 3

\ округ 2

T T+1

Рис. 4. Паттерны голосований

Динамический анализ подразумевает также классификацию объектов в соответствии с устойчивостью выбранных ими паттернов. Как правило, все объекты разбиваются на несколько групп: абсолютно устойчивые, устойчивые, неустойчивые и абсолютно неустойчивые.

К группе абсолютно траекторно устойчивых объектов относятся те объекты, которые придержи -ваются одного паттерна в течение всего периода наблюдений. Если объекты меняли свои паттерны небольшое число раз (число допустимых изменений задается исследователем в зависимости от конкретной задачи и длины выборки), то они называются устойчивыми. Абсолютно неустойчивыми называются объекты, меняющие паттерны в каждый момент времени. Все остальные объекты относятся к группе неустойчивых объектов.

В качестве иллюстрации приведем результаты исследования [17]. Было проанализировано, насколько 100 крупнейших российских банков по валюте баланса придерживаются бизнес-модели, выбранной ими после кризиса 2004 г., на временном интервале I кв. 2005 г. — II кв. 2007 г. Если на протяжении 10 отчетных периодов (квартал) банк избирал одну и ту же бизнес-модель, его в [17] отнесли к категории абсолютно устойчивых. «Траектория» абсолютно устойчивых банков может быть представлена как упорядоченный ряд паттернов во времени, например, 1-1-1-1-1-1-1-11-1. Оказалось, что абсолютно устойчивых банков всего 24 (более подробно см. далее).

3. Применение метода анализа паттернов в макроэкономическом анализе

Опишем применение метода анализа паттернов для поиска связи между такими экономическими показателями как инфляция (inflation), темп роста денежной массы (growth rate of money), реальный объем производства (real output) и реальный объем производства на душу населения (real output per capita) на данных 119 стран [2,3].

В качестве оценки для денежной массы использовались показатели M1 (наличные деньги в обращении, а также чеки и вклады до востребования) и M2 (M1 плюс срочные вклады). Для оценки уровня инфляции учитывался индекс потребительских цен (то есть стоимость корзины товаров по CPI), а для оценки производства — валовый внутренний продукт — GDP, отражающий рыночную стоимость всех конечных товаров и услуг, произведенных за

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

7

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

год на территории государства. В табл. 4 приведены результаты первичной статистической обработки данных, а именно средние значения коэффициента корреляции указанных показателей по нескольким группам стран.

Таблица 4.

Коэффициенты корреляции между темпами роста денежной массы, индекса потребительских цен и ВВП

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

M1(M2)- CPI M1(M2)- GDP CPI- GDP Число стран

Все страны 0.99 (0.99) -0.08 (-0.06) -0.16 119

Страны ОЭСР 0.96 (0.97) 0.56 (0.57) 0.48 23

Страны G-7 0.76 (0.77) 0.12 (0.23) -0.31 7

Страны Латинской Америки 1.00 (0.99) -0.21 (-0.20) -0.25 30

На полной выборке из 119 стран (табл. 4) корреляция между темпом роста денежной массы и реальным объемом производства (в том числе и на душу населения), равно как и между инфляцией и реальным объемом производства, обнаружена не была. Проведенная кластеризация позволила выделить 6 групп стран, имеющих одинаковые паттерны соотношений между параметрами. Были рассчитаны коэффициенты корреляции отдельно для двух индикаторов денежной массы, для М1 (табл. 5) и М2 (табл. 6).

Таблица 5.

Коэффициенты корреляции между параметрами для М1

M1-CPI M1-GDP per capita CPI-GDP per capita Число стран

All 0.99 -0.12 -0.18 119

Cluster 1 1.0 0.20 0.15 12

Cluster 2 0.99 0.36 0.37 25

Cluster 3 0.98 0.16 0.28 40

Cluster 4 0.92 0.09 0.37 19

Cluster 5 0.88 0.60 0.86 12

Cluster 6 -0.28 0.33 0.46 6

Интересно, что в один кластер попали страны со схожими экономическими и политическими условиями. Так, второй кластер содержит 23 развивающиеся страны, имеющие высокую инфляцию и нестабильную политическую ситуацию: Боливию, Чили, Эквадор, и т.д. Состав стран в кластерах меняется незначительно — как правило, одни и те же страны группируются в одни кластеры в обоих случаях.

Для всех кластеров и выборки в целом показано, что существует положительная зависимость между ростом денежной массы, находящейся в обращении, и инфляцией. Однако на всей выборке корреляция между темпом роста ВВП и темпом роста инфляции не наблюдается. В свою очередь, внутри двух из шести кластеров данная взаимосвязь обнаружена для расчетов с М1 и внутри пяти кластеров — для М2.

Таблица 6.

Коэффициенты корреляции для параметров с М2

M2 -CPI M2-GDP per capita CPI-GDP per capita Число стран

All 0.99 -0.12 -0.18 119

Cluster 1 1.0 0.60 0.59 13

Cluster 2 1.0 -0.85 -0.87 7

Cluster 3 0.99 0.41 0.44 27

Cluster 4 0.98 0.33 0.44 33

Cluster 5 0.87 0.30 0.53 26

Cluster 6 0.74 0.65 0.91 10

Таким образом, эти результаты подтверждают гипотезу о том, что в каждом кластере страны используют различные механизмы разработки и реализации монетарной политики. Если данные паттерны не различать, то невозможно рассматривать дифференцированные механизмы экономического развития стран; виден лишь эффект общего характера — зависимость между эмиссией денежных знаков и инфляцией.

4. Применение метода анализа паттернов в банковской сфере

Применение метода паттернов для анализа структурных особенностей развития банковской системы проводилось в 1997-2004 гг. на данных Турции [5-8], а также для российских банков:

4- в период восстановления экономики и финансового сектора после кризиса 1998 г. — с первого квартала 1999 года по третий квартал 2003 года [18];

4 в период кризиса ликвидности 2004 г., а также кредитного бума и стабильного развития банковского сектора — с I квартала 1999 г. по II квартал 2007 г. [17];

4 в преддверии финансового кризиса 2008 г. и его активной фазы — с апреля 2007 года по март 2009 года [15, 17].

8

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Наиболее комплексный анализ бизнес-моделей российских банков в период с 2006-2009 с использованием метода паттернов представлен в [15].

Остановимся на описании некоторых проектов из этого цикла работ. В [21] для изучения развития российского банковского сектора, в частности, для определения структурных различий в банковской системе России, выявления тенденций и оценки состояния коммерческих банков, было исследовано 1018 кредитных организаций. Период анализа включал пять лет: с марта 1999 года по сентябрь 2003 года включительно.

Для использования предложенной методики в первую очередь потребовалось сформировать систему показателей, которая являлась бы отображением характеристик, описывающих различные стороны функционирования объекта. Например, для анализа функционирования банков в качестве основной концепции в [17] было предложено использовать модель CAMEL. Здесь деятельность банка характеризуется пятью его фундаментальными показателями: достаточностью капитала (C — Capital), качеством активов (A — Assets Quality), качеством менеджмента и системы управления (М — Management), прибыльностью (Е — Earnings) и ликвидностью (L — Liquidity).

При разработке данной системы показателей банковской деятельности во внимание принимались следующие соображения:

Ф’ выбранные показатели должны отражать особенности формирования финансового рынка и деятельности банковских учреждений в России;

ф- так как банковская система России является достаточно неоднородной по размеру составляющих ее учреждений, то систему показателей целесообразно строить на основе относительных показателей. Последнее снимает проблему размерности;

Ф’ анализ структурных различий строится на основе тех количественных показателей деятельности банка, которые имеются в открытом доступе.

С учетом всех перечисленных факторов и на основании проведенного анализа динамики российского банковского сектора примером системы финансовых коэффициентов, отвечающих модели CAMEL, может служить следующая система показателей (см. табл. 7), используемая в [17].

Был проведен статистический анализ коэффициентов и получен 151 паттерн, которые определяли поведение банков в динамике. На основе анализа паттернов исследовалось поведение 10 крупных и

около 250 небольших, но стабильных по структурным характеристикам, банков. Было выделено 66 банков, принадлежащих к 16 паттернам, характеризующихся стабильными траекториями развития.

Таблица 7.

Список показателей по системе CAMEL [17]

Достаточность капитала (САР) Собственный капитал / Валюта баланса

Качество активов (GOS) Вложения в госбумаги / Работающие активы

Качество менеджмента (MBK) Полученные МБК / Суммарные обязательства

Качество менеджмента (CRED) Кредиты коммерческим организациям / Работающие активы

Прибыльность (PR) Фактическая прибыль / Работающие активы

Ликвидность (LIQ) Ликвидные активы / Работающие активы

Полученные результаты позволили оценить степень однородности развития банковского сектора, его устойчивость, выявить тенденции развития, провести более глубокий анализ на уровне как группы финансовых институтов, так и отдельного банка с учетом реакции на изменение внешней среды, следования определенной стратегии развития, выявить конкурентные преимущества банков и проанализировать развитие рынка банковских услуг.

Кроме того, эндогенное выделение совокупностей банков, характеризующихся сходными неустойчивыми траекториями развития, позволило выявить информацию о слабых банках. Полученные результаты были полезны регулирующим органам для проведения превентивных мероприятий и отслеживания параметров развития банковской системы в целом и отдельных банков в частности.

В [15] представлен комплексный анализ бизнесмоделей ведущих, средних и малых российских коммерческих банков для наиболее актуального периода времени с учетом финансового кризиса 2007 г.: с 2006 г. по 2009 г. В его основе лежит группировка кредитных организаций по принципу однородности результатов их операционной и финансовой деятельности. При оценке бизнес-моделей учитывается структура активов и обязательств, уровень прибыльности и ликвидности банков. В этой задаче анализ был проведен для всех трех групп банков — крупные, средние и малые банки.

Показатель

Коэффициент

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

9

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

В качестве признаков для выделения паттернов были выбраны такие финансовые показатели, как достаточность капитала (C), качество активов (A), качество управления (M), прибыльность (E), ликвидность (L), т.е. модель CAMEL плюс более тонкие характеристики: структура пассивов (F) и характеристика портфеля ценных бумаг (S). Например, на рис. 5 представлены паттерны, полученные для банка «КИТ Финанс» в ходе анализа банковской системы России в период 2006 -2009 гг. в [15]. Каждый паттерн, как оказалось, соответствует определенной бизнес-модели.

--- 1 ... 2 ---3------4 ----5

Рис. 5. Паттерны банка «КИТ Финанс»

Всего за исследуемый период (16 кварталов) данный банк придерживался 5 различных бизнес -моделей. Половину рассматриваемого временного интервала банк придерживался первой бизнес-модели, характеризуемой достаточностью капитала на уровне 15%, просроченной задолженностью 7% и ликвидностью в пределах 40%. Убыточными бизнес-моделями стали для банка третья (которой банк придерживался на протяжении 4 кв. 2008 и 1 кв. 2009 г.) и пятая (2 кв. 2009 г.). Главной отличительной особенностью является уровень достаточности капитала (для третьей бизнес-модели — 10,7%, для пятой — 1,55%) и уровень ликвидности, который в два раза выше, чем у третьей модели поведения.

Деятельность банка «КИТ Финанс» была связана с инвестиционными операциями, которые, как показал мировой опыт, характеризуются высокой неопределенностью и часто приводят к финансовым потерям и списаниям с баланса убытков. В период кризиса, когда доверие инвесторов к инвестиционным активам резко падает, банк с подобной структурой операций теряет большин-

ство источников доходов, его финансовая устойчивость резко снижается, операции с ценными бумагами нужно либо приостановить, либо рассчитывать на еще большие убытки. В такой ситуации кредитной организации тяжело решить проблемы с убытками, и убыточность на протяжении нескольких периодов вполне объяснима, а на уровне крупных системно значимых банков — опасна, т.к. банкротство любого такого банка может привести к цепной реакции во всей банковской системе.

Применяя алгоритм кластерного анализа для данных, охватывающих нескольких периодов, мы получаем набор паттернов для каждого момента времени. Вполне возможно, что структура деятельности банков, описываемая различными паттернами, будет повторяться во времени, хотя на разных интервалах состав групп банков может меняться.

Таким образом, для каждого банка конструируются «траектории», которые показывают, какую бизнес-модель в определенный момент времени выбирает банк. Банки, имеющие одинаковые «траектории», составляют динамическую группу. Динамический анализ подразумевает также классификацию банков в соответствии с устойчивостью выбранных ими паттернов. Напомним, что при такой классификации все объекты разбиваются на несколько групп: абсолютно устойчивые, устойчивые, полуустойчивые, неустойчивые и абсолютно неустойчивые. К группе абсолютно устойчивых банков относятся те объекты, которые придерживаются одного паттерна в течение всего периода наблюдений. Если банки меняли свои бизнес-модели 1-2 раза за 10 отчетных периодов, то они называются полуустойчивыми. Абсолютно неустойчивыми называются банки, меняющие паттерны в каждый момент времени. Все остальные банков относятся к группе неустойчивых банков.

Абсолютно неустойчивый

Абсолютно устойчивый

10

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Например, в [17] абсолютно устойчивым считается банк, который одной и той же бизнес-модели на протяжении 10 отчетных дат (кварталов) (см. распределение банков по типам устойчивости на рис. 6).

Если в течение 10 отчетных периодов банк произвел 1—2 смены бизнес-моделей, его можно отнести к категории полуустойчивых. «Траектория» полуустойчивых банков может иметь следующий вид: 1-2-1-1-1-1-1-1-1-1. Доля полуустойчивых банков в общем объеме анализируемой выборки составляет 31%. Таким образом, чуть более половины отнесены к устойчивым банкам данных двух категорий.

Банк является абсолютно неустойчивым, если в течение 10 отчетных дат сменил 9 бизнес-моделей, например, 65-37-28-68-38-28-39-23-29-22. Доля таких в банковском секторе РФ невелика — 2%. Остальные банки (43%) отнесены к категории неустойчивых банков.

Распределение крупнейших банков по частоте смены паттернов представлено в табл. 8. Видно, что на те банки, которые сменили от 1 до 3 бизнесмодели, приходится 39% анализируемых банков. На банки, чья деятельность может быть описана числовыми значениями единственной бизнес-модели, — 24%. Таким образом, кумулятивный процент таких банков составляет 63%. Кумулятивный процент, равный 80%, достигается при включении банков, которые на протяжении последних 10 отчетных дат сменили четыре бизнес-модели.

Таблица 8.

Распределение крупнейших банков* по частоте смены бизнес-моделей

Частота смены бизнес-моделей Кумулятивное количество банков Кумулятивный процент

0 24 24

1 34 33

2 56 55

3 64 63

4 82 80

5 90 88

6 96 94

7 97 95

8 100 98

9 102 100

* Включая Сбербанк России и Внешторгбанк

Отметим, что устойчивость выбора банками бизнес-модели в течение рассматриваемого периода повышается: банки определяются со своей ры-

ночной нишей. Кредитные организации, которые аккумулируют практически 90% совокупных активов банковского сектора России на 01.01.2007 г., выбрали ориентацию на кредитование нефинансового сектора экономики, причем выполняют функцию финансового посредника с прибылью.

Таким образом, динамический анализ бизнесмоделей, выбираемых российскими банками, прояснил степень их устойчивости к условиям среды, позволил выявить тенденции их развития и определить, насколько банки ориентированы на кредитование нефинансового сектора экономики, т.е. выполняют ли они функцию финансового посредника.

Кроме этого, данный анализ показывает, насколько устойчива классификация банков по структуре операций и принимаемых ими основных финансовых рисков во времени. Таким образом, подтверждается гипотеза о том, что неоднородность российских банков необходимо учитывать в динамике, поскольку большинство банков из топ-100 с течением времени меняют свои бизнес-модели.

В [5-7] анализ паттернов данных был применен к задаче распределения персонала по филиалам турецкого банка Yapi Kredi Bank. Задача решалась в два этапа: на первом этапе все филиалы банка были разбиты на классы (паттерны) по микрорынкам, на которых они функционируют, на втором этапе осуществлялось ранжирование филиалов, описываемых одинаковыми паттернами, по эффективности их деятельности.

Распределение филиалов по патернам было необходимо для их адекватной оценки с учетом разной направленности деятельности филиалов. Во-первых, деятельность филиала зависит от географического положения и характеристик локального рынка, на котором он находится — какие банковские продукты и услуги востребованы, какие конкуренты присутствуют на локальном рынке и т.п. Во-вторых, филиалы банка изначально неоднородны: есть головной офис, местные отделения, операционные офисы и т.п. Детальный анализ структуры деятельности каждого филиала банка слишком затратен как с финансовой, так и с временной точки зрения. Анализ паттернов позволяет разбить все множество разнородных отделений банка на классы, имеющие схожую структуру деятельности внутри каждого класса, и решать задачу оценки эффективности среди таких классов.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Объектами в данной задаче являются филиалы одного банка, в качестве признаков для оценки эф-

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

11

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Рис. 7. Пример кластерных кривых различных паттернов

фективности деятельности филиала были выбраны такие критерии, как менеджмент (MNG), маркетинг (MKT), активность банка на рынках депозитов (DEP), кредитов (CRE) и операций с валютой (FX).

На рис. 7 и рис. 8 представлены примеры четырех различных паттернов, полученных в [7]. Паттерн 1 (рис. 7, слева) содержит 207 филиалов, главная активность которых сосредоточена вокруг депозитных операций. В паттерн 2 вошло 76 филиалов (рис. 7, справа), которые также делают упор на депозитах и операциях с валютой. В паттерне 3 расположено 20 филиалов, отличающихся от предшественников высоким значением параметра кредитования (рис. 8, слева). Четвертый паттерн, состоящий из 9 филиалов (рис. 8, справа), практически не характеризуется валютными операциями, но филиалы в нем более активны в области кредитования, чем филиалы первого и даже третьего паттерна.

В [4] аналогичное исследование было проведено для распределения персонала по отделениям банка внутри групп отделений, которые описываются одинаковыми паттернами. В качестве характеристик для выделения паттернов были выбраны показатели, характеризующие распределение трудозатрат на различные операции: трудозатраты на менеджмент и маркетинг, объем вкладов, объем кредитов и размер обменных операций. Расчет этих параметров см. в [10, 11, 14].

В [22] анализировалась эффективность конкурсного управления в Агентстве по страхованию вкладов — государственной корпорации, обеспечивающей эффективную процедуру банкротства российских кредитных организаций, в основном коммерческих банков. Предлагаемая методика для оценки эффективности деятельности управляющей компании при осуществлении процедур конкурсного производства (ликвидации) включала решение двух основных подзадач:

1. выявление однородных групп кредитных организаций (по паттернам, которых придерживаются банки);

2. построение регрессионных моделей возврата активов ликвидируемых банков.

Было продемонстрировано, что стандартные методы кластер-анализа в применении к задаче разделения всей совокупности кредитных организаций на однородные группы не дали адекватных результатов. С помощью этих методов не удавалось разделить всю совокупность из 82 банков на небольшое число кластеров, содержащих сравнимые объекты, примерно равного объёма. Как правило, при применении стандартных методов кластеризации, таких как метод ^-средних, метод связных компонент, а также иерархических процедур дальнего и ближнего соседа, при заданном количестве кластеров возникали одно-двухэлементные кластеры,

12

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

состоящие из банков, явно выделяющихся объёмами активов по сравнению с остальными. В связи с этим к первому классу задач — разработке процедуры, связанной с формированием и наполнением конкурсной массы1, т.е. с выведением всех средств и активов ликвидируемой кредитной организации, — применялся метод анализа паттернов.

Основное отличие метода анализа паттернов от стандартных методов кластер-анализа состоит в том, что при его использовании предполагается независимость распределения по кластерам от совокупного объёма активов, т.е. крупный банк с большим объёмом активов на балансе и мелкий банк со сравнительно малым объёмом активов на балансе будут отнесены к одному кластеру при условии одинаковой структуры портфеля активов. Более формально процедура определения паттернов выглядит следующим образом: от пространства абсолютных значений показателей по каждому виду активов осуществляется переход к пространству пар из углов наклона и свободных коэффициентов линейных частей профильных кривых (при этом размерность пространства векторов меняется с п на 2п - 2). Каждому банку ставится в соответствие вектор, состоящий из семи пар углов наклона и свободных коэффициентов. И в дальнейшем банки относятся к разным паттернам на основе сравнения этих векторов.

На следующих двух диаграммах приведены примеры двух похожих (Bankl и Bank2, рис. 9) и двух различных паттернов банков (Bank3 и Bank4, рис. 10), полученных при анализе данных по незавершённым делам о ликвидации 82 российских кредитных организаций [22]. Среди показателей, характеризующих положение банка на момент начала процедуры ликвидации, были выделены следующие:

♦ касса и денежные средства на корреспондентском счёте в Банке России — «LA1»;

♦ обязательные резервы, перечисленные в Банк России, — «R1»;

♦ кредиты юридическим лицам — «CP1»;

♦ кредиты физическим лицам — «IP1»;

♦ вложения в ценные бумаги (векселя) «BILLS1»;

♦ основные средства — «BAS1»;

♦ прочие активы — «OTAS1».

После анализа всей совокупности, состоящей из 82 банков, оказалось, что фактически разделить все банки на несколько кластеров можно, учитывая в первую очередь значения показателей «кредиты юридическим лицам» и «объём вексельного

Рис. 9. Схожие паттерны для банков, подлежащих ликвидации

портфеля». Сначала все банки были разделены на 6 групп, затем с целью укрупнения их количество было уменьшено до четырёх. Таким образом, каждый из 82 банков, проходящих процедуру ликвидации, был отнесён к одной из следующих групп (кластеров).

Кластер 1 включает банки, портфель активов которых практически полностью состоит из одних векселей. На рис. 11 представлен паттерн 11 банков с пиком в ценных бумагах (значение показателя BILLS1). На этом и последующих рисунках отсутствуют числовые шкалы значений показателей, так как конкретные числа далее не имеют значения,

1Под конкурсной массой понимаются основные и оборотные средства, нематериальные активы, дебиторская задолженность, кредиторская задолженность, прочие пассивы и активы, находящиеся на балансе должника. Всё имущество должника, имеющееся на момент открытия конкурсного производства и выявленное в ходе конкурсного производства, составляет конкурсную массу.

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

13

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Кластер 1. Векселя.

i : :

..... О Bdl lk.01 : : Bank25 I / ’■о-- Bank46 .._,J L j.. \

• ВапкЗО ! // -e - Bank31 \ j // ,\\

Bank02 j j // /= 4\\ -»- Bank65 | i

Bank70 j j //// j \\V -■ - вапкЗб ! L..Mi....I !v\&

-о- Bank61 I I if | V8, : i iу i...

LA1 R1T CP1 IP1 BILLS1 ST1 BAS1 OTS1 Рис. 11. Вексельные банки

важны лишь соотношения между параметрами и формы ломаных, соответствующих различным паттернам.

Кредитные организации из этого кластера, по мнению экспертов, относятся к группе так называемых «вексельных банков». Так как векселя — это активы, как правило, с достаточно низкой ликвидностью, то отнесение кредитной организации к данной группе банков может говорить о том, что перед банкротством в кредитной организации проводились операции по замене активов на менее ликвидные. А такое обстоятельство свидетельствует о возможно имевшем место «криминальном банкротстве», зачастую преднамеренном. Соответственно, эта группа банков характеризуется крайне малым процентом возврата активов.

Кластер 2 включает банки, большую часть порт-

феля активов которых занимают кредиты юридическим лицам. Диаграмма 19 банков с пиком в кредитах юридическим лицам (показатель CP1) показана на рис. 12.

Как видно из графика, на их балансе также присутствуют «другие активы» (OTAS1) и резервы в ЦБ, но в значительно меньшем объёме. И если наличие таких резервов — требование законодательства, то относительно большие объёмы «других активов» у некоторых банков могут говорить о наличии, например, значительных основных фондов на балансе. Тем не менее, столь несбалансированный портфель активов, как правило, приводит к крайне малому проценту возврату активов. Банкротство такого банка может произойти из-за невозврата кредитов несколькими крупными клиентами.

Кластер 3 содержит банки, большая часть портфеля активов которых распределена между кредитами юридическим лицам и векселями. На рис. 13 приведены графики для 26 банков с двумя пиками в профилях: «кредиты юр. лицам» (CP1) и «векселя» (BILLS1), соответственно.

Кредитные организации из этой группы обладают сбалансированным портфелем активов. Банки этой группы имеют, по экспертным оценкам, средний процент возврата активов. Банкротство этих кредитных организаций, скорее всего, имеет рыночный характер, т.е. оно происходит, как правило, из-за неправильных (непреднамеренных) действий менеджмента банка или неблагоприятной ситуации на рынке для конкретного банка.

В кластер 4 вошли 26 банков, не вошедших в другие кластеры, а именно те банки, в портфеле активов которых присутствуют в примерно равных

Кластер 2. Кредиты юридическим лицам.

LA1 R1T CP1 IP1 BILLS1 ST1 BAS1 OTS1 Рис. 12. Банки, активно кредитующие юридических лиц

Кластер 3. Кредиты юридическим лицам и Векселя.

LA1 R1T CP1 IP1 BILLS1 ST1 BAS1 OTS1 Рис. 13. Банки, имеющие в портфеле корпоративные кредиты и векселя

14

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Кластер 4. Малые банки.

LA1 R1T CP1 IP1 BILLS1 ST1 Рис. 14. «Мусорные» банки

BAS1 OTS1

долях разные типы активов и нет значимого преобладания кредитов юридическим лицам или векселей (рис. 14).

Можно заметить, что большинство кредитных организаций этого кластера имеют небольшие объёмы по всем видам активов, за исключением банков под номерами 82, 67 и 35. Это означает, что здесь собраны, в основном, мелкие банки, имеющие различную структуру портфеля активов. Об этом также говорит тот факт, что все 26 банков из этого кластера имеют минимальные резервы в ЦБ. 24 из 26 банков эксперты отнесли к классу так называемых «мусорных». Поскольку банкротство мелких кредитных организаций могло происходить по различным причинам, то и процент возврата активов может сильно отличатся для банков этого кластера. В то же время из-за небольшого совокупного объёма активов стоит ожидать достаточно высокого процента возврата. Стоит также отметить следующий факт — банки 67 и 82 можно было отнести в отдельный кластер, что обычно и происходило при применении стандартных процедур кластер-анализа.

Анализ финансового состояния ликвидируемых кредитных организаций с использованием метода паттернов показал то, что в подавляющем большинстве банков присутствовали признаки преднамеренного банкротства. Практически во всех банках были выявлены совершенные в преддверии банкротства сделки, наносящие существенный ущерб имущественным интересам банков и их кредиторам. Подчеркнем, что все кредитные организации были разбиты на однородные группы (кластеры) для того, чтобы строить модели возврата активов ликвидируемых банков уже внутри этих групп (банков со

схожими паттернами поведения). Было показано, что такая модель более адекватна, нежели модели, в которых не учитывается подобное разбиение.

5. Применение метода анализа паттернов в политологии

Метод анализа паттернов применялся для анализа результатов выборов в британских парламентских и финских муниципальных выборах [1, 9, 20]. Исследовались результаты парламентских выборов 1992, 1997 и 1999 гг. в округах Великобритании (отдельно по Англии, Шотландии, Уэльсу и Северной Ирландии) и семь муниципальных выборов в Финляндии в 1976-2000 гг. Был проведен как анализ паттернов поддержки политических партий по округам в статике, так и динамический анализ для оценки изменений такой поддержки с течением времени.

Объектами исследования были округа, в которых проводились выборы, а в качестве признаков для кластеризации были выбраны итоги голосования за различные партии.

Эмпирические данные о результатах выборов показывают широкий разброс итогов голосований по различным округам и в различные годы. Выделение и изучение типологий поведения населения округов при голосовании является очень важной задачей анализа политической конкуренции партий, особенно динамики изменений этой конкуренции и ее отражения в итогах голосований. В обоих случаях — и для Великобритании, и для Финляндии, и для парламентских, и для муниципальных выборов — оказалось, что распределение поддержки партий в среднем может быть описано несколькими похожими типами поведения.

Для выборов в Великобритании из 440 избирательных округов 199 округов показали стабильность предпочтений избирателей между партиями в течение исследуемого периода. Всего было выделено 13 паттернов поддержки партий (табл. 9), восемь из которых (паттерны 1-6,8,9) были найдены на данных о выборах 1992 г., три (7,10,12) и два (11,13) паттерна добавились по итогам изучения голосований 1997 и 2001 гг. При этом первые 6 паттернов поведения являются наиболее распространенными — более 90% округов имеет именно такие паттерны голосования. В выборах 1992 г. наиболее распространенным был паттерн 2 и, действительно, эти выборы выиграли консерваторы. А в выборах 1997 и 2001 гг. чаще всех остальных

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

15

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Паттерны поддержки партий избирателями в Великобритании

Таблица 9.

Номер паттерна Консервативная партия Лейбористская партия Либеральные демократы Другие партии

1 23,18 60,23 12,49 4,1

2 48,82 32,88 15,76 2,53

3 38,08 47,61 11,8 2,52

4 50,97 19,05 26,78 3,19

5 41,42 12,98 42,42 3,17

6 14,22 46,29 36,40 3,07

7 31,40 38,75 24,77 5,08

8 35,24 28,08 33,74 3,0

9 12,72 36,25 48,50 2,50

10 0 65,30 0 34,70

11 38,0 12,60 15,60 33,80

12 37,5 0 0 62,5

13 19,1 22,1 0 58,8

наблюдался паттерн 1, и в этих парламентских выборах победу одержала Лейбористская партия во главе с Тони Блэром.

Построение «траекторий» изменения паттернов позволяет отследить динамику изменений паттернов поддержки партий (табл. 10). В таблице отражены самые распространенные траектории динамики голосования в Великобритании — результаты голосований по 440 округам (83% от общего числа).

Таблица 10.

Распределение английских округов по динамическим группа

Динамическая группа Частота % округов

x-x-x 99 37.62

x-x-y 21 13.97

y-x-x 251 47.45

x-y-x 20 3.78

x-y-z 38 7.18

Около 38% округов оказались стабильными в своих предпочтениях. Из них 14% округов оказались приверженцами лейбористов («1—1—1»), почти 10% поддерживали консерваторов («2—2—2»). Некоторые округа стабильно выбирали при голосовании паттерны 4 и 5.

Для групп, менявших паттерны, наиболее распространённой оказалась траектория вида «у— х—х», причем среди траекторий такого вида траектория «3—1—1» встречается чаще всего. Также популярными оказались траектории вида

«2—1—1» и «2—3—3». Поскольку и первый, и третий паттерн наибольшую поддержку дают как раз Лейбористской партии, это и предрешило победу лейбористов на выборах 1997 года.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Финские выборы были проанализированы на данных о результатах 7 муниципальных выборов с 1976 г. по 2000 г., причем учитывались 6 главных политических партий: Социально-демократическая партия (the Social Democratic Party, сокращенно SDP), Центристская партия (the Center Party, KESK), Партия национальной коалиции (the National Coalition Party, KOK), Левый Альянс (the Left Alliance, VAS), Шведская партия (the Swedish People’s Party, RKP) и партия Зеленых (the Green League, VIHR).

Всего было получено 87 паттернов электоральной поддержки партий, причем на подавляющем большинстве округов реализовалось 46 из них. Остальные паттерны являются редкими — каждый реализуется менее чем в 5-10 случаях. Десять паттернов, встречающихся более 100 раз в наблюдениях, приведены в табл. 11.

Из табл. 11 видно, что в наиболее распространенном паттерне партия KESK обладает абсолютным большинством голосов (53%), значимую поддержку имеет партия VAS (22%) и далеко позади партии SDP и KOK с 10% и 8% поддержки населения соответственно. Этот паттерн оказался характерным для сельских округов, особенно в северной и восточной части страны.

Во втором по распространенности паттерне данных также доминирует KESK (41%) с догоняющи-

16

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Паттерны поддержки политических партий в Финляндии на данных 7 муниципальных выборов

Таблица 11.

Средняя поддержка партий внутри кластера, %

Номер паттерна Количество наблюдений SDP KESK KOK VAS RKP VIHR Other

1 386 9.55 53.33 8.42 21.84 0 0.48 6.37

2 190 28.26 41.1 14.96 2.29 0 0.91 12.47

3 190 34.32 7.59 27.68 17.43 0.92 1.88 10.2

4 189 13.25 53.82 14.98 0.85 0 0.34 16.76

5 180 18.09 44.08 8.89 10.66 0 0.25 18.01

6 134 13.16 46.91 19.93 10.97 0 0.2 8.83

7 127 13.88 45.56 22.85 15.41 0 0.38 3.93

8 119 10.25 49.49 9.56 16.45 0 0.35 13.91

9 101 17.92 1.52 1.65 1.97 71.31 1.07 4.55

10 96 29.19 37.69 18.35 11.08 0 0.73 2.94

ми ее партиями SDP (29%) и KOK (15%). Округа, попавшие в третий распространенный паттерн, отдают предпочтение SDP (34%), а также партиям KOK (28%) и VAS (17%), KESK же имеет там очень низкую поддержку (8%). Такое распределение голосов характерно для городских муниципалитетов.

Очень сильная позиция партии KESK отражена в том факте, что в 8 из 10 самых распространенных паттернов она является победителем по абсолютному большинству голосов. В двух других паттернах победителями стали партии SDP и RKP Как было упомянуто выше, первый из них относится к городским поселениям, а второй паттерн голосования типичен для множества мелких муниципалитетов на побережье или островах, где преобладает шведское население.

При анализе динамических групп было выявлено, что почти треть абсолютно стабильных групп (не менявших свои паттерны поведения в течение всей истории голосований) придерживается первого паттерна, обеспечивающего KESK положение доминирующей партии. Всего таких округов 19, они расположены большей частью в регионе Лапландии и Северной Остроботнии. Многие другие абсолютно стабильные паттерны также характеризуются доминирующей позицией KESK. Например, 6 муниципалитетов на протяжении всех 7 исследованных выборов голосовали согласно паттерну 4, то есть демонстрировали высокую поддержку KESK, затем KOK и SDP, и совсем немного VAS. Оказалось, что все такие муниципалитеты

расположены в сельской части юга Финляндии. Также в числе абсолютно стабильных муниципалитетов оказались муниципалитеты, выбравшие паттерн 9 с абсолютным большинством у партии RKP Ими и в самом деле оказались муниципалитеты побережья с преобладанием шведского населения.

Так, анализ паттернов данных и динамический анализ паттернов помогает упростить анализ данных большой размерности, представить результаты в наглядной форме, отразить структуризацию политической жизни страны, скрывающуюся за огромным массивом разрозненной информации.

6. Применение метода анализа паттернов в оценке инновационного развития регионов

Успешное развитие регионов в долгосрочном плане неразрывно связано не только с экономикосоциальными факторами, но и напрямую определяется степенью развития в регионе образовательной и научной деятельности научных организаций. Любые инновации опираются на солидный фундамент научной деятельности, которая невозможна без соответствующих кадров — не только научных сотрудников, но и студентов всех ступеней образования, а также квалифицированных рабочих и служащих. Все эти факторы сложным образом взаимосвязаны. Для анализа структуры этих связей был использован метод анализа паттернов [19].

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

17

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

10

1 2 3 4 5

1 2 3 4

22

1 2 3 4 5

13

1 2 3 4 5

19

1 2 3 4 5

24

1 2 3 4 5 1 2 3 4 5 1 2 3 4

Рис. 15. Паттерны инновационного развития регионов

1 2 3 4 5

15

1 2 3 4 5

. 25

1 2 3 4 5

1

2

3

4

5

В этой задаче объектами анализа были регионы, цель заключалась в построении системы индикаторов, адекватно отражающих положение региона в части развития в нем науки, инновационной активности организаций и образования, и анализ полученных кластеров. Базовая система индикаторов создавалась на основе рейтинга инновационного развития регионов, разработанного коллективом ИСИЭЗ НИУ ВШЭ [23]. Были выделены следующие блоки показателей

1. Социально-экономические условия;

2. Образовательный потенциал;

3. Результативность исследований и разработок;

4. Потенциал инновационной деятельности;

5. Результативность инновационной деятельности. Все показатели в базовой системе были нормированы в шкале от 0 до 1 — они либо приведены к

численности экономически активного населения, либо представляют собой процентное соотношение. Авторы намеренно отказались от абсолютных показателей, имея целью исследовать внутреннюю структуру взаимной зависимости науки, образования и инноваций.

Логично считать, что регионы, имеющие приблизительно одинаковый паттерн в базовой системе показателей, схожи в выбранной модели развития науки, образования и инноваций. Стоит отметить, что не ставилась задача построения рейтинга или «выставления оценок» регионам, интересовало именно положение дел как оно есть, исследование скрытых взаимосвязей между наукой, образованием и инновационной деятельностью в разрезе регионов, нахождение «близких» по структуре и соотношениям между указанными областями регионов.

18

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

4

-г. Москва2008 -г. Москва2009 -г. Москва2010

— г. Санкт-Петербург2007

— г. Санкг-Петербург2009

— г. Санкг-Петербург2010 -Приморский край2007

— Приморский край2008

— Приморский край2009 -Приморский край2010

Рис. 16. Первый паттерн инновационного развития

2

3

5

Всего было получено 24 паттерна инновационного развития регионов (рис. 15), где под номером 25 объединены все уникальные объекты, не попавшие в 24 паттерна. Далее приведено описание первых 3 паттернов.

Первый паттерн (рис. 16) характерен для 11 объектов, представляющих город Москву и Приморский край за все 4 года с 2007 по 2010 гг., а также город Санкт-Петербург в 2007 г., 2009 г., 2010 г. Этот паттерн характеризуется умеренными (0,3-0,5) значениями первых двух показателей (Блок 1 «Социальноэкономические условия» и Блок 2 «Образовательный потенциал»), чрезвычайно высоким (0,5-0,9) показателем Блока 3 «Результативность исследований и разработок», а также очень низкими (менее 0,2) показателями Блоков 4 и 5, отвечающими за потенциал и результативность инновационной деятельности.

Второму паттерну (рис. 17) соответствуют 19 объектов. Основные характеристики этого паттерна: низкие (0,1-0,3) показатели блоков 1, 3, 4, 5 (социально-экономические условия, результативность науки и потенциал и результативность инновационной деятельности) и средние (0,4-0,5) показатели образовательного потенциала регионов.

» Архангельская область2007

■ Архангельская область2009 й Архангельская область2010

—и— Волгоградская область2007 ж Иркутская область2007 • Иркутская область2009 —н- Кемеровская область2009

— Кемеровская область2010

— Красноярский край2009

> Мурманская область2007

■ Мурманская область2009 —*—Мурманская область2010

к Новосибирская область2008 ж Омская область2007

> Республика Башкортостан2007 I Ростовская область2007

Удмуртская Республика2007

------Удмуртская Республика2009

» Удмуртская Республика2010 Брянская область2007

Рис. 17. Второй паттерн инновационного развития

Третий паттерн (рис. 18) объединяет 14 объектов. Он отличается от второго паттерна только двумя показателями: «результативность исследований и разработок» в нём ниже, чем во втором, а «результативность инновационной деятельности» наоборот, выше.

1 2 3 4 5

Рис. 18. Третий паттерн инновационного развития

7. Заключение

В работе рассмотрено понятие паттерна как устойчивой комбинации существенных переменных, связанной с характерной моделью поведения социально-экономических объектов. Предложено выделять типы устойчивости функционирования объектов в зависимости от частоты смены паттерна. Такая типологизация является полезным инструментом управления объектами. Кроме того, она позволяет выделить группы риска их стратегического развития. Сделаны обзоры литературы по использованию понятия паттерн в науке и культуре, методам факторного анализа, анализа многомерных систем, а также работ по анализу конкретных социально-экономических данных, выполненных под руководством Ф.Т. Алескерова, с использованием понятия паттерн. Эти примеры наглядно демонстрируют перспективность использования понятия паттерна в анализе данных, так как оно является эмпирическим аналогом логического понятия «тип», широко используемого на первых этапах изучения сложных феноменов и процессов.

В связи с этим актуальной задачей нам представляется формирование таких математических моделей и методов, которые бы выявляли паттерны в данных непосредственно, без предварительного выявления кластеров. Необходимость проведения соответствующих теоретических, алгоритмических и экспериментальных разработок давно назрела. ■

» Брянская область2007 ■ Брянская область2009 * Брянская область2010 )( Волгоградская о6ласть2008 ^^Вологодская область2009 » Забайкальский край2007 I Костромская область2009

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

....... Костромская область2010

----Курганская область2008

» Республика Адыгея2007 Я Республика Карелия2010 Ж Тамбовская область2007 )( Тамбовская область2008

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

19

АНАЛИЗ ДАННЫХ И ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ

Литература

1. Aleskerov F. Patterns of party competition in British and Russian general and Finnish municipal elections // Proceedings of the 4-th International Conference on Operational Research. — Moscow, September 2004.

- P. 11-13.

2. Aleskerov F., Alper C.E. Inflation, money, and output growths: Some observations // Bogazici University Research Paper. — 1996. — #SBE 96-06.

3. Aleskerov F., Alper C.E. A clustering approach to some monetary facts: a long-run analysis of cross-country data // The Japanese Economic Review. — 2000. — Vol. 51, No. 4. — P. 555-567.

4. Aleskerov F., Ersel H., Yolalan R. Personnel allocation among bank branches using a two-stage multicriterial approach // European Journal of Operational Research. — 2003. — Vol. 148/1. — P. 116-125.

5. Aleskerov F., Erser H., Yolalan R. Clustering Turkish commercial banks according to structural similarities // Yapi Kredi Discussion Paper Series. — 1997. — No. 97-02. — Istanbul, Turkey.

6. Aleskerov F., Ersel H., Yolalan R. Multicriterial methods for evaluating the bank branches performance // Yapi Kredi Discussion Paper Series. — 1997. — No: 97-01. — Istanbul, Turkey.

7. Aleskerov F., Ersel H., Yolalan R. Multicriterial ranking approach for evaluating bank branch performance // International Journal of Information Technology and Decision Making. — 2004. — Vol. 3, No. 2. — P. 321-335.

8. Aleskerov F., Ersel H., Mercan M. Structural dissimilarity in Turkish banks 1988-1999 // Bogazici Journal Review of Social, Economic and Administrative Studies. — 2001. — Vol. 15, No. 1. — P. 57-69.

9. Aleskerov F., Nurmi H. A method for finding patterns of party support and electoral change: An analysis of British general and Finnish municipal elections // Mathematical and Computer Modelling. — 2008. — P. 12251253.

10. Caruth D.L. Surveying bank use of work measurement. — Burroughs Clearing House, 1970.

11. Caruth D.L. Work measurement in commercial banks. — Istanbul: Yapi Kredi Bank Publication. — 1985.

12. Few S. Multivariate Analysis Using Parallel Coordinates, 2006. Источник в Интернет: http://www. perceptualedge.com/articles/b-eye/parallel_coordinates.pdf.

13.Inselberg A. Parallel coordinates: Visual multidimensional geometry and its applications. — Springer, 2009.

14. Maynard H.B. (Ed.) Industrial engineering handbook. — NY: Mc-Graw Hill, 1971.

15. Алексашин П.Г., Алескеров Ф.Т., Белоусова В.Ю., Попова Е.С., Солодков В.М. Динамический анализ бизнес-моделей российских банков в период 2006-2009 гг. // Препринт WP7/2012/03. — М.: Издательский дом НИУ ВШЭ, 2012.

16. Алескеров Ф.Т., Белоусова В.Ю., Егорова Л.В., Миркин Б.Г. Анализ паттернов в статике и динамике, часть 1: Обзор литературы и уточнение понятия // Бизнес-информатика. — 2013. — № 3 (25). — C. 20.

17. Алескеров Ф.Т., Белоусова В.Ю., Кнурова А.А., Солодков В.М. Стереотипы поведения российских коммерческих банков в период финансового кризиса // Проблемы развития экономики и общества: в 3 кн. / Отв. ред. Е. Г. Ясин. — М.: Издательский дом ГУ-ВШЭ. — 2011. — Кн. 1. — С. 583-593.

18. Алескеров Ф.Т., Белоусова В.Ю., Сердюк М.Ю., Солодков В.М. Стереотипы поведения российских банков // Банковское дело. — 2008. — № 7. — С. 44-50.

19. Алескеров Ф.Т., Гохберг Л.М., Егорова Л.Г., Мячин А.Л., Сагиева Г.С. Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов // Препринт WP7/2012/07, Нац. исслед. ун-т «Высшая школа экономики». — М. : Издательский дом НИУ ВШЭ, 2012.

20. Алескеров Ф.Т., Нурми Х. Паттерны конкуренции партий в британских парламентских и финских муниципальных выборах // Препринт ГУ-ВШЭ, WP7/2003/07. — М., 2003.

21. Алескеров Ф.Т., Солодков В.М., Челнокова Д.С. Динамический анализ паттернов поведения коммерческих банков России // Экономический журнал Высшей школы экономики. — 2006. — №1.

— С. 48-61.

22. Алескеров Ф. Т., Шерман И.В., Энтов Р.М. Анализ эффективности конкурсного управления при банкротстве банков // Банковское дело. — 2008. — № 12. — С. 70-76.

23. Гохберг Л.М. (ред.) Рейтинг инновационного развития субъектов Российской Федерации: аналитический доклад. — М.: НИУ ВШЭ, 2012.

20

БИЗНЕС-ИНФОРМАТИКА №4(26)-2013 г

i Надоели баннеры? Вы всегда можете отключить рекламу.