Научная статья на тему 'ПРИЛОЖЕНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА СЕТЕВЫХ СТРУКТУР ДЛЯ ИССЛЕДОВАНИЯ ДИНАМИКИ РЫНОЧНЫХ ГРАФОВ И ГРАФОВ СОВМЕСТНЫХ УПОМИНАНИЙ'

ПРИЛОЖЕНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА СЕТЕВЫХ СТРУКТУР ДЛЯ ИССЛЕДОВАНИЯ ДИНАМИКИ РЫНОЧНЫХ ГРАФОВ И ГРАФОВ СОВМЕСТНЫХ УПОМИНАНИЙ Текст научной статьи по специальности «Экономика и бизнес»

CC BY
85
8
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЕТЕВЫЕ СТРУКТУРЫ / СТАТИСТИЧЕСКИЙ АНАЛИЗ ДИНАМИКИ СЕТЕВЫХ СТРУКТУР / РЫНОЧНЫЕ ГРАФЫ / ГРАФЫ СОУПОМИНАНИЙ / МЕРЫ СХОДСТВА ГРАФОВ / NETWORK STRUCTURES / STATISTICAL ANALYSIS OF THE DYNAMICS OF NETWORK STRUCTURES / GRAPH PROPERTIES / SOCIAL NETWORKS / MARKET GRAPH / GRAPH SIMILARITY MEASURES

Аннотация научной статьи по экономике и бизнесу, автор научной работы — Балаш Владимир Алексеевич, Сидоров Сергей Петрович, Файзлиев Алексей Раисович

В данной статье рассматриваются приложения методов анализа сетевых структур для исследования динамики процессов ценообразования на финансовых рынках и их отражением в новостных потоках. Представление взаимодействий между социально-экономическими явлениями в виде сети или графа позволяет не только повысить наглядность отображения структуры взаимосвязей, но и проводить статистический анализ свойств такого графа и делать обоснованные выводы о сходстве или различии структуры связей в разные периоды времени. Целями нашего исследования являлось, во-первых, анализ изменения во времени свойств графов двух параллельно протекающих процессов, и, во-вторых, сходства или различия их динамики, в-третьих, насколько результаты анализа устойчивы относительно выбора метрики сходства графов.Мы предполагаем, что влияние всей совокупности скрытых, ненаблюдаемых факторов, воздействующих на процессы ценообразования на финансовых рынках, должно находить свое отражение в изменениях структурных свойств, так называемых рыночных графов и графов совместных упоминаний компаний в новостных потоках. Рыночный граф, описывает сеть взаимодействий между доходностями активов, вершинами которого являются компании, акции которых котируются на биржах, соединяемых ребрами, если показатель тесноты связи между доходностями акций за выбранный период превосходит по абсолютной величине выбранный порог. Использование данных провайдеров новостной аналитики позволяет также оценить частоту совместных упоминаний компаний в финансовых новостях. Сдвигая начало сегмента на шаг, равный одному дню, месяцу и т. д., мы получали последовательность матриц смежности графов.Для изучения стабильности и изменчивости структурных свойств подобных графов мы применяли QAP-процедуру корреляционного и регрессионного анализа между матрицами смежности и анализ сходства топологий сетевых структур в разные отрезки времени. Результаты применения методов многомерного шкалирования для состояний динамических графов с использованием двух различных метрик сходства сетевых структур, отражающих изменение меры центральности узлов сети и топологии сети приводят к выводу, что однофакторная модель в состоянии объяснить существенную часть динамики изменений структуры как рыночного графа, так и графа соупоминаний.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по экономике и бизнесу , автор научной работы — Балаш Владимир Алексеевич, Сидоров Сергей Петрович, Файзлиев Алексей Раисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF METHODS OF STATISTICAL ANALYSIS OF NETWORK STRUCTURES TO STUDY THE DYNAMICS OF MARKET GRAPHS AND GRAPHS OF JOINT REFERENCES

The aim of the paper is to provide an analysis of news and financial data using their network representation. This article discusses the application of methods for analyzing network structures to study the dynamics of market graphs and graphs of joint references. The objectives of our study were, firstly, to analyze the temporal changes in the properties of the graphs of two parallel processes, and secondly, the similarities or differences in their dynamics, and thirdly, how the analysis results are stable relative to the choice of graph similarity metrics. We assume that the impact of the entire set of hidden, unobservable factors affecting pricing processes in financial markets should be reflected in changes in the structural properties of the so-called market graphs and graphs of joint mentions of companies in the news flow. The market graph describes a network of interactions between asset returns, whose vertices are companies whose shares are listed on exchanges connected by edges, if the indicator of the tightness of the relationship between stock returns over the selected period exceeds the selected threshold in absolute value. We calculated the number of comentions of each pair of companies and formed the corresponding adjacency matrices of comention graphs.In order to analyze the variability of network structures over time, two methods were used to calculate the graphs similarity (nodes similarity based metric and network topology similarity based metric). The results of applying multidimensional scaling methods for dynamic graph lead to the conclusion that the one-factor model is able to explain a significant part of the dynamics of changes in the structure of graphs. Also QAP correlation and regression analysis were used to examine graphs similarity.

Текст научной работы на тему «ПРИЛОЖЕНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА СЕТЕВЫХ СТРУКТУР ДЛЯ ИССЛЕДОВАНИЯ ДИНАМИКИ РЫНОЧНЫХ ГРАФОВ И ГРАФОВ СОВМЕСТНЫХ УПОМИНАНИЙ»

Интеллект. Инновации. Инвестиции / Intelligence. Innovations. Investment • № 5, 2019

УДК 311 DOI: 10.25198/2077-7175-2019-5-39

ПРИЛОЖЕНИЕ МЕТОДОВ СТАТИСТИЧЕСКОГО АНАЛИЗА СЕТЕВЫХ СТРУКТУР ДЛЯ ИССЛЕДОВАНИЯ ДИНАМИКИ РЫНОЧНЫХ ГРАФОВ И ГРАФОВ СОВМЕСТНЫХ УПОМИНАНИЙ

В.А. Балаш,1 С.П. Сидоров,2 А.Р. Файзлиев3

Саратовский государственный университет, Саратов, Россия

'e-mail: [email protected]; 2e-mail: [email protected]; 3e-mail: [email protected]

Аннотация. В данной статье рассматриваются приложения методов анализа сетевых структур для исследования динамики процессов ценообразования на финансовых рынках и их отражением в новостных потоках. Представление взаимодействий между социально-экономическими явлениями в виде сети или графа позволяет не только повысить наглядность отображения структуры взаимосвязей, но и проводить статистический анализ свойств такого графа и делать обоснованные выводы о сходстве или различии структуры связей в разные периоды времени. Целями нашего исследования являлось, во-первых, анализ изменения во времени свойств графов двух параллельно протекающих процессов, и, во-вторых, сходства или различия их динамики, в-третьих, насколько результаты анализа устойчивы относительно выбора метрики сходства графов.

Мы предполагаем, что влияние всей совокупности скрытых, ненаблюдаемых факторов, воздействующих на процессы ценообразования на финансовых рынках, должно находить свое отражение в изменениях структурных свойств, так называемых рыночных графов и графов совместных упоминаний компаний в новостных потоках. Рыночный граф, описывает сеть взаимодействий между доходностями активов, вершинами которого являются компании, акции которых котируются на биржах, соединяемых ребрами, если показатель тесноты связи между доходностями акций за выбранный период превосходит по абсолютной величине выбранный порог. Использование данных провайдеров новостной аналитики позволяет также оценить частоту совместных упоминаний компаний в финансовых новостях. Сдвигая начало сегмента на шаг, равный одному дню, месяцу и т. д., мы получали последовательность матриц смежности графов.

Для изучения стабильности и изменчивости структурных свойств подобных графов мы применяли QAP-процедуру корреляционного и регрессионного анализа между матрицами смежности и анализ сходства топологий сетевых структур в разные отрезки времени. Результаты применения методов многомерного шкалирования для состояний динамических графов с использованием двух различных метрик сходства сетевых структур, отражающих изменение меры центральности узлов сети и топологии сети приводят к выводу, что однофакторная модель в состоянии объяснить существенную часть динамики изменений структуры как рыночного графа, так и графа соупоминаний.

Ключевые слова: сетевые структуры, статистический анализ динамики сетевых структур, рыночные графы, графы соупоминаний, меры сходства графов.

Благодарности: Исследование выполнено за счет гранта Российского научного фонда (проект № 19-18-00199).

Для цитирования: Балаш В. А., Сидоров С. П., Файзлиев А. Р. Приложение методов статистического анализа сетевых структур для исследования динамики рыночных графов и графов совместных упоминаний // Интеллект. Инновации. Инвестиции. - 2019. - № 5. - С. 39-50. DOI: 10.25198/2077-7175-2019-5-39.

APPLICATION OF METHODS OF STATISTICAL ANALYSIS OF NETWORK STRUCTURES TO STUDY THE DYNAMICS OF MARKET GRAPHS AND GRAPHS OF JOINT REFERENCES

V.A. Balash,1 S.P. Sidorov,2 Al.R. Faizliev3

Saratov State University, Russian Federation

•e-mail: [email protected]; 2e-mail: [email protected]; 3e-mail: [email protected]

Abstract. The aim of the paper is to provide an analysis of news and financial data using their network representation. This article discusses the application of methods for analyzing network structures to study the dynamics of market graphs and graphs of joint references. The objectives of our study were, firstly, to analyze the temporal changes in the properties of the graphs of two parallel processes, and secondly, the similarities or differences in their dynamics, and thirdly, how the analysis results are stable relative to the choice of graph similarity metrics. We assume that the impact of the entire set of hidden, unobservable factors affecting pricing processes in financial markets should be reflected in changes in the structural properties of the so-called market graphs and graphs of joint mentions of companies in the news flow. The market graph describes a network of interactions between asset returns, whose vertices are companies whose shares are listed on exchanges connected by edges, if the indicator of the tightness of the relationship between stock returns over the selected period exceeds the selected threshold in absolute value. We calculated the number of co-mentions of each pair of companies and formed the corresponding adjacency matrices of co-mention graphs.

In order to analyze the variability of network structures over time, two methods were used to calculate the graphs similarity (nodes similarity based metric and network topology similarity based metric). The results of applying multidimensional scaling methods for dynamic graph lead to the conclusion that the one-factor model is able to explain a significant part of the dynamics of changes in the structure of graphs. Also QAP correlation and regression analysis were used to examine graphs similarity.

Keywords: network structures, statistical analysis of the dynamics of network structures, graph properties, social networks, market graph, graph similarity measures.

Acknowledgements: This work is supported by the Russian Science Foundation under grant 19-18-00199.

Cite as: Balash V.A., Sidorov S.P., Fayzliev A.R. (2019) [Application of methods of statistical analysis of network structures to study the dynamics of market graphs and graphs of joint references]. Intellekt. Innovatsi. Investitsii [Intellect. Innovation. Investments]. Vol. 5, pp. 39-50. DOI: 10.25198/2077-7175-2019-5-39.

Введение

Методы исследования сетевых структур привлекают все большее внимание специалистов различных отраслей знаний. Представление взаимодействий между социально-экономическими явлениями в виде графа позволяет не только повысить наглядность отображения структуры взаимосвязей, но и проводить статистический анализ свойств такого графа и делать обоснованные предположения и выводы о свойствах процессов, приводящих к порождению той или иной структуры взаимосвязей, сходства или различия структуры связей разных процессов или одного и того же процесса в разные периоды времени. Методы, первоначально развитые для исследования структуры социальных сетей (Social network analysis - SNA), все шире применяются для исследования биологических, технических, социальных, экономических и т. д. процессов. При этом решается ряд задач, традиционно входящих в круг проблем социально-экономической статистики.

В данной работе сделана попытка применить методы анализа сетевых структур для исследования статистических характеристик двух параллельно протекающих процессов - ценообразования на финансовых рынках и потока финансовых новостей.

В некоторых случаях взаимосвязи между экономическими агентами можно построить на основе знаний о том, в каких отношениях они состоят между собой, например, покупатель - поставщик [1-5], кредитор - заемщик [6-10], инвестор - получатель [11-14]. К сожалению, подобная информа-

ция труднодоступна для анализа, часто являясь конфиденциальной.

Многие исследователи используют косвенный способ оценивания. Наиболее часто используется метод, основанный на величине коэффициента корреляции между доходностями финансовых активов по результатам биржевых торгов. Обоснованием такого подхода является гипотеза информационной эффективности финансового рынка, согласно которой вся публичная информация полностью отражается в биржевых ценах. Поэтому экономические и финансовые отношения между компаниями воспроизводятся в корреляциях между доходностями активов [15-17, 18-23, 24-33]. Информация о значимых корреляциях отображается в матрице смежности так называемого «рыночного графа». К преимуществам такого подхода можно отнести то, что сведения о результатах биржевых торгов является общедоступными для широкого перечня крупнейших компаний за длительное время.

Некоторые исследователи использовали и иные методы косвенного оценивания взаимосвязей, основанные на географической близости, отраслевой принадлежности, сведений о составах советов директоров и пр. [34-38, 39-42]. Мы, кроме данных о результатах биржевых торгов, использовали материалы, предоставляемые провайдерами новостной аналитики, так как деятельность крупных корпораций находит свое отражение в огромном количестве публикаций, таких как отчеты, пресс-релизы самих компаний, решений арбитражных судов, публикаций рейтинговых и аналитических агентств, публикаций в специализированных изданиях и т. д. Про-

вайдеры новостной аналитики, крупнейшими из которых являются Thompson Reuters и Raven Pack, собирают, обрабатывают и представляют пользователям в оцифрованном виде доступ к подобной информации [43, 44]. Мы предполагаем, что факт упоминания двух или нескольких компаний в одной и той же новости может рассматриваться как косвенное подтверждение наличия взаимосвязи или взаимозависимости между их деятельностью. Подсчитывая число совместных упоминаний компаний в новостях за определенный период, можно получить матрицу смежности графа соупоминаний.

Результаты оценивания статистических характеристик полученных графов, таких как показатели связности, центральности вершин, параметры закона распределения степеней вершин, кластеризации, размера клик и ключевых компаний, оценивания существенности корреляций между графами, построенными за различные периоды времени с помощью QAP-процедуры, и т. д. изложены нами в работах [39-42]. На основании расчетов можно сделать выводы, что структурные свойства изучаемых графов значительно менялись в периоды финансового кризиса, оставаясь относительно стабильными в прочие периоды.

В данной статье мы сосредотачиваемся на результатах анализа динамики изменений структурных свойств рыночных графов и графов соупоминаний.

Исходные данные и построение графов смежности

Финансовые данные. Исторические данные о результатах биржевых за 6-летний период с 1 января 2005 года по 31 декабря 2010 года (1500 торговых дней) получены с использованием сервиса Yahoo Finance. Рассчитывались логарифмические доходности активов

rit = l n(PitfPit - ),

где

Ptt - цена закрытия актива i в день t.

Для построение рыночных графов мы исполь-

зовали подход, предложенный в работе [15]. Сеть взаимодействий между компаниями описывается графом, вершинами которого являются компании, акции которых котируются на биржах, которые соединяются ребрами, если показатель тесноты связи между доходностями акций за выбранный период превосходит по абсолютной величине некоторый порог в. Подобный способ применялся в дальнейшем многими исследователями, в качестве измерителя тесноты связи чаще всего использовался коэффициент корреляции Пирсона.

Исследуемый период разбивался на сегменты -подпериоды продолжительностью 125 торговых дней (6 месяцев). Такая длина выборки обеспечивает, с одной стороны, достаточную надежность оценок значений коэффициентов корреляции, с другой стороны, чувствительность оценок к изменениям тенденции. Вычислялась матрица корреляций между логарифмическими доходностями. В нашем случае вершины графа i и j соединялись ребром, если \r.ji < в. Сдвигая начало сегмента на шаг т, равный одному дню, месяцу и т. д., мы получали последовательность матриц смежности рыночных графов.

Данные новостной аналитики. Мы анализировали последовательность новостных сообщений 1 января 2005 года по 31 декабря 2010 года (72 месяца). В процессе предварительной подготовки данных исключались новости о начале и завершении биржевых торгов и отраслевые обзоры, содержащие табличные материалы. Общее число использованных при анализе новостных сообщений превысило 8550 тысяч за 6-летний период. За календарный месяц выходило от 90 до 140 тысяч новостных сообщений, пиковые значения приходились на период начала финансового кризиса 2008 года. Более 90 процентов новостей относилось к единственной компании, в 7 процентах новостей упоминалось две компании, три и более лишь в 0,5 процента новостей (табл.1). Максимальное число компаний упомянутых в одной новости равнялось 14. Доля новостей содержащих совместные упоминания двух и более компаний колебалась от 5.5% до 11,4% в разные месяцы (табл. 2).

Таблица 1. Распределение новостей по числу упомянутых компаний за 2005-2000 годы

Число компаний, упомянутых в новости 2005 2006 2007 2008 2009 2010 Total

1 1223120 1233665 1335949 1335034 1369973 1393439 7891180

2 102505 110590 112436 105207 91984 88102 610824

3 6395 6749 7408 8597 7655 6548 43352

4 576 533 1384 1433 1335 1626 6887

5 65 45 449 309 300 385 1553

6 13 11 404 112 48 62 650

Число компаний, упомянутых в новости 2005 2006 2007 2008 2009 2010 Total

7 2 3 781 126 11 5 928

8 3 2 1314 276 3 13 1611

9 0 0 94 30 1 1 126

10 0 0 23 10 0 0 33

11 1 0 6 3 1 0 11

14 0 0 0 0 1 0 1

Итого 1332680 1351598 1460248 1451137 1471312 1490181 8557156

Таблица 2. Показатели интенсивности новостного потока

Год Общее число новостей Число новостей, в которых упоминалось две и более компании Доля новостей с соупоминаниями Число соупоминаний

2005 1332680 109560 8.22 252344

2006 1351598 117933 8.73 269538

2007 1460248 124299 8.51 422912

2008 1451137 116103 8.00 312870

2009 1471312 101339 6.89 254352

2010 1490181 96742 6.49 245574

Итого 8557156 665976 7.78 1757590

Более 90% новостей и совместных упоминаний относились к компаниям, торгуемым на 15 крупнейших биржах, 45% - к компаниям, акции которых торговались на биржах США. Мы построили матрицы смежности для сетей соупоминаний за каждый из 72 месяцев анализируемого периода. Затем компании ранжировались по среднему числу совместных упоминаний за период. Полученный граф оказался достаточно разреженным. Лидирующая по числу связей компании упоминалась в новостях за 6-летний период совместно с более чем 4000 компаний. Но лишь около 200 компаний упоминались совместно с лидером хотя бы раз в год. Всего соупоминания были зафиксированы для более чем 8000 компаний. Большая часть соупо-минаний приходилось на первую тысячу лидеров рейтинга. Многие вершины графа оставались изолированными в более чем половине периодов из-за редкого появления названий компаний в новостях. Такие компании исключались из дальнейшего анализа. В результате сравнивались матрицы смежности для сетей соупоминаний для 1053 компаний за последовательные периоды, построенные за 6-месячный период. Сдвигая начало сегмента на шаг т, равный одному дню, месяцу и т. д., мы получали последовательность матриц смежности графов соупоминаний.

Таким образом, объектом анализа являлись две

GM

т для

рыночных графов и Ос для сетей совместных упоминаний, т = 1,2, ..., т. При построении рыночных

графов показатель отсечения в выбирался таким образом, чтобы обеспечить сопоставимую плотность рыночного графа и графа совместных упоминаний. Число вершин графов равнялось 1053.

Методы измерения сходства графов

Проблема измерения степени сходства или различия двух сетевых структур широко обсуждается в литературе в последние десятилетия. Один из простейших способов состоит в расчете значений коэффициентов корреляции между двумя матрицами смежности. Элементы каждой матрицы смежности рассматриваются как вектор соответствующей размерности, затем вычисляются коэффициенты корреляции между полученными векторами. При этом показано [47], что проверка значимости коэффициентов корреляции не может производиться по стандартным формулам. Для нахождения критических значений предложено использовать метод Монте-Карло, соответствующий метод получил название Quadratic Assignment Procedure (QAP). Данный метод может применяться и для проведения регрессионного анализа матриц смежности, широко используется для исследования социальных связей, сетей цитирования, патентов и т. д. [59-62].

Результаты применения QAP процедуры для оценивания корреляций между матрицами смежности, построенных в смежные периоды для т равного 6 месяцам приведены в таблице 3.

Таблица 3. Значения коэффициентов корреляции между матрицами смежности графов в два последовательных периода (результаты QAP анализа)

Периоды Рыночные графы Совместные упоминания

1-2 0,68*** 0 17***

2-3 0,62*** 0,16***

3-4 0,33*** 0,18***

4-5 0,40*** 0 15 ***

5-6 0,24*** 0 15 ***

6-7 0 29*** 0 14***

7-8 0,27*** 0 17***

8-9 0 70*** 0,20***

9-10 0,65*** 0,20***

10-11 0,34*** 0,20***

11-12 0,40*** 0,21***

*** коэффициент значимо отличен от 0 на 1% уровне. Критические значения рассчитывались с помощью QAP - процедуры при 500 итерациях.

Проверка значимости коэффициентов корреляции с помощью QAP процедуры подтверждают, существование значимой корреляционной зависимости во всех периодах. В случае рыночного графа можно увидеть относительную стабильность матриц смежности в докризисный и посткризисный периоды и ослабление корреляционной зависимости в момент финансового кризиса. Результаты расчетов частично подтверждают полученные нами в предыдущих исследованиях выводы об относительной стабильности структуры взаимос-

вязей как между доходностями финансовых активов, так и упоминаний компаний в новостном потоке.

Кроме этого мы попытались оценить параметры линейной регрессионной модели между матрицами графов смежности двух различных типов. Рыночный граф ОМ рассматривался как зависимая переменная, в качестве независимых мы использовали матрицу смежности в предыдущем периоде О^ и граф соупоминаний GT в текущем периоде. Результаты расчетов приведены в таблице 4.

Таблица 4. Результаты регрессионного анализа матриц смежности

Период Const G Т-1 GC

2 0,0008 0,7116 0,0062

3 0,0013 0,6906 0,0078

4 0,0066 0,5504 0,0313

5 0,0127 0,5764 0,0257

6 0,1282 0,6132 0,0816

7 0,0035 0,1196 0,017

8 0,0005 0,0962 0,0175

9 0,0007 0,7153 0,0099

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10 0,001 0,6737 0,0067

11 0,0075 0,6176 0,039

12 0,0139 0,5633 0,0537

Применение QAP процедуры подтверждает существенное отличие от нуля всех коэффициентов. Заметим, что для 7 и 8 периодов (1 и 2 полугодия 2008 года) величины авторегрессионных коэффи-

циенты значительно меньше, чем в предыдущие и последующие периоды, что свидетельствует об отличии структуры связей между доходностями активов в период финансового кризиса.

Иной подход предполагает вычисление формальной меры сходства (расстояния) между двумя графами или соответствующими матрицами смежности. В литературе можно найти значительное количество различных способов построения подобных мер, основанных на поиске совпадающих частей двух графов или максимального общего подграфа, оценивании сходства топологий двух графов и др. [46-57].

В данном исследовании мы сравнивали результаты использования следующих способов расчета расстояний между графами, предложенными в работе [46]. Пусть С0 и О^ - матрицы смежности двух графов, отражающие взаимосвязи для одного и того же множества объектов, например, в разные периоды времени. Определим расстояние между графами, следующим образом:

центральности вершин графов О0 и О1. В принципе, сходство показателей центральности вершин двух графов можно было бы измерить, вычислив значение коэффициента корреляции Спирмена. Но ранги вершин чувствительны к небольшим изменениям данных. Поэтому целесообразно ввести некоторый порог е и считать одинаковыми ранги вершин, если различие значений показателя центральности меньше этого порога. Определим:

Y =

11, ci - cj >s 0, cj - cj <£.

Расстояние между графами можно найти, используя меру Хэмминга:

S Ig1 - G,0| Ф ■• G'K-21. i(G.G; )

n maxi

Данная мера обращается в ноль, если матрицы смежности идентичны. В работе [46] предложено общение данной меры, позволяющее учитывать не только прямое, но и непрямое влияние вершин друг на друга.

Другой подход к измерению сходства графов основан на анализе значений показателей центральности вершин. Обозначим с ., t = 0,1 показатели

Ii

( ч Sir1! -Y d (g 0, g 1 >- и *k

n(n -1>

Используя приведенные меры, можно найти расстояния между графами в смежные периоды

d(от,От+ ), т = 1,2,...,т -1. На рис. 1 и рис. 2 отображены расстояния между матрицами смежности с последовательные периоды для рыночных графов и графов совместных упоминаний.

Рисунок 1. Расстояния между матрицами смежности в последовательные периоды для рыночного графа

0

Использование топологической меры позволяет отчетливо выявить существенное отличие рыночного графа в период финансового кризиса от предыдущего и последующего периодов (рис. 1). При этом структура взаимосвязей между доходностями

финансовых активов начала претерпевать серьезные изменения в начале 2008 года, затем изменения стали более плавными. Трансформация структуры новостного потока началось несколько позже и наиболее явно проявилась в период кризиса 2008 года.

Рисунок 2. Расстояния между матрицами смежности в последовательные периоды для графа совместных упоминаний

Более полное представление об отличии графов в разные периоды дает матрица расстояний между сетевыми структурами в различные периоды

d (от, О<),т = 1,2,..., т; д= 1,2,..., т.

Применение методов многомерного шкалирования позволяет оценить размерность пространства, в котором без потери точности может быть воспроизведена структура расстояний или, иными словами, число факторов, от которых зависит порождающий матрицу расстояний процесс, а также найти оценки значений этих факторов [64, 65]. В зависимости от особенностей данных применяют алгоритмы метрического или неметрического шкалирования. Алгоритмы метрического шкалирования ориентированы на наиболее точное воспроизведение значений элементов матрицы расстояний, тогда

как неметрические - лишь на наименьшее искажение монотонности последовательности расстояний.

Поскольку мы рассматривали временные последовательности графов двух типов и использовали два способа вычисления количественных оценок расстояний между ними, то алгоритм метрического шкалирования применялся к четырем матрицам расстояний между сетевыми структурами. На рис. 3 представлены изменения во времени значений первого фактора, выделенного процедурой метрического шкалирования для этих матриц.

На рис. 3(а) и 3(с) отображены результаты, полученные для рыночных графов, 3(Ь) и 3(с[) - графов совместных упоминаний. Выбор числа значимых факторов определялось на основе критерия RSQ -квадрата коэффициента корреляции между исход-

ной и воспроизведенной матрицей расстояний. Единственный фактор позволял объяснить более 80 процентов дисперсии значений элементов матриц расстояний между рыночными графами. Топология рыночных графов оставалась стабильной в большинстве периодов, но испытала кратковременные изменения во время финансового кризиса (период 6, рис. 3(а) и 3(с)). Эти выводы оказались достаточно устойчивы к выбору меры близости графов.

(а)

(с)

Первый фактор позволяет воспроизвести лишь около 50 % дисперсии значений элементов матриц расстояний между графами совместных упоминаний. Круг компаний, находящихся в центре внимания новостной аналитики не оставался постоянным во времени. Использование топологической меры позволяет отметить, что смещение внимания началось еще в предкризисный период.

■Ю-2

(Ь)

(d)

Рисунок 3. Динамика значений первого фактора, выделенного процедурой многомерного шкалирования для объяснения отличий сетевых структур

Заключение

Целями нашего исследования являлось, во-первых, анализ изменения во времени свойств графов двух параллельно протекающих процессов, и, во-вторых, сходства или различия их динамики, в-третьих, насколько результаты анализа устойчивы относительно выбора метрики сходства графов. Для этого мы рассчитывали матрицы сходства графов, построенных по данным за последовательные периоды, и анализировали построенные матрицы расстояний методами корреляционного и регресси-

онного анализа и многомерного шкалирования матриц смежности.

Мы обнаружили, что однофакторная модель может объяснить существенную часть динамики изменений структуры как рыночного графа, так и графа совместных упоминаний. Можно констатировать существенное отличие структуры графов в предкризисный и кризисный период от докризисного и после кризисного периода. При этом структуры матриц сходства графов в докризисный и после кризисный период достаточно схожи.

Литература

1. Cheng, C.Y.; Chen, T.L.; Chen, Y.Y. An analysis of the structural complexity of supply chain networks. Applied Mathematical Modelling 2014, 38, 2328-2344.doi:https://doi.org/10.1016/j.apm.2013.10.016.

2. Bellamy, M.; Basole, R. Network Analysis of Supply Chain Systems: A Systematic Review and Future Research. Systems Engineering 2013, 16.- 235-249 c.doi:10.1002/sys.21238.

3. Long, Q. Data-driven decision making for supply chain networks with agent-based computational

experiment. Knowledge-BasedSystems 2018, 141, 55-66. doi:https://doi.org/10.1016/j.knosys.2017.11.006.

4. Long, Q. A framework for data-driven computational experiments of inter-organizational

1. collaborations in supply chain networks. Information Sciences 2017, 399, 43-63. doi:https://doi. org/10.1016/j.ins.2017.03.008.

5. Boss, M.; Elsinger, H.; Summer, M.; 4, S.T. Network topology of the interbank market. QuantitativeFinance 2004, 4, 677-684, [https://www.tandfonline.com/doi/pdf/10.1080/14697680400020325]. doi:10.1080/14697680400020325.

6. Affinito, M.; Pozzolo, A.F. The interbank network across the global financial crisis: evidence from Italy Temi di discussione (Economic working papers) 1118, Bank of Italy, Economic Research and International Relations Area, 2017, P.45.

7. Stefano, B.; Guido, C.; Marco, D.; Stefano, G. Leveraging the network: A stress-test framework based on DebtRank. Statistics & Risk Modeling 2016, 33, 117-138.

8. Gofman, M. Efficiency and stability of a financial architecture with too-interconnected-to-fail institutions. JournalofFinancialEconomics 2017, 124, 113-146. doi:10.1016/j.jfineco.2016.12.

9. Bundi, N.; Khashanah, K. Complex Interbank Network Estimation: Sparsity-Clustering Threshold. Complex Networks and Their Applications VII; Aiello, L.M.; Cherifi, C.; Cherifi, H.; Lambiotte, R.; Lió, P.; Rocha, L.M., Eds.; Springer International Publishing: Cham, 2019; pp. 487-498.

10. Gorgoni, S.; Amighini, A.; Smith, M., Eds. Networks of International Trade and Investment; Vernon Press, 2018. Version May 16, 2019 submitted to Future Internet 17 of 19, P.47.

11. Hochberg, Y.V; Lindsey, L.A.; Westerfield, M.M. Resource accumulation through economic ties: Evidence from venture capital. JournalofFinancialEconomics 2015, 118, 245-267. doi:10.1016/j.jfineco.2015.06.

12. Bygrave, W.D. The structure of the investment networks ofventure capital firms. JournalofBusinessVenturing 1988, 3, 137-157.doi:https://doi.org/10.1016/0883-9026(88)90023-7.

13. Xue, C.; Jiang, P.; Dang, X. The dynamics of network communities and venture capital performance: Evidence from China. FinanceResearchLetters 2019, 28, 6-10. doi:https://doi.org/10.1016/j.frl.2018.03.009.

14. Boginsky, V.; Butenko, S.; Pardalos, P.M., Innovations in Financial and economic networks; Edward Elgar Publishing Inc.: Northampton, 2003; chapter On structural properties of the market graph, pp. 29-45.

15. Boginski, V.; Butenko, S.; Pardalos, P.M. Statistical analysis of financial networks. ComputationalStatisti cs&DataAnalysis 2005, 48, 431-43.

16. Huang,W.Q.; Zhuang, X.T.; Yao, S. A network analysis of the Chinese stock market.Physica A: Statistical Mechanics and its Applications 2009, 388, 2956-64.

17. Tse, C.K.; Liu, J.; Lau, F.C.M. A network perspective of the stock marketJournalofEmpiricalFinance 2010, 17, 659-67.

18. Boginski, V.; Butenko, S.; Pardalos, P.M. Network Models of Massive Datasets. ComputerScienceandInf ormationSystems 2004, 1, 75-89.

19. Onnela, J.P.; Kaski, K.; Kertész, J. Clustering and information in correlation based financial networks. TheEuropeanPhysicalJournalB 2004, 38, 353-62.

20. Boginski, V.; Butenko, S.; Pardalos, P.M. Mining market data: A network approach. Computers &Operations Research 2006, 33, 3171-84. Part Special Issue: Operations Research and Data Mining.

21. Emmert-Streib, F.; Dehmer, M. Identifying critical financial networks of the DJIA: Toward a network-based index. Complexity 2010, 16, 24-33.

22. Bautin, G.A.; Kalyagin, V.A.; Koldanov, A.P.; Koldanov, P.A.; Pardalos, P.M. Simple measure of similarity for the market graph construction. Computational Management Science 2013, 10, 105-24.

23. Garas, A.; Argyrakis, P. Correlation study of the Athens Stock Exchange. Physica A: Statistical Mechanics and its Applications 2007, 380, 399-410.

24. Vizgunov, A.; Goldengorin, B.; Kalyagin, V.; Koldanov, A.; Koldanov, P.; Pardalos, P.M. Network approach for the Russian stock market. Computational Management Science 2014, 11, 45-55.

25. Namaki, A.; Shirazi, A.H.; Raei, R.; Jafari, G.R. Network analysis of a financial market based on genuine correlation and threshold method. Physica A: Statistical Mechanics and its Applications 2011, 390, 3835-41.

26. Bautin, G.A.; Kalyagin, V.A.; Koldanov, A.P. Comparative Analysis of Two Similarity Measures for the Market Graph Construction. Models, Algorithms, and Technologies for Network Analysis; Goldengorin, B.I.; Kalyagin, V.A.; Pardalos, P.M., Eds.; Springer New York: New York, NY, 2013; pp. 29-41.

27. Shirokikh, O.; Pastukhov, G.; Boginski, V.; Butenko, S. Computational study of the US stock market evolution: a rank correlation-based network model. Computational Management Science 2013, 10, 81-103.

28. Wang, G.J.; Xie, C.; Han, F.; Sun, B. Similarity measure and topology evolution of foreign exchange markets using dynamic time warping method: Evidence from minimal spanning tree. Physica A: Statistical Mechanics and its Applications 2012, 391, 4136-46.

29. Kenett, D.Y.; Tumminello, M.; Madi, A.; Gur-Gershgoren, G.; Mantegna, R.N.; Ben-Jacob, E. Dominating Clasp of the Financial Sector Revealed by Partial Correlation Analysis of the Stock Market. PLoS ONE 2010, 5, 1-14.

30. Kalyagin, V.A.; Koldanov, A.P.; Koldanov, P.A.; Pardalos, P.M. Optimal decision for the market graph identification problem in a sign similarity network. AnnalsofOperationsResearch 2017, 266, 313-27.

31. Kalyagin, V.A.; Koldanov, A.P.; Koldanov, P.A.; Pardalos, P.M. Optimal decision for the market graph identification problem in a sign similarity network. AnnalsofOperationsResearch 2018, 266, 313-327. doi:10.1007/ s10479-017-2491-6.

32. Faizliev, A.; Balash, V.; Vlasov, A.; Tryapkina, T.; Mironov, S.; Androsov, I.; Petrov, V. Analysis of the Dynamics of Market Graph Characteristics. Third Workshop on Computer Modelling in Decision Making (CMDM 2018).Atlantis Press, 2019/02.doi:https://doi.org/10.2991/cmdm-18.2019.3.

33. Mahdi, K.; Almajid, A.; Safar, M.; Riquelme, H.; Torabi, S. Social Network Analysis of Kuwait Publicly-Held Corporations. Procedia Computer Science 2012, 10, 272 - 281. ANT 2012 and MobiWIS 2012, doi:https:// doi.org/10.1016/j.procs.2012.06.037. Version May 16, 2019 submitted to Future Internet 18 of 19

34. 476 Sankar, C.P.; Asokan, K.; Kumar, K.S. Exploratory social network analysis of affiliation networks of Indian listed companies. SocialNetworks 2015, 43, 113 - 120. doi:https://doi.org/10.1016/j.socnet.2015.03.008.

35. Battiston, S.; Catanzaro, M. Statistical properties of corporate board and director networks. TheEuropeanPhysicalJournalB 2004, 38, 345-352. doi:10.1140/epjb/e2004-00127-8.

36. Vasques Filho, D.; O'Neale, D.R.J. Degree distributions of bipartite networks and their projections.Phys. Rev. E 2018, 98, 022307.doi:10.1103/PhysRevE.98.022307.

37. Bargigli, L.; Giannetti, R. The Italian corporate system in a network perspective(1952-1983). Physica A: Statistical Mechanics and its Applications 2018, 494, 367 - 379.doi:https://doi.org/10.1016/j.physa.2017.12.016.

38. Sidorov, S.P.; Faizliev, A.R.; Balash, VA.; Gudkov, A.A.; Chekmareva, A.Z.; Anikin, P.K. Company Co-mention Network Analysis. In Computational Aspects and Applications in Large-Scale Networks; Kalyagin, V.A.; Pardalos, P.M.; Prokopyev, O.; Utkina, I., Eds.; Springer International Publishing: Cham, 2018; pp. 341-354. doi:10.1007/978-3-319-96247-4_26.

39. Balash, V.; Chekmareva, A.; Faizliev, A.; Sidorov, S.; Mironov, S.; Volkov, D. Analysis of News Flow Dynamics Based on the Company Co-mention Network Characteristics. Complex Networks and Their Applications VII; Aiello, L.M.; Cherifi, C.; Cherifi, H.; Lambiotte, R.; Lió, P.; Rocha, L.M., Eds.; Springer International Publishing: Cham, 2019; pp. 521-533.

40. Sidorov, S.P.; Faizliev, A.R.; Balash, V.A.; Gudkov, A.A.; Chekmareva, A.Z.; Levshunov, M.; Mironov, S.V. QAP Analysis of Company Co-mention Network. Algorithms and Models for the Web Graph; Bonato, A.; Pralat, P.; Raigorodskii, A., Eds.; Springer International Publishing: Cham, 2018; pp. 83-98.

41. Balash, VA.; Faizliev, A.R.; Korotkovskaya, E.V; Mironov, S.V.; Smolov, F.M.; Sidorov, S.P.; A., V.D. The Evolution of Degree Distribution, Maximum Cliques and Maximum Independent Sets of Company Co-Mention Network over Time.WSEASTransactionsonsystemsandcontrol 2019, 14, 97-103.

42. Mitra, G.; Mitra, L., Eds. The Handbook of News Analytics in Finance; John Wiley & Sons, 2011, P.384

43. Mitra, G.; Yu, X., Eds. Handbook of Sentiment Analysis in Finance; 2016, P. 578

44. Sidorov, S.; Faizliev, A.; Balash, V Measuring long-range correlations in news flow intensity time series. International Journal of Modern Physics C 2017, 28, 1750103, [https://doi.org/10.1142/S0129183117501030]. doi:10.1142/S0129183117501030.

45. Aleskerov, F.; Shvydun, S. Stability and Similarity in Networks Based on Topology and Nodes Importance. Complex Networks and Their Applications VII; Aiello, L.M.; Cherifi, C.; Cherifi, H.; Lambiotte, R.; Lió, P.; Rocha, L.M., Eds.; Springer International Publishing: Cham, 2019; pp. 94-103.

46. Krackardt, D. QAP partialling as a test of spuriousness. Social Networks 1987, 9, 171-186.doi:https://doi. org/10.1016/0378-8733(87)90012-8.

47. Hubert, L. Assignment methods in combinatorial data analysis; New York: Dekker, 1987.pp.272-273.

48. Dekker, D.; Krackhardt, D.; Snijders, T.A.B. Sensitivity ofMRQAP Tests to Collinearity andAutocorrelation Conditions. Psychometrika 2007, 72, 563-581. doi:10.1007/s11336-007-9016-1.

49. Broder, A.Z.; Glassman, S.C.; Manasse, M.S.; Zweig, G. Syntactic Clustering of theWeb. Computer Networks 1997, 29, 1157-1166.

50. Bunke, H.; Dickinson, P.; Kraetzl, M.;Wallis, W. A Graphtheoretic Approach to Enterprise Network Dynamics; Birkhauser, Boston, 2007, P.226.

51. Gardiner, E.J.; Raymond, J.W.; Willett, P. RASCAL: Calculation of Graph Similarity using Maximum Common Edge Subgraphs. The Computer Journal 2002, 45, 631-644, [http://oup.prod.sis.lan/comjnl/article-pdf/45/6/631/1184782/450631.pdf]. doi:10.1093/comjnl/45.6.631.

52. Borodin, A.; Roberts, G.O.; Rosenthal, J.S.; Tsaparas, P. Link Analysis Ranking: Algorithms, Theory, and

Experiments. ACMTrans.InternetTechnol. 2005, 5, 231-297. doi:10.1145/1052934.1052942.

53. Papadimitriou, P.; Dasdan, A.; Garcia-Molina, H. Web graph similarity for anomaly detection. Journal of Internet Services and Applications 2010, 1, 19-30. doi:10.1007/s13174-010-0003-x.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

54. Papadopoulos, A.; Manolopoulos, Y. Structure-Based Similarity Search with Graph Histograms. Proc. DEXA/IWOSS Int. Workshop on Similarity Search 2003, pp. 174-178.

55. Koutra, D.; Vogelstein, J.T.; Faloutsos, A Principled Massive-Graph Similarity Function. Proceedings of the 2013 SIAM International Conference Version May 16, 2019 submitted to Future Internet 19 of 19 on Data Mining. Society for Industrial and Applied Mathematics, 2013, pp. 162-170, [https://epubs.siam.org/doi/pdf/10.1 137/1.9781611972832.18]. doi:10.1137/1.9781611972832.18.

56. De Domenico, M.; Nicosia, V.; Arenas, A.; Latora, V. Structural reducibility of multilayer networks. Nat. Commun. 2015, 6, 7864.

57. Krackhardt, D. Predicting with networks: Nonparametric multiple regression analysis of dyadic data. SocialNetworks 1988, 10, 359 - 381. doi:https://doi.org/10.1016/0378-8733(88)90004-4.

58. Rienties, B.; Heliot, Y.; Jindal-Snape, D. Understanding social learning relations of international students in a large classroom using social network analysis. Higher Education 2013, 66, 489-504.

59. Barnett, G.A.; Park, H.W.; Jiang, K.; Tang, C.; Aguillo, I.F. A multi-level network analysis of web-citations among the world's universities.Scientometrics 2014, 99, 5-26.doi:10.1007/s11192-013-1070-0.

60. Cantner, U.; Graf, H. The network of innovators in Jena: An application of social network analysis. ResearchPolicy 2006, 35, 463 - 480. doi:https://doi.org/10.1016/j.respol.2006.01.002.

61. Lee, W.; Lee, W.; S.Y., S. Patent Network Analysis and Quadratic Assignment Proceduresto Identify the Convergence of Robot Technologies. PLoSONE 2016, 11, e0165091.doi:https://doi.org/10.1371/journal. pone.0165091.

62. Mantel, N. The detection of disease clustering and a generalized regression approach. CancerResearch 1967, 27, 209-220. doi:https://doi.org/10.1016/0378-8733(87)90012-8.

63. Kruskal, J.B. Multidimensional scaling by optimizing goodness of fit to a nonmetric hypothesis. Psychometrika 1964, 29, 1-27. D0I:10.1007/BF02289565.

64. Borg, I.; Groenen, P.J.; Mair, P. Applied Multidimensional Scaling and Unfolding; SpringerBriefs in Statistics, Springer International Publishing, 2018,P.122.

Информация об авторах:

Владимир Алексеевич Балаш, доктор экономических наук, профессор, профессор кафедры математической экономики^СГО ID: 0000-0002-6987-4799, Researcher ID: D-9660-2013, Scopus Author ID: 55178491100, Федеральное государственное бюджетное образовательное учреждение высшего образования «Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского», Саратов, Россия e-mail: [email protected]

Сергей Петрович Сидоров, доктор физико-математических наук, доцент, заведующий кафедрой теории функций и стохастического анализа, ORCID ID: 0000-0003-4047-8239, Researcher ID: F-5530-2017, Scopus Author ID: 7004296306, Федеральное государственное бюджетное образовательное учреждение высшего образования «Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского», Саратов, Россия e-mail: [email protected]

Алексей Раисович Файзлиев, кандидат экономических наук, заведующий лабораторией, ORCID ID: 0000-0001-6442-4361, Researcher ID: E-1969-2017, Scopus Author ID: 56369452400, Федеральное государственное бюджетное образовательное учреждение высшего образования «Саратовский национальный исследовательский государственный университет имени Н.Г. Чернышевского», Саратов, Россия e-mail: [email protected]

Статья поступила в редакцию 16.05.2019; принята в печать 31.07.2019. Авторы прочитали и одобрили окончательный вариант рукописи.

Information about the authors:

Vladimir Alexeevich Balash. Doctor of Economics, Professor, Professor of the Department of Mathematical Economics, ORCID ID: 0000-0002-6987-4799, Researcher ID: D-9660-2013, Scopus Author ID: 55178491100, Saratov National Research State University named after N.G. Chernyshevsky, Saratov, Russia e-mail: [email protected]

Sergey Petrovich Sidorov, Doctor of Physics and Mathematics, Associate Professor, Head of the Depart ment of Function Theory and Stochastic Analysis, ORCID ID: 0000-0003-4047-8239, Researcher ID:

F-5530-2017, Scopus Author ID: 7004296306, Saratov National Research State University named after N.G. Chernyshevsky, Saratov, Russia e-mail: [email protected]

Alexey Raisovich Fayzliev, Candidate of Economical Sciences, Head of Laboratory, ORCID ID: 0000-0001- 6442-4361, Researcher ID: E-1969-2017, Scopus Author ID: 56369452400, Saratov National Research State University named after N.G. Chernyshevsky, Saratov, Russia e-mail: [email protected]

The paper was submitted: 16.05.2019. Accepted for publication: 31.07.2019. The authors have read and approved the final manuscript.

i Надоели баннеры? Вы всегда можете отключить рекламу.