技术文章和通讯

用图论和马尔可夫链探讨风险传染

作者:Ken Deeley, MathWorks


最近的金融危机和市场波动时期提高了金融分析师对风险传染和系统性风险的意识。因此,金融专业人员通常负责构建和分析模型,以洞察风险对投资、投资组合和业务操作的潜在影响。

一些作者描述了使用先进的数学和统计技术来量化投资、外汇汇率、工业部门或地理区域[1]-[7]之间的依赖关系。对于分析人员来说,弥合形式化方法和工作代码实现之间的差距是一个关键挑战。

本文展示了MATLAB如何®可用于利用各种数学工具分析风险传染的各个方面。涵盖的主题包括:

  • 数据聚合、预处理和风险基准测试
  • 量化财务变量之间的依赖关系
  • 将产生的依赖关系网络与邻近信息可视化(图1)
  • 利用隐马尔可夫模型分析风险传染的周期

下载本文的MATLAB实时脚本交互式访问所有的图像,方程,和代码。实时脚本包含本文中的所有代码、输出、方程和图像。您可以下载该脚本,在MATLAB中打开它,并探索本文中描述的分析步骤。

R2016a或以上版本需要使用MATLAB Live Editor。如果你没有R2016a,你可以下载免费试用版

了解更多有关MATLAB实时编辑器。

risk_fig1_w.jpg
图1。工业部门收益的相关距离依赖网络。

数据聚合和预处理

我们首先收集了2008年1月至2013年12月期间各国中盘证券的价格记录。每种证券都有相关的元数据,如市值、工业部门和国家。在本文中,我们将分析不同行业之间的传染,但研究其他分组很容易——例如,来源国。我们使用标准化的市值来定义单个证券的权重,然后使用加权和来合计每个部门的所有证券。结果是基准价格序列,如图2所示。

risk_fig2_w.jpg
图2。八个工业部门的基准价格系列。

相关分析

研究变量之间依赖性的最简单方法之一是计算数据的相关矩阵。使用MATLABplotmatrix函数和统计和机器学习工具箱™相关系数函数,我们可以创建有信息的可视化显示,显示扇区返回序列数据中存在的成对关系。图3和图4显示了这些图表的示例。

图3中的非对角线元素显示了两两的关节分布,对角线显示了直方图上每个变量的边缘分布。图4通过说明工业部门收益之间的成对相关系数,量化了图3中所示成对线性关系的相对强度。为了研究变量之间更一般的单调关系,我们可以计算Kendall’sτ斯皮尔曼的ρ系数使用相关系数函数。

risk_fig3_w.jpg
图3。行业回报率之间的经验配对关系。
risk_fig4_w.jpg
图4。显示成对扇形线性相关系数的热图。0.80以上的相关性用红色突出显示。

使用图论可视化依赖关系

直接从相关矩阵中获得风险传染的洞见可能是困难的。应用图论是量化和可视化变量接近性的一种有效技术。为了测量接近度,我们使用映射将相关系数转换为距离,例如\(f(C) = 1 - C\)或\(f(C) = \sqrt{2(1 - C)}\)

将工业部门分配到网络节点,然后通过相关距离给出的长度的边将节点连接起来。在[1]和[2]中,作者计算最小生成树(MST)。MST是一个连接所有节点的子图,其中总边长是最小的。在这种情况下,我们可以将MST看作是封装扇区之间依赖关系的“骨干网”。在MATLAB中我们可以使用而且minspantree函数直接计算MST:

G =图(sectorDist, sectors);T = minspantree(G);

在这里,sectorDist相关距离矩阵和行业包含扇区名称的单元格数组。

有几个选项可以可视化生成的MST。最简单的方法是使用图表情节直接在树上运行。提供2D表示[1]的另一种方法是通过Sammon映射在距离矩阵上使用非线性多维缩放:

cods = mdscale(sectorDist, 3, 'Criterion', 'Sammon');

为了创建2D可视化,我们传递得到的欧几里德坐标数组坐标情节方法:

情节(T, XData,坐标(:1),YData,坐标(2):,)

当结合一些简单的情节设置时,这种方法允许我们创建如图1所示的可视化。我们通过创建谢泼德图(图5)来评估图嵌入的质量。如果散点没有实质上偏离参考线,那么我们的嵌入质量很好。

risk_fig5_w.jpg
图5。萨蒙嵌入距离与实际距离的谢泼德图。

利用图中心性度量评估部门重要性

用图表形式表示数据有助于我们量化变量之间的关系。由于数学图形本质上提供了节点重要性的度量,我们可以通过计算这些量来评估扇区的重要性。我们使用中心关联的方法。对象:

发生率=中心性(T,‘度’);亲密度=中心性(T, '亲密度','成本',edgeWeights);中间性=中心性(T, 'betweenness', 'Cost', edgeWeights);

发病率的值计算与该节点相连的边的数量,而亲密是该节点到所有其他节点的距离之和的倒数。因此,较高的紧密度值意味着该节点是中心的或重要的。类似地,中间状态度量该节点在图中其他两个节点之间最短路径上出现的频率。较高的中间值意味着该节点很重要。

计算上述MST的这些度量会产生如图6所示的结果。我们看到,服务业在所有指标中都有最高的价值。中央服务节点在图1中以红色突出显示。

risk_fig6_w.jpg
图6。部门中心性度量由MST计算。

通过滚动窗口可视化风险传染

前一节中描述的分析使用了2008-2013年的完整数据集。在风险模型中,通常在滚动窗口中进行分析,以评估相关变量的动态变化。为了在连续6个月的滚动窗口中实现前面的分析,我们使用一个-loop增加每个窗口的开始日期。

控件可以在视频文件中捕获此过程中的图形VideoWriter类,显示了高度相关(> 0.80)扇区对随时间变化的发生率(图7)。

图7。滚动风险传染的例子。

图8显示了中央扇区随时间的变化。我们注意到,服务、工业品和消费品部门在整个时期具有高度重要性。

risk_fig8_w.jpg
图8。滚动窗口计算的中心节点跟踪。

用可选距离度量量化相关性

尽管相关性易于解释和计算,但它可能无法完全描述金融变量之间依赖关系的复杂本质。在[5]中,作者使用了基于熵和互信息理论的统计概念的度量。如果\(f_X\)是随机变量\(X\)的概率密度函数,则\(X\)的熵为

\[H_X = - \int f_X(x)\log f_X(x)\mathrm{d}x\]

我们可以把熵看作是对变量无序或随机性的衡量。高熵表明无序程度高。同样,如果我们有两个随机变量\(X\)和\(Y\),关节密度\(f_{X,Y}\),那么\(X\)和\(Y\)的互熵为

\ [H_ {X, Y} = - f {X, Y} \ iint日志f (X, Y) \ {X, Y} (X, Y) \ mathrm X \ d {} mathrm {d} Y \]

相互信息内容的\(X\)和\(Y\)的定义为

\[i_ {x, y} = h_x + h_y - h_ {x, y}\]

互信息可以用这个公式转换成距离

\[d_{X,Y} = 1 - \sqrt{1 - e^{2I_{X,Y}} \]

注意,最大距离是1。只有当\(X\)和\(Y\)的互信息含量为零时,这个结果才会实现,反过来,只有当\(X\)和\(Y\)是独立的[5]时才会发生。如果\(X\)和\(Y\)关系密切,则它们的互信息含量较大,因此距离接近于零。

我们可以在MATLAB中使用统计和机器学习工具箱函数估计两个随机变量的联合密度ksdensity.这种技术的优点是避免了数据上的任何分布假设。

假设\(X\)和\(Y\)是两个扇区的返回序列,计算\(H_{X,Y}\)的示例代码如下:

x = linspace(min(x), max(x), 250);y = linspace(min(y), max(y), 250);[Xgrid, Ygrid] = meshgrid(x, y);pts = [Xgrid(:), Ygrid(:)];fXY = ksdensity([X, Y], pts);fXY = shape(fXY, size(Xgrid));integrandXY = fXY .* log(fXY);integrandXY(isnan(integrandXY)) = 0;HXY = - trapz(y, trapz(x, integrandXY, 2));

该代码估计了250x250晶格上\(X\)和\(Y\)的联合密度,然后计算定义\(H_{X,Y}\)的二重积分trapz函数来进行数值梯形积分。一些如果\(f_{X,Y}\)的估计值为零,则在被积函数中出现值。我们在积分前将这些设为零。

图9显示了前两个部门(基本材料和消费品)的估计联合密度。

risk_fig9_w.jpg
图9。前两个工业部门的估计联合密度函数。

我们用类似的方法估计\(H_X\)和\(H_Y\),然后计算信息距离\(d_{X,Y}\)。估计精细晶格上的关节密度函数是一个耗时的过程,因此我们使用parfor在并行计算工具箱™中构建并行估计成对距离矩阵,这需要nSector (nSectors-1) / 2要计算不同的距离。图10显示了使用信息距离度量计算的结果MST。与前面的分析一致,中心部门是服务,在图10中用红色突出显示。

risk_fig10_w.jpg
图10。MST使用信息距离度量计算。

用隐马尔可夫模型建立风险传染模型

当从描述性分析转移到建模时,一些作者使用了统计技术,如隐藏马尔可夫模型(例如,参见[6])。回到滚动窗口分析,我们将高度相关的板块对数量视为市场风险传染水平的基本指标。

为了简单起见,我们假设三个潜在的、未观察到的风险传染水平,我们称之为“低”、“中”和“高”,构成一个隐藏的马尔可夫链的状态。我们将马尔可夫链中观测到的排放序列作为高度相关扇区对的数量,其范围从0到28。

图11显示了2008-2013年期间的观测数据。我们看到有几个高传染的时期,高传染似乎以不同的速度消散。下面的图表显示了发射跃迁的顺序——也就是说,从一个窗口到下一个窗口高度相关的对的数量的差异。

risk_fig11_w.jpg
图11。高度相关扇区对和发射跃迁的观测序列。

统计和机器学习工具箱为构建隐马尔可夫模型提供了一个框架。为了估计状态和发射跃迁矩阵,我们使用hmmtrain函数,提供初始猜测TR而且新兴市场对于未知矩阵:

[estr, estEM] =hmmtrain(排放,TR, EM);

为了检查估计矩阵的鲁棒性,我们可以在发射向量的子集上交叉验证,以确保算法收敛到相同的矩阵。图12显示了从图11中可视化的数据获得的马尔可夫链。表1显示了保持相同状态的高概率,以及向上或向下转换一个级别的小但非平凡的概率。在一个步骤中向上或向下转换两个级别的可能性微乎其微。

状态 媒介
0.964 0.036 0.000
媒介 0.107 0.833 0.060
0.000 0.035 0.965

表1。用马尔可夫链转移概率计算hmmtrain

risk_fig12_w.jpg
图12。隐马尔可夫链的状态图。

hmmviterbi函数回溯性地估计了最可能的状态序列:

states = hmmviterbi(emissions, estr, estEM,…'Statenames', {'Low', 'Medium', 'High'}).';

我们还计算后验状态概率使用hmmdecode

pstates = hmmdecode(emissions, estr, estEM).';

表格结果提供了对历史时期市场状况的洞察(图13)。第二列包含来自的输出状态hmmviterbi,列3-5包含后验状态概率hmmdecode.同样,通过比较可能的状态与观察到的市场数据,我们可以深入了解该模型的有效性(图14)。

risk_fig13_w.jpg
图13。隐马尔可夫模型分析结果表。
risk_fig14_w.jpg
图14。马尔可夫链状态和观察到的市场数据。

摘要及下一步步骤

理解系统性风险需要仔细的建模和分析。在本文中,我们实现了量化金融变量之间的接近性的技术,包括相关性和信息距离。我们已经了解了如何使用图论可视化邻近信息。在数据分析的探索性阶段,量化和可视化变量之间的关系非常重要。进入建模阶段,我们通过将隐马尔可夫模型与观测数据拟合,创建了一个简单的风险传染模型。

为了扩展本文中描述的技术,并在我们的分析中包括系统风险的其他方面,我们可以使用其他MATLAB工具箱中的高级模型,包括:

  • 时间序列和状态空间模型(在计量经济学工具箱™中)
  • 市场和信用风险模型(在金融工具箱™中)
  • 工具定价功能(在金融工具工具箱™中)

发布于2016 - 92983v00

参考文献

  1. Resovsky, Marcel, Denis Horvath, Vladimir Gazda,和Marianna Sinicakova,“最小生成树在货币市场中的应用”,外汇市场, 7/2013https://www.nbs.sk/_img/documents/_publik_nbs_fsr/biatec/rok2013/07-2013/05_biatec13-7_resovsky_en.pdf

  2. McDoland, Mark, Omer Suleman, Stacy Williams, Sam Howison和Neil F. Johnson,《利用外汇网络树检测货币的支配性或依赖性》https://arxiv.org/abs/cond-mat/0412411

  3. 欧阳,刘小东。基于网络分析的中国金融机构系统重要性及系统风险传染机制分析[j] .欧阳红兵,刘小东,CMS, 2015,V23(10): 30-37

  4. Lori, Giulia, Giulia de Masi, Ovidiu V. Precup, Giampaolo Gabbi和Guido Caldarelli,《意大利隔夜货币市场的网络分析》经济系讨论论文系列,第05/05号https://www.city.ac.uk/__data/assets/pdf_file/0017/90260/0505_iori-et-al.pdf

  5. Kaya,Hakan,《资产管理的怪癖》,《金融网络理论杂志》第一卷第一册(https://www.jbs.cam.ac.uk/faculty-research/centres/risk/

  6. Staum,Jeremy C.和Ming Liu Staum,“传染网络模型中的系统风险成分”2012年1月。可在SSRN:https://ssrn.com/abstract=1726107

  7. biisias, Dimitrios, Mark Flood, Andrew W. Lo和Stavros Valavanis,“系统风险分析的调查”,金融研究办公室,工作论文#0001,2012年1月5日https://financialresearch.gov/working-papers/files/OFRwp0001_BisiasFloodLoValavanis_ASurveyOfSystemicRiskAnalytics.pdf

查看相关功能的文章

查看相关行业文章

Baidu
map