楼主: 能者818
760 29

[量化金融] 基于时间聚类的日内金融市场状态检测 [推广有奖]

21
mingdashike22 在职认证  发表于 2022-5-15 14:50:34
在计算时间段相关矩阵之前,根据选定的时间尺度,对数据进行聚合,提取特征并计算回报。PGA是使用Nvidia Nsight和Microsoft Visual Studio开发环境在CUDA-C中实现的。从MATLAB环境中调用已编译的PGA来运行时间聚类分析。生成的聚类配置被传输到MATLAB工作区,从中我们可以确定幂律函数、提取SSV、估计在线聚类和计算转移概率矩阵。使用库存、时间段、集群c on figur at i on和相关数据,编写了一个MATLAB脚本来生成一个XML文件,其中包含无向图导入Gephi所需的节点和边缘元数据。

22
能者818 在职认证  发表于 2022-5-15 14:50:37
如第8节所述,Gephi用于可视化集群配置i。3.10 2017年2月24日预印本˙002˙compressedSTARTTrade/Quote数据库(MongoDB)高频时间序列对象(MATLAB)选择时间尺度的数据聚合(MATLAB)计算特征返回(MATLAB)计算时间周期相关矩阵(MATLAB)计算时间簇配置(CUDA-C)可视化簇?幂律适合簇大小(MATLAB)使用 标准(MATLAB)计算状态的特征向量(CFV)计算状态分配的FV到CFV的欧氏距离(MATLAB)估计时间簇配置(MATLAB)计算一步转移概率(MATLAB)生成XML节点/边缘元数据(MATLAB)导入XML并生成簇可视化(Gephi)ENDTransition prob?在线集群?可视化集群?生成XML节点/边缘元数据(MATLAB)导入XML并生成群集可视化(Gephi)YesNoyesNoyesNoyesNoyesNoyesNoyesNoyes图2:流程图说明了从时间周期相关矩阵确定时间集群配置、识别持续状态、使用特征向量估计时间集群配置以及确定状态转移概率的工作流程。进程按平台着色:MongoDB=黄色,MATLAB=绿色,CUDA-C=橙色,Ge p h i=紫色。8.3. 可视化对于集群配置可视化,我们使用了i on and Manipulation软件包(Bastian et al.(2009))中的Gephi graph visualis,以及节点和边的定制计数和Fruchterman and Rein gold(1991)节点间距算法。节点间边缘的存在表明它们是同一簇的成员,而边缘厚度提供了一种视觉上的改善,从而改善了簇内的连通性。

23
mingdashike22 在职认证  发表于 2022-5-15 14:50:40
对于接下来的可视化,我们选择按日内时间段给节点着色,以便在检测到的状态下显示任何日历时间影响。根据该方案,不同日期的sametime将获得相同的颜色。这些可视化如图3、5、7、9、12、13、14和15.8.4所示。结果讨论对于每组结果,我们考虑在一个月的时间内,每天从09:00到17:00连续进行8小时的t r adi活动。图3显示了60分钟周期的时间集群配置。我们首先注意到,从基于微观结构的时间相关性中检测到的非平凡簇表明,日内动态可能会简化为一组有限的时间状态。考虑到一天中的时间着色,我们注意到两个集群表现出与上午和下午时间一致的市场活动特征。深绿色集群指交易日的第一个小时(09:00至10:00),包括公开拍卖和后续活动。我们注意到,南非股市受到全球市场活动的强烈影响,部分原因是当地股票在英国、美国、欧洲和澳大利亚的多个交易所上市(JSE(2014))。在本分析中考虑的时间段内,英国市场开放时间为10:00 SAST,美国市场开放时间为15:30 SAST。2017年2月24日英国市场公开赛预印本˙002˙压缩对当地交易动态有重大影响,10:00至11:00时段分散在各个集群中,没有时间相关性。我们注意到,随着美国市场开始参与当地交易活动,从15:00到16:00出现了连续的深橙色集群。

24
大多数88 在职认证  发表于 2022-5-15 14:50:43
这种市场活动模式大体上证实了来自全球市场的这些外生市场效应。图4显示了从图3中选择的重要状态中提取的SSV。如第7节所述,我们使用从幂律函数到簇大小的尾部分布的X不稳定性来确定重要状态。在60分钟内,最显著的幂律分布是集群大小≥ 13,结果为6个重要状态。当考虑到特征值中每个平均变化的幅度和方向时,得到的SSV都是不同的。这确保了在线F V状态分配的更大确定性。图5显示了30分钟周期的临时集群配置。我们看到,随着粒度的增加,出现了更多的st at,根据粒度更细的市场活动对60分钟的状态进行了剖析。深灰色和深橙色连续的黎明和午后状态仍保持在这种规模,尽管内源性系统特征开始掩盖之前确定的前一个特征。我们注意到,没有明确的层次结构出现,因为一组30分钟的集群无法组合形成之前确定的60分钟集群,进一步突出了时间尺度特定的行为。图6显示了基于10个大小为≥ 14.图7显示了15分钟周期的时间集群配置。我们注意到,在每个已识别的集群中,一天中的时间多样性都在增加,这进一步突显了内源性系统活动。

25
kedemingshi 在职认证  发表于 2022-5-15 14:50:46
红色的连续簇与16:30到16:45之间的时间段有关,这表明市场活动在16:50开始的收盘拍卖中有一个特殊的特征。在这种规模上,英国和美国相关的影响似乎较弱,交易所的具体影响更为显著。因此,我们在图8中看到了更多种类的SSV,其中一些在30分钟的SCALE上看到了类似的结果,但更关注的是数量,而不仅仅是方向。图9显示了5分钟周期的时间集群结构。在这里,我们看到了相当多的系统行为差异。存在大量的单态,这可能归因于这种规模的数据中的噪声量,使得识别重要结构更加困难。我们注意到一天中有一个有趣的时间与检测到的集群相关,但是根据国家特定的市场特征,宽时段(上午、午餐、下午)似乎被分割成了连续的区块。5分钟的时间校准开始捕捉自动化、基于规则的交易代理的影响,这些代理显示出相当不同的特征信号。这进一步突显了以你所参与的规模研究市场行为的重要性。即使考虑到第10和第8节中的相关SSV,5分钟和15分钟的研究使用幂律标准显示出相同数量的重要状态,但特征值的方向和大小组合是不同的。图11展示了幂律函数对每个时间尺度上集群规模经验分布的结果。

26
kedemingshi 在职认证  发表于 2022-5-15 14:50:50
尾部分布的每一个fit都显示出Kolmogorov-Smirnov p值>0.1(假设幂律fit的零假设),这表明给定比例因子(α)和最小si z e(xmin)的幂律函数形式的一个strong-g fit(Clauset al.(2009))。此外,我们注意到,对于所考虑的每个时间尺度,α指数是不同的。在每个测量尺度下,这种具有统计意义的幂律函数与作为一个复杂适应系统的南ci市场的noti on一致,并且该系统在每个测量时间尺度下都接近临界状态(Mastromatteo和Marsili(2011))。进一步的研究应该验证这是否表明在不同的时间序列中系统行为存在不同的普适性类别,但是se初步结果确实表明存在一些复杂的系统行为层次,这促使需要进行特定规模的时间分析。图12显示了同一时间段(2012年11月1日至2012年11月30日)估计的60分钟集群配置,但每个时段的FV与已识别SSV的差异被用作状态分配的标准。这是一个简单的样本测试,用于确定拟议的在线状态分配方案是否能够识别Direct12 2017年2月24日预印˙002˙压缩聚类算法应用程序建议的str u ct。通过比较图12和图3,我们注意到在线状态分配算法确实恢复了连续的上午和下午状态,但更广泛地直观地将时间分为:开放式拍卖和清晨交易状态、英国市场开放状态、两个午餐时间、美国市场开放状态和一天结束/结束状态。这完全反映了外部市场的影响,这是对该方法的有力验证。

27
kedemingshi 在职认证  发表于 2022-5-15 14:50:53
表5显示了根据图12所示状态计算的经验一步转移概率矩阵,说明了该技术的一个潜在应用。1步转换显示了一种p-ar-t-ic-ul-ar偏好,表明交易代理可以利用一些可预测性。需要明确的是,只将FV分配给一个状态意味着我们已经开发了一种机制,使用当前的SSV集来检测我们当前处于哪个状态。过渡矩阵可以在线使用和更新,也可以用于域中的最优规划。图13至15和表6至8显示了使用特定时间尺度上的SSV估计的集群配置和概率矩阵。当一个人接近5分钟尺度时,观察外生时间效应的减弱是很有趣的。图16显示了在线状态分配算法的稳定性。鉴于在线FV的状态分配基于到预定SSV的最小欧几里德距离,我们计算样本中每个FV的最佳匹配距离,并使用Explot可视化经验分布。本文提出了用于在线状态检测的s-SVs的s-o估计。图12、13、14和15所示的在线集群配置使用了前期的FV,即用于估算SSV的同一时期。谨慎的做法是,确定使用样本外(事后)FV的状态分配是否显著偏离样本内分配,并在需要重新估计前评估SSV的样本外有效性。考虑到第5节所示的计算时间,在实践中,人们可以隔夜估计每个交易日的SSVS。

28
能者818 在职认证  发表于 2022-5-15 14:50:56
我们考虑了从2012年11月1日至2012年11月30日期间估计的SSV,并将事前(2012年11月1日至2012年11月30日)的在线状态结果与事后(2012年12月3日至2012年12月7日,SSV预计在ion一周后)的状态进行了比较。从这些结果来看,考虑到最佳匹配欧氏分布的范围更大,使用在线检测算法在60分钟时无法可靠地确定测试数据。30分钟、15分钟和5分钟的nutetime量表均显示出可接受的事后最佳匹配距离,但少数异常值除外。从这些初步结果来看,该算法似乎可以可靠地确定SSV估计后相对较短时间内30分钟、15分钟和5分钟的状态。

29
mingdashike22 在职认证  发表于 2022-5-15 14:50:59
更可靠的研究应该考虑SSV的精确半衰期,但考虑到离子时间的相对快速计算,这不可能是一个实际问题。2017年2月24日13日预印本˙002˙压缩图3:JSE 2012年11月1日至2012年11月30日期间的40个60分钟时间集群,代表184个不同的时段。每个节点代表一个交易日内60分钟的时间段,颜色阴影表示一天的时间(上午=绿色,午餐=黄色,下午=红色),节点连接表示集群成员。价差成交量-1012345集群5(21个成员,c5=35483.445)价差量VolImb-4.-3.5-3.-2.5-2.-1.5-1.-0.500.5集群6(15个成员,c6=7323.8035)价差量VolImb-0.15-0.1-0.0500.050.1集群7(16个成员,c7=542.8251)价差量VolImb-2.-1.5-1.-0.500.5集群12(14个成员,c12=982.9791)价差量VolImb00。050.10.150.20.25集群13(13个成员,c13=331.5971)价差量VolImb-0.6-0.5-0.4-0.3-0.2-0.100.10.2集群15(13个成员,c15=579.9487)图4:2012年11月1日至2012年11月30日期间JSE TOP40 60分钟集群状态特征向量。每一个图都显示了每个集群的交易价格、价差、交易量和报价量不平衡的平均变化≥ xminfrom截断的幂律函数。

30
何人来此 在职认证  发表于 2022-5-15 14:51:03
括号中显示了簇大小和簇内相关性。2017年2月24日预印本˙002˙压缩图5:JSE 2012年11月1日至2012年11月30日期间的40个30分钟时间集群,代表368个不同的时段。每个节点代表一个交易日内30分钟的时间段,颜色阴影表示一天的时间(上午=绿色,午餐=黄色,下午=红色),节点连接表示集群成员。价差成交量-0.1-0.0500.050.10.15集群4(15个成员,c4=260.3446)价差量VolImb00。020.040.060.080.1集群7(15个成员,c7=593.0322)价差量VolImb-0.2-0.100.10.20.3集群9(15个成员,c9=668.719)价差量VolImb-0.4-0.3-0.2-0.100.1集群10(14个成员,c10=378.3076)价差量VolImb-1012345集群11(21个成员,c11=34233.7002)价差量VolImb-0.4-0.3-0.2-0.100.1集群13(14个成员,c13=363.4887)价差量VolImb-0.4-0.3-0.2-0.100.1集群18(14个成员,c18=307.6546)价差量VolImb-0.3-0.2-0.100.10.2集群19(14个成员,c19=555.1054)价差量VolImb-0.1-0.0500.050.10.150.20.25集群25(14个成员,c25=388.596)价差量VolImb-0.1-0.0500.050.10.150.20.25集群28(17个成员,c28=767.8294)图6:2012年11月1日至2012年11月30日期间JSE TOP40 30分钟集群状态特征向量。每一个图都显示了每个集群的交易价格、价差、交易量和报价量不平衡的平均变化≥ xminfrom截断的幂律函数。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-29 14:45