楼主: 大多数88
876 32

[量化金融] 凝聚似然聚类 [推广有奖]

31
何人来此 在职认证  发表于 2022-6-24 13:25:22
更快地展开社区:加快Louvain算法。物理。修订版。E、 92(3):032801。[40]Tumminello,M.、Lillo,F.和Mantegna,R.N.(2007)。多变量数据的层次嵌套因子模型。EPL,78(3):30006。[41]Tumminello,M.、Lillo,F.和Mantegna,R.N.(2010)。金融市场中的相关性、层级和网络。《经济行为与组织杂志》,75(1):40–58。[42]Wilcox,D.和Gebbie,T.(2007)。新兴市场中的相互关联分析。Physica A:统计力学及其应用,375(2):584–598。[43]Wilcox,D.和Gebbie,T.(2014)。金融经济学中的等级因果关系。https://ssrn.com/abstract=2544327.[44]Wu,F.Y.(1982)。Potts模型。修订版。摩登派青年物理。,54(1):235–268.[45]Yelibi,L.(2020a)。凝聚似然聚类。https://github.com/lyelibi/ALC.【46】Yelibi,L.(2020b)。单因素时间序列模型。https://github.com/lyelibi/timeseriesgen.[47]Yelibi,L.和Gebbie,T.(2020年)。快速超顺磁聚团。Physica A:统计力学及其应用,551:124049。[48]Zalesky,A.、Fornito,A.和Bullmore,E.(2012)。使用相关性作为网络连通性的度量。神经影像学,60(4):2096–2106。[49]Zhang,Y.,Li,X.,和Guo,S.(2018)。Markowitz均值-方差框架下的投资组合选择问题:文献综述。模糊最优决策,17(2):125–158。附录A:算法:凝聚似然聚类这里我们提供了ALC的伪代码:1。)生成候选群集,2。)使用等式n评估候选配置Lc【11】的可能性。(7) ,然后是3。)选择最好的候选者并丢弃其他候选者。表1 ALC实现的算法1伪代码(第。

32
能者818 在职认证  发表于 2022-6-24 13:25:25
(三) )和[45]1中的“alc.py”:输入:相关矩阵,输出:Tracker2:产生大小为N3的总体:而N≥ 2 do4:选择填充中的标签i 5:对于j 6=填充中的i do6:通过合并标签i创建标签k和j7:通过优化Lc8:添加k,从总体中删除i和j。9: 结束时间:如果信用证≤ 0和输出Tracker11:对于人口do12中的j:存储相关性Ckjin相关矩阵13:更新Tracker14中的聚类组成:结束for 15:结束whileAppendix B:数据生成过程:综合相关时间序列Noh Ansatz【11,31】为聚类目的提供了一个强大的随机过程模型。我们利用以下方程式(相当于方程式(2))作为生成相关时间序列的方法:ξi(d)=√gsiηsi(d)+i(d)√1+gsi(B1)表(2)中描述了该过程。在图(2a)中,我们绘制了3000个D的模拟时间序列∈ (20、60、250),10个集群,每个集群的大小为300。时间序列可视化缺乏可解释性,尤其是在明显的噪声和混沌的情况下。我们使用其他工具,如最小生成树(MST)和降维方法,如UMAP,以提供更好的可视化效果。图(2b)和(2c)中分别显示了真实相关矩阵的最大似然误差,以及图(2a)中时间序列返回的估计值。因为MST依赖最近的邻居来构建图,所以这里的输入是dij=1- ρij。MST显然能够分解集群,在这种简单的情况下,人们可以在没有太多先验信息的情况下分辨出所有10个集群。在MST的拓扑结构中有一点需要注意,即从真实到估计的相关矩阵:根据数据估计相关性会引入拓扑结构中反映的噪声。(2) 1簇数:定义簇数C和簇大小s的值,并获得N=s*C数据集中的时间序列数。

33
kedemingshi 在职认证  发表于 2022-6-24 13:25:28
拾取atime系列长度D(2)2个自旋标签:使用C标签创建自旋标签阵列列表(2)3个随机效应:创建CxD阵列η~N(0,1)和另一个NxD阵列 ~ N(0,1)。η和 分别捕获每日集群和单个对象的随机影响。(2) 4固定集群内绑定强度:为gsper集群选择avalue:不需要为每个集群选择gsbeidentical。事实上,RealNoised系统将显示各种GSValue。然而,使用GSI简化了流程并提高了可维护性。(2) 5计算收益:创建一个NxD数组ξ,并使用等式n计算每日收益。(B1)通过在集群上循环,以及集群内的时间序列。表2:相关时间序列的Noh-Ansatz模型的实现(见代码[46])使用UMAP,我们绘制了图(2a)中的相同数据,但出于视觉目的,投影在图(8)中的2D流形上。由于相关矩阵的估计,通常使用随机矩阵理论方法在一定程度上清理相关矩阵。图8:从上到下的GSI从0.1到0.3不等(见附录(B)中的模型),从左到右,时间序列长度为20到250。结果是UMAP[28]2D嵌入了3000个相关的时间序列,这些时间序列按10个集群进行排序。只有我们希望UMAP能够捕获数据的局部结构:从左到右,时间序列长度为20到250,而从上到下,GSValue的范围为0.1到0.3。噪声级由gs捕获:带有gs的群集→ 0是不同的,并且彼此接近,而使用gs的→ 1显示密度越来越高。类似的短时间序列会产生虚假的相关性和噪声细簇。数据集仍然是模块化的,非常有用,但随着时间序列长度的增加,它们会分散开来,因此应该更容易通过聚类算法进行分离。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 19:39