[量化金融] 凝聚似然聚类 [推广有奖]

31楼

何人来此

发表于 2022-6-24 13:25:22

更快地展开社区：加快Louvain算法。物理。修订版。E、 92（3）：032801。[40]Tumminello，M.、Lillo，F.和Mantegna，R.N.（2007）。多变量数据的层次嵌套因子模型。EPL，78（3）：30006。[41]Tumminello，M.、Lillo，F.和Mantegna，R.N.（2010）。金融市场中的相关性、层级和网络。《经济行为与组织杂志》，75（1）：40–58。[42]Wilcox，D.和Gebbie，T.（2007）。新兴市场中的相互关联分析。Physica A：统计力学及其应用，375（2）：584–598。[43]Wilcox，D.和Gebbie，T.（2014）。金融经济学中的等级因果关系。https://ssrn.com/abstract=2544327.[44]Wu，F.Y.（1982）。Potts模型。修订版。摩登派青年物理。，54(1):235–268.[45]Yelibi，L.（2020a）。凝聚似然聚类。https://github.com/lyelibi/ALC.【46】Yelibi，L.（2020b）。单因素时间序列模型。https://github.com/lyelibi/timeseriesgen.[47]Yelibi，L.和Gebbie，T.（2020年）。快速超顺磁聚团。Physica A：统计力学及其应用，551:124049。[48]Zalesky，A.、Fornito，A.和Bullmore，E.（2012）。使用相关性作为网络连通性的度量。神经影像学，60（4）：2096–2106。[49]Zhang，Y.，Li，X.，和Guo，S.（2018）。Markowitz均值-方差框架下的投资组合选择问题：文献综述。模糊最优决策，17（2）：125–158。附录A：算法：凝聚似然聚类这里我们提供了ALC的伪代码：1。）生成候选群集，2。）使用等式n评估候选配置Lc【11】的可能性。（7），然后是3。）选择最好的候选者并丢弃其他候选者。表1 ALC实现的算法1伪代码（第。

32楼

能者818

发表于 2022-6-24 13:25:25

（三））和[45]1中的“alc.py”：输入：相关矩阵，输出：Tracker2：产生大小为N3的总体：而N≥ 2 do4：选择填充中的标签i 5：对于j 6=填充中的i do6：通过合并标签i创建标签k和j7：通过优化Lc8：添加k，从总体中删除i和j。9：结束时间：如果信用证≤ 0和输出Tracker11：对于人口do12中的j：存储相关性Ckjin相关矩阵13：更新Tracker14中的聚类组成：结束for 15：结束whileAppendix B：数据生成过程：综合相关时间序列Noh Ansatz【11，31】为聚类目的提供了一个强大的随机过程模型。我们利用以下方程式（相当于方程式（2））作为生成相关时间序列的方法：ξi（d）=√gsiηsi（d）+i（d）√1+gsi（B1）表（2）中描述了该过程。在图（2a）中，我们绘制了3000个D的模拟时间序列∈ （20、60、250），10个集群，每个集群的大小为300。时间序列可视化缺乏可解释性，尤其是在明显的噪声和混沌的情况下。我们使用其他工具，如最小生成树（MST）和降维方法，如UMAP，以提供更好的可视化效果。图（2b）和（2c）中分别显示了真实相关矩阵的最大似然误差，以及图（2a）中时间序列返回的估计值。因为MST依赖最近的邻居来构建图，所以这里的输入是dij=1- ρij。MST显然能够分解集群，在这种简单的情况下，人们可以在没有太多先验信息的情况下分辨出所有10个集群。在MST的拓扑结构中有一点需要注意，即从真实到估计的相关矩阵：根据数据估计相关性会引入拓扑结构中反映的噪声。（2） 1簇数：定义簇数C和簇大小s的值，并获得N=s*C数据集中的时间序列数。

33楼

kedemingshi

发表于 2022-6-24 13:25:28

拾取atime系列长度D（2）2个自旋标签：使用C标签创建自旋标签阵列列表（2）3个随机效应：创建CxD阵列η~N（0，1）和另一个NxD阵列 ~ N（0，1）。η和分别捕获每日集群和单个对象的随机影响。（2） 4固定集群内绑定强度：为gsper集群选择avalue：不需要为每个集群选择gsbeidentical。事实上，RealNoised系统将显示各种GSValue。然而，使用GSI简化了流程并提高了可维护性。（2） 5计算收益：创建一个NxD数组ξ，并使用等式n计算每日收益。（B1）通过在集群上循环，以及集群内的时间序列。表2：相关时间序列的Noh-Ansatz模型的实现（见代码[46]）使用UMAP，我们绘制了图（2a）中的相同数据，但出于视觉目的，投影在图（8）中的2D流形上。由于相关矩阵的估计，通常使用随机矩阵理论方法在一定程度上清理相关矩阵。图8：从上到下的GSI从0.1到0.3不等（见附录（B）中的模型），从左到右，时间序列长度为20到250。结果是UMAP[28]2D嵌入了3000个相关的时间序列，这些时间序列按10个集群进行排序。只有我们希望UMAP能够捕获数据的局部结构：从左到右，时间序列长度为20到250，而从上到下，GSValue的范围为0.1到0.3。噪声级由gs捕获：带有gs的群集→ 0是不同的，并且彼此接近，而使用gs的→ 1显示密度越来越高。类似的短时间序列会产生虚假的相关性和噪声细簇。数据集仍然是模块化的，非常有用，但随着时间序列长度的增加，它们会分散开来，因此应该更容易通过聚类算法进行分离。

返回列表

上一页 1 2 34

发帖

[量化金融] 凝聚似然聚类 [推广有奖]

浏览过的帖子

浏览过的版块

本版微信群