楼主: 何人来此
1106 23

[量化金融] 北欧证券交易所的交易模式。A. [推广有奖]

11
能者818 在职认证  发表于 2022-5-10 12:34:27
在随机共现的零假设下,观察到A,B的X共现的概率由超几何分布H(X | NT,NA,NB)描述[29]。通过了解X同时发生的概率,可以估计每对投资者以及调查状态a和B的每种组合的p值。具体而言,对于每对状态a和B,p值isp(NA,B)=1-不,B-1XX=0H(X | NT,NA,NB)。(2) investori和j之间三种交易状态的九种可能组合是(ib,jb),(ib,js),(ib,jbs),(is,jb),(is,js),(is,jbs),(ibs,jb),(ibs,js)和(ibs,jbs)。共现NA,b的统计验证需要多重假设检验校正[33]。广泛使用的多重假设检验修正是Bonferroni和错误发现率控制(FDR)方法。对于每种股票s,我们使用Bonferroni校正αb=20.01/9(Ns(Ns- 1) ),其中Nsis是指2003年至少有一次参与股票交易的投资者人数。不太严格的校正是通过控制FDR[34]获得的校正,其计算如下:所有不同k试验的p值(k=9Ni(Ni- 1) 在本例中,首先按递增顺序排列(p<p<…<pk),然后通过找到pkmax<kmaxpb的最大kmax来获得统计阈值。在表3中,我们报告了每只被调查股票至少同时出现九名被调查者的投资者数量。统计验证中使用的多假设检验校正是Bonferroni校正。在交易文件中同时出现的投资者数量最多的是诺基亚股票。这并不奇怪,因为诺基亚股票在2003年是OMXH25指数中交易量最大(如表1所示)和流动性最强的股票。

12
kedemingshi 在职认证  发表于 2022-5-10 12:34:31
结果还取决于待统计验证的状态数增加时变得更强的统计测试的能力。在表4中,我们报告了基于FDR校正的多假设检验校正的结果。正如预期的那样,显示经统计验证的共现情况的投资者数量正在增加,测试的准确性也在提高,尽管精确度可能会略有下降。表3中经统计验证同时出现的投资者数量当然总是包含在表4的相应条目中。图3展示了通过Bonferroni校正获得的诺基亚投资者统计验证网络。该网络由576名投资者组成。其中大多数是家庭,但也有其他类别的投资者在场。具体而言,该网络中有142家公司(紫色节点)、18家金融和1家金融NR(灰色节点)、5家外国组织(黄色节点)、16家政府(黑色节点)、378户家庭(蓝色节点)和16家非盈利(红色节点)投资者。对网络的直接检查表明,有一个由346名投资者组成的大型关联组件,所有共现验证都涉及ib、jb(蓝色链接)、is、js(红色链接),以及ib、jb和is、js(黑色链接)的同时验证。如表3和表4所示,经统计验证的最大网络是交易诺基亚股票的投资者。对于该股票,Bonferroni(即通过Bonferroni校正获得的统计验证网络)和FDR(即通过Benjamini-Hochberg校正获得的统计验证网络)网络分别有576和1518个节点。在其他OMXH25库存的情况下,Bonferroni和FDR网络始终填充,但节点数量要少得多。

13
何人来此 在职认证  发表于 2022-5-10 12:34:33
事实上,第二大经统计验证的网络是斯道拉恩索的网络,由67名投资者组成。通过FDR校正获得网络(见表4)。图3:由576名个人投资者组成的网络,他们在2003年对诺基亚股票的交易决策进行了统计验证。多假设检验校正是Bonferroni校正。投资者类别如下:公司(紫色)、金融(灰色)、外国组织(黄色)、ZF(黑色)、家庭(蓝色)和非营利组织(红色)。统计验证的共现类型标记如下:ib、jb(1075个蓝色链接)、is、js(2468个红色链接),以及ib、jb和is、js(10353个黑色链接)的同时验证。最后一个经过统计验证的网络如图4所示。在这种情况下,他们中的大多数是ZF组织。不同类别的投资者如下:11家公司(紫色节点)、15家金融(灰色节点)、17家ZF(黑色节点)、16户家庭(蓝色节点)和8家非营利(红色节点)投资者。与前一个示例一样,大多数共现验证涉及ib、jb(蓝色链接)、is、js(红色链接),以及ib、jb和is、js(黑色链接)的同时验证。网络不存在覆盖大多数节点的大型连接组件。事实上,最大的连接组件只有21个节点。剩余的OMXH25股票中,大多数都有经过统计验证的斯道拉股票所观察到的网络类型,即一个小的不相交聚类网络。如参考文献[19]所述,为了获得具有类似交易业绩的投资者群,我们对所有获得的经统计验证的网络应用了广泛使用的社区检测算法。

14
kedemingshi 在职认证  发表于 2022-5-10 12:34:38
具体而言,我们将Infomap算法[35]应用于我们网络的加权版本,其中每个链接的权重是两个投资者之间验证的共现次数(例如,当我们验证ib、JBIS和JS时,链接的权重设置为2)。在大多数情况下,网络中观察到的集群如图4所示:由67名个人投资者组成的网络,在统计上验证了2003年斯道拉恩索股票交易决策的同时发生。多重假设检验校正就是FDR校正。链接编码如下:ib、jb(6个蓝色链接)、is、js(210个红色链接)和同时验证ib、jband is、js(26个黑色链接)图5:投资者交易诺基亚(左)和theStora(右)股票的交易文件的色码表示。在横轴上,我们订购不同的投资者,而纵轴是时间(以交易日为单位)。左面板显示了576名诺基亚投资者的交易记录,其tradingco事件通过邦费罗尼修正进行了统计验证,而右面板显示了67名斯道拉投资者通过FDR修正进行了验证。红点表示买入,绿点表示卖出,白点表示买入/卖出。黑点表示没有交易。不同的辐射特性很容易检测到,尤其是对于大型集群。没有被算法进一步分割。但是,如果存在人口密集的大型连接组件(如诺基亚),则大型组件将通过算法进行分区。如参考文献[29]所述,我们使用获得的分区来可视化属于检测到的集群的投资者的交易模式。在图5中,我们展示了诺基亚和斯道拉投资者与图3和图4所示经过统计验证的网络的交易情况。

15
mingdashike22 在职认证  发表于 2022-5-10 12:34:46
在图中,红色点表示买入/卖出,绿色点表示卖出,白色点表示买入/卖出。一个空白点表示特定投资者和交易日没有交易。图5清楚地显示了在经过统计验证的网络集群中存在不同的交易产品,这些网络在某些情况下已被Infomap社区检测算法划分。5.聚类比较在前面的章节中,我们已经表明,相关分析和统计验证程序都提供了关于(i)不同投资者的交易组合的信息(在统计验证方法与社区检测程序联合使用的情况下),以及(ii)关于交易文件的层次聚类。在本节中,我们将研究这两种类型的信息是否重叠,或者提供互补类型的信息,如果重叠,我们旨在估计这种重叠的程度。比较这两组信息的一个困难是,虽然在经过统计验证的网络中提供了分区,但层次聚类只提供了需要处理才能获得分区的层次结构。从层次树开始获得分割的一种基本方法是在相异(或相似)度量的给定值处切割层次树,并考虑以低于切割阈值的距离连接的元素簇。该方法简单有效,但缺点是没有已知的最佳方法来选择阈值水平。出于这个原因,我们决定应用以下协议来检测SVN的分区和从分层树获得的分区之间的最大重叠程度。

16
大多数88 在职认证  发表于 2022-5-10 12:34:49
此后,我们将向交易诺基亚股票的投资者展示我们的投资组合。首先,我们选择一个层次聚类程序,并获得考虑系统的层次树(7824名投资者采用相关方法进行了调查,并在2003年交易了诺基亚股票)。我们使用单链接、平均链接和完整链接作为分层聚类过程[32]。对于得到的每个层次树,我们设置一个阈值,并从树中获得投资者的一个分区,其特征是投资者之间的距离小于所选阈值。在较远距离连接的节点被视为孤立节点。从获得的层次树分区中,我们选择了与Bonferroni网络中的576名投资者相关的分区。因此,我们通过计算调整后的兰德指数[36],对576名投资者的两个分区(一个来自SVN pluscommunity检测,另一个来自对层次树进行阈值化)进行了比较。调整后的兰德指数是一个广泛用于分区比较的指标。它是一个标准化指标,当两个分区相同时,它假定一个值等于一,当两个分区随机分配时,它假定一个值接近零。在图6中,我们显示了通过Infomap算法划分的Bonferroni统计验证网络分区之间的调整后兰德指数。图6:通过Infomap算法划分的Bonferroni统计验证网络获得的诺基亚投资者分区与通过执行基于诺基亚投资者差异性度量的分层聚类算法,并选择不同的切割阈值(横轴)。

17
mingdashike22 在职认证  发表于 2022-5-10 12:34:53
对单连杆(黑色圆圈)、平均连杆(红色圆圈)和完整连杆(蓝色圆圈)进行比较。画线来引导这条线。根据不同切割阈值(横轴)的分层聚类算法,对相同投资者进行分割。对单连杆(黑色圆圈)、平均连杆(红色圆圈)和完整连杆(蓝色圆圈)进行比较。在这三种情况下,我们观察到ARI的钟形曲线是阈值的函数。因此,在所有三种情况下,阈值的特定值都存在一个最大值。在图中,我们显示了通过以0.1的步长改变阈值计算的ARI值。然而,在接近最大值时,我们将阈值变化的增量设置为0.01。通过该分辨率,我们验证了单个、平均和完整层次树的阈值分别为0.80、1.09和1.31时观察到的ARI最高值。单次、平均和完全ARI的最大值分别为0.806、0.923和0.795。这些都是非常高的值,因此对于最佳阈值,层次树的分区与从Bonferror统计验证和使用Infomap进行的后续社区检测中获得的分区非常相似。平均连锁层次聚类的相似性最高。图7:交易诺基亚的投资者交易文件的色码表示。图的左侧部分(受蓝色竖条限制)显示了Bonferroni统计验证网络中576名诺基亚投资者的交易记录(与图左面板中的图相同)。

18
何人来此 在职认证  发表于 2022-5-10 12:34:58
5) 而右侧部分是使用1.09阈值从平均聚类的层次树中获得的聚类。重叠簇按照图5的顺序排列。为了提供两个分区相似性的视觉比较,在图7中,我们展示了投资者交易诺基亚股票的交易文件的色码表示,这些股票由Bonferroni统计验证网络定义,当使用通过最大化ARI获得的阈值时,由平均聚类层次树定义。在特定情况下,阈值设置为1.09,ARI为0.923。该图显示了由ARI指数的高值量化的高重叠。它还表明,层次树方法扩展了大量投资者可获得的信息。事实上,当使用1.09的阈值时,在319个至少有2个投资者的集群中检测到1419个诺基亚投资者。分层树划分的投资者数量明显大于Bonferroni统计验证网络观察到的576名诺基亚投资者数量。尽管我们有经验证据表明,ARI的最高值通常是在平均聚类中观察到的,但所使用的分层聚类类型的作用对于最大的聚类并不重要。单链接的使用正在增加。图8:通过Infomap算法(浅蓝色菱形)、单链接(红色圆圈)、平均链接(绿色三角形)和完整链接(蓝色正方形)划分的Bonferror统计验证网络,获得的分区簇大小的概率密度函数。股票是诺基亚。观察大簇的概率,而完整连锁选择最大的簇或相对较小的簇。平均连锁提供中间行为。无花果。

19
mingdashike22 在职认证  发表于 2022-5-10 12:35:01
8.我们展示了在Bonferroni分区和通过分层聚类算法获得的三个分区中观察到的簇大小(投资者数量)的概率密度函数。所有三种层次聚类方法都很好地再现了Bonferroni分区的行为。分区的数量和存在于分区中的投资者的数量在完全连锁中较高,在平均连锁中居中,在单个连锁中较低。通过考虑在Bonferroni分区和完整链接分区中存在的投资者的ARI值,可能以较低的分区精度为代价获得更广泛的投资者覆盖范围和完整分区。在目前的系统和演示示例中,平均链接为分割数量大于Bonferroni分割的投资者提供了最佳选择,Bonferroni分割保持了与Bonferroni近似相同的精度,用于通过统计验证方法选择的投资者。观察到Bonferroni统计验证网络提供了高度精确但不一定精确的聚类并不令人惊讶。事实上,众所周知,Bonferroni校正过于严格。这种选择确保了高水平的精确度(因为误报的数量很少),但另一方面,它可能与大量的假阴性相关,因此精确度相对较低。因此,基于相关性度量的聚类检测提供的结果可能不太精确,但更准确。

20
mingdashike22 在职认证  发表于 2022-5-10 12:35:06
相关方法的问题是,阈值过程没有任何理论依据。我们对两种不同方法获得的聚类显著重叠的观察表明,一种新方法的有效性,该方法使用Bonferroni统计验证的网络,通过高效的社区检测算法和分层聚类程序进行划分。在这种方法中,可以使用Bonferroni方法获得的精确信息来确定分层聚类过程中使用的最佳阈值。最后,当确定阈值时,从层次树中获得分区。最后一个划分覆盖了更多的投资者,这意味着更高水平的准确度,也许更低水平的准确度。6.讨论和结论我们已经证实,对于一些交易的股票,参与区域金融市场价格发现过程的不同投资者的数量可能是有限的。在表1中,我们注意到,从事诺基亚股票交易的芬兰投资者人数为41729人,其中7824人(见表2)在2003年至少进行了五笔交易。在价格发现过程中,这些数字可以被视为相当大(特别是考虑到许多其他交易是由作为注册代理人的外国投资者完成的)。然而,组成OMXH25指数的其他股票没有观察到类似的数据。事实上,除了诺基亚之外,只有其他六只股票在2003年至少有超过10000名投资者交易该股票(他们是ELIAV、FUM1V、NDA1V、OUT1V、TLS1V和UPM1V,见表1),但只有STERV和UPM1V在2003年有超过1000名投资者进行至少五次交易。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 22:28