|
要记住的一件事是,在*K-means中,一个人要筛选大量的P个聚合,当将2000多只股票聚类成100多个集群时,这会带来计算成本。另一个潜在的应用是在组合Alpha(交易信号)的背景下——参见,例如,【Kakushadze和Yu,2017a】。还有一个应用是当我们有一个期限结构时,比如一个期限不同的债券组合(如美国国债或其他一些债券),或者一个交付量不同的期货组合(如欧洲美元期货)。这些病例更像基因组数据,因为仪器的数量相对较少(通常甚至少于突变类别的数量)。另一个工具数量相对较少的例子是不同外汇(外汇)对的各种期货组合(即使是统一交割),例如美元/欧元、美元/港币、欧元/澳元等,即FX统计套利。优化此类投资组合风险的一种方法是采用聚类方法,而稳定的、本质上具有确定性的算法(如*K-means)可能很有用。希望K-means能成为癌症研究、定量金融以及其他领域(如图像识别)的一个有价值的工具。R源代码在本附录中,我们给出了用于统计计算的R(R)包,http://www.rproject.org)使用第2节的算法计算聚类和权重的源代码。代码简单明了,不言自明。主要功能是生物。cl.sigs(x,iter.max=100,num.try=1000,num.runs=10000)。这里:x是N×d发生计数矩阵Gis(其中N=96是或两者的数量…或者-这将是真正令人兴奋的-也许有一个生物学解释。无论如何,现在说还为时过早-另一种可能性是,这仅仅是我们使用的数据集的一个事实。
|