|
之后,这将有助于在极为相似的顾问中发现领导者和追随者。由于相似的行为顾问被划分为一个集群,因此考虑每个集群中的样本投资组合来计算每个顾问之间的余弦相似性。余弦相似度是内部项空间的两个非零向量之间的可比性度量,它度量了它们之间边的余弦。0的余弦为1,其他边的余弦小于1。以这种方式,这是对引入而非大小的判断:具有类似引入的两个向量有一个余弦第3章。实验设计与设置13接近度为1,90处的两个向量的可比性为0,相反对照的两个向量的相似性为-1,与它们的大小无关。余弦贴近度尤其被用作正空间的一部分,其结果在[0,1]中完全有限。名称来源于“航向余弦”表达式:在这种情况下,请注意,单位向量最大程度上是平行的“比较”,最大程度上是正交的(相反)。这实际上相当于余弦,当部分对零边时,余弦是团结(最大值),当片段相反时,余弦是零(不相关)。该技术还用于量化集群内的内聚性。考虑一个例子,找出描述顾问投资组合的两个时间序列t1和t2之间的余弦相似性。t1=(5,0,3,0,2,0,0,0,2,0,0)t2=(3,0,2,0,1,1,0,1)使用以下公式计算余弦相似性:cos(t1,t2)=1.2/(| 1 | 2 |)=0.94每对时间序列数据之间的类似余弦相似性。
|