|
类别向量的元素设置为1或0,每个元素的概率为50%。用户偏好向量以50%的概率设置为零,否则设置为1或1-1的概率相等。在用户和项目之间逐个创建链接。我们向其添加链接的用户i以统一的概率在每个用户中选择,项目α按照以下规则选择p(α,i)=θkα+1Pβkβ+1+(1- θ) cα·ti/OαiPβcβ·ti/Oβi(D.1),其中θ是一个参数,用于调整生长过程中使用的首选附件或用户偏好的数量,而Oα是充满cβ·ti=cα·ti的项目数β。用Oαi进行归一化可增加重叠度高的项目的权重cα·i,并补偿此类项目数量较少的事实。当α·ti<0时,该项与1成正比- θ被忽略,只有第一项贡献toP(α,i)。网络中总共创建了m个链接。请注意,模型设置和参数是任意的,可以修改以适应用户和项目的不同行为。这一基本模型与用于评估新闻推荐模型[44,45]的基于代理的模型类似,但它并不足以说明优先依恋和推荐绩效之间所需的依赖关系。当网络仅以优先依附(θ=1)构建时,项目的实际程度与其未来增加程度之间的相关性为0.91。当只使用用户偏好来构建网络(θ=0)时,这种相关性下降到0.11。然后,使用与之前国家产品数据相同的方法,对通过热扩散或质量扩散方法对人工创建的数据得出的建议进行评估。结果如图D.1所示。在没有优先连接的情况下,马萨和热在精确度和恢复方面表现相似。
|