|
例如,考虑以下两种候选群集配置:C1={1,2,3,3,4,4,4,5}C2={1,2,2,3,3,4,5}。然后,当考虑聚类指数2时,d(s2,s02)=1-|s2∩s02 | | s2∪s02 |=1-13= 0.67. 因此,我们有表1。计算两个重叠聚类结构聚类指数k | sk之间距离的最佳匹配度量演示∩ s0k | | sk∪ s0k | d(sk,s0k)1 1 0.002 1 3 0.673 0 4 1.004 1 3 0.675 1 1 0.00d(C1,C2)2.344.8=0.49考虑到集群配置之间的量化距离,我们需要指定一些距离阈值,以编码配置与被分类为相同状态的想法。该距离阈值的具体说明有些特殊,是主观输入的来源,但结合学习目标,我们可以迭代多个条件阈值,以确定一个优化目标的阈值。在第8节演示的用例中,我们考虑一个简单的Q-学习算法,其目的是通过决定何时购买/出售股票来实现财富最大化。从给定的现金金额和库存开始,我们向Learning agent提供一组固定的操作(购买/出售量),它可以根据当前状态在每个时期执行这些操作。每个候选距离阈值将为代理提供不同的镜头来区分国家,因此国家行动政策和代理的最终财富将受到影响。我们将选择一个最大化终端财富的阈值。最佳匹配指标易于计算、直观且有效,但Goldberg等人(2010)提出的替代指标应在进一步研究中探索,以评估对国家歧视的影响。6.
|