|
现在,我们将在第t天为j区生成的基于中间值的伪指数编写SJT。虽然这会产生更具代表性的伪指数,但如果通过普通最小二乘法估计回归系数α和β,如果残差(i) ,t来自非高斯平均尾分布。因此,我们使用heil-Sen估计来估计每个α和β,而不是标准最小二乘估计。在可能存在极值的情况下进行回归时,泰尔森方法被广泛使用,因为它比普通最小二乘法对异常值更具鲁棒性[?]。泰尔森估计值可以如下计算:对于j区的每个公司i,将数据写入t=1、2、…、的有序对(Sjt、ri、t),T斜率估计器^βi被定义为这些对之间所有成对斜率的中位数,即:^βi=中位数李,m- 李,nSjm- Sjn, m6=n,其中m和n覆盖所有有序对。鉴于该估计,截距估计量αiis被定义为ri,t的中位数-^β值。由于该估计器是根据中间值定义的,因此它对数据中的异常值具有高度鲁棒性,并将比使用标准最小二乘法对数据进行更好的拟合。根据Eqn,在每个公司的价格回报被转换以消除行业成员资格的影响之后。6使用泰尔-森方法估计α和β系数后,在数据上重新运行聚类算法。图3a显示了在消除行业成员影响后,按国家着色的公司MDSplot。与第节中的图2b进行比较。V地理集群变得更加明显,并且有几个清晰的集群。
|