1.因子个数选择。
主成分回归,一般提取解释力度85%以上的因子,比如提取4个因子,对被解释变量做回归。但是如果,其中一个因子不显著怎么办呢?有些学者直接删除该因子,然后将被解释变量对其余因子进行回归[都显著]。但是问题是这是三个因子(A),与在软件中设定只提取3个因子(B)[进入模型,都显著],这两组因子得分不同的,回归结果也不同啊。那么到底使用哪一种呢?是直接在软件中设置提取3个因子,还是先提取4个,然后删除一个呢?
2.面板数据
在面板数据主成分回归时,需要加入虚拟变量,此时在以标准化的主成分(因子)为解释变量的方程中,可以进行这样的操作吗?
3.原始变量与标准化变量不同
与传统的标准化回归然后还原成标准方程步骤(A)不一致,有学者在计算因子得分时,乘以特征根的平方根,得到以原始变量表示的主成分,然后直接对原被解释变量进行回归(B)。好像理论上也行。但是我试过,回归结果相差巨大,实在不知道哪一种方法是可靠的。
A or B?