问题1:即使原数据全部都是正数,但是面板数据中心化后的数据是有正有负的,交互项肯定也是有正有负,这本身就改变了交互项的数据结构。估计结果差异是正常的。因此我做了交互项中心化和非中心化的相关系数,发现二者有时候是显著负相关的关系,也就是中心化显著改变了原交互项的数据结构。我不懂为什么大家都说结果基本不变。
问题2:问题1所述的情况在截面数据中也许少见,因为截面数据所减去的是所有截面的均值,因而相当于对变量进行了平移,但交互项也同样会出现如问题1所述的情况。
请看如下图中的计算过程。我将stata的运算简化到excel表格中,交互项有明显的巨大变化,不仅出现符号变化,且在数据变化趋势上也有差异。比如看上海市2008和2009年数据,本身lnh和lnsi都是增长的,非中心化的时候,交互项也是增长的,但是中心化以后发现2009年比2008年的交换项目要小。如果将上海的每一年数据作为一个截面,看后面的交互项,也同样出现了变化。那估计结果产生巨大变化是可以理解的。
但为什么目前所有的资料都说经过验证,中心化和非中心化的估计结果一致。
百思不得其解,请大神指教。可以有偿的。