交叉项是指两个变量联合解释,单独变量解释时会存在很明显的偏误,通过增加交叉项来降低该变量的偏误,以及防治单独变量错误回归时地错误解释。 考虑reg y a 和reg y a ab 其中y是成绩 ,a是听课时间, b是不认真程度,第一个回归可以得到y和a应该正相关,第二个回归能得到y与a正相关,但与ab负相关。若只考虑第一个回归,那我们就错误地得出结论听课时间越长成绩越好,其实考虑第二个回归就能发现成绩不仅和时间有关还与认真度有关。 一般交叉项用于定量变量(数量级,多少个)和定性变量(表示程度或者性质)之间的组合,比如最简单的性别问题,就可以在原解释变量上乘以一个性别地虚拟变量。 关于交叉项,学得不精,楼主酌情学习吧。 在模型中引入交互项通常有以下几种情况:例如X1和X2的交互项的引入,1、从经济理论和经济现象上二者之间本身就存在相互影响;2、X1是X2对于因变量产生影响的必备条件,就是说X2要想对因变量产生影响,必须是在X1起作用的情况下进行;3、在X1的不同取之范围或不同取值情况下,X2对因变量影响的边际量不同,如不同教育水平下的收入是不同的,而在不同的收入水平下其边际消费倾向是不同的。 https://bbs.pinggu.org/thread-2159403-1-1.html 例子:研究性别和学历对工资的影响,性别是F,学历是E,工资是S。 如果没有交叉项,那么回归的方程是S=beta0+beta1*F+beta2*E。 在这种情况下,性别的影响是beta1,学历的影响是beta2 。 而有交叉项,那么回归的方程是S=beta0+beta1*F+beta2*E+beta3*F*E 在这种情况下,性别对工资的影响是beta1+beta3*E,学历对工资的影响是beta2+beta3*F 所以我们很容易发现,交叉项刻画了什么呢?他刻画了一个人的学历对工资的影响是否受性别的影响,刻画了一个人的性别对工资的影响是否受学历的影响,换言之,他刻画了第一种情况下,如果把不同的性别分开回归,得出的beta2是否与F有相关关系,刻画了如果把不同的学历分开回归,得出的beta1是否和E有相关关系。 更简单点说,就是两个自变量对因变量的共同作用。