搜索
人大经济论坛 标签 交互项 相关日志

tag 标签: 交互项经管大学堂:名校名师名课

相关日志

分享 交互项问题
乌小鱼子爱统计 2015-4-28 13:40
以下为楼主学习交互项笔记,具体参见 谢宇:《回归分析》,社会科学文献出版社, 2010 第 13 章。 1 、为什么做交互? 解决条件效应,即某个自变量对因变量的作用很可能依赖于其他自变量的取值。 例如, 月收入 --- 化妆品支出 与消费者的性别有关 可以回答例如这类问题:男性的月收入对化妆品支出的影响是否要小于女性月收入对化妆品的影响? 低次项不显著也可以进一步做交互,只要研究假设需要。 2 、交互的几种形式? 2.1 虚拟变量 * 虚拟变量 例如 性别 (男 =0 女 =1 )与 是否具有高中或以上学历(有 =1 无 =0 ) 对收入对数的影响 性别的作用取决于劳动者是否具有高中及以上学历,而学历的作用则取决于劳动者是否为女性。 2.2 连续变量 * 虚拟变量 例如 性别 ( 男 =0 女 =1) 与 exp( 工作年限 ) 对收入对数的影响 如果 sex*exp 系数为负,则说明 男性的工作年限对收入的影响大于女性工作年限对收入的影响,即工作年限对收入的影响存在性别差异。 2.3 连续变量 * 连续变量:两个不同的连续变量和某个连续变量的平方 2.3.1 exp (工作年限) *grossd( 工业总产值增长率 ) 如果系数为负的话,说明工业总产值增长率对于个人收入的作用和工作年限对个人收入的作用间存在着相互削弱的关系 2.3.2 exp2=exp*exp 一些变量如 年龄、工作年限对收入的影响是非线性的,在身体慢慢成长的过程中收入逐步上升,年老收入逐步下降,呈现倒 U 型,因此,研究中引入年龄、工作年限的二次项来描述这种与二次曲线有关的非线性作用。 3 、如何评估交互项有作用? 利用嵌套模型检验交互项的存在 嵌套之前的模型 残差 SSe1 自由度 df1 ; 嵌套之后 残差 SSe2 自由度 df2 零假设 交互项的偏系数 =0 备择假设 交互项的偏系数不为 0 F= /(SSe2/df2) 与 F(0.95,1,df2) 相比 。 4 、交互项与低次项的关系 4.1 低次项与交互项为什么要同时放入模型?可不可以删掉低次项? 要同时放入,不能删掉低次项。我们应尽量在模型中保留交互项的低此项,否则很有可能产生似是而非的结论( ClearyKessler,1982 )。 研究中常常遇到的一种情况是,在放入交互项之后,原来的低次项变的不显著了,那么是否需要删除呢? 公式原理参见(谢宇:《回归分析》,社会科学文献出版社, 2010:244-245 ) 结论是:( 1 )如果某个自变量是交互项涉及变量中的低次项,则该自变量在统计上是否显著并不能作为将该变量纳入或剔除出回归模型的依据,因为这种显著(或不显著)是可以通过对另一个低次项加上某个特定常数而人为构造的。 ( 2 )先做不放交互项的模型,再做有交互项的模型。在低此项作用显著的情况下,可以进一步验证由那些低此项构造的交互项对于因变量的作用是否显著。 为了使回归模型对交互项的估计保持一致,我们需要将交互项的所有低次项都放入模型。 4.2 如何处理低此项与交互项的共线性? 两个连续变量的交互,做对中处理。例如 edu*exp 教育与工作经验的交互,如果 exp 与 edu*exp 选项存在较强的共线性( pwcorr exp edu*exp , 模型共线性命令: vif 当 vif 的最大值大于 10 ,同时各 vif 的平均值大于 1 时,表明多重共线性比较严重。使用 vif 命令时一定要在回归命令执行以后再用。 其他如 做时间序列数据的回归也需要注意多重共线性(当样本量较小时,例如小于 100 )和序列相关性,需要考察 t 统计值、 R2 ( adj-R2 )、 F 统计量、 D.W. 值。)。 解决共线性做法: 对中处理法:将低次项减去样本均值后再构造交互项,同时将减去均值后的低次项带入回归模型,即 edu=edu-mean(edu) exp=exp-mean(exp), 模型中将 exp 、 edu 、( exp ) * ( edu )带入。
个人分类: 统计|12 次阅读|0 个评论

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 09:34