有个很奇怪的现象,大家看合理吗?
我的模型是:ln(工资)=a+b*工会+error,只有一个自变量:工会。工会是个虚拟变量,是工会的人是1, 不是工会的人是0。一共有2000个observation。
1. 2000人作出回归以后,b=0.30, p=0
2. 把2000人分成高收入和低收入两部分
3. 高收入的1000人回归,b_high=0.12, p=0
4. 低收入的1000人回归,b_low=0.18, p=0
奇怪的是,为什么2000人的b=0.30,不是在高收入b=0.12和低收入b=0.18之间呢?这样合理吗?
非常感谢!!!


雷达卡


京公网安备 11010802022788号







