楼主: mzdg
4307 1

[统计软件] 回归时控制了行业效应后结果不再显著 [推广有奖]

  • 0关注
  • 35粉丝

已卖:813份资源

教授

24%

还不是VIP/贵宾

-

威望
0
论坛币
33693 个
通用积分
60.7676
学术水平
73 点
热心指数
85 点
信用等级
59 点
经验
65344 点
帖子
768
精华
1
在线时间
1273 小时
注册时间
2013-10-14
最后登录
2025-12-11

楼主
mzdg 在职认证  学生认证  发表于 2017-9-16 09:22:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
普通回归的结果显著,当控制了行业效应时,结果不再显著,为什么呢?求大神解惑
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:行业效应

太极生两仪

沙发
phoenxidolly 学生认证  发表于 2017-9-16 15:16:47
对回归模型而言,如果不控制自变量的规模和回归的复杂度,无论多奇怪的Y,你都可以获得相应的回归模型,但是,这种回归往往是无意义的,因为往往这种回归是data mining。
一般而言回归模型是Y=h(X,W,V)+err,发生data mining时,模型看起来很美丽,但是实际上失去了可预测性,因为err也被当作有效数据加进了回归模型中,回归出来的比较像这样Y=g(X,W,V,Z,T,...)+o(h),其中o(h)趋近于0,这个模型和我们期望的h(X)实际上是不同的。
另外一个问题则是多重共线性的问题,即在回归模型中有两个或以上的自变量是相关的。举个例子,我们回归一个模型
体重=a年龄+b收入+c纬度
我们知道收入和年龄是正相关的,那么,我们在回归上面这个模型的时候,实际上增加了年龄这个变量的权重,那么我们跑出来的实验就很容易在年龄收入上表现出显著,因为它们是互相促进的。实际上我们想跑这个模型,那么就要把收入做一个投影,使之与年龄不相关,才能让他们彼此不再干扰。
回答楼主的问题,控制了行业效益结果就变得不显著,那么明显,实际上这个模型就应该是不显著的,也就是说,控制行业效益相当于剔除了数据中的多重共线性的数据,同样的,减少了对数据的过度挖掘。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-30 09:55