楼主: liujiafei
4475 2

[学科前沿] 关于超大样本做回归,系数显著性问题 [推广有奖]

  • 1关注
  • 1粉丝

已卖:64份资源

教授

46%

还不是VIP/贵宾

-

威望
0
论坛币
23896 个
通用积分
158.7828
学术水平
8 点
热心指数
9 点
信用等级
8 点
经验
8988 点
帖子
263
精华
0
在线时间
2420 小时
注册时间
2006-3-21
最后登录
2025-12-30

楼主
liujiafei 发表于 2011-2-17 22:37:44 |AI写论文
50论坛币
我做了五个一般线性回归,一个被解释变量,5个解释变量(2个虚拟变量,3个连续性变量),然后分别依次增加解释变量做了另外四个一般线性回归
数据总共近3000000个case,
第一个模型的回归结果R2=0.16,后面四个模型的回归结果R2大约等于0.37
所有模型的回归系数全部显著,p值都等于0.000

我感到拿不准的就是回归系数的显著性问题

请问这种情况一般是什么原因造成的?是case太多导致的吗?

最佳答案

cangyuquan 查看完整内容

这是显著性检验本身的局限性,有一种说法是:只要你想要拒绝原假设,增加样本容量即可。因此仅考虑统计显著性是不够的,还应考虑统计检验的功效和实际的显著性。对于假设检验,在统计推断理论上一直是存在争议的,对于P值决策规则也存在诸多的批评。
关键词:大样本 性问题 是什么原因 解释变量 Case 样本 模型

本帖被以下文库推荐

沙发
cangyuquan 发表于 2011-2-17 22:37:45
这是显著性检验本身的局限性,有一种说法是:只要你想要拒绝原假设,增加样本容量即可。因此仅考虑统计显著性是不够的,还应考虑统计检验的功效和实际的显著性。对于假设检验,在统计推断理论上一直是存在争议的,对于P值决策规则也存在诸多的批评。

藤椅
echotianxia 在职认证  发表于 2011-2-18 09:43:36
样本太多,变量太少,大样本下,都显著,一般统计学家考虑时候 变量比样本数在1:10~30
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
liujiafei + 1 + 1 + 1 观点有启发

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 00:21