楼主: wgl25169410
1050 0

[R] 样本估计量抽样分布模拟(R) [推广有奖]

  • 3关注
  • 2粉丝

已卖:464份资源

博士生

89%

还不是VIP/贵宾

-

威望
0
论坛币
3556 个
通用积分
23.0224
学术水平
16 点
热心指数
17 点
信用等级
11 点
经验
14200 点
帖子
257
精华
0
在线时间
436 小时
注册时间
2016-9-6
最后登录
2025-11-28

楼主
wgl25169410 学生认证  发表于 2021-10-11 10:21:08 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
样本估计量抽样分布模拟(R)

[url=]样本估计量抽样分布模拟(R)[/url][url=]1 、OLS估计量分布[/url][url=]2 R语言实现[/url]                                                                                            1 、OLS估计量分布


对于线性回归方程




利用普通最小二乘法(OLS)估计上述方程参数使的假定(之一)是扰动项​必须满足正态分布,这样才能保证估计量也服从正态分布。当扰动项服从正态分布,如果自变量是确定性的,那么被解释变量也服从正态分布。根据OLS估计量的线性性性质




其中常数列​一定满足​,​。当样本估计量抽样分布知晓后,就可以进行推断统计,包括假设检验和区间估计等。下面通过R语言进行模拟这一过程。

2 R语言实现

数据模拟

  1. # OLS抽样分布
  2. # 数据模拟
  3. set.seed(1110)
  4. # 总体容量
  5. N = 5000
  6. ID = seq(1,N,1)
  7. # 自变量
  8. x1 = rnorm(N,2,3)
  9. x2 = rnorm(N,1,2)
  10. x3 = rnorm(N,2,1)
  11. # 残差
  12. e = rnorm(N,0,3)

  13. # 直方图与核密度曲线
  14. par(mar = c(2,2,2,2),mfrow =c(1,1))
  15. hist(e,prob = T,col = "blue",main = "残差e分布")
  16. lines(density(e), col="red", lwd=2)

  17. # 被解释变量
  18. y = 1 + 2*x1 + 3*x2 + 4*x3 + e
  19. # 被解释变量分布
  20. op <- par(fig=c(.03,.3,.5,.98), new=TRUE)
  21. hist(y,prob = T,col = "red",main = "y分布")
  22. lines(density(y), col = "blue", lwd=2)
  23. box()
  24. par(op)

  25. # 合并为数据框
  26. data = data.frame(ID,y,x1,x2,x3)
复制代码

残差与被解释变量的经验分布如下图

Rplot.png

接下来进行样本抽取(简单随机抽样,抽取一次,样本容量为500)

  1. # 样本抽取
  2. sample1 = sample(N,500,replace = FALSE)
  3. mydata1 = data[sample1,]
  4. # OLS回归
  5. OLS = lm(y~1 + x1+ x2 + x3,data = mydata1)
  6. B = OLS$coefficients
  7. B[1]
  8. B[2]
  9. B[3]
  10. B[4]
复制代码

现在抽取10000次,样本容量为500

  1. # 参数抽样分布
  2. B1 = numeric()
  3. B2 = numeric()
  4. B3 = numeric()
  5. B4 = numeric()
  6. for (i in 1:10000){
  7.   sampling = sample(N,500,replace = FALSE)
  8.   mydata = data[sampling,]
  9.   OLS = lm(y~1 + x1+ x2 + x3,data = mydata)
  10.   B1[i] = OLS$coefficients[1]
  11.   B2[i] = OLS$coefficients[2]
  12.   B3[i] = OLS$coefficients[3]
  13.   B4[i] = OLS$coefficients[4]
  14. }
  15. mypar = data.frame(B1,B2,B3,B4)
  16. # OLS估计量的线性性质,回归参数也服从正态分布
  17. par(mfrow = c(2,2))

  18. hist(B1,prob = T,col = "red",main = "截距系数抽样分布")
  19. lines(density(B1), col = "blue", lwd=2)

  20. hist(B2,prob = T,col = "red",main = "x1的系数抽样分布")
  21. lines(density(B2), col = "blue", lwd=2)

  22. hist(B3,prob = T,col = "red",main = "x2的系数抽样分布")
  23. lines(density(B3), col = "blue", lwd=2)

  24. hist(B4,prob = T,col = "red",main = "x3的系数抽样分布")
  25. lines(density(B4), col = "blue", lwd=2)
复制代码

各个参数的经验分布如下图:

Rplot01.png




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:估计量 Density OLS估计 Lines 最小二乘法

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 22:42