楼主: why842000
3150 9

[一般统计问题] 和平均,及平均和之间不相等的问题 [推广有奖]

  • 1关注
  • 3粉丝

副教授

5%

还不是VIP/贵宾

-

威望
0
论坛币
356 个
通用积分
8.2840
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
14276 点
帖子
692
精华
0
在线时间
662 小时
注册时间
2007-5-21
最后登录
2025-9-30

楼主
why842000 发表于 2015-7-31 09:13:01 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
今天用STATA做分析,我有三个变量,分别求平均之后直接相加,与先求和之后再平均,两者之间是不相等的。如有三个变量X,Y,Z,先获得M=Mean(X)+Mean(Y)+Mean(Z);然后求N=Mean(X+Y+Z),然而M不等于N。请问这里出的问题在哪?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata mean tata 求平均

沙发
EosNz 发表于 2015-7-31 09:15:17 来自手机
why842000 发表于 2015-7-31 09:13
今天用STATA做分析,我有三个变量,分别求平均之后直接相加,与先求和之后再平均,两者之间是不相等的。如有 ...
a/b+c/d不等于(a+b)/(c+d)

藤椅
why842000 发表于 2015-7-31 09:20:21
EosNz 发表于 2015-7-31 09:15
a/b+c/d不等于(a+b)/(c+d)
在我的分析中,X是工资收入,Y转移收入,Z是财产收入。同时,这三个变量都是分城乡的。所以,当我求平均和、及和平均的时候,发现农村样本中,这M和N两者是相等的,但是城市样本中M和N是不相等的。请问下问题出在哪里?怎么改正?谢谢!

板凳
EosNz 发表于 2015-7-31 11:47:55
设X,Y,Z分别为总工资收入、总转移收入、总财产收入,样本为n1,n2,n3,总样本数为n=n1+n2+n3
M = X/n1+Y/n2+Z/n3 > X/n+Y/n+Z/n = (X+Y+Z)/n = N
只能说明乡村计算的精度有问题,偶然相等,或者样本数量差距太大。
不太明白为什么要研究这个论题 0.0
个人理解,有问题欢迎讨论

报纸
why842000 发表于 2015-7-31 12:41:46
我有样本1.2万个,8000个是农村样本,4000个是城市样本(在STATA中,urban=1是城市,urban=0是农村)。样本中有2个变量,分别是工资性收入X、财产性收入Y,通过这两个这个计算出个体的总收入:gen Z=X+Y。
我现在要描述这些变量X、Y、Z的平均值情况。在STATA中,用mean命令,即mean(X),over(urban)、mean(Y),over(urban)、mean(Z),over(urban)等。
最终,发现城市样本中Z的平均值,正好等于X、Y平均值之和。然而,在农村样本中,Z的平均值,不等于X、Y的平均值之和。

地板
汪玉薇 发表于 2015-7-31 23:36:40 来自手机
why842000 发表于 2015-7-31 12:41
我有样本1.2万个,8000个是农村样本,4000个是城市样本(在STATA中,urban=1是城市,urban=0是农村)。样本中 ...
亲,分析工具也是基于数学的,人家的公式很明显

7
汪玉薇 发表于 2015-7-31 23:39:18 来自手机
why842000 发表于 2015-7-31 12:41
我有样本1.2万个,8000个是农村样本,4000个是城市样本(在STATA中,urban=1是城市,urban=0是农村)。样本中 ...
不等是正常的,相等的那个才是问题

8
夏目贵志 发表于 2015-8-2 03:31:34
没有缺失数据的话应该是相等的。自己试试这个例子就知道了。
  1. clear all
  2. set obs 12000
  3. gen urban = 0 in 1/8000
  4. replace urban = 1 in 8001/l
  5. gen x = runiform()+urban*3
  6. gen y = runiform()+urban*3
  7. gen z=x+y
  8. mean(x), over(urban)
  9. mean(y), over(urban)
  10. mean(z), over(urban)
复制代码

9
夏目贵志 发表于 2015-8-2 03:37:22
有缺失值的情况下就不一定相等了。比如这个例子跟前一个基本相同,但是x有了缺失值。注意第7行。楼主可以自己试试。
  1. clear all
  2. set obs 12000
  3. gen urban = 0 in 1/8000
  4. replace urban = 1 in 8001/l
  5. gen x = runiform()+urban*3
  6. gen y = runiform()+urban*3
  7. replace x = . if urban==0 & y>0.5
  8. gen z=x+y
  9. mean(x), over(urban)
  10. mean(y), over(urban)
  11. mean(z), over(urban)
复制代码

10
why842000 发表于 2015-8-5 20:56:44
夏目贵志 发表于 2015-8-2 03:37
有缺失值的情况下就不一定相等了。比如这个例子跟前一个基本相同,但是x有了缺失值。注意第7行。楼主可以自 ...
嗯,用您这个试了一下,确实如你所说。主要还是缺失值所导致的。谢谢啦!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-12 06:34