搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  Sample_Data.xlsx
资料下载链接地址: https://bbs.pinggu.org/a-4212688.html
附件大小:
悬赏数据缺失问题怎么计算平均值时候不计入缺失数据的行数?请看附件样本数据。
我打算计算使用proc means 或者 proc sql 都行,但是感觉计算出的结果小于预期很多,可能跟缺失数据的行数有关。 请帮忙指点,金币不是问题。 谢谢。

比如 group_name = A, B, C, D, E 在2021年如果A, C都没有数显示. 那么计算一年的平均数时候,就需要用B,D,E的数除以3而不是5。我是直接把缺失数据部分替换成0,不知道这样会不会影响计算平均数。 要不然得出的平均数小于预期。 如果某一行所有group_name 都是缺失,那么可以算成是0。但凡有一个组不是缺失,最后只计算有数据的组的数在某一年的平均数。

比如:

proc means data=sample_data n nmiss mean nolabels;
class survey_year;
by group_name;
var var1 var2 var3 var4 var5 var 6;
run;

proc sql;
create table sample_summary as
select group_name, survey_year, avg(var1) as avg_var1, avg(var2) as avg_var2, avg(var3) as avg_var3, avg(var4) as avg_var4, avg(var5) as avg_var5, avg(var6) as avg_var6
from sample_data
group by group_name, survey_year
order by 1, 2;
quit;





    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-28 18:58