楼主: run4ever
6480 3

[原创博文] 如何计算数据的频率 [推广有奖]

  • 2关注
  • 0粉丝

svip3

讲师

34%

(VIP/贵宾)四级

1%

威望
0
论坛币
71675 个
通用积分
0.0715
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
100858 点
帖子
114
精华
0
在线时间
860 小时
注册时间
2009-9-1
最后登录
2025-12-1

楼主
run4ever 发表于 2010-9-27 13:38:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
收集了一组数据,是上万家公司在40年的时间里某个数据,但是数据参差不齐,比如有的公司有40年的全部数据,有的只有一两年,或者三四年的

第一列是公司的代码,用6个数字表示,第二列是年份,第三列是数据。

gvkey  year  data

现在想剔除掉那些数据小于两年的公司。就是只有一到两年数据的公司。

请问这个该怎么写?

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:year Data 参差不齐 ear 数字表 如何

沙发
feig 发表于 2010-9-27 13:46:09
用EXCEL试试。
已有 1 人评分热心指数 收起 理由
run4ever + 1 好的意见建议

总评分: 热心指数 + 1   查看全部评分

发现事实,尊重事实。

藤椅
pobel 在职认证  发表于 2010-9-27 15:52:43
data test;
   input gvkey $  year $ data;
   cards;
aaaaaa 1984 83949
aaaaaa 1985 88888
aaaaaa 1986 99999
bbbbbb 1987 81111
bbbbbb 1988 23934
cccccc 2000 1123
dddddd 2009 9890
dddddd 2008 8900
dddddd 2010 8999
;

proc tabulate data=test out=a(where=(N<=2));
    class gvkey;
   table gvkey;
run;

proc sql noprint;
    select quote(strip(gvkey)) into :rm_list separated by "," from a;
quit;

data wanted;
     set test;
     if gvkey not in (&rm_list);
run;
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
run4ever + 1 + 1 + 1 好的意见建议
crackman + 1

总评分: 学术水平 + 1  热心指数 + 2  信用等级 + 1   查看全部评分

和谐拯救危机

板凳
novice505 发表于 2010-9-27 16:06:57
假设原始数据集名为orig
proc sql;
        create table new as
        select *
        from orig
        group by gvkey
        having count(gvkey)>2;
quit;
proc print data=new;
run;
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
run4ever + 1 + 1 + 1 好的意见建议
crackman + 1 hao

总评分: 学术水平 + 1  热心指数 + 2  信用等级 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-9 11:23