楼主: disertation
3391 5

[数据管理求助] 如何筛选数据 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

23%

还不是VIP/贵宾

-

威望
0
论坛币
3 个
通用积分
0.0032
学术水平
2 点
热心指数
3 点
信用等级
0 点
经验
619 点
帖子
45
精华
0
在线时间
223 小时
注册时间
2014-7-23
最后登录
2024-12-26

楼主
disertation 发表于 2014-12-12 13:07:27 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我有很多公司,面板数据,ID是不同公司,时间是年度。不平衡面板,有的公司有10(比如从2000-2010)年的数据,有的公司有7年、8年、9年等的数据,不等。我怎么筛选出有连续10年数据的ID(公司)组、有连续9年数据的ID(公司)组、有连续8年数据的ID(公司)组、---、有连续1年数据的ID(公司)组?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:筛选数据 面板数据 平衡面板 筛选出 不平衡 如何 平衡

已有 1 人评分论坛币 收起 理由
zhuosn + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

沙发
ermutuxia 发表于 2014-12-12 14:11:17
duplicates tag id year,gen(count1)
replace count1=count1+1
browse if count1<=4
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
SpencerMeng + 40 + 1 + 1 给力~!

总评分: 论坛币 + 40  学术水平 + 1  热心指数 + 1   查看全部评分

藤椅
disertation 发表于 2014-12-12 15:50:46
ermutuxia 发表于 2014-12-12 14:11
duplicates tag id year,gen(count1)
replace count1=count1+1
browse if count1
多谢!

板凳
disertation 发表于 2014-12-12 23:43:34
disertation 发表于 2014-12-12 15:50
多谢!
经测试,duplicates tag id year,gen(count1) 的作用是给id和year 组合记录打上标识,并产生一个新变量count1,默认值是0, replace count1=count1+1 将count1的值由0变为1,browse if count1<=4,条件count1<=4永远成立,因为count1通过 replace count1=count1+1值变为了1,永远小于4,故条件没有特别意义,br if count1<=4等同于 browse.
如果想浏览count1==11或n(1<n<11)的数据,该如何实现呢? browse if count1==11 或br if count1==n,但关键是count1的值只等于1,无法随id和year组合值的增加而增加,该如何解决呢?

报纸
disertation 发表于 2014-12-13 00:02:57
disertation 发表于 2014-12-12 23:43
经测试,duplicates tag id year,gen(count1) 的作用是给id和year 组合记录打上标识,并产生一个新变量cou ...
通过 tabulate id 可以看到 id 的频度(依year),id的频度包括10、9、8、7、6、5、4、3、2、1,如果只想查询 id频度为8的数据,如何实现?  
browse if  id频度 ==8,关键是“ id频度” 如何表示,有没有某变量频度函数可直接取某变量的频度信息?

地板
disertation 发表于 2014-12-13 08:05:33
disertation 发表于 2014-12-12 15:50
多谢!
真心感谢!此是正解。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-24 15:24