楼主: longswans
5471 2

[编程问题求助] 如何筛选出某个变量中里出现过很多次的值 [推广有奖]

  • 0关注
  • 0粉丝

小学生

57%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
36 点
帖子
3
精华
0
在线时间
12 小时
注册时间
2012-3-29
最后登录
2019-3-1

楼主
longswans 发表于 2013-3-7 21:46:03 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位同学,请教下,这是一个大样本的数据(10w)。我目前想通过小区代号、总楼层、所在楼层、面积来筛选出重复交易的房屋样本(因为数据里头房子没有一个唯一的标识),在stata如何实现?多谢!

数据样本



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:筛选出 Stata tata 如何实现 大样本 求助 统计

沙发
arlionn 在职认证  发表于 2013-3-8 08:40:31
egen id = group(x1 x2 x3 x4)  
然后用 id 作为房屋标识。
想要删除重复观察值,可以执行如下命令:
duplicates drop id
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
sucheng199099 + 3 精彩帖子
桂楚 + 3 + 3 + 3 热心帮助其他会员

总评分: 学术水平 + 6  热心指数 + 3  信用等级 + 3   查看全部评分

藤椅
longswans 发表于 2013-3-8 13:46:14
arlionn 发表于 2013-3-8 08:40
egen id = group(x1 x2 x3 x4)  
然后用 id 作为房屋标识。
想要删除重复观察值,可以执行如下命令:
谢谢啦!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-22 06:36