楼主: mingxc188
5996 5

[数据管理求助] stata group和_n标识数据问题 [推广有奖]

  • 3关注
  • 1粉丝

讲师

68%

还不是VIP/贵宾

-

威望
0
论坛币
29 个
通用积分
6.0027
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3051 点
帖子
312
精华
0
在线时间
609 小时
注册时间
2009-9-15
最后登录
2025-12-28

楼主
mingxc188 发表于 2018-8-17 15:18:15 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问,我用stata,gen id=_n对数据进行标记,数据大约1700万,到最后发现id会出现重复值,用group也会出现相同问题,有知道怎么解决的吗?谢谢。
duplicates tag id,gen(df)
tab df




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Group Stata tata duplicates duplicate

1534490191(1).png (30.38 KB)

1534490191(1).png

回帖推荐

黃河泉 发表于5楼  查看完整内容

It's OK. 尔后也请用回复,我才会"被通知"!

沙发
黃河泉 在职认证  发表于 2018-8-18 07:02:12
1. 你若要问程序,永远附上资料;若要附上资料,永远用 dataex 印出资料;先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html。2. 请执行
  1. dataex 你的变量 in -10/-1
复制代码
并将其发出来!

藤椅
黃河泉 在职认证  发表于 2018-8-18 07:21:27
试试如下 (加入 double) 之类似
  1. clear
  2. set obs 18000000
  3. gen x = rnormal()
  4. gen double id = _n
  5. duplicates tag id, gen(tag)
复制代码
程序:
已有 1 人评分论坛币 学术水平 收起 理由
115861 + 5 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1   查看全部评分

板凳
mingxc188 发表于 2018-8-26 22:34:25
非常谢谢黄老师的回复,第一次求助,不太懂得规矩,下次一定注意。

报纸
黃河泉 在职认证  发表于 2018-8-27 07:02:37
mingxc188 发表于 2018-8-26 22:34
非常谢谢黄老师的回复,第一次求助,不太懂得规矩,下次一定注意。
It's OK. 尔后也请用回复,我才会"被通知"!

地板
mingxc188 发表于 2018-8-27 12:13:01
黃河泉 发表于 2018-8-27 07:02
It's OK. 尔后也请用回复,我才会"被通知"!
好的,黄老师,下次一定注意。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-6 19:43