楼主: zae莞尔
1672 1

[数据管理求助] stata有条件判断变量内部相同值 [推广有奖]

  • 1关注
  • 0粉丝

大专生

36%

还不是VIP/贵宾

-

威望
0
论坛币
6 个
通用积分
0.0838
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
4696 点
帖子
9
精华
0
在线时间
74 小时
注册时间
2011-10-18
最后登录
2021-5-15

楼主
zae莞尔 发表于 2014-2-19 16:43:23 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
code     year   comment
1          2010  a
1          2010  b
1          2010  c
1          2011  a
1          2011  c
1          2011  e
1          2012  b
'''''''
2         2010   f
2         2010   g
数据结构如上图。
对于某一年份的一个code,需要判断相同的comment在该code的下一年有没有出现,若有,产生新变量d=0;否则产生新变量d=1。
对于第一行,a在11年出现,为0;但对于第二行,b在11年没有出现,虽然在12年出现,在第二行产生的新变量仍为1。

https://bbs.pinggu.org/thread-1407787-1-1.html类似,但多了一个仅在下一年判断是否存在的条件。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata comment thread pinggu comment 2011

沙发
jjjj6666 发表于 2014-2-20 00:34:09
does this work (assuming no duplications)?

gen _obs=_n
sort code comment year
gen d=0 if code==code[_n+1] & comment==comment[_n+1] & year+1==year[_n+1]
replace d=1 if d==.
sort _obs
已有 1 人评分论坛币 学术水平 信用等级 收起 理由
SpencerMeng + 10 + 1 + 1 精彩帖子

总评分: 论坛币 + 10  学术水平 + 1  信用等级 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 05:23