1127 4

[数据管理求助] 请教各位老师,有关相似编码数据的删除问题。含dataex数据 [推广有奖]

  • 0关注
  • 0粉丝

已卖:65份资源

教授

24%

还不是VIP/贵宾

-

威望
0
论坛币
267 个
通用积分
320.7247
学术水平
10 点
热心指数
12 点
信用等级
10 点
经验
155057 点
帖子
170
精华
0
在线时间
2278 小时
注册时间
2015-6-1
最后登录
2025-12-23

楼主
想飞的夹尾巴狗 发表于 2018-10-7 20:09:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
老师好,目前想要处理的问题是这样的:
理论上第二列b的编码应该是基于第一列a的,故b列编码的前六位应该与a列的相同,如第一行所示100051 100051501。目前存在异常值,如第三行的100125 110147102,故想把这类异常样本全部剔除,不知道应该如何处理~
---------------------- copy starting from the next line -----------------------
  1. * Example generated by -dataex-. To install: ssc install dataex
  2. clear
  3. input double(a b)
  4. 100051 100051501
  5. 100051 100051502
  6. 100125 110147102
  7. 100435 130155521
  8. 100453 100453401
  9. end
  10. label values a a
  11. label values b b
复制代码

------------------ copy up to and including the previous line ------------------


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Data including generated previous generate

回帖推荐

黃河泉 发表于3楼  查看完整内容

试试

沙发
黃河泉 在职认证  发表于 2018-10-8 07:57:13
试试
  1. format b %10.0f

  2. gen c = (b-mod(b, 1000))/1000
  3. gen d = (a==c)
  4. drop if d==0
复制代码

藤椅
黃河泉 在职认证  发表于 2018-10-8 08:00:28
试试
  1. format b %10.0f

  2. gen c = (b-mod(b, 1000))/1000
  3. gen d = (a==c)
  4. drop if d==0
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Stakiny + 3 + 3 + 3 热心帮助其他会员

总评分: 学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

板凳
想飞的夹尾巴狗 发表于 2018-10-8 08:40:51
谢谢黄老师~

报纸
想飞的夹尾巴狗 发表于 2018-10-8 08:40:53
谢谢黄老师~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 20:33