楼主: jzbd
1658 2

[数据管理求助] 同一id数据,却在显示不同地区。如何识别出来? [推广有奖]

  • 0关注
  • 28粉丝

已卖:2022份资源

学科带头人

28%

还不是VIP/贵宾

-

威望
1
论坛币
9333 个
通用积分
4.1175
学术水平
53 点
热心指数
55 点
信用等级
37 点
经验
14098 点
帖子
865
精华
0
在线时间
2301 小时
注册时间
2007-11-3
最后登录
2025-12-28

楼主
jzbd 发表于 2018-10-12 12:33:15 |AI写论文
10论坛币
例如
id         diqu
123      河南
123      河南
123      河北
124      浙江
124      浙江
126      江苏
126      江苏

这里面 id为123 的企业,大部分都是 显示 在  河南,但是,有个地区显示是在 河北。如何把这些异常值识别出来。
请大神出手帮忙一下。谢谢了。(由于样本量很大,没有办法手动操作。)


最佳答案

黃河泉 查看完整内容

你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769, https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html。
关键词:异常值识别 手动操作 异常值 样本量
加油!!!坚持,才有持久力!

沙发
黃河泉 在职认证  发表于 2018-10-12 12:33:16
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html

藤椅
黃河泉 在职认证  发表于 2018-10-12 16:06:22
试试 (d=1 就是),
  1. gen d = (id==123)&(diqu=="河北")
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-28 16:54