楼主: hy32gt
1215 3

[数据管理求助] 数值类型混合的数据筛选问题 [推广有奖]

  • 1关注
  • 2粉丝

硕士生

93%

还不是VIP/贵宾

-

威望
0
论坛币
431 个
通用积分
4.7204
学术水平
2 点
热心指数
2 点
信用等级
0 点
经验
1891 点
帖子
83
精华
0
在线时间
279 小时
注册时间
2012-7-13
最后登录
2020-11-11

楼主
hy32gt 学生认证  发表于 2015-1-6 18:41:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
主要是一列年份数据中夹杂着一些字符串,如“0000”“056”,之类的,可能由于工业企业数据库的录入时存在错误,我定义年份数据的时候或是直接将其转化为数值型的时候都会报错
形式
1   1999
2   2011
3   0000
4       56
5     006
5   2003
……将近百万条,所以人工识别的话就挺麻烦和费时的,所以能否请大神提供个筛选语句,将一部分错误信息去除掉?因为自己刚接触stata,感觉用if,drop等语句,但是不会写,所以能否请各位高手指点下,不甚感激。至于一些如56之类的,我想是用个2013左右的数与其做差,把余数过大的drop掉,不知道可不可行?谢谢各位了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据筛选 工业企业数据库 工业企业数 Stata drop 数据库 字符串 工业 信息 左右

沙发
hy32gt 学生认证  发表于 2015-1-6 18:49:17
好像理解错了,这列好像都是字符型吧,转化不了。encode好像也不行,destring报错了

藤椅
SpencerMeng 在职认证  发表于 2015-1-6 19:08:14
hy32gt 发表于 2015-1-6 18:49
好像理解错了,这列好像都是字符型吧,转化不了。encode好像也不行,destring报错了
destring var,replace force

最后加个force试试

板凳
hy32gt 学生认证  发表于 2015-1-7 11:15:58
SpencerMeng 发表于 2015-1-6 19:08
destring var,replace force

最后加个force试试
恩恩,谢谢了,不过已经采用real命令解决了

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 18:59