楼主: AmyandLWE
1254 4

[数据管理求助] 在stata中sort了cid以后就乱码了是怎么回事? [推广有奖]

  • 0关注
  • 0粉丝

大专生

8%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
373 点
帖子
19
精华
0
在线时间
47 小时
注册时间
2017-10-25
最后登录
2020-3-30

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,在处理cfps 2012年的数据库时,sort了村居代码cid以后,cid就乱码了,而且连带着省份的变量也跟着一部分乱码,请问有人遇到过类似的情况吗?是怎么解决的呢? 1512301838895.jpg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata CID SOR cfps

沙发
奇犽dsp 学生认证  发表于 2017-12-3 22:43:35 |只看作者 |坛友微信交流群
乱码的话试一试这个:
https://bbs.pinggu.org/thread-4169938-1-1.html

使用道具

藤椅
iorent 发表于 2017-12-3 23:18:27 |只看作者 |坛友微信交流群
你的操作系统是英文版的吧
不是排序后才出现的乱码, 是本身就存在乱码,因为中英文编码不一样
  1. clear
  2. cd "your path"
  3. unicode analyze "your data.dta"
  4. unicode encoding set gb18030
  5. unicode translate "your data.dta", invalid
  6. save "your data",replace
复制代码

转码之后可能有些变量值标签还是乱码,这时候只能返回编码簿查看变量标签值,重新编码成中文
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
我是小肚肚 + 1 + 1 + 1 我很赞同
黃河泉 + 3 + 3 + 3 分析的有道理

总评分: 学术水平 + 4  热心指数 + 4  信用等级 + 4   查看全部评分

使用道具

板凳
AmyandLWE 发表于 2017-12-6 09:51:49 |只看作者 |坛友微信交流群
iorent 发表于 2017-12-3 23:18
你的操作系统是英文版的吧
不是排序后才出现的乱码, 是本身就存在乱码,因为中英文编码不一样
你好,非常感谢你的回复,我是之前处理过中英文乱码的问题了,后来才发现是因为cfps可能有对外国人的调查,所以他们所在的村居代码是用特殊符号表示的,当时sort以后这些人的信息都排在最上面,后来下拉才发现后面的就是正常的了

使用道具

报纸
iorent 发表于 2017-12-7 22:03:53 |只看作者 |坛友微信交流群
AmyandLWE 发表于 2017-12-6 09:51
你好,非常感谢你的回复,我是之前处理过中英文乱码的问题了,后来才发现是因为cfps可能有对外国人的调查 ...
我觉得那些不是特殊符号,就是编码问题

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-14 04:25