楼主: melodyhome
2595 16

[数据管理求助] 【乱码转换奔溃】全国调查数据乱码,用尽办法,软件奔溃 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

21%

还不是VIP/贵宾

-

威望
0
论坛币
2991 个
通用积分
33.8664
学术水平
1 点
热心指数
5 点
信用等级
1 点
经验
170 点
帖子
12
精华
0
在线时间
283 小时
注册时间
2008-4-19
最后登录
2023-9-25

20论坛币
问题我自己解决了(见9楼,有操作步骤),由于不能将自己的回复作为最佳答案,我就随便点一个。

某国内调查机构今年7月析出一份2014年旧数据的更新版(全国公开),使用stata14分析社区数据,出现乱码。
我使用stata 14有1年多,清楚明白这个版本的软件分析国内数据,需要转换unicode。可这份社区数据实在无法转换(见附件 community.dta (1.81 MB) 。诚恳求教于各位大牛!
我使用命令如下:
  1. unicode analyze community.dta
  2. unicode encoding set "GB18030"
  3. unicode retranslate "community.dta", transutf8
复制代码
结果stata奔溃。
我还尝试使用
  1. unicode analyze community.dta
  2. unicode encoding set "GB18030"
  3. unicode retranslate "community.dta", transutf8 invalid
复制代码
stata依旧奔溃。
stata截图如下:
截图.jpg


最佳答案

蓝色 查看完整内容

rep78就成蓝色的了
关键词:调查数据 查数据 Community translate unicode

本帖被以下文库推荐

沙发
蓝色 发表于 2017-12-8 21:36:02 |只看作者 |坛友微信交流群
黃河泉 发表于 2017-12-10 09:25
谢谢,又长了一些知识!此外,除了 encode 外,您知不知道有什么其它指令会让数值变成"蓝色的"呢?
  1. sysuse auto,clear

  2. label define label_rep78   1"1次"  2 "2次"  3 "3次",replace
  3. label value rep78 label_rep78
  4. list rep78 in 1/5
复制代码
rep78就成蓝色的了

使用道具

藤椅
nuomin 发表于 2017-12-8 21:39:49 |只看作者 |坛友微信交流群
我用stata13.1打开后没发现有乱码。

使用道具

板凳
melodyhome 发表于 2017-12-8 21:55:41 |只看作者 |坛友微信交流群
nuomin 发表于 2017-12-8 21:39
我用stata13.1打开后没发现有乱码。
前面已说,我使用stata 14。stata 14不建议和stata 13 混用

使用道具

报纸
从融之旅 发表于 2017-12-8 23:25:59 |只看作者 |坛友微信交流群
变量标签太过杂乱,建议用stata13将标签整理之后再用14编码。

使用道具

地板
qiangli 发表于 2017-12-8 23:31:50 来自手机 |只看作者 |坛友微信交流群
那就都用stata13不是很好吗

使用道具

7
melodyhome 发表于 2017-12-9 10:57:00 |只看作者 |坛友微信交流群
从融之旅 发表于 2017-12-8 23:25
变量标签太过杂乱,建议用stata13将标签整理之后再用14编码。
谢谢回复。如果能详细指出具体问题,更好不过。是标签的unicode的哪一方面出了问题,怎么整理?这可是个巨大样本

使用道具

8
melodyhome 发表于 2017-12-9 10:57:56 |只看作者 |坛友微信交流群
qiangli 发表于 2017-12-8 23:31
那就都用stata13不是很好吗
谢谢回复。软件使用和购买科技产品一样,从新不从旧。

使用道具

9
melodyhome 发表于 2017-12-9 11:47:22 |只看作者 |坛友微信交流群
已解决。用R读进去,发现变量标签字符串超过stata的限定,导致unicode translate失败。迂徊的办法是,先在stata 14里安装savespss,将dta格式转化为spss的sav(最大化保留标签),再安装usespss,用stata读入。如此转化就不会崩溃。

建议各位朋友出现类似情况,可采取先在各软件格式间转换的办法,再进行unicode的转换。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
奇犽dsp + 1 + 5 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 5  信用等级 + 1   查看全部评分

使用道具

10
奇犽dsp 学生认证  发表于 2017-12-9 13:03:32 |只看作者 |坛友微信交流群
melodyhome 发表于 2017-12-9 11:47
已解决。用R读进去,发现变量标签字符串超过stata的限定,导致unicode translate失败。迂徊的办法是,先在s ...
昨晚看到你的问题我运行之后也发现程序崩溃,今天早上想到能不能在stata中导出数据到excel,再看相关端倪。不过导出excel对于大数据来说不太方便。用你说的导出到spss倒也可以一试。不过我刚才尝试用spss导入你的dta文件发现失败了。。。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 18:57