楼主: laojie
3192 7

[统计软件与数据分析] 数据求助:stata14的中文转码问题 [推广有奖]

  • 1关注
  • 0粉丝

已卖:4份资源

本科生

39%

还不是VIP/贵宾

-

威望
0
论坛币
3456 个
通用积分
52.7080
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1511 点
帖子
55
精华
0
在线时间
100 小时
注册时间
2006-12-28
最后登录
2025-11-23

楼主
laojie 发表于 2019-7-2 00:14:42 |AI写论文
50论坛币
老问题了,stata14打开数据库无法显示中文
由于数据库比较大,不想重新从excel导入文件
论坛里常用的命令,我试过了:
cd "D:\00.资料\02.Data_in all\mydata\"      (设定目标文件夹)        
unicode analyze 2017demo.dta         (分析数据文件)
unicode encoding set ISO-8859-1       (这里是最诡异的,只能用这个encoding)
unicode retranslate 2017demo.dta, transutf8    (显示转换成功,但是转换后还是不能读的中文)


第二步是最诡异的,我试了如下编码,系统全部报错
unicode encoding set gb18030
unicode encoding set windows-936-2000
unicode encoding set ibm-1383_P110-1999
unicode encoding set Windows-1253
unicode encoding set ISO 8859-7

全部报错 invalid encoding

附件是待转换的数据库(只有部分变量),如能成功,请联系我。
我把完整数据库发给你,或者你教我如何转换。酬谢200个论坛币

万分感谢!


2017demo.dta
下载链接: https://bbs.pinggu.org/a-2856112.html

317.79 KB

需要: 1000 个论坛币  [购买]

关键词:Stata14 Stata 数据求助 tata translate stata14 中文 乱码

沙发
laojie(未真实交易用户) 发表于 2019-7-2 03:04:00
我自己解决了:
问题的症结在于gb18030得在中文版本中才能发挥作用
我下了stata15的中文版
请关注经管之家的微信公众号,输入stata15,就可以看到网盘链接

然后输入下列命令即可
unicode analyze 2017demo.dta        
unicode encoding set gb18030     
unicode retranslate 2017demo.dta, transutf8

注意:有些变量可能包含了无法转换的信息,系统会把这些变量名列出来,重新编辑一下,再转换即可。
转化后的文件可以在14和15中打开

藤椅
Vivian淘气(未真实交易用户) 发表于 2020-1-20 17:08:15
您好,按照您的方法出现以下,想请教您这该如何解决呢

. unicode encoding set gb18030     
gb18030 invalid encoding
r(198);

.
. unicode retranslate shuju.dta, transutf8
encoding not set
    Before using unicode translate, you must set the character encoding you believe is being used, such as latin1.  There
    are lots of encodings.  You set the encoding using the unicode encoding set command.  You can set and reset the
    encoding and repeat the unicode translate command to see which works best.

板凳
laojie(未真实交易用户) 发表于 2020-9-7 23:41:01
Vivian淘气 发表于 2020-1-20 17:08
您好,按照您的方法出现以下,想请教您这该如何解决呢

. unicode encoding set gb18030
你的问题出在第一步,正如系统报错所示“encode set gb18030无效”,换言之你对数据的编码设置不对。
至于应该用哪个encode set,请先属于第一行命令 unicode analyze *.dta,看看分析结果再下判断。
另外,stata版本很重要,14和15均可使用。建议按照说明,先下载stata15的中文版。

报纸
爱吃肉的麻烦精(未真实交易用户) 发表于 2020-10-16 19:43:17
laojie 发表于 2019-7-2 03:04
我自己解决了:
问题的症结在于gb18030得在中文版本中才能发挥作用
我下了stata15的中文版
已关注公众号,单输入以后没有网盘链接,楼主方便分享一下中文版的stata15吗?

地板
渺渺Y(未真实交易用户) 发表于 2020-12-9 20:08:10
您好!
按照您的方法,确实出现了一些变量无法转码的信息。请问您说的“重新编辑一下,再转换即可”是什么意思呢?如何操作?

7
laojie(未真实交易用户) 发表于 2020-12-11 18:03:36
渺渺Y 发表于 2020-12-9 20:08
您好!
按照您的方法,确实出现了一些变量无法转码的信息。请问您说的“重新编辑一下,再转换即可”是什么 ...
前提是,正确安装STATA14或STATA15的中文版,我目前用的是15,在14上也试过。命令如下:
clear
unicode analyze "myfile.dta"  //对myfile进行转码分析
unicode encoding set GB18030  //大多数时候不需要写这个命令,因为默认set这个编码,可多试几种编码
unicode translate "myfile.dta", transutf8 // 转码,任何一个变量转码失败,整个文件都会失败。
在这一步,仔细检查失败的变量及其原因,看情况处理,直到转码成功为止。

8
laojie(未真实交易用户) 发表于 2020-12-11 18:03:59
渺渺Y 发表于 2020-12-9 20:08
您好!
按照您的方法,确实出现了一些变量无法转码的信息。请问您说的“重新编辑一下,再转换即可”是什么 ...
前提是,正确安装STATA14或STATA15的中文版,我目前用的是15,在14上也试过。命令如下:
clear
unicode analyze "myfile.dta"  //对myfile进行转码分析
unicode encoding set GB18030  //大多数时候不需要写这个命令,因为默认set这个编码,可多试几种编码
unicode translate "myfile.dta", transutf8 // 转码,任何一个变量转码失败,整个文件都会失败。
在这一步,仔细检查失败的变量及其原因,看情况处理,直到转码成功为止。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 10:43