楼主: royyang
3421 2

[数据管理求助] 大样本数据处理经验 [推广有奖]

  • 3关注
  • 12粉丝

已卖:661份资源

教授

0%

还不是VIP/贵宾

-

威望
0
论坛币
2888 个
通用积分
13.1361
学术水平
76 点
热心指数
120 点
信用等级
65 点
经验
4807 点
帖子
488
精华
0
在线时间
1130 小时
注册时间
2011-6-11
最后登录
2025-8-25

楼主
royyang 发表于 2017-6-2 19:04:55 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如题,本人目前使用一套数据,包括2000W条的截面数据(分成10个文件,每个大约300多M),一半以上的变量是中文的,拿到的数据存储方式是csv格式的,现在用stata直接打开就发现一个问题,我使用stata13.1SE版本,在64位系统下,打开以后是中文是乱码,而且打开前csv300多M,打开后的dta有2.6G/个。
看论坛网友经验,本文通过以下几个途径试图解决问题:
1,可能是stata版本问题,所以我更换了stata13.1MP版本,也是这个问题,最后stata12.0下,仍然没有解决中文识别问题。2,我已经是经典模式,在个人偏好里面。
3,如果使用excel打开,试图通过excel转换,还有个问题,就是一个csv里面大约200W条数据,然后excel的极限是10W条,所以显示不全。
4,命令csvcovert命令不好用。
求问如何处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据处理 样本数据 样本数 大样本 Stata13 样本

沙发
royyang 发表于 2017-6-3 07:28:12
持续求助

藤椅
夏目贵志 发表于 2017-6-3 11:42:51
stata最新版本支持unicode。我不记得13是否支持了。如果可能的话用14试试。dta文件本来就大。正常的。
已有 2 人评分热心指数 收起 理由
royyang + 1 热心帮助其他会员
日新少年 + 1 精彩帖子

总评分: 热心指数 + 2   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-5 14:34