请选择 进入手机版 | 继续访问电脑版
楼主: complicated
10358 19

[学习分享] SAS导入中文乱码的robust解决方案 [推广有奖]

  • 3关注
  • 18粉丝

副教授

65%

还不是VIP/贵宾

-

威望
0
论坛币
6463 个
通用积分
3868.8146
学术水平
88 点
热心指数
86 点
信用等级
58 点
经验
21961 点
帖子
507
精华
0
在线时间
1424 小时
注册时间
2007-6-16
最后登录
2024-4-19

complicated 在职认证  发表于 2012-12-12 16:01:16 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
500M以上的CSV,导入之后莫名其妙的一堆乱码,网上说要转ANSI才好,用notepad++都打不开,UE电脑里没有,是不是想撞墙?
我发现了一个很robust的办法,一般电脑里都很不起眼的装了access吧,
虽然性能遭各种鄙视,人家好歹是专门的数据库,兼容各种编码的性能还是过关的,起码比SAS专业。
不管你是csv还是txt都能导进去吧,导进去一看编码正常了吧,然后用SAS访问数据库读表就好了。
供参考~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:robust 中文乱码 解决方案 bust OBU 解决方案 中文 数据库 专业

已有 3 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
eijuhz + 2 精彩帖子
yukiooy + 1 + 1 + 1 这点子真厉害!!!
数据分析师3K + 100 + 100 + 5 + 5 + 5 专业观点

总评分: 经验 + 100  论坛币 + 100  学术水平 + 6  热心指数 + 8  信用等级 + 6   查看全部评分

密码被盗??
ziyenano 发表于 2012-12-12 16:06:36 |显示全部楼层 |坛友微信交流群
可能你csv文本的编码是utf8;
SAS默认的编码是gb2312,导入之后才会乱码,
你用filename命令设置csv的读入编码是utf8,这样导入就不会乱码了
已有 2 人评分学术水平 热心指数 信用等级 收起 理由
yukiooy + 1 + 1 + 1 好建议。
davil2000 + 1 + 1 + 1 好的意见建议

总评分: 学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

使用道具

playmore 发表于 2012-12-12 16:06:37 |显示全部楼层 |坛友微信交流群
Access打开大文件快吗?
这东西不是MS做的吗?
能比Excel快?
playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛

使用道具

弱弱地问一句,难到使用SAS/ACCESS模块不能够解决问题?

使用道具

complicated 在职认证  发表于 2012-12-12 16:14:46 |显示全部楼层 |坛友微信交流群
嘿嘿,多谢斑竹慷慨~
SAS/ACCESS不清楚,不过对于水平不高,模块不全,工具不多的我来说,这是目前最省心的办法了。
楼上,ACCESS确实能做到一些excel做不到的事情,excel会加载不全的,可能术业有专攻吧。
密码被盗??

使用道具

davil2000 发表于 2012-12-12 16:15:35 |显示全部楼层 |坛友微信交流群
学习了 感谢朋友们的经验分享
R是万能的,SAS是不可战胜的!

使用道具

complicated 在职认证  发表于 2012-12-12 16:42:53 |显示全部楼层 |坛友微信交流群
davil2000 发表于 2012-12-12 16:15
学习了 感谢朋友们的经验分享
论坛给我的帮助实在太多了,有机会当然要多多分享啦
密码被盗??

使用道具

webgu 发表于 2012-12-12 16:50:43 |显示全部楼层 |坛友微信交流群
SAS9.3在安装时,会让你选择语言地区及编码体系。中国地区会默认用utf-8 。
SAS资源
1. SAS 微信:StatsThinking
2. SAS QQ群:348941365

使用道具

complicated 在职认证  发表于 2013-2-19 10:49:57 |显示全部楼层 |坛友微信交流群
软件安装的时候还都是小白呢,没遇到也不懂很多东西,我想SAS的一些配置也应该能够在安装完成后更改,这才是好的用户体验吧
密码被盗??

使用道具

yukiooy 发表于 2013-2-19 11:06:27 |显示全部楼层 |坛友微信交流群
在 Excel 2010 和 2007 中,工作表的大小为 16,384 列 × 1,048,576 行
在 Excel 97-2003 中,工作表的大小为 256 列 × 65,536 行。

500M以上的CSV,不知道有多少行,多少列。如果行数超过一定的限制,用Excel打开,就是悲剧,打开不全。
如果数据超过2Gb,用Access好像也不行了。
如果你经常处理大数据,建议用数据库管理已经处理好的数据。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-19 01:44