楼主: cheetahfly
1026 1

[实际应用] 关于中文编码问题的一个经验分享/疑难解决 [推广有奖]

  • 2关注
  • 72粉丝

版主

已卖:1份资源

院士

11%

还不是VIP/贵宾

-

威望
0
论坛币
63967 个
通用积分
1679.3337
学术水平
489 点
热心指数
598 点
信用等级
336 点
经验
127404 点
帖子
2099
精华
1
在线时间
3984 小时
注册时间
2010-10-27
最后登录
2026-1-1

楼主
cheetahfly 在职认证  发表于 2023-1-9 21:37:39 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在利用R语言进行数据处理和分析过程中,会经常出现不可预知的乱码问题,尤其是SQL系列数据进行数读取时。
在此分享一个经验:可以尝试用“GB2312”编码来解决,举个例子:
  1. string <- "\xc9\xa2\xbb\xa7"
  2. (readr::parse_character(string, locale = readr::locale(encoding = "GB2312")))

  3. ## [1] "散户"
复制代码

用“UTF8”的时候:
  1. string <- "\xc9\xa2\xbb\xa7"
  2. (readr::parse_character(string, locale = readr::locale(encoding = "UTF-8")))

  3. ## [1] "ɢ\xbb\xa7"
复制代码


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:经验分享 经验分 string tring RING

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 鼓励积极发帖讨论

总评分: 学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

沙发
黑丝刘盼 发表于 2024-10-9 14:11:47

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 15:48