楼主: tegulia
10340 4

[问答] R中的中文处理问题~~~~~~~~~~~~~~~~~~~~~~~~~~~~ [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

40%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
20 点
帖子
1
精华
0
在线时间
0 小时
注册时间
2015-1-12
最后登录
2015-1-12

楼主
tegulia 发表于 2015-1-12 15:57:50 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

算法包,比如C50算法包在处理中文数据的时候,会报错。


我将原来的数据转换为utf8,确认在Rstudio中已经是正常的显示中文了,但仍然会报错。


数据样本:

数据样本

函数使用:

C5.0.default(x = proble[, c(1:3)], y = proble[, 4])


Classification Tree

Number of samples: 500

Number of predictors: 3


Tree size: 0


Non-standard options: attempt to group attributes

报错信息:


警告信息:

1: In strsplit(Z$output, "\n") : 输入的字符串1不适用于此语言环境

2: In strsplit(x$output, "\n") : 输入的字符串1不适用于此语言环境


ps:后来我用了stringi包,转换为\u5317等类型的字符,然后再需要输出显示的时候,再转换回来,这种方式很不方便,因为stringi里面,似乎不能直接转换文本。请问,有没有什么更好的办法解决这个问题呢?相信这个问题也是很多R工作者关心的问题。

十分感谢!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:中文处理 Attributes Predictors predictor attribute 工作者 字符串 中文 信息 样本

沙发
ryoeng 在职认证  发表于 2015-1-18 16:04:09
提示: 作者被禁止或删除 内容自动屏蔽

藤椅
萨克的减肥药 发表于 2015-8-22 16:19:29
不知版主的问题解决了没有?
我总是出现Tree Size:0 的问题,楼主的方法能否说一下?麻烦的方法也好啊

板凳
sinceregao 发表于 2016-1-20 21:32:10
> Sys.setlocale(category = "LC_ALL", locale = "English_United States.1252")
就好了!

报纸
shinny 发表于 2016-6-4 11:32:20
https://stackoverflow.com/questions/22803310/c5-0-decision-tree-c50-code-called-exit-with-value-1?rq=1

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 12:09