楼主: 08liurenxing
2110 3

[问答] 请教,Error in toupper(stormdata$EVTYPE) : invalid multibyte string 56613 [推广有奖]

  • 0关注
  • 2粉丝

讲师

16%

还不是VIP/贵宾

-

威望
0
论坛币
4932 个
通用积分
6.5679
学术水平
8 点
热心指数
11 点
信用等级
5 点
经验
7746 点
帖子
426
精华
0
在线时间
153 小时
注册时间
2009-11-9
最后登录
2023-12-9

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
> stormdata$FATALITIES <- as.numeric(stormdata$FATALITIES)
Warning message:
NAs introduced by coercion
> stormdata$INJURIES <- as.numeric(stormdata$INJURIES)
Warning message:
NAs introduced by coercion
> stormdata$EVTYPE <- toupper(stormdata$EVTYPE)
Error in toupper(stormdata$EVTYPE) : invalid multibyte string 566138
> eventtype <- sort(unique(stormdata$EVTYPE))
> stormdata$EVTYPE <- toupper(stormdata$EVTYPE)
Error in toupper(stormdata$EVTYPE) : invalid multibyte string 566138

请教出现这个错误是咋整啊,感谢!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:invalid string Storm tring Valid message invalid Error

回帖推荐

hongweigg 发表于3楼  查看完整内容

应为向量中字符串存在多字节字符,在使用toupper()大写转换函数时报错。 1、一个简单的处理方法是,先将待处理数据转换为utf-8编码,再使用toupper()函数,完了再转换回来: >a2b
沙发
08liurenxing 发表于 2015-10-25 21:44:56 |只看作者 |坛友微信交流群
自己先顶起,R语言,费力气啊!

使用道具

藤椅
hongweigg 发表于 2015-10-26 14:50:05 |只看作者 |坛友微信交流群
应为向量中字符串存在多字节字符,在使用toupper()大写转换函数时报错。
1、一个简单的处理方法是,先将待处理数据转换为utf-8编码,再使用toupper()函数,完了再转换回来:
>a2<-iconv(toupper(iconv(a,"iso8859-1","utf-8")),"utf-8","iso8859-1")
这里a为输入数据,a2为输出数据。

2、若这些字符无意义,可剔除这些多字节字符
>b<-function(p){gsub("\\\\x\\d{2}",'',gsub("\\\"","",deparse(p))}
> a2<-unlist(lapply(a,FUN=b))
b函数为剔除字符串中的多字节字符;
unlist(lapply(a,FUN=b)) 为应用b函数到要处理的向量,因为结果是列表,完了转换为向量。

3、在读入数据时使用正确的编码。
参考:http://stackoverflow.com/questions/4993837/r-invalid-multibyte-string
已有 1 人评分论坛币 收起 理由
admin_kefu + 25 热心帮助其他会员

总评分: 论坛币 + 25   查看全部评分

使用道具

板凳
08liurenxing 发表于 2015-10-26 16:30:47 |只看作者 |坛友微信交流群
hongweigg 发表于 2015-10-26 14:50
应为向量中字符串存在多字节字符,在使用toupper()大写转换函数时报错。
1、一个简单的处理方法是,先将待 ...
感谢指点!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 09:35