楼主: nieqiang110
578 3

[问答] 数据处理代码请教 [推广有奖]

已卖:5520份资源

学术权威

60%

还不是VIP/贵宾

-

威望
0
论坛币
96679 个
通用积分
808.7710
学术水平
293 点
热心指数
351 点
信用等级
207 点
经验
11300 点
帖子
4801
精华
0
在线时间
5994 小时
注册时间
2007-7-26
最后登录
2025-12-26

楼主
nieqiang110 学生认证  发表于 2023-3-5 12:37:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位老师:
请教大家汉语字符串的分割问题。
我有data=data.frame(Id=1:2,Location=c("山东省.聊城市.东阿县","北京市.北京市.朝阳区")),
试图将Location变量分割为省、市、县共3个变量。我用tidyr::separate函数,结果只能分割英语字符。
请老师指正。
谢谢。
尘埃落定
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据处理代码 数据处理 Location separate cation

回帖推荐

llb_321 发表于2楼  查看完整内容

可能是汉字字符串中那个点的编码问题,试试:

沙发
llb_321 在职认证  发表于 2023-3-5 18:57:39
可能是汉字字符串中那个点的编码问题,试试:
  1. data <- data.frame(Id = 1:2,
  2.                    Location = c("山东省.聊城市.东阿县", "北京市.北京市.朝阳区"))
  3. new <- separate(data,
  4.                 Location,
  5.                 into = c("省", "市", "区/县"),
  6.                 sep = "[[:punct:]]")
复制代码
已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
cheetahfly + 10 热心帮助其他会员
Sunknownay + 3 + 3 + 3 热心帮助其他会员
nieqiang110 + 5 + 5 + 5 + 5 精彩帖子

总评分: 论坛币 + 15  学术水平 + 8  热心指数 + 8  信用等级 + 8   查看全部评分

藤椅
nieqiang110 学生认证  发表于 2023-3-5 19:10:11
llb_321 发表于 2023-3-5 18:57
可能是汉字字符串中那个点的编码问题,试试:
由衷感谢lib_321老师的热心指导,不知道该怎么感谢您

板凳
llb_321 在职认证  发表于 2023-3-5 19:29:40
只是碰巧解开了,真的没什么。湖海论交,无需介怀。祝安

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-2 10:05