楼主: jay_lzp
1858 2

[有偿编程] R语言分析QQ聊天记录 [推广有奖]

  • 0关注
  • 0粉丝

高中生

75%

还不是VIP/贵宾

-

威望
0
论坛币
262 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
54 点
帖子
0
精华
0
在线时间
72 小时
注册时间
2013-11-10
最后登录
2020-6-24

1论坛币
现在我有一些QQ聊天记录,是txt格式的,我想对该聊天记录进行统计分析。但是数据是非标准化的,我想用R语言让其标准化,再进行分析。

关键词:聊天记录 QQ聊天 R语言 txt格式 非标准化 QQ聊天 记录
沙发
蔡梦园 发表于 2019-1-1 19:01:20 |只看作者 |坛友微信交流群
正则化


time <- c();use <- c();msg <- c();

for(i in 1:length(mantou)){   

regmantou <- regexpr("[0-9]{4}-[0-9]{2}-[0-9]{2} [0-9]+:[0-9]+:[0-9]+",mantou[i])   

      if(regmantou[1]==1){      

          time[i] <- substr(mantou[i],1,19)      

          use[i] <- substr(mantou[i],21,nchar(mantou[i]))   

     }else{         

          msg[i] <- mantou[i]   

     }

}

使用道具

帮你顶一下帖子

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-4 05:46