我用R里面的TwitterR package下载了几天的Tweets。但是根据每个Tweet的内容,我要分类出来Tweets(用户自己发的),Replies(用户回复别人的)以及Retweets(用户转发别人的).
大家晓得每类的特征吗?正常来说,Replies是应该以@开头; Retweets应该以RT开头;一般的Tweet就是以 数字或者字符开头,不应该含有@和RT。这样对吗?或者你那里有现成的针对每种tweet的常规表达式吗?
谢谢大家指教啦。
|
楼主: imzbxt
|
1984
2
[问题] Twitter数据分类 |
|
本科生 38%
-
|
| ||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


