楼主: 海的方向
19920 24

[学习分享] 问题:能只用R语言进行网络爬虫的相关工作吗? [推广有奖]

  • 3关注
  • 2粉丝

海儿

副教授

28%

还不是VIP/贵宾

-

威望
0
论坛币
1454 个
通用积分
12.9166
学术水平
21 点
热心指数
24 点
信用等级
20 点
经验
12421 点
帖子
706
精华
0
在线时间
731 小时
注册时间
2005-10-27
最后登录
2024-9-20

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
真心喜欢R语言,最近要搞文本挖掘,R语言上手也算快,但是如果想做web挖掘,需要网络爬虫在网上爬一些东西,谁知道该怎么办?
难道我要学习一下python或者java ruby?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:网络爬虫 R语言 python web挖掘 文本挖掘 网络

投我以木瓜,报之以琼琚,匪报也,永以为好也.天之道,以有余而补不足。
沙发
ozero210 发表于 2014-3-27 10:37:26 |只看作者 |坛友微信交流群
坐等楼主解决。。

使用道具

藤椅
yuanhangzhe 发表于 2014-7-28 10:24:53 |只看作者 |坛友微信交流群
同行呀

使用道具

板凳
srfdksg 发表于 2014-10-10 09:39:44 |只看作者 |坛友微信交流群
楼主有答案了吗?

使用道具

报纸
cduwanglping 在职认证  发表于 2014-10-12 16:40:45 |只看作者 |坛友微信交流群
如果不想学编程,用火狐插件爬取文本数据吧,http://www.gooseeker.com/cn/node/document/metaseeker/cookbookv4/bookfront.html,这是教程地址

使用道具

Rcurl package
已有 1 人评分经验 收起 理由
李会超 + 36 热心帮助其他会员

总评分: 经验 + 36   查看全部评分

使用道具

7
xucaifeng66 发表于 2014-11-6 09:54:13 |只看作者 |坛友微信交流群
是抓取文本吗????

用grep等相关的函数

使用道具

8
xucaifeng66 发表于 2014-11-6 09:56:09 |只看作者 |坛友微信交流群
需要RCurl和XML包
已有 1 人评分经验 收起 理由
李会超 + 20 精彩帖子

总评分: 经验 + 20   查看全部评分

使用道具

9
马甲1号 发表于 2014-11-6 17:10:51 |只看作者 |坛友微信交流群
比起python, R缺少类似于scrapy这类爬虫框架, 而且处理中文网页时各种编码问题很烦. R简单的数据可以抓抓, 不过如果任务比较复杂(比如全站抓取), 可能用python更适合吧.
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
蒙奇.D + 2 + 2 + 2 + 2 精彩帖子
李会超 + 48 + 12 + 2 每种软件确实都有自己的优势和软肋

总评分: 经验 + 48  论坛币 + 14  学术水平 + 4  热心指数 + 2  信用等级 + 2   查看全部评分

使用道具

马甲1号 发表于 2014-11-6 17:10
比起python, R缺少类似于scrapy这类爬虫框架, 而且处理中文网页时各种编码问题很烦. R简单的数据可以抓抓,  ...
我有一些python基础 学习python scrapy难吗
使用python scrapy 抓取中文网页有教程么
因为我主要抓中文网页

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-5 14:39