楼主: xdlz584
1387 2

[其它] 请问有没有大神指导一下R来抓取网络数据的过程 [推广有奖]

  • 0关注
  • 1粉丝

已卖:2份资源

本科生

26%

还不是VIP/贵宾

-

威望
0
论坛币
1686 个
通用积分
8.9338
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
204 点
帖子
12
精华
0
在线时间
151 小时
注册时间
2013-9-21
最后登录
2021-9-12

楼主
xdlz584 发表于 2014-3-7 08:05:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
          最近导师要我学习如何用R来抓取网络数据  但一直找不到相关的学习资料  有木有大神指导一下  谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:请问有没有 有没有 学习资料 如何用 有木有 网络 如何 资料

沙发
hyu9910 在职认证  发表于 2014-3-7 11:17:03
可能其他的软件更适合

藤椅
zhu334334334 发表于 2014-3-11 09:26:19
我舉一例做為說明,以下是r的code碼:
#抓取"http://www.google.com/adplanner/static/top1000/"的數據
library(XML)        #您要先裝XML的套件
google="http://www.google.com/"
path="adplanner/static/top1000/"
top1000s=paste(google,path,sep="")       #將html資料先用top1000s命名
table=readHTMLTable(top1000s)              #讀入r中,並以table命名
top1000=table[[2]]                                #將html資料的欄位資料取出,並命名為top1000
colnames(top1000)=c('rank','site','category','user','reach','view','advertising') #重新對top1000的欄位命名
head(top1000)                                       #查看top1000的前六筆資料

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-27 15:26