该课程的网址为https://www.stat.auckland.ac.nz/~ihaka/120/Lectures/,我们称之为url。下面是该套教程的官网截图。
我们随便点开一个文件如lecture01.pdf,就可以发现它的下载地址其实就是在上述url的基础上添加字符lecture01.pdf。我们只需要构建出所有需下载文件的网址就能对其进行下载了。以下是相应的代码。大家可以尝试一下。理解起来也非常简单的。
##安装与加载爬取文件需要的包
install.packages("downloader")
install.packages("rvest")
library(rvest)
library(downloader)
##创建网址中不变的部分
url <- 'https://www.stat.auckland.ac.nz/~ihaka/120/Lectures/lecture'
##创建每个文件网址最后的一段字符
a<-paste(0,c(1:9),sep="")
b<-c(a,as.character(c(10:29)))
c<-paste(b,"-8up",sep="")
num<-c(b,c)
numb<-paste(num,".pdf",sep="")
##将两段字符通过paste函数拼接起来形成完整的下载链接
link<-paste(url,numb,sep="")
link
#采用for循环批量下载课件
for(i in 1:length(link))
{
download(link,paste("E:/R/",numb,sep = ""), mode = "wb")
}
这是下载完成后的样子和打开后的内容啦!


雷达卡








京公网安备 11010802022788号







