网页部分源码如下:
<div class="hd">
<a href="https://movie.douban.com/subject/1292052/" class="">
<span class="title">肖申克的救赎</span>
<span class="title"> / The Shawshank Redemption</span>
<span class="other"> / 月黑高飞(港) / 刺激1995(台)</span>
</a>
1.只爬取第一个title里的影片中文名怎么做?
我的代码如下,只能把两个title的数据都爬出来。。。
web_movie%>%
html_nodes("div.hd")%>%
html_nodes("a")%>%
html_nodes("span.title")%>%
html_text("span.title")
2.把两个title里的中英文名都爬出来,但是想要中文名一列,英文名一列,怎么做?
谢谢各位大神!


雷达卡




京公网安备 11010802022788号







