楼主: daishen
10723 22

[实际应用] 网页抓取又添利器 [推广有奖]

11
wuchm 发表于 2014-11-30 15:18:06 |只看作者 |坛友微信交流群
为什么我用RStudio运行,出现下面的错误提示呢?
Error in function (type, msg, asError = TRUE)  : couldn't connect to host

使用道具

12
daishen 发表于 2014-11-30 16:00:10 |只看作者 |坛友微信交流群
我这里是正常的。

> movie = data.frame(电影 = names,时间 = time,得分 = score,评价人数 = rates,导演 = direct,主演 = actor)
> head(movie)
            电影 时间 得分 评价人数                               导演
1   肖申克的救赎 1994  9.6   576180     弗兰克·德拉邦特 Frank Darabont
2 这个杀手不太冷 1994  9.4   546210               吕克·贝松 Luc Besson
3       阿甘正传 1994  9.4   486869                    Robert Zemeckis
4       霸王别姬 1993  9.4   391181                  陈凯歌 Kaige Chen
5       美丽人生 1997  9.4   266813      罗伯托·贝尼尼 Roberto Benigni
6     海上钢琴师 1998  9.2   428010 朱塞佩·托纳多雷 Giuseppe Tornatore
                                         主演
1                蒂姆·罗宾斯 Tim Robbins /...
2       让·雷诺 Jean Reno / 娜塔丽·波特曼 ...
3 Tom Hanks / Robin Wright Penn / Gary Sinise
4 张国荣 Leslie Cheung / 张丰毅 Fengyi Zha...
5               罗伯托·贝尼尼 Roberto Beni...
6                    蒂姆·罗斯 Tim Roth / ...

使用道具

13
wuchm 发表于 2014-12-1 08:49:37 |只看作者 |坛友微信交流群
可以发个完整版的程序吗?最好是可直接拷贝的,我是初学者,谢谢!

使用道具

14
daishen 发表于 2014-12-1 10:13:09 |只看作者 |坛友微信交流群
那有什么完整版呀,你在上面代码直接复制到RStudio里面就行了,没有那么复杂。
如果还运行不出来,说明你的安装有问题。

使用道具

15
kaurala 学生认证  发表于 2014-12-1 23:09:53 |只看作者 |坛友微信交流群
马克,学习一下

使用道具

16
distiner 发表于 2014-12-2 13:53:26 |只看作者 |坛友微信交流群
rvest是不是不需要提供header之类的东西了?如何提交表单?

使用道具

17
tiantanshu 发表于 2014-12-2 22:13:04 |只看作者 |坛友微信交流群
感谢楼主分享了这么好的包

使用道具

18
ywh19860616 发表于 2014-12-5 15:07:25 |只看作者 |坛友微信交流群
[[1]]
<div id="RECORD_1" class="search-results-item">
<div class="search-results-checkbox">
<div class="search-results-checkbox-align">
<input value="1" name="marked_list_candidates" type="checkbox"/></div>
</div>
<div class="search-results-number">
<div class="search-results-number-align">1. <div id="ml_indicator_1">
</div>
<div id="enw_link_1">
</div>
</div>
</div><div class="search-results-content"><div>
<div>
<a class="smallV110" href="/full_record.do?product=WOS&search_mode=GeneralSearch&qid=1&SID=Y2MNQ3yTI747x3epKaV&page=1&doc=1">
<value lang_id="">Profitability determinants of Portuguese knowledge-intensive business services: empirical evidence using <span class="hitHilite">panel</span> <span class="hitHilite">data</span> models</value></a>
</div>
</div>
<div>
<span class="label">By: </span>Nunes, Paulo Macas; Serrasqueiro, Zelia</div>
<div>
<span style="display: none" url="http://apps.webofknowledge.com/FetchESIField.do?product=WOS&search_mode=CitedFullRecord&SID=Y2MNQ3yTI747x3epKaV&isickref=WOS:000344596300009&doc=1" id="fetch_wos_subject_Span_1"/><span style="display: none" name="show_journal_overlay_link_1" id="show_journal_overlay_link_1"><a href="javascript:;" hasautosubmit="false" title="View journal information">APPLIED ECONOMICS LETTERS</a></span><span style="display: none;" name="show_journal_overlay_1" id="show_journal_overlay_1">
<p class="sourceTitle">
<span class="sourceTitle_txt">
<source_title_txt_label><value>APPLIED ECONOMICS LETTERS</value></source_title_txt_label></span><span class="journal_overlay_close"><a title="Hide journal information" href="javascript:;"><img border="0" src="http://images.webofknowledge.com/WOKRS515B5/images/xicon.png"/></a></span>
</p>
<div class="overlayJCRblock">
<span id="ifactor_1"/><span id="category_1"/>
</div>
<p class="FR_field">
<span class="FR_label">Publisher </span><span>ROUTLEDGE JOURNALS, TAYLOR & FRANCIS LTD, 4 PARK SQUARE, MILTON PARK, ABINGDON OX14 4RN, OXFORDSHIRE, ENGLAND</span>
</p>
<p class="FR_field sameLine">
<span class="FR_label">ISSN: </span>
<value>1350-4851</value><br/><span class="FR_label">eISSN: </span>
<value>1466-4291</value></p>
<span id="subject_1"/>
<p class="closeWindow">
<a title="Hide journal information" href="javascript:;"><img border="0" src="http://images.webofknowledge.com/WOKRS515B5/images/closewin.gif"/></a>
</p>
</span><span name="source_title_1" id="source_title_1">APPLIED ECONOMICS LETTERS</span>  <span class="label">Volume: </span><span class="data_bold">22</span>   <span class="label">Issue: </span><span class="data_bold">1</span>   <span class="label">Pages: </span><span class="data_bold">51-56</span>   <span class="label">Published: </span><span class="data_bold">JAN 2 2015</span>
</div>
<div style="display: inline-block" id="links_1">
<nobr><span id="links_openurl_1"/> <span id="links_full_text_1"/> <span id="links_doc_del_1"/> <span id="links_patent_1"/> </nobr></div>
<div class="search-action-item">
<span id="solo_full_text_1" class="solo_full_text"/><a name="full_text_1" id="full_text_1" title="Full Text" class="button2link button-ft" href="javascript:;"><span id="full_text_1" name="full_text_1" title="Full Text" class="button2 button-ft">Full Text</span></a>
<div class="popup-full-text" id="full_text_1_menu">
<span id="full_text_1_links"/>
</div>
</div>
<script type="text/javascript"><![CDATA[$("#full_text_1").hide();]]></script><span style="display: inline-block" class="button-abstract" id="ViewAbstract1_text"><a title="View Abstract" alt="View Abstract" href="javascript:;" class="button9"><img align="absmiddle" title="View Abstract" alt="View Abstract" src="http://images.webofknowledge.com/WOKRS515B5/images/spacer.gif" id="ViewAbstract1_img"/>View Abstract<nobr/></a></span><span style="display: none" class="button-abstract" id="HideAbstract1_text"><a title="Close Abstract" alt="Close Abstract" href="javascript:;" class="button9"><img align="absmiddle" title="Close Abstract" alt="Close Abstract" src="http://images.webofknowledge.com/WOKRS515B5/images/spacer.gif" id="HideAbstract1_img"/>Close Abstract<nobr/></a></span><span style="display: none" url="http://apps.webofknowledge.com/ViewAbstract.do?product=WOS&search_mode=GeneralSearch&viewType=ViewAbstract&qid=1&SID=Y2MNQ3yTI747x3epKaV&page=1&doc=1" id="ViewAbstract_Span1">
<!----></span></div><div class="search-results-data">
<div class="search-results-data-cite">Times Cited: 0<br/><span class="en_data_bold"> (from Web of Science Core Collection)</span>
</div>
</div>
</div>


您好,请问这里如何提取作者信息,非常感谢您
就是这个by:之后的
<span class="label">By: </span>Nunes, Paulo Macas; Serrasqueiro, Zelia</div>

使用道具

19
daishen 发表于 2014-12-5 15:16:21 |只看作者 |坛友微信交流群
要想省事,在火狐浏览器里面使用 selectorgadget,需要下载什么就把鼠标移到那个地方,看看是什么节点,复杂一些要自己查看源码。
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
ywh19860616 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

20
ywh19860616 发表于 2014-12-5 15:55:32 |只看作者 |坛友微信交流群
daishen 发表于 2014-12-5 15:16
要想省事,在火狐浏览器里面使用 selectorgadget,需要下载什么就把鼠标移到那个地方,看看是什么节点,复杂 ...
谢谢您,前辈
我也看过这个啦,没有做出来,那我再看看。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-21 17:42