楼主: 不朽之守护
2968 2

[问答] 求助,在用rvest包中如何保存class类为xml_nodeset 的文件? [推广有奖]

  • 0关注
  • 0粉丝

小学生

92%

还不是VIP/贵宾

-

威望
0
论坛币
19 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
49 点
帖子
5
精华
0
在线时间
12 小时
注册时间
2016-11-9
最后登录
2018-6-21

楼主
不朽之守护 发表于 2018-4-3 16:33:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人在做网络数据抓取过程中,用的是rvest包(因为利用getURL()汉字乱码)。
下附为题所在。
>html0403<-list()
>for (i in 1:100) {
     urlab0403<-str_c(url0403,new0403$V1[1]) #获取真实地址,循环从1到100下载对应的网页
     html0403[]<-read_html(urlab0403)
     Sys.sleep(10)
     setTxtProgressBar(progress_bar,i)
}

|=========================================================================================| 100%

>x<-html_nodes(html0403[[1]],".detail_main_right_conbg_con script") #选区节点 因为数据在 script 下
{xml_nodeset (4)}
[1] <script>origTime("3月26日17时51分新不列颠地区发生6.6级地震","2018-03-26 18:30:51");\n</script>
[2] <script>subStringLocationLatitude("-5.42");</script>
[3] <script>subStringLocationLongitude("151.31");</script>
[4] <script>shengdu("40.0");</script>

> class(x)
[1] "xml_nodeset"
> typeof(x)
[1] "list"

> as.data.frame(x[1])
Error in as.data.frame.default(x[1]) :
  不能把""xml_nodeset""类别强迫变成数据框




如何保存?请求大神不吝赐教。





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Nodes Vest ODEs Node XML

沙发
不朽之守护 发表于 2018-4-3 17:03:36
准备用另外一种方法,先用download_html()先下载下来再说!

藤椅
Elizabeth_Kohl 发表于 2019-5-19 21:37:59
x%>%html_text()

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 21:25