楼主: 何武德
1923 4

[问答] 如何用R抓取一个网页中在div中的数据且不乱码 [推广有奖]

  • 0关注
  • 0粉丝

小学生

28%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
49 点
帖子
5
精华
0
在线时间
3 小时
注册时间
2015-10-20
最后登录
2016-4-29

楼主
何武德 发表于 2016-4-21 12:16:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
3.png 2.png
想要抓取 http://www.demohour.com/projects?attribute=most_funded  中的数据并制成表格保存成csv输出,但是怎么抓取网页中在div中的数据,想要抓取的内容在图片中浅蓝色背景的区域,代码错在哪里??可以怎么改??

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:div 如何用 attribute Projects tribute 如何 网页

1.png (3.79 KB)

1.png

1.png (3.79 KB)

1.png

1.png (3.79 KB)

1.png

沙发
jiangbeilu 学生认证  发表于 2016-4-21 16:37:51
看不到浅蓝色

藤椅
langdao1688 发表于 2016-4-21 23:06:22 来自手机
跟楼主遇到过一样的情况

板凳
何武德 发表于 2016-4-22 10:02:40
jiangbeilu 发表于 2016-4-21 16:37
看不到浅蓝色
在<div id="project_list" class="c8">里

报纸
何武德 发表于 2016-4-22 10:10:53
langdao1688 发表于 2016-4-21 23:06
跟楼主遇到过一样的情况
那后来是怎么解决的呢?昨天试了一下,用dat = url %>% read_html() %>% html_nodes('dd') %>% html_text 可以取到乱码的数据,dd是那个div下的一个节点,在一些有table标签的网页用XML包中的readHTMLTable抓到正常的数据,不知道怎样用XML包抓取网页中非表格的数据,知道哪里可以查找XML包中的方法使用的例子吗?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 13:03