楼主: 6417
2193 3

[问答] 用R或者rapidminer怎么抓取下面网页的数据? [推广有奖]

  • 0关注
  • 0粉丝

高中生

67%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
446 点
帖子
8
精华
0
在线时间
46 小时
注册时间
2013-3-19
最后登录
2020-5-18

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
下面是国家专利汇编的网站,哪位能指点下怎么才能把网站的数据爬取下来放到excel表格里?最好是用R或者rapidminer来做,急急急。。。。。。哪位大神帮帮我,谢谢啦。

https://patentscope.wipo.int/search/zh/result.jsf?currentNavigationRow=1&prevCurrentNavigationRow=2&query=&office=&sortOption=%E5%85%AC%E5%B8%83%E6%97%A5%E9%99%8D%E5%BA%8F&prevFilter=&maxRec=48599234&viewOption=All

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:RapidMiner Rapid Miner DMINE MINE 网页

沙发
icyjunjin 发表于 2015-10-9 09:33:52 |只看作者 |坛友微信交流群
不知道到啊

使用道具

藤椅
Mujahida 在职认证  发表于 2020-2-10 19:46:22 |只看作者 |坛友微信交流群
https://bbs.pinggu.org/thread-7775772-1-1.html

使用道具

板凳
sanjie27 发表于 2020-2-11 13:58:08 |只看作者 |坛友微信交流群
可以用rvest包来做,就几个函数,另外稍微熟悉一点html和css就可以
下面的代码是获取类似"WO/2020/025997"(不知道这个叫什么)
library(rvest)
url <- "https://patentscope2.wipo.int/search/zh/result.jsf?currentNavigationRow=1&prevCurrentNavigationRow=2&query=&office=&sortOption=%E5%85%AC%E5%B8%83%E6%97%A5%E9%99%8D%E5%BA%8F&prevFilter=&maxRec=48599234&viewOption=All"
read_html(url)%>%
  html_nodes(".notranslate.ps-patent-result--title--patent-number")%>%
  html_text()
批注 2020-02-11 135654.png

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 04:33