楼主: dream1095
8939 14

python爬取专利网站数据 [推广有奖]

  • 0关注
  • 23粉丝

已卖:752份资源

博士生

81%

还不是VIP/贵宾

-

威望
0
论坛币
5563 个
通用积分
91.9515
学术水平
7 点
热心指数
2 点
信用等级
2 点
经验
1470 点
帖子
37
精华
0
在线时间
652 小时
注册时间
2019-8-28
最后登录
2025-12-25

楼主
dream1095 学生认证  发表于 2019-9-5 21:17:27 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
关于企业创新的研究基本离不开专利数据,数据来源http://pss-system.cnipa.gov.cn/sipopublicsearch/portal/uiIndex.shtml。但是根据公司名称一个一个单独查询数据工作量较大,于是写出了python程序进行爬取。
爬取的位置是检索后,公开日的专利数量,也就是专利的年度数据。如下图所示:
1567689059(1).jpg

爬取后的结果如下:
1567689235(1).png
因为不能上传py格式文件,于是上传txt文件,可将后缀名改为py格式:
爬取国家年度发布专利量.txt (7.97 KB, 需要: RMB 19 元)


补充内容 (2020-1-31 09:03):
目前时间2020-1-31, 专利网站结构好像进行了修改,原有代码可能只能起到一个参考作用,慎拍
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python 爬虫 专利 年度数据

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
weizhen05 + 1 + 1 + 1 奖励积极上传好的资料

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

沙发
41251314hh(未真实交易用户) 在职认证  发表于 2019-9-9 17:04:14
看看,数据与公布数据是否相差不大?

藤椅
dream1095(未真实交易用户) 学生认证  发表于 2019-9-10 21:15:53
41251314hh 发表于 2019-9-9 17:04
看看,数据与公布数据是否相差不大?
您好,这边没有相关的数据才想着从网站上爬取相关的专利数据

板凳
lonestone(未真实交易用户) 在职认证  发表于 2019-9-15 05:59:05 来自手机
dream1095 发表于 2019-9-5 21:17
关于企业创新的研究基本离不开专利数据,数据来源http://pss-system.cnipa.gov.cn/sipopublicsearch/portal ...
谢谢楼主的分享

报纸
zhuzhuzhuzhu123(未真实交易用户) 发表于 2019-9-24 18:51:51 来自手机
谢谢楼主的分享

地板
hey_na2009(未真实交易用户) 发表于 2019-10-8 12:18:28
你好,请问这份数据是包含哪些年份、哪些企业的

7
dream1095(未真实交易用户) 学生认证  发表于 2019-10-8 18:55:35
hey_na2009 发表于 2019-10-8 12:18
你好,请问这份数据是包含哪些年份、哪些企业的
你好,这个是需要python爬虫代码,根据你的需要输入企业的名称,然后爬去专利网站上分年度的数据。所以具体的结果取决于网站上的数据区间

8
jatise(未真实交易用户) 发表于 2019-10-10 18:48:34
大佬我也是经管的,现在正在学习爬虫,小白有点迷,能把你的爬虫代码,分享下吗,非常感谢!

9
dream1095(未真实交易用户) 学生认证  发表于 2019-10-10 19:36:01
jatise 发表于 2019-10-10 18:48
大佬我也是经管的,现在正在学习爬虫,小白有点迷,能把你的爬虫代码,分享下吗,非常感谢!
你好,帖子下附上的就是爬虫代码,只是上传不了py格式,就上传了文本格式(txt)。

10
peyzf(未真实交易用户) 发表于 2019-10-10 22:49:09
了解一下

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-31 05:58