楼主: 786317806
1963 11

[找数据和资料] 300论坛币求帮写段代码从网页上抓取数据导出到excel表 [推广有奖]

  • 0关注
  • 29粉丝

已卖:3123份资源

讲师

48%

还不是VIP/贵宾

-

威望
0
论坛币
20305 个
通用积分
31.8744
学术水平
0 点
热心指数
5 点
信用等级
0 点
经验
10041 点
帖子
271
精华
0
在线时间
332 小时
注册时间
2012-12-4
最后登录
2025-12-23

楼主
786317806 在职认证  发表于 2020-10-17 11:30:14 |AI写论文
300论坛币
想用python从中国食药监局网站上导出5项公示信息,每项公示信息都导出其截止目前所有的公示记录,并存放在一个excel文件,最终是形成5个excel文件。
网址:
http://app1.nmpa.gov.cn/data_nmpa/face3/dir.html?type=hzp&CbSlDlH0=qArdqArzpkMcusp8PW9rUaXD68SDmlmeyKJ9sg3O4fEqqxL
中的:(1)国产特殊用途化妆品、(2)进口化妆品、        (3)化妆品生产许可获证企业、(4)国产非特殊用途化妆品备案信息        (5)进口非特殊用途化妆品备案信息        
7.png

交付结果(5个独立的代码文件):


代码文件1:国产特殊用途化妆品,能实现导出该公示项下的所有公示记录的详细内容到一个excel文件(例如命名为《国产特殊用途化妆品+操作日期》),excel中的每条记录都需要包括该网站上能查询到的该记录的详细内容,举例如下(把每条公示信息的下列所有内容作为一行):
1.png

代码文件2:进口化妆品,能实现导出该公示项下的所有公示记录的详细内容到一个excel文件(例如命名为《进口化妆品+操作日期》),excel中的每条记录都需要包括该网站上能查询到的该记录的详细内容,举例如下(把每条公示信息的下列所有内容作为一行):
2.png

代码文件3:化妆品生产许可获证企业,能实现导出该公示项下的所有公示记录的详细内容到一个excel文件(例如命名为《化妆品生产许可获证企业+操作日期》),excel中的每条记录都需要包括该网站上能查询到的该记录的详细内容,举例如下(把每条公示信息的下列所有内容作为一行):
3.png

代码文件4:国产非特殊用途化妆品备案信息,能实现导出该公示项下的所有公示记录的详细内容到一个excel文件(例如命名为《国产非特殊用途化妆品备案信息+操作日期》),excel中的每条记录都需要包括该网站上能查询到的该记录的详细内容,举例如下(把每条公示信息的下列所有内容作为一行):
4.png

代码文件5:进口非特殊用途化妆品备案信息,能实现导出该公示项下的所有公示记录的详细内容到一个excel文件(例如命名为《进口非特殊用途化妆品备案信息+操作日期》),excel中的每条记录都需要包括该网站上能查询到的该记录的详细内容,举例如下(把每条公示信息的下列所有内容作为一行):
5.png


6.png (64.32 KB)

6.png

关键词:100论坛币 Excel表 EXCEL xcel 抓取数据

沙发
786317806 在职认证  发表于 2020-10-17 20:47:48
急求大神指导

藤椅
Veniamor 发表于 2020-10-20 11:31:35
偏题问一句,这个是非要代码不可吗,复制难道不更方便[titter]

板凳
ihateu 发表于 2020-10-20 23:30:41
赞楼上,哈,又不是实时更新的东西,搞个爬虫太麻烦了吧?

报纸
ihateu 发表于 2020-10-20 23:31:51
不是常更新的数据,实在用不到爬虫

地板
786317806 在职认证  发表于 2020-10-20 23:57:24
Veniamor 发表于 2020-10-20 11:31
偏题问一句,这个是非要代码不可吗,复制难道不更方便
这个我最初也有想过的,但一是网页上公示内容太多,且实时在更新,多的有好几百页几万条信息,纯手工复制怕是要断手,二是最近也在学习python,但还不会自己解决这么复杂的问题,所以也想借这个机会想高手们学习一下

7
786317806 在职认证  发表于 2020-10-21 23:45:42
ihateu 发表于 2020-10-20 23:31
不是常更新的数据,实在用不到爬虫
虽然数据更新频率没有那么高,但光其中一项就有21万条数据,纯手工逐个点开来复制粘贴怕是要粘贴个把月

8
a184155211 发表于 2020-10-24 10:22:06
有人接这个项目了没?

9
32433 发表于 2020-10-24 10:34:32
这种翻页爬取,可以用VBA实现,但是爬取的过程中时间比较长,代码已测试,可以运行。

10
786317806 在职认证  发表于 2020-10-24 13:54:52
a184155211 发表于 2020-10-24 10:22
有人接这个项目了没?
还没有诶,你可以帮忙实现吗

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-11 16:51