楼主: dream1095
7082 28

下载深交所年报python [推广有奖]

  • 0关注
  • 23粉丝

博士生

81%

还不是VIP/贵宾

-

威望
0
论坛币
5516 个
通用积分
91.8915
学术水平
7 点
热心指数
2 点
信用等级
2 点
经验
1470 点
帖子
37
精华
0
在线时间
646 小时
注册时间
2019-8-28
最后登录
2024-2-22

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
写过两篇帖子,关于如何从巨潮资讯网以及上交所下载年报:
https://bbs.pinggu.org/thread-7320099-1-1.html
https://bbs.pinggu.org/thread-7292296-1-1.html
本来想把深交所爬取同样放在上一篇帖子中,但是发现深交所采用的是post请求中的payload方式
在写的时候没反应过来,琢磨了一下才弄懂代码该怎么写。
也就是需要用到payload为参数进行访问。
比如
`{"seDate":["",""],"channelCode":["fixed_disc"],"bigCategoryId":["010301"],"pageSize":30,"pageNum":2}`

## 代码的基本思路
1. 获取深交所所有上市公司PDF的地址
2. 通过访问PDF地址进行下载


代码如下:
爬取深交所.txt (3.52 KB, 需要: 10 个论坛币) (代码有误)
在使用中发下代码编写有误,故重现附上更正后的代码:
批量下载深交所年报(更正).txt (3.44 KB, 需要: 10 个论坛币) (代码有误)
感谢南风拂面 的意见,(实在抱歉)因为网站访问到第500页后无法显示,爬取报错,只能以三年为单位,分多次下载。代码如下:
分年度下载.txt (4.05 KB, 需要: 10 个论坛币)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:python 爬虫 年报

已有 2 人评分经验 收起 理由
np84 + 100 精彩帖子
cheetahfly + 100 观点有启发

总评分: 经验 + 200   查看全部评分

沙发
dream1095 学生认证  发表于 2019-9-23 10:03:51 |只看作者 |坛友微信交流群
请用论坛币购买过的此代码的朋友私信邮箱,会将更正后的代码发到邮箱

使用道具

藤椅
南风拂面 发表于 2019-11-14 19:18:39 |只看作者 |坛友微信交流群
您好,在使用您的深交所年报代码时出现如下错误
  1. 爬取深交所年报下载地址第501页
  2. Traceback (most recent call last):

  3.   File "C:/Users/nanfeng/Documents/深交所年报.py", line 41, in <module>
  4.     num = len(result['data'])

  5. KeyError: 'data'
复制代码

向您求教,恳请指导一二

使用道具

板凳
dream1095 学生认证  发表于 2019-11-14 19:45:15 |只看作者 |坛友微信交流群
南风拂面 发表于 2019-11-14 19:18
您好,在使用您的深交所年报代码时出现如下错误

向您求教,恳请指导一二
你好,我再次检查了一下代码,实在抱歉,当时写代码没有发现这个失误,因为网站超过500后访问就无法访问了,最多显示500页内容,所以现在新写了一份代码(以三年为一个时间段进行下载)。实在抱歉,麻烦留下邮箱。

使用道具

报纸
南风拂面 发表于 2019-11-14 20:09:21 |只看作者 |坛友微信交流群
dream1095 发表于 2019-11-14 19:45
你好,我再次检查了一下代码,实在抱歉,当时写代码没有发现这个失误,因为网站超过500后访问就无法访问了 ...
麻烦您了 打扰了您好几次 1243439689@qq.com
非常感谢

使用道具

地板
xiang8482890 在职认证  发表于 2019-11-15 06:17:31 |只看作者 |坛友微信交流群
408796054@qq.com  谢谢!

使用道具

7
dream1095 学生认证  发表于 2019-11-20 12:40:28 |只看作者 |坛友微信交流群
xiang8482890 发表于 2019-11-15 06:17
408796054@qq.com  谢谢!
你好,这边没看到这个ID的购买记录,是用其他账号购买的吗?麻烦说下一下ID

使用道具

8
qhdxcjxy 发表于 2019-12-22 14:11:58 |只看作者 |坛友微信交流群
2544532289@qq.com谢谢

使用道具

9
hifinecon 发表于 2019-12-23 13:24:06 |只看作者 |坛友微信交流群

使用道具

10
baluoyan9 发表于 2020-1-5 22:31:06 |只看作者 |坛友微信交流群
楼主,我在用分年度爬取深交所年报的时候出现出现了这种情况:requests.exceptions.ConnectionError: ('Connection aborted.', ConnectionResetError(10054, '远程主机强迫关闭了一个现有的连接。', None, 10054, None)),请问有什么解决办法吗?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 10:01