楼主: dream1095
12032 29

[程序分享] Python实现批量下载年报 [推广有奖]

11
chaozhang2333 发表于 2020-1-12 10:43:43 |只看作者 |坛友微信交流群
楼主想问一下,在巨潮里下载年报的话,sh的怎么修改爬虫呢?

使用道具

12
套龙的汉子 发表于 2020-2-11 13:04:00 |只看作者 |坛友微信交流群
楼主,请问你有遇到过下载下来的pdf,大小只有10kb,打开显示文件已损坏。鼠标点击网址确实是年报的href,但是用程序下载下来就失败

使用道具

13
套龙的汉子 发表于 2020-2-11 13:18:10 |只看作者 |坛友微信交流群
套龙的汉子 发表于 2020-2-11 13:04
楼主,请问你有遇到过下载下来的pdf,大小只有10kb,打开显示文件已损坏。鼠标点击网址确实是年报的href,但 ...
好的吧,参考楼主的代码,我是用selenium爬去的年报的href,但是这个href对应不出年报的真实网络连接,但是href中的年报id 和年报宣告日期是有用的,所以还需要一步提取这两个信息组成年报的链接,才可以下载成功。感谢

使用道具

14
儿童文 发表于 2020-4-13 18:40:09 |只看作者 |坛友微信交流群
感谢楼主,有沪市的代码么跪求一波

使用道具

15
儿童文 发表于 2020-4-15 21:36:03 |只看作者 |坛友微信交流群
想问问楼主半年报应该改哪些地方啊,跪求

使用道具

16
xuexuexd 发表于 2020-5-27 09:13:42 来自手机 |只看作者 |坛友微信交流群
dream1095 发表于 2019-8-30 19:09
最近对年报进行文本分析的文章不断增多,但是年报的获取或者批量下载是一件工作量很大的事情。于是写了一个 ...
赞<br>

使用道具

17
咕咕咕影 学生认证  发表于 2020-6-25 23:11:12 |只看作者 |坛友微信交流群
您好,想请问一下,如果需要的是年中季报应该修改那几个参数呢?
谢谢

使用道具

18
咕咕咕影 学生认证  发表于 2020-6-25 23:12:23 |只看作者 |坛友微信交流群
儿童文 发表于 2020-4-15 21:36
想问问楼主半年报应该改哪些地方啊,跪求
请问您问题解决了吗?我也正好有此困惑

使用道具

19
funnyjoke 发表于 2020-6-26 08:01:29 |只看作者 |坛友微信交流群
谢谢楼主,这个可以试试可不可以下载沪深股市的上市公司年报?

使用道具

20
ming_hua 发表于 2021-1-31 10:56:17 |只看作者 |坛友微信交流群
楼主,第一次使用Python,请问运行“data = pd.read_excel(r"C:\Users\MY\Desktop\数字化转型相关数据\制造业代码.xlsx",dtype = str)
data1 = data.copy()
data1 = data1.drop_duplicates(subset = ['Stkcd'])
data1.index = range(len(data1))”出现以下错误改怎么解决:
runfile('C:/Users/MY/Desktop/pathon/巨潮资讯下载年报1.py', wdir='C:/Users/MY/Desktop/pathon')
开始爬取第0个公司,一共3654家公司
公司代码为000008
找到公司信息了
Traceback (most recent call last):

  File "<ipython-input-1-feabfa26a41c>", line 1, in <module>
    runfile('C:/Users/MY/Desktop/pathon/巨潮资讯下载年报1.py', wdir='C:/Users/MY/Desktop/pathon')

  File "C:\Users\MY\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py", line 827, in runfile
    execfile(filename, namespace)

  File "C:\Users\MY\Anaconda3\lib\site-packages\spyder_kernels\customize\spydercustomize.py", line 110, in execfile
    exec(compile(f.read(), filename, 'exec'), namespace)

  File "C:/Users/MY/Desktop/pathon/巨潮资讯下载年报1.py", line 68, in <module>
    for i in range(len(response['announcements'])):

TypeError: object of type 'NoneType' has no len()





十分感谢楼主!!!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-24 08:34