你好,你的代码爬取上交所的上市公司年报可以,但深交所的貌似不行。此外,上交所的年报爬取会有一个问题,就是有一些公司会发布更新或修订版的年报,而这个年报的时间往往就是超过了4月30日,可能大部分都在6月份,所以那个时间可能要延后一些。我稍微修改了一点点上交所年报爬取的代码(stata5.0):
clear
set more off
cd C:\Users\86152\Desktop
*ssc install cnstock
*cnstock SHA //上交所证券代码
cap mkdir "年报\上交所" //存放路径
cd "年报\上交所" //存放路径
use cnstock.dta //上交所股票代码
forvalues n =1/1465{ // 此处的n可以视情况自行选择区间(如果一次性下载所有上交所公司的年报会耗时很久),可以每次下载5-10个
global v=stkcd[`n']
dis $v
foreach stkcd in $v{
forvalues year = 2010(1)2018 { //抓取2010到2018年的年报【起止年份可以换】
forvalues date=0/211{
local reptdate: disp %dCY-N-D mdy(1, 1, `year' + 1)+`date'
disp "`reptdate'"
capture copy "http://static.sse.com.cn/disclosure/listedinfo/announcement/c/`reptdate'/`stkcd'_`year'_n.pdf" `stkcd'_`year'_`reptdate'.pdf, replace
*if _rc == 0 {
*continue, break //原代码是为了达到只要找到当年年报便不在继续往后搜索的目的
*}
}
}
}
}
深交所我试了很多都没成功,不知道该怎么办
|