请选择 进入手机版 | 继续访问电脑版
楼主: 画心199488
12307 26

用stata软件爬虫抓取交易所上市公司年报 [推广有奖]

  • 2关注
  • 31粉丝

教授

34%

还不是VIP/贵宾

-

威望
0
论坛币
7208 个
通用积分
65.2420
学术水平
24 点
热心指数
24 点
信用等级
18 点
经验
21809 点
帖子
260
精华
0
在线时间
2206 小时
注册时间
2014-4-14
最后登录
2024-3-28

画心199488 学生认证  发表于 2018-12-18 20:11:02 |显示全部楼层 |坛友微信交流群
相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
用stata软件爬虫抓取交易所上市公司年报

1.上交所年报爬虫下载上海证券交易所网站:http://www.sse.com.cn/

2.深交所年报下载
深圳证券交易所网站:http://www.szse.cn/

附件为对应的Stata程序(命令),可以避免很多人工一一查找的不便。












二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:stata 财务报告 年报 爬虫

爬虫抓取上交所和深交所年报.zip

1.03 KB

需要: RMB 3 元  [购买]

用Stata下载上市公司年报

本附件包括:

  • 爬虫抓取上交所和深交所年报.do

回帖推荐

gytwo123 发表于10楼  查看完整内容

你好,你的代码爬取上交所的上市公司年报可以,但深交所的貌似不行。此外,上交所的年报爬取会有一个问题,就是有一些公司会发布更新或修订版的年报,而这个年报的时间往往就是超过了4月30日,可能大部分都在6月份,所以那个时间可能要延后一些。我稍微修改了一点点上交所年报爬取的代码(stata5.0): clear set more off cd C:\Users\86152\Desktop *ssc install cnstock *cnstock SHA //上交所证券代码 cap mkdir ...

本帖被以下文库推荐

您好,有爬取好的上市公司年报吗?

使用道具

尘光123 发表于 2019-3-31 18:37:35 |显示全部楼层 |坛友微信交流群
没用,不要下载

使用道具

zy15688830171 学生认证  发表于 2019-4-16 22:44:23 来自手机 |显示全部楼层 |坛友微信交流群
蛊盅的夏天 发表于 2018-12-21 09:59
您好,有爬取好的上市公司年报吗?
我有,你需要吗?

使用道具

飞鸿惊鸿 发表于 2019-4-23 02:33:36 |显示全部楼层 |坛友微信交流群
深圳证券交易所改变了网站代码,请问楼主,你现在还能用你附件中的程序下载深圳证券交易所中的年报吗

使用道具

请问这个命令可以爬取财务报告中的任意数据吗

使用道具

画心199488 学生认证  发表于 2019-6-9 19:06:36 |显示全部楼层 |坛友微信交流群
飞鸿惊鸿 发表于 2019-4-23 02:33
深圳证券交易所改变了网站代码,请问楼主,你现在还能用你附件中的程序下载深圳证券交易所中的年报吗
可以的  是年报

使用道具

画心199488 学生认证  发表于 2019-6-9 19:06:59 |显示全部楼层 |坛友微信交流群
我一定会有猫的 发表于 2019-5-31 20:54
请问这个命令可以爬取财务报告中的任意数据吗
是上市公司年报  不是年报中的任意数据

使用道具

画心199488 学生认证  发表于 2019-6-9 19:08:07 |显示全部楼层 |坛友微信交流群
尘光123 发表于 2019-3-31 18:37
没用,不要下载
文明留言,真实可用   获取的是上市公司年报,并非年报里的某一数据

使用道具

gytwo123 发表于 2019-6-14 16:37:52 |显示全部楼层 |坛友微信交流群
你好,你的代码爬取上交所的上市公司年报可以,但深交所的貌似不行。此外,上交所的年报爬取会有一个问题,就是有一些公司会发布更新或修订版的年报,而这个年报的时间往往就是超过了4月30日,可能大部分都在6月份,所以那个时间可能要延后一些。我稍微修改了一点点上交所年报爬取的代码(stata5.0):
clear
set more off
cd C:\Users\86152\Desktop
*ssc install cnstock  
*cnstock SHA       //上交所证券代码
cap mkdir "年报\上交所"   //存放路径
cd "年报\上交所"          //存放路径
use cnstock.dta     //上交所股票代码

forvalues n =1/1465{      // 此处的n可以视情况自行选择区间(如果一次性下载所有上交所公司的年报会耗时很久),可以每次下载5-10个
global v=stkcd[`n']
dis $v
        foreach stkcd in $v{               
                forvalues year = 2010(1)2018 {      //抓取2010到2018年的年报【起止年份可以换】
                        forvalues date=0/211{
                        local reptdate: disp %dCY-N-D mdy(1, 1, `year' + 1)+`date'
                        disp "`reptdate'"
                        capture copy "http://static.sse.com.cn/disclosure/listedinfo/announcement/c/`reptdate'/`stkcd'_`year'_n.pdf" `stkcd'_`year'_`reptdate'.pdf, replace
                                *if _rc == 0 {           
                                *continue, break      //原代码是为了达到只要找到当年年报便不在继续往后搜索的目的
                                *}
                        }
                }
        }
}

深交所我试了很多都没成功,不知道该怎么办         

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 06:42