常用上市公司数据整理
[季度版]
dta格式(stata14/15/16版本)
需要安装包可以该帖免费下载:下载地址
提供整理代码和合并使用代码
2、数据包含
- 资产负债表
- 利润表
- 现金流量表(直接法)
- 现金流量表(间接法)
- 偿债能力
- 披露财务指标
- 比率结构
- 经营能力
- 盈利能力
- 现金流分析
- 风险水平
- 发展能力
- 每股指标
- 相对价值指标(托宾Q值、账面市值比)
- 股利分配
- 治理综合信息(董事人数、独立董事人数、董事监事及高管年薪总额 董事监事及高管前三名薪酬总额 董事长与总经理兼任情况等)(这个数据只有年度的)
- 股东股权集中度(包含第1大、前3大、前5大、前10大股东持股比例之和以及Herfindahl指数、股权制衡度等)
- 流通股东股权集中度
- 公司文件
包含特色整理指标:上市年份(便于计算上市公司年龄或者剔除当年IPO的数据),行业(以证监会2012行业分类标准,制造业用二级行业分类,其他行业用一级行业分类),市场类型,是否ST(以最新的是否ST来判断,如果需要根据当年是否ST,可以参考该贴https://bbs.pinggu.org/thread-10351009-1-1.html)
3、数据说明
- 精心整理以便写论文方便
- 数据起始时间都是公司上市开始到2021年1季度
- 数据只有沪深A股上市公司(包括主板、中小板、创业板、科创板),不包含B股上市公司
- 季度数据,报表类型只保留合并报表
- 所有数据统计证券代码字段为stkcd,季度字段为quarter,以便以合并匹配
- q变量表示1:一季度报,2:中报,3:三季度报,4:年报
- 注意:stkcd字段类型为数字,1即代表股票000001,为了便于匹配同时提供证券代码字段(字符型)
直接用Stata的merge 1:1 stkcd quarter 匹配汇总简直不能更方便可以使用
xtset stkcd quarter 定义成面板数据
字段都为中文名,直观方便
让您免去数据下载整理的烦恼
4、附件下载(百度网盘地址)
- 数据说明文件
数据说明季度.xlsx
(82.81 KB)
- 数据包
【季度版】沪深A股上市公司常用数据整理(更新至2021年1季度)
(76 Bytes, 需要: RMB 98 元)
5、示例代码
使用 merge 1:1 匹配数据 1:1指的是1对1匹配 m:1匹配是指多对1匹配(匹配公司文件)
stkcd quarter对应的是匹配变量
nogen 表示不生成_merge变量
keep(1 3) 相当于 keep if _merge==1 | _merge==3
keep里面具体对应
numeric equivalent
code word (results) description
-------------------------------------------------------------------
1 master observation appeared in master only
2 using observation appeared in using only
3 match observation appeared in both
keepusing() 里面放入想要匹配进去的变量,默认是全部变量
- *= 切换到数据所在路径
- cd E:\数据\
- *======================== 合并数据 =========================
- use 资产负债表.dta, clear
- keep stkcd 证券代码 year quarter q 资产总计 负债合计 货币资金 交易性金融资产
- merge 1:1 stkcd quarter using 利润表.dta, nogen keep(1 3) keepusing(净利润 营业收入)
- merge 1:1 stkcd quarter using 盈利能力.dta, nogen keep(1 3) keepusing(行业代码 总资产净利润率ROAB)
- merge 1:1 stkcd quarter using 发展能力.dta, nogen keep(1 3) keepusing(营业收入增长率B)
- merge 1:1 stkcd quarter using 相对价值指标.dta, nogen keep(1 3) keepusing(托宾Q值*)
- merge m:1 stkcd year using 治理综合信息.dta, nogen keep(1 3) keepusing(董事人数 其中独立董事 董事长与总经理兼任情况)
- merge m:1 stkcd using 公司文件.dta, nogen keep(1 3) keepusing(行业代码C 上市日期 市场类型 是否ST )
- *======================== 筛选数据 =========================
- *= 剔除金融行业
- drop if regexm(行业代码C, "J")
- *= 剔除ST类上市公司
- drop if 是否ST==1
- *= 筛选沪深A股
- * 市场类型字段对应编码:1=上海A,2=上海B,4=深圳A,8=深圳B,16=创业板,32=科创板
- keep if inlist(市场类型, 1, 4, 16, 32)
- *= 如果要选择创业板的话
- * keep if inlist(市场类型, 16)
- * 剔除当年IPO的数据以及上市以前的数据
- drop if year<=real(substr(上市日期, 1, 4))
- * 筛选年份
- keep if year>=2010 & year<=2020
经管之家:momingiqmiao7
欢迎关注,及时获取更多实用实证的数据
【点击关注】【帖子索引】【使用常见问题】【点击查看更多帖子】
【Stata软件下载】【Stata免费学习资料】【批量购买可享优惠】
PS: 有部分人反映手机app购买不了附件,可以尝试用电脑网页进行购买,还有问题可以留言(部分海外的朋友可能百度网盘打不开,可以留个邮箱给我)
补充内容 (2022-6-3 21:12):
季度版常用数据整理更新至2022年1季度
https://bbs.pinggu.org/thread-11053751-1-1.html



雷达卡





京公网安备 11010802022788号







