搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  数据说明文件
资料下载链接地址: https://bbs.pinggu.org/a-3460036.html
附件大小:
76 Bytes   举报本内容

论文常用上市公司数据整理




1、数据格式

dta格式(stata14/15/16版本)
需要安装包可以该帖免费下载:下载地址
提供基础数据包整理代码

2、数据包含

基础数据包:


  • 资产负债表
  • 利润表
  • 现金流量表(直接法)
  • 现金流量表(间接法)
  • 偿债能力
  • 披露财务指标
  • 比率结构
  • 经营能力
  • 盈利能力
  • 现金流分析
  • 风险水平
  • 发展能力
  • 每股指标
  • 相对价值指标(托宾Q值、账面市值比)
  • 股利分配
  • 治理综合信息(董事人数、独立董事人数、董事监事及高管年薪总额 董事监事及高管前三名薪酬总额 董事长与总经理兼任情况等)
  • 股东股权集中度(包含第1大、前3大、前5大、前10大股东持股比例之和以及Herfindahl指数、股权制衡度等)
  • 流通股东股权集中度
  • 公司文件
    包含特色整理指标:上市年份(便于计算上市公司年龄或者剔除当年IPO的数据),行业(以证监会2012行业分类标准,制造业用二级行业分类,其他行业用一级行业分类),市场类型,是否ST(以最新的是否ST来判断,如果需要根据当年是否ST,可以参考该贴https://bbs.pinggu.org/thread-10351009-1-1.html


拓展数据包:
  • 个股回报率(周期包括:日、周、月、年)
  • 市场回报率(周期包括:日、周、月、年)
市场类型字段对应编码:1=上海A,2=上海B,4=深圳A,8=深圳B,16=创业板,32=科创板
  • 综合市场回报率(周期包括:日、周、月、年)
    5=综合A股市场, 10=综合B股市场, 15=综合AB股市场, 21=综合A股和创业板; 31=综合AB股和创业; 37=综合A股和科创板; 47=综合AB股和科创板; 53=综合A股和创业板和科创板; 63=综合AB股和创业板和科创板。
  • 指数
  • 无风险利率(定期整存整取一年利率)
  • 三因子数据(包含周期:日、周、月)
  • 四因子数据(包含周期:月)
  • 五因子数据(包含周期:日、周、月)
  • 股东股权质押统计表和明细(可以筛选控股股东股权质押数据)
  • 个股非流动性Amihud指标(日、月、年)
  • 投资者情绪指数
  • 计算操控性利润和非操控性应计利润计算所需数据
  • 研发支出/研发投入(研发费用费用化 资本化)
  • 汇率
  • 交易日历
  • 三会基本信息
  • 股东大会信息文件
  • 股权性质(介绍:https://bbs.pinggu.org/thread-10544920-1-1.html
  • 社会责任报告数据(和讯网)(介绍:https://bbs.pinggu.org/thread-10602192-1-1.html
  • 十大股东、十大流通股东持股比例明细
  • 机构投资者持股比例(Wind)https://bbs.pinggu.org/thread-10607278-1-1.html
  • 分析师预测指标文件
  • 分析师特色指标(是否四大、分析师跟踪人数、研报关注度、上市公司透明度)
  • 董监高个人特征文件(性别、年龄、学历、职业背景、海外背景、学术背景、金融背景等)(2020年暂时不全,后续更新)
  • 高管个人资料文件(性别、年龄、教育背景、任期等)


3、数据说明
  • 精心整理以便写论文方便
  • 数据起始时间都是公司上市开始到2020年
  • 数据只有沪深A股上市公司(包括主板、中小板、创业板、科创板),不包含B股上市公司
  • 只有保留年度数据,报表类型只保留合并报表
  • 所有数据统计证券代码字段为stkcd,年份字段为year,以便以合并匹配
  • 注意:stkcd字段类型为数字,1即代表股票000001,为了便于匹配同时提供证券代码字段(字符型)



直接用Stata的merge 1:1 stkcd year 匹配汇总简直不能更方便
字段都为中文名,直观方便



让您免去数据下载整理的烦恼


4、附件下载(百度网盘地址)

  • 数据说明文件


  • 基础数据包


  • 拓展数据包


  • 基础+拓展数据


5、示例代码
使用 merge 1:1 匹配数据1:1指的是1对1匹配 m:1匹配是指多对1匹配(匹配公司文件)
stkcd year 对应的是匹配变量
nogen 表示不生成_merge变量
keep(1 3) 相当于 keep if _merge==1 | _merge==3
keep里面具体对应

numeric equivalent
code word (results) description
-------------------------------------------------------------------
1 master observation appeared in master only
2 using observation appeared in using only
3 match observation appeared in both

keepusing() 里面放入想要匹配进去的变量,默认是全部变量
  1. *= 切换到数据所在路径
  2. cd E:\数据\

  3. *======================== 合并数据 =========================
  4. use 资产负债表.dta, clear
  5. keep stkcd 证券代码 year 资产总计 负债合计 货币资金 交易性金融资产
  6. merge 1:1 stkcd year using 利润表.dta, nogen keep(1 3) keepusing(净利润 营业收入)
  7. merge 1:1 stkcd year using 盈利能力.dta, nogen keep(1 3) keepusing(行业代码 总资产净利润率ROAB)
  8. merge 1:1 stkcd year using 发展能力.dta, nogen keep(1 3) keepusing(营业收入增长率B)
  9. merge 1:1 stkcd year using 相对价值指标.dta, nogen keep(1 3) keepusing(托宾Q值*)
  10. merge 1:1 stkcd year using 治理综合信息.dta, nogen keep(1 3) keepusing(董事人数 其中独立董事 董事长与总经理兼任情况)
  11. merge m:1 stkcd using 公司文件.dta, nogen keep(1 3) keepusing(行业代码C 上市日期 市场类型 是否ST )

  12. *======================== 筛选数据 =========================

  13. *= 剔除金融保险行业
  14. drop if regexm(行业代码C, "J")

  15. *= 剔除ST类上市公司
  16. drop if 是否ST==1

  17. *= 筛选沪深A股
  18. * 市场类型字段对应编码:1=上海A,2=上海B,4=深圳A,8=深圳B,16=创业板,32=科创板
  19. keep if inlist(市场类型, 1, 4, 16, 32)

  20. *= 如果要选择创业板的话
  21. * keep if inlist(市场类型, 16)

  22. * 剔除当年IPO的数据以及上市以前的数据
  23. drop if year<=real(substr(上市日期, 1, 4))

  24. * 筛选年份
  25. keep if year>=2010 & year<=2020

复制代码





经管之家:momingiqmiao7
欢迎关注,及时获取更多实用实证的数据


点击关注帖子索引使用常见问题点击查看更多帖子
Stata软件下载Stata免费学习资料】【批量购买可享优惠

PS: 有部分人反映手机app购买不了附件,可以尝试用电脑网页进行购买,还有问题可以留言(部分海外的朋友可能百度网盘打不开,可以留个邮箱给我)




补充内容 (2024-5-30 18:19):
【重磅更新】沪深京A股上市公司常用数据整理[更新至2023年]方便匹配 含代码 1000+变量
https://bbs.pinggu.org/thread-11801597-1-1.html


    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2026-1-8 02:55