楼主: momingqimiao7
2035 21

[实证分析] 【重磅更新】沪深京A股上市公司常用数据整理[更新至2024年]方便匹配 含代码 1500+变量 [推广有奖]

经管之家资深用户 Stata小能手 原创数据 专注熟悉领域

已卖:60225份资源
好评率:100%
商家信誉:极好

巨擘

0%

还不是VIP/贵宾

-

TA的文库  其他...

论文数据收藏

stata技巧

统计学习

威望
1
论坛币
283553 个
通用积分
2189.8645
学术水平
3632 点
热心指数
3537 点
信用等级
3367 点
经验
476237 点
帖子
18232
精华
1
在线时间
65535 小时
注册时间
2009-11-23
最后登录
2026-2-14

初级热心勋章 初级学术勋章 中级热心勋章 高级热心勋章 初级信用勋章 特级热心勋章 20周年荣誉勋章

楼主
momingqimiao7 在职认证  学生认证  发表于 2025-5-18 11:58:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

论文常用上市公司数据整理




权威数据库、多年更新,质量保证,大量好评,用的放心
超600行详细Stata整理代码大放送

2020年:https://bbs.pinggu.org/thread-10608582-1-1.html
2021年:https://bbs.pinggu.org/thread-11036326-1-1.html
2022年:https://bbs.pinggu.org/thread-11501087-1-1.html

2023年:https://bbs.pinggu.org/thread-11801597-1-1.html

1、数据格式

dta格式(适用于Stata14/Stata15/Stata16/Stata17/Stata18版本)
需要安装包可以该帖免费下载:https://bbs.pinggu.org/home.php?mod=space&uid=1388312&do=blog&id=295098

提供基础数据包整理代码

2、数据包含

基础数据包:


  • 资产负债表
  • 利润表
  • 现金流量表(直接法)
  • 现金流量表(间接法)
  • 偿债能力(资产负债率、流动比率、速动比率、利息保障倍数等)
  • 披露财务指标(基本每股收益、稀释每股收益等)
  • 比率结构(营运资金比率、固定资产比率、有形资产比率、综合税率等)
  • 经营能力(总资产周转率、存货周转率、资本密集度、应收账款周转率等)
  • 盈利能力(资产报酬率、总资产净利润率、净资产收益率、管理费用率、营业毛利率、投资收益率等)
  • 现金流分析(股权现金流、公司现金流、股权自由现金流、企业自由现金流、折旧摊销等)
  • 风险水平(财务杠杆、经营杠杆、综合杠杆)
  • 发展能力(营业收入增长率、总资产增长率、净利润增长率、可持续增长率、资本积累率等)
  • 每股指标(每股收益、每股净资产、每股现金净流量、每股净资产等)
  • 相对价值指标(托宾Q值、账面市值比、市盈率、市净率等)
  • 股利分配(股利分配率、每股税前现金股利、每股税后现金股利、收益留存率等)
  • 治理综合信息(股东总数、 员工人数、董事长持股数量、总经理持股比例、董事长与总经理兼任情况等)
  • 高管人数、持股及薪酬情况(董事人数、独立董事人数、董事监事及高管年薪总额、董事前三名薪酬总额等)
  • 股东股权集中度(包含第1大、前3大、前5大、前10大股东持股比例之和以及Herfindahl指数、股权制衡度等)
  • 流通股东股权集中度
  • 审计意见表(审计费用、审计意见类型、审计事务所、审计师)
  • 股本结构(总股本、流通股本、国有股本、A股股本等)
  • 融资约束(SA指数(2024年)、WW指数(2024年)、KZ指数、FC指数)
  • 赫芬达尔指数表(HHI)、行业集中度(CR)、行业勒纳指数(Lerner
  • 公司基本信息(多交易所上市、A/B/H股交叉码、首次ST日期、首次ST原因、首次ST时公司生存时间、首次ST后摘帽的时间、是否经历多次ST、是否有海外子公司)

  • 公司文件
    包含特色整理指标:上市年份(便于计算上市公司年龄或者剔除当年IPO的数据),行业(以证监会2012行业分类标准,制造业用二级行业分类,其他行业用一级行业分类),市场类型,是否ST或PT(以最新的是否ST来判断,如果需要根据当年是否ST,可以参考该贴https://bbs.pinggu.org/thread-11702210-1-1.html



同时提供基础数据所有变量合并版本



拓展数据包:
  • 个股回报率(周期包括:日、周、月、年)
  • 市场回报率(周期包括:日、周、月、年)

  1. 市场类型字段对应编码:1=上海A,4=深圳A,16=创业板,32=科创板,64=北交所
复制代码


  • 综合市场回报率(周期包括:日、周、月、年)

  • 指数
  • 无风险利率(定期整存整取一年利率)
  • 三因子数据(包含周期:日、周、月)
  • 四因子数据(包含周期:月)
  • 五因子数据(包含周期:日、周、月)
  • 股东股权质押统计表和明细(可以筛选控股股东股权质押数据)
  • 个股非流动性Amihud指标(日、周、月、年)
  • 个股换手率指标(日、周、月、年)
  • Roll指标(采用日收益率估计的Roll指标)
  • IML非流动性补偿收益因子表(流动性最差的投资组合收益与流动性最好的投资组合收益之差(收益加权)、流动性最差的投资组合收益与流动性最好的投资组合收益之差(成交金额加权)
  • Zeros指标(年内零收益率天数/年交易天数
  • Pastor_Stambaugh指标
  • 市场投资者情绪指数
  • 计算操控性利润和非操控性应计利润计算所需数据
  • 研发支出/研发投入研发人员数量、研发人员数量占比(%)、研发投入金额、研发投入占营业收入比例(%)、研发投入(支出)费用化的金额、研发投入(支出)资本化的金额、资本化研发投入(支出)占研发投入的比例(%)、资本化研发投入(支出)占当期净利润的比重(%))(研发费用  费用化 资本化)
  • 汇率
  • 交易日历
  • 三会基本信息
  • 股东大会信息文件
  • 委员会召开情况
  • 股权性质(介绍:https://bbs.pinggu.org/thread-11489489-1-1.html
  • 社会责任报告数据(和讯网)到2020年后续网站未更新(介绍:https://bbs.pinggu.org/thread-10602192-1-1.html
  • 十大股东、十大流通股东持股比例明细
  • 机构投资者持股比例
  • 分析师预测指标文件
  • 经营风险指标ZScore(计算公式为:Z=1.2X1+1.4X2+3.3X3+0.6X4+0.999X5;其中:X1=营运资金/总资产;反映资产的变现能力和规模特征。X2=留存收益/总资产;反映公司的累积盈利能力。X3=EBIT/总资产;反映资产的盈利能力。X4=权益的市场价值/总负债的账面价值;是衡量一家公司财务结构、表明所有者权益和债权人权益相对关系的比率,可以反映一家公司的偿债能力。X5=营业收入/总资产;反映企业资产周转情况,用来衡量公司利用资产的效率情况。)
  • 经营风险指标Score计算公式为:OScore=−1.32−0.407SIZE+6.03TLTA−1.43WCTA+0.0757CLCA−2.37NITA−1.83FUTL+0.285INTWO−1.72OENEG−0.521CHIN; 其中:SIZE=Ln(总资产);TLTA=总负债/总资产;WCTA=营运资金/总资产;CLCA=流动负债/流动资产;NITA=净利润/总资产;FUTL=经营性净现金流/总负债;INTWO=若过去两年净利润均为负数则为1,否则为0;OENEG=如果总负债>总资产为1,否则为0;CHIN=(NIt−NIt−1)/(|NIt|+|NIt−1|),NI表示净利润)
  • 管理层治理能力控股股东性质、机构投资者持股比例、银行持股比例、是否持有其他金融机构股份、管理层薪酬总额、两职合一、独立董事占比、管理层男性占比、董监高是否具有金融背景、董监高是否具有海外背景、董监高是否兼任股东单位职务、员工人数、人均创利、超额雇员率、员工密集度、独立董事网络中心度、是否存在一控多情况
  • 分析师特色指标(是否四大、分析师跟踪人数、研报关注度、上市公司透明度)
  • 会计信息披露及时性指标初步时滞、审计师签字时滞、总时滞A、总时滞B
  • 董监高个人特征文件(性别、年龄、学历、职业背景、海外背景、学术背景、金融背景等) 2024年部分未更新全,实时更新
  • 高管个人资料文件(性别、年龄、教育背景、任期等)
  • 董监高任职情况
  • 国内外专利申请获得情况表(发明专利申请和授权、实用新型专利申请和授权、外观专利申请和授权)
  • 供应链数据大全(前五大客户销售信息表(排名、客户名称、公司股票代码、客户销售额、客户销售额占比)、前五大供应商采购信息表(排名、供应商名称、公司股票代码供应商采购额、供应商采购额占比供应链地理距离指标表空间距离、与客户/供应商距离]、是否同省份企业、是否同城市企业)、供应链集中度指标表第一大客户销售额、前五大客户销售额、第一大供应商采购额、前五大供应商采购额、营业总收入、第一大客户销售额占总销售额比率、 第一大供应商采购额占总采购额比率、客户集中度、供应商集中度、客户集中度赫芬达尔指数、供应商集中度赫芬达尔指数、供应链集中度)、供应链网络关系指标表一级供应链业务关系、一级供应链股票代码、二级供应链业务关系、二级供应链股票代码 注意后续更新

3、数据说明
  • 精心整理以便写论文方便
  • 数据起始时间都是公司上市开始到2024
  • 数据只有沪深北交所A股上市公司(包括主板、中小板、创业板、科创板),不包含B股上市公司
  • 只有保留年度数据,报表类型只保留合并报表
  • 所有数据统计证券代码字段为stkcd,年份字段为year,以便以合并匹配
  • 注意:stkcd字段类型为数字,1即代表股票000001,为了便于匹配同时提供证券代码字段(字符型)


直接用Stata的merge 1:1 stkcd year 匹配汇总简直不能更方便
字段都为中文名,直观方便
QQ截图20250518115824.jpg


QQ截图20250518120021.jpg


让您免去数据下载整理的烦恼

QQ截图20250518115348.jpg


QQ截图20250518120341.jpg

4、附件下载(百度网盘地址)

  • 数据说明文件
       数据说明 (76 Bytes, 需要: RMB 1 元)

  • 基础数据包
    基础数据包 (76 Bytes, 需要: RMB 98 元)

  • 拓展数据包
    拓展数据包 (76 Bytes, 需要: RMB 118 元)


5、示例代码
  1. *======================== 合并数据 =========================
  2. use 资产负债表.dta, clear
  3. merge 1:1 stkcd year using 利润表.dta, nogen keep(1 3)  
  4. merge 1:1 stkcd year using 现金流量表_直接法.dta, nogen keep(1 3)  
  5. merge 1:1 stkcd year using 现金流量表_间接法.dta, nogen keep(1 3)  
  6. merge 1:1 stkcd year using 偿债能力.dta, nogen keep(1 3)  
  7. merge 1:1 stkcd year using 披露财务指标.dta, nogen keep(1 3)  
  8. merge 1:1 stkcd year using 比率结构.dta, nogen keep(1 3)  
  9. merge 1:1 stkcd year using 经营能力.dta, nogen keep(1 3)  
  10. merge 1:1 stkcd year using 现金流分析.dta, nogen keep(1 3)  
  11. merge 1:1 stkcd year using 风险水平.dta, nogen keep(1 3)  
  12. merge 1:1 stkcd year using 发展能力.dta, nogen keep(1 3)  
  13. merge 1:1 stkcd year using 每股指标.dta, nogen keep(1 3)  
  14. merge 1:1 stkcd year using 相对价值指标.dta, nogen keep(1 3)  
  15. merge 1:1 stkcd year using 股利分配.dta, nogen keep(1 3)  
  16. merge 1:1 stkcd year using 股东股权集中度.dta, nogen keep(1 3)  
  17. merge 1:1 stkcd year using 流通股东股权集中度.dta, nogen keep(1 3)  
  18. merge 1:1 stkcd year using 流通股东股权集中度.dta, nogen keep(1 3)  
  19. merge 1:1 stkcd year using 治理综合信息.dta, nogen keep(1 3)  
  20. merge 1:1 stkcd year using 高管人数持股及薪酬情况.dta, nogen keep(1 3)  
  21. merge 1:1 stkcd year using 审计意见表.dta, nogen keep(1 3)  
  22. merge 1:1 stkcd year using 股本结构.dta, nogen keep(1 3)  
  23. merge 1:1 stkcd year using 融资约束SA指数.dta, nogen keep(1 3) keepusing(SA指数)
  24. merge 1:1 stkcd year using 融资约束WW指数.dta, nogen keep(1 3) keepusing(WW指数)
  25. merge 1:1 stkcd year using 融资约束KZ指数.dta, nogen keep(1 3) keepusing(KZ指数)
  26. merge 1:1 stkcd year using 融资约束FC指数.dta, nogen keep(1 3) keepusing(FC指数)
  27. merge m:1 stkcd using 公司文件.dta, nogen keep(1 3)   
  28. drop 行业代码
  29. rename 行业代码1 行业代码
  30. merge m:1 行业代码 year using  赫芬达尔指数表.dta, nogen keep(1 3) keepusing(HHI*)
  31. merge m:1 行业代码 year using  行业集中度.dta, nogen keep(1 3) keepusing(   行业内公司总数  CR*)
  32. merge 1:1 stkcd year using  行业勒纳指数.dta, nogen keep(1 3) keepusing( 个股勒纳指数 行业勒纳指数 交易状态)

  33. *======================== 筛选数据 =========================

  34. *= 剔除金融保险行业
  35. drop if regexm(行业代码, "J")

  36. *= 剔除ST或PT类上市公司
  37. *  - A=正常上市、B=ST、C=PT、D=*ST、T=退市整理期。
  38. keep if 交易状态=="A"

  39. *= 筛选全部A股
  40. * 市场类型字段对应编码:1=上海A,4=深圳A,16=创业板,32=科创板,64=北证A股市场
  41. keep if inlist(市场类型, 1, 4, 16, 32, 64)

  42. *= 如果要选择创业板的话
  43. * keep if inlist(市场类型, 16)

  44. * 剔除当年IPO的数据以及上市以前的数据
  45. drop if year<=real(substr(上市日期, 1, 4))

  46. * 筛选年份
  47. keep if year>=2010 & year<=2024

  48.   
复制代码



经管之家:momingiqmiao7
欢迎关注,分享更多实用的数据,独家发布,严禁转载获利,转载必究,有任何问题在可以帖子下方回复,及时回复

批量购买可享优惠


关注帖子索引2023年】【帖子索引2022年】【帖子索引2021年】【使用常见问题点击查看更多帖子】【Stata软件下载】【Stata免费学习资料




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:A股上市公司 上市公司 数据整理 上市公 Herfindahl

已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
Whatsappp + 5 + 5 + 5 + 4 精彩帖子
Andrew_p0 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 6  热心指数 + 6  信用等级 + 5   查看全部评分

常用控制变量 https://bbs.pinggu.org/thread-15164021-1-1.html

沙发
momingqimiao7(未真实交易用户) 在职认证  学生认证  发表于 2025-5-18 12:04:25
本数据源自上市公司权威数据库,由Stata软件整理得出,真实可靠可复现,多次人工校对确保数据的准确性,如何任何问题可联系本人(momingqimiao7)沟通!

藤椅
momingqimiao7(未真实交易用户) 在职认证  学生认证  发表于 2025-5-18 12:04:50
数据真实可靠~

板凳
Andrew_p0(未真实交易用户) 发表于 2025-5-18 18:01:29
变量很多,自己得整理老半天

报纸
momingqimiao7(未真实交易用户) 在职认证  学生认证  发表于 2025-5-18 18:50:50
   性价比超高,100+文件,平均一份不到2元

地板
gimmy09(未真实交易用户) 发表于 2025-5-18 22:09:59
含金量很高~

7
南开学子苦逼论文ing(未真实交易用户) 发表于 2025-5-18 22:16:33

对我的实证很有帮助,以前我整理这个数据都花了好多时间
一直关注楼主,质量比较可靠

8
Killmaster(未真实交易用户) 发表于 2025-5-19 00:00:51
楼主很实在

9
yiyijiayuan(未真实交易用户) 在职认证  发表于 2025-5-19 03:00:43
友情回复。

10
512661101(未真实交易用户) 发表于 2025-5-19 12:40:44
谢谢分享!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-14 17:01