楼主: momingqimiao7
19609 38

[实证分析] 【重磅更新】沪深京A股上市公司常用数据整理[更新至2023年]方便匹配 含代码 1000+变量 [推广有奖]

经管之家资深用户 Stata小能手 原创数据 专注熟悉领域

已卖:60089份资源
好评率:100%
商家信誉:极好

巨擘

0%

还不是VIP/贵宾

-

TA的文库  其他...

论文数据收藏

stata技巧

统计学习

威望
1
论坛币
283548 个
通用积分
2067.2410
学术水平
3632 点
热心指数
3537 点
信用等级
3367 点
经验
474460 点
帖子
18212
精华
1
在线时间
65535 小时
注册时间
2009-11-23
最后登录
2026-1-4

初级热心勋章 初级学术勋章 中级热心勋章 高级热心勋章 初级信用勋章 特级热心勋章 20周年荣誉勋章

楼主
momingqimiao7 在职认证  学生认证  发表于 2024-5-30 18:15:29 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

论文常用上市公司数据整理




多年更新,质量保证,大量好评,用的放心

2020年:https://bbs.pinggu.org/thread-10608582-1-1.html
2021年:https://bbs.pinggu.org/thread-11036326-1-1.html
2022年:https://bbs.pinggu.org/thread-11501087-1-1.html


1、数据格式

dta格式(适用于Stata14/Stata15/Stata16/Stata17/Stata18版本)
需要安装包可以该帖免费下载:下载地址
提供基础数据包整理代码

2、数据包含

基础数据包:


  • 资产负债表
  • 利润表
  • 现金流量表(直接法)
  • 现金流量表(间接法)
  • 偿债能力(资产负债率、流动比率、速动比率、利息保障倍数等)
  • 披露财务指标(基本每股收益、稀释每股收益等)
  • 比率结构(营运资金比率、固定资产比率、有形资产比率、综合税率等)
  • 经营能力(总资产周转率、存货周转率、资本密集度、应收账款周转率等)
  • 盈利能力(资产报酬率、总资产净利润率、净资产收益率、管理费用率、营业毛利率、投资收益率等)
  • 现金流分析(股权现金流、公司现金流、股权自由现金流、企业自由现金流、折旧摊销等)
  • 风险水平(财务杠杆、经营杠杆、综合杠杆)
  • 发展能力(营业收入增长率、总资产增长率、净利润增长率、可持续增长率、资本积累率等)
  • 每股指标(每股收益、每股净资产、每股现金净流量、每股净资产等)
  • 相对价值指标(托宾Q值、账面市值比、市盈率、市净率等)
  • 股利分配(股利分配率、每股税前现金股利、每股税后现金股利、收益留存率等)
  • 治理综合信息(股东总数、 员工人数、董事长持股数量、总经理持股比例、董事长与总经理兼任情况等)
  • 高管人数、持股及薪酬情况(董事人数、独立董事人数、董事监事及高管年薪总额、董事前三名薪酬总额等)
  • 股东股权集中度(包含第1大、前3大、前5大、前10大股东持股比例之和以及Herfindahl指数、股权制衡度等)
  • 流通股东股权集中度
  • 审计意见表(审计费用、审计意见类型、审计事务所、审计师)
  • 股本结构(总股本、流通股本、国有股本、A股股本等)
  • 公司文件
    包含特色整理指标:上市年份(便于计算上市公司年龄或者剔除当年IPO的数据),行业(以证监会2012行业分类标准,制造业用二级行业分类,其他行业用一级行业分类),市场类型,是否ST或PT(以最新的是否ST来判断,如果需要根据当年是否ST,可以参考该贴https://bbs.pinggu.org/thread-11702210-1-1.html


同时提供基础数据所有变量合并版本


拓展数据包:
  • 个股回报率(周期包括:日、周、月、年)
  • 市场回报率(周期包括:日、周、月、年)
市场类型字段对应编码:1=上海A,4=深圳A,16=创业板,32=科创板,64=北交所

  • 综合市场回报率(周期包括:日、周、月、年)
  • 指数
  • 无风险利率(定期整存整取一年利率)
  • 三因子数据(包含周期:日、周、月)
  • 四因子数据(包含周期:月)
  • 五因子数据(包含周期:日、周、月)
  • 股东股权质押统计表和明细(可以筛选控股股东股权质押数据)
  • 个股非流动性Amihud指标(日、周、月、年)
  • 个股换手率指标(日、周、月、年)
  • 投资者情绪指数
  • 计算操控性利润和非操控性应计利润计算所需数据
  • 研发支出/研发投入(研发费用  费用化 资本化)
  • 汇率
  • 交易日历
  • 三会基本信息
  • 股东大会信息文件
  • 委员会召开情况
  • 股权性质(介绍:https://bbs.pinggu.org/thread-11489489-1-1.html
  • 社会责任报告数据(和讯网)到2020年后续网站未更新(介绍:https://bbs.pinggu.org/thread-10602192-1-1.html
  • 十大股东、十大流通股东持股比例明细
  • 机构投资者持股比例
  • 分析师预测指标文件
  • 分析师特色指标(是否四大、分析师跟踪人数、研报关注度、上市公司透明度)
  • 董监高个人特征文件(性别、年龄、学历、职业背景、海外背景、学术背景、金融背景等) 2023年部分未更新全,实时更新
  • 高管个人资料文件(性别、年龄、教育背景、任期等)
  • 董监高任职情况

3、数据说明
  • 精心整理以便写论文方便
  • 数据起始时间都是公司上市开始到2023
  • 数据只有沪深北交所A股上市公司(包括主板、中小板、创业板、科创板),不包含B股上市公司
  • 只有保留年度数据,报表类型只保留合并报表
  • 所有数据统计证券代码字段为stkcd,年份字段为year,以便以合并匹配
  • 注意:stkcd字段类型为数字,1即代表股票000001,为了便于匹配同时提供证券代码字段(字符型)


直接用Stata的merge 1:1 stkcd year 匹配汇总简直不能更方便
字段都为中文名,直观方便
QQ截图20240530180426.jpg


让您免去数据下载整理的烦恼


4、附件下载(百度网盘地址)

  • 数据说明文件
       数据说明文件 (76 Bytes)

  • 基础数据包
    基础数据包 (76 Bytes, 需要: RMB 98 元)

  • 拓展数据包
    拓展数据包 (76 Bytes, 需要: RMB 118 元)


5、示例代码

  1. *======================== 合并数据 =========================
  2. use 资产负债表.dta, clear
  3. keep stkcd 证券代码 year 资产总计 负债合计 货币资金 交易性金融资产
  4. merge 1:1 stkcd year using 利润表.dta, nogen keep(1 3) keepusing(净利润 营业收入)
  5. merge 1:1 stkcd year using 盈利能力.dta, nogen keep(1 3) keepusing(行业代码 总资产净利润率ROAB)
  6. merge 1:1 stkcd year using 发展能力.dta, nogen keep(1 3) keepusing(营业收入增长率B)
  7. merge 1:1 stkcd year using 相对价值指标.dta, nogen keep(1 3) keepusing(托宾Q值*)
  8. merge 1:1 stkcd year using 治理综合信息.dta, nogen keep(1 3) keepusing(董事长持股数量 董事长持股比例 董事长与总经理兼任情况)
  9. merge m:1 stkcd using 公司文件.dta, nogen keep(1 3) keepusing(行业代码C 上市日期 市场类型 是否ST 是否ST或PT)

  10. *======================== 筛选数据 =========================

  11. *= 剔除金融保险行业
  12. drop if regexm(行业代码C, "J")

  13. *= 剔除ST或PT类上市公司
  14. drop if 是否ST或PT==1

  15. *= 筛选全部A股
  16. * 市场类型字段对应编码:1=上海A,4=深圳A,16=创业板,32=科创板,64=北证A股市场
  17. keep if inlist(市场类型, 1, 4, 16, 32, 64)

  18. *= 如果要选择创业板的话
  19. * keep if inlist(市场类型, 16)

  20. * 剔除当年IPO的数据以及上市以前的数据
  21. drop if year<=real(substr(上市日期, 1, 4))

  22. * 筛选年份
  23. keep if year>=2010 & year<=2023
复制代码





经管之家:momingiqmiao7
欢迎关注,分享更多实用的数据,独家发布,严禁转载获利,转载必究,有任何问题在可以帖子下方回复,及时回复

批量购买可享优惠


关注帖子索引2023年】【帖子索引2022年】【帖子索引2021年】【使用常见问题点击查看更多帖子】【Stata软件下载】【Stata免费学习资料



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:A股上市公司 上市公司 数据整理 上市公 Herfindahl

基础数据包
下载链接: https://bbs.pinggu.org/a-4157369.html

82 Bytes

需要: RMB 9999 元  [购买]

过期

常用控制变量 https://bbs.pinggu.org/thread-15164021-1-1.html

沙发
momingqimiao7(未真实交易用户) 在职认证  学生认证  发表于 2024-5-30 18:31:53
【重磅更新】沪深京A股上市公司常用数据整理[更新至2024年]方便匹配 含代码 1500+变量
https://bbs.pinggu.org/forum.php ... ;extra=#pid94541461

藤椅
淡定看世界(未真实交易用户) 发表于 2024-6-1 15:21:53
这个还挺全的,不错不错

板凳
孙漂亮哥哥(未真实交易用户) 发表于 2024-6-1 15:22:23
我Stata18能用不?

报纸
momingqimiao7(未真实交易用户) 在职认证  学生认证  发表于 2024-6-1 15:46:43
孙漂亮哥哥 发表于 2024-6-1 15:22
我Stata18能用不?
您好,可以使用的

地板
lingdze66(未真实交易用户) 发表于 2024-6-4 03:55:35
感谢分享。十分有用的数据

7
赵安豆(未真实交易用户) 发表于 2024-6-5 22:39:22
这份数据集包含了中国沪深京A股上市公司的常用数据。数据格式为dta,适用于Stata的多个版本。

数据内容涵盖了以下方面:

1. 基础财务报表:资产负债表、利润表和现金流量表(直接法和间接法)。

2. 偿债能力指标:包括资产负债率、流动比率、速动比率和利息保障倍数等。

3. 披露的财务指标:如基本每股收益、稀释每股收益等。

4. 比率结构分析:包括营运资金比率、固定资产比率、有形资产比率、综合税率等。

5. 经营能力指标:总资产周转率、存货周转率、资本密集度、应收账款周转率等。

6. 盈利能力指标:资产报酬率、总资产净利润率、净资产收益率、管理费用率、营业毛利率、投资收益率等。

7. 现金流分析:涉及企业经营活动、投资活动和筹资活动的现金流状况。

这份数据集提供了丰富的上市企业财务信息,对于学术研究、市场分析以及企业经营决策等方面都有很大的参考价值。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



8
momingqimiao7(未真实交易用户) 在职认证  学生认证  发表于 2024-6-5 23:13:38
赵安豆 发表于 2024-6-5 22:39
这份数据集包含了中国沪深京A股上市公司的常用数据。数据格式为dta,适用于Stata的多个版本。

数据内容涵盖 ...

9
Spark2(未真实交易用户) 发表于 2024-6-10 11:20:43
很好很齐全,方便挺多的

10
momingqimiao7(未真实交易用户) 在职认证  学生认证  发表于 2024-6-10 11:26:43
Spark2 发表于 2024-6-10 11:20
很好很齐全,方便挺多的
谢谢支持

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-4 05:07