基本说明:本数据为1990-2022中国上市公司数据大全(代码+数据),已根据2022年最新公布的上市公司年报进行更新,本数据集已经出品4年,涵盖上市公司研究的绝大多数变量,本版共有变量1372个(详见附件-免费下载)。为了方便大家掌握数据处理的整个过程,附件提供了全部的数据处理代码和原始数据,供大家参考学习。后续也会根据大家的意见进行免费升级。
更新时间:2023年5月16日(2023年第一版)
变量个数:1372
观测值数量:77774
数据处理:Stata16(数据处理do文件3000+行)
包含数据库说明:
1.上市公司基本信息
2.股票市场交易(年度指标)
3.财务报表(资产负债表+利润表+现金流量表(直接法+间接法))
4.财务指标分析(偿债能力、披露财务指标、比率结构、经营能力、盈利能力、现金流量分析、风险水平、发展能力、每股指标、相对价值指标、股利分配)
5.民营上市公司
6.治理结构(包含三会信息、三会人数及会议次数、董监高薪酬等)
7.股东
8.股权性质(包含国有非国有划分、中央地方划分等)
9.财务报告审计意见
10.内部控制
11.上市公司贷款
12.上市公司研发创新
13.操控性与非操控性应计利润(部分-主要为了获取固定资产原值)14.资本结构等(部分-主要为了获取利息支出)
注:由于包含变量较多,建议大家先下载查阅变量说明和样本数据(后文附件免费下载)
附件包含文件说明:
1.lab文件夹:数据处理过程中的标签文件(可忽略)——加上标签代码将超过3000行
2.out文件夹:数据处理过程中生成的中间 dta 格式文件(可忽略)
3.xlsx文件夹:原始 xlsx 格式文件和说明 txt 文件(可忽略)
4.GTA2022.do:数据处理 do 文件(请使用 Stata16 打开)
5.GTA2022final.dta:处理后的最终数据(请使用 Stata16 打开)
注意:这里最重要的是4和5两个文件,其他文件均可忽略
各年度观测值数量:
年份 | Freq. | Percent | Cum. |
1990 | 12 | 0.02 | 0.02 |
1991 | 18 | 0.02 | 0.04 |
1992 | 78 | 0.1 | 0.14 |
1993 | 236 | 0.3 | 0.44 |
1994 | 362 | 0.47 | 0.91 |
1995 | 397 | 0.51 | 1.42 |
1996 | 618 | 0.79 | 2.21 |
1997 | 839 | 1.08 | 3.29 |
1998 | 964 | 1.24 | 4.53 |
1999 | 1,140 | 1.47 | 6 |
2000 | 1,359 | 1.75 | 7.74 |
2001 | 1,499 | 1.93 | 9.67 |
2002 | 1,505 | 1.94 | 11.61 |
2003 | 1,592 | 2.05 | 13.65 |
2004 | 1,709 | 2.2 | 15.85 |
2005 | 1,753 | 2.25 | 18.11 |
2006 | 1,902 | 2.45 | 20.55 |
2007 | 2,254 | 2.9 | 23.45 |
2008 | 2,477 | 3.18 | 26.63 |
2009 | 2,602 | 3.35 | 29.98 |
2010 | 2,648 | 3.4 | 33.38 |
2011 | 2,775 | 3.57 | 36.95 |
2012 | 2,963 | 3.81 | 40.76 |
2013 | 3,272 | 4.21 | 44.97 |
2014 | 3,681 | 4.73 | 49.7 |
2015 | 3,867 | 4.97 | 54.67 |
2016 | 4,116 | 5.29 | 59.97 |
2017 | 4,623 | 5.94 | 65.91 |
2018 | 5,066 | 6.51 | 72.42 |
2019 | 5,368 | 6.9 | 79.33 |
2020 | 5,381 | 6.92 | 86.24 |
2021 | 5,362 | 6.89 | 93.14 |
2022 | 5,336 | 6.86 | 100 |
Total | 77,774 | 100 |
代码数据展示: