更新时间:2022年5月11日
处理软件:Stata16观测值数量:70765
变量个数:37
数据说明:行业分类是研究中经常用到的变量,如股票市场交易子库、治理结构子库、上市公司基本信息子库、内部控制子库、上市公司贷款子库、诉讼仲裁子库等。同时,有两个版本的行业分类,分别是证监会2001年行业分类标准和2012年行业分类标准。
处理过程详解:
(1)首先,需要将同一标准下的行业分类尽可能地补全(各个子库的缺失值程度是不一样的);
(2)然后,将行业大类、行业门类单独提取出来,便于在不同纬度进行聚类分析;
(3)再次,目前常用的行业分类是除制造业按照行业门类划分以外,其他行业按照行业大类划分(参见黄梅、夏新平(2009)-《南开管理评论》)——这是目前研究中使用最多的;
(4)最后,还要分别生成行业分类对应的数值型和字符串变量。
以上步骤笔者已经处理好了,大家可以直接使用。变量开头为Sic的变量为最终处理好的变量(根据证监会2012年行业分类处理),当然,各个子库的原始变量(在变量标签中添加了所属的子库)也在附件中,便于大家比较查阅。附件包含 dta 和 excel 两个版本。
核心变量说明:
序号 | 变量 | 说明 |
1 | id | 证券代码 |
2 | id_org | 证券代码-字符串 |
3 | year | 年份 |
4 | Stknme | 证券简称(补全) |
5 | Markettype | 市场类型-股票市场交易子库 |
6 | ABSign10 | AB股标识-上市公司贷款子库-数值型 |
7 | Aonly | 是否仅发行A股 |
8 | Sicda_str | 证监会2012行业大类分类码-每年更新 |
9 | Sicda | 证监会2012行业大类分类码-每年更新 |
10 | Sicda_chg | 行业大类代码是否变更 |
11 | Sicmen_str | 证监会2012行业门类分类码-每年更新 |
12 | Sicmen | 证监会2012行业门类分类码-每年更新 |
13 | Sicmen_chg | 行业门类代码是否变更 |
14 | Sic2_str | 行业分类: A B C1 C2 D E |
15 | Sic2 | 行业分类: A B C1 C2 D E |
各年度观测值:
年份 | Freq. | Percent | Cum. |
1990 | 12 | 0.02 | 0.02 |
1991 | 18 | 0.03 | 0.04 |
1992 | 78 | 0.11 | 0.15 |
1993 | 236 | 0.33 | 0.49 |
1994 | 362 | 0.51 | 1 |
1995 | 397 | 0.56 | 1.56 |
1996 | 618 | 0.87 | 2.43 |
1997 | 839 | 1.19 | 3.62 |
1998 | 960 | 1.36 | 4.97 |
1999 | 1,136 | 1.61 | 6.58 |
2000 | 1,351 | 1.91 | 8.49 |
2001 | 1,498 | 2.12 | 10.61 |
2002 | 1,504 | 2.13 | 12.73 |
2003 | 1,590 | 2.25 | 14.98 |
2004 | 1,708 | 2.41 | 17.39 |
2005 | 1,751 | 2.47 | 19.87 |
2006 | 1,897 | 2.68 | 22.55 |
2007 | 2,250 | 3.18 | 25.73 |
2008 | 2,477 | 3.5 | 29.23 |
2009 | 2,602 | 3.68 | 32.9 |
2010 | 2,648 | 3.74 | 36.65 |
2011 | 2,775 | 3.92 | 40.57 |
2012 | 2,959 | 4.18 | 44.75 |
2013 | 3,261 | 4.61 | 49.36 |
2014 | 3,654 | 5.16 | 54.52 |
2015 | 3,803 | 5.37 | 59.89 |
2016 | 4,032 | 5.7 | 65.59 |
2017 | 4,523 | 6.39 | 71.98 |
2018 | 4,960 | 7.01 | 78.99 |
2019 | 4,971 | 7.02 | 86.02 |
2020 | 4,957 | 7 | 93.02 |
2021 | 4,938 | 6.98 | 100 |
Total | 70,765 | 100 |
变量缺失值情况:
Variable | Missing | Total | Percent Missing |
id | 0 | 70,765 | 0 |
id_org | 0 | 70,765 | 0 |
year | 0 | 70,765 | 0 |
Stknme | 214 | 70,765 | 0.3 |
Markettype | 2,631 | 70,765 | 3.72 |
ABSign10 | 3,646 | 70,765 | 5.15 |
Aonly | 2,631 | 70,765 | 3.72 |
Sicda_str | 2,859 | 70,765 | 4.04 |
Sicda | 2,859 | 70,765 | 4.04 |
Sicda_chg | 0 | 70,765 | 0 |
Sicmen_str | 2,859 | 70,765 | 4.04 |
Sicmen | 2,859 | 70,765 | 4.04 |
Sicmen_chg | 0 | 70,765 | 0 |
Sic2_str | 2,859 | 70,765 | 4.04 |
Sic2 | 2,859 | 70,765 | 4.04 |
数据展示: