数据来源:权威数据库 CSM__。论坛上有限制,大家也可以私聊我了解数据来源
样本选择:全部A股,未做任何剔除处理
数据区间:1990.12.31-2021.12.31
字段设置:全选
使用时根据行业代码与公司数据进行匹配
每个压缩包中都附有数据说明
1.赫芬达尔指数表
字段说明:
IndustryCode [行业代码] - 2012版证监会行业分类代码。
IndustryName [行业名称] - 2012版证监会行业分类名称。
EndDate [截止日期] - YYYY-MM-DD:统一用10位字符表示,如1999-12-31。
Markettype [市场类型] - 1=上海A、2=上海B、4=深圳A、8=深圳B、16=创业板、5=综合A股、10=综合B股、15=综合AB股、21=综合A股和创业板、31=综合AB股和创业板、32=科创板、37=综合A股和科创板、47=综合AB股和科创板、53=综合A股和创业板和科创板、63=综合AB股和创业板和科创板。
ST [是否剔除ST或*ST股] - 0=未剔除、1=剔除。
IsNewOrSuspend [是否剔除当年新上市,已经退市或被暂停上市的公司] - 0=未剔除、1=剔除。
SampleNumber [行业内公司总数] -
HHI_A [HHI(A)] - 赫芬达尔指数计算公式为:HHI=sum[(Xi/X)^2],以下四个指标的计算中使用了不同的指标X代入计算。利用单个公司主营业务收入计算其所占行业市场份额。其中,Xi为单个公司的主营业务收入,X为该公司所属行业的主营业务收入合计,(Xi/X)即为该公司所占的行业市场份额。即为行业内的每家公司的主营业务收入与行业主营业务收入合计的比值的平方累加。
HHI_B [HHI(B)] - 利用单个公司所有者权益的账面价值计算其所占行业市场份额。其中,X_i为单个公司所有者权益的账面价值,X为该公司所属行业的所有者权益的账面价值总计,(Xi/X)即为该公司所占的行业市场份额。(所有者权益的账面价值取资产负债表中的“所有者权益合计”)。即为行业内的每家公司的所有者权益合计与行业内所有者权益合计的比值的平方累加。
HHI_C [HHI(C)] - 利用单个公司总资产计算其所占行业市场份额。其中,X_i为单个公司的总资产,X为该公司所属行业的总资产总计,(Xi/X)即为该公司所占的行业市场份额。即为行业内的每家公司的总资产与行业总资产合计的比值的平方累加。
HHI_D [HHI(D)] - 利用单个公司营业收入计算其所占行业市场份额。其中,X_i为单个公司的营业收入,X为该公司所属行业的营业收入合计,(Xi/X)即为该公司所占的行业市场份额。即为行业内的每家公司的营业收入与行业营业收入合计的比值的平方累加。(常用)
2.行业集中度指标表
字段说明:
IndustryCode [行业代码] - 2012版证监会行业分类代码。
IndustryName [行业名称] - 2012版证监会行业分类名称。
EndDate [截止日期] - YYYY-MM-DD:统一用10位字符表示,如1999-12-31。
Markettype [市场类型] - 1=上证A股市场;2=上证B股市场;4=深证A股市场;5=沪深A股市场;8=深证B股市场;10=沪深B股市场;15=沪深AB股市场;16=创业板;20=深证A股和创业板;21=沪深A股和创业板;31=沪深AB股和创业板;32=科创板;33=上证A股和科创板;37=沪深A股和科创板;47=沪深AB股和科创板;53=沪深A股和创业板和科创板;63=沪深AB股和创业板和科创板;64=北证A股市场;69=沪深京A股市场;79=沪深京AB股市场;85=沪深京A股和创业板;95=沪深京AB股和创业板;101=沪深京A股和科创板;111=沪深京AB股和科创板;117=沪深京A股和创业板和科创板;127=沪深京AB股和创业板和科创板
ST [是否剔除ST或*ST股] - 0=未剔除、1=剔除。
IsNewOrSuspend [是否剔除当年新上市,已经退市或被暂停上市的公司] - 0=未剔除、1=剔除。
SampleNumber [行业内公司总数] -
CR_4A [CR_4(主营业务收入)] - 行业集中度指标计算公式为:CR_n=[sum(Xi)]/X,指标为计算行业内最大的前n家公司的主营业务收入占全行业主营业务收入的比例。其中,X_i为单个公司的主营业务收入,X为该公司所属行业的主营业务收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_5A [CR_5(主营业务收入)] - 行业集中度指标计算公式为:CR_n=[sum(Xi)]/X,指标为计算行业内最大的前n家公司的主营业务收入占全行业主营业务收入的比例。其中,X_i为单个公司的主营业务收入,X为该公司所属行业的主营业务收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_8A [CR_8(主营业务收入)] - 行业集中度指标计算公式为:CR_n=[sum(Xi)]/X,指标为计算行业内最大的前n家公司的主营业务收入占全行业主营业务收入的比例。其中,X_i为单个公司的主营业务收入,X为该公司所属行业的主营业务收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_10A [CR_10(主营业务收入)] - 行业集中度指标计算公式为:CR_n=[sum(Xi)]/X,指标为计算行业内最大的前n家公司的主营业务收入占全行业主营业务收入的比例。其中,X_i为单个公司的主营业务收入,X为该公司所属行业的主营业务收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_20A [CR_20(主营业务收入)] - 行业集中度指标计算公式为:CR_n=[sum(Xi)]/X,指标为计算行业内最大的前n家公司的主营业务收入占全行业主营业务收入的比例。其中,X_i为单个公司的主营业务收入,X为该公司所属行业的主营业务收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_4B [CR_4(营业收入)] - 指标为计算行业内最大的前n家公司的营业收入占全行业营业收入的比例。其中,X_i为单个公司的营业收入,X为该公司所属行业的营业收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_5B [CR_5(营业收入)] - 指标为计算行业内最大的前n家公司的营业收入占全行业营业收入的比例。其中,X_i为单个公司的营业收入,X为该公司所属行业的营业收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_8B [CR_8(营业收入)] - 指标为计算行业内最大的前n家公司的营业收入占全行业营业收入的比例。其中,X_i为单个公司的营业收入,X为该公司所属行业的营业收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_10B [CR_10(营业收入)] - 指标为计算行业内最大的前n家公司的营业收入占全行业营业收入的比例。其中,X_i为单个公司的营业收入,X为该公司所属行业的营业收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
CR_20B [CR_20(营业收入)] - 指标为计算行业内最大的前n家公司的营业收入占全行业营业收入的比例。其中,X_i为单个公司的营业收入,X为该公司所属行业的营业收入总计。其中,n分别取4,5,8,10,20代入计算(若该行业中公司数目不足,则记为NULL。)。
3.行业勒纳指数表
字段说明:
StockCode [证券代码] - 上交所和深交所上市的证券代码。
ShortName [证券简称] - 上交所和深交所上市的股票简称。
IndustryCode [行业代码] - 2012版证监会行业分类代码。
IndustryName [行业名称] - 2012版证监会行业分类名称。
EndDate [截止日期] - YYYY-MM-DD:统一用10位字符表示,如1999-12-31。
StockLernerIndex [个股勒纳指数] - (营业收入-营业成本-销售费用-管理费用)/营业收入。
IndustryLernerIndex [行业勒纳指数] - 利用单个公司的营业收入与单个行业营业收入的比,对个股勒纳指数进行加权得到;即:单个公司营业收入/行业内营业收入合计*个股勒纳指数累计。
Status [交易状态] - A=正常上市、B=ST、C=PT、D=*ST、T=退市整理期。
(推荐购买)由于很多文献使用的都是自己根据计算公式得来的结果,所以本人根据CS___数据库下载的初始数据和参考文献(顶刊)的计量方式手工用stata计算了结果,此处上传了相关附件。每个手工用stata计算的文件夹都附有初始数据,数据说明,参考文献,并且区分了行业分类。本人有已发表文章(B刊)使用的就是此种方式的计量结果,确保真实可靠。此项数据的数据区间:1990.12.31-2020.12.31
补充内容 (2022-4-27 19:38):
购买附件请移步此帖
https://bbs.pinggu.org/forum.php?mod=viewthread&tid=10994972