一、OLS回归(常用)
1.计算说明
模型(1) OLS回归计算出的残差取绝对值,用以衡量投资效率,正残差用于衡量投资过度,负残差的绝对值来度量投资不足。所有变量值越小说明投资效率越高。
其中:
INV为新增投资支出,用购建固定资产无形资产和其他长期资产支付的现金-处置固定资产无形资产和其他长期资产收回的现金净额,并除以期初总资产表示
Growth为成长性水平,用主营业务收入增长率表示
Lev为资产负债率,用负债除以总资产表示
Cash为现金持有量,用现金及现金等价物除以总资产表示
Age为企业上市年限,用当年与上市年份差额加1的自然对数表示
Size为企业规模,用总资产的自然对数表示
Return为股票收益率,用考虑现金红利再投资的年个股回报率表示
Industry表示行业虚拟变量
Year表示年度虚拟变量
注:Richardson投资效率模型的两种回归模型(OLS/GMM)下,还都可以有多种变形,具体如下:
1.模型选取变量的不同,是否包括变量Age、Return或ROA/ROE
2.变量度量方式的不同,如Growth还可以用托宾Q值衡量
上述列示的Richardson投资效率模型选取的变量和变量度量方式均是现有文献中最常用的,可以直接使用此模型。
为了方便大家自己修改代码、调整模型,本文整理了近三年来几十篇顶刊,提供了多种替代变量计算所需的初始数据和代码,同时将每种替代变量的度量方式汇总至word文档中并附有参考文献(大多是A/B刊)。
在调整模型时,仅需在代码中将变量进行简单替换,再次运行即可。购买了此项数据的用户,如在调整模型中遇到问题,均可私聊我免费答疑。
提供的替代变量汇总如下:
INV(7种)、Growth(1种,为TobinQ)、Cash(4种)、Age(1种)、ROA(2种)
替代变量计算说明示例:
2.数据说明
样本选择:全部A股2000-2022年数据(初始数据是从1990年开始,回归选择的数据起点为2000年,可自行在代码中更改时间范围)
与大多数文献相同,做了如下的处理:剔除金融行业的样本;剔除当年年末被ST、*ST或PT的上市公司;剔除公司上市之前的样本;剔除已经退市的上市公司样本;剔除有缺失值的公司样本
注:提供了剔除所需数据和剔除代码,若无需做该项剔除处理,自行删除相关代码重新运行即可
行业参照证监会2012年行业分类标准,制造业用二级行业分类(取前两位),其他用一级分类来计算
并对连续型变量进行了1%和99%分位数的缩尾处理
每个压缩包都附有初始数据,计算代码,参考文献和最终数据
3.参考文献
[1]金龙,丁志国,丁垣竹.地缘网络中债务违约会加剧企业投资不足吗?[J].中央财经大学学报,2022(04):50-62+118.
[2]刘贯春,张军,叶永卫.银行贷款及其所有制结构的投资治理效应[J].财贸经济,2022,43(06):64-79.
[3]孙瀛,张士强,廖显春.资源型企业避税对非效率投资的影响机制研究[J].科研管理,2022,43(05):200-208.
[4]夏秀芳,吴卫星,J Daniel Chi.“过度投资”是低效率投资吗?——来自中国上市公司的证据[J].中国软科学,2020(12):117-129.
等压缩包所含文件:
数据样例:
分年份数据量统计:
缩尾后的描述性统计结果(与参考文献基本一致):
二、GMM回归
此外,还对模型方法进行改进,采用GMM方法估计基本投资方程以消除内生性。由于两步法系统GMM估计将水平方程和差分方程结合起来,具有更好的有限样本性质,又不易受到异方差干扰,故最终选用两步法系统GMM估计投资方程。