wlingxue 发表于 2024-5-30 20:50
您好,有些模型的拟合系数只有0.2-0.3左右,尤其是在微观数据中,r2确实会出现很小的情况,该怎么处理呢
拟合系数r2偏低在实践中是很常见的情况,不用大惊小怪
这种局面主要看您打算怎么解释
因为拟合只是提取统计趋势,而不是替你找到经济变量的真值
所以有无数种方法改良r2数值
1)在不增加新的解释变量Xi 的情况下
最简单的做法就是更换拟合模型或者拟合算法
比如说当线性拟合OLS效果不好时
您可以更换为其他非线性的模型去拟合,比如抛物线、N型曲线、振荡线等等
Matlab的cftool工具包或者Origin软件里有大量的非线性模型可用
但使用这些复杂的非线性模型时,它们的数学函数形式也会变得更复杂
这时您就要考虑怎么解释才能把这些复杂的数学函数用在您的研究体系里——因为数学函数有无数种,你为什么非要用这个,仅凭拟合系数r2是不行的,很可能有好几种函数形式完全不同的非线性拟合能得到相似的拟合系数r2数值
一般来讲,这时需要您用求解偏微分方程等等方法,从一些基本假设公式开始,进行机械模型推导
把自己所用的拟合模型用理论推导的方式给出来
只要您能推出来,那么基本上是无法被质疑的
只是这要求您要有较强的数学功底
2)第二种办法是在线性拟合的框架内,更换计量经济学方法
用统计检验的方法,找出拟合模型中某些变量潜在的内生性
从而将拟合算法更改为2SLS(两阶段最小二乘法)、GMM这些其他计量方法
即使是相同的数据,更换算法,拟合系数r2也会有所不同(一般都会提升)
3)如果您对模型的函数形式没有强假设
那么更简单的方法是改用核密度回归、局部最小二乘法等等非参数拟合或半参数拟合
线性拟合和非线性拟合在本质上都是参数回归,也就是用全部数据去拟合出特定的参数
非参数拟合或半参数拟合相当于是把全部数据分割为无数的局部区间(由局部区间大小由带宽确定)
在每个局部区间内做独立拟合,给出每个局部的估计值
最后把这些局部估计值全部连起来,就得到一个不规则、但完全捕捉数据趋势的拟合结果
这个做法的缺点是无法得出能用于外推预测的参数模型
但好处是拟合系数r2绝对高的很
4)如果以上都不用,就局限在OLS这类简单线性拟合模型里
那么拟合系数低可以用“遗漏变量”来解释
意思就是说当前用的拟合模型存在尚未捕捉到的其他解释变量
这时如果您只是想提升拟合系数的话
可以胡乱加入一些似是而非的解释变量,做一些统计检验(比如多重共线性、平稳性和协整性),只要通过检验了就都加进去,做更多变量的多元线性回归(或者时间序列、面板)
基本上拟合系数r2都能提升
总之,r2数值本身其实是很容易被改善的,方法很多
所以提升r2数值结果一般不是重点
重点是在于您如何给自己选用的方法自圆其说,以说服审稿人