这两个都是Stata软件可以轻易解决的
蒙特卡洛虽然知道大概什么原理,但平时用的少,就不乱说了
核密度估计真的很简单
只是种数据局部拟合技术
一般常用的OLS、2SLS、GLS、迭代法之类的,都是全局拟合,即全部样本用于估计一组“平均”参数
而所谓局部拟合,就是对每个样本点,以其一个局部邻域范围的有限样本作估计,作为对这个样本点的估计
举个例子,假设有(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)四个样本点做拟合
OLS的全局拟合时这四个点的信息都囊括在内,估计y=a+bx 的一组参数a和b
但局部估计是这样的,就是先取一个带宽h
h一般是通过交叉核实确定的,基本思路就是对h进行迭代,以让整体残差平方和最小(交叉核实有许多衍生方法,但核心思维接近),将其作为最优带宽使用
h也可以人为指定,不过一般还是用交叉核实
然后分别以(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)四个点为中心,半带宽h/2为半径,划一个空间邻域,利用每个空间邻域内的样本进行估计
比如对(x1,y1),落入h/2范围内的点只有(x1,y1)、(x2,y2),就用这两个样本的信息为基础估计,作为对(x1,y1)点的估计
对(x2,y2),落入h/2范围内的点有(x1,y1)、(x2,y2)、(x3,y3),于是就用这三个样本的信息为基础估计,作为对(x2,y2)点的估计
以此类推
用这种方法估计出来的,直接是每个样本点都有一个对应数值解,然后将其连起来就可以得到一个任意形状的解
由于这种估计不限定函数的具体形式,这也是局部估计的“优势”
核密度估计是局部拟合中最简单的一种
就是半带宽半径的空间局部内,所有样本点取平均值作为估计
不过由于分布假设等问题,并不是直接取算术平均值,而是加权平均值,权重是由“核”决定的(一种特定函数形式的分布函数),“核”种类很多,一般是根据实际需要选择(高斯核用的多些,但这个选取其实是有随意性的)
具体操作和简单概念,您去看看陈强那本《高级计量经济学与Stata》即可
蒙特卡洛法的内涵和操作,里面也有
客观的讲,核密度估计真正的困境是在于你用这种算法得出的那些“任意”解是否真的有经济含义
尤其是局部估计中,带宽范围内可能样本稀疏,估计值很容易会出现大波动
这时你实际上很难去解释
更多只是种数学算法而已
|