|
窃以为,关于参数、非参数和半参数这几个概念之间的区别的争论确实比较多,但LZ在一楼所说的问题并不是文献里争论的关键,LZ的说法并没有切中要害。
针对一楼的定义A,其实这个定义是比较明晰的。“分布类型”这个词一般我们认为都是指某种明确的分布函数形式,定义中所说的“分布的类型已知”,意思是说分布函数的形式已经确定了,比如是正态分布、卡方分布等,未知的是正态分布的均值、方差这些参数。其实这个定义跟LZ说的薛留根老师的说法是一致的,当分布族的函数形式已知、只剩下有限个参数需要我们去推断的时候,这个模型是参数模型。对于这个定义,关键是理解”类型”一词的确切所指;当然,你硬要把类似于“所有厚尾分布”这种没有一个统一函数形式来刻画的分布族也当作一个“分布类型”来抬杠,我也没有办法。
针对定义B,我只能说“啧啧”。。不忍直视。。我只从这个定义中看到敷衍的态度。
至于吴老师和薛老师的两种说法,我认为两者并没有矛盾。一个统计学问题,一般有两部分组成:一部分是我们已经知道什么,一部分是我们想知道什么。前一部分,即所有可能的分布族构成一个集合,被称作一个模型;后一部分就是我们需要估计的目标参数。窃以为,参数、非参数、半参数,只跟前一部分,即这个问题的模型有关,而与后者无关,即当模型是有限维时(即只剩下有限个参数未被确定)定义为参数模型,当对模型一无所知时为非参,当具有关于模型的信息但还不足以用有限个参数来刻画模型时定义为半参。三种模型的区别本质上是几何的,对目标参数的切空间具有本质影响。这种定义方式是Efficient and adaptive estimation for semiparametric models (Bickel, Klassen, Ritov, and Wellner, 1998)一书中第一页上的说法,也是窃以为比较清晰又方便研究的分类方法。
然而文献中还有其他说法,这些说法和上述Bicek的说法的区别在于他们的定义既考虑模型的性质,也考虑目标参数的性质;或者说他们的“模型”定义和上述定义不同,认为一个“模型”是Bicke et al (1998)一书中l说的“模型”和目标参数的组合,所以他们考虑参数、非参、半参的分类时,同时考虑“我们已经知道什么”和“我们想知道什么”。这些定义的例子有Begun et al.(1983), Xiaohong Chen(2007, Handbook of econometrics,Chapter 76, p.5552的脚注),James Powell(1994, Chapter 41,Handbook of Econometrics, p.2449)。
然而,窃以为,三者的分类方法和估计方法没有联系,这一点是可以确定的,也即吴老师的观点。统计问题和统计方法是两个概念,方法无所谓参数不参数的。所以吴老师和薛老师的观点也是没有矛盾的,因为他们在谈论不同的事情。
|