楼主: 绵阳
69778 162

[学术治理与讨论] 讨论主题内容:实证论文中的常见问题   [推广有奖]

131
mosuchen 在职认证  发表于 2013-9-2 12:20:33
收获很大

132
wobushita 发表于 2013-9-15 08:11:47
我个人的体会是:在实证研究中数据非常重要,当然不否认论文研究的主题是首要的。
往往收集到的数据跑回归的结果还真是未必是自己想要的结果,这个时候有两种办法:一直是再继续收集更多的样本(如果还能收集到的话);另一种就是修改数据,改到自己想要的结果。实际上很多时候我看到了很多人都是首选后一种。即使是经济学方面的统计年鉴数据,很多人也是这么改,不知道是否是国情。
看了很多老外的文献,发现人家的论文确实相比国内来说写的好,问题研究得也很有意义和深度。
可爱可爱就是可爱啦~~~~

133
潴者 发表于 2013-10-1 17:24:15
严重同意楼主啊,实证的出现没有坏处,但我们不能为了实证而实证,那就没有必要了!

134
潴者 发表于 2013-10-1 17:24:46
严重同意楼主啊,实证的出现没有坏处,但我们不能为了实证而实证,那就没有必要了!

135
淘宝网橙迷橙橙 发表于 2013-10-8 19:52:56
总体说来,经济学和管理学中的所谓实证研究不过是在盲人摸象。
真相永不可知,而实证研究就是在黑暗中摸索。你摸的方向正确(理论模型站得住脚,变量间的联系有比较坚实的理论逻辑和前人研究做基础),方法得当(变量测量有效、数据真实、模型参数的估计与检验恰当),而且说的故事比较有趣,重要的是你在论文中说服了其他人相信你摸到的就是“象”,你的论文就能发表。至于到底是不是“象”,只有上帝知道。因为就是在完全控制的随机化实验条件下,你还是有一定的几率犯弃真错误和纳伪错误。
所谓尽人力而听天命,就是如此。在现有的条件下,你已经尽力了!因为就你写的论文而言,你比其他人更有可能摸到真实的“象”。
说起来,实证研究中处处都是陷阱,你可能随时跳入一个陷阱,导致你的研究结论错误。比如说模型设定错误、变量的选择、界定和测量、样本的随机化(即返回了一个特定而不具代表性的样本,这个在调查数据中非常普遍)、数据的真实性、估计和检验方法错误,等等。因此,一项令人信服的研究,需要在一些技术细节上反复打磨,才可能得到一个令人信服的结果。
最后总结,为什么经济学这么强调方法?管理学次之?而心理学和医学又次之?你去看心理和医学统计的书,都是一些很简单的东西,方差分析、多元回归、因子分析、聚类分析等占了多半篇幅,软件spss基本搞定,稍微复杂一点的也就是多层模型和结构方程模型。为什么?因为人家搜集的数据,基本上在实验范围内,自己可控,基本上可以实现“在其他条件不变的情况下,考察干涉变量对结果变量的影响”;而管理学大多通过问卷调查来搜集数据,在样本选择上也有一定的可控性,可以在一定程度上修正样本,因此用到的基本上也是多元数据分析的东西。唯有经济学,尤其是宏观数据,对于整个数据搜集过程,完全被动,只能被动的去观测发生的现象,而对于现象发生的机理,完全是黑箱(当然,可以通过理论臆测),这种情况下,你怎么能说解释变量就一定是那个解释变量呢?你计量出来显著的东西,也许在混杂因素的干扰下,本来就不该显著;你计量出来不显著的东西,也许其效应被混杂因素盖住了。在众多因素的影响纠缠不清的情况下(即误差项与解释变量关联),你真的是无法隔离出解释变量的“干净效应”。众多方法,如工具变量等,只能是缓解,无法完全弥除。想到这,头都要大了。

136
淼烯 发表于 2013-10-8 20:08:00
现在每篇论文都要用实证分析真的有意义吗

137
淘宝网橙迷橙橙 发表于 2013-10-8 21:20:14
qq1020023370 发表于 2013-6-11 16:58
我想问下那经典线性回归模型中假定X值是固定的怎么理解呢?希望高人知道。。。。
因为你估计的是Y的条件均值。Y的条件均值只有在相同条件下,通过固定X,重复试验或抽样,才能估计出来,同时还可估计Y的条件方差。
这么说吧,你希望通过一个人的身高(h)来预测他的体重(w)。假如你知道一个人的身高是1.7m,让你去预测他的体重。假如总体中所有身高1.7m的人一共有10000人,这10000人的平均身高是68kg。一般来说,这10000人的身高分布会近似正态分布,所以其平均值的发生概率是最高的。因此在给出条件信息(h=1.7m)的情况下,你会用子样本(身高等于1.7m的10000人)的平均值68kg来做预测。
如果还不清楚,简而言之,当有人问你一个人身高为1.7m时,他的体重是多少?你会回答说是68kg。但是当你实际抽一个身高1.7m的人来观测其身高时,他可能是63,也可能是74,不一而足。与预测值68不一致的部分,在回归模型中,统统归入误差项。但是,平均来看,他可能低于68,也可能高于68,但一定是以68为中心。所以,误差项的均值必须为零。
如果给出身高为1.75m的条件信息,预测机理同上。其他,1.6m、1.8m也一样。这里设定h为离散的,是为了说明问题的方便。事实上,h是连续的,要完全找到n个身高准确等于1.7m的子样本也是不可能的。不要纠缠这些假设,这一切都是为了说明问题的方便。
现在,问题来了,你不断给出h的条件信息,然后去找身高等于h的子样本,再来计算w的条件均值(这里假设你拥有总体样本值),然后把这些条件均值点连线,你怎么就能保证它是一条直线(即所谓线性性)?它不太可能是一条直线,但是必须做这个假设,否则给后面的参数估计增加难度,很有可能估计不出来。所以,接受之,不要过多纠缠。
现在回到你的问题,为什么假定x值固定?所谓x值固定,说的就是我上面的意思。简而言之,先给出x值,然后去观察y的值,如你所想,这个时候,y忽高忽低,他不是确定的,它是一个条件随机变量。在重复测量的情况下,我们可以根据X=x的子样本来估计这个条件均值。现在的问题是,我们得到的数据,往往是总体数据的一个随机呈现。比如说我们刚好得到了一个身高等于1.69m的人的体重数据,而最接近的样本观测可能是1.71m,不一而足,样本中每一个特定身高值的人基本上都只有一个测量,而且样本值中间有断点。那么,要根据这些断断续续的样本来估计在每一点x值下的y的条件均值,那是相当的困难!简而言之,给你的是相当不完全的x的条件信息,而现在要你估计的是总体中的y的整条基于x的条件均值曲线,要是不做出一些假定,你还真搞不定。这就是那些经典OLS假定的由来,不再赘述。
再说一点,就观测数据而言,你肯定无法做到先设定x,然后去反复观测y。比如说,你想知道某省的大学生比例提高一个百分点,其gdp是否也会随之增长?你能做到让100个相同情况的省提高同等程度的大学生比例,然后去观测这100个省gdp的增长情况吗?绝对不可能。就如以上的身高与体重的例子,h与w在现实中都是总体数据的随机呈现,不存在一个固定一个随机的问题。之所以假定x固定,纯粹是为了便于理解ols,不具现实意义。

138
shirley923 发表于 2013-10-13 18:00:22

139
hxck 发表于 2013-10-29 14:17:02
感谢赐教。

140
三沙市新居民 发表于 2013-10-29 19:34:28
路过
用理性指导前方,用长度丈量成就,用高度审视人生。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注ddjd
拉您入交流群
GMT+8, 2025-12-29 12:50