楼主: somewhere379
91905 33

[回归分析求助] 选择性偏误(selection bias)与样本选择偏差(sample self-selction)一样吗   [推广有奖]

  • 7关注
  • 1粉丝

教授

15%

还不是VIP/贵宾

-

威望
0
论坛币
1259 个
通用积分
18.5349
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
33809 点
帖子
447
精华
0
在线时间
747 小时
注册时间
2011-11-26
最后登录
2025-12-26

楼主
somewhere379 在职认证  发表于 2015-7-29 01:32:21 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
RT,注意到某帖下的回答:
http://www.stata.com/support/faqs/statistics/endogeneity-versus-sample-selection-bias/
值得注意的是,"选择性偏误(selection bias)"与"样本选择偏误/自选择(sample selection bias/self selection)"不一样,前者指的是"内生性"。

一般样本选择偏误用heckman解决,但选择性偏误导致内生性如何理解?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Selection Election Sample Select Elect 选择性 样本

回帖推荐

狮子坟沉淀 发表于9楼  查看完整内容

两个问题还是有所区别的 举两个例子: 样本选择:如果想研究哪些因素会影响人们对健身房的需求,研究者选择在健身房门口蹲点,对走进来的人进行问卷调查。那么,通过这种方式获取的数据就会具有样本选择问题,因为在健身房门口采访到的都是来健身房的人,那些对健身房没有需求的样本信息,可能都没有被收集到,从而导致估计是有偏的。一般而言,样本选择问题需要使用hecman两步法。 自选择偏误:一般出现在政策或项目评估领域 ...

沙发
夏目贵志 发表于 2015-7-29 03:02:09
值得注意的是,"选择性偏误(selection bias)"与"样本选择偏误/自选择(sample selection bias/self selection)"不一样,前者指的是"内生性"。
我不认为你这句话是对的。selection bias和sample selection bias一个意思。。。如果不是关于sample,难道selection bias还是关于别的什么的么?至于self-selection,它可能造成selection bias,得看具体情况。
而且,你说的那个FAQ就是在告诉大家selection bias和endogeneity不是一个东西。前者关于sample,什么能observe什么不能。后者仅仅是指违反ols的假定。两个问题既可以单独出现,也可以同时出现在同一个模型里。

藤椅
somewhere379 在职认证  发表于 2015-7-29 12:44:15
夏目贵志 发表于 2015-7-29 03:02
我不认为你这句话是对的。selection bias和sample selection bias一个意思。。。如果不是关于sample,难道 ...
谢谢~~~了解了~~

板凳
somewhere379 在职认证  发表于 2015-7-29 12:52:49
夏目贵志 发表于 2015-7-29 03:02
我不认为你这句话是对的。selection bias和sample selection bias一个意思。。。如果不是关于sample,难道 ...
只是有时候,一些文章里提出是“自选择”问题,用heckman的方法解决,但在表述时又更像是一个内生性问题,更像遗漏变量。所以看起来好像是“自选择”导致了内生性问题,实际应该表达了两层意思。
在我看来,导致内生主要就是三个来源:测量误差,遗漏变量,和互为因果。自选择(样本选择偏差)本身是另一个研究问题,但往往会造成遗漏变量,所以会误让人以为自选择是造成内生的主要原因之一。

如研究是否加入工会对工资的影响:
自选择的角度:侧重认为是否加入工会的样本不是random的,(可能有一些个人特征?很有可能是能力)
内生性的角度:侧重认为存在可能的遗漏变量能力,既可能影响是否加入工会(自变量),也会影响工资水平。

在这个问题里,应该是同时存在了自选择和内生两个问题的。
不知道您是否有现成的只存在自选择问题的文章,希望能够拜读~

报纸
夏目贵志 发表于 2015-7-29 22:42:40
somewhere379 发表于 2015-7-29 12:52
只是有时候,一些文章里提出是“自选择”问题,用heckman的方法解决,但在表述时又更像是一个内生性问题, ...
遗漏了一个可观测的变量和无法观测到一个变量是不一样的两个问题。我不认为这两个问题可以混在一起讨论。工会的例子就是这样。“遗漏”的前提得是变量存在。如果你要的变量根本不存在,就不要说遗漏不遗漏什么的了。从这个角度上说,sample selection是无法用加入新变量解决的。而遗漏变量则可以。

测量误差其实也是很扯的。经济领域里,谁敢说有完全没有误差的数据?所谓的误差是否随机也是完全的猜测罢了。不知道就是不知道。推断不等于知道。

互为因果的问题理论上是可以通过联立方程解决的,所以并不算是个问题。

总之就是内生性方面的东西是很扯的啦。理论上讨论可以,实际中还不是rain fall搞定。。。

不要在这个问题上纠缠了。
已有 1 人评分学术水平 收起 理由
很大的小 + 5 精彩帖子

总评分: 学术水平 + 5   查看全部评分

地板
migonglong 发表于 2016-12-11 10:20:38
somewhere379 发表于 2015-7-29 12:52
只是有时候,一些文章里提出是“自选择”问题,用heckman的方法解决,但在表述时又更像是一个内生性问题, ...
答主解释的很清楚,受教了~

7
w财经w 学生认证  发表于 2017-7-26 16:35:12
受教了,不错的东西

8
华农晨曦123 学生认证  发表于 2017-11-9 19:28:09
somewhere379 发表于 2015-7-29 12:52
只是有时候,一些文章里提出是“自选择”问题,用heckman的方法解决,但在表述时又更像是一个内生性问题, ...
解释的非常清楚……不过自选择问题还可以用倾向得分匹配(PSM)和处理效应模型(TEM)来处理。实际上,heckman解决的问题好像跟PSM、TEM不同……

9
狮子坟沉淀 发表于 2018-3-12 10:46:37
两个问题还是有所区别的
举两个例子:
样本选择:如果想研究哪些因素会影响人们对健身房的需求,研究者选择在健身房门口蹲点,对走进来的人进行问卷调查。那么,通过这种方式获取的数据就会具有样本选择问题,因为在健身房门口采访到的都是来健身房的人,那些对健身房没有需求的样本信息,可能都没有被收集到,从而导致估计是有偏的。一般而言,样本选择问题需要使用hecman两步法。

自选择偏误:一般出现在政策或项目评估领域。再举个例子:我们希望研究某个就业培训项目是否有效,于是将参与过培训项目和没参与过项目的人进行比较。结果很可能发现,没参与过就业培训的人找到工作的概率更大。这是否意味着培训项目无效呢?不一定!因为在这里比较的两类人在自身特质方面可能存在很大差异,没参与就业培训的可能本身能力比较强,而参与培训的恰恰是那些能力不够,找不到工作的个体,也就是说在是否进入这个培训项目的问题上存在样本的自选择。因而,要精确评估这个项目的效果,从逻辑上来讲,需要评判同一个人参与培训与没有参与培训之间收益的差(反事实分析),当然这个在操作上无法实现。取而代之的做法是:寻找一群在培训前条件相当,能力相当,各种背景都相当的个体,唯一的区别是一部分参加了培训,另一部分没参加培训。比较这两部分人的收益差,从而得到政策的效果。因而在存在自选择问题时,一般使用PSM和DID等方法。

样本选择中,个体差异在于是否有机会进入到观测样本,那些没有进入样本的个体,其y是观测不到的;而在自选择偏误中,个体的差异在于是否得到处理,并且这种差异是个体自选择形成的,而不论是否得到处理,其y都是可观测的。


已有 23 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
lxf02227 + 5 + 2 + 2 + 2 精彩帖子
lucky_day + 1 精彩帖子
crystal8832 + 10 + 10 + 2 + 2 + 2 精彩帖子
Eosyyy + 1 + 1 + 1 精彩帖子
田子啊 + 1 + 1 + 1 精彩帖子
HyoukaX + 1 + 1 + 1 精彩帖子
rainkira + 1 + 1 + 1 精彩帖子
gjy0707 + 5 + 1 + 1 + 1 精彩帖子
O.T.R + 1 + 1 + 1 精彩帖子
stkbg + 1 精彩帖子

总评分: 经验 + 10  论坛币 + 28  学术水平 + 23  热心指数 + 24  信用等级 + 21   查看全部评分

10
闪了电 发表于 2018-3-31 20:24:56
狮子坟沉淀 发表于 2018-3-12 10:46
两个问题还是有所区别的
举两个例子:
样本选择:如果想研究哪些因素会影响人们对健身房的需求,研究者选 ...
很有道理

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 12:13