楼主: peyzf
11884 9

[其他] 克服样本自选择有哪些方法 [推广有奖]

  • 1关注
  • 63粉丝

警督

大师

59%

还不是VIP/贵宾

-

威望
2
论坛币
566735 个
通用积分
200.4746
学术水平
218 点
热心指数
240 点
信用等级
140 点
经验
132065 点
帖子
12769
精华
0
在线时间
2976 小时
注册时间
2007-9-8
最后登录
2025-10-10

楼主
peyzf 发表于 2010-1-2 21:13:13 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
读到一些外资技术外溢的实证研究。发现有些文章经常不注意样本自选择问题(self-selection,即很可能外资会选择一些生产力比较高的企业或产业,而不是论文中所发现的技术溢出。要克服这样效应主要有哪些方法?我知道联立方程组是一个,但它其实是一种工具变量方法,而工具变量的寻找具有一定的困难。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Selection Election Select Elect 联立方程组 方程组 生产力 文章 样本 技术

回帖推荐

talentyxc 发表于7楼  查看完整内容

想了一下,还可以用treatment model,在stata里就是treatreg,模型是 C*_i=mu+u_i (1) C_i=1 if C*_i>=0 else C_i=0 (2) Y_i=C_i*b+e_i (3) corr(u_i,e_i)=rho 它的含义就是说,有某种未知的影响Y_i的因素也会影响到C*_i,外在表现就是生产力会影响外商的行业选择。但这个模型要求残差分布为正态,而且个人认为如果没有其他外生变量,这个模型之所以能估算出结果也只是因为(1)的非线性设定和(3)的线性设定刚好可以把它们 ...

talentyxc 发表于5楼  查看完整内容

只能找工具变量,因为lz你的问题是双向的,模型就相当于: C*_i=Y_i*b1+u_i (1) C_i=1 if C*_i>=0 else C_i=0 (2) Y_i=C_i*b2+e_i=I(C*_i>=0)*b2+e_i (3) 其中C*_i是外商进行选择的效用函数,大于等于0则选择该行业,C_i是选择与否的dummy变量,Y是生产力,(1)和(3)是两个完全不同经济含义的式子,但如果没有其他外生变量帮助identify,如何能确定估计的式子是(1)还是(3)?从现实角度来理解,外商选择和行业生产力变高,如 ...

本帖被以下文库推荐

沙发
金黄 发表于 2010-1-2 21:50:52
Hechman两阶段法

藤椅
qiuygyy 发表于 2010-1-2 23:32:46
Hechman两阶段法

板凳
peyzf 发表于 2010-1-3 17:55:49
样本自选择问题(self-selection),可能我的翻译的点偏差。heckman好像不是针对这种情形的。即解释变量与被解释变量可能存在双向因果关系。

报纸
talentyxc 发表于 2010-1-3 19:28:33
只能找工具变量,因为lz你的问题是双向的,模型就相当于:
C*_i=Y_i*b1+u_i   (1)
C_i=1 if  C*_i>=0 else C_i=0   (2)
Y_i=C_i*b2+e_i=I(C*_i>=0)*b2+e_i  (3)
其中C*_i是外商进行选择的效用函数,大于等于0则选择该行业,C_i是选择与否的dummy变量,Y是生产力,(1)和(3)是两个完全不同经济含义的式子,但如果没有其他外生变量帮助identify,如何能确定估计的式子是(1)还是(3)?从现实角度来理解,外商选择和行业生产力变高,如果把它们看做横截面数据同时发生,是无法区分是a引起b或者是b引起a的,解决方法只有两个,第一,引入其他外生变量,比如一些会引起生产力变化但不会引起外商选择变化的变量;第二,引入时间。

地板
gwl11818 在职认证  发表于 2010-1-3 22:28:03
一般好像理解为内生性。

7
talentyxc 发表于 2010-1-3 23:04:32
想了一下,还可以用treatment model,在stata里就是treatreg,模型是
C*_i=mu+u_i   (1)
C_i=1 if  C*_i>=0 else C_i=0   (2)
Y_i=C_i*b+e_i  (3)
corr(u_i,e_i)=rho
它的含义就是说,有某种未知的影响Y_i的因素也会影响到C*_i,外在表现就是生产力会影响外商的行业选择。但这个模型要求残差分布为正态,而且个人认为如果没有其他外生变量,这个模型之所以能估算出结果也只是因为(1)的非线性设定和(3)的线性设定刚好可以把它们区分开来,换个角度说,我随意对(1)的设定换个形式,只要不是线性的,总能得到结果。所以这种方法有很强的主观性,不推荐。

8
ruclaolan 发表于 2010-1-4 12:22:34
讲的挺有意思
laolan

9
peyzf 发表于 2010-1-4 19:07:11
谢谢。学习中。

10
大锤砸砸砸 发表于 2020-2-14 16:36:55
感觉有用

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 06:32