楼主: ldh921122
5119 12

求教:我想用一个二元选择模型 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

99%

还不是VIP/贵宾

-

威望
0
论坛币
2491 个
通用积分
0
学术水平
4 点
热心指数
0 点
信用等级
0 点
经验
2328 点
帖子
141
精华
0
在线时间
84 小时
注册时间
2006-4-20
最后登录
2024-9-17

楼主
ldh921122 发表于 2007-6-4 22:29:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

我想用一个二元选择模型(即函数为虚拟变量10)进行分析,说明变量数为45个,

但样本数仅20个。是不是样本太小,不能用啊。请大侠帮助,谢谢先!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:选择模型 虚拟变量 不能用 样本数 模型 选择 求教

回帖推荐

xwmhwj 发表于3楼  查看完整内容

个人觉得20个是非常非常少的。以Probit为例,典型的例子就是对选举行为的调查回归,现在假想你只随机抽取了20个人做样本进行Probit回归,那么你觉得能用这个模型来对这20个人之外的数万数亿人的的选举倾向(概率)作出判断吗?显然得出的结果(各人的选举倾向)将很不可靠,更何况你的说明变量还有4-5个,要我做,怎么说也得有5*1000=5000的样本量才能对事情有个清楚的交代...呵呵 个人看法,欢迎大家拍砖...(样本大小是个度的问题 ...

本帖被以下文库推荐

沙发
冷血九段 发表于 2007-6-4 22:41:00
这也太少了吧。样本20个,变量都5个了
人生上半场22年,拒人3次,被拒2次,目前3:2领先……

藤椅
xwmhwj 发表于 2007-6-4 23:00:00
个人觉得20个是非常非常少的。以Probit为例,典型的例子就是对选举行为的调查回归,现在假想你只随机抽取了20个人做样本进行Probit回归,那么你觉得能用这个模型来对这20个人之外的数万数亿人的的选举倾向(概率)作出判断吗?显然得出的结果(各人的选举倾向)将很不可靠,更何况你的说明变量还有4-5个,要我做,怎么说也得有5*1000=5000的样本量才能对事情有个清楚的交代...呵呵 个人看法,欢迎大家拍砖...(样本大小是个度的问题,不知道有没有针对这类模型的“度”的科学标准?)
已有 1 人评分经验 论坛币 收起 理由
胖胖小龟宝 + 10 + 10 热心帮助其他会员

总评分: 经验 + 10  论坛币 + 10   查看全部评分

板凳
young_fan 发表于 2007-6-5 04:33:00
no way, probit and logit demand for assympototic approach which is valid only when sample size is large. you even can not use finite sample adjustment with 20 observations.
天助自助者 God helps those who help themselves

报纸
ldh921122 发表于 2007-6-5 11:24:00
谢谢楼上各位!!!

地板
lili 发表于 2007-6-5 11:34:00
感觉样本太少,也不利于进行残差分析咯!呵呵!

7
ldh921122 发表于 2007-6-6 09:29:00

“求教:我想用一个二元选择模型”的再求教!

我想用一个二元选择模型(即函数为虚拟变量1或0)分析人口数量 、 GDP等4至5个自变量各自对一个政策(即函数)的采用与否的影响程度(概率的高低)。因为观察对象只有20个(各位学长在网上都赐教道这样的话样本太少了),考虑了半天,为增加sample size,不知以下的方法是否可行:因该政策是1991年采用的,所以取1981年-1990年的10年区间,对于1991年采用了该政策的观察对象,1981年-1990年间每年的函数均取值1,而对于未采用该政策的观察对象,1981年-2000年间每年的函数均取值为0;这样的话,sample size将为20*10=200个了。

但这样的数据好像成为面板数据(Panel date)了,能把它视为横截面数据进行二元选择模型处理吗?再次请求诸位学长的赐教,谢谢,谢谢!

[此贴子已经被作者于2007-6-6 11:21:00编辑过]

8
bingobingo 在职认证  发表于 2007-6-6 09:48:00
还有时间上的效应影响……

9
xwmhwj 发表于 2007-6-6 22:30:00
我觉得“视为横截面数据进行二元选择模型处理”不大合适,因为1980年的100块GDP和1991年的100块GDP购买力差很多,所以对政策执行的影响力度也差很多,所以我的建议是至少将GDP按一定的基数调成相同的基准在进行拟合,但其中的可靠性并不清楚,因为正如你说的,上面是PANEL DATA,它能不能“转”以及如何“转”成横截面数据相关的理论,对小生而言都是盲点,故无法继续解答。

[此贴子已经被作者于2007-6-7 10:35:29编辑过]

10
ldh921122 发表于 2007-6-7 22:52:00

谢谢各位的赐教!

我想可能没把我的意思表达清楚。情况是这样:

我现在的观察对象为20个,其中10个为此政策的采用者(91年采用),其他

10个为非采用者。我想分析人均GDP等3个自变量对该政策采用与否的影响程度,即,

Y(虚拟变量1或0)=c+a*X1+b*X2+d*X3 (X1,X2,X3分别为3个自变量)。

原本考虑X1,X2,X3取1990年的值,这样观察对象为20,sample size也为20个,太少。

为了扩大sample size,所以每个观察对象都取81-90年的10个点的值,这样每个观察对象sample size

就为10个,总的sample size就为20*10=200个了。这样话,可以适用

Y(虚拟变量1或0)=c+a*X1+b*X2+d*X3 的回归分析吗?

再请不吝赐教!谢谢谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 02:53