楼主: huaijige0
1561 7

[一般统计问题] 关于从微观数据中筛选子样本来进行分析的疑惑 [推广有奖]

  • 1关注
  • 0粉丝

等待验证会员

已卖:4份资源

大专生

55%

还不是VIP/贵宾

-

威望
0
论坛币
4421 个
通用积分
1.5460
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
98 点
帖子
8
精华
0
在线时间
107 小时
注册时间
2017-4-13
最后登录
2024-12-15

楼主
huaijige0 发表于 2022-6-12 01:02:10 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
统计小白,有个疑惑,为什么可以从微观数据库(cgss cfps这样的)筛选符合某些特征的子样本(比如年龄16-34、或者地区是农村的、或者有迁移经历、或者有工作的等等)出来进行各种分析(比如回归等等)。

这些微观数据的抽样设计里,可能并没有这样的分层指标(譬如年龄、譬如工作经历、譬如工作状态),那么按照这样标准筛选出来的样本应该并不具有代表性呀,为什么很多论文都是这样筛选个案来做回归分析呢?

到底哪些指标能够用来筛选子样本,哪些指标不能用作筛选呢?

可能是我哪个地方没搞懂,还望有老师能帮我解惑,非常感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:微观数据 cfps 非常感谢 工作经历 CGSS

沙发
黄曾煜 学生认证  发表于 2022-6-12 02:04:37 来自手机
我也不太懂,同求

藤椅
nieqiang110 学生认证  发表于 2022-6-12 06:29:20
可以对筛选后的样本进行特征分析,看看样本量是否足够大,年龄、性别、学历等变量分布与主要调研样本差异是否显著。在保证样本具有代表性的前提下——有时你需要继续筛选——例如个别省份只有几个样本,就要剔除掉,然后进行分析,并在讨论部分指出这种样本筛选可能带来的影响。

板凳
huaijige0 发表于 2022-6-12 14:12:37
nieqiang110 发表于 2022-6-12 06:29
可以对筛选后的样本进行特征分析,看看样本量是否足够大,年龄、性别、学历等变量分布与主要调研样本差异是 ...
是不是这种事后的分布比较,只能提供部分的支持呀,比如年龄、性别、教育等分布可能很接近,但是感兴趣的变量或者用于筛选子样本的变量,其分布已经不同了?

看好多论文都没有做这样的说明,而是直接就筛了,总感觉是有问题的。

报纸
nieqiang110 学生认证  发表于 2022-6-13 06:32:17
总体的无偏样本无法实现——随机抽样实现,就退而求其次——样本较大,且具有代表性

地板
pangqubing0 学生认证  发表于 2022-6-13 16:14:01
大样本代替总体 也有比较好的估计效果

7
LHFX111 发表于 2023-4-9 21:27:00
补充一点个人猜想,选择样本标准可能也与作者研究目的有关。

8
huaijige0 发表于 2023-5-26 14:15:07
LHFX111 发表于 2023-4-9 21:27
补充一点个人猜想,选择样本标准可能也与作者研究目的有关。
当然是和研究目的相关,但是我想问的是能不能,或者说靠谱不靠谱。

比如cfps对某些省份并没有单独的样本代表性(举例广西),那我就不能用广西的数据单独来做统计推断上的分析,即使我对它感兴趣。

那为什么可以用有没有房、有没有接收过初中教育等等这样的变量来筛选样本呢,抽样的时候并没有对这些变量单独分层。

是他们用错了还是我不太懂统计呢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-11 16:10