统计小白,有个疑惑,为什么可以从微观数据库(cgss cfps这样的)筛选符合某些特征的子样本(比如年龄16-34、或者地区是农村的、或者有迁移经历、或者有工作的等等)出来进行各种分析(比如回归等等)。
这些微观数据的抽样设计里,可能并没有这样的分层指标(譬如年龄、譬如工作经历、譬如工作状态),那么按照这样标准筛选出来的样本应该并不具有代表性呀,为什么很多论文都是这样筛选个案来做回归分析呢?
到底哪些指标能够用来筛选子样本,哪些指标不能用作筛选呢?
可能是我哪个地方没搞懂,还望有老师能帮我解惑,非常感谢。


雷达卡




京公网安备 11010802022788号







