[经济学] CFPS 文本编码——专业为什么那么多不适用 [推广有奖]

0关注
0粉丝

初中生

90%

还不是VIP/贵宾

威望: 0 级
论坛币: 10 个
通用积分: 0.0141
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 172 点
帖子: 5
精华: 0
在线时间: 55 小时
注册时间: 2020-10-6
最后登录: 2024-10-16

楼主

卷叶树 发表于 2024-7-8 18:57:23 |只看作者 |坛友微信交流群|倒序 |AI写论文

1论坛币

CFPS 文本编码——专业为什么那么多不适用，在逻辑图里面，其本上所有16岁以上群体（包括初中及以上群体）都调查了专业、学科类型，并且通过观察数据发现调查专业的受访者占比至少要到一半，而问卷中有效数值只占到2%

分享0 收藏0 回帖

关键词：cfps CFP 受访者 CFPS数据求助！ CFPS

使用道具举报

沙发

赵安豆 发表于 2024-7-9 09:01:36 |只看作者 |坛友微信交流群

CFPS（中国家庭追踪调查）文本编码中的“不适用”或缺失值比例高可能是由以下几个原因导致的：

1. **样本选择偏差**：并非所有被调查者都有正式教育背景或者专业。例如，对于年纪较大的受访者、未接受过高等教育的人群、以及初中以下学历的人群来说，“专业”这一信息可能确实不适用。

2. **数据清理规则**：在处理问卷数据时，为了保证数据质量，研究团队可能会设定一些过滤规则。比如，如果某项调查问题与受访者的当前状态不符（例如问一个未上过大学的受访者他的大学专业），那么这项回答将被标记为“不适用”或缺失值。

3. **回忆偏差**：对于那些有高等教育背景但已经毕业多年的受访者来说，他们可能记不清具体的专业名称或者分类。这种情况下，研究者可能会选择记录为“不适用”而非错误的信息。

4. **问卷设计与实施过程中的误差**：在调查过程中可能出现的误解、疏忽或数据录入错误也可能导致部分有效信息被标记为“不适用”。

5. **保护隐私**：在某些情况下，受访者可能不愿意透露自己的专业信息。研究者出于尊重和保护受访者的隐私权，可能会将这部分信息处理为缺失。

6. **数据编码规则**：CFPS的数据编码规则中，“不适用”或缺失值的定义可能较为严格，即使是一些看似有教育背景的受访者也可能因为种种原因被标记为“不适用”。

在使用这些数据时，研究人员需要理解上述潜在的原因，并根据研究目的决定如何处理这些“不适用”的信息。例如，通过构建预测模型来推测缺失的专业信息、对样本进行分层分析以排除特定群体的影响等。

总之，“专业”编码中大量出现的“不适用”并不是一个简单的数据错误问题，它反映出了调查设计与实施、数据清理规则和受访者的复杂性等多个层面的因素。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用