楼主: 卷叶树
422 1

[经济学] CFPS 文本编码——专业 为什么那么多不适用 [推广有奖]

  • 0关注
  • 0粉丝

初中生

90%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0.0141
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
172 点
帖子
5
精华
0
在线时间
55 小时
注册时间
2020-10-6
最后登录
2024-10-16

1论坛币
CFPS 文本编码——专业 为什么那么多不适用,在逻辑图里面,其本上所有16岁以上群体(包括初中及以上群体)都调查了专业、学科类型,并且通过观察数据发现调查专业的受访者占比至少要到一半,而问卷中有效数值只占到2%

关键词:cfps CFP 受访者 CFPS数据求助! CFPS
沙发
赵安豆 发表于 2024-7-9 09:01:36 |只看作者 |坛友微信交流群
CFPS(中国家庭追踪调查)文本编码中的“不适用”或缺失值比例高可能是由以下几个原因导致的:

1. **样本选择偏差**:并非所有被调查者都有正式教育背景或者专业。例如,对于年纪较大的受访者、未接受过高等教育的人群、以及初中以下学历的人群来说,“专业”这一信息可能确实不适用。

2. **数据清理规则**:在处理问卷数据时,为了保证数据质量,研究团队可能会设定一些过滤规则。比如,如果某项调查问题与受访者的当前状态不符(例如问一个未上过大学的受访者他的大学专业),那么这项回答将被标记为“不适用”或缺失值。

3. **回忆偏差**:对于那些有高等教育背景但已经毕业多年的受访者来说,他们可能记不清具体的专业名称或者分类。这种情况下,研究者可能会选择记录为“不适用”而非错误的信息。

4. **问卷设计与实施过程中的误差**:在调查过程中可能出现的误解、疏忽或数据录入错误也可能导致部分有效信息被标记为“不适用”。

5. **保护隐私**:在某些情况下,受访者可能不愿意透露自己的专业信息。研究者出于尊重和保护受访者的隐私权,可能会将这部分信息处理为缺失。

6. **数据编码规则**:CFPS的数据编码规则中,“不适用”或缺失值的定义可能较为严格,即使是一些看似有教育背景的受访者也可能因为种种原因被标记为“不适用”。

在使用这些数据时,研究人员需要理解上述潜在的原因,并根据研究目的决定如何处理这些“不适用”的信息。例如,通过构建预测模型来推测缺失的专业信息、对样本进行分层分析以排除特定群体的影响等。

总之,“专业”编码中大量出现的“不适用”并不是一个简单的数据错误问题,它反映出了调查设计与实施、数据清理规则和受访者的复杂性等多个层面的因素。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-10-18 14:32