楼主: vivsun
6923 10

[数据求助] cgss区县地理信息 [推广有奖]

11
赵安豆 发表于 2024-10-17 16:17:19
处理CGSS(中国社会状况综合调查)数据时遇到的问题确实需要细致和耐心。以下是对您提到问题的一些解答:

1. **关于不同年份的调查设计**:
   - CGSS自2003年开始,每两年一次地收集了大量数据。您所说的“03、05、06”年的调查实际上是指CGSS 2003, 2005, 和2006年的数据集。这些早期的调查虽然在设计上可能有一些连续性(比如样本点的选择),但并不意味着是在完全相同的地点进行重复调查。
   - CGSS 2008年之后,确实有较大的设计调整,特别是在样本选择和追踪方面有了改进。

2. **关于代码解码问题**:
   - 对于CGSS早期的数据集(如2003、2005年),区县的编码确实不那么透明。03年的三位数countyid中前两位表示省份信息是正确的,但后一位则涉及具体的区县级单位,其具体对应关系没有公开。
   - 从2010年开始CGSS采用了新的设计和编码体系,其中三位数代码(比如1-135)确实按顺序排列,每年可能都有所变动。这是因为为了保护调查对象的隐私,CGSS采用了随机化处理。

对于您的问题:

**A. 理解是否有误**:您对数据集年份及其设计的理解大体正确,但在“相同地点”的表述上需稍作修正。虽然有追踪样本的设计意图,但具体执行中并不一定是在完全相同的地理点进行重复调查。

**B. 代码对应表求助**:CGSS的区县编码与实际区县名称之间的对应关系由项目组严格保密,特别是在2010年之后的数据集中,出于隐私保护目的,这种信息不会直接提供。因此,找到一个完整的公开的“漏网之鱼”版本的可能性非常小。

**C. 早期数据可能的信息**:确实,CGSS早期(如2003-2008)的数据在编码处理上没有后来那么严格,理论上可能存在一些更具体的位置信息被保留下来。但是,这需要找到当时的具体文档或者通过历史备份数据库中寻找线索。

鉴于隐私保护和数据使用协议,直接提供或获取此类详细信息的尝试可能触及法律边界,请确保您的研究目的符合CGSS的数据使用规定,并尽量寻求官方渠道获得必要的支持与指导。
  
**D. 解决建议**:可以考虑向CGSS项目组(中国社会科学院)发送正式的研究需求申请,说明你的研究背景和目标,请求获取更为详细的地理信息数据。虽然不能保证一定成功,但这是符合程序的正确途径。

希望这些建议能对您的研究有所帮助!

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 15:58