如何获取研究数据?获取数据之前要做好哪些准备?
❤ 研究开展前需要做哪些知识储备,除了要仔细阅读与课题主题相似的论文,学习已有文章的研究过程和方法,还要有意识地拓宽知识面,与研究课题有关的知识点都要了解,甚至熟练掌握。为什么我们反复强调这一点?是因为只有深入地学习和了解一个领域,我们做出来的研究才能具备较好的科学性和实用性。
❤ 举个例子,想研究“国家推行的癌症筛查项目是否降低了我国人群的癌症死亡率”,直觉告诉我们,对筛查人群和与之可比的未筛查人群进行若干年的随访,比较其死亡率即可。
❤ 但是,当你查阅大量文献之后,就会发现,很多研究把目标人群限定为高危人群,因为相比于低风险人群,对高危人群进行筛查的效果会更明显。
❤ 再继续阅读文献,你会发现高危人群的界定受多个因素影响,比如年龄、癌症家族史,还有很多我们之前并不了解的因素。
❤ 那么我们就要调整研究思路了:首先要全面了解危险因素,根据年龄、家族史等危险因素判断是否属于高危人群,然后在高危人群中开展筛查,再寻找与之可比的未筛查人群,随访。
❤ 可以看出,这是个认知不断完善的过程,也是研究设计更加完善的过程。
❤ 当以上这些步骤都做得差不多了,我们就要正式开始实施这项研究,让脑海中的设想落地。具体来讲,就是要收集数据了。❤ 如何收集数据呢?
1.重温你的研究目标
2.明确为实现研究目标,必须获取什么样的数据,包括数据所针对的人群、覆盖的时间限制有哪些?需要哪些变量?需要连续随访的数据还是横截面数据就可以?
3.寻找已有的数据库中是否符合或接近你的需求,也可以整合多个数据库中的资源来完成你的研究。
❤ 比如健康领域常用的公开数据库有北京大学主持的中国家庭追踪调查(China Family Panel Studies,CFPS),中国健康与养老追踪调查(China Health and Retirement Longitudinal Study, CHARLS),中国老年健康与家庭幸福调查(CLHLS-HF)等,大家可登陆北京大学开放研究数据平台来申请获取(https://opendata.pku.edu.cn/)。
❤ 当然国内外公开的数据还有很多,大家在阅读文献或与其他圈内人交流的过程中,也会不断发现新的可用资源。
❤ 还有很多特属于某个单位的数据库,比如国家疾控中心的死因监测数据和中国成人慢性病和营养调查等数据库,都需要通过项目合作的方式获取。
4.如果可获得的数据库无法实现你的研究,可以想办法调整你的研究目标,然后用已有数据库去开展研究。如果你的既定目标无法调整,或者你不想调整,那么,就自己去收集数据。



雷达卡





京公网安备 11010802022788号







