楼主: crackman
13062 5

EpiData使用经验(1)–如何构建一个有价值的数据库录入界面 [推广有奖]

院士

83%

还不是VIP/贵宾

-

威望
6
论坛币
91908 个
通用积分
23.3245
学术水平
424 点
热心指数
505 点
信用等级
256 点
经验
113002 点
帖子
2948
精华
0
在线时间
2529 小时
注册时间
2007-4-26
最后登录
2024-4-23

初级热心勋章 中级热心勋章 初级学术勋章 初级信用勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本文来自:http://crackman.net/?p=1825


前段时间,由于工作的原因,需要处理一些数据库的问题,从新勾起我在读书期间对数据库的设计和理解,在这里和大家一起来分享,这次的主题是如何构建一个有价值的数据库录入界面。使用过EpiData的人都知道,EpiData是一个快速开发数据库录入界面的软件,从软件的安装到数据库的设计以及录入界面的设计显得非常的灵活方便。从问卷量表的录入,变量的属性设置,到数据库录入文件的生成,似乎过程很简洁,程序简单而快速,但是很多人设计出来的数据库录入界面,使用效率以及最终数据的质量差距很大,那么如何构建一个有价值的数据库录入界面呢?首先这里对有价值的数据库录入界面进行界定,何为有价值?对于问卷设计者来说,能够通过这个录入界面保证数据的正确性完整性可靠性;对于具体录入人员来说,能够具备良好的操作界面,统一规范的录入操作行为,录入效率高;对于最终分析者来说,希望该数据录入界面能够导出目前主流统计软件的数据格式,该格式包括常规的变量命名规则等属性。那么下面从三个方面来谈谈:1.对于问卷设计者来说,对于数据库的考虑是如何正确、完整、可靠的记录问卷中的信息。首先数据库的界面内容要与问卷中的内容协调一致,这里为什么是协调一致而不是完全一致?因为问卷设计者在设计问卷的时候,对于问卷中问题的设置需要在数据库中以多种其他形式来表达,例如:在EPIDATA的QES文件中,就是反应问卷中的问题和内容,对于可以多选的问题,在数据库设计的时候考虑是否二分类变量还是如何确保有效的录入多选题信息,对于排序题,排序题本身的序列号和排序的顺序号如何协调一致?其次是数据库中的逻辑关系要与问卷匹配一致,哪些问题的回答有前提条件的,不同条件下,问题的回答结构与方式不一样。例如:年龄为一个关键性要素,大于18岁地才可以回答婚姻状况,那么在人口社会学调查中,就需要考虑这种逻辑关系,在设计数据库时采用EPIDATA中CHK文件的设计来实现问卷中设定的逻辑关系。再次是确保数据的完整性,通常在设计数据库的时候,会考虑到单选题中,如果没有调查对象所期望的选项时,经常会设计“其他”这个选项,然后对“其他”的具体内容进行注明,那么需要在设计数据库的时候充分考虑到后面具体内容的部分添加一个新的变量。2.对于具体录入人员来说,良好的录入界面、统一规范的录入操作行为是非常重要的。录入人员的最关键的地方在于忠于原始的问卷信息,进行数据录入。数据录入的效率在于录入界面,那么需要从几个方面来设计录入界面?首先是内容,内容问题的顺序要与问卷一致,不要轻易的变化问题的顺序,如果需要改变的,必须在数据库中有所说明;每一个变量的约束条件最大化的符合调查问卷中的实际情况,例如:在调查年龄的时候,有些是才出生补到一岁的小朋友,如何计算年龄?是写一岁还是0.6岁?那么在设计的时候是否有小数位保留。单选题中,选项的个数很容易确定,但是如果漏填,那么在数据库录入界面如何设置呢?通常设置为9,或者99等来表示。在开放式的回答问题中,如果一次性回答的字数超过40个,那么有没有考虑需要新增一个字符型变量来容纳多于的字?这两个变量之间的命名规则如何设定?其次是形式,所谓的形式主要是在数据录入过程中给予过程的管理和提醒,例如:可以在变量框的右边设置一些LABEL提醒,有助于第一时间核实和确认变量的值;如果在数据库的CHK文件中有跳转等行为时,可以使用JUMP等来设置,但是鼠标行为是可以改变这种程序的约束的,但是采用HIDE 、UNHIDE等命令的时候,就没有给录入人员犯错的机会了,因为鼠标这个时候是无法点入进去输入内容的。变量形式可以是下拉框的形式,可以穷举列出来供选择,而不是由录入人员的喜好随意输入。最后有一个非常关键的地方,就是同意的录入行为要求,这点需要集中对数据录入人员进行系统性的培训,了解录入的规则、异常问题的处理方式等等。3.数据最终分析者来说,最关心的是数据格式的转换以及数据变量的规则。在最初设计数据库的时候,一定要一套命名的规则,此规则最好是采用目前国内外统计软件对变量的要求。例如:在SAS中,英文变量名。不能以数字开头,当然EPIDATA本身对变量名也有一定的要求。命名规则是关于后期分析的最重要的原则,一般来说几个方式,有的是以英文单词或者缩写作为变量名,因为可以从名字的本身来识别改变了的含义;有的是以问题的顺序号来做为变量名,因为可以对应问题的本身。但是实际上我们经常用的是后一种,特别是变量数量巨大的时候,300-500个变量的时候,而且变量之间的聚合度很高的时候,这个方法显得更加高效些。当然现在的数据库很多时候采用两个方法,对于一些常规的信息可以采用英文缩写,对于局部变量数大的信息采用问题顺序来命名。另外对于EPIDATA数据设计中, 有一项功能值得学习,就是对异常数据的定义以及记录,生成一个独立的异常数据信息文件,可以很快速的识别出异常数据。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:EpiData Data 有价值 pid EPI EpiData 数据库

本帖被以下文库推荐

沙发
qinmu870219 发表于 2013-5-29 12:19:53 |只看作者 |坛友微信交流群

使用道具

藤椅
henryyhl 发表于 2014-9-24 10:09:36 |只看作者 |坛友微信交流群
谢谢分享,学习了。

使用道具

板凳
问卷星 发表于 2014-9-24 11:09:24 |只看作者 |坛友微信交流群
其实使用我们问卷星,是可以完美解决问卷录入的问题的,自己把问卷发布到平台上,然后就可以录入问卷了,填写问卷和录入问卷是一体的,同步完成!可以实现epidata的所有功能,而且界面友好,网络实时保存!

使用道具

报纸
benxiaohai415 发表于 2015-12-28 09:22:09 |只看作者 |坛友微信交流群
问卷星 发表于 2014-9-24 11:09
其实使用我们问卷星,是可以完美解决问卷录入的问题的,自己把问卷发布到平台上,然后就可以录入问卷了,填 ...
非常棒,问卷星最后导出的数据格式怎么样?还能进行二次分析吗?

使用道具

地板
lcj0222 发表于 2018-8-28 12:03:22 |只看作者 |坛友微信交流群
老师,请问如何在hide之后设置新的记录中unhide所有?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 08:43