EpiData使用经验(1)–如何构建一个有价值的数据库录入界面-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 数据>>

数据库

>>

EpiData使用经验(1)–如何构建一个有价值的数据库录入界面

EpiData使用经验(1)–如何构建一个有价值的数据库录入界面

发布:crackman | 分类:数据库

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

本文来自:http://crackman.net/?p=1825前段时间,由于工作的原因,需要处理一些数据库的问题,从新勾起我在读书期间对数据库的设计和理解,在这里和大家一起来分享,这次的主题是如何构建一个有价值的数据库录入界面 ...
免费学术公开课,扫码加入


本文来自:http://crackman.net/?p=1825
前段时间,由于工作的原因,需要处理一些数据库的问题,从新勾起我在读书期间对数据库的设计和理解,在这里和大家一起来分享,这次的主题是如何构建一个有价值的数据库录入界面。使用过EpiData的人都知道,EpiData是一个快速开发数据库录入界面的软件,从软件的安装到数据库的设计以及录入界面的设计显得非常的灵活方便。从问卷量表的录入,变量的属性设置,到数据库录入文件的生成,似乎过程很简洁,程序简单而快速,但是很多人设计出来的数据库录入界面,使用效率以及最终数据的质量差距很大,那么如何构建一个有价值的数据库录入界面呢?首先这里对有价值的数据库录入界面进行界定,何为有价值?对于问卷设计者来说,能够通过这个录入界面保证数据的正确性完整性可靠性;对于具体录入人员来说,能够具备良好的操作界面,统一规范的录入操作行为,录入效率高;对于最终分析者来说,希望该数据录入界面能够导出目前主流统计软件的数据格式,该格式包括常规的变量命名规则等属性。那么下面从三个方面来谈谈:1.对于问卷设计者来说,对于数据库的考虑是如何正确、完整、可靠的记录问卷中的信息。首先数据库的界面内容要与问卷中的内容协调一致,这里为什么是协调一致而不是完全一致?因为问卷设计者在设计问卷的时候,对于问卷中问题的设置需要在数据库中以多种其他形式来表达,例如:在EPIDATA的QES文件中,就是反应问卷中的问题和内容,对于可以多选的问题,在数据库设计的时候考虑是否二分类变量还是如何确保有效的录入多选题信息,对于排序题,排序题本身的序列号和排序的顺序号如何协调一致?其次是数据库中的逻辑关系要与问卷匹配一致,哪些问题的回答有前提条件的,不同条件下,问题的回答结构与方式不一样。例如:年龄为一个关键性要素,大于18岁地才可以回答婚姻状况,那么在人口社会学调查中,就需要考虑这种逻辑关系,在设计数据库时采用EPIDATA中CHK文件的设计来实现问卷中设定的逻辑关系。再次是确保数据的完整性,通常在设计数据库的时候,会考虑到单选题中,如果没有调查对象所期望的选项时,经常会设计“其他”这个选项,然后对“其他”的具体内容进行注明,那么需要在设计数据库的时候充分考虑到后面具体内容的部分添加一个新的变量。2.对于具体录入人员来说,良好的录入界面、统一规范的录入操作行为是非常重要的。录入人员的最关键的地方在于忠于原始的问卷信息,进行数据录入。数据录入的效率在于录入界面,那么需要从几个方面来设计录入界面?首先是内容,内容问题的顺序要与问卷一致,不要轻易的变化问题的顺序,如果需要改变的,必须在数据库中有所说明;每一个变量的约束条件最大化的符合调查问卷中的实际情况,例如:在调查年龄的时候,有些是才出生补到一岁的小朋友,如何计算年龄?是写一岁还是0.6岁?那么在设计的时候是否有小数位保留。单选题中,选项的个数很容易确定,但是如果漏填,那么在数据库录入界面如何设置呢?通常设置为9,或者99等来表示。在开放式的回答问题中,如果一次性回答的字数超过40个,那么有没有考虑需要新增一个字符型变量来容纳多于的字?这两个变量之间的命名规则如何设定?其次是形式,所谓的形式主要是在数据录入过程中给予过程的管理和提醒,例如:可以在变量框的右边设置一些LABEL提醒,有助于第一时间核实和确认变量的值;如果在数据库的CHK文件中有跳转等行为时,可以使用JUMP等来设置,但是鼠标行为是可以改变这种程序的约束的,但是采用HIDE 、UNHIDE等命令的时候,就没有给录入人员犯错的机会了,因为鼠标这个时候是无法点入进去输入内容的。变量形式可以是下拉框的形式,可以穷举列出来供选择,而不是由录入人员的喜好随意输入。最后有一个非常关键的地方,就是同意的录入行为要求,这点需要集中对数据录入人员进行系统性的培训,了解录入的规则、异常问题的处理方式等等。3.数据最终分析者来说,最关心的是数据格式的转换以及数据变量的规则。在最初设计数据库的时候,一定要一套命名的规则,此规则最好是采用目前国内外统计软件对变量的要求。例如:在SAS中,英文变量名。不能以数字开头,当然EPIDATA本身对变量名也有一定的要求。命名规则是关于后期分析的最重要的原则,一般来说几个方式,有的是以英文单词或者缩写作为变量名,因为可以从名字的本身来识别改变了的含义;有的是以问题的顺序号来做为变量名,因为可以对应问题的本身。但是实际上我们经常用的是后一种,特别是变量数量巨大的时候,300-500个变量的时候,而且变量之间的聚合度很高的时候,这个方法显得更加高效些。当然现在的数据库很多时候采用两个方法,对于一些常规的信息可以采用英文缩写,对于局部变量数大的信息采用问题顺序来命名。另外对于EPIDATA数据设计中, 有一项功能值得学习,就是对异常数据的定义以及记录,生成一个独立的异常数据信息文件,可以很快速的识别出异常数据。
「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-1136365-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
经管之家 人大经济论坛 大学 专业 手机版