- 阅读权限
- 255
- 威望
- 0 级
- 论坛币
- 6762 个
- 通用积分
- 19.5160
- 学术水平
- 18 点
- 热心指数
- 24 点
- 信用等级
- 15 点
- 经验
- 383 点
- 帖子
- 1182
- 精华
- 0
- 在线时间
- 997 小时
- 注册时间
- 2013-1-20
- 最后登录
- 2024-8-2
已卖:23份资源
教授
还不是VIP/贵宾
- 威望
- 0 级
- 论坛币
 - 6762 个
- 通用积分
- 19.5160
- 学术水平
- 18 点
- 热心指数
- 24 点
- 信用等级
- 15 点
- 经验
- 383 点
- 帖子
- 1182
- 精华
- 0
- 在线时间
- 997 小时
- 注册时间
- 2013-1-20
- 最后登录
- 2024-8-2
 | 开心 2016-12-24 23:06:08 |
|---|
签到天数: 187 天 连续签到: 1 天 [LV.7]常住居民III
|
150论坛币
|
数据清理是数据分析阶段前必须要完成的,为了保证数据库中的数据干净、完整。数据库中的数据一般分为两种,第一种是为了试验的最终目的而收集的,包括primary variables 和 secondary variables的数据;第二种是对第一种数据分析产生影响的,但是不是我们主要要进行分析的变量的数据。
对于第一类数据一般是要进行100%的清理,而对于第二类数据是用来进行辅助分析的,只要进行部分的清理就可以进行有意义的统计分析。那我的问题是对于第二类数据,我要计算进行清理到多少才能进行有意义的统计分析,这应该怎么去做?
|
|