在做分析中,收集上来的第一手数据一般都是要进行清理才能做统计分析的。我现在有一些变量的干净数据,我想用模拟的方法分析一下如果数据不干净的话对统计分析的影响。我首先从干净的数据中按比例抽取了一部分数据,把剩下的数据用模拟的方法做成未清理的数据,求问各位大神,这应该怎么做呀?我知道可能有以下五六种污染源,也大概知道每种污染源在污染中所占的比例呀。可以给一些建议么?
|
楼主: 小宝爱波1314
|
1209
0
[问题] 怎样模拟dirty data |
|
已卖:23份资源 教授 12%
-
|
本帖被以下文库推荐
| ||
|
|
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


