RT,我这有一批大数据,里面有个字段,从1到几千,我想用EM做决策树. 分析之前想先处理下极值,一般从数据分析的角度来讲,需要平滑多少占比的数据? 目前我是这样的,
A>800的占总数据的10%,那将>800的A全置为800.这样对吗?
楼主: dugu_ke
|
1849
1
[问答] SAS EM 数据极值处理,应该平滑多少占比的极值? |
初中生 85%
-
|
| ||
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明