苹果/安卓/wp
初中生
0%
还不是VIP/贵宾
签到天数: 23 天
连续签到: 1 天
[LV.4]偶尔看看III
应届毕业生专属福利!
送您一个全额奖学金名额~ !
经管之家送您两个论坛币!
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
llulla 发表于2楼 查看完整内容
使用道具 举报
VIP
数据的分布与很多因素有关。 首先是数据的特征,其次是样本含量。通过变量变换,只是将一些偏离正态分布的数据使其成为正态分布。并非所有的数据通过转换都可以成为正态分布。
要根据数据的特征和类型选取数据变换。若数据是角度资料,或百分比资料(0-1),可以尝试一下平方根反正旋转化。也可以尝试box-cox转化。
有一点可以肯定,若样本含量足够大,是通过变量变换使其正态化。若样本含量过小,则不行。
我个人认为,可以做聚类和判别分析。因为有些判别分析不需要正态分布,如logistic回归判别分析,甚至多元线性的二值判别等(大样本情况下)。聚类分析也相似。主要看结果是否符合实际,能否解释。我的回答不系统,建议系统看一本多元统计的书。
[此贴子已经被作者于2008-10-29 23:58:02编辑过]
总评分: 经验 + 3 论坛币 + 3 查看全部评分
学前班
楼主是好人
爱你!~~~
本科生
llulla 发表于 2008-10-29 23:50 数据的分布与很多因素有关。 首先是数据的特征,其次是样本含量。通过变量变换,只是将一些偏离正态分布的数 ...
yiyiustb 发表于 2011-11-16 21:13 专家,你好,请问可以以转换后数据的处理结果解释原数据么?
学术权威
小学生
发表回复 回帖后跳转到最后一页
京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明 免责及隐私声明