楼主: yangyangql
11648 8

[学习资料] 非正态数据的转换 [推广有奖]

  • 0关注
  • 0粉丝

初中生

14%

还不是VIP/贵宾

-

威望
0
论坛币
15 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1338 点
帖子
1
精华
0
在线时间
23 小时
注册时间
2008-5-28
最后登录
2020-9-3

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问非正态数据在Spss中经过平方根、倒数、正切、指数、对数等方法都无法转换为正态数据是怎么回事?这样的数据还能做聚类判别分析吗? <br/>
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:非正态数据 非正态 SPSS 判别分析 PSS 平方根 倒数

回帖推荐

llulla 发表于2楼  查看完整内容

数据的分布与很多因素有关。 首先是数据的特征,其次是样本含量。通过变量变换,只是将一些偏离正态分布的数据使其成为正态分布。并非所有的数据通过转换都可以成为正态分布。要根据数据的特征和类型选取数据变换。若数据是角度资料,或百分比资料(0-1),可以尝试一下平方根反正旋转化。也可以尝试box-cox转化。有一点可以肯定,若样本含量足够大,是通过变量变换使其正态化。若样本含量过小,则不行。我个人认为,可以做聚类和判 ...

本帖被以下文库推荐

沙发
llulla 发表于 2008-10-29 23:50:00 |只看作者 |坛友微信交流群

数据的分布与很多因素有关。 首先是数据的特征,其次是样本含量。通过变量变换,只是将一些偏离正态分布的数据使其成为正态分布。并非所有的数据通过转换都可以成为正态分布。

要根据数据的特征和类型选取数据变换。若数据是角度资料,或百分比资料(0-1),可以尝试一下平方根反正旋转化。也可以尝试box-cox转化。

有一点可以肯定,若样本含量足够大,是通过变量变换使其正态化。若样本含量过小,则不行。

我个人认为,可以做聚类和判别分析。因为有些判别分析不需要正态分布,如logistic回归判别分析,甚至多元线性的二值判别等(大样本情况下)。聚类分析也相似。主要看结果是否符合实际,能否解释。我的回答不系统,建议系统看一本多元统计的书。

[此贴子已经被作者于2008-10-29 23:58:02编辑过]

已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

使用道具

藤椅
huangpiyy 发表于 2008-10-30 08:38:00 |只看作者 |坛友微信交流群

楼主是好人

爱你!~~~

使用道具

板凳
乖孩子 发表于 2010-4-27 01:16:26 |只看作者 |坛友微信交流群
哎,这些东西学起来还真的很麻烦,很难懂。

使用道具

报纸
yiyiustb 发表于 2011-11-16 21:13:13 |只看作者 |坛友微信交流群
llulla 发表于 2008-10-29 23:50
数据的分布与很多因素有关。 首先是数据的特征,其次是样本含量。通过变量变换,只是将一些偏离正态分布的数 ...
专家,你好,请问可以以转换后数据的处理结果解释原数据么?

使用道具

地板
coms1100 发表于 2011-11-22 10:29:06 |只看作者 |坛友微信交流群
你可以试试box-cox转换;
能进行聚类分析,聚类分析是把多个数据合成几个类,不涉及数据的检验。

使用道具

7
llulla 发表于 2011-12-5 12:03:43 |只看作者 |坛友微信交流群
yiyiustb 发表于 2011-11-16 21:13
专家,你好,请问可以以转换后数据的处理结果解释原数据么?
可以用转换后数据的处理结果解释研究假设的问题. 比如, 新药组和对照组两组均数比较, 数据转换的均数其差别有统计学意义. 可以认为两组药物的效果不同.

但你的表述"以转换后数据的处理结果解释原数据"并不准确.

使用道具

8
matlab-007 发表于 2015-11-17 14:27:37 |只看作者 |坛友微信交流群
可以应用变量变换的方法,将不服从正态分布的资料转化为非正态分布或近似正态分布。常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正玄变换等,应根据资料性质选择适当的变量变换方法。
1、对数变换 即将原始数据X的对数值作为新的分布数据:
X’=lgX
当原始数据中有小值及零时,亦可取X’=lg(X+1)
还可根据需要选用X’=lg(X+k)或X’=lg(k-X)
对数变换常用于(1)使服从对数正态分布的数据正态化。如环境中某些污染物的分布,人体中某些微量元素的分布等,可用对数正态分布改善其正态性。(2)使数据达到方差齐性,特别是各样本的标准差与均数成比例或变异系数CV接近于一个常数时。
2、平方根变换 即将原始数据X的平方根作为新的分布数据。
X’=sqrt(X)
平方根变换常用于:1)使服从Poission分布的计数资料或轻度偏态资料正态化,可用平方根变换使其正态化。2)当各样本的方差与均数呈正相关时,可使资料达到方差齐性。
3、倒数变换 即将原始数据X的倒数作为新的分析数据。
X’=1/X
常用于资料两端波动较大的资料,可使极端值的影响减小。
4、平方根反正旋变换 即将原始数据X的平方根反正玄值做为新的分析数据。
X’=sin-1sqrt(X)
常用于服从二项分布的率或百分比的资料。一般认为等总体率较小如<30%时或较大(如>70%时),偏离正态较为明显,通过样本率的平方根反正玄变换,可使资料接近正态分布,达到方差齐性的要求。
你可以根据自己的资料适当转化。另外,可以考虑其他分析方法,比如秩和检验。

使用道具

9
czzhbq 发表于 2017-10-27 14:13:59 |只看作者 |坛友微信交流群
用JMP怎么转换呢?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 19:41