楼主: zwl6233967
3098 4

[其它] 如果需要取对数、标准化和平方,这三者的顺序应该怎样 [推广有奖]

  • 0关注
  • 0粉丝

svip1

本科生

46%

还不是VIP/贵宾

-

威望
0
论坛币
1063 个
通用积分
0.0965
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
303 点
帖子
34
精华
0
在线时间
126 小时
注册时间
2022-12-3
最后登录
2024-4-20

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如果需要取对数、标准化和平方,这三者的顺序应该怎样
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:标准化 取对数

回帖推荐

Markqb 发表于2楼  查看完整内容

可以按照以下顺序进行处理: 取对数:对数可以把数据的分布拉伸,降低离群点的影响,同时也可以使数据更易于比较。一般建议先对数据取对数。 标准化:标准化可以使不同变量之间具有可比性,同时也可以减少变量之间的相关性,使得分析更加准确。标准化的顺序一般在对数变换之后,平方之前。 平方:平方可以使数据的分布更加偏斜,使数据更符合正态分布,同时也可以突出数据中的差异和特征。一般建议在对数和标准化之后再进 ...
沙发
Markqb 发表于 2023-4-12 10:53:14 |只看作者 |坛友微信交流群
可以按照以下顺序进行处理:

取对数:对数可以把数据的分布拉伸,降低离群点的影响,同时也可以使数据更易于比较。一般建议先对数据取对数。

标准化:标准化可以使不同变量之间具有可比性,同时也可以减少变量之间的相关性,使得分析更加准确。标准化的顺序一般在对数变换之后,平方之前。

平方:平方可以使数据的分布更加偏斜,使数据更符合正态分布,同时也可以突出数据中的差异和特征。一般建议在对数和标准化之后再进行平方处理。

使用道具

藤椅
邱宗满 学生认证  发表于 2023-4-12 18:23:22 |只看作者 |坛友微信交流群
1.标准化是对数据的特征缩放,任意时候都可以进行,并且不影响变量自身的显著性。
2.对数是对数据的非特征转换,适用于中等右偏态数据的转换,用于将数据自身分布转换得更加接近正态分布。例如收入数据,低收入群体扎堆,数值相差很小;而高收入群体之间较为分散,并且人与人之间差异很大。
3.计算平方,也即对数据计算二次项,一般是为了分析数据和因变量之间的U型或者倒U型关系。无论何种数据都可以直接计算二次项并进行分析。如果因为共线性问题导致模型无法拟合,可对原始数据进行中心化/标准化。

在传统针对非正态数据的转换中,一般没有使用平方进行转换的。如果数据属于中等左偏,一般采用反向对数转换。

综上,同一个数据进行这3种转换,应该是以下流程。
1.先判断数据是否符合正态分布,或者近似正态分布。如果数据右偏态较为严重,应当先进行对数转换。如果数据存在负数,可先加上一个常数,对数据进行位移,使最小值为正数。

2.在1的过程后,先进行标准化,再进行二次项计算。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
wsy1234567890 + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

已销号

使用道具

板凳
不会R的小白 学生认证  发表于 2023-4-17 12:42:38 |只看作者 |坛友微信交流群
楼上大佬说的不错

使用道具

报纸
Brooklyn2024 发表于 2024-5-17 12:07:04 |只看作者 |坛友微信交流群
邱宗满 发表于 2023-4-12 18:23
1.标准化是对数据的特征缩放,任意时候都可以进行,并且不影响变量自身的显著性。
2.对数是对数据的非特征 ...
您好,请问标准化后再进行平方不会存在负负得正影响系数吗,这个问题困扰了我很久,期待您的解答!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-21 22:28