楼主: jeffzhaolan
59366 81

[学习资料] 关于标准化回归系数 [推广有奖]

31
我就知道 发表于 2009-6-18 20:43:32 |只看作者 |坛友微信交流群
标准化系数的作用是剔除了由于量纲不同而变化的缺点,消除了数量级不同而造成的误差,缺点是剔除量纲使方程抽象。我认为当数据量纲不同,或者数量级相差很大时,采用标准化系数,当量纲以及数量级对数据回归分析准确性影响不大的情况下,或对具体对象分析时,采用非标准化系数。

使用道具

32
张伟0304 发表于 2009-6-18 21:33:02 |只看作者 |坛友微信交流群
标准化系数是自变量和因变量进行标准化后建立的回归方程,一方面代替了量纲不同带来的变化,另一方面有利于消除变量的数量级不同带来的误差,标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。
由于标准化后式子中没有常数项,所以非标准化系数用于常数项的检验。

使用道具

33
稻草小屋 发表于 2009-6-18 22:47:25 |只看作者 |坛友微信交流群
数据经过标准化之后,均变换为均值为0、方差为1的数据。标准化后不同样本的观测值的比较只有相对意义,没有绝对意义。
数据标准化之后,有利于剔除量纲不同而变化系数的缺点,有利于消除数量级的不同代来的误差,但是数据标准化之后没有了量纲,就不如非标准化的数据那么直观的看出自变量变化一个单位,因变量随之变化的实际意义。个人认为数据要不要标准化与常数项能否通过检验没有关系,数据要不要标准化视实际情况而定。

使用道具

34
墨chanming 发表于 2009-6-19 22:54:45 |只看作者 |坛友微信交流群
标准化是去除纲量的,标准化前的数据单位不同数量级也不同,标准化后便没有纲量的影响了。对于常数项的检验,那一定是非标准化的(标准化的式子中没有常数项)所以非标准化系数用于常数项的检验。

使用道具

35
jinxiaoxue 发表于 2009-6-21 11:19:47 |只看作者 |坛友微信交流群
标准化与否,是数据的标准化。标准化只是为了消除量纲的影响,对于常数项的检验,那一定是非标准化的(标准化的式子中没有常数项),与是否通过检验没有关系。标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。由于标准化后式子中没有常数项,所以非标准化系数用于常数项的检验.

使用道具

36
咏梅 发表于 2009-6-21 11:57:03 |只看作者 |坛友微信交流群
两个都可以,但一般都用非标准化的,因为标准化后是消除纲量的影响,数据的模糊性比较大。

使用道具

37
咏梅 发表于 2009-6-21 12:18:33 |只看作者 |坛友微信交流群
1# jeffzhaolan
两个都可以,但一般都用非标准化的,因为标准化后是消除纲量的影响,数据的模糊性比较大。

使用道具

38
咏梅 发表于 2009-6-21 12:19:25 |只看作者 |坛友微信交流群
1# jeffzhaolan
两个都可以,但一般都用非标准化的,因为标准化后是消除纲量的影响,数据的模糊性比较大。

使用道具

39
dzgbz 发表于 2009-6-21 12:29:13 |只看作者 |坛友微信交流群
标准化主要是为了去除纲量,对于常数项的检验,那一定是非标准化的(标准化的式子中没有常数项),与是否通过检验没有关系。
标准化回归系数在多元回归中被用来比较变量间的重要性。但是由于重要性这一词意义的含糊性,这一统计常被误用。
  有时人们说重要性,是指同样的条件下,哪一个东西更有效。在提高教学质量上,是硬件条重要还是师资更重要?如果是师资更重要,那么同样的物力投在师资上就可以更快地提高教学质量。但是这里要比较的两者必须有同样的测量单位,如成本(元)。如果变量的单位不同,我们不能绝对地说那个变量更重要。不同单位的两个东西是不能绝对地比出高低轻重来。要想进行绝对地比较,就需要两个东西有着共同的测度单位,否则无法比较。
  而标准化回归系数说的重要性则与上面的意义不同,这是一种相对的重要性,与某一特定的情况下,自变量间的离散程度有关。比如说,虽然我们不能绝对地说出教育和年资在决定收入上那一个一定是重要的,但如果现在大家的教育程度比较相似,那么在收入的决定上,工作年数就是决定因素;反之,如果工作年数没有太大区别,那么教育就成为了重要原因。这里的重要性是相对的,是根据不同情况而改变的。再举一个通俗的例子,研究者研究的是遗传因素和后天因素对于人成长的影响。那么在一个社会境遇悬殊巨大的环境中,有人在贫民窟成长,有人在贵族学校上学,那么我们会发现人格的大部分差异会从后天环境因素得到解释,而遗传的作用就相对较小;相反,如果儿童都是在一个相差不大的环境中长大的,你会发现,遗传会解释大部分的人格差异。这种意义上的重要性,不仅与这一自变量的回归系数有关系,而且还与这个自变量的波动程度有关系:如果其波动程度较大,那么就会显得较为重要;否则,就显得不太重要。标准化回归系数正是测量这种重要性的。从标准化回归系数的公式 中也可看出,Beta值是与自变量的标准差与成正比的,自变量波动程度的增加,会使它在这一具体情况下的重要性增加。
  但是如果将两种重要性混同,就会得到误导性结论。如环境因素的Beta值比遗传因素的Beta值大,就认为在个体的人格发展上应更注意环境因素,而轻视遗传因素,在目前对于Beta值的错误观念非常流行,甚至是一些高手中。
  标准化回归系数的比较结果只是适用于某一特定环境的,而不是绝对正确的,它可能因时因地而变化。举例来说,从某一次数据中得出,在影响人格形成的因素中,环境因素的Beta值比遗传因素的Beta值大,这只能说明数据采集当时当地的情况,而不能加以任何不恰当的推论,不能绝对地不加任何限定地说,环境因素的影响就是比遗传因素大。事实上,如果未来环境因素的波动程度变小,很可能遗传因素就显得更为重要。数据的情况千差万别,变量的相对重要性也可能完全不同但都符合当时的实际情况。

使用道具

40
gunana9girl 发表于 2009-6-21 16:25:23 |只看作者 |坛友微信交流群
标准化的数据可以消除量纲的影响,而非标准化的数据不可以。一般用不是标准化的就可以了。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 16:38