楼主: xiaohaha008
5817 4

lm.ridge里的数据需不需要中心化和标准化 [推广有奖]

  • 0关注
  • 0粉丝

已卖:253份资源

大专生

45%

还不是VIP/贵宾

-

威望
0
论坛币
1096 个
通用积分
0.2400
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
1120 点
帖子
22
精华
0
在线时间
54 小时
注册时间
2009-10-1
最后登录
2011-5-30

楼主
xiaohaha008 发表于 2010-4-30 22:12:18 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
真心请教:lm.ridge里的数据需不需要中心化和标准化。比如说lm.ridge(Y~X1+X2,lambda=seq(0,10,1))这里的设计阵需不需要中心化和标准化?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Ridge 标准化 IDG DGE 中心化 数据 标准化 Ridge

沙发
飘洒 发表于 2010-5-1 21:52:44
你可以参看这个函数的help 文件,看他有没有对标准化和中心化做一些说明,若没有说明,你可以不必做这两个方面的工作。另外,你可以看你的实际数据需要这两个操作不。
It is not entirely satisfying but the alternatives are worse!
统计人

藤椅
xiaohaha008 发表于 2010-5-7 23:48:03
thanks very much !

板凳
shz0829 发表于 2010-5-8 12:50:53
lm.ridge函数默认你已经进行过中心化,所以你最好用scale函数进行中心化+标准化后再用lm.ridge.

报纸
snakepointid 发表于 2015-7-3 11:10:15
岭回归是需要标准化的。因为岭回归是在最小二乘的基础上加一个惩罚项,通过惩罚项来限制参数的大小。所以参数的量纲会影响惩罚项的大小,所以需要标准化。但在调用R程序时不需要,lm.ridge自动标准化了。
> library(MASS)
> example(lm.ridge)

lm.rdg> longley # not the same as the S-PLUS dataset
     GNP.deflator     GNP Unemployed Armed.Forces Population Year Employed
1947         83.0 234.289      235.6        159.0    107.608 1947   60.323
1948         88.5 259.426      232.5        145.6    108.632 1948   61.122
1949         88.2 258.054      368.2        161.6    109.773 1949   60.171
1950         89.5 284.599      335.1        165.0    110.929 1950   61.187
1951         96.2 328.975      209.9        309.9    112.075 1951   63.221
1952         98.1 346.999      193.2        359.4    113.270 1952   63.639
1953         99.0 365.385      187.0        354.7    115.094 1953   64.989
1954        100.0 363.112      357.8        335.0    116.219 1954   63.761
1955        101.2 397.469      290.4        304.8    117.388 1955   66.019
1956        104.6 419.180      282.2        285.7    118.734 1956   67.857
1957        108.4 442.769      293.6        279.8    120.445 1957   68.169
1958        110.8 444.546      468.1        263.7    121.950 1958   66.513
1959        112.6 482.704      381.3        255.2    123.366 1959   68.655
1960        114.2 502.601      393.1        251.4    125.368 1960   69.564
1961        115.7 518.173      480.6        257.2    127.852 1961   69.331
1962        116.9 554.894      400.7        282.7    130.081 1962   70.551

lm.rdg> names(longley)[1] <- "y"

lm.rdg> lm.ridge(y ~ ., longley)
                        GNP    Unemployed  Armed.Forces    Population          Year
2946.85636017    0.26352725    0.03648291    0.01116105   -1.73702984   -1.41879853
     Employed
   0.23128785

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-16 08:00