楼主: redcardinal
1868 3

[文彤老师SPSS课程] 请教张老师有关偏小二乘回归有关问题,非常感谢!!!!!!!!!!!! [推广有奖]

  • 0关注
  • 0粉丝

硕士生

99%

还不是VIP/贵宾

-

威望
0
论坛币
6811 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
8065 点
帖子
51
精华
0
在线时间
382 小时
注册时间
2006-5-8
最后登录
2022-8-25

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
张老师,您好。我在遇到片最小二乘回归时遇到如下问题,烦请您指点。

1、偏最小二乘回归是否需要预先对数据标准化,看了很多教材案例,有的说标准化好,有的也没提标准化的事,哪一种处理在统计学上和实际应用上最好?

2、为了得到偏最小二乘回归结果,我先后用了spss(安装pls插件和pthlon包),statistica、simca和dps对同一个数据进行计算,结果发现存在一定差异。很不解。其中spss和statistica的结果基本一致(回归系数,R2)。但是simca的结果与spss和statistica不同,查阅相关教程和网络教程,提到simca是专门用于pls回归的软件,据称算法比spss更好,为什么回归系数在两个软件中不一致,与哪些处理步骤有关(数据标准化?是否要截距),请指教。

3、statistica软件在pls模型上比spss模块丰富,还有是否要截距项的选项。在一般的教程中对此都没有提及,如果一般分析,需要针对截距项的有无进一步分析吗?

非常感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:非常感谢 statistica statistic Statist 偏最小二乘回归 老师

沙发
张文彤 在职认证  发表于 2012-10-8 09:48:17 |只看作者 |坛友微信交流群
1. 这类复杂的算法为了避免测量尺度的影响,原则上都是应当先对原始变量做标准化和正态化的,当然有的软件在算法里内嵌了标准化,可以不做,比如SPSS中的因子分析就是如此(算法直接内嵌了标准化步骤)。这个需要查阅每个软件的算法说明,所以保险起见最好都先做标化。

2. 算法不同得到不同的结果是很正常的,特别是使用ML或者其他迭代收敛算法的时候更是常见。simca我没用过,所以没法给出具体的问题所在。

3. 绝大多数问题中,截距是多少,有无显著意义都是不重要的,所以除非特殊要求,不要去限定截距(对此问题的进一步参考文献是那个著名的画蛇添足的故事)。

使用道具

藤椅
redcardinal 发表于 2012-10-8 11:58:48 |只看作者 |坛友微信交流群
张文彤 发表于 2012-10-8 09:48
1. 这类复杂的算法为了避免测量尺度的影响,原则上都是应当先对原始变量做标准化和正态化的,当然有的软件在 ...
非常多谢您强调截距的不必要性。

您提到软件估算的结果都可能有不同之处,是否应该主要原因由小数点保留和四舍五入的缘故。比较让我纠结的是两种软件差异比较大,而其中一种软件恰好为众多外文文献所应用(ps即simca)。

使用道具

板凳
张文彤 在职认证  发表于 2012-10-9 10:29:31 |只看作者 |坛友微信交流群
结果不同不是四舍五入之类的问题,迭代算法不同于最小二乘法,只是对期望值的逼近或者近似,所以不同的迭代算法完全可能得到不同的逼近值,算法的提出者也会做模拟研究来验证逼近效果如何。要弄清楚哪个更好,只有去查作者发表的原始文献中的模拟实验结果。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 06:58