楼主: 爱萌
7125 13

[原创博文] 针对数据挖掘、文本挖掘做一些简单阐释 [推广有奖]

11
新人2012 发表于 2013-1-17 02:59:10
爱萌 发表于 2010-10-11 09:05
正如我提供过一个统计前沿的知识点一样,已经有ICA为什么还要用主成分分析,因为主成分分析前提是对正态数据 ...
1.主成分分析只有极少的教科书才会强调指标数据的正态分布特征,也就是说并不需要正态分布的假设前提。可参考相关证明推导。
2.但主成分分析没有理论依据,解释各主成分含义变成了一种艺术,也许数据建模本身就是种艺术,艺术和科学区分在哪?
3.就主成分用于指标合成,综合评价,至少有两个方面目前没有定论,一是需要用几个主成分是妥当的,二是几个主成分如何赋权。
就算不说这些统计技术,简单的一个数据标准化技术,哪种更好更差,也是没有定论的东西。
没有理论指导,或不理解实务,任何数据分析技术都是对数据的玩弄!

供参考。

12
with_luck 发表于 2013-12-22 17:27:13
长见识的菜鸟飘过~

13
爱萌 发表于 2013-12-23 10:36:21
新人2012 发表于 2013-1-17 02:59
1.主成分分析只有极少的教科书才会强调指标数据的正态分布特征,也就是说并不需要正态分布的假设前提。可 ...
我不赞同你的观点,PCA基本是什么,他背后的假设是有,但不能因为教科书没有说,你就不考虑,这是非常不可靠的
最恨对我说谎或欺骗我的人

14
gaotao0727 发表于 2013-12-23 14:21:31
爱萌版主,可否介绍几本关于数据挖掘应用方面比较好的书呢?理论性太强的书总感觉跟实际的应用相差很大,在实际应用中也不知道是如何处理的,不是纯理论性,最好结合应用的讲解方面的书~~谢谢!!
衣带渐宽终不悔,为伊消得人憔悴~~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 09:44