楼主: ssningok
2615 4

怎么用R做数据挖掘? [推广有奖]

  • 2关注
  • 2粉丝

已卖:26份资源

教授

42%

还不是VIP/贵宾

-

威望
0
论坛币
1854 个
通用积分
16.9586
学术水平
1 点
热心指数
4 点
信用等级
2 点
经验
7203 点
帖子
895
精华
0
在线时间
1436 小时
注册时间
2009-3-8
最后登录
2023-9-18

楼主
ssningok 在职认证  发表于 2010-5-16 22:38:17 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
RT。谢谢。想想学习下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 数据 挖掘

本帖被以下文库推荐

沙发
liuqi99 发表于 2010-5-16 23:16:19
想想学习下
本文来自: 人大经济论坛 详细出处参考:http://www.pinggu.org/bbs/viewth ... &from^^uid=224862

藤椅
yahoocom 发表于 2010-5-17 00:36:09
可以看下以下两个package:
ElemStatLearn
FactoMineR

板凳
眼泪迷信 发表于 2010-5-18 14:09:29
谢谢谢谢@
呵呵
心若倦了 泪也干了

报纸
snakepointid 发表于 2015-7-3 14:53:05
首先,一切都要从业务出发或者理论出发!!!
数据分析本身并没有发现一切规律的能力。数据分析最好的用途就是对已有的理论或者你熟悉的业务逻辑进行实证的,数据支持的分析。所以在选模型的时候,一定要充分了解你要研究的问题。
在那个基础上,对模型的判别有很多判断准则比如AIC,BIC等等,但是一定要记住那些都不能作为你模型判断的绝对标准。你的模型必须符合逻辑和常识。

不过残差或者误差确实能帮我们提供很多信息。如果残差是整体分布,那么首先考虑线性回归。如果是泊松分布,首先考虑对数回归模型。如果是二分类问题,首先考虑逻辑回归。
如果你要研究的问题确实没有太多理论支撑以及你的数据量够的话,并且你只在乎用模型来进行预测,那么你可以用一些现代的方法如随机森林,神经网络等等。现代的方法的选择一般通过CV交叉验证的方法来选取。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 03:02