楼主: fanxinkong
2556 16

[问题] 我是新手,希望从事数据挖掘的同志们帮助一下,不胜感激 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

58%

还不是VIP/贵宾

-

威望
0
论坛币
147 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2224 点
帖子
98
精华
0
在线时间
63 小时
注册时间
2013-11-15
最后登录
2019-12-12

楼主
fanxinkong 发表于 2013-12-3 22:20:31 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据挖掘都需要那些基础性的东西?听好多人说需要算法和编程,还需要数据分析的一些东西,请高手介绍一下,数据挖掘的应用过程及过程中使用的上述的那些东西
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:不胜感激 数据挖掘 一些东西 数据分析 基础性 不胜感激

本帖被以下文库推荐

沙发
狼牙11 学生认证  发表于 2013-12-4 10:21:30
同求,求指导···
GO AHEAD!!

藤椅
飞起一脚 发表于 2013-12-4 22:00:37
数据挖掘这个概念本身就是比较模糊的, 从大的范围说,所有的分析数据的活动都可以称为数据挖掘. 狭义上来说, 对于计算机系的人, 数据挖掘的概念略等同于"机器学习" (machine learning), 是人工智能的重要组成部分. 而对于统计系特别是生物统计系来说, 数据挖掘的概念略等同于生物信息学(bioinformatic)或者统计学习(statistical learning).  当然,死扣定义是没什么必要的.

至于数据挖掘本身, 一般来说涉及到以下几个层次: 理论=>模型=>计算机编程实现或者利用商业软件进行数据分析. 所谓理论的层次是数据挖掘的基础, 比如说PAC理论还有BOOSTING就是研究分类器的强弱关系(定义分类器的强与弱,以及一个弱分类器能否被强化为强分类器), 而所谓模型层次, 则是一些具体的模型和算法,比如决策树,  KNN, PCA, SVM等等, 最后一层则是应用, 比如决策树的算法实现, 数值方法选取等等. 一般来说, 都是通过软件实现的,比如流行的R, python, SAS, SPSS, MATLAB等等.

板凳
fanxinkong 发表于 2013-12-4 22:41:56
谢谢你啊!那要是具体学习的话学习这些课程你看行吗?我的学习顺序:概率论与数理统计=》高等数理统计=》应用多元统计分析=》spss19.0及统计分析=》c++,数据结构,数据库=》算法导论,数据挖掘
我是这么计划的,请大神帮我看看有欠缺的,小弟谢谢啊
我现在研一了,正在努力 ,明年九月就要找工作了,很是着急。

报纸
飞起一脚 发表于 2013-12-5 02:59:01
概率,统计,多元统计都是数据挖掘的基础, 修修是很好的. 至于后面具体的软件什么的,这个得看你的具体专业和准备从事的行业还有个人定位. 有机会去修修"机器学习"这么课,这是最纯正的数据挖掘课程. 至于最流行的软件, 我建议你学R或者python, 这是大趋势 .  说实话, SPSS作为社会学统计软件, 局限性比较大, 不利于理解模型. 我本科毕业后就不用了, 最开始还用SAS, 后来用MATLAB, 到现在R打天下. 你可以看看我们开发的数据挖掘系统, 从界面到后天,全部R写的. www.foam-buffalo.com

地板
miaomomo 发表于 2013-12-5 09:48:35
我们一起努力!!

7
allg168 发表于 2013-12-5 13:26:46
学习 了  继续关注

8
fanxinkong 发表于 2013-12-5 22:02:12
谢谢你,你的回答让我的思路越来越清楚了,之所以选择spss是因为它比较好入手,我现在的基础比较差,学会它基本的数据分析就可以进行了,关于编程语言的选择是出于我们本科学习过c++,而且我觉得各种编程语言是相通的,软件中各种语言都是支持的,关于数据分析的应用主要是经济,生物,医药,我感觉经济离自己近点,所以我想将来处理经济方面的数据,那么关于经济方向,大神又有什么好的建议,我本科是数学与应用数学专业,研究生是概率论与数理统计,学术型,研究方向是应用统计,研究生毕业暂时不想往下读了,想工作,从事数据分析,数据挖掘方向,

9
飞起一脚 发表于 2013-12-6 02:17:22
如果是搞经济的话,SPSS还是不错的选择. 你的背景听起来算是比较强大的, 有机会找本"element of statistical learning" (hastie) 看看, 学习下最经典的logistic regression, KNN, decision tree, random forest, SVM, PCA, PLS 这些模型.

10
fanxinkong 发表于 2013-12-6 21:46:33
谢谢啊

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 17:56