楼主: playmore
10399 21

[学习分享] 基于泰坦尼克号公开数据的数据挖掘案例 [推广有奖]

学科带头人

1%

还不是VIP/贵宾

-

TA的文库  其他...

R相关

经济学相关

金融工程

威望
1
论坛币
15171 个
学术水平
368 点
热心指数
393 点
信用等级
339 点
经验
15057 点
帖子
1195
精华
1
在线时间
1303 小时
注册时间
2007-1-11
最后登录
2018-3-23

初级学术勋章 初级热心勋章 中级热心勋章

playmore 发表于 2014-5-19 15:47:01 |显示全部楼层
本帖最后由 playmore 于 2014-5-19 15:47 编辑

冷不丁发现一个网站,里面有很多关于数据挖掘的案例,也可以说是挑战,需要用户利用网站提供的数据并结合自己的方法和工具来完成挑战,如果做的好还有奖金。废话不多说,省得成了广告。

其中有一个案例,我觉得挺有意思,是关于泰坦尼克号的公开数据,如附件中的test.csv和train.csv两个文件所示,具体的变量有性别、年龄、是否生还、舱位等级、所花票价、上船地点等,然后就可以从这点数据中挖掘出有效的模型来预测一个人是否可以在这次劫难中生还。

这个案例已经过期,不再接受挑战,但是网站上有用Excel、R和Python来完成这个案例的具体方法和代码,我觉得还不错,可以用来学习下。

链接如下:
http://www.kaggle.com/c/titanic-gettingStarted


泰坦尼克号案例.zip (39.27 KB, 售价: 1 个论坛币)

本帖被以下文库推荐

playmore邀请您访问ChinaTeX论坛!!!进入ChinaTeX论坛
stata SPSS
chenfeixian 发表于 2014-5-19 15:55:26 |显示全部楼层
非常感谢分享
回复

使用道具 举报

jalma1990 发表于 2014-5-20 07:04:50 |显示全部楼层
Thanks for sharing !!
回复

使用道具 举报

ljh_9802 发表于 2014-5-20 11:20:31 |显示全部楼层
谢谢楼主!
回复

使用道具 举报

dorothy_helium 发表于 2014-6-3 14:25:49 |显示全部楼层
谢谢 楼主分享,网站打不开。。。
回复

使用道具 举报

xingjianbat 发表于 2014-6-3 20:36:09 |显示全部楼层
谢谢楼主
回复

使用道具 举报

发展方向 发表于 2014-6-20 06:43:30 |显示全部楼层
你的分享给我带来快乐,需要的东东有人想着给予,你是快乐的,你是善良的,有你这样的勤奋者,研究领域会硕果累累的
回复

使用道具 举报

马景涛 发表于 2014-6-21 23:11:38 |显示全部楼层
谢谢楼主
回复

使用道具 举报

iavjssssmqee 发表于 2014-7-28 23:31:35 |显示全部楼层
谢谢分享!
回复

使用道具 举报

doulaAmeng 发表于 2014-8-8 02:46:17 |显示全部楼层
this is interesting~~
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2018-4-25 08:30