其中有一个案例,我觉得挺有意思,是关于泰坦尼克号的公开数据,如附件中的test.csv和train.csv两个文件所示,具体的变量有性别、年龄、是否生还、舱位等级、所花票价、上船地点等,然后就可以从这点数据中挖掘出有效的模型来预测一个人是否可以在这次劫难中生还。
这个案例已经过期,不再接受挑战,但是网站上有用Excel、R和Python来完成这个案例的具体方法和代码,我觉得还不错,可以用来学习下。
链接如下:
http://www.kaggle.com/c/titanic-gettingStarted