@
目录
- 这是传奇性的Titanic ML竞赛-参加ML竞赛并熟悉Kaggle平台的工作原理的最佳,首要挑战。
- 这是国外Kaggle大数据网站的一个经典的入门比赛。这个网站要翻墙。
简单来说,就是一个简单的大数据预测的题目:我们知道一些人的信息,比如这个人是否有兄弟姐妹,是否是头等舱,这样的信息,然后通过这些信息来预测这个人是否会在 泰坦尼克灾难中 幸存!
我们先来看看这次比赛提供的数据:
- survival:这个人幸存下来了,这也是我们要预测的值
- pclass:就是这个人做的是不是头等仓, class 1 = 1st, 2 = 2nd, 3 = 3rd
- sex: 性别
- Age:年龄
- sibsp:船上是否有他的兄弟姐妹
- parch:船上是否有他的父母
- ticket:船票的号码
- fare:所花费的船票的费用
- cabin:船舱的号码
- embarked:登船港口,泰坦尼克号总共有三个登船港口
这里有一部分的样本:
之后我也会讲解一些大神的做法,然后回详细介绍相关算法和知识
附件里:
train是训练集
test是测试机
然后我把标准答案也附在里面了,可以自己测试看看准确率。