随机森林是通过投票来预测数据的,每次投票票数超过半数的特征则被确认为某类数据,我们曾经觉得随机森林的投票太过严格,于是花了几天时间试着修改随机森林,让其投票超过4/10的数据认为是我们所需求的数据,可是接连的现象让我们发现我们的无知,我们的提交数据变多了,可分数降低了,而且越来越低,曾最低达到40分。
于是我们改变了方向,我们接着把重心放在算法和特征上去,有效特征增加了,分数也开始增加了,而且幅度很大,达到了我们以前一直想达到的分数70分,甚至超过了很多
接下来继续找特征,脚步不能停
随机森林是通过投票来预测数据的,每次投票票数超过半数的特征则被确认为某类数据,我们曾经觉得随机森林的投票太过严格,于是花了几天时间试着修改随机森林,让其投票超过4/10的数据认为是我们所需求的数据,可是接连的现象让我们发现我们的无知,我们的提交数据变多了,可分数降低了,而且越来越低,曾最低达到40分。
于是我们改变了方向,我们接着把重心放在算法和特征上去,有效特征增加了,分数也开始增加了,而且幅度很大,达到了我们以前一直想达到的分数70分,甚至超过了很多
接下来继续找特征,脚步不能停