REF[24]
随机森林是一个很好适用于微阵列数据的分类算法:
1.即使大多数的预测变量都是噪音,RF仍然具有优秀的性能,因此不需要对基因进行预选择。
2.能够应用于变量数远远大于观测数据量的情况
3.能用于两类和多于两个分类问题的情况
4.返回变量重要性测量
5.不会过拟合
6.能处理分类和连续预测器的混合
7.合并预测变量间的相互作用
8.对于预测器的单调变换,输出不变
9.高质量免费的实现,如R包
10.几乎不需要调整参数来获得优秀的性能
REF[24]
随机森林是一个很好适用于微阵列数据的分类算法:
1.即使大多数的预测变量都是噪音,RF仍然具有优秀的性能,因此不需要对基因进行预选择。
2.能够应用于变量数远远大于观测数据量的情况
3.能用于两类和多于两个分类问题的情况
4.返回变量重要性测量
5.不会过拟合
6.能处理分类和连续预测器的混合
7.合并预测变量间的相互作用
8.对于预测器的单调变换,输出不变
9.高质量免费的实现,如R包
10.几乎不需要调整参数来获得优秀的性能