不多说,直接上干货!
在决策树二元或决策树多元分类参数设置中:
使用DecisionTree.trainClassifier
见
Spark Mllib里如何对决策树二元分类和决策树多元分类的分类数目numClasses控制(图文详解)
val model = DecisionTree.trainClassifier(trainData, 2, Map[Int, Int](), impurity, maxDepth, maxBins)
在决策树回归分析参数设置中:
使用DecisionTree.trainRegressor,无numClasses参数,而且,这里是共有impurity, maxDepth, maxBins这3个参数。
将impurity固定为variance
见