MLLib

决策树在Spark的实现. 划分特征. 每一个样本应该被分到哪个桶. 聚合每一个桶的统计信息. 计算每次分割的信息增量. 找到该层所有节点的最好分割. 逐层训练.
展开查看详情