集成学习

下载 1

快召唤伙伴们来围观吧
微博 QQ QQ空间 贴吧
文档嵌入链接
<iframe src="https://www.slidestalk.com/u2773/ch08aaa48269?embed" frame border="0" width="640" height="360" scrolling="no" allowfullscreen="true">复制
微信扫一扫分享
已成功复制到剪贴板

陈成

发布于

6年前

2240

人观看

#信息技术

集成学习是使用一系列学习器进行学习，并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。一般情况下，集成学习中的多个学习器都是同质的"弱学习器"。

展开查看详情

1 .马健

2 .第八章：集成学习

3 .集成学习个体与集成 Boosting Adaboost Bagging 与随机森林结合策略平均法投票法学习法多样性误差 - 分歧分解多样性度量多样性扰动

4 .个体与集成集成学习 (ensemble learning) 通过构建并结合多个学习器来提升性能

5 .个体与集成考虑一个简单的例子，在二分类问题中，假定 3 个分类器在三个样本中的表现如下图所示，其中 √ 表示分类正确， X 号表示分类错误，集成的结果通过投票产生。集成个体应：好而不同

6 .个体与集成 – 简单分析考虑二分类问题，假设基分类器的错误率为：假设集成通过简单投票法结合分类器，若有超过半数的基分类器正确则分类就正确

7 .个体与集成 – 简单分析假设基分类器的错误率相互独立，则由 Hoeffding 不等式可得集成的错误率为：显示，在一定条件下，随着集成分类器数目的增加，集成的错误率将指数级下降，最终趋向于 0

8 .个体与集成 – 简单分析上面的分析有一个关键假设：基学习器的误差相互独立现实任务中，个体学习器是为解决同一个问题训练出来的，显然不可能互相独立事实上，个体学习器的“准确性”和“多样性”本身就存在冲突如何产生“好而不同”的个体学习器是集成学习研究的核心集成学习大致可分为两大类

9 .个体与集成 – 简单分析上面的分析有一个关键假设：基学习器的误差相互独立现实任务中，个体学习器是为解决同一个问题训练出来的，显然不可能互相独立事实上，个体学习器的“准确性”和“多样性”本身就存在冲突如何产生“好而不同”的个体学习器是集成学习研究的核心集成学习大致可分为两大类

10 .Boosting 个体学习器存在强依赖关系，串行生成每次调整训练数据的样本分布

11 .Boosting - Boosting 算法 Boosting 族算法最著名的代表是 AdaBoost

12 .Boosting – AdaBoost 算法

13 .Boosting – AdaBoost 推导基学习器的线性组合最小化指数损失函数

14 .Boosting – AdaBoost 推导若能令指数损失函数最小化，则上式对的偏导值为 0 ，即贝叶斯最优错误率，说明指数损失函数是分类任务原来 0/1 损失函数的一致的替代函数。

15 .Boosting – AdaBoost 推导当基分类器分布，该基分类器的权重使得最小化指数损失函数令指数损失函数的导数为 0 ，即

16 .Boosting – AdaBoost 推导在获得的样本分布进行调整，使得下一轮的基学习器能纠正的一些错误，理想的能纠正全部错误泰勒展开近似为

17 .Boosting – AdaBoost 推导于是，理想的基学习器：注意到是一个常数，令 D t 表示一个分布 :

18 .Boosting – AdaBoost 推导根据数学期望的定义，这等价于令 : 由 :

19 .Boosting – AdaBoost 推导最终的样本分布更新公式则理想的基学习器

20 .Boosting – AdaBoost 注意事项数据分布的学习重赋权法重采样法重启动，避免训练过程过早停止

21 .0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 (a) 3 个基学习器 (b) 5 个基学习器 (c) 11 个基学习器 Boosting – AdaBoost 实验从偏差 - 方差的角度：降低偏差，可对泛化性能相当弱的学习器构造出很强的集成

22 .0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 (a) 3 个基学习器 (b) 5 个基学习器 (c) 11 个基学习器 Boosting – AdaBoost 实验从偏差 - 方差的角度：降低偏差，可对泛化性能相当弱的学习器构造出很强的集成

23 .Bagging 与随机森林个体学习器不存在强依赖关系并行化生成自助采样法

24 .Bagging 与随机森林 - Bagging 算法

25 .Bagging 与随机森林 - Bagging 算法特点时间复杂度低假定基学习器的计算复杂度为 O(m) ，采样与投票 / 平均过程的复杂度为 O(s) ，则 bagging 的复杂度大致为 T(O(m)+O(s )) 由于 O(s) 很小且 T 是一个不大的常数因此训练一个 bagging 集成与直接使用基学习器的复杂度同阶可使用包外估计

26 .Bagging 与随机森林 - 包外估计表示对样本包外预测，即仅考虑那些未使用样本训练的基学习器在预测 Bagging 泛化误差的包外估计为：

27 .0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 0 0.2 0.4 0.6 0.8 0.2 0.4 0.6 好瓜坏瓜密度含糖率 (a) 3 个基学习器 (b) 5 个基学习器 (c) 11 个基学习器 Bagging 与随机森林 - Bagging 实验从偏差 - 方差的角度：降低方差，在不剪枝的决策树、神经网络等易受样本影响的学习器上效果更好

28 .Bagging 与随机森林 - 随机森林随机森林 (Random Forest ，简称 RF) 是 bagging 的一个扩展变种采样的随机性属性选择的随机性

29 .Bagging 与随机森林 - 随机森林算法随机森林算法

15点赞

5收藏

1下载