Support Vector Machines

下载 1

快召唤伙伴们来围观吧
微博 QQ QQ空间 贴吧
文档嵌入链接
<iframe src="https://www.slidestalk.com/u2773/Support_Vector_Machines_1543411391965?embed" frame border="0" width="640" height="360" scrolling="no" allowfullscreen="true">复制
微信扫一扫分享
已成功复制到剪贴板

陈成

发布于

6年前

4394

人观看

#信息技术

支持向量机的”最大间隔”思想。对偶问题及其解的稀疏性。通过向高维空间映射解决线性不可分的问题。引入”软间隔”缓解特征空间中线性不可分的问题。将支持向量的思想应用到回归问题上得到支持向量回归。将核方法推广到其他学习模型。

展开查看详情

1 .张腾

2 .第六章：支持向量机

3 .大纲间隔与支持向量对偶问题核函数软间隔与正则化支持向量回归核方法

4 .引子线性模型：在样本空间中寻找一个超平面 , 将不同类别的样本分开 . 0

5 .引子 -Q: 将训练样本分开的超平面可能有很多 , 哪一个好呢 ? 0

6 .引子 -Q: 将训练样本分开的超平面可能有很多 , 哪一个好呢 ? -A: 应选择 ” 正中间 ”, 容忍性好 , 鲁棒性高 , 泛化能力最强 . 0

7 .间隔与支持向量超平面方程 : 间隔 0 支持向量

8 .支持向量机基本型最大间隔 : 寻找参数和 , 使得最大 .

9 .支持向量机基本型最大间隔 : 寻找参数和 , 使得最大 .

10 .对偶问题拉格朗日乘子法第一步：引入拉格朗日乘子得到拉格朗日函数第二步：令对和的偏导为零可得第三步：回代

11 .解的稀疏性最终模型： KKT 条件：支持向量机解的稀疏性 : 训练完成后 , 大部分的训练样本都不需保留 , 最终模型仅与支持向量有关 .

12 .求解方法 - SMO 基本思路：不断执行如下两个步骤直至收敛 . 第一步：选取一对需更新的变量和 . 第二步：固定和以外的参数 , 求解对偶问题更新和 . 仅考虑和时 , 对偶问题的约束变为偏移项：通过支持向量来确定 . 用一个变量表示另一个变量 , 回代入对偶问题可得一个单变量的二次规划 , 该问题具有闭式解 .

13 .求解方法 - SMO 基本思路：不断执行如下两个步骤直至收敛 . 第一步：选取一对需更新的变量和 . 第二步：固定和以外的参数 , 求解对偶问题更新和 . 仅考虑和时 , 对偶问题的约束变为偏移项：通过支持向量来确定 . 用一个变量表示另一个变量 , 回代入对偶问题可得一个单变量的二次规划 , 该问题具有闭式解 .

14 .线性不可分 -Q: 若不存在一个能正确划分两类样本的超平面 , 怎么办 ? -A: 将样本从原始空间映射到一个更高维的特征空间 , 使得样本在这个特征空间内线性可分 .

15 .核支持向量机设样本映射后的向量为 , 划分超平面为 . 原始问题对偶问题预测只以内积的形式出现

16 .核函数基本想法：不显式地设计核映射 , 而是设计核函数 . Mercer 定理 ( 充分非必要 ) ：只要一个对称函数所对应的核矩阵半正定 , 则它就能作为核函数来使用 . 常用核函数：

17 .核函数基本想法：不显式地设计核映射 , 而是设计核函数 . Mercer 定理 ( 充分非必要 ) ：只要一个对称函数所对应的核矩阵半正定 , 则它就能作为核函数来使用 . 常用核函数：

18 .软间隔 -Q: 现实中 , 很难确定合适的核函数使得训练样本在特征空间中线性可分 ; 同时一个线性可分的结果也很难断定是否是有过拟合造成的 . -A: 引入 ” 软间隔 ” 的概念 , 允许支持向量机在一些样本上不满足约束 . 0 不满足约束的样本

19 .0/1 损失函数基本想法：最大化间隔的同时 , 让不满足约束的样本应尽可能少 . 其中是 ”0/1 损失函数 ” 存在的问题： 0/1 损失函数非凸、非连续 , 不易优化！

20 .替代损失 0 1 2 -1 -2 1 2 3 替代损失函数数学性质较好 , 一般是 0/1 损失函数的上界软间隔 SVM

21 .软间隔支持向量机原始问题对偶问题根据 KKT 条件可推得最终模型仅与支持向量有关 , 也即 h inge 损失函数依然保持了支持向量机解的稀疏性 .

22 .正则化支持向量机学习模型的更一般形式通过替换上面两个部分 , 可以得到许多其他学习模型对数几率回归 (Logistic Regression) 最小绝对收缩选择算子 (LASSO) …… 结构风险 , 描述模型的某些性质经验风险 , 描述模型与训练数据的契合程度

23 .正则化支持向量机学习模型的更一般形式通过替换上面两个部分 , 可以得到许多其他学习模型对数几率回归 (Logistic Regression) 最小绝对收缩选择算子 (LASSO) …… 结构风险 , 描述模型的某些性质经验风险 , 描述模型与训练数据的契合程度

24 .支持向量回归特点 : 允许模型输出和实际输出间存在的偏差 . 0 间隔带

25 .损失函数落入中间间隔带的样本不计算损失 , 从而使得模型获得稀疏性 . 0 最小二乘损失函数支持向量回归损失函数

26 .形式化原始问题对偶问题预测

27 .形式化原始问题对偶问题预测

28 .表示定理结论 : 无论是支持向量机还是支持向量回归 , 学得的模型总可以表示成核函数的线性组合 . 更一般的结论 ( 表示定理 ): 对于任意单调增函数和任意非负损失函数 , 优化问题的解总可以写为 . 支持向量机支持向量回归

29 .核线性判别分析通过表示定理可以得到很多线性模型的 ” 核化 ” 版本核 SVM 核 LDA 核 PCA …… 核 LDA: 先将样本映射到高维特征空间 , 然后在此特征空间中做线性判别分析

6点赞

3收藏

1下载