贝叶斯分类器

下载 0

陈成

发布于

1974

人观看

#信息技术

贝叶斯分类器是各种分类器中分类错误概率最小或者在预先给定代价的情况下平均风险最小的分类器。它的设计方法是一种最基本的统计分类方法。其分类原理是通过某对象的先验概率，利用贝叶斯公式计算出其后验概率，即该对象属于某一类的概率，选择具有最大后验概率的类作为该对象所属的类。

展开查看详情

1 .霍轩

2 .第七章：贝叶斯分类器

3 .章节目录贝叶斯决策论极大似然估计朴素贝叶斯分类器半朴素贝叶斯分类器贝叶斯网 EM 算法

4 .章节目录贝叶斯决策论极大似然估计朴素贝叶斯分类器半朴素贝叶斯分类器贝叶斯网 EM 算法

5 .贝叶斯决策论贝叶斯决策论（ Bayesian decision theory ）是在概率框架下实施决策的基本方法。在分类问题情况下，在所有相关概率都已知的理想情形下，贝叶斯决策考虑如何基于这些概率和误判损失来选择最优的类别标记。

6 .贝叶斯决策论贝叶斯决策论（ Bayesian decision theory ）是在概率框架下实施决策的基本方法。在分类问题情况下，在所有相关概率都已知的理想情形下，贝叶斯决策考虑如何基于这些概率和误判损失来选择最优的类别标记。假设有种可能的类别标记，即，是将一个真实标记为的样本误分类为所产生的损失。基于后验概率可获得将样本分类为所产生的期望损失（ expected loss ），即在样本上的“条件风险”（ conditional risk ）我们的任务是寻找一个判定准则以最小化总体风险

7 .贝叶斯决策论显然，对每个样本，若能最小化条件风险，则总体风险也将被最小化。

8 .贝叶斯决策论显然，对每个样本，若能最小化条件风险，则总体风险也将被最小化。这就产生了贝叶斯判定准则（ Bayes decision rule ）：为最小化总体风险，只需在每个样本上选择那个能使条件风险最小的类别标记，即此时，被称为贝叶斯最优分类器 (Bayes optimal classifier ) ，与之对应的总体风险称为贝叶斯风险 (Bayes risk) 反映了分类起所能达到的最好性能，即通过机器学习所能产生的模型精度的理论上限。

9 .贝叶斯决策论具体来说，若目标是最小化分类错误率，则误判损失可写为

10 .贝叶斯决策论具体来说，若目标是最小化分类错误率，则误判损失可写为此时条件风险

11 .贝叶斯决策论具体来说，若目标是最小化分类错误率，则误判损失可写为此时条件风险于是，最小化分类错误率的贝叶斯最有分类器为即对每个样本，选择能使后验概率最大的类别标记。

12 .贝叶斯决策论不难看出，使用贝叶斯判定准则来最小化决策风险，首先要获得后验概率。然而，在现实中通常难以直接获得。机器学习所要实现的是基于有限的训练样本尽可能准确地估计出后验概率。主要有两种策略：判别式模型（ discriminative models ）给定，通过直接建模 , 来预测决策树， BP 神经网络，支持向量机生成式模型（ generative models ）先对联合概率分布建模，再由此获得生成式模型考虑

13 .贝叶斯决策论生成式模型

14 .贝叶斯决策论生成式模型基于贝叶斯定理，可写成

15 .贝叶斯决策论生成式模型基于贝叶斯定理，可写成先验概率样本空间中各类样本所占的比例，可通过各类样本出现的频率估计（大数定理）

16 .贝叶斯决策论生成式模型基于贝叶斯定理，可写成先验概率样本空间中各类样本所占的比例，可通过各类样本出现的频率估计（大数定理） “证据” （ evidence ）因子，与类标记无关

17 .贝叶斯决策论生成式模型基于贝叶斯定理，可写成先验概率样本空间中各类样本所占的比例，可通过各类样本出现的频率估计（大数定理） “证据” （ evidence ）因子，与类标记无关类标记相对于样本的 “ 类条件概率 ” ( class-conditional probability ), 或称“似然”。

18 .贝叶斯决策论生成式模型基于贝叶斯定理，可写成先验概率样本空间中各类样本所占的比例，可通过各类样本出现的频率估计（大数定理） “证据” （ evidence ）因子，与类标记无关类标记相对于样本的 “ 类条件概率 ” ( class-conditional probability ), 或称“似然”。

19 .极大似然估计估计类条件概率的常用策略：先假定其具有某种确定的概率分布形式，再基于训练样本对概率分布参数估计。记关于类别的类条件概率为，假设具有确定的形式被参数唯一确定，我们的任务就是利用训练集估计参数

20 .极大似然估计估计类条件概率的常用策略：先假定其具有某种确定的概率分布形式，再基于训练样本对概率分布参数估计。记关于类别的类条件概率为，假设具有确定的形式被参数唯一确定，我们的任务就是利用训练集估计参数概率模型的训练过程就是参数估计过程，统计学界的两个学派提供了不同的方案：频率主义学派 ( frequentist ) 认为参数虽然未知，但却存在客观值，因此可通过优化似然函数等准则来确定参数值贝叶斯学派 (Bayesian) 认为参数是未观察到的随机变量、其本身也可由分布，因此可假定参数服从一个先验分布，然后基于观测到的数据计算参数的后验分布。

21 .极大似然估计令表示训练集中第类样本的组合的集合，假设这些样本是独立的，则参数对于数据集的似然是对进行极大似然估计，寻找能最大化似然的参数值。直观上看，极大似然估计是试图在所有可能的取值中，找到一个使数据出现的“可能性”最大值。

22 .极大似然估计令表示训练集中第类样本的组合的集合，假设这些样本是独立的，则参数对于数据集的似然是对进行极大似然估计，寻找能最大化似然的参数值。直观上看，极大似然估计是试图在所有可能的取值中，找到一个使数据出现的“可能性”最大值。式 (7.9) 的连乘操作易造成下溢，通常使用对数似然 (log-likelihood) 此时参数的极大似然估计为

23 .极大似然估计例如，在连续属性情形下，假设概率密度函数，则参数和的极大似然估计为也就是说，通过极大似然法得到的正态分布均值就是样本均值，方差就是的均值，这显然是一个符合直觉的结果。需注意的是，这种参数化的方法虽能使类条件概率估计变得相对简单，但估计结果的准确性严重依赖于所假设的概率分布形式是否符合潜在的真实数据分布。

24 .极大似然估计例如，在连续属性情形下，假设概率密度函数，则参数和的极大似然估计为也就是说，通过极大似然法得到的正态分布均值就是样本均值，方差就是的均值，这显然是一个符合直觉的结果。需注意的是，这种参数化的方法虽能使类条件概率估计变得相对简单，但估计结果的准确性严重依赖于所假设的概率分布形式是否符合潜在的真实数据分布。

25 .朴素贝叶斯分类器估计后验概率主要困难：类条件概率是所有属性上的联合概率难以从有限的训练样本估计获得。朴素贝叶斯分类器 (Naïve Bayes Classifier) 采用了“属性条件独立性假设 ” (attribute conditional independence assumption) ：每个属性独立地对分类结果发生影响。基于属性条件独立性假设， (7.8) 可重写为其中为属性数目，为在第个属性上的取值。

26 .朴素贝叶斯分类器

27 .朴素贝叶斯分类器由于对所有类别来说相同，因此基于式 (7.6) 的贝叶斯判定准则有这就是朴素贝叶斯分类起的表达式子

28 .朴素贝叶斯分类器朴素贝叶斯分类器的训练器的训练过程就是基于训练集估计类先验概率并为每个属性估计条件概率。令表示训练集中第类样本组合的集合，若有充足的独立同分布样本，则可容易地估计出类先验概率对离散属性而言，令表示中在第个属性上取值为的样本组成的集合，则条件概率可估计为对连续属性而言可考虑概率密度函数，假定，其中和分别是第类样本在第个属性上取值的均值和方差，则有

29 .朴素贝叶斯分类器例子：用西瓜数据集 3.0 训练一个朴素贝叶斯分类器，对测试例“测 1 ”进行分类 (p151, 西瓜数据集 p84 表 4.3)

10点赞

4收藏

0下载