概率论与数理统计在计算机专业有着非常重要的基础地位,通信与计算机网络; 硬件,平台等的可靠性保障; 数据挖掘; 算法设计与分析等等都有与之相关。

注脚

user picture
  • 好菇娘
  • Apparently, this user prefers to keep an air of mystery about them.

相关Slides

  • 本章主要讲述了区间估计。其中包括置信区间的定义,求未知参数θ的置信区间的一般方法:枢轴变量法,枢轴函数的两大特点;正态总体下的置信区间:均值估计与均值的置信区间,方差的估计与方差的置信区间,两个正态总体的情形。

  • 本章主要讲述了假设检验。其中包括假设检验的基本原理,检验问题的提法,原假设和备择假设,检验统计量,否定论证及实际推断原理,假设检验的两类错误,假设检验的任务:必须在原假设与备择假设之间作一选择;显著水平检验法与正态总体检验:正态总体的显著水平检验。

  • 我们证明样本对于学习中的k高斯混合是必要且充分的,直到整体偏差距离误差ε。这改善了该问题已知的上限和下限。对于轴对齐高斯分布的混合,我们证明样本足够,匹配已知的下界。上限是基于一种基于样本压缩概念的分布式学习新技术。任何一类允许这种样本压缩方案的分布也可以通过很少的样本来学习。我们的主要结果是证明了中的高斯类具有有效的样本压缩。

  • 在Q-learning和其它形式的动态规划中,我们确定了一个基本的误差来源。当近似体系结构限制了可表达的贪婪策略类时,就会产生偏差。由于标准Q-updates对可表达的策略类做出了全局不协调的动作选择,因此可能导致不一致甚至冲突的Q值估计,从而导致病态行为,如过高/过低估计、不稳定甚至分歧。为了解决这个问题,我们引入了新的策略一致性概念,并定义了一个本地备份流程,该流程通过使用信息集来确保全局一致性,这些信息集记录了与备份后的Q值一致的策略约束。我们证明使用此备份的基于模型和无模型的算法都可消除妄想(delusional)偏差,从而产生第一种已知算法,可在一般条件下保证最佳结果。此外,这些算法仅需要多项式的一些信息集即可。最后,我们建议尝试减少妄想偏差的Value-iteration和 Q-learning的其它实用启发式方法。