语音识别

语音识别的基本过程和方法,包括Input(语音输入波形),预处理(preprocess),建模(Acoustic model / Language model),输出(文字)。 基于观测的预处理方法,怎么通过波形数据采样,转化成一组连续的参数向量,如何选择不同的帧率以及合适的窗口大小,是问题核心,围绕这个核心也有很多方法被提及。 用隐马尔科夫算法来建立观测模型,并介绍针对这个算法的基本理论和优化拟合。涉及到一些公式的推导。
展开查看详情