麦克风阵列语音识别

麦克风阵列语音识别——(make machine understand us)

China☆狼群 提交于 2020-04-07 08:46:31
基于麦克风阵列增强的语音识别 基于麦克风阵列增强的语音识别,与单通道语音识别相比麦克风阵列可以利用多通道的语音信息,通过波束形成算法来增强语音信号的质量,这样提取的特征参数能更好的反应语音的特征,从而提高语音识别的效果。 麦克风阵列可接收到多路的语音信息,可以通过对多路语音信息以某种准则加以筛选整合,得到对识别更有利的通道的语音信息,从而达到提高识别率的目的。通道选择的方法有很多种,比如基于 SNR 的方法,基于特征补偿的方法,基于互相关系数法,基于最近邻法。 语音识别的基础理论知识 语音识别过程本质上是一种模式识别过程,首先麦克风将接收到语音信号转换成电信号,经过预处理和端点检测后对其进行特征参数提取。然后根据语音特点选择合适的语音模型,通过提取的特征参数建立起语音识别的参考模型。最后,对待识别的语音进行预处理、端点检测和特征参数提取,将待识别语音的特征参数与训练过程建立语音模型进行匹配,进而通过判决规则得出识别结果。 (http://blog.csdn.net/ziyuzhao123/article/details/8932336) 梅尔倒谱系数 语音特征参数可以是基音周期、短时能量、共振峰等。目前在语音识别系统中,常用的特征参数是和线性预测倒谱系数。 HMM 模型的基础知识 隐马尔科夫模型是语音信号的一种统计模型,在语音处理各个领域广泛应用。它具有双重随机过程的特点