MFCC(Mel 倒谱系数)
Mel倒谱系数 Mel倒谱系数:MFCC Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient)的缩写是MFCC,Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。 用录音设备录制一段模拟语音信号后,经由自定的取样频率(如8000 Hz、16000 Hz等)采样后转换(A/D)为数字语音信号。由于在时域(time domain)上语音信号的波形变化相当快速、不易观察,因此一般都会在频域(frequency domain)上来观察,其频谱是随着时间而缓慢变化的,因此通常可以假设在一较短时间中,其语音信号的特性是稳定的,通常我们定义这个较短时间为一帧(frame),根据人的语音的音调周期值的变化,一般取10~20ms。 Mel-frequency cepstrum coefficient 作用: 和线性预测倒谱系数LPCC一起用于描述语音特征的参数:能量,基音频率,共振峰值等。 详解几个概念: 1.Mel频率: 是模拟人耳对不同频率语音的感知。 人类对不同频率语音有不同的感知能力: 对1kHz以下,与频率成线性关系,对1kHz以上,与频率成对数关系。频率越高,感知能力就越差了。 因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。 2.倒谱: