kaldi

sclite (SCTK) `make check` faliure, C++/perl/Cygwin, Safe to use Perl4 stuff?

半世苍凉 提交于 2019-11-28 06:23:41
问题 I am currently trying to install NIST's sclite , which is part of SCTK 2.4.0 (github or newer version). I am attempting the install on Cygwin in bash . The installation is done using make . I have gotten past the make configure and make all parts of the installation. This didn't come without some effort (See the SO posts on the first ( file not recognized ) and second (template/scoping) problems). When I get to the make check part of the install, a lot of the checks/tests pass, but then I get

以kaldi中的yesno为例谈谈transition

柔情痞子 提交于 2019-11-27 02:11:08
在基于GMM-HMM的传统语音识别里,比音素(phone)更小的单位是状态(state)。一般每个音素由三个状态组成,特殊的是静音(SIL)由五个状态组成。这里所说的状态就是指HMM里的隐藏的状态,而每帧数据就是指HMM里的观测值。每个状态可以用一个GMM模型表示(这个GMM模型的参数是通过训练得到的)。在识别时把每帧数据对应的特征值放进每个状态的GMM里算概率,概率最大的那个就是这帧对应的状态。再从状态得到音素(HMM负责),从音素得到词(字典模型负责),从词得到句子(语言模型负责),最终完成识别。可以从一个状态转到另一个状态,即状态之间存在转移(transition)。Transition是kaldi里一个非常重要的概念,相关的有transition-state、transition-index、transition-id等,初一看云里雾里不太好理解,其实它们都是根据topo图(/s5/data/lang/topo)得到的。今天就基于yesno的例子对它们做一个讲解。 先看yesno中的topo图(见下图),它有三个音素:SIL、yes、no (yes和no均作为一个音素处理),id 分别为1、2、3. SIL有5个状态,id为0—4 ,5为结束态。yes/no分别有三个状态,id为0—2 ,3为结束态。 SIL中状态0—3 分别有4条状态转移路径(或者叫转移弧),以状态0为例