3---kaldi 自己录音,做自己版本的yesNo
学习经历 0---原始文档备份和环境准备 1---原始脚本注释解析 2---原始脚本训练和测试拆分 3---自己录音,做自己版本的yesNo ========================================================= 3---自己录音,做自己版本的yesNo 这个过程较为曲折,经过时间较长,主要经历了win10录音和词典设计,查找m4a转wav方法和脚本设计,识别测试失败乱投医(再次注释理解后面脚本),查看log文件并找到采样率改变方法,再次运行wer过高,检查脚本发现错误,wer等于0等过程。这里只对最终正确的过程做总结。下面将只讲述整理过的正确内容 (1)录制音频。 我的电脑是win10系统,分别在用耳机和没有耳机的情况下进行了录制,发现区别不大,最终的音频没有用耳机录制,另外,录制是去掉了麦克风增强(应该影响不大),加入了噪声抑制。录制时文件名形如YYNNYYNN.m4a。没有像例程一样采用下划线主要时考虑文件名命名不方便。录制之后拷贝到虚拟机内。 (2)转换成和例程一致wav格式 百度下,决定使用ffmpeg进行格式转换工作。所以首先安装ffmpeg,安装完毕后查看例程声音文件格式。具体如下: ffmpeg -i 0_0_0_0_1_1_1_1.wav 显示信息如下: Guessed Channel Layout for Input