合成知识01

北慕城南 提交于 2019-11-28 07:18:31
interval文件

每个句子会有一个interval文件,对应到句中每个发音的间隔
比如

0
3.63
<exists>   语音总长度
1
"IntervalTier"
"B001_TTS000080.interval"
0
3.63    0-3.63是语音总长度
36      一共有36个silence+phone+st(句中停顿)
0.0
0.38
"sil"   0-0.38时长对应的是silence(句子首末的静音段用sil表示)
0.38
0.43
"iang4"   0.38-0.43对应的是‘iang‘的四声发音
prosody

韵律的划分,整个数据集会写到一个文件中

B001_TTS000020  樱桃的#1味道#1实在#1太美了#3又酸#1又甜#4
ying1 tao2 de5 wei4 dao4 shi2 zai4 tai4 mei3 le5 you4 suan1 you4 tian2

中间用韵律符号划分
#1 韵律停顿
#2 介于#1 和#3之间的停顿
#3 韵律短语停顿
#4 句子的停顿,比如感叹号,句号,问号的结束
不仅是停顿时间的客观比较,还有一些主观的含义在里边

TTS前端会根据文本解析出应该在什么地方停顿,但也会有一定的误差

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!