如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
CASIA语音合成语料库存储及标注规范1、本数据库包括的内容,分为陈述语句、疑问语句和短消息风格;每种语料都包含语音和文本两种数据。其中陈述语句、短消息为一个女声播音员,疑问语句为四个播音员(两男两女)。语料覆盖汉语的所有音节、diphone信息。2、文件命名方式文本文件所有陈述句的文本都放在“陈述句.txt”中;所有疑问句的文本都放在“疑问句.txt”中;所有短消息的文本都放在“短消息.txt”中;示例:1.只好求别人替他介绍一个最轻松的工作.2.我母亲和我都是耽于梦想的人.语音文件语音数据的存储格式皆为16K采样16位的无压缩wav格式。命名方式为:陈述句:c_序号.wav。其中序号用数字表示,例如第一个语句就是c_00001.wav,对应着“陈述句.txt”文本中的一个句子。疑问句:q_序号.wav。其中序号用数字表示,例如第一个语句就是q_00001.wav,对应着“疑问句.txt”文本中的一个句子。短消息:s_序号.wav。其中序号用数字表示,例如第一个语句就是s_00001.wav,对应着“短消息.txt”文本中的一个句子。标注文件语料的标注分为声学层、韵律层和文本层共三层标注。声学层标注包括语音的音素、音节边界、基频曲线、音强参数等。声学层标注文件的命名方式为:c_序号.laa;q_序号.laa;s_序号.laa韵律层标注包括语音的韵律节奏边界等信息,文本层标注包括语句的读音、语法词边界、词性标注等信息。韵律层标注和文本层标注共用一个文件,命名方式为:c_序号.lap;q_序号.lap;s_序号.lap3、语料标注内容及方式(1)声学层标注示例:SIL2808913590000到d:aod1359000014730000ao1473000020370000(14732000,…,)处ch:uch2037000021500000u2150000023310000(21532000,…,)找zh:aozh2331000027770000ao2777000030570000(27773200,…,)寻x:vnx3057000034340000vn3434000036470000(34360200,…,)SIL3747000047190000这里SIL表示静音,汉字字符后面紧跟的是其读音,如果读音中间有“:”,表示这是一个多音素字节,紧接在SIL以及音素后面的两个数字是其在语音中的起始和结束边界,单位为10-7毫秒。在浊音后面括号中的数字,表示基频标注的位置,单位为10-7毫秒,数量根据基频标注的多少动态变化。(2)文本和韵律层标注示例:1.|<只好(POS=adv,P=zhi2hao3)>|<求(POS=v,P=qiu2)别(POS=adj,P=bie2)人(POS=n,P=ren5)>|<替(POS=v,P=ti4)他(POS=prep,P=ta1)><介绍(POS=v,P=jie4shao4)><一(POS=q,P=yi2)个(POS=q,P=ge5)>|<最(POS=adv,P=zui4)轻松(POS=adj,P=qing1song1)的(POS=u,P=de5)><工作(POS=n,P=gong1zuo4)>|.这里“(“前面的内容,表示一个完整的语法词,POS表示词性,P后面的内容表示读音,“<”和“>”表示韵律词边界。“|”表示韵律短语。(3)语音合成建库和分析工具与本语料相配的还有适用于语音合成语音库的建库工具,以及各种语音分析平台和工具包。