本科毕业论文-—连续语音识别中半连续hmm的研究及实现.doc
上传人:王秋****哥哥 上传时间:2024-09-11 格式:DOC 页数:71 大小:2.1MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

本科毕业论文-—连续语音识别中半连续hmm的研究及实现.doc

本科毕业论文-—连续语音识别中半连续hmm的研究及实现.doc

预览

免费试读已结束,剩余 61 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

密级:内部连续语音识别中半连续HMM的研究及实现ResearchandImplementofSCHMMinCSR(申请清华大学工学硕士学位论文)独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得清华大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。签名:日期:关于论文使用授权的说明本人完全了解清华大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。签名:导师签名:日期:PAGEIV摘要SCHMM作为一种有效的语音识别技术,它充分地吸收了离散HMM和连续HMM的优点,具有识别精度高搜索速度快等特点。特别是它的码本绑定策略,由于从全局的角度来共享和调整码本,所生成的码本性能更好,能够有效地反映语音空间的特征,因此只要少量的码本就能使系统达到较好的性能,大大减轻了码本计算的复杂性,提高了系统识别的速度。研究内容包括如下几个方面:在初始码本生成中引入了随机松弛算法,SCHMM的初始码本生成是一个矢量量化的问题,量化的困难是量化结果通常会陷入局部最优,采用随机松弛算法能够比较好地克服这个缺点。在连续语音训练中,通过减去句子单元信息,克服了Baum-Welch算法训练不同类型句子时发生数据奇异的缺陷。改进了SCHMM的搜索算法,通过对码本进行剪枝,Beam剪枝等措施,在保证一定识别率的前提下,大大减少了搜索在时间和空间上的消耗,加快了搜索的速度。实现了一个基于SCHMM的连续语音训练和识别系统。关键词:语音识别,半连续HMM,码本,随机松弛,搜索AbstractAsanefficienttechnologyofspeechrecognition,SemiContinuousHMM(SCHMM)integratestheadvantagesofdiscreteHMMandcontinuousHMM,andprovidesahighrecognitionaccuracyandsatisfactoryspeed.Inparticular,sincethesharingandmodificationofcodebooksinglobalscope,thecode-bindingstrategymakesitpossibletogeneratemuchbettercodebooksthatcoulddescribethefeatureofacousticspacemoreaccurately.Insuchacase,smallcodebookscanprovidesatisfactoryperformancesothatthecomputationalcomplexityisreducedandtherecognitionspeedisincreased.ThekeyresearchcontainsthefollowsThealgorithmofstochasticrelaxationisintroducedintocodebookinitialization.CodebookinitializationofSCHMMisaproblemofvectorquantification,whosetroubleisthatthequantificationresultoftenreachesthelocalminimalpoint.Theintroductionofstochasticrelaxationovercomesthisprobleminourexperiments.Incontinuousspeechtraining,thedisadvantagethatBaum-Welchalgorithmcouldbethrownintodataodditybecauseofdifferentsentencesgivesvariousweightstotheestimationisresolvedbysubtractingsentenceinformation.Throughcodebookselection,beampruning,thesearchalgorithmofSCHMMismodifiedsothatthecostofsearchisreducedint