如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
学校代码:10062学号:04063201012本科毕业论文(设计)UNDERGRADUATEDISSERTATION论文题目:基于PSSM矩阵构建ANN预测蛋白质二级结构TITLEProteinSecondaryStructurePredictionUsingArtificalNeuralNetworkBasedonPSSM院系专业年级学生姓名指导教师生物医学工程系生物医学工程2004级王伟田心教授杨惠云助教2008年6月天津医科大学生物医学工程系学士学位论文摘要目的:生物信息学关于生物序列研究的工作主要集中在氨基酸序列的研究上,这是因为氨基酸序列决定了蛋白质的空间结构,而蛋白质空间结构决定了蛋白质生理功能的多样性。蛋白质二级结构预测对于我们了解蛋白质空间结构是至关重要的一步。方法:本文利用MATLAB软件,构建前向型BP神经网络,用位置特异性得分矩阵(position-specificscoringmatrics,PSSM)方式对氨基酸编码,文章提出的二级结构预测方法,基于位置特异性打分矩阵构建人工神经网络预测蛋白质二级结构。利用位置特异性打分矩阵对CB513序列进行打分,并将其随机分为7组,对BP人工神经网络进行训练。结果:采用PSSM对蛋白质二级结构进行编码,并采用7-交叉验证,得到Q3准Q确率为72.51%,QH为72.79%QE为60.97%,C为78.45%,相对于二进制编码方式(基于5位编码方式)、正交编码方式、密码子编码方式,预测精确率都有显著提高。结论:远程进化信息的位置特异性打分矩阵的神经网络模型,能够更好的预测蛋白质二级结构。关键词:蛋白质结构预测;二级结构;人工神经网络;位置特异性打分矩阵;序列分析1天津医科大学生物医学工程系学士学位论文AbstractObjects:ThekeyworkofBioinformaticsinresearchingthesequencesfocusedontheaminoacidsequences.Thatisbecausetheaminoacidsequencesdecidethestructureoftheprotein,andthemultiformityoftheproteinfunctionsisdependedonthestructure.Proteinsecondarystructurepredictionisanimportantstepinunderstandinghowproteinfoldinthreedimensions.Methods:ThispaperpresentamethodthattheneuralnetworkusedtopredictproteinsecondarystructurebasedonthepositionspecificscoringmatricesgeneratedbyPSI-BLAST.Despitethesimplicityandconvenienceoftheapproachused,theresultsarefoundtobesuperiortothoseproducedbyothermethods.CB513isgetfromtheProteinDataBank(PDB),andtraintheneuralnetwork.7-crossvalidationhasbeenused,andwegettheQ3predictionaccuracyis72%.Thepredictionaccuracyismuchbetterthanthebinaryencoding,theorthogonalencodingandthecodonencoding.UsingpositionspecificscoringmatricestoevaluationthesequencesofCB513,andgroupinginto7groupsinrandom,thentrainingtheneuralnetwork.Results:Despitetheconvenienceoftheapproachused,theresultsarefoundtobesuperiortothoseproducedbyothermethods.CB513isgotfromtheProteinDataBank(PDB),andtraintheneuralnetwork.7-crossvalidationhasbeenused,andwegettheQ3predictionaccuracyis72%,QHis72.79%QEis60.97%,QCis78.45%.Thepredictionaccuracyi