基因预测分析程序.doc
上传人:sy****28 上传时间:2024-09-13 格式:DOC 页数:51 大小:21KB 金币:15 举报 版权申诉
预览加载中,请您耐心等待几秒...

基因预测分析程序.doc

基因预测分析程序.doc

预览

免费试读已结束,剩余 41 页请下载文档后查看

15 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基因预测分析程序?基因分析程序是一个综合性程序,对一段DNA序列进行综合分析预测,找出可能的编码区确定外显子、内含子位置,翻译出可能的编码蛋白。GENSCANGenebuildergenscan?GENSCAN是美国麻省理工学院ChrisBurge于1997年开发成功的人类(或脊椎动物)基因预测软件,它根据基因的整体结构进行基因预测,不依赖于已有的蛋白库,是一种“从头预测”软件。目前ChrisBurge还开发了适用于果蝇、拟南芥菜、玉米的专用版本。对于非版本专用的物种,其预测准确率会下降。?根据作者ChrisBurge本人的数据,对特定核苷酸预测的校正准确率为91%,对外显子的平均准确率为80%。结果重新选择条件预测软件的评定标准?敏感性(sensitive)?特异性(specifity)M条基因序列,其余为非基因序列,预测测出N条序列,其中H条确实是基因,那么敏感性为H/M,特异性为H/NGENSCANAccuracySn=TP/APSp=TP/PPTP:预测中外显子中预测对的FP:预测错的外显子AP:实际外显子PP:预测出来的所有外显子PP:预测出的exonSensitivity:Sn=TP/APSpecuficity:Sp=TP/PPME:丢失的exonWE:错误的exon1、exon有时会因为一些原因丢失,一些潜在的exon可与realexon符合。2、在一段序列中,如果大量Suboptimalexon存在,提示这段可能存在交替剪切。3、Probabilitycutoff的选择1.0:没有给出Suboptimalexon0.1:建议使用P>0.99:总是excatlycorrect,可设计PCR引物0.5<0.99:大多数是excatlycorrect0.1<0.5:不可信,忽略一些exonGENESCAN遮蔽重复序列是在预测之后对比后进行的。GENESCAN,不遮蔽一些简单重复序列,如ATATATATATATA…,CAGCAGCAGCAGCAG…GENE数:近似正确,也会出现二者和一和一分为二的。物种:主要适合人类和脊椎动物。C.elegans不是很稳定。真核及酵母建议用Climmer和GeneMark预测。训练集:短exon和intron的相对简单的效果很好。所以对典型的DNA序列预测准确exon类型:中间较准,两段较差。启动子:建议NNPP。植物剪接信号:建议用SPLICEPREDICTIONWEBGENEGenebuilderhttp://l25.itba.mi.cnr.it/~webgene/genebuilder.html登陆CLUSTALW?http://www.ebi.ac.uk/clustalw/?将上述软件进行预测的结果进行比,看看有什么差别?将预测的结果和GENEBANK的序列进行比较,观察差别NCBIMAMQKIFAREILDSRGNPTVEVDLHTAKGRFRAAVPSGASTGIYEALELRDGDKGRYLGKGVLKAVENINNTLGPALLQKKLSVVDQEKVDKFMIELDGTENKSKFGANAILGVSLAVCKAGAAEKGVPLYRHIADLAGNPDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGASSFKEAMRIGAEVYHHLKGVIKAKYGKDATNVGDEGGFAPNILENNEALELLKTAIQAAGYPDKVVIGMDVAASEFYRNGKYDLDFKSPDDPARHITGEKLGELYKSFIKNYPVVSIEDPFDQDDWATWTSFLSGVNIQIVGDDLTVTNPKRIAQAVEKKACNCLLLKVNQIGSVTESIQACKLAQSNGWGVMVSHRSGETEDTFIADLVVGLCTGQAATKLSVVDQEKVDKFMIELDGTENKSKFGANAILGVSLAVCKAGAAEKGVPLYRHIADLAGNPDLILPVPAFNVINGGSHAGNKLAMQEFMILPVGASSFKEAMRIGAEVYHHLKGVIKAKYGKDATNVGDEGGFAPNILENNEALELLKTAIQAAGYPDKVVIGMDVAASEFYRNGKYDLDFKSPDDPARHITGEKLGELYKSFIKNYPVVSIEDPFDQDDWATWTSFLSGVNIQIVGDDLTVTNPKRIAQAVEKKACNCLLLKVNQIGSVTESIQACKLAQSNGWGVMVSHRSGETEDTFIADLVVGLCTGQIKTGAPCRSERLAKYNQLMRIEEALGDKAIFAGRKFRNPKAKSGESSSPGG