生物信息学复习题及答案.doc
上传人:王子****青蛙 上传时间:2024-09-14 格式:DOC 页数:10 大小:78KB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

生物信息学复习题及答案.doc

生物信息学复习题及答案.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

生物信息学复习题名词解释生物信息学,二级数据库,FASTA序列格式,genbank序列格式,Entrez,BLAST,查询序列(query),打分矩阵(scoringmatrix),空位(gap),空位罚分,E值,低复杂度区域,点矩阵(dotmatrix),多序列比对,分子钟,系统发育(phylogeny),进化树得二歧分叉结构,直系同源,旁系同源,外类群,有根树,除权配对算法(UPGMA),邻接法构树,最大简约法构树,最大似然法构树,一致树(consensustree),bootstrap,开放阅读框(ORF),密码子偏性(codonbias),基因预测得从头分析法,结构域(domain),超家族,模体(motif),序列表谱(profile),PAM矩阵,BLOSUM,PSI-BLAST,RefSeq,PDB数据库,GenPept,折叠子,TrEMBL,MMDB,SCOP,PROSITE,GeneOntologyConsortium,表谱(profile).问答题1)生物信息学与计算生物学有什么区别与联系?2)试述生物信息学研究得基本方法.3)试述生物学与生物信息学得相互关系.4)美国国家生物技术信息中心(NCBI)得主要工作就是什么?请列举3个以上NCBI维护得数据库.5)序列得相似性与同源性有什么区别与联系?6)BLAST套件得blastn、blastp、blastx、tblastn与tblastx子工具得用途什么?7)简述BLAST搜索得算法。8)什么就是物种得标记序列?9)什么就是多序列比对过程得三个步骤?10)简述构建进化树得步骤。11)简述除权配对法(UPGMA)得算法思想.12)简述邻接法(NJ)得算法思想。13)简述最大简约法(MP)得算法思想。14)简述最大似然法(ML)得算法思想.15)UPGMA构树法不精确得原因就是什么?16)在MEGA2软件中,提供了多种碱基替换距离模型,试列举其中2种,解释其含义。17)试述DNA序列分析得流程及代表性分析工具。18)如何用BLAST发现新基因?19)试述SCOP蛋白质分类方案。20)试述SWISS-PROT中得数据来源。21)TrEMBL哪两个部分?22)试述PSI-BLAST搜索得5个步骤。操作与计算题如何获取访问号为U49845得genbank文件?解释如下genbank文件得LOCUS行提供得信息:LOCUSSCU498455028bpDNAlinearPLN21—JUN—1999利用Entrez检索系统,对核酸数据搜索,输入如下信息,将获得什么结果:AF114696:AF114714[ACCN].3)相比使用BLAST套件搜索数据库,BLAST2工具在结果呈现上有什么优点?MEGA2如何将其它多序列比对格式文件转化为MEGE格式得多序列比对文件?什么简约信息位点Pi?以下软件得主要用途就是什么?RepeatMasker,CpGPlot,SpliceView,Genscan,ORFfinder,neuralnetworkpromoterprediction、7)为下面得序列比对确定比对得分:匹配得分=+1,失配得分=0,空位得分=—1。TGTACGGCTATATC—-CGCCT–TA8)用UPGMA重建系统发生树,距离矩阵如下:物种ABCDB9C811D121510E15181359)画出4个物种得3棵不同得无根树、这4个物种在某位置上得核苷酸分别就是T,T,C与C,为每个内部节点推断得祖先序列标出最可能得候选核苷酸,3棵可能得无根树中有几棵就是一样简约得(因为她们有最小替换数)?有几棵树得替换树就是2?有大于2个替换得树吗?10)如何将所研究得蛋白质与其她相关蛋白质做结构比对。答案部分一、名词解释:生物信息学:研究大量生物数据复杂关系得学科,其特征就是多学科交叉,以互联网为媒介,数据库为载体。利用数学知识建立各种数学模型;利用计算机为工具对实验所得大量生物学数据进行储存、检索、处理及分析,并以生物学知识对结果进行解释。二级数据库:在一级数据库、实验数据与理论分析得基础上针对特定目标衍生而来,就是对生物学知识与信息得进一步得整理.P11,第2段。FASTA序列格式:就是将DNA或者蛋白质序列表示为一个带有一些标记得核苷酸或者氨基酸字符串,大于号(〉)表示一个新文件得开始,其她无特殊要求。genbank序列格式:就是GenBank数据库得基本信息单位,就是最为广泛得生物信息学序列格式之一。该文件格式按域划分为4个部分:第一部分包含整个记录得信息(描述符);第二部分包含注释;第三部分就是引文区,提供了这个记录得科学依据;第四部分就是核苷酸序列本身,以“//”结尾。