籼稻Kasalath全基因组拼接注释以及水稻不同亚种比较分析的中期报告.docx
上传人:快乐****蜜蜂 上传时间:2024-09-14 格式:DOCX 页数:3 大小:11KB 金币:5 举报 版权申诉
预览加载中,请您耐心等待几秒...

籼稻Kasalath全基因组拼接注释以及水稻不同亚种比较分析的中期报告.docx

籼稻Kasalath全基因组拼接注释以及水稻不同亚种比较分析的中期报告.docx

预览

在线预览结束,喜欢就下载吧,查找使用更方便

5 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

籼稻Kasalath全基因组拼接注释以及水稻不同亚种比较分析的中期报告一、背景介绍水稻(Oryzasativa)是世界上最重要的粮食作物之一,其主要分为两个亚种:籼稻(Oryzasativasubsp.japonica)和粳稻(Oryzasativasubsp.indica)。每个亚种内又包含多个不同的品种,其中籼稻品种Kasalath是一个重要的研究材料。目前,水稻的全基因组已经完成测序和注释,但仍需要更深入的研究来揭示其分子机理。比较不同亚种之间和不同品种之间的差异可以帮助我们更好地了解水稻的遗传多样性和重要性状的形成。二、Kasalath全基因组拼接注释1.数据来源本研究使用了公共数据库中的Kasalath基因组测序数据,包括IlluminaPE数据和PacBio长读数据。其中IlluminaPE数据覆盖广泛,可以用于拼接;PacBio长读数据能够提高精度,特别是在复杂的基因区域。2.拼接我们使用了SOAPdenovo2软件对IlluminaPE数据进行拼接,生成了初始的连通图。然后,我们使用PacBio长读数据对连接图进行错误纠正和连接,形成更长和更连续的超级连边。最后,我们使用JoiningContigswithLinked-Reads(JCLR)方法将长读连接边与PE连接边进一步完善。3.注释完成基因组拼接后,我们使用RepeatMasker、RepeatModeler和RepeatProteinMask等软件对基因组进行了重复序列注释,并用TandemRepeatsFinder对串联重复序列进行了注释。然后,我们使用Augustus和GeneMark-ES对基因进行了结构注释,并使用EVidenceModeler将多个注释结果整合为最终的结构注释结果。三、不同亚种的比较分析1.数据来源我们选择了不同亚种间及其代表品种的高质量基因组序列进行比较分析,包括:籼稻Kasalath、粳稻Nipponbare、粳稻93-11、粳稻Minghui63和粳稻Gui630。这些基因组序列均可在公共数据库上获取。2.分析方法我们使用QUAST软件对基因组序列进行评估和比较,包括序列长度、重复序列占比、基因数目、基因长度、外显子比例等。同时,我们使用BUSCO软件对基因组序列进行基因组完备性检查,并使用MUMmer软件比对基因组序列彼此之间的相似度和结构变异。三、初步结果1.Kasalath基因组拼接我们使用IlluminaPE数据将Kasalath基因组拼接成了10250个contig,N50为25.7kb,最长contig为853.3kb。使用PacBio长读数据纠正了错误,连接了contig,形成了4186个scaffold,N50为4.24Mb,最长scaffold为39.4Mb。2.Kasalath基因组注释我们注释了Kasalath基因组中的22386个蛋白编码基因,并预测了16889个转录因子家族成员。Kasalath基因组的重复序列占比为47.7%,其中,LTR占比最大,为22.1%。3.比较分析结果我们的结果表明,不同亚种之间在基因数目、基因平均长度、基因组完备性等方面有差异。粳稻基因数目相对较多,但平均长度相对较短;籼稻基因平均长度相对较长。同时,不同品种之间的差异也比较明显,这为进一步了解水稻的遗传多样性提供了帮助。四、总结本研究完成了籼稻Kasalath全基因组拼接注释,并对不同亚种的基因组进行了比较分析。初步结果表明,不同亚种和品种之间的基因组结构和基因特征存在差异,这为进一步了解水稻的遗传多样性和性状形成提供了依据。
立即下载