如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
破解RNA测序技术(下)随着新一代高通量DNA测序技术的快速发展,RNA测序(RNA-seq)已成为基因表达和转录组分析新的重要手段,并且随着RNA的重要性逐渐被人们所认识,研究人员也开发出多种方法来研究它,各个厂家也相继推出了相关的产品。目前RNA测序产品技术主要分为两类,一类是将DNA高通量测序技术应用到由mRNA逆转录生成的cDNA上,从而获得来自不同基因的mRNA片段在特定样本中的含量,各种类型的转录本都可以用深度测序技术进行高通量定量检测。另外一类就是最新的直接测序方法:利用单分子测序技术来进行RNA直接测序。第一类的主要代表是Illumina/Solexa测序技术,具体可见新技术:破解RNA测序的方方面面(中),另外今年LifeTechnologies公司在这一技术的基础上也开发出了一种单细胞转录组测序技术,可以用于研究细胞从内细胞团发育成胚胎干细胞时的基因表达变化。这项技术主要是以去年的一篇NatureMethods上的单分子RNA测序方法为技术,在只含有100飞克(1飞克=10-15克)mRNA的细胞上验证了这种方法,目前LifeTechnologies公司正在开发一个试剂盒,用于“低起始量”的转录组测序,但目前还没有上市日期。利用这种技术,研究人员可以展示当细胞发育时基因表达是如何改变的,他们还鉴别出两类看起来负责调控多能性的microRNA,以及似乎在调控发育中起作用的选择性剪接事件。而另一种新型单分子测序技术在RNA测序领域当属HelicosBioSciences公司,近期他们也发表了一篇验证文章,证明了利用这汇总单分子测序技术能进行RNA直接测序。这个过程不同于之前的技术方法主要是在于能跳过将mRNA逆转录成cDNA这一过程,因此不会出现反转录、扩增、连接以及其他cDNA合成步骤的相关困难,而是能利用极少量的总RNA来综合、无偏见地浏览转录组。并且这种方法还能消除转录组分析偏误,目前这种RNA直接测序方法目前的错误率约为4%,大部分是黑暗碱基(darkbase)引起的缺失,插入的错误率为1-2%,而替换的概率只有0.1-0.3%。但是这种方法中,由于mRNA比较脆弱,操作上也要多加注意。这种方法的技术原理是边合成边测序方法,首先研究人员对一段40个碱基的RNA序列进行测序,来检验这种方法。大约一半(48.5%)的读长是20个核苷酸或更长。最长的无误差读数是38个碱基。随后他们将注意力转向酿酒酵母这种模式生物。因为酿酒酵母的大部分RNA本身就存在聚腺苷酸化,所以她们不需要在测序前再加上poly-A尾巴。研究人员为了让“边合成边测序”的反应适应直接的RNA测序,优化了使用的聚合酶到缓冲液,并利用专利的荧光核苷酸类似物,从而能在poly(dT)包被的表面捕获聚腺苷酸化的RNA,并利用大肠杆菌poly(A)聚合酶I来进行边合成边测序的步骤。目前在HelicosBioSciences公司网站上暂没有看到相关产品的信息,不过相信不久以这种技术为原理的产品将会进入市场。除了上述的方面,由于RNA测序本质上只是一种高通量的计数技术,它提供了一种方法来决定细胞中的转录有多丰富,因此RNA测序数据的处理和分析看起来就显得额外重要。将RNA-seq测序文库加入流动槽中的各通道,在桥式PCR扩增后,就可以进行测序了。测序过程中,计算机软件同步地对荧光图像数据进行处理,通过分析荧光信号来确定被测碱基,并给出质量评分。按照图像上的位置坐标,计算机程序将同一位置测得的碱基根据测序顺序连成读段。由于荧光图像文件所占有的磁盘空间很大,通常GAIIx平台一次实验就能产生上太字节(TB)的图像文件,所以一般情况下不予保留原始的荧光图像数据,而是只保留程序读出的读段数据及对应的质量分值,这就是多数实验室委托测序中心进行RNA-seq测序后得到的最原始的数据。为方便保存和共享各实验室产生的高通量测序数据,NCBI,EBI,DDBJ等数据中心建立了大容量的数据库SRA(SequenceReadArchive,来存放共享的测序数据。而对于原始数据的加工,首先需要将所有测序读段通过序列映射定位到参考基因组上,这是所有后续处理和分析的基础。高通量测序的海量数据对计算机算法的运行时间提出了很高的要求。针对诸如llumina/Solexa等测序平台得到的读段一般较短、且插入删除错误较少等特点,人们开发了一些短序列定位算法。这些算法主要采用空位种子索引法(spaced-seedindexing)或Burrows-Wheeler转换(Burrows-WheelerTransform,BWT)技术来实现。之后选择性进行基因表达水平估计,选择性剪接事件识别和剪接异构体表达水平,检测新基因,序列注释等,更多相关的内容可以参考相关文章(