一般生物体中的的RNA中,rRNA占绝大多数,含量超过90%,而mRNA的含量在1-2%,左右,转录组测序文库是以样本的Total RNA为基础,从中提取mRNA构建测序文库,因此文库构建包括mRNA富集和碎片化、mRNA反转录、接头添加和PCR富集等过程。
mRNA富集
在生物的Total RNA中,mRNA所占比例很低,绝大部份时核糖体RNA (rRNA),因此如果直接使用Total RNA进行测序,得到的结果必然是不准确的,因此需要先将Total RNA中的mRNA分类纯化出来。
转录组测序的文库根据待测样品的物种分为真核转录组和原核转录组。由于真核生物和原核生物mRNA结构不同,因此在mRNA富集时所采用的方法也并不相同。
真核生物mRNA中含有polyA尾结构,因此可以使用oligoT与其特异性的匹配,从而在Total RNA中特异性的富集mRNA。
然而,原核生物并不像真核生物mRNA具有polyA的结构,因此,无法直接利用oligoT将mRNA纯化出来,目前,提高原核生物中mRNA的量,最主要的方式是去除Total RNA中rRNA。
由于测序仪器不能直接对RNA测序,所以还要反转录成cDNA
链特异性文库
由于转录组文库构建过程中要将mRNA反转录为双链的cDNA,因此,在测序时,即会同时得到cDNA双链的序列信息,这就消除了mRNA单链的特性,无法区分cDNA中的正义链和反义链。
因此提出了另一种文库构建方式,链特异性文库,其在文库制备和测序中保留mRNA 的方向信息,使得有效数据增多,基因表达定量更准确;基因注释更准确,新基因识别等分析更可靠;同该方法能够鉴定与开放阅读框反义的ncRNA、发现反义转录本。
其建库原理与普通转录组类似,不同之处在于合成第二链cDNA时,用dUTP代替dTTP,此时第二链cDNA上布满了含dUTP的位点。
在接头连接后用一种特定的酶,其可在尿嘧啶位置产生一个单核苷酸缺口,从而消化掉第二链cDNA,只保留第一链cDNA,随后进行PCR扩增纯化,得到只含第一链cDNA信息的文库。