宏基因组学技术已经成为一个标准的工具,通过对环境样品中群落 DNA 的 随机打断测序来分析群落结构组成(DeLong et al, 2006; Rusch et al, 2007)以及后 续蛋白编码基因多样性等的分析。然而 DNA 序列信息只代表了物种具有某种特 定的代谢潜力,有研究表明既定的物种在任何时间段都只表达所有基因的 1/3。所以理解微生物群落如何应对环境因子的变化,包括活性基因的表达情况以及物种代谢活跃程度则需要通过分析群落微生物的 mRNA 的表达情况及参与物种分类的标记基因表达情况去解析。
1997 年 Velculescu 等首次将特定细胞在特定时间段表达的所有基因总和称为转录组。转录组学研究中方法学的改进包括使用流式细胞 仪筛选活性细胞(fluorescently activated cell sorting, FACS)并测基因组序列、使 用稳定同位素标签(stable-isotope probing, SIP)追踪群落中 代谢活跃的成员、使用溴脱氧尿苷(BrdU)标记的胸腺嘧啶核苷类似物标记生 长中的细胞用于分离测序或者直接分离纯化 RNA 并测序去了解何种微生物活跃以及何种基因被表达。当上述方法运用到微 生物群落中时,这些就被总称为宏转录组学技术(Metatranscriptomics)。
宏转录组学研究早期使用基因芯片(Microarray)、cDNA 文库(表达序列标签,expressed sequence tag, EST)等手段进行研究。高通量测序技术越来越多的被应用到宏转录组的研究中。2006 年, Leininger 等发表在 Nature 上的文章中首次利用 454 焦磷酸测序技术对土壤中氨氧化微生物的宏转录组信息进行了研究,这是首次宏转录组学技术对微生物群落 的研究报道。
由于宏转录组样品制备难度大于宏基因组,包括 RNA 的稳定性较差,总 RNA 中超过 90%以上都是 rRNA,这些 rRNA 的丰度与代谢活力的 比较可以反映出群落中代谢活跃的物种,但是却无法揭示在特定环境下基因的表达情况以及代谢通路的构成,目前市面上存在针对环境样品中绝大部分细菌的rRNA的去除试剂盒,可以很大程度的降低后续测序中的rRNA占比。