


作为固着生物,作物在生长发育过程中需要产生大量代谢物以适应不断变化的环境和各种胁迫。此外,各种内外因素可能导致特定代谢物丰度、代谢通量发生变化,或引发多条代谢途径的协同调控。影响作物生长发育的代谢物包括木质素、类黄酮、酚胺和脂质等。这些化合物广泛参与细胞膜重塑、花药育性、种子形成以及冷、旱等逆境胁迫响应等生长发育过程。它们还能影响作物生产中重要的营养品质相关性状,具有作为分子育种靶点的巨大潜力。因此,有必要从更宏观的 “代谢组” 视角研究代谢物的变化及其调控机制。目前,植物代谢组在现代植物生物学研究和生物技术应用中发挥着至关重要的作用。
高通量转录组学和代谢组学的大规模整合分析成为解析作物特定组织和不同发育阶段代谢物丰度影响因素的有效工具,这种方法有助于追踪同一组织内代谢物及其相应调控基因的动态变化。
那么转录组学和代谢组学联合在作物生长发育研究中如何分析呢?

分别在作物几个关键生长发育时期采集样品:
•种子萌发期:选取萌发3d的幼苗(带胚根和胚芽);
•幼苗期:选取3叶期的全株幼苗;
•分蘖期:选取分蘖数达到3-4个的植株,采集茎基部和新生分蘖芽;
•拔节期:选取主茎第一节间伸长2-3cm的植株,采集主茎和功能叶;
•孕穗期:选取剑叶完全抽出、穗开始分化时的植株,采集穗和剑叶;
•开花期:选取穗开花率达到50%时的植株,采集穗(含颖花)和剑叶;
•灌浆期:选取开花后15d的植株,采集穗(含灌浆籽粒)和剑叶。
每个时期每个生物学重复采集3份样品,每份样品重量≥0.5g。采集后迅速用液氮冷冻处理,置于-80℃超低温冰箱中保存备用。样品处理时,先去除杂质(如土壤、病叶等),用无菌水清洗3次,滤纸吸干表面水分,然后在液氮中研磨成粉末,用于后续组学检测。
为什么要进行转录组与代谢组关联分析?最基本的原因是代谢物与表型最为接近,代谢物的变化直接导致生物体表型发生变化,而转录组测序结果可以得到大量的差异表达基因,两者结合,可将基因的表达变化与代谢表型进行关联,利用基因和代谢物的表达水平、富集通路等信息,筛选共同变化的基因、代谢物及代谢通路,从而解释基因的变化水平是如何来调控代谢水平的变化,深度解析生物系统的宏观发育过程,解释生物过程的复杂性和整体性,提高文章的水平。
a)转录组:真核有参转录组,数据量6G(可根据需要提高数据量);
b)代谢组:植物广靶代谢组,参考自建植物数据库,排除外源信号干扰,MRM定量金标准,获得数千种发育相关的代谢物。
整体研究思路总结如下:首先,筛选生理表型数据,比如说不同组织或者发育阶段有明显差异的材料,统计并分析表型数据变化,确定5个以上的变化最明显的实验材料。接着分别对不同表型的样本进行转录组和代谢组检测,筛选出差异基因和差异代谢物做进一步分析。后续也可以选择对目的基因和代谢物进一步实验验证,提升数据质量,这样生信分析+实验验证的文章更容易获得审稿人的青睐。
关联分析思路主要包括三种:第一种基于两组变化显著的基因和代谢物共同富集到的通路关系,可能在某几条通路中或其中的一条通路中基因的表达水平发生改变导致下游的代谢物水平同时发生变化,最终影响到生物体表型发生明显变化,这样可以说明基因和代谢物及表型之间的直接关系。第二种分析思路是以核心差异代谢物为诱饵,通过基因与代谢物的相关性分析,筛选相关性系数r≥0.8(p_value<0.05)的基因,建立基因-代谢物-表型之间的关系。第三种分析思路是通过高级的WGCNA或者K-means分析,建立基因-代谢物共表达模块,通过关键代谢物寻找共表达基因,筛选强相关性的基因和代谢物进行后续研究也是一种有效的分析策略。
获得作物几个关键生长发育时期的转录组数据,描述检测平台,数据量,clean data,map结果等。描述PCA分析、韦恩分析等的结果。明确各时期的基因表达谱;筛选出每个时期的差异表达基因(DEGs),分析DEGs的数量变化趋势(如分蘖期和孕穗期DEGs数量是否显著增加);GO和KEGG富集分析结果显示,DEGs主要富集在光合作用、激素信号转导、碳水化合物代谢等通路;构建DEGs共表达网络,鉴定出各时期的核心调控基因。

图1 转录组中各样本基因统计及PCA分析、聚类分析
基于植物广靶的液相色谱-串联质谱(LC-MS/MS)的代谢谱分析方法对作物几个关键生长发育时期的代谢物进行分析。代谢组共鉴定出xx种不同的注释代谢物,包括xx种类黄酮、xx种氨基酸和衍生物、xx种脂类、xx种有机酸、xx种核苷酸和衍生物、xx种酚酰胺、xx种生物碱、xx种羟基肉桂酰和衍生物、xx种多酚、xx种碳水化合物、xx种维生素、xx种苯甲酸和衍生物、xx种多胺以及xx种其他类别的其他化合物。描述PCA分析、聚类分析等的结果。筛选出每个时期的差异积累代谢物(DAMs),分析DAMs的积累规律(如灌浆期淀粉、蔗糖等碳水化合物代谢物含量是否显著升高);KEGG富集分析结果显示,DAMs主要富集在淀粉和蔗糖代谢、氨基酸代谢、类黄酮合成等通路;绘制关键代谢通路的动态变化图,明确代谢物在作物生长发育过程中的转化规律。

图2 各组织代谢物聚类分析、PCA分析
为更好地探究作物生长发育过程中的代谢变化,采用k-均值聚类算法,根据xx种注释代谢物的积累模式将其分为xx个聚类。通过对xx个聚类的分析,我们发现了在特定组织中富集的代谢物,例如胚乳(聚类I)、胚根(聚类II)、根(聚类III)、叶片(聚类IV)、叶鞘(聚类V)、茎秆(聚类VI)、穗(聚类VII)和种子(聚类VIII)中的代谢物。还鉴定出分布在多个组织中的化合物,例如萌发组织(聚类IX)、营养组织(聚类X)和生殖组织(聚类XI)中的代谢物。此外,部分化合物在两种以上组织或阶段中富集(聚类XII)。获得“DEGs- DAMs”共表达数据集,构建作物生长发育的多组学调控网络,可视化展示基因、代谢物之间的调控关系;基于文献报道基因-代谢物互作对,在数据集中筛选出与之共表达的网络,尤其是调控网络中的关键节点,包括关键基因(如OsPIN1、OsARF)、核心蛋白(如生长素受体蛋白TIR1)、特征代谢物(如生长素IAA、脱落酸ABA、蔗糖、淀粉);划分出2个核心调控模块,明确每个模块参与的生长发育过程(如分蘖调控模块、灌浆调控模块)。

图3 作物生长发育过程中代谢物和基因的动态表达模式
描述选择基因的来源,如MYB转录因子在黄酮合同途径中发挥重要作用,已报道研究表明MYB转录因子可以与PAL、4CL、C4H等基因启动子结合激活下游基因的表达,从而增强植物抗病的功能。在我们构建的共调控网络中,xx种代谢物中有xx种黄酮特异性积累在种子中(聚类VIII),为进一步探究xx是否直接诱导xx代谢基因的表达,利用原生质体进行了双荧光素酶报告基因测定,表明xx是xx代谢物的正调控因子。为继续探究xx基因的潜在代谢功能,构建了由过表达转基因植株。发现转基因株系中代谢基因的表达显著高于野生型,相关代谢物同样也是。为表明该基因的表型,我们接种了xx菌或者xx胁迫,结果显示,过表达植株能增强作物抗病/胁迫的功能。证明该基因在作物生长发育调控中的关键作用。

图4 基因功能分析
通过转录组、代谢组联合分析,系统解析了作物几个关键生长发育时期的组学变化特征,构建了“基因-代谢物”协同调控网络,挖掘出一系列调控作物生长发育的关键基因和特征代谢物,并通过实验验证了关键节点的功能。主要结论如下:①明确了作物各生长发育时期的基因表达和代谢物积累的动态规律,发现分蘖期和孕穗期是组学变化最为显著的关键时期;②筛选出多个参与作物生长发育调控的核心通路,其中激素信号转导通路、黄酮代谢通路在整个生长发育过程中发挥重要作用;③鉴定出xx、xx等关键基因,以及IAA、ABA、蔗糖等特征代谢物,这些节点在调控网络中处于核心位置,对作物生长发育具有重要调控作用;④划分出分蘖调控、灌浆调控等核心模块,为解析作物特定生长发育过程的调控机制提供了重要依据。
百谱生物自主构建了70000种代谢物数据库GB-plantDB,建立了高通量代谢组检测平台。植物广靶代谢组分析能够一次定量检测3000种以上代谢产物,更加适合大量样品的高通量、广覆盖的代谢组学分析,有利于全面有效地比较代谢物差异与解析代谢途径。
