(河南省农业科学院经济作物研究所,河南郑州 450002)
异源多倍化是植物界普遍存在的一种生物学现象,是物种形成的重要途径。自然界中超过95%的被子植物在其进化历程中至少发生过一次多倍化事件。与二倍体祖先相比,多倍体植物在产量和抗逆性等方面具有独特的优势,并在生产上得到广泛应用。很多重要的农作物,包括小麦、棉花、油菜等都是多倍体,拟南芥、水稻、玉米、大豆和甘蓝等二倍体作物也都保留有古多倍体的痕迹。
野生及栽培驯化的多倍体有很强的适应性,在农业生产中发挥了巨大的作用.但人工合成的异源多倍体是不稳定的,基因组结构发生了快速的变化。鉴于此,针对多倍体在异源多倍化过程中基因组结构和基因表达模式的变化以及转座子和表观遗传变化的研究进展进行综述,以期为了解植物进化的机制提供参考。
1 基因组结构变化
异源多倍体形成过程中,为了适应杂交和多倍化对基因组的冲击,新融合的基因组发生了快速的二倍化过程,包括基因组重排、序列扩增和消除等。Song等首先报道了芸薹属的人工异源四倍体形成后,基因组结构发生了快速、广泛的变化,包括亲本片段的丢失以及新片段的出现,这些变化被认为是由部分同源染色体间的相互移位和不等交换造成的。以小麦基因组特异序列(GSS)和染色体特异序列(CSS)为探针,研究小麦属不同倍性多倍体的基因组序列变化发现,快速而非随机的序列消除在小麦多倍体中普遍存在,消除的序列包括重复序列和编码序列。序列消除使异源基因组间的差异性更加明显,成为染色体二倍化的多倍体。染色体二倍化有利于异源多倍体物种在自然界的稳定和进化。为了更好地洞悉伴随多倍化发生的遗传变化,Ozkan等对新合成的35个属间和种间F1以及22个人工异源多倍体(1~3代)进行研究,结果表明,序列丢失发生于F1,自交3代后趋于稳定。Shaked等的研究表明,在组合(Ae.sharonensis×Ae. umbellulata)中,母本(Ae.sharonensis)中有14%的位点在人工多倍体中丢失,而父本(Ae.umbllulata)中只有0.5%丢失。Dong等用AFLP分析了人工六倍体小麦和自然六倍体中国春的DNA指纹,发现两者的基因组中均有20%的条带偏离了亲本的加性效应。
与芸薹属和小麦属异源多倍体不同,棉属多倍体在异源多倍化后基因组序列几乎没有发生变化。米草属(Spartina)多倍体在异源多倍化后发生变化的频率也很低。这表明,与芸薹属和小麦相比,棉花和米草对种间杂交和基因组加倍的忍耐性较高。拟南芥异源多倍体基因组和染色体的变化介于棉花和小麦的人工异源多倍体之间。在拟南芥异源四倍体中发现,异源多倍化后约有1%的基因组位点发生了变化。Grover等对棉属异源多倍体及其原始祖先的AdhA邻近区域的微共线性进行了研究,表明很多差异是由于反转录转座子的转座和序列消除的累积造成的。这为多倍体形成后“基因组缩减”现象提供了证据,在一定程度上也反映了多倍化后发生了高频率的小片段缺失。
2 基因表达模式的变化
基因沉默在异源多倍化过程中普遍发生,人工异源四倍体拟南芥、人工四倍体小麦及棉花中基因沉默发生的频率分别为0.4%、1%和5%。沉默的基因包括转座元件和植物生长发育相关的基因。基因沉默频率的差异,暗示着不同物种基因组对异源多倍化冲击的忍耐性不同。异源多倍化可激活反转录转座子和蛋白质编码基因。对人工四倍体小麦的研究表明,在表达发生变化的基因中有20%为激活表达,包括反转录转座子。在新合成的六倍体小麦中,仅发现1个编码蛋白质基因的激活,而在新合成的异源四倍体棉花中,未发现有新基因的激活。Cronn等用特定位点分离技术和比较作图,研究了异源多倍体棉花中部分同源基因位点的进化,通过研究从异源多倍体中和双亲中分离的16个位点,发现异源多倍体棉花中很多部分同源基因是彼此独立进化的,且和二倍体祖先的进化速率一致。Adams等研究了异源四倍体棉花中40对部分同源基因在不同器官中的表达情况,发现有13对部分同源基因发生了沉默或偏表达。为了研究单个棉纤维细胞发育过程中部分同源基因表达的变化,Hovav等用基因芯片同时检测了1484对部分同源基因,结果表明,在棉纤维细胞发育的3个阶段(起始期、伸长期、次生壁合成),约30%的部分同源基因表现为偏向性表达(偏A或D组),进一步比较棉花的栽培种和野生种发现,人工选择的栽培驯化导致了棉花纤维细胞中基因偏向D组的表达。Bottley等用cDNA-SSCP的方法对小麦中236个单拷贝的部分同源基因进行了研究,结果表明,大约有27%unigenes在小麦叶片中表达,约有26%则在根中表达。部分同源基因的表达变化具有器官特异性,这暗示多倍化后部分同源基因可能发生着快速的亚功能化。Chagué等利用Affymetrix小麦基因组芯片对人工异源六倍体小麦进行了全基因组的基因差异表达分析,结果表明约93%的基因为加性表达,只有约7%(2000个)为非加性表达,部分同源基因的表达没有基因组的偏向性。
异源多倍化所带来的一个直接结果是基因重复。多倍体基因组中的重复基因可能有以下3种不同的命运:沉默或假基因化、分化并执行新的功能、亚功能化。菊属植物的查尔酮合酶(Chalcone Synthase,CHS)基因家族由于基因成员的冗余,序列DCCHS5由于编码区的序列删除最终蜕变为假基因。重复基因进化过程中的亚功能化和新功能化已经证实存在于很多多倍体物种中,包括棉花、小麦、甘蔗等。
3 反转录转座子与基因表达的变化
转座子是可移动的遗传因子,是真核生物基因组的重要组成成分。转座子通过转位造成染色体的断裂、异常重组和基因组重组。转座子插入到基因内部或基因附近可以造成基因失活或改变基因的表达模式或改变所编码蛋白质的结构。DNA甲基化是抑制转座子在寄主基因组中转座的一种方式。
转座子在植物中普遍存在,并在植物多倍体物种形成中起重要作用。研究表明,人工合成异源多倍体和天然异源多倍体中均有反转录转座子的激活。与亲本相比,人工异源多倍体拟南芥中DNA转座子和反转录转座子都有更高的转座活性。Kashkush等研究表明,激活的反转座子Wis2-lA改变了两侧基因的表达模式。
4 植物多倍体中的表观遗传
表观遗传是指基因序列不发生改变的情况下,基因表达了可遗传的变化,主要包括DNA甲基化、基因组印记以及核仁显性等。远缘杂交和基因组加倍可诱发基因组内编码及调控序列发生迅速的表观遗传变化,从而导致基因沉默、产生新性状以及转座子活性的抑制。
基因沉默与高水平的DNA甲基化和低水平的组蛋白乙酰化有关,去甲基化可引起基因激活,过度的甲基化可引起基因沉默。越来越多的证据表明,无论是转录失活还是转录后沉默都与DNA甲基化有关。Lee等研究人工四倍体拟南芥中一些呈沉默表达的基因,发现基因组中存在这些基因的完整DNA序列,使用aza-dC处理阻断基因组的胞嘧啶甲基化后,这些沉默基因又表现出了活性。“核仁显性”即亲本之一的rRNA基因在多倍体中沉默,是基因表达模式发生改变的典型例子,是多倍化过程中另一个突出的表观遗传现象。Chen等对芸薹属异源多倍体植物的研究发现,来自不同亲本的rDNA基因的表达具有组织特异性。Chen等在人工合成的四倍体拟南芥中也发现了“核仁显性”现象,认为“核仁显性”现象是基于不同基因组成分之间的相互作用。Ksi&#261&#378czyk等对芸薹属人工四倍体(AACC)的rDNA位点的研究表明,从F1代开始,C-基因组的核仁组织区发生了快速的凝集和聚合酶I启动子的甲基化,致使基因沉默发生了B.oleracea基因组的偏向性。Mittelsten等的研究表明,染色体的倍性能改变基因的表达模式。Comai认为,表观遗传变化是多倍体基因组中基因表达调控模式改变的主要原因。
5 展望
广泛分布在自然界的异源多倍体植物,由于整合遗传背景不同的多套基因组,基因库大大扩增,使得异源多倍体不仅耐受更多的基因变异,而且能使基因获得更多产生功能分化的机会。多倍化后重复基因在进化过程中的命运是近年来国际上关注的热点,尽管已取得一定的进展,但知之甚少。因此,需要进一步深入研究多倍化后重复基因功能分化的时间、机制以及基因表达调控网络的变化,探索在异源多倍体中固定的“杂种优势”,为多倍体育种提供理论指导。
注明:国家自然科学基因项目(30370878)
Tags:多倍体植物基因组结构和基因表达的变化研究进展