转自公众号Eric生信小班。学习群体遗传套路
中科院昆明动物园吴东东研究团队联合国外研究团队2019年在Genome Biology发表题为Whole genomes and transcriptomes reveal adaptation and domestication of pistachio的研究论文,利用全基因组和转录组数据,系统研究了开心果在驯化与环境适应上的遗传机制,研究内容和方法采用群体基因组学的常规分析,包括基因组de novo、转录组、群体进化、选择位点分析,可作为群体基因组学分析的标准化示范文献。
开心果(Pistacia vera, 2n = 30)又名阿月浑子,生活中较为常见的坚果种类之一,漆树科黄连木属多年生落叶果树,其野生种起源于中亚、中东地区,现在世界主产国有美国、土耳其等。开心果树能适应严酷的生长条件,具有耐旱、抗热、抗盐碱等特性,同时果实具有低脂肪、低卡路里、高纤维等特点,具有重要的经济价值。
利用二代和三代(pacbio)数据组装了671Mb大小的开心果参考基因组,组装质量contig N50和scaffold N50分别为75.7kb和949.2kb。转座子占基因组70.7%,注释了31784个编码基因和161个miRNAs。基于9个物种1096组单拷贝基因建树,发现开心果在5800万年前与橙子(Citrus sinensis)分化,在1.05亿年前与毛果杨(Populus trichocarpa)分化(图1c)。开心果、无油樟(Amborella trichopoda)、毛果杨(Populus trichocarpa)三者基因组共线性分析结果表明开心果在分化后并没有发生特异性谱系全基因组复制(图1b),4DTv分析也支持上述结论。
为了进一步揭示开心果抗旱、抗盐等重要表型的遗传机制,通过OrthoMCL鉴定基因家族,KEGG和GO功能富集表明开心果独有的基因家族中很多涉及防御反应,许多基因含有NB-ARC和NBS-LRR结构域。同时,对扩增的基因家族进行功能富集表明其多于萜类、黄酮类、倍半萜类、生物碱等生物合成有关,特别的是细胞色素P450基因家族的扩增可能与开心果抗盐相关。为了研究开心果抗盐的遗传机制,文章从转录组层面进行近一步分析。将开心果置于盐处理和正常环境下,取根和叶组织进行转录组测序。通过Tophat-Cufflinks-Cuffdiff流程,在根和叶中分别得到214 和461个差异表达基因,并对差异表达基因进行功能富集分析。结果表明,15个细胞色素P450基因和几丁质酶基因家族在耐盐环境下,表达量差异明显。特别是CYP74A(图2b)。已有研究表明CYP74A催化参与茉莉酸生物合成途径,且研究人员还发现了7个响应茉莉酸途径的基因在耐盐环境下的表达量也显著提高(图2c)。综上,可以推断茉莉酸途径在开心果耐盐特性中起到了重要的调控作用。
此外,文章还对93个栽培种,14个野生种和35个野生开心果近缘物种(包括P. mutica, P. khinjuk, P. integerrima和 P. palaestina)进行了重测序,平均深度为6~8x。通过GATK流程鉴定到1477万个SNP,利用Treemix构建群体进化树,发现一些野生开心果近缘物种之间存在渗入(如从*P. khinjuk *到 P. integerrima ),但对于栽培种,并没有发现其他物种的渗入信号,这一结果也被ABBA-BABA检验支持。PSMC分析发现,开心果有效群体大小在更新世时期经历了遗传瓶颈,在200万年前又发生了种群扩张。δaδi 分析结果推断开心果大约在8000年前被驯化,并经历了两次人工选择。系统发生树和主成分分析结果发现栽培品种分成两组,古老栽培品种(Group Ⅱ)与野生开心果亲缘关系更近,其连锁不平衡率与野生种几乎相同,且表型上其种子大小与野生种相近,群体结构分析也表明该组有很大比例的野生成分(图4)。以上结果表明栽培开心果经历了驯化与改良两个人工选择阶段。
遗传多态性θπ与分化参数Fst分析,发现在栽培种在驯化过程中有些区域多样性降低,分化明显,推测可能受到了人工选择,最终鉴定到了9.2Mb的候选选择区域。重点关注区域中受到正向选择且与表型相关的基因,如影响树形大小的SAUR55基因和影响种子大小的CYCD7-1基因(图5),其转录水平上野生与栽培也存在显著差异。