年11月,中国科学院植物研究所在HorticultureResearch(IF:6.)在线发表了题为“ThePhysalisfloridanagenomeprovidesinsightsintothebiochemicalandmorphologicalevolutionofPhysalisfruits”的研究文章,研究者利用三代测序结合Hi-C辅助组装技术,构建了毛酸浆高质量染色体水平基因组,并发现基因获得(复制)和基因丢失是果实性状进化的重要遗传基础,为茄科作物的进化遗传和育种提供了有价值的基因组资源。安诺优达为本次研究提供PacBio三代建库测序和Hi-C建库测序以及分析服务,安诺优达杨伟飞、张雪梅等为该文章共同作者。
文章名称:毛酸浆基因组为酸浆属果实生化和形态进化提供见解
发表期刊:HorticultureResearch
发表时间:年11月
影响因子:6.
样本选择
二倍体的毛酸浆幼叶
测序策略
PacBioSequelII基因组测序,90X
llluminaDNA小片段文库,PE双端测序,X
llluminaHiSeqXTen,Hi-C文库
研究背景
茄科是提供营养和果蔬多样性的重要来源之一。酸浆属作为茄科最大的属之一,具有独特的果实形态和生化多样性,是生态、进化和发育研究的新的园艺作物。毛酸浆作为酸浆属模式生物的代表物种之一,其花萼在受精后随浆果发育迅速膨大,形成“中国灯笼”或膨大花萼综合征(ICS)这一创新形态,包裹浆果。然而,酸浆属果实形态、生化特性及其起源背后的遗传基础还不够清楚。为了更好地了解茄科此类性状的起源、进化和发育机制,研究者使用PacBio三代测序技术和基于染色体构象捕获的Hi-C技术,实现了毛酸浆染色体水平的基因组组装。结合进化和功能分析,对酸浆属果实形态创新“中国灯笼”和特征性化学成分的进化遗传基础有了新的认识。技术路线
研究结果
01
高水平的毛酸浆基因组组装
首先,研究者通过对毛酸浆基因组进行Illumina测序得到Gb的高质量数据。研究发现基因组纯合度较高,并且有大量的重复序列。通过K-mer分析后,利用PacBio测序得到Gb的subreads,组装成条contigs,contigN50长度为4.87Mb。然后利用Hi-C数据将1.37Gb的数据组装为12条染色体,使用Illumina二代测序数据验证,并与全长转录组数据进行比对,来评估组装的完整性,结果表明得到了高水平的毛酸浆染色体水平基因组。
图1毛酸浆的形态和基因组组装结果
02
基因组注释和基因预测
利用蛋白质编码基因、tRNA和rRNA基因、转座因子及GC分布和基因组重排事件等信息,进行数据评估。结合denovo和同源性的方法,将数据整合到毛酸浆基因组中,并在转录组序列辅助下,注释蛋白质编码序列。在当前基因组版本中,共预测出32,个完整蛋白编码基因,进一步预测了3,个rRNA,个tRNA,个miRNA和3,个snRNA。
图2高质量的毛酸浆基因组
03
基因组进化分析
利用7,个单拷贝基因家族进行系统基因组分析,揭示了毛酸浆和其他12个代表性物种的拓扑结构。考虑到茄科植物共同的全基因组复制历史,进一步研究了酸浆属、番茄属和辣椒属三种基因组。在全染色体水平上,三个基因组之间存在明显的一对一共线关系,虽然基因组大小不同,但总体基因组是相对保守的,仅观察到几个小规模的染色体重排和物种特定的基因组区域。图3茄属植物的基因组进化
04
基因家族的进化分析
选取八种茄科植物的基因组,使用OrthoMCL法构建正交群,发现在茄科基因组中,大部分基因聚集在直系同源基因或旁系同源基因中;且某些基因家族在进化过程中经常发生扩张和收缩。在进一步揭示基因组独特性的研究中,选用毛酸浆和其他12种植物,发现直系同源基因、旁系同源基因和非聚类基因在13种植物中以相似的方式分布。GO富集分析中,毛酸浆的特异基因则发挥了多种作用。在以上多层次的进化分析中,在酸浆属、辣椒属和茄属植物的基因组中观察到小规模突变。其中,与甾体相关化合物生物合成途径关键步骤相关的基因和与毛酸浆形成相关的MADS-box基因的潜在遗传变异是