**The genome of Dioscorea zingiberensis sheds light on the biosynthesis, origin and evolution of the medicinally important diosgenin saponins **
薯蓣皂素成为不可替代的合成甾体激素类药物的理想原料已近90年。盾叶薯蓣被认为是世界上最理想、最重要的甾体激素药源植物之一。
该研究采用三代Oxford Nanopore、Hi-C、10X Genomics技术进行盾叶薯蓣全基因组测序,组装得到一个染色体水平的参考基因组。大小为629 Mb,contig N50为1.16 Mb。盾叶薯蓣基因组中存在大量扩张的基因家族,其中,参与薯蓣皂苷生物合成的基因家族如CYP450、UGT以及OSC等基因家族成员数量显著扩增,这可能是盾叶薯蓣能够大量合成薯蓣皂苷的主要原因之一。盾叶薯蓣基因组中全基因组加倍事件以及基因的串联重复产生了大量的基因家族成员扩增,这为盾叶薯蓣中薯蓣皂苷生物合成途径提供了关键的进化资源。
通过盾叶薯蓣中薯蓣皂素时空变化、免疫组织化学定位及转录组分析,发现薯蓣皂素首先在叶片合成,转化为薯蓣皂苷,然后运输到地下根茎中储存。对13 种薯蓣属植物的转录组和代谢物进行比较分析表明,薯蓣皂苷生物合成通路基因的特定表达模式促进了薯蓣属植物薯蓣皂苷生物合成途径的差异性进化。
点评:研究目的很清晰
An algorithm for automatic identification of multiple developmental stages of rice spikes based on improved Faster R-CNN
水稻自抽穗起直到收获,不同发育期的稻穗呈现出不同的形态特征,当观测区域中有10%的水稻穗形态特征发生变化时,水稻进入相应发育期。利用水稻图像序列,探索表征稻穗形态的图像特征及其演化规律来识别稻穗关键发育期。具体来说,依据不同发育期稻穗在大小、成熟度、色彩等方面的差异,采用目标检测算法来实现稻穗的自动计数,只要识别到足够数量的稻穗便可确定对应发育期的达到日期。然而,已有的自动计数方法都仅限于检测某一关键发育期的稻穗,尚未见稻穗多发育期识别的研究报道。
该研究首次提出基于深度学习目标检测模型的不同发育期稻穗图像特征自动提取算法,实现稻穗多发育期自动识别。针对稻穗目标小而密、在抽穗期、乳熟期和成熟期3个不同发育期尺度差异大等问题,团队对Faster R-CNN网络进行了有针对性地改进。基于改进Faster R-CNN的稻穗检测模型,先检测出每天采集的图像中3个不同发育期的各类稻穗数,再计算各类图像穗密度。在不同发育期下,绘制不同成熟度稻穗的图像穗密度日变化拟合曲线。经试验分析得出:若当天图像中某类穗密度较前一天增加了2倍以上,即当天该类图像穗密度拟合曲线具有首次快速上升趋势,那么确定当天日期为对应稻穗类别的发育始期。
点评:图像识别可以了解下了。
Fine mapping and candidate gene analysis of qGL10 affecting rice grain length
研究者以粳稻02428为受体亲本,长粒型籼稻ZYX为供体亲本,通过多代回交自交,构建了长粒型近等基因系LB3。利用02428和LB3构建F1群体和F2遗传分离群体,通过 BSA-seq初步定位到一个主效QTL qGL10;开发InDel标记,精细定位至第10染色体上20.8~20.93 Mb(128.45 kb)的物理区间内。该区间内有17个候选基因,通过表达分析和单倍型分析最终确定了候选基因LOC_Os10g39130(OsMADS56)。在LB3中OsMADS56在多个幼穗发育时期表达量都显著高于02428。利用RFGB数据库进一步分析表明,SNP9位点上携带A碱基基因型的水稻比携带G碱基基因型的水稻粒长、株高和抽穗期都显著增加。因此,位于启动子TGTCACACA基序的SNP9(G / A)可能是导致OsMADS56在02428和LB3幼穗中表达出现差异的原因。SNP9中携带A碱基基因型的材料(LB3基因型)大部分为粳稻(93.24%),携带G碱基基因型的材料(02428基因型)大部分为籼稻(67.33%),SNP9(A)在籼稻育种中还未被选择利用,在提高籼稻的粒长方面具有一定的应用潜力。
点评:新时代图位克隆例子,不用生信基础,用公共数据库即可。
The analysis of genetic structure and characteristics of the chloroplast genome in different Japanese apricot germplasm populations
叶绿体基因组编码区片段的核苷酸替换率较低且速度较慢,因此常用于比较较高的类群(科和属水平)。相比之下,非编码区替代率高,进化速度快,适合比较较低的类群(种间或亚种)分类。
利用146个梅子群体研究的重测序数据组装注释叶绿体基因组cp。通过对100份野生群体、21份驯化群体、25份繁殖群体数据组装出来叶绿体基因组,对其进行基因组特征描述,发现和李属其实物种相似。通过比较基因组学分析发现野生群体的遗传多样性最高,同时还找到最高群体的地理分布。同时利用146个cp基因组序列的SNP分子标记,探讨不同地理分布梅子资源间的遗传关系和遗传多样性,为梅子的起源和进化提供一定的参考。
点评:数据再利用案例。是不是所有物种重测序数据可以来一波?
Three types of genes underlying the Gametophyte factor1 locus cause unilateral cross incompatibility in maize
玉米的异交率非常高。然而,在玉米中仍然存在着一种特殊单向杂交不亲和现象 (Unilateral cross incompatibility, UCI),其中,以位于玉米4号染色体短臂上的Ga1位点所控制的杂交不亲和效应最大。之前普遍认为在Ga1位点存在决定花粉与雌穗亲和性的雌、雄两种因子,也即双因子模型。但Ga1位点的定位区间大小始终保持在2Mb左右,无法进一步精细定位
该研究发现在Ga1位点包含三类,共7个决定玉米单向杂交不亲和表型的基因,提出了一个新的解释UCI成因的三基因遗传模型,该结果不仅对理解物种的生殖隔离这一重大基础科学问题有理论意义,也对作物的遗传改良尤其是杂交制种有应用价值。
Ga1位点的三因子遗传模型。研究人员借助中国古代神话故事《封神榜》中的人物关系,形象地展示了三类基因之间地关系。哪吒代表ZmGa1Ps-m,拥有最强的武力值,可以破除一切障碍。ZmPME3的角色则是哼哈二将,阻止花粉管的前进。雷震子代表ZmPRP3, 武力值不如哪吒,并非最高级的战神,但在ZmPME3表达量较低时 (比如哼哈二将只来了一个),也能够帮助花粉管突破障碍。
点评:研究人员要懂艺术,要懂人文历史。
Genetic and Multi-omics Analysis Reveal BnaA07.PAP2In-184-317 as the Key Gene Conferring Anthocyanin-based Color in Brassica napus Flowers
国内各育种单位陆续选育出粉红、玫红、杏红、深红等花色的新品种,但这些红色系花色的形成机制并不清楚。之前该团队成功解析了甘蓝型油菜白花(New Phytologist, 206:1513-1526)和橙花(The Plant Journal, 104:932-949)花色形成的分子机理。
该研究以浙江农科院选育的杏红花品系为材料创制了粉红花材料,明晰了各种甘蓝型油菜花色,包括白、黄、杏红、粉红之间的显隐性关系。不同花色花瓣代谢组分析表明,杏红花色是由黄色的叶黄素和红色的花青素积累形成,而粉红花色由无色的胡萝卜素和红色花青素积累形成。花青素中矢车菊素-3-O-葡萄糖苷的含量是导致花瓣中红色素积累的关键。转录组分析表明,与黄或白花相比,杏红和粉红花中花青素合成路径的结构基因和3个关键转录因子基因BnaMYBL2, BnaA07.PAP2和 BnaTT8均急剧上调表达。基于BSA-seq和RNA-seq结果,图位克隆了红色系花色形成的关键基因BnaA07.PAP2。BnaA07.PAP2在黄或白花中几乎不表达,而在杏红或粉红花中高表达。转基因结果表明,BnaA07.PAP2启动子区域的两个片段插入是导致该基因表达被激活的原因,BnaA07.PAP2的表达又激活了整个花青素路径基因的表达,促进红色花青素在花瓣中的积累,最终导致甘蓝型油菜红色系花色的形成。此外,通过对不同花色的甘蓝型油菜进行杂交和选育,该团队创制了不同深浅程度的红色系花色材料。
点评:多组学关联。
Across-population genomic prediction in grapevine opens up promising prospects for breeding
目前利用模拟数据和真实数据预测基因型值,探讨影响模型准确率的研究都是基于单个群体进行的,但基于单群体的模型在跨群体应用时会因为亲缘关系的差别导致预测准确率不高,另外真实育种中也不会仅在一个群体内部进行选育。
该研究利用多个群体探究GS的跨群体准确率以及影响GS准确率的关键参数。利用欧亚葡萄的一个自然群体和半双列杂交产生的十个双亲群体对15个表型性状(包括产量、浆果成分、酚类和植株活力等)开展了GS研究。首先,分别利用多位点微效模型ridge regression和少位点大效应模型LASSO进行模型构建;其次,由观测到的平均基因型值(observed mean genotypic value)和预测到的基因型值相关性判断预测的准确率;最后,利用单一群体(S1a)、三个半同胞群体(S1b)和自然群体(S2)进行GS模型准确率评估。结果表明,对于群体预测准确率,S1a、S1b和S2的预测准确率分别为0.54、0.63和0.36;对于性状预测准确率,S1a和S1b的大部分表型预测准确率接近于1,S2大部分表型预测准确率为0.75。杂交组合及性状组合(10 x 15=150)的平均预测准确率为0.45。
点评:有点懵,不知在模型上有何创新。
The genome of Eustoma grandiflorum reveals the whole-genome triplication event contributing to ornamental traits in cultivated lisianthus
该工作利用PacBio HiFi和HiC测序技术组装注释了大小为1.71Gb的高质量栽培洋桔梗参考基因组(2n=6x=72),揭示了洋桔梗在进化过程中发生的全基因组三倍化事件可能促进了洋桔梗花色与花形态的形成,构建了花色调控模型与花发育模型,并鉴定了相关的关键候选基因,为未来洋桔梗分子设计育种奠定了理论基础。
点评:亮哥在园艺作物花色花香上的研究厉害。
Pan-transcriptome assembly combined with multiple association analysis provides new insights into the regulatory network of specialized metabolites in the tea plant Camellia sinensis
本研究利用公共数据136份茶树RNA-seq数据和对应的代谢组数据(相同样本),首先组装了茶树宏转录组,其次鉴定了大叶茶(CSA)纯系和小叶茶(CSS)纯系之间的遗传差异,并探究了代谢与遗传之间的关系,最后揭示了次级代谢物调控网络及其关键基因。
点评:公共数据再利用之典范!尤其是转录组层面的挖掘:泛转录组、ePAVs、eQTL,我辈楷模。
Natural variation of DROT1 confers drought adaptation in upland rice
水、旱稻基因组存在明显的分化,尤其在粳稻亚群。然而,目前对水、旱稻分化的遗传基础仍然缺乏理解,利用旱稻发掘的抗旱基因很少,这极大地限制了稻作抗旱分子育种的进程。
对 271 份水、旱稻种质资源进行大田干旱环境下的苗期表型鉴定,利用 GWAS 定位抗旱遗传位点,并结合旱稻导入系抗旱表型,以及水旱稻转录组分析,确定一个抗旱候选基因,命名为 DROT1 。通过转基因功能验证,发现敲除 DROT1 能够显著降低水稻植株抗旱性,而超表达 DROT1 可以显著增强水稻抗旱性。在大田中度干旱胁迫条件下,超表达 DROT1 的植株生物量显著增加,而敲除植株的生物量和产量均显著降低。这意味着 DROT1 的抗旱性能够在大田干旱环境下得以体现。
通过 GUS 染色和激光微切割分离组织表达鉴定,证明 DROT1 主要在维管组织中表达。亚细胞定位显示 DROT1 蛋白主要定位于细胞壁。对转基因材料叶片组织中纤维素、半纤维素和木质素进行化学方法测定,同时对转基因材料叶片进行切片,并利用中远红外光谱显微成像原位标定三素含量。两种方法均发现只有在干旱环境下,纤维素的含量在 DROT1 超表达材料中显著增加,而在敲除材料中显著降低。利用 X 射线小角衍射对转基因材料的纤维素结晶度进行分析,发现在干旱环境下, DROT1 超表达可以提高纤维素结晶度,敲除 DROT1 可以降低纤维素结晶度。
研究表明 DROT1 的表达受到干旱诱导,启动子具有三个 GCC box ,是 ERF 家族转录因子结合位点。进一步通过瞬时转录激活实验、Y1H、EMSA、ChIP-PCR等实验证明 ERF3 可以直接抑制 DROT1 表达,而 ERF71 可以直接激活 DROT1 表达。通过遗传互作实验也表明它们属于同一个遗传调控通路。
对 DROT1 单倍型分析发现,Hap3 是旱稻特异单倍型,其启动子的一个关键 SNP 由 C 变为 T,显著增强了 DROT1 在旱稻中的表达量,进而提高旱稻抗旱性。该变异可能起源于东南亚地区的偏籼型野生稻,随着栽培稻的分化传入籼稻,然后在稻作适应干旱的过程中,由籼稻渗入热带粳稻,并逐渐在热带粳稻中聚集。这与旱粳稻中绝大多数是热带粳稻相吻合,说明 DROT1 在旱稻形成过程中发挥了重要作用。
本研究利用稻种资源,通过 GWAS、水、旱稻 ILs 连锁分析,并结合转录组分析克隆了一个抗旱基因 DROT1,该基因通过调控细胞壁结构来提高水稻抗旱性。利用稻种资源发掘的优异自然变异将为旱稻分子育种提供重要的基因资源。
点评:超哥崛起!钱院士高度评价,专业评估价值108.01亿元。
TDTHub, a web server tool for the analysis of transcription factor binding sites in plants
本研究介绍了TDTHub (TFBS-Discovery Tool Hub),这是一个用于快速直观地研究植物转录调控的Web 服务器。TDTHub 在 40 种植物中使用预先计算的 TFBS,并允许选择两种映射算法,提供更高的通用性。除了主要的TFBS 富集工具外,TDTHub 还包括其他工具来帮助分析和可视化数据。为了证明 TDTHub 的有效性,研究者分析了花青素生物合成途径的转录调控。还分别分析了拟南芥和番茄中茉莉酸和伤口的转录级联反应。在这些研究中,TDTHub 帮助验证了最相关的 TF 节点,并提出了在这些途径中具有突出作用的新节点。
TDTHub 网址为http://acrab.cnb.csic.es/TDTHub/,作者后续将定期升级和扩展新物种和基因注释。
点评:类似工具挺多的。
由李恒大神设计的图形化泛基因组工具:minigraph。该工具在保留线性参考基因组的坐标同时,使用基于图形的数据模型和相关格式来表示多个基因组,可以有效的构建图形化泛基因组,表示当前基因组中缺失的变异体。
目前Minigraph已经应用到人类泛基因组,羊牛的泛基因组和高粱的泛基因组。
点评:感谢大佬开发。