生命学院张强锋课题组联合北京大学汪阳明和席建忠研究团队开发鉴定同源长非编码RNA的新方法

长非编码RNA(lncRNA)的发现和表征是过去几十年分子生物学领域的重大进展。已有研究成果表明,lncRNA在发育、肿瘤等多种生理和疾病过程中发挥调控作用1-3,但目前绝大多数lncRNA 的功能仍然未知。通过鉴定不同物种间同源的lncRNA,可以筛选出在进化过程中保守的lncRNA,这些lncRNA也更可能具备重要的功能。但是,由于lncRNA的序列保守性较低4,5,传统的序列比对方式只能鉴定出极少的不同物种间同源的lncRNA。例如,在斑马鱼和人类上万的lncRNA基因中,通过序列比对只能找到几十个序列保守的同源lncRNA。因此,不管是从lncRNA的理论还是技术方面考虑,目前都亟需一种新的方法来鉴定不同物种之间的同源lncRNA。

2024年1月9日,清华大学张强锋、北京大学汪阳明、席建忠研究团队合作在《自然×遗传》(Nature genetics)杂志上发表题为“计算预测和实验验证鉴定人类和斑马鱼之间功能保守的长非编码RNA”(Computational prediction and experimental validation identify functionally conserved lncRNAs from zebrafish to human)的研究论文。该工作开发了一套新的计算流程,在包括人类、小鼠、斑马鱼在内的8种脊椎动物中,鉴定保守的同源lncRNA,工作同时开发了基于CRISPR的基因敲除和回补筛选系统,通过实验验证了所鉴定的同源lncRNA在不同物种中的保守功能,为该领域的研究提供了新的思路。

该团队开发了一套鉴定不同物种之间同源lncRNA的计算方法(lncHOME)。lncHOME计算方法通过比较基因组和机器学习的人工智能方法,在8种脊椎动物中鉴定出了一类在不同物种中具有保守基因组位置及保守RNA结合蛋白(RBP)结合位点模式的lncRNA(图1)。这些不同物种中潜在同源的lncRNA被命名为coPARSE-lncRNA (lncRNA with conserved genomic locations and patterns of RNA binding protein (RBP) binding sites)。

图1. 鉴定不同物种之间同源lncRNA方法(lncHOME)的计算流程

lncHOME计算方法鉴定了570个在斑马鱼中具有同源基因的人类coPARSE-lncRNA,其中通过序列比对的方式仅仅只能鉴定出17个序列保守的同源lncRNA。相比于非同源的lncRNA,这些coPARSE-lncRNA基因富集了更多疾病相关突变,并且更倾向于在癌症组织中异常表达。这些发现说明coPARSE-lncRNA可能具有重要的生理功能。

接下来,该团队深入探究了所鉴定的同源lncRNA的功能保守性。首先,通过建立CRISPR-Cas12a介导的大片段基因敲除筛选系统,该团队鉴定出了75个能促进癌症细胞增殖的coPARSE-lncRNA,其中37个在HeLa细胞中起重要作用。着该团队进一步开发了一个基于CRISPR-Cas12a的敲除和回补单步系统,应用该系统发现,通过回补预测的斑马鱼同源lncRNA片段,可以挽救其中4个人类coPARSE-lncRNA的敲除所导致的HeLa细胞增殖的缺陷。更有意思的是,在斑马鱼胚胎中敲低这四个斑马鱼的coPARSE-lncRNA会导致严重的胚胎发育延迟,而这些表型可以通过回补人类的同源lncRNA进行挽救。以上结果说明这些同源lncRNA具有很强的功能保守性。

lncHOME算法得到的同源lncRNA具有保守的RBP结合位点模式。根据这一条件推测,coPARSE-lncRNA具有相似的RBP结合图谱。针对其中两条coPARSE-lncRNA,该团队通过RNA沉降结合质谱实验验证了这一假设。更重要的是,对于上面所描述的可以挽救细胞增殖或胚胎发育缺陷的同源lncRNA片段,如果突变其中某些RBP(例如NONO和IGF2BP2)的结合位点,所得到的新的片段无法起到挽救效果。这些突变实验证明了RBP结合位点对coPARSE-lncRNA的功能的重要性。

总而言之,该团队的研究提供了一个基于机器学习的计算分析方法,鉴定得到了一系列在脊椎动物中潜在同源的lncRNA,并通过实验验证了同源lncRNA的功能保守性。这些lncRNA在进化过程中序列保守性逐渐消失,但是却保留着保守的RBP结合模式(图2)。该工作极大地扩展了当前脊椎动物中保守的lncRNA库,为研究lncRNA的进化、功能及作用机制提供了新视角和新资源。

图2. coPARSE-lncRNA的进化以及功能机制模型

清华大学生命科学学院的张强锋副教授、北京大学未来技术学院的汪阳明教授和席建忠教授为论文的共同通讯作者。清华大学生命科学学院黄文泽博士、熊团林博士及北京大学未来技术学院赵雨亭博士为论文的共同第一作者。中国科学院动物研究所刘峰研究员、衡鉴博士、清华大学生命科学学院韩鸽博士、2019级博士生王鹏飞、北京大学赵志华博士、李娟博士、2021级博士生石铭和2023级博士生汪家震、吴怡霞为论文工作做出了重要贡献。

 

原文链接:https://www.nature.com/articles/s41588-023-01620-7