Phenomics表型组学前沿论坛第二十期“基因组结构变异的检测、表征和功能”圆满举办

来源:上海国际人类表型组研究院 发布时间:2022-08-17

2022年8月16日晚,由上海国际人类表型组研究院、Phenomics表型组学期刊、复旦大学人类表型组研究院、中国生物物理学会表型组学分会共同举办的生命天眼论:Phenomics表型组学前沿论坛第二十期顺利开讲。

本次论坛特别邀请了西安交通大学电信学部自动化学院、西安交通大学第一附属医院叶凯教授,作了主题为“基因组结构变异的检测、表征和功能”的精彩报告。论坛由复旦大学生命科学学院徐书华教授主持。来自全国的2000余名专家、学者线上参加了本次论坛。

叶凯教授

叶凯教授,现任西安交通大学电信学部自动化学院、西安交通大学第一附属医院教授,博导;兼任中国人类表型组研究协作组(HPCC)委员。获国家杰出青年科学基金,科技部重大专项等资助。叶教授本科和硕士分别毕业于武汉大学生命科学学院和药学院,博士(cum laude -优等)毕业于荷兰莱顿大学(Leiden University)计算机学院;博士后阶段师从Rolf Apweiler教授,在欧洲生物信息学研究所(European Bioinformatics Institute)实现生物信息学研究对象从蛋白质序列到基因组的转变。其后,分别在荷兰莱顿大学医学中心(Leiden University Medical Center)和美国圣路易斯华盛顿大学基因组研究所(The Genome Institute at Washington University in St. Louis)任助理教授,开发了以Pindel、MSIsensor、Mako、SVision为为代表的系列基因组变异检测方法,受邀参加千人基因组(The 1000 Genomes Project)、肿瘤基因组路线图计划(The Cancer Genome Atlas, TCGA)等多项国际基因组项目。2016年初,叶凯教授全职回国,在西安交通大学电信学部组建信息学与生命科学相结合的交叉学科团队,继续深入研究结构变异的检测、表征和功能,开展了罂粟科多物种性状演化、拟南芥T2T基因组研究等研究。在Science、Nature、Nat Med、Nat Commun等期刊发表SCI论文70余篇,其中ESI高被引论文14篇,热点论文(hot paper)1篇,SCI他引34000余次。

徐书华教授

论坛开始,主持人徐书华教授代表主办方对莅临的嘉宾及观众表示热烈欢迎,并对论坛的三个主要主办方上海国际人类表型组研究院(IHPI)、Phenomics表型组学期刊、复旦大学人类表型组研究院(HuPI)做了简要介绍,对演讲嘉宾叶凯教授做了隆重介绍。

报告中,叶凯教授先简述了基因组变异研究的基本背景与概况,指出从人类基因计划结束,人类基因组参考图谱产生起,研究人员逐渐意识到个体之间的基因存在一定的差异,因此针对基因变异情况检测的研究逐步被重视。

其次,叶教授讲述了基因变异研究的瓶颈,指出二代测序在针对点突变以及插入缺失时检测精度尚可,但对于较长的结构变异呈现出低灵敏度、低特异性与低分辨率的现象。叶教授在2009年左右开发完成了一套针对短插入缺失变异与结构变异的开拓性算法Pindel,该算法受到基因测序领域多位专家的高度评价,且在2017年时被Nature杂志上的综述收录为DNA测序发展历程中里程碑式的算法之一。

接着,叶教授解释了其团队对微卫星不稳定性的研究进展。微卫星不稳定性实际上是基因短插入缺失变异中的一个类型,在肿瘤中出现频率较高。研究人员通常可利用PCR方法在基因组上挑选5个位点进行测序,再将肿瘤样本与正常血样进行比对,若两者出现了3个位点的不同,即可在临床上将其称为微卫星的不稳定性。2014年,叶教授团队通过开发一套测序分析算法MSIsensor,优化减少了大量辅助性实验的需求,并且将该检测结果与临床样本的检测结果进行比对,得到99.4%的一致性。后续该算法被FDA批准的产品纳入,是世界首款不依据肿瘤来源,而根据生物标志物来进行判断的泛肿瘤精准诊断产品。

再次,叶教授解释了近期其团队针对基因组复杂结构变异的研究进展。利用计算机视觉技术将基因组的结构变异以及复杂结构变异进行区分,通过两个序列间的二维矩阵进行编码,同时通过样本与参考基因组进行比对操作,将噪声影响部分消除,进一步采用图像分割方法实现基因组复杂结构变异图像的生成,再通过深度训练后的模型进行结构预测,即可将复杂结构变异利用RFA格式编码出来。该成果近期将在Nature Methods在线发表。

最后,叶教授讲述了其团队针对鸦片罂粟基因组和吗啡喃合成途径相关工作。叶教授指出,临床上40%-50%的止疼药物与吗啡相关,通过对吗啡合成基因组的解析发现,吗啡与那可丁的编码序列集中在十几个基因的基因簇中,其团队已通过一系列的解析工作,明确了吗啡与那可丁自然界中通路演化的过程,解释了其中生化反应过程中底物与酶变化的趋势。

在精彩的报告后,叶凯教授还与观众们展开了热烈讨论。观众们非常踊跃地提问,叶教授也对每个问题作了详细的解答。

如有位观众提问:“如果我们想完成类似T2T这样工作,是一定要采用单倍体的细胞系,还是也可以利用二倍体的细胞系进行尝试?”叶教授答复:“单倍体细胞系的组装难度较低,因为测试量都集中在一个单倍型上。如果在基因组上有非常多的重复,两个二倍体测试结果会难以分离,组装过程可能出现错误。虽然二倍体细胞系组装难度大,但研究的意义也较大,因此现在对于二倍体细胞系方向的研究也是越来越多,且已有一些鼓舞人心的进展。”另外有观众提问:“在做人群队列与疾病的关系中,有大样本量的二代测序数据,但主要以线性基因为主,是否有必要用pan-genome的方式再做一遍分析?”叶教授回复:“Cell上近期发表了一篇文章,将3000多个受试者样本使用pan-genome的方式进行了分析,有一定参考意义。建议先利用已有数据进行计算,作图分析,有助于挖掘更多信息。”

生命天眼论:Phenomics表型组学前沿论坛将持续为大家提供高质量的讲座。敬请各位同仁关注!

近期新闻