“父归父,母归母”,基因新研究将推动精准医疗
■本报首席记者 许琦敏
父母孕育出的生命,还能截然分清哪些遗传信息来自父亲,哪些来自母亲吗?以我国科学家为主导,一个中外科学家联合团队首次采用全新方式,对狨猴这一非人灵长类模式动物的全基因组数据进行了组装和分析,获得了两套完美的同源染色体(分别来自父亲和母亲)基因组,为高质量基因组分析找到了新方法,也为进入“完美基因组”时代提供了一个范例。该成果近期发表于国际权威学术期刊《自然》杂志。
从“马赛克”变成“清一色”
众所周知,正常人的体细胞内有46条23对染色体。“但传统方法在测序后只能组装出22条常染色体,以及X、Y两条性染色体,总共只有24条。”论文第一作者、深圳华大生命科学研究院与丹麦哥本哈根大学联合培养的博士生杨琛涛说,由于染色体分子太大,所以测序时无法直接测整条染色体,只能分段测得数据,再通过算法将这些数据组装起来。
灵长类动物的染色体是成对存在的,一条来自父亲,一条来自母亲,成对的两条常染色体演化起源相同、序列相似,但又存在遗传差异。杨琛涛说,在DNA测序数据组装时,算法有时无法区分DNA上某些有差异的区域,只能随机保留其中一条的数据。因此,目前大多数基因组研究往往只能得到一套父母本遗传信息混合的基因组,类似于由两种颜色拼成的马赛克图案。
能不能将这些被算法混淆不清的基因组信息弄清楚呢?“我们在狨猴基因组测序中首次尝试了新方法。”论文共同第一作者、深圳华大生命科学研究院副研究员周旸介绍,他们同时为狨猴及其父母进行了基因组测序,“利用被测个体的父母本的测序数据进行遗传信息区分,我们的算法可以完美地将两条同源染色体分别组装出来。”最终,两套染色体级别的父母本单倍体基因组的单碱基精确度分别达到99.996%和99.998%。
透露狨猴演化独特信息
“这是一个很大的进步,相关方法未来可以应用到更多物种的分析中。”杨琛涛表示,如果考虑到所有类型的遗传变异,目前一般得出的杂合率结果被远远低估了。
另外,研究团队发现,来自父亲的种系突变是来自母亲的两倍,这可能与卵细胞和精子的形成过程中细胞发生复制分裂的次数不同有关。
研究团队还在对狨猴生物学进行分析时,获得不少有趣的发现。
例如,他们发现,狨猴的Y染色体上比人多出了一段雄性特异性序列,而且一些参与人类精子形成的基因在狨猴中丢失或者失去功能。又如,狨猴的Y染色体上一些对精子形成过程至关重要的基因发生了丢失或假基因化。这一现象可能与狨猴一夫一妻制的婚配方式导致雄性个体精子竞争的降低有关。
研究团队还发现,在人和狨猴之间,大部分与大脑相关的基因是高度保守的。这在一定程度上解释了为何狨猴可以作为研究人类神经疾病模式物种的遗传学基础。
此外,他们也发现了一些与狨猴身体大小、繁殖特征、饮食习惯相关的基因受到了正选择。“在这些基因中,有些基因与其体型缩小有关,有些基因则与狨猴特殊的以树胶为食的习性有关。”周旸说。
助力精细疾病研究
“2021年是人类参考基因组草图序列公布20周年,但如何构建参考基因组序列仍是当前基因组研究的重点攻关领域。”论文通讯作者,深圳华大生命科学研究院、中国科学院昆明动物研究所及丹麦哥本哈根大学的张国捷教授认为,基因组中包含大量与健康、疾病和表型相关序列,对这些序列的研究有赖于基因组序列的准确度。
近几年,随着基因组序列功能研究的日益深入,生命科学界对获得更高质量基因组的需求不断增加。“我们对二倍体物种完美基因组序列提出了新的标准,即二倍体细胞中的两套基因组应分别独立组装到染色体水平并含有极少的测序漏洞。通过本次研究,我们论证了实现这一目标的可行性。”张国捷表示,高质量的狨猴基因组也为利用该物种作为动物模型的医学研究提供了重要遗传数据。
未来20年,精准医学是人类基因组学的一个主要发展方向。该研究显示出了新测序组装技术的极大潜力,它可为科学家提供非常精准的基因组数据支持,在此基础上,科学家可以进行更为精细的疾病相关研究。
相关链接
模式动物狨猴
普通狨猴是生活在巴西东北部大西洋沿岸地区的一种小型猴子,是医学研究常用的模式动物之一。
狨猴与人都属于简鼻亚目,与起源于亚洲和非洲的旧世界猴在形态上有很多显著差别,例如身体大小、鼻孔形态、牙齿数目等,可为实验室提供非常充足的样本资源。狨猴与人类在解剖学、生理学和药物代谢方面具有许多共同特征,能开发出多种医学研究模型。对狨猴高质量遗传信息的解读,对于推进人类疾病研究非常重要。