cnBeta.COM - 中文业界资讯站 ( ) • 2024-04-25 04:16

一个全球研究小组构建了迄今为止最全面、最广泛的鸟类家系图,详细描述了 9300 万年来 363 种鸟类之间的进化联系。该图代表了所有鸟类家族的 92%。这一进展在很大程度上得益于加州大学圣地亚哥分校工程师开发的尖端计算方法,以及该校圣地亚哥超级计算机中心最先进的超级计算资源。

这些技术使研究人员能够高精度、高速度地分析大量基因组数据,为构建有史以来最全面的鸟类家谱奠定了基础。

4月1日发表在《自然》(Nature)和《美国国家科学院院刊》(PNAS)上的两篇互补性论文详细介绍了这一进展。《自然》杂志报道的更新家系揭示了6600万年前恐龙灭绝后鸟类进化史的模式。

Divergence-Times-for-363-Bird-Species-Based-on-63430-Intergenic-Loci.jpg

发表在《自然》杂志上的最新鸟类家谱,勾勒出 363 种鸟类之间 9,300 万年的进化关系。图片来源:Jon Fjeldså(绘图)和 Josefin Stiller

研究人员观察到,早期鸟类的有效种群数量、替代率和相对脑容量都急剧增加,这为我们揭示这一关键事件之后推动鸟类多样化的适应机制提供了新的线索。在发表于《美国国家科学院院刊》(PNAS)的相关论文中,研究人员仔细研究了新家谱的一个分支,发现火烈鸟和鸽子的亲缘关系比之前的全基因组分析所显示的更远。

这项工作是由哥本哈根大学、浙江大学和加州大学圣地亚哥分校牵头的多机构合作项目"鸟类万基因组(B10K)项目"的一部分,该项目旨在为约10500种现存鸟类生成基因组序列草案。

"我们的目标是重建所有鸟类的整个进化史,"加州大学圣地亚哥分校雅各布斯工程学院电子与计算机工程教授西亚瓦什-米拉拉布说,他是《自然》论文的共同资深作者,也是《美国科学院院报》论文的第一作者和共同通讯作者。

这些研究的核心是一套名为"ASTRAL"的算法,米拉拉布实验室开发了这套算法,以前所未有的可扩展性、准确性和速度推断进化关系。通过利用这些算法的强大功能,研究小组整合了来自 6 万多个基因组区域的基因组数据,为他们的分析提供了强大的统计基础。

研究人员随后研究了整个基因组中各个片段的进化历史。在此基础上,他们拼凑出了一棵马赛克基因树,然后将其编入一棵综合物种树。这种细致入微的方法使研究人员能够构建一个新的、经过改进的鸟类家系,即使在历史不确定的情况下,也能非常精确和详细地描述复杂的分支事件。

米拉拉布说:"我们发现,我们在分析中加入数万个基因的方法实际上是解决鸟类物种之间进化关系的必要条件。需要所有这些基因组数据,才能以很高的置信度还原6500万-6700万年前的这段特定时期发生了什么"。

Chromosome-Section-Responsible-for-Evolutionary-Grouping-of-Flamingos-and-Doves-scaled.jpg

在发表于《美国国家科学院院刊》(PNAS)上的这项研究中,研究人员仔细研究了更新的鸟类家谱中的一个分支,发现包括火烈鸟和鸽子在内的鸟类群体的亲缘关系比以前的全基因组分析所显示的要远,并将这一结果归因于第 4 号染色体上的一个不寻常区域。图片来源:Ed Braun(绘图)、Daniel J. Field(鸟类图片)和 Siavash Miarab

该团队之所以能够在海量数据集上进行这些分析,是因为米拉拉布实验室设计的计算方法能够在功能强大的 GPU 机器上运行。他们在加州大学圣地亚哥分校圣地亚哥超级计算机的Expanse超级计算机上进行了计算。

米拉拉布说:"我们很幸运能够使用如此高端的超级计算机。如果没有Expanse,我们就无法在合理的时间内对如此庞大的数据集进行运行和重新运行分析。"

研究人员还研究了不同基因组取样方法对树的准确性的影响。他们发现,两种策略--对每个物种的许多基因进行测序,以及对许多物种进行测序--结合在一起,对重建这一进化史非常重要。

哥本哈根大学生物学教授、《自然》论文第一作者约瑟芬-斯蒂勒(Josefin Stiller)说:"因为混合使用了这两种策略,所以我们可以测试哪种方法对系统发育重建的影响更大,从每种生物体中采样许多基因序列比从更广泛的物种中采样更重要,尽管后一种方法有助于我们确定不同群体进化的时间。"

借助先进的计算方法,研究人员还揭示了他们在之前的一项研究中发现的不寻常之处:鸟类基因组中一条染色体的特定部分数百万年来一直保持不变,没有出现预期的基因重组模式。

这一反常现象最初导致研究人员错误地把火烈鸟和鸽子归为进化上的表亲,因为根据这一段未变的DNA,它们似乎关系密切。这是因为他们之前的分析是基于48种鸟类的基因组。但通过使用363个物种的基因组重复分析,他们发现了一个更准确的家族树,它将鸽子与火烈鸟的关系进一步拉近。此外,通过使用由洛克菲勒大学神经生物学教授埃里希-贾维斯(Erich Jarvis)领导的脊椎动物基因组计划(Vertebrate Genome Project,VGP)提供的六个高质量基因组,米拉布及其同事能够发现并推测出这种令人惊讶的模式。

佛罗里达大学生物学教授、《美国科学院院刊》(PNAS)论文共同通讯作者爱德华-布劳恩(Edward Braun)说:"令人惊讶的是,这段被抑制的重组时期可能会误导分析。正因为它可能会误导分析,所以在未来的6000多万年后,它实际上是可以被检测到的。这才是最酷的部分。"

这项工作的影响远远超出了对鸟类进化史的研究。米拉拉布实验室首创的计算方法已成为重建其他各种动物进化树的标准工具之一。

下一步,研究小组将继续努力构建鸟类进化的完整图景。生物学家们正在对更多鸟类物种的基因组进行测序,希望能将家谱扩展到数千个鸟属。与此同时,米拉拉布领导的计算科学家们正在改进他们的算法,以适应更大的数据集,确保在未来的研究中能够高速、准确地进行分析。

编译来源:ScitechDaily