高科技行业门户 ( ) • 2022-08-09 09:33

前言:

蛋白质是有机体内细胞的关键构成部分,也被称为支撑生命正常运转的基石。它具有一定的形状和空间结构,且形状与功能之间有密切的联系。

因此,只有深入了解蛋白质结构,才能更好地掌握原理和功能,进一步推动生物科学的发展。

作者 | 方文

图片来源 |   网 络

蛋白质结构研究加速度

蛋白质是生命的基石,由氨基酸链组成,并折叠成复杂的形状。蛋白质根据储存在DNA中的指令产生复杂的生物分子,它们执行着至关重要的细胞任务,并完成各种机体功能。

一些蛋白质是有益的,例如那些参与消化食物的蛋白质;而另一些则是有害的,例如那些参与肿瘤生长的蛋白质。它们各自都有着非常复杂的形状和结构。

由于蛋白质的形状与其功能密切相关。了解蛋白质的结构可以更好地了解其作用和工作原理,这也是解决许多生命科学问题的关键。

以前,研究人员需要付出几个月或几年的时间和精力,才能弄清蛋白质的结构。

如今,凭借人工智能的力量,几秒钟内就能完成。

它不仅可被用于疾病研究、食物安全、疫苗开发、可持续发展等领域;

还帮助科学家深入了解体内复杂过程是如何工作的、以及哪些有机分子能被用于克服污染、生命起源于何处等那些为全人类所关注的重要问题。

AlphaFold蛋白质数据库

AlphaFold蛋白质数据库不仅实现了1000倍的扩容,成为[蛋白质宇宙],更能在几分钟破解渐冻人等不治之症相关的世界级生物难题。

这些转储数据将在Deep Mind和欧洲分子生物学实验室欧洲生物信息研究所共同建立的一个数据库中免费公开。

AI芯天下丨分析丨AlphaFold几乎破解所有蛋白质,Deep Mind的下一步战略?

在这些逾 2.14 亿个结构预测中,约35%的预测结果被认为准确度很高,即和实验解析的结构一样可靠。

另有45%的预测被认为置信度足够高,在很多情况下都能使用。

AlphaFold预测的许多结构都很可靠,能在很多情况下替代实验解析的结构。

其他情况下,研究人员会用AlphaFold的预测结果验证和解读实验数据。

不可靠的预测结果一望即知,其中一些源于蛋白质固有的无序性质,这种无序意味着蛋白质本身没有固定的形状,至少在没有其他分子的情况下是无序的。

AI芯天下丨分析丨AlphaFold几乎破解所有蛋白质,Deep Mind的下一步战略?

AlphaFold的发展历程

2016年,DeepMind公司开发的AlphaGo击败韩国传奇围棋选手李世石后,其先进性与潜力受到认可,DeepMind决定成立团队开始研究[蛋白质折叠问题]。

2018年12月,AlphaFold在第13届国际蛋白质结构预测竞赛上预测出了43种蛋白质中25种蛋白质的最精确结构。

2020年,DeepMind 推出一个名为 AlphaFold的AI算法,它可以正确地完成蛋白质的结构测定。

2021年,与欧洲分子生物学实验室EMBL合作,建立了一个公开发布 AlphaFold 预测结果的可搜索数据库,即 AlphaFold DB,其公布的最初一组数据包含了 98% 的人类蛋白质。

2021年7月15日,DeepMind通过一篇Nature论文开源了其基于深度学习神经网络的AlphaFold2模型;

7月22日,DeepMind再次发表Nature论文,推出AlphaFold蛋白质结构数据库,向公众免费开放人类蛋白质组以及另外20种模式生物的总共超过350000种结构,并且对98.5%的人类蛋白质结构进行了准确预测。

AI芯天下丨分析丨AlphaFold几乎破解所有蛋白质,Deep Mind的下一步战略?

今年1月,DeepMind 宣布已经有超过30万研究者使用了 AlphaFold数据库,并且添加了超过27个蛋白质组,总计超过19万条蛋白质结构预测数据。

这次添加的重要性在于其中17个蛋白质组都和被忽视热带疾病有关,影响全球十多亿人。

今年7月,DeepMind 将 AlphaFold 数据库从近100万条扩展到2.14亿条,覆盖了人类已知的绝大多数蛋白质。

AI芯天下丨分析丨AlphaFold几乎破解所有蛋白质,Deep Mind的下一步战略?

目前预测准确度尚待提升

人工智能有一个学习的过程,要通过大量的训练来提升其准确性。

如果AlphaFold预测的蛋白质结构是不常见的结构,AI无法通过已有的知识学习到这个结构,预测时就容易产生偏差。

AI是一个能够利用现有的知识预测将来的工具,如果连现有的知识都是缺失状态,自然无法预测新结构。

除非把世界上所有的蛋白质结构都预测并验证过了,否则是不可能达到100%的准确率。

虽然对部分蛋白质结构的预测不完全准确,但AlphaFold蛋白质结构数据库在开放数据的同时也提供了相应结构预测的准确度报告,为使用者提供参考。

AI芯天下丨分析丨AlphaFold几乎破解所有蛋白质,Deep Mind的下一步战略?

将开启数字生物学新时代

过去几十年来,确定蛋白质结构的主要方法是实验室中的各种成像技术,包括X 射线晶体学、冷冻电镜、微晶电子衍射等。

这些方式通常依赖昂贵的设备,耗时比较长,解析出一个蛋白质结构可能需要数月甚至数年时间。

与实验室中的各种成像技术相比,基于氨基酸序列预测蛋白质结构是一种极具吸引力的方式,也是 AI 在生命科学领域的重要落脚点。

以 AlphaFold 为代表的蛋白结构预测模型可能是人工智能对科学界的最大贡献。

DeepMind 在官方通稿中表示:以 AlphaFold 为代表的蛋白结构预测将生物学带入了一个结构更为丰富的时代,并以数字化速度开启科学探索。

AI芯天下丨分析丨AlphaFold几乎破解所有蛋白质,Deep Mind的下一步战略?

结尾:

数量庞大的蛋白质结构为生命科学研究带来的影响仍是毋庸置疑,尤其是在结构生物学的领域。

AlphaFold蛋白质结构数据库中的结构虽然有不足之处,不能全部将其应用于研究中,但数量庞大的蛋白质结构对生命科学各个领域的研究,仍有着不可忽略的意义。

部分资料参考:雷锋网:《AlphaFold 新成果再次引爆生命科学界》,ZAKER:《AlphaFold把几乎所有已知蛋白质的结构预测完了》,硅星人:《DeepMind“顺手”放的大招,要一举攻克渐冻人症》

       原文标题 : AI芯天下丨分析丨AlphaFold几乎破解所有蛋白质,Deep Mind的下一步战略?