DeepMind发布了人类蛋白质组的准确图片

2022-04-10新闻资讯

AlphaFold 蛋白质结构

表示通过 AlphaFold 获得的数据的蛋白质结构。来源:凯伦·阿诺特/EMBL-EBI

DeepMind 和 EMBL 发布了最完整的预测人类蛋白质 3D 结构的数据库。

合作伙伴使用 AlphaFold(去年被公认为解决蛋白质结构预测问题的 AI 系统)向科学界发布了超过 350,000 个蛋白质结构预测,包括整个人类蛋白质组。

DeepMind 今天宣布与欧洲生命科学旗舰实验室欧洲分子生物学实验室 (EMBL) 建立合作伙伴关系,以建立迄今为止最完整、最准确的人类蛋白质组预测蛋白质结构模型数据库。这将涵盖人类基因组表达的所有约 20,000 种蛋白质,并且数据将免费和公开提供给科学界。该数据库和人工智能系统为结构生物学家提供了强大的新工具来检查蛋白质的三维结构,并提供了一个数据宝库,可以开启未来的进步,预示着人工智能生物学的新时代。

AlphaFold 于 2020 年 12 月被蛋白质结构预测 (CASP) 基准测试的组织者认可为解决 50 年来蛋白质结构预测的重大挑战的解决方案,这是该领域的一个惊人突破。AlphaFold 蛋白质结构数据库建立在这一创新和几代科学家的发现之上,从蛋白质成像和晶体学的早期先驱者,到数千名预测专家和结构生物学家,他们多年来一直在用蛋白质进行实验。该数据库极大地扩展了积累的蛋白质结构知识,将高精度的数量增加了一倍以上可供研究人员使用的人类蛋白质结构。促进对这些生命组成部分的理解,这些生命组成部分支撑着每一种生物的每一个生物过程,将有助于使各个领域的研究人员加速他们的工作。

上周,最新的高度创新版本 AlphaFold 背后的方法论,即去年 12 月宣布的为这些结构预测提供动力的复杂人工智能系统,其开源代码已在 Nature上发表。今天的宣布恰逢 《自然》杂志的第二篇 论文,该论文提供了构成人类蛋白质组的蛋白质的最完整图片,并发布了另外 20 种对生物学研究很重要的生物

“我们在 DeepMind 的目标一直是构建人工智能,然后将其用作工具来帮助加快科学发现本身的步伐,从而促进我们对周围世界的理解,”DeepMind 创始人兼首席执行官 Demis Hassabis 博士说。“我们使用 AlphaFold 生成了最完整、最准确的人类蛋白质组图。我们相信这代表了人工智能迄今为止对推进科学知识做出的最重要贡献,并且很好地说明了人工智能可以为社会带来的各种好处。”

AlphaFold 已经在帮助科学家加速发现

从氨基酸序列计算预测蛋白质形状的能力——而不是通过多年艰苦、费力且通常昂贵的技术通过实验确定它——已经帮助科学家在几个月内实现了以前需要数年的时间。

伊迪丝·赫德

Edith Heard,欧洲分子生物学实验室 (EMBL) 主任。来源:Kinga Lubowiecka

“AlphaFold 数据库是开放科学良性循环的完美例子,”EMBL 总干事 Edith Heard 说。“AlphaFold 使用来自科学界建立的公共资源的数据进行训练,因此公开其预测是有意义的。公开和自由地分享 AlphaFold 预测将使世界各地的研究人员能够获得新的见解并推动发现。我相信 AlphaFold 确实是生命科学的一场革命,就像几十年前的基因组学一样,我很自豪 EMBL 能够帮助 DeepMind 实现对这一非凡资源的开放访问。”

AlphaFold 已被合作伙伴使用,例如被忽视疾病药物倡议 (DNDi) 和酶创新中心 (CEI)正在使用 AlphaFold 来帮助设计更快的酶,以回收我们一些污染最严重的一次性塑料。对于那些依赖实验性蛋白质结构测定的科学家来说,AlphaFold 的预测有助于加速他们的研究。例如,科罗拉多大学博尔德分校的一个团队在使用 AlphaFold 预测来研究抗生素耐药性方面找到了希望,而加州大学旧金山分校的一个团队则利用它们来增加他们对SARS-CoV-2生物学的理解。

AlphaFold 蛋白质结构数据库

AlphaFold 蛋白质结构数据库* 建立在国际科学界的许多贡献,以及 AlphaFold 复杂的算法创新和 EMBL-EBI 在共享世界生物数据方面数十年的经验之上。DeepMind 和 EMBL 的欧洲生物信息学研究所 (EMBL-EBI) 正在提供对 AlphaFold 预测的访问,以便其他人可以使用该系统作为工具来启用和加速研究,并开辟全新的科学发现途径。

伊万·伯尼

Ewan Birney,EMBL 副总干事兼 EMBL-EBI 主任。来源:唐嘉丽

“这将是自人类基因组图谱以来最重要的数据集之一,”EMBL 副总干事和 EMBL-EBI 主任 Ewan Birney 说。“让国际科学界可以使用 AlphaFold 预测开辟了许多新的研究途径,从被忽视的疾病到用于生物技术的新酶以及介于两者之间的一切。这是一个伟大的新科学工具,它补充了现有技术,将使我们能够突破我们对世界的理解的界限。”

除人类蛋白质组外,该数据库还包含约 350,000 个结构,包括 20 种具有重要生物学意义的生物,例如大肠杆菌、果蝇、小鼠、斑马鱼、疟原虫和结核菌。对这些生物的研究已成为无数研究论文和众多重大突破的主题。这些结构将使从神经科学到医学等众多领域的研究人员能够加速他们的工作。

AlphaFold 的未来

随着我们继续投资于 AlphaFold 的未来改进,数据库和系统将定期更新,并且在接下来的几个月中,我们计划将覆盖范围扩大到科学已知的几乎所有测序蛋白质——超过 1 亿个结构,涵盖大部分 UniProt 参考数据库。

要了解更多信息,请参阅描述我们完整方法和人类蛋白质组*的 Nature 论文,并阅读作者说明*。如果您想查看系统的工作情况,请参阅 AlphaFold 的开源代码,以及运行单个序列的 Colab notebook*。要探索这些结构,请访问 EMBL-EBI 的可搜索数据库*,该数据库对所有人免费开放。

###

新发现:国外哪个大学生物材料比较好?

独立领先科学家的声明:

Paul Nurse,2001 年诺贝尔生理学或医学奖获得者,弗朗西斯·克里克研究所所长和 EMBL 科学咨询委员会主席

“计算方法正在改变科学研究,为公共利益的发现和应用开辟了新的可能性。了解蛋白质的功能对于提高我们的生命知识至关重要,并将最终导致医疗保健、食品可持续性、新技术等方面的改进。DeepMind 与欧洲分子生物学旗舰组织 EMBL 一起发布的 AlphaFold 蛋白质结构数据库是生物创新的一大飞跃,展示了跨学科合作对科学进步的影响。有了这个免费和公开的资源,科学界将能够利用集体知识来加速发现,开创人工智能生物学的新时代。”

Venki Ramakrishnan,2009 年诺贝尔化学奖获得者,英国皇家学会前主席

“这项计算工作代表了蛋白质折叠问题的惊人进步,这是一个 50 年前的生物学重大挑战。早在该领域的许多人预测到之前,它就已经发生了。看到它将从根本上改变生物学研究的许多方式将是令人兴奋的。”

伊丽莎白布莱克本,2009 年诺贝尔生理学或医学奖获得者,加州大学旧金山分校名誉教授

“随着 DeepMind 开创的这些革命性的蛋白质结构方法变得可用,这将为科学界打开新的窗口,让他们了解基因组序列的生物学意义。”

Patrick Cramer,马克斯普朗克生物物理化学研究所所长

“DeepMind 和 EMBL 提供的奇妙资源将改变我们进行结构生物学的方式。这些预测展示了机器学习的力量并服务于全球社区,这些社区提供了开放数据以实现这一突破性成就。一个开创性的例子,说明如何在 21 世纪完成科学。”

来自使用 AlphaFold 的研究合作伙伴的声明:

Ben Perry,发现开放式创新负责人,被忽视疾病药物计划 (DNDi)

“我们需要为全球数百万处于被忽视疾病风险中的人加速新药的发现。人工智能可以改变游戏规则:通过快速准确地预测蛋白质结构,AlphaFold 开辟了新的研究视野,提高了研发的范围和效率,并促进了我们在流行国家的研究。看到强大的尖端 AI 支持治疗几乎完全集中在贫困人口中的疾病,这是令人鼓舞的。”

John McGeehan 教授,朴茨茅斯大学结构生物学教授兼酶创新中心 (CEI) 中心主任

“我们的使命是开发用于塑料循环回收的酶解决方案。这项技术正在以一种没人能预料到的方式加速我们的研究。DeepMind 提供的开放访问将改变整个社区,并允许每个人进行这些类型的实验。我们花了数月和数年才完成的工作,AlphaFold 能够在一个周末完成。我觉得我们比昨天的水平至少提前了一年。

科罗拉多大学博尔德分校生物化学系 Marcelo Sousa 教授

“AlphaFold 的预测通过最终解决我们坚持了 10 多年的实验数据,帮助加速了我们对抗生素耐药性的研究。预测是如此准确和精确,以至于我最初认为我可能在设置上做错了!”

DeepMind / Alphabet 的声明:

谷歌和 Alphabet 首席执行官 Sundar Pichai

“AlphaFold 数据库显示了人工智能在深刻加速科学进步方面的潜力。DeepMind 的机器学习系统不仅在一夜之间极大地扩展了我们在蛋白质结构和人类蛋白质组方面积累的知识,而且它对生命组成部分的深刻见解为科学发现的未来带来了非凡的希望。”

Pushmeet Kohli 博士,DeepMind 科学人工智能负责人

“我们的团队一直致力于 AlphaFold,通过预测蛋白质结构来破译和解开蛋白质世界。我们正在通过数据库将 AlphaFold 的预测提供给所有人,以最大限度地利用这些见解取得科学进展。该数据库和 AlphaFold 有可能开辟新的科学探究途径,最终将促进我们对生物学和生命本身的许多领域的理解。我们相信这将对与健康和疾病、药物设计过程和环境可持续性相关的问题的研究产生变革性的影响,并且很高兴看到在未来几个月和几年内开发出哪些应用程序。”

John Jumper,博士,AlphaFold 负责人,DeepMind

“随着数据库的扩展,几乎所有编目的蛋白质都可以使用模型。AlphaFold DB 可能会改变我们处理生物信息学的方式,即对DNA和蛋白质的大规模研究,因为它将使我们能够以接近原子的精度研究所有已知生物体的蛋白质。我们乐观地认为,AlphaFold 的前景和机器学习的进步将推动蛋白质研究进入一个激动人心的新阶段,在这个阶段,深度学习工具可以通过实验方法对生物学进行定量理解。”

Kathryn Tunyasuvunakool,博士,研究科学家,DeepMind

“AlphaFold 模型可用于通过实验方法帮助确定结构。对结构进行足够准确的初始预测将使研究人员能够重新访问和解决以前无法进行模型构建的旧 X 射线数据集和低温电磁图。这是计算方法如何与实验方法互补的一个很好的例子。”

EMBL 的声明:

EMBL-EBI 名誉主任 Dame Janet Thornton 教授

BXP-111透反射生物显微镜
BXP-111透反射生物显微镜

“人工智能的力量是 AlphaFold 预测的基础,该预测基于过去 50 年来世界各地科学家收集的数据。使这些模型可用无疑将激励实验和理论蛋白质结构研究人员将这些新知识应用于他们自己的研究领域并开辟新的感兴趣领域。这有助于我们了解和理解生命系统,这将为人类带来所有机会。”

Sameer Velankar,博士,EMBL-EBI 部门负责人

“距人类基因组革命已有 20 年,AlphaFold 是生物学研究的重大突破。蛋白质功能由其结构决定,AlphaFold 蛋白质结构数据库将提供数百万个预测的蛋白质结构,加速发现过程。前所未有的规模将引发一波新的创新浪潮,帮助我们应对从健康到气候变化的挑战。”

Christoph Müller 博士,EMBL 结构和计算生物学部门负责人

“这是向前迈出的一大步。AlphaFold 结构预测将大大加快结构生物学研究的速度,并将使 3D 蛋白质结构更加成为生命科学研究的焦点。”

相关内容