欢迎访问本站!

首页科技正文

龚海鹏:AlphaFold2与结构生物学

admin2021-08-2337

USDT交易所

www.usdt8.vip),全球頂尖的USDT場外擔保交易平臺。

,

近年来,受益于人工智能和深度学习手艺的快速生长以及结构生物学数据的大量积累,卵白质结构展望的方式学取得了突破性的希望。2020年举行的第14届卵白质结构展望竞赛CASP14中,Google DeepMind团队开发出的人工智能算法AlphaFold2(简称AF2)震惊了天下,对竞赛的目的卵白的展望精度GDT_TS分数跨「kua」越了90%,意味着对其中许多卵白所展望的结构与实验结构异常靠近,RMSD在1-2埃以内。2021年7月15日,DeepMind团队在Nature杂志揭晓论文,详细形貌了AF2的设计思绪,并提供了可运行的开源代码。统一天,David Baker 团队在Science杂志揭晓论文,提出了接纳类似设计思绪的RoseTTAFold算法及其开源代码。随后,DeepMind团队使用AF2展望了多个物种 *** 30余万个无实验结构的卵白质的结构模子,并联手EBI确立了却构展望数据库AFDB。这一系列功效的泛起吸引了科学界的大量关注,人人众说纷纭。一方面,施一公教授等顶级结构生物学家甚至宣称AF2本世纪最主要的科学突破;另一方面《mian》,也有科学家对AF2展望的精度提出质疑。此外,有许多人以为实验结构生物学会成为昨日黄花,逐渐退出历史舞台。本文中对此征象做出一些小我私人解读。

撰文 | 龚海鹏(清华大学生命科学学院副教授、博士生导师、北京结构生物学高精尖创新中央研究员)

01 AF2的主要性和创新性

凭证Anfinsen规则,卵白质的氨基酸序列决议其三维结构,同时三维结构又是卵白质行使其生物学功效的基础。因此,研究卵白质序列和结构间关系的卵白质折叠问题是生物物理领域最主要的基础问题之一,困扰了科学界50年之久。由于卵白质序列和结构之间属于高维到高维的映射关系,传统上接纳数学或物理的方式都无法解决这一问题。近年来,随实验手艺的提高,通过新一代测序手艺和卵白质晶体学以及冷冻电镜等结构生物学方式,积累了大量的卵白质序列和结构信息,为使用人工智能手艺研究序列-结构间关系打下了优越基础。从2016年举行的CASP12竞赛最先,种种深度学习手艺普遍应用于卵白质结构展望领域,引发了却构展望准确度的快速提升。AF2是其中的集大成者,接纳了差异于以往方式的全新算法设计,具有极高的创新性。从生物物理角度看,AF2设计的神经网络架构,稀奇是Evoformer架构中序列信息与氨基酸残基相互作用图谱间的迭代优化,与卵白质折叠的物理机理隐约吻合。同时,模子第一次乐成地实现了端对端的精准结构展望,以序列比对为输入,不经由中央步骤,直接展望三维结构坐标。此外,能显著提高展望水平的recycling和self-distillation等手艺也是首次应用于结构展(zhan)望领域,体现了工程设计优化对方式学生长的主要性。因此,无论是从方式设计的角度照样从性能的角度看,AF2都体现了人工智能方式和生物物理头脑的完善连系,不失为近年来最主要的科学突破之一。

02 AF2的局限性

足球免费推荐

免费足球贴士网(www.zq68.vip)是国内最权威的足球赛事报道、预测平台。免费提供赛事直播,免费足球贴士,免费足球推介,免费专家贴士,免费足球推荐,最专业的足球心水网。

受限于算法和硬件,AF2在适用中另有一定的局限性。首先,DeepMind团队使用AF2算法对近期(2018年4月30日至2021年2月15日)新剖析出的一万余条卵白质序枚举行“xing”了却构展(zhan)望。虽然其中近一半的卵白展望精度较高,RMSD95(笼罩95%残基的RMSD)在2埃以内,然则仍有【you】许多卵白的展望效果不佳,好比近20%的卵白其RMSD95跨越8埃。众所周知,依托结构的机理研究和药物开发等往往需要高精度的结构模子,误差在2埃以上的展望模子对真实应用没有指导作用。因此,针(zhen)对这些卵白,仍然需要接纳实验结构生物学方式举行结构剖析。其次,AF2在展望时严重依赖GPU显存,纵然使用现在市面上最好的A100显卡,在举行单卡展望时该算法也仅能处置2500残基以内的卵白序列。若是使用CPU举行展望则会严重影响(xiang)算法的运行效率,而且随卵白残基数越多,对内存的压力越大。当前的AF2程序还无法像单颗粒冷冻电镜一样剖析出超大型复合体的结构。第三,AF2的输入信息泉源于多重序列比对(MSA),而非单纯的氨基酸序列。多重序列比对相当于自然界以进化的方式做的实验,其中含有许多分外的信息。凭证测算,当不使用MSA而仅使用目的卵白的单序列信息时,AF2的展望精度大幅度下滑。因此AF2还不能算是完全解决了序列和结构间的映射关系。最后,AF2等结构展望方式现在仅能展望特定氨基酸序列的一种构象。卵白质在行使生物学功效时往往需要发生构象转变。好比酶从失活状态转变为活性状态、膜转运卵白需要通过构象转变交替接触膜两侧的溶液、卵白和配体连系时发生构象转变等等。在实验结构生物学方式中,冷冻电镜、核磁共振、小角散射和单分子等手艺都可以在一定水平上捕捉结「jie」构的动态特征,展现构象转变历程。现在的AF2还不具有这样的能力。可以看到,由于以上局限性,AF2至少在现在阶段还无法取代实验结构生物学的职位。

03 AF2为新一代结构生物学的生长提供契机

即便有以上的局限性,AF2的提出仍属于主要的科学突破。同时AF2将会成为实验结构生物学的主要工具,并推动相关领域的进一步生长。首先,冷冻电镜等实验生物学研究的条件是目的卵白的表达和提纯,因此往往在自然卵白质序列中引入点突变,以稳固卵白的结构(好比把目的卵白锁定在一种主要构象中)。在缺乏结{jie}构信息时,突变位点的设计往往以履历为主,费时艰辛。AF2可以快速展望卵白的结构,为突变位点的设计提供主要的结构信息作为参考。基于结构的突变位点设计显然更有针对性,好比相对于卵白结构的内部残基,外面的残基的突变往往不容易损坏结构的稳固性。其次,AF2展望的结构可以作{zuo}为实验结构生物学的初始结构模子,辅助最终的结构建模。好比,X射线晶体衍射实「shi」验往往由于缺乏相位信息无法确立结构模子,已有研究《jiu》解释,AF2展望的结构可以提供主要的相位信息,从而有用辅助卵白质晶体学家快速剖析结构。再好比,单颗粒冷冻电镜结构剖析中二维图像的分类对最终模子的确立至关主要,然则现在的算法要先依赖履历举行初始分类再迭代优化。AF2展望的结构显然可以对二维图像的分类提供主要的理论指导,从而进一步优化电镜结构模子的建模。第三,AF2展望的结构〖gou〗可以提供初始坐标作(zuo)为卵白质结构动态研究的基础。冷冻电镜断层扫描、核磁共振、小角散射以及单分子荧光等实验可以快速获取卵白质的部门结构特征用于表征或形貌卵白质的结构动态转变,然则{ze}这些方式或者只能获得低分辨率的结构信息(如冷冻电镜断层扫描),或者完全缺失结构细节(如小角散射和单分子荧光),或者需要庞大冗长的实验流程才气获得结构细节(如核磁共振)。显然,AF2展望的结构可以为这些方式弥补缺失的结构信息。最后,有了AF2展望的结构,分子动力学模拟等盘算化学方式也会(hui)有更普遍的应用。传统的分子动力学模拟盘算需要以可靠的结构作为模拟起始点,因此很难用于研究未知结构卵白。AF2则大大扩展了分子动力学模拟盘算的研究局限,从而对分子机理的研究、卵白质设计和药物设计等提供主要的辅助作用。

综上所述,以AF2为代表的新一代卵白质结构展望方式将会成为结构生物学的主要弥补,并推动整个结构生物学领域的进一步生长。在新的形式下,需要充实行使卵白质结构展望算法提供的信息对结构生物学的研究模式举行新的探索。

作者简介

龚海鹏博士划分于1997年和2000年于清华大学生物科学与手艺系(后改为生“sheng”命科学学院)获得学士以及硕士学位,后前往美国约翰霍普金斯大学攻读博士学位,师从George Rose教授,并于 2007年获得生物{wu}物理学博士学位。随后,其加入芝加哥大学Tobin Sosnick教授实验室从事博士后研究。2009年,其返回清华大学任教至今,现为清华大学生命科学学院副教授、博士生导师、北京结构生物学高精尖创新中央研究员。实在验室专注于与卵白质结构相关的盘算研究和方式开发,包罗卵白质结构展望、定量剖析生物大分子的大尺度构象转变等研究。

网友评论