我的快乐小窝 > 财经科技 >大卫·贝克团队用AI设计新蛋白质,具有极大的结构稳定性

大卫·贝克团队用AI设计新蛋白质,具有极大的结构稳定性

在构成细胞的化学物质中,除遗传因子 DNA 外,蛋白质也同样发挥出至关重要的作用,无论是从阳光中获取能量,还是制造生命所需的分子,蛋白质在生物体生命活动中都扮演着重要的角色。

蛋白质由 20 种氨基酸按照不同的顺序连接而成,是一大类具有复杂功能的分子。

氨基酸的序列决定了它的三维形状,这种错综复杂的结构对决定蛋白质的不同功能发挥出至关重要的作用。(来源:Science)

(来源:Science)

早在 2020 年年底,AlphaFold2 作为 DeepMind 公司研发的深度学习算法软件,解决学术界 50 年没有解决的“蛋白质折叠”难题,解析出不同的蛋白质结构。

“依我之见,这是人工智能对科学领域最大的一次贡献,也是人类在 21 世纪取得的最重要的科学突破之一,”谈及 AlphaFold 的最新成果,生物物理学家、西湖大学校长施一公曾在 2021 年告诉 DeepTech。

先是有 AlphaFold 能够全面解析蛋白质结构。如今,科学家又研发出 Protein MPNN 人工智能工具,能够设计出全新的蛋白质。

Protein MPNN 的出现为科学家提供更全面的研究方法:用 Protein MPNN 设计出全新的蛋白质,再用 AlphaFold 全面解析验证所设计蛋白结构的准确性,使对于蛋白质的设计更趋于个性化。

华盛顿大学生物化学家大卫·贝克(David Baker)等人将 Protein MPNN 相关的研究论文以《基于深度学习的蛋白质序列设计方法》(Robust deep learning–based protein sequence design using ProteinMPNN)发表在 Science 上。

(来源:Science)

据介绍,蛋白质传统设计方法是在已有的结构上进行修改。

论文中提到,现有的 Protein MPNN 方法能够为特定任务设计出蛋白质序列,短短几秒钟之内就能够根据自主意愿快速生成全新蛋白质,既高效又准确,既能够解锁全新治疗方法、开发出更有效疫苗,还能够加速癌症的治疗研究,或设计产生全新的蛋白质材料。

适用于几乎所有蛋白质序列设计问题

(来源:Science)

“ProteinMPNN 之于蛋白质设计,就像 AlphaFold 之于蛋白质结构预测。”贝克告诉媒体。

Protein MPNN 是一种基于深度学习算法的实验工具,解决了生成蛋白质过程中的逆折叠现象,借用图像识别工具,设计出与特定结构相对应的序列。

经测算,实验设计成功率高、计算效率高,适用于几乎所有的蛋白质序列设计问题,是蛋白质序列设计的标准方法,用于设计复杂的纳米机器和生物材料。

据悉,Baker 研究蛋白质设计已达 30 年之久,曾在 1998 年开发出 Rosetta 软件,是一套用于模拟大分子结构的综合软件,能够将蛋白质的创造过程分解为多个步骤,构思出蛋白质的形状,计算出氨基酸序列。但是,实验成功率低,耗费时间长。

该团队用 Protein MPNN 等程序开展实验,耗费时间极大缩短,能够随机将氨基酸序列输入到结构预测网络,使氨基酸排列方式发生转变,越来越接近蛋白质结构。

据统计,使用 Protein MPNN 的序列获得率为 52.4%,而使用 Rosetta 的序列获得率仅为 32.9%。

论文中还提到,不同位置的氨基酸序列可以在单链或多链之间耦合,使设计出的蛋白质应用范围广泛,通过X射线晶体学、冷冻电镜和功能研究,展示出 Protein MPNN 的广泛用途与高精度。

在高精度方面,Protein MPNN 能够制造出纳米级环状蛋白质,大约比罂粟种子小十亿倍,用电子显微镜才能观察到。科研人员认为这种纳米级环状蛋白质可以被用作纳米机器的零部件。

(来源:华盛顿大学蛋白质设计研究所)

设计出结构稳定的蛋白质

Protein MPNN 在运行过程中能够自动进行大规模侧链包装计算,改变了从前使用 Rosetta 或 AlphaFold 对蛋白质单体、组件和蛋白质-蛋白质接口进行的失败设计,使产品更加稳定。

与 Rosetta 和其它基于物理方法不同,Protein MPNN 能够准确反映出序列设计问题框架的基本差异,从而更容易获得预期蛋白质。

总之,运用 Protein MPNN 程序实验设计成功率高、计算效率高,适用于几乎所有蛋白质序列设计问题,而且不需要定制。

除此之外,Protein MPNN 使氨基酸具有更高的结晶倾向,极大地促进了设计蛋白质结构稳定性。

利用该方法稳定性好的优点,研究团队正在将 Protein MPNN 扩展到蛋白质-核酸设计和蛋白质-小分子设计。

目前,ProteinMPNN 可以在开源软件库 GitHub 上免费获得,将为更多研究人员提供最新式的蛋白质设计工具。

支持:Bao

参考资料:

J. DAUPARAS,ANISHCHENKO,BENNETT,R. J. RAGOTTE,L. F. MILLES,B. I. M. WICKY,(2022).Robust deep learning–based protein sequence design using ProteinMPNN.Science

本文来自网络,不代表本站立场,转载请注明出处:https://www.51din.com/a/5744.html

方法,大卫·贝克,设计,序列,氨基酸,Science,Protein,结构,蛋白质,Rosetta

我的快乐小窝后续将为您提供丰富、全面的关于方法,大卫·贝克,设计,序列,氨基酸,Science,Protein,结构,蛋白质,Rosetta内容,让您第一时间了解到关于方法,大卫·贝克,设计,序列,氨基酸,Science,Protein,结构,蛋白质,Rosetta的热门信息。小编将持续从百度新闻、搜狗百科、微博热搜、知乎热门问答以及部分合作站点渠道收集和补充完善信息。