诺奖化学奖再次垂青AI?这个研究领域可是诺奖化学奖“顶流”!
交汇点讯 10月9日,瑞典皇家科学院宣布,将2024年诺贝尔化学奖授予大卫·贝克(David Baker)、戴米斯·哈萨比斯(Demis Hassabis)和约翰·江珀(John M.Jumper),以表彰他们在蛋白质设计和蛋白质结构预测领域作出的贡献。
蛋白质,是生命中精妙的化学工具。蛋白质设计为何能摘得今年的诺奖?记者邀请南京大学化学化工学院、化学和生物医药创新研究院教授郑鹏进行科普。
诺奖热门之选,蛋白质结构研究已获颁10余次奖项
众所周知,诺奖的初衷是为了表彰那些为全人类创造最大利益的贡献者。在今年诺奖化学奖的预测中,蛋白质三维结构的革命性技术——阿尔法折叠(AlphaFold)就位列其中,被认为是今年夺奖的热门之选。
没有蛋白质,生命就无法存在。我们现在可以预测蛋白质结构并设计自己的蛋白质,这给人类带来了极大的益处。郑鹏教授科普道,蛋白质是生命执行各类生理功能最重要生物大分子,在维持身体结构、促进代谢、支持免疫系统等方面发挥着至关重要的作用。“比如,用于消化的酶、抵御病毒的抗体、人体的肌肉都是由蛋白组成的。”郑鹏表示,蛋白质设计与人类可以说息息相关,可以让人类获得更加强壮的肌肉、更稳定的蛋白类药物,更有效的蛋白类靶向药物……满足人类的各种需求。
诺贝尔奖官方表示,2024年诺贝尔化学奖的主题是蛋白质——生命中巧妙的化学工具。大卫·贝克成功完成了几乎不可能的任务,构建了大量全新的蛋白质。戴米斯·哈萨比斯和约翰·江珀开发了一种名为AlphaFold2的人工智能模型,解决了一个50年来的难题:预测蛋白质的复杂结构。这些发现具有巨大的潜力。
事实上,蛋白质结构研究一直是诺贝尔化学奖青睐的对象,至今已颁发十余次奖项,既包括重要蛋白(或复合物)的解析,也包括新技术或新方法的突破,因此该领域长期来看是生命科学前沿和焦点。
求解蛋白质折叠之谜,借助计算机模拟“上帝之手”
诺奖得主大卫·贝克是一位美国生物化学家和计算生物学家,目前是美国华盛顿大学蛋白质设计研究所所长,以开创能够预测和设计蛋白质三维结构的方法而闻名,也有多位中国留学生在其门下学习。
想做蛋白质设计,首先要破解蛋白质的结构。学过高中生物的都知道,蛋白质由20种不同的氨基酸组合而成,氨基酸就像乐高块一样,通过不同的排列组合,形成有各种功能的蛋白质。“但是,线性排列的‘一维’蛋白质是没有功能的。科学家早就通过实验发现:氨基酸序列很奇妙,就像有设计图纸一样,他们可以自发折叠为三维结构,并在细胞内发挥特定功能。那么一条氨基酸序列是如何折叠成三维结构的呢?”郑鹏说,从20世纪80年代开始,大卫·贝克就对这个问题产生兴趣,并一直致力于解开蛋白质折叠之谜。
“解开三维折叠之谜,是一个非常耗时耗力的工作,也不见得成功。”郑鹏介绍,大卫·贝克的贡献是借助计算机的力量做蛋白质结构设计和预测相关的课题
1996年,大卫·贝克与研究生们开始编写一个叫做Rosetta的程序,这个程序有潜力根据一段氨基酸序列解出蛋白质的结构。Rosetta的程序设计用了一种十分巧妙的方法,它不是通过穷举法从这些天文数字般的可能结构中挨个寻找自由能最低的形状,而是先分析蛋白质的生物物理特性,模拟出一个大致的形状,然后进行微调,只留下自由能更低的结果。这样一来,研究人员可以更快预测出蛋白质的结构。
在Rosetta这个程序基础上,2003年,大卫·贝克的团队设计出了第一个原本并不存在于自然界中的蛋白质,它被命名为Top7,具有完全新颖的褶皱。接下来的几年时间,大卫的团队对Rosetta进行了更多的优化。如今,大卫·贝克的实验室,以及他的合作伙伴们已能设计出一个又一个富有想象力的蛋白质,并证明能被用于药物、疫苗、纳米材料和微型传感器。
3名获奖者均与人工智能领域有关,蛋白质结构预测新工具获一半奖项
如果说大卫·贝克近几十年一直从事蛋白质设计工作,戴米斯·哈萨比斯和约翰·江珀则是近十年才从事该研究,通过利用AI,在蛋白结构预测取得了颠覆性成果。
根据网络信息,约翰·江珀1985年出生,戴米斯·哈萨比斯是“75后”,他们带领的是一支非常年轻的团队。
在2018年前,大卫及其团队开发的Rosetta在蛋白质结构预测领域完全没有对手。而在那一年,戴米斯·哈萨比斯和约翰·江珀联合研发的AI模型——AlphaFold让大卫感觉到了危机,该模型能将蛋白质结构有关的物理知识和生物学知识结合起来,通过融入深度学习算法,根据氨基酸序列来对蛋白质结构进行高精度的预测,让人工智能快速成为蛋白质结构预测领域的专家。尽管2018年的蛋白质结构预测竞赛依然是Rosetta拔得头筹,但首次亮相就获得了第二名的AlphaFold令大卫·贝克见识到了机器学习的过人之处。于是,他要求团队紧跟时代的风向,加紧研究机器学习。
他们真正取得惊人突破,仅仅在四年之前。郑鹏介绍说,2020年,戴米斯·哈萨比斯和约翰·江珀首次公布了他们所开发的AlphaFold2人工智能模型。在该模型的帮助下,二人得以预测出当时人们已确定的几乎所有2亿种蛋白质的结构。在2020年的竞赛中,第二代AlphaFold击败了Rosetta,一举成名。
两个团队既有竞争关系,也在相互促进。2021年7月15日,当DeepMind公司在《自然》杂志上发表论文,公开了“AlphaFold2”的源代码,并且详细描述了它的设计框架和训练方法时,大卫的团队也在《科学》杂志上介绍了其开发的RoseTTAFold算法。
“两位学者能这么快得奖,其实也反映了AI的发展及其在蛋白改造设计中的应用趋势是势不可挡的。”目前,郑鹏及团队也在运用AI改造肌肉蛋白,针对猴痘病毒螺旋结构进行蛋白分子设计。“AlphaFold已经极大地减少了人工确定蛋白质结构的时间,在AI的辅助下,人工改造设计蛋白质逐渐从幻想变为现实,并已成为不可阻挡的未来发展趋势。未来这项研究将有助于人们更好地了解疾病,并能加速新靶向药物的开发。”
新华日报·交汇点记者 杨频萍