利用人工智能加速基于核磁共振的蛋白质结构测定

瑞士苏黎世联邦理工学院的Roland Riek教授的研究兴趣涉猎广泛,其中大部分涉及核磁共振在生物系统中的应用,特别是蛋白质。但他的最新项目与其他项目全然不同,其重点是如何加快结构测定本身,利用人工智能(AI)来简化核磁共振数据采集和分析的过程。

像许多核磁共振(NMR)学界的人一样,Roland Riek教授最初对这项技术感兴趣是因为它的跨学科性质。Riek教授学习过物理学,但对生物学非常着迷,他选择了当时(1990年代中期)唯一横跨两个领域的研究领域——核磁共振。Riek教授在瑞士苏黎世联邦理工学院K.Wüthrich教授小组攻读学位时的工作是一个主要动力,他说:"他们当时正非常投入地开发核磁共振这项技术,专业知识令人惊叹。那时候我就知道,我想继续从事核磁共振工作。"

Riek教授对核磁共振的热情到今天也没有减退,他说:"我之所以喜欢核磁共振,是由于这项技术的多功能性和分辨率。我们可以利用NMR研究多达200个氨基酸的蛋白质结构中的原子级相互作用......这太神奇了。虽然核磁共振所涉及的分析过程很复杂,但我非常乐于接受解析谱图表达的内容这一挑战。"

Riek教授研究的广度也令人钦佩,包括以sub-Angstrom分辨率解决所谓的"多态结构"、了解帕金森病中蛋白质聚集的机制、调查参与癌症发展的酶、利用化学诱导动态核极化(CIDNP)改善核磁共振的信噪比、在细胞内核磁共振技术方面取得进展、以及考虑将自聚集晶体作为生命起源的一种可能机制。

尽管Riek教授每天都忙着指导包含15-20名研究人员的研究小组,并作为ETH资深教职工参加各种会议,他仍然喜欢核磁共振这项技术的实践方面,他说:”我大概每周会查看一下我们的核磁共振设施,设置实验还有分析数据。“

使用核磁共振观察蛋白质:拍电影和快照有何区别?

Riek教授认为,核磁共振的一个关键优势是它能够提供对蛋白质在原子水平上的行为的理解:“这有点像能够拍出一部显示工厂运作的电影,但规模缩小了100亿倍。”

Riek教授指出,NMR与其他方法形成强烈对比:“诸如低温电子显微镜和X射线晶体学等方法当然有其价值,但用这些方法你只是得到了快照——蛋白质要么真的被冻结在基质中,要么被固定在一个晶体中。这意味着我们必须做大量的工作来重构整个过程。“与此相反的是,核磁共振具有独特的蛋白质研究能力,因为蛋白质会在溶液中不断移动,这为观察它们如何工作提供了许多机会:“你现在就可以了解蛋白质如何折叠,如何移动,如何与其他分子结合,这是一个令人难以置信的强大且广泛适用的方法。”

新仪器、新方法、新见解

而这种能力是由高分辨率仪器的可用性推动的,包括2020年6月在苏黎世联邦理工学院安装的布鲁克1.2GHz核磁共振系统。尽管到目前为止,Riek教授使用这台谱仪的时间有限,但他对所看到的一切都感到印象深刻,他说:"这台仪器的超高分辨率着实让我惊讶,尽管知道理论上来说可以期待什么样的内容,但当我第一次看到谱图时,仍然感到是一个很大的惊喜。"

2020年6月,苏黎世联邦理工学院成功安装全球第二台布鲁克1.2 GHz核磁共振波谱仪

 

Riek教授计划在两个主要方面使用新设备:“首先,我们想在这些高场系统上开发新的方法。我们一直在推进核磁共振的边界,你永远不知道这将推动怎样的进步。应用场景可能不会立即开发出来,但对于核磁共振,你几乎可以保证,在适当的时候,肯定会有一个研究领域从新方法中受益。我认为这往往是这种开放式、‘蓝天’类型研究的方式。

“其次,我们也对推进对细胞内生物分子的理解很感兴趣,从而开发治疗帕金森症等神经退行性疾病的新方法。一旦了解了在分子水平上发生了什么,我们就可以合理地处理这些问题,并最终开发出新的技术来治疗它们。”

利用人工智能打破信息瓶颈

但是,伴随着这些研究的可能性而来的还有一个问题——数据。Riek教授表示:“生物核磁共振的进展受到了数据可用性和处理时间的阻碍。首先要考虑数据的可用性,值得注意的是,在核磁共振研究的成千上万的蛋白质结构中,只有极小部分的原始数据集提供给了其他研究人员。这是目前核磁共振领域尚未解决的一个巨大问题。

但是他认为,第二个难题——运行核磁共振实验和分析结果所需的时间,可以利用快速发展的人工智能(AI)来解决。

他说:“目前,完全确定一个蛋白质结构的特征需要六个月到几年的时间。完成所有的测量并分析所有的数据是非常耗时的,而且需要专家不断地判断。”他认为,这个瓶颈阻碍了该领域的进展,因此找到一个解决这个问题的办法是很困难的。教授指出:“加快获取核磁共振数据的过程并不容易。我们受到需要培养生物介质和准备分析样本的限制,然后又受到运行核磁共振脉冲序列的规定时间的限制。但我们能做的是更有效地利用核磁共振仪器上的时间,简化数据分析。”

Riek教授认为,人工智能提供了一条实现这两个目标的途径:“通过训练算法来评估产生的结果,然后对实验进行即时的自动修改,我们可以节省大量的时间,只运行那些对解决结构问题有必要的脉冲序列。而且由于仪器的时间是昂贵的,我们在这个过程中也会省钱。”Riek教授在这一领域的工作仍处于早期阶段,但他相信,一旦初步结果发表,这种方法的优势将是广泛适用的。

生物核磁共振的数据处理革命?

那么,Riek教授认为人工智能对使用核磁共振的日常蛋白质结构测定会有什么影响呢?

他很乐观地表示:“试想一下,如果我们能够生成一个蛋白质结构,比如说,只需要两周的数据采集和五个小时的分析。这现在听起来可能很牵强,但我认为我们可以在1-2年内现实地看到这一点。如果是这样,我认为这将彻底改变生物化学的工作方式,因为它加速了对高度复杂的生物大分子的研究,而且一下就让以前不切实际的事情成为可能。”

而这又与Riek教授先前关于基础研究的意外应用的观点相联系:“你不一定能预测一种新的方法可能出现什么进展。在核磁共振领域,也许有一种方法可以进行实验,显示单个水分子如何与蛋白质互动。如果是这样,那会有用吗?也许会。但在我们尝试之前,我们不会知道。

“我认为想尝试新事物是人类本性的一部分,即使你不能立即设想出一个应用。在科学领域,这意味着首先要想出方法,然后看看它能把你引向何处。”

合作与未来:从蛋白质结构到蛋白质动力学

与许多核磁共振领域的研究人员一样,Riek教授的工作也依赖于合作:“除了与布鲁克的科学家密切合作外,我们还与几个团体联系,他们从不同的角度,使用不同的分析方法,为我们的研究目标作出贡献。蛋白质本身就是一个复杂的目标,尤其是一旦你加入了神经退行性疾病中涉及的聚集和分解过程。那么就必须与多个研究人员合作,使用不同的方法来提取最大的信息。”

这是一个他热衷于推广的工作范式:“我们目前正在建立一个服务器,使我们能够向合作者提供基于人工智能的核磁共振服务——上传你的核磁共振数据,你就会得到自动生成的结构。它的进展很顺利。”

有了Riek教授的团队取得的这些和其他进展,未来看起来是十分光明的:“在未来几年,我认为我们将看到大多数核磁共振研究的重点,一方面是每年确定许多蛋白质的结构,另一方面是通过将动力学测量与多态蛋白质结构确定相结合,去研究蛋白质的动力学,以获得蛋白质如何运动和运作的完整图像。这是一个非常令人兴奋的前景。”

如需了解更多关于Riek教授的研究,请访问:https://chab.ethz.ch/forschung/institute-und-laboratorien/LPC.html

如需了解更多布鲁克核磁共振产品系列信息,请访问:https://www.bruker.com/zh/products-and-solutions/mr/nmr.html

Roland Riek教授

瑞士苏黎世联邦理工学院化学和应用生物科学系物理化学教授和生物核磁共振小组组长,自2007年以来一直在ETH任职工作。在此之前,Riek教授是美国加州La Jolla的Salk生物研究所核磁共振设施主任。