戴尔高性GPU服务器助力冷冻电镜——人类对抗病毒的一双“慧眼

戴尔高性GPU服务器助力冷冻电镜——人类对抗病毒的一双“慧眼

3月4日,美国著名的 Science 杂志发表了一篇题为《Structural basis for the recognition of the SARS-CoV-2 by full-length human ACE2》的研究论文。揭开新冠病毒入侵人体细胞的神秘面纱。

这是西湖大学研究员周强团队,通过冷冻电镜技术,首次成功解析新型冠状病毒细胞表面受体 ACE2 的全长三维结构,以及新型冠状病毒表面 S 蛋白受体结合结构域与细胞表面受体 ACE2 全长蛋白复合物的三维结构,因而受到了国际科学期刊的认可这次是世界上首次解析出 ACE2 的全长结构,为新冠病毒的研究提供了重要的基础。而在其背后,作为生物大分子的结构研究的重要手段,冷冻电镜技术,就像是人类对抗病毒的一双智慧的双眸,让病毒露出“原型”。


电镜科研的四大挑战

冷冻电镜的发明者之一、2017年诺贝尔化学奖获得者 Jacques Dubochet,在1970年代用电子显微镜研究水在各种冷冻条件下的结构时,可能没想到,他的研究会成为结构生物学广泛应用的实验方法。

冷冻电镜本质上是电子散射机制,基本原理就是把样品冻起来然后保持低温放进显微镜里面,利用相干的电子作为光源对分子样品进行测量,透过样品和附近的冰层,透镜系统把散射信号转换为放大的图像在探测器上记录下来,最后进行信号处理,得到样品的三维结构。

由于这项技术可实现直接观察液体、半液体及对电子束敏感的样品,如生物、高分子材料等,所以被很多科研院所作为一种必备的研究手段。

清华大学生命科学学院生物计算平台主管杨涛认为:冷冻电镜目前在科研方向的挑战有四个,分别是:数据管理的挑战,科研进度的挑战,实验风险的挑战和快速试错的挑战。

戴尔高性GPU服务器助力冷冻电镜——人类对抗病毒的一双“慧眼

第一:数据管理的挑战,源于超量的数据,在最大化压缩的前提下,每天大约会产生4个TB的数据量,而为了发挥计算设备的最大效率,都是365天无休的工作,一年下来的数据量总体就非常惊人,也给数据管理带来巨大挑战。

第二:科研管理的挑战,因为冷冻电镜技术已经备受认可,所有的科研机构都调集了资源进来,希望抢占高地,所以存在抢时间效率的问题,哪怕比别人慢半天也丢掉了首发的价值。

第三:实验风险的挑战,因为这是一个非常长期的实验流水线,任何中间环节都存在风险,一旦风险无法及时解决,整个系统的产出就会大打折扣。

第四:快速试错的挑战,任何技术风险都是可以解决的,但是加上时间限制的话,快速解决问题的能力就尤为关键。“清华大学做的最有特色的就是快速试错,将整个实验的生命周期压得非常短。如果说每个单位科研人员的水平是接近的,那么每次是错的迭代速度更快一点,产出就一定会更高。包括西湖大学的两个电镜中心,也是清华大学辅助建设的,在快速试错方面也做得非常好。” 杨涛说。好在这些难题,都可以通过技术手段的来加以解决。


三维重构的难题与解决之道

诞生于上个世纪70年代的冷冻电镜技术,其实经历了一个长期的发展,直到2013年才做到突破,使传统 X 射线、传统晶体学长期无法解决的许多重要大型复合体及膜蛋白的原子分辨率结构,一个个被迅速解决。

正因为冷冻电子显微镜的自动化、分辨率、直接电子探测技术以及高性能图像处理技术的大幅提高,越来越适合分析大的难以形成三维晶体复合体的三维结构,如膜蛋白以及病毒和蛋白质-核酸复合物等。如对新冠病毒的研究突破,就是一个典型的例证。

我们都清楚,冷冻电镜最大的技术难点就是在于三维重构。这项技术本身,是通过数据采集、图像处理、三维重构三个步骤来实现对三位解构的呈现。每一个步骤都需要采集大量的图像数据,以及对这些图像进行处理和分析,这导致,三维重构计算需要花费极其漫长的时间,研究效率非常低下。

解决这一难题的关键,就是高性能计算以及 GPU 集群。

通常来讲,GPU 凭借着其得天独厚的并行计算优势,对大规模数据处理能力尤为突出。在对样本进行图像采集之后,能够快速地对图像进行保存,并且凭借着高速的计算能力,可以迅速地对图像进行优化,大大提高了三维重构的质量。

尤其针对科研单位面对的“实验风险的挑战”,在重构的过程中,GPU 的加速效果尤为明显,将漫长的重构计算时间进行了大量的压缩,为科研人员争取了大量最为宝贵的科研时间。同时,科研效率的提升,也进一步加快的试错的迭代速度。

另一方面,实现高速大带宽直连通讯的快速互联机制,超高计算密度,还极大地节省了使用空间。此服务器还是可以上架的,对于后期需要进行计算集群扩充的客户来说简便易维护。所以,对于冷冻电镜初探阶段的研究和后期全方位科研开展都特别适合。


戴尔助电镜擦亮双眼

戴尔高性GPU服务器助力冷冻电镜——人类对抗病毒的一双“慧眼

这些技术难题和逻辑可见,要解决数据管理这第一大挑战,就需要海量的 GPU 算力资源,以及与之相应的基础设施。

戴尔科技,在生命科学领域亦有很多的产品和解决方案,可以为冷冻电镜科研院所提供帮助。

首先,戴尔易安信有 PowerEdgeC4140 服务器,1U 高度可以安装4块双宽度 GPU(如nVidia Tesla V100),且支持 NVLink 或 PCI-E 两种架构方式可选,用于不同的应用业务场景,同时节省机柜占用空间。

除此之外,戴尔还有 R740/R740xd、R7515、R6515、R6525、R840R940XA、T640 等一系列优秀的 GPU 服务器,可以支撑冷冻电镜对 GPU 计算集群的建设需求。

其次,冷冻电镜 HPC 集群对存储 I/O 性能和容量要求也非常高,要保证强大的计算资源以得以最大化被利用,也需要性能优越的存储资源。

那么在存储领域,戴尔科技集团亦有深厚的技术积累,并且经过多年的市场考验,长期在 IDC 全球外部存储设备市场排名第一。特别是针对 HPC 应用领域,提供了多种存储方案供选择。既能保证性能和容量要求,又提供更多功能选择供未来扩展业务应用。

第三,在硬件之外,还需要大量软件和服务的支持。戴尔则有“ 适用于 HPC 的 ProSupport 附加服务”,提供了比 ProSupport 及 ProSupportPlus 基于设备本身售后服务更高级别的支持。这为很多的科研院所解决了大量后期运维的难题。

截止目前,戴尔凭借多年以来在高性能计算领域的深厚沉淀,在国内很多高校生命科学院也成功实施部署了规模不等的冷冻电镜 HPC 平台,例如包括 清华大学生命科学与技术学院、北京大学生命科学联合中心、西湖大学生命科学学院、哈尔滨工业大学生命科学与技术学院等都有丰富的部署和实施经验。

对冷冻电镜技术来说,作为人类对微观世界深入研究的一双慧眼,解决了它计算资源的难题,等于帮助其擦亮了眼睛,让病毒现出“原型”,时刻保护着人类世界。