【广州日报】中科院系统里排名第一的超算中心,就在广州!

  

  随着超级计算应用领域的逐步扩展,超级计算机已成为支撑前沿科研的国之重器。如果将“国家超级计算广州中心”比作润泽诸多科研领域的大海,那么“中科院超算环境广州分中心”就是滋养生命科学领域的湖泊。

  成立于2014年的中科院超算环境广州分中心以其惊人的计算能力在干细胞与再生医学、疾病健康、药物设计、感染与免疫、等领域都有广泛应用。在2019年中科院发布《中国科学院超级计算发展指数报告(2018)》中,中科院超算环境广州分中心(简称超算广州分中心)的超算发展指数在中科院各超算分中心中位列第一名。 

  近日,广州日报全媒体记者走进中科院超算环境广州分中心,了解超算广州分中心在支撑科研和人才培养中所发挥的作用。

  中科院超算环境广州分中心的服务器上绿灯闪得频繁, 

  可见各个实验室的忙碌程度 

  通过“化缘”建成的超算中心 

  超算广州分中心于2014年正式获得中科院批准、依托中科院广州生物医药与健康研究院建设和管理,面向广州两院地区及相关单位用户服务。

  在中科院广州生物医药与健康研究院一间普通的机房里,广州日报全媒体记者看到,超级计算机被安放在恒温恒湿的环境,容不得半点灰尘。科学家通过它们,读取生命科学、新材料、新能源等领域的重要密码。

  “如果把科研当做造房子,那么超级计算机无疑就是一台挖掘机。” 广州健康院研究员刘劲松说。

  以数据计算驱动科研创新正变得越来越重要,但起初在建设超算广州分中心时,很多人并不理解。“这个超算中心在2013年开始规划,有人觉得我们是生物医药健康研究院,为什么还要超级计算机。”中科院广州生物医药与健康研究院副院长潘光锦说道。

  国家超级计算广州中心已有了天河二号,为什么要需要另建一个超算中心?潘光锦认为,“天河二号”就像公交车,需要服务很多人的需求。但是生命科学领域需要自己的“小汽车”,广州健康院因此坚持建设超算中心。 

  因为超算广州分中心不属于科研项目,所以无法申请到经费。在经费紧张的情况下,广州健康院的研究员刘劲松、许永,与陈朝明采取“化缘”的方式,号召院领导及PI,“有钱出钱,有力出力,没钱没力出吆喝”。同时,三剑客花费大量时间和精力,深入多家单位进行调研、学习,对超算的发展进行详细规划。终于在中科院、广州健康院的大力支持下,采取“经费支持+服务先租后购+课题组支持”的方式,超算中心才得以建成。  

  广州健康院的研究员刘劲松、许永,与陈朝明被称为“三剑客”, 

  他们为超算中心的建设付出了大量心血 

  让科学家感到好用的超算平台 

  经过多年建设,目前该中心超算集群拥有60台普通刀片计算节点,1000个CPU计算核心,全系统内存容量6TB,存储总容量达到3PB,整体聚合计算能力理论峰值每秒100万亿次。

  超算广州分中心主任陈朝明说,从超算资源量来讲,如果把天河二号比喻为大海,那他们就是一个湖泊。

  这个湖泊虽属于超算的小规模集群,却已成为支撑生命科学和生物医药产业发展的重要平台,这源于超算广州分中心在运营上不断完善自己。

  陈朝明说,他们利用开源工具对软件进行优化、扩展和流程整合,同时根据实验设计到科研数据的具体特点,自主编写程序脚本和软件工具,使得科学数据得以进行创新性的分析利用。

  

中科院超算环境广州分中心主任陈朝明 

  目前广州超算分中心汇聚了1000多个生物多组学、及创新药物分析工具包、及30多个流程工具集。无论是寻找药物靶点、小分子化合物设计,还是蛋白结构解析,广州超算分中心足以全闭环支持生命科学的科研工作。 

  “我们正不断努力实现无基础超算即来即用的能力建设。”据陈朝明介绍,使用超算需要一定的门槛,这对于刚入学的研究者来说具有难度。他们正在构建一套软件环境,让超算的操作变得“傻瓜式”,让学科领域科学家一来就能上手。

  “生物学实验,尤其是药物研发,涉及的数据量大、算力要求高,基于AI技术构建完整的生物医药计算平台,对于健康数据管理、药物设计等科研活动具有极大的价值,高效稳定的网络和数据支撑也是重中之重。”广州健康院研究员刘劲松说。

  超算广州分中心目前计算聚合能力达100万亿次,并行高通量存储达2.5PB,提供100M专线高速科技网络带宽,主要应用在生物学、基础医学、 生物医学工程、药学等13个领域。目前用户覆盖30个科研组左右,最多时有超过100名分析人员同时在线进行计算。

  “服务器上绿灯一闪就代表着有数据传入或传出,闪得这么频繁,你就知道院各个实验室有多忙碌,你就知道为他们提供稳定高效的网络和数据是多么重要的事!” 陈朝明表示,如今很多科学家都把科研生涯维系在超算广州分中心上。中心停机一小时就意味着前期的科研投入可能失去价值,因为其他科学家会早一步发布成果。  

  中科院超算环境广州分中心在运营上不断完善自身, 

  努力让科学家觉得好用 

  超算支撑科研成果不断产出 

  以前,科学家在显微镜下做完实验,需要将数据送往第三方进行分析。有了超算广州分中心,数据与科研结合得更紧密,数据分析也可以指导实验的设计。

  而在生物医药领域,数据与计算之间的“就近原则”愈加凸显,因为该领域数据量越来越大。网络传输则存在很大的瓶颈。而超算广州分中心就在科学家身边,这意味着他们可以更多地应用数据计算平台,并不断试错,使得科研得到更多新发现。

  潘光锦对记者分享了一个小故事。此前他们已可利用人尿液中分离的脱落细胞诱导获得稳定的多能干细胞,而潘光锦团队一直希望进一步将这些多能干细胞进一步诱导出造血干细胞,用于血液病移植治疗。他们一度发现培养皿中的诱导出细胞从细胞形态上和真正的造血干细胞非常相似,但是移植到体内没有完全实现造血干细胞的功能,它们无法演化成病人需要的白细胞、红细胞、血小板,淋巴细胞等。

  “我们通过超算平台对生物信息进行分析,发现培养皿中的细胞大部分是红细胞前体细胞而不是真正的造血干细胞,才明白其中原因” 潘光锦说,他们团队之后再通过超算平台的数据分析,再次从培养皿中提取了可能是造血干细胞的成分,移植之后该细胞可以变成红细胞、白细胞、淋巴细胞等,为进一步临床应用迈出了坚实一步。“依托超算带来的新发现让我非常兴奋。”他说。

  2017年到2020年度,在超算平台支撑下,广州健康院在国际知名刊物包括nature、cell、science系列等约60篇论文,同时获得1项国家自然科学二等奖、2项广东省科学自然一等奖,3项广东省自然科学二等奖。  

 

  中科院超算环境广州分中心已经成为支撑生命科学研究的重要平台 

  截至2020年9月,超算广州分中心面向广州分院各研究所、生物岛实验室、高校及广州科学城相关企业等开通账号357个,培训应用账号90个。集群平均使用率65%。过去一年来,该平台支撑干细胞先导专项、国家重点研发计划及省市专项项目超过200项。

  超算广州分中心也正在支持人类细胞谱系大科学研究设施、广东省生物医药计算重点实验室、国家生物信息中心粤港澳大湾区节点、中国科学院生物数据大科学研究中心、生物岛实验室等国家重大科研设施平台。 

  广州健康院院长陈新文说,数据计算逐渐成为世界各国争夺的新战略资源,是“卡脖子”技术的关键一环,超算中心将以参与新一代超级计算机研制、承担人类细胞谱系大科学设施建设、粤港澳科创中心建设等重大任务为契机,充分发挥超算中心作用,为研究院提升承担大项目能力,申建重大科研基地、产出大成果提供更强力的基础支撑。

  未来,超算中心将不再满足提供单一方向的设备和技术支持,而是将联合各个子平台的特长和优势,依靠平台的自主创新,提供全面的技术解决方案,支持科学家挑战生命科学领域影响深远的课题。

  文、图:广州日报全媒体记者 龙锟 通讯员 黄博纯