中国教育在线
中国教育在线
AMD EPYC以超多核心超强“算力”助推基因研究
2020-03-13 16:08:00
中国教育和科研计算机网
作者:

  一场突如其来的新型冠状病毒(COVID-19),牵动着全世界的神经,抗击疫情成为社会各界广泛关注的焦点。实际上,除了一直以来奋战在一线的医务人员,先进的“科技力量”也是这场“战疫”中的另外一条关键战线。在针对新型冠状病毒的研究工作中,科研人员首先需要解析病毒全基因组序列,从而根据序列来研发相应诊断试剂盒,并进行病毒同源性分析找到病毒的来源,同时根据病毒的信息和特点决定接下来的防控和治疗方式。

  在如何获取更完整详尽的病毒基因组序列方面,目前广泛应用高通量测序技术来完成,但由于病毒体的基因测序会产生TB级甚至PB级的海量数据,使用这种技术产生的DNA序列数据量十分庞大,需要强大的计算能力来支持。为此,高性能计算(HPC)在有效管理、分析和利用这些序列数据方面发挥了重要作用。作为国际知名的基因科研组织之一,俄勒冈州立大学基因组研究和生物计算中心(CGRB)在利用基于AMD EPYC(霄龙)处理器的高性能计算设备开展基因测序方面进行了积极探索,无疑很值得借鉴。

  多线程带来高效率,让科研更进一步

  俄勒冈州立大学基因组研究和生物计算中心(CGRB)为大学的26 个科系提供服务,从而促进基因组和数据驱动研究。研究人员可以使用该中心开发的 4000 至 5000 个程序,这些程序运行在分布式服务架构上,并且该架构拥有5000多个处理器、5PB可用存储以及安全的专用 1G/10G/40G 网络。 CGRB 每天生成 4TB 到 8TB 的海量数据,同时每时每刻都有成千上万个作业在运行。因此,如何进一步提升高性能计算水平,增加运行的作业数,帮助该大学以最佳的成本效益进行科学研究,是该中心目前亟需解决的问题。

  CGRB 生物计算助理主任 Chris Sullivan表示: “我们每天处理约 20,000 个作业,并且大部分作业与基因组比对有关。可能同时有一百个作业在运行,每个作业包含必须与基因组比对的5000万个序列,并且每个都使用不同的算法。而处理如此庞大的数据需要具有非常多的处理器核心和线程的高性能服务器才能做到。”

  经过一系列的评估和对比,AMD EPYC处理器成为了俄勒冈州立大学的选择。“我们在研究上取得的成果要依赖于线程数。我们需要解答科学问题, 但处理器频率并不会改变科学答案,所以我们不会为更高的处理器频率而多花钱。 但是,我们拥有的线程数越多,完成的作业就越多,这意味着我们可以离答案更近一步。因此,我们一直在寻求获得非常高的线程数,希望能达到 100 个以上,同时要拥有高性价比。”Sullivan表示, “就我们所谈论的线程和作业数量而言,只有AMD EPYC真正达到这个要求,可以提供128个线程。”

  事实上,通过增加多台基于AMD EPYC的高性能计算设备,CGRB能以较低的总运营成本获得更多的线程,从而完成更多的作业数量,提升投资回报率。

  降本增效省空间,让科研更容易

  AMD EPYC所拥有的核心密度和线程数在其他方面同样发挥重要作用。“我无法扩建我的服务器机房,这需要花费成百上千万美元,然而EPYC处理器为我提供了新的选择。”Sullivan表示,“EPYC处理器的双路配置带来的回报非常显著。我们插上电源,获得所需的线程,以足够快的速度完成作业,并且不用对服务器机房做任何改建。”

  除此之外,俄勒冈州立大学的研究组还降低了 CGRB 管理费用,同时使可以执行的作业数量增加了一倍。Sullivan解释道:“由于配备了AMD EPYC,我们不再使用 InfiniBand。它们可以在本机运行,比使用 InfiniBand 更快。”借助AMD EPYC,该中心不仅减少了管理开销,而且降低了成本,同时将笨拙的大型机器更换为更具成本效益的设备且不影响性能,获得了研究人员的一致好评。

  CGCB寻找的新技术要求能够为研究人员更快获得运算结果。“这项技术令研究人员折服,他们是购买的决策者。AMD EPYC 正是他们想要的,因为无论价格还是线程数量都极具优势。因此,我们在拨款申请方面也变得非常容易。”Sullivan提到。

  科研永无止境,算力永不止步

  Sullivan表示,对于俄勒冈州立大学的各种科研项目来说,现有的计算能力还远远不足,科学的发展正在逐渐超越设备的能力。面对不断攀升的计算需求,CGRB将继续携手AMD来部署新一代高性能计算,获得更加前沿、强劲的“算力”体验。

  “我们的研究组正准备撤换现有的48线程、24核心处理器,替换为更多核心和线程的 AMD EPYC处理器。”Sullivan 表示,“AMD 将会成为推动该中心不断发展的科学事业的重要力量。AMD 一直在帮助我们,我们期待部署更多的 AMD EPYC,因为更多线程意味着更出色的成本效益。”

  毫无疑问,无论是在当前新冠疫情背景下的应用,还是疫情结束之后的科学研究和检测,强大的算力支持都是不可或缺的。在这场收集、研究和分析与医疗信息化环境相关的关键生物医学研究数据的竞赛中,AMD EPYC凭借超强的性能和易用性,加上其领先的总体拥有成本(TCO)优势,为企业和研究机构的分析和不断创新提供了一条捷径。

  关于俄勒冈州立大学基因组研究和生物计算中心(CGRB)

  基因组研究和生物计算中心(CGRB)致力于让俄勒冈州立大学以及整个州在生命和环境科学领域促进基因组和数据驱动的研究。 该中心通过专家、核心实验室、计算设施、技术研讨会以及各类会议,为教职员工和学生带来先进理念、培训和服务。 同时以该中心为平台,促进研究人员建立联系、发起合作以及在研究中应用新技术。 如需更多信息,请访问 cgrb.oregonstate.edu

免责声明:

① 凡本站注明“稿件来源:中国教育在线”的所有文字、图片和音视频稿件,版权均属本网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本站协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国教育在线”,违者本站将依法追究责任。

② 本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。