日前,采用刀片架構(gòu)的浪潮天梭10000在北京生命科學(xué)研究所上線運行,這套高性能計算系統(tǒng)峰值計算能力超過14萬億次,成為我國生命科研領(lǐng)域浮點計算能力的新高峰,相比原有系統(tǒng),作業(yè)運行時間減少了50%以上,有效提高了該所的科研效率。

  性能與需求的“超車”比賽

  生命科學(xué)作為一門在農(nóng)業(yè)、醫(yī)藥、環(huán)保等領(lǐng)域有著廣泛應(yīng)用的實驗科學(xué),對高性能計算有著高度依賴。無論是蛋白質(zhì)模擬還是海量基因數(shù)據(jù)的收集、篩選與排序,都離不開具有強大運算能力的高性能計算平臺。而在我國生命科學(xué)飛速發(fā)展的背景下,高性能計算在生命科研領(lǐng)域的應(yīng)用也正在邁上新的水平。

  組建于2003年的北京生命科學(xué)研究所,是我國政府在新世紀(jì)推動生命科學(xué)技術(shù)快速發(fā)展的重要戰(zhàn)略布局之一。與國內(nèi)傳統(tǒng)科研院所不同,北京生科所采用與國際接軌的管理和運行機制,以全球一流的科研人員為班底,進行原創(chuàng)性的生命科學(xué)的基礎(chǔ)研究和人才培養(yǎng)。目前,該所已經(jīng)成立了包括10位諾貝爾獎獲得者在內(nèi)的24位國內(nèi)外知名專家組成的科學(xué)指導(dǎo)委員會,在《細(xì)胞》、《科學(xué)》、《自然》等國際一流學(xué)術(shù)刊物上發(fā)表高水平論文數(shù)十篇。其雄厚的科研實力在國際生命科學(xué)界占有一席之地。

  與其在體制探索和業(yè)務(wù)創(chuàng)新上的“大跨步”一脈相承,北京生科所在構(gòu)建硬件計算平臺方面也走在了業(yè)界的前列。2008年初,北京生科所引入了被稱為“中國45nm四核第一單”的浪潮天梭TS10000高性能計算集群。這套包含102個計算節(jié)點的高性能計算系統(tǒng)采用了當(dāng)時最先進的Intel 45nm四核處理器,浮點運算能力達到6.5萬億次,將蛋白質(zhì)模擬等作業(yè)的運行效率提升了幾十倍,以前需要幾天時間的任務(wù),該系統(tǒng)幾小時就能完成。

  對于一年前引進的這套計算系統(tǒng),科研所的相關(guān)負(fù)責(zé)人給予了高度評價,平臺運行一年來一直運行穩(wěn)定,從未出現(xiàn)任何技術(shù)故障,同時浪潮還提供了免費的技術(shù)咨詢和機房遷移服務(wù),這些對于該所科研效率的提升起到很大的作用。但由于業(yè)務(wù)量的不斷加大,平臺的運算能力逐漸接近了瓶頸。據(jù)該負(fù)責(zé)人介紹,系統(tǒng)建成以來,這套天梭高性能系統(tǒng)一直處于飽和狀態(tài),經(jīng)常同時運行100-200個作業(yè),300-400個作業(yè)在排隊,科研所決定在該系統(tǒng)的基礎(chǔ)上進行擴容。

  優(yōu)中選優(yōu) 用性能說話

  在系統(tǒng)招標(biāo)初期,該所要求各投標(biāo)廠商先期提供設(shè)備進行測試,目前實驗室的主要應(yīng)用有用于分子對接的DOCK軟件,以及蛋白質(zhì)分子模擬軟件CHARMM等。其中CHARMM是一個被廣泛承認(rèn)并應(yīng)用的分子動力學(xué)模擬程序,主要用于生物大分子的模擬,包括能量最小化,分子動力學(xué)和蒙特卡羅模擬等,測試方案是用生命所最常用的軟件Charmm對各家機器進行Benchmark測試,并根據(jù)實際運行時間和IO能力進行綜合打分,以作為評標(biāo)參考。

  北京生命科學(xué)研究所作為浪潮的老客戶,浪潮對其應(yīng)用非常熟悉,技術(shù)團隊從方案和部件本身都做了精心的準(zhǔn)備。大規(guī)模的集群系統(tǒng),功耗和密度是每一位用戶面臨的巨大問題,方案首先選擇了高密度、低功耗的NX7100DB刀片服務(wù)器作為節(jié)點,在7U空間內(nèi)集成10個刀片,支持冗余千兆以太網(wǎng)和infiniband交換技術(shù),性能強勁;同時,浪潮技術(shù)團隊從硬盤I/O、硬件系統(tǒng)、軟件環(huán)境等多個層次進行了數(shù)十次測試優(yōu)化工作,其中針對硬盤的優(yōu)化和測試,就高達20次,對操作系統(tǒng)的驗證,達到近20個不同版本,最終采用了Redhat Linux AS5.0操作系統(tǒng),并對其參數(shù)進行了大量優(yōu)化工作,方案搭建完成后,浪潮方案開發(fā)實驗室采用支持OpenMP的Intel編譯器,高性能數(shù)學(xué)庫,VTune等性能調(diào)優(yōu)工具圍繞CHARMM等客戶應(yīng)用軟件做了進一步的優(yōu)化工作,將系統(tǒng)性能值進一步提高了30%以上。

  結(jié)果在由生科所主持的CHARMM以及系統(tǒng)I/O性能測試中,浪潮在4家廠商送測的5款產(chǎn)品中以絕對優(yōu)勢勝出,在同處理器配置下兩項成績高出平均水平20%以上,實測系統(tǒng)I/O速度高達87.5MB/S,浪潮天梭高性能解決方案一舉勝出。

  高密度 高性能 生命探索新引擎

  基于NX7100DB刀片服務(wù)器的浪潮天梭TS10000高性能計算系統(tǒng)具有高密度、易維護、易擴展等特點。該集群在有限的空間內(nèi)部署了100個計算節(jié)點,能夠提供多達800顆計算核心,峰值計算能力達到7.5萬億次,計入已有的102節(jié)點,峰值能力達到14萬億次,成為生命科學(xué)領(lǐng)域的第一個浮點高峰。100個刀片節(jié)點,僅占用10個機箱空間,實際部署不到3個機架。隨機配送的浪潮天梭監(jiān)控管理軟件針對服務(wù)器節(jié)點的運行狀態(tài),實現(xiàn)實時監(jiān)控和管理,發(fā)現(xiàn)故障時在控制臺端向管理員報警,為系統(tǒng)管理員提供了一個統(tǒng)一、集中、可視化、跨平臺的遠程管理環(huán)境。

  生命科學(xué)研究所的相關(guān)負(fù)責(zé)人表示,他們的研究方向涉及生命科學(xué)、計算化學(xué)等多個領(lǐng)域,對高性能設(shè)備具有很強的依賴性,科研進度受平臺性能影響很大,浪潮天梭的上線使得計算效率提升了一倍有余,這對他們搶占生命科學(xué)前沿領(lǐng)域具有重要意義。

責(zé)任編輯:admin