NVIDIA Selene
時(shí)間:2022-04-29 20:42:01 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-29 20:42:01 來源:行業(yè)動(dòng)態(tài)
雖然HPC和AI的價(jià)值日漸凸顯,但是眾所周知,HPC是耗電大戶,如何優(yōu)化能耗成為突出的問題,NVIDIA GPU在能耗控制方面做了很多工作。與不使用NVIDIA GPU的系統(tǒng)相比,其能效(以gigaflops/watt為單位)平均高出2.8倍。這也是為何排在TOP500榜單前25的超級(jí)計(jì)算機(jī)中有20臺(tái)系統(tǒng)都選擇采用NVIDIA GPU的原因之一。
在今年的TOP500榜單中,我們看到一個(gè)新面孔Selene,這是NVIDIA內(nèi)部研究集群的新成員。該系統(tǒng)在Linpack基準(zhǔn)測(cè)試中以27.5petaflops的性能表現(xiàn),在最新Green500榜單中排名第二,在整個(gè)TOP500榜單中排名第七。
Selene的功耗為20.5gigaflops/watt,與Green500榜單上的第一名相差甚微,但排名第一的系統(tǒng)體積更小,其性能表現(xiàn)僅排在第394位。Selene是排名前100系統(tǒng)中唯一突破20gigaflops/watt能效表現(xiàn)大關(guān)的系統(tǒng),同時(shí)也是全球性能排名第二的工業(yè)超級(jí)計(jì)算機(jī)。
在能效方面,相比于未使用NVIDIA GPU的其它TOP500系統(tǒng)的平均能效表現(xiàn),Selene的能效高出了6.8倍。除了出色的能效表現(xiàn),Selene的快速部署能力也是令人刮目相看。工程師們可以使用NVIDIA的模塊化參照架構(gòu),在不到四周的時(shí)間內(nèi)就能快速構(gòu)建Selene。4名操作人員僅需不到1個(gè)小時(shí),就能組裝起一套由20臺(tái)系統(tǒng)組成的DGX A100集群,創(chuàng)建出一套性能可以達(dá)到2petaflops的系統(tǒng)。
通過添加NVIDIA Mellanox InfiniBand交換機(jī)層,工程師將14套分別配置有20臺(tái)DGX A100系統(tǒng)的模塊組的相連接,從而創(chuàng)造出了Selene。Selene系統(tǒng)具有:280臺(tái)DGX A100系統(tǒng);2240顆NVIDIA A100 GPU;494臺(tái)NVIDIA Mellanox Quantum 200G InfiniBand交換機(jī);56TB/s的網(wǎng)絡(luò)架構(gòu);7PB的高性能全閃存。
Selene可以提供超過1exaflops的AI性能。此外,在TPCx-BB關(guān)鍵數(shù)據(jù)分析基準(zhǔn)測(cè)試中,其僅使用了16臺(tái)DGX A100系統(tǒng)就創(chuàng)造了新紀(jì)錄,其性能表現(xiàn)高出其他系統(tǒng)20倍。Selene之所以有如此上佳表現(xiàn),這得益于其架構(gòu)設(shè)計(jì)和打造的NVIDIA DGX A100系統(tǒng)。
NVIDIA Selene的參考架構(gòu)其實(shí)是NVIDIA的DGX SuperPOD,其基于NVIDIA DGX A100系統(tǒng)。NVIDIA DGX A100在一臺(tái)6U服務(wù)器中集成了8顆A100 GPU以及NVIDIA Mellanox HDR InfiniBand網(wǎng)絡(luò)技術(shù),可以為高性能計(jì)算、數(shù)據(jù)分析和AI工作(包括訓(xùn)練和推理)等多種組合提供加速,并實(shí)現(xiàn)快速部署。