高性能計(jì)算的新方向
時(shí)間:2022-04-09 06:21:01 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-09 06:21:01 來源:行業(yè)動(dòng)態(tài)
去年由日本理研所和富士通聯(lián)合開發(fā)的基于Arm架構(gòu)的超級(jí)計(jì)算機(jī) 富岳(Fugaku)連續(xù)第二次登上Top500榜首。富岳(Fugaku)是世界上第一臺(tái)Arm架構(gòu)處理器驅(qū)動(dòng)的TOP500高性能計(jì)算集群,認(rèn)證算力超過51.3億億次每秒。
這足以看出Arm在HPC領(lǐng)域的巨大潛力,而在近日Armv9的推出更是Arm處理器將不再局限于移動(dòng)/嵌入式市場,現(xiàn)已經(jīng)擴(kuò)展到PC、HPC高性能計(jì)算、深度學(xué)習(xí)等新市場。例如Armv9支持SVE2指令集,SVE最早是ARM與富士通合作的浮點(diǎn)性能擴(kuò)展,TOP500超算富岳就使用SVE指令集,SVE2就是第二代SVE浮點(diǎn)指令。
與SVE的128位矢量相比,SVE2可以支持128為倍數(shù)、最多2048位運(yùn)算。因此SVE2可以增強(qiáng)ML機(jī)器學(xué)習(xí)、DSP信號(hào)處理能力,提升未來5G、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)以及CPU本地運(yùn)行ML的性能,同時(shí)Arm未來還會(huì)繼續(xù)提升AI人工智能性能。
在本次GTC大會(huì)上,NVIDIA發(fā)布了NVIDIA Arm HPC開發(fā)者套件,為科學(xué)計(jì)算提供支持。該套件包含1個(gè)Ampere Altra CPU,它擁有80個(gè)運(yùn)行頻率高達(dá)3.3GHz 的Arm Neoverse核;雙NVIDIA A100 GPU,每個(gè)GPU可提供312 teraflops 的FP16深度學(xué)習(xí)性能;以及兩個(gè)用于加速網(wǎng)絡(luò)、存儲(chǔ)和安全的NVIDIA BlueField-2 DPU。
該開發(fā)者套件可運(yùn)行NVIDIA HPC SDK,這是一套編譯器、庫和工具,將助力工程師、科學(xué)家和開發(fā)者創(chuàng)建HPC和AI應(yīng)用,并將其遷移到GPU加速的Arm計(jì)算系統(tǒng)中。開發(fā)者和ISV合作伙伴可使用開發(fā)者套件,輕松地對其軟件進(jìn)行遷移和確認(rèn),并進(jìn)行性能分析。
該開發(fā)者套件將于2021年第三季度上市。此外,NVIDIA正在與實(shí)驗(yàn)室負(fù)責(zé)人、科學(xué)家和合作伙伴展開合作,幫助他們將軟件移植到Arm CPU和NVIDIA GPU上運(yùn)行。
在HPC和數(shù)據(jù)科學(xué)方面,NVIDIA正在與富士通和SiPearl等其他合作伙伴共同致力于擴(kuò)展Arm生態(tài)系統(tǒng)。其中,SiPearl正在設(shè)計(jì)并向市場推出歐洲的高性能、高能效處理器Rhea,它將為歐洲的exascale(百億億次級(jí))超級(jí)計(jì)算機(jī)提供支持。NVIDIA的新工具和SDK將幫助開發(fā)者為Arm構(gòu)建加速HPC應(yīng)用,為超級(jí)計(jì)算中心提供豐富的Arm生態(tài)系統(tǒng)。
總之,得到NVIDIA大量工具支持的Arm處理器IP產(chǎn)品組合等先進(jìn)技術(shù)讓各種新的平臺(tái)成為可能。用于Arm的CUDA工具包將NVIDIA GPU加速計(jì)算和AI功能引入Arm生態(tài)系統(tǒng)。通過CUDA,開發(fā)者可以訪問TensorRT進(jìn)行深度學(xué)習(xí)推理、訪問DeepStream進(jìn)行視頻分析等。