AI訓(xùn)練處理器「Gaudi」:實(shí)現(xiàn)本地以太網(wǎng)擴(kuò)展
時(shí)間:2022-04-13 23:24:01 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-13 23:24:01 來源:行業(yè)動(dòng)態(tài)
再來看一下最新發(fā)布的人工智能訓(xùn)練處理器Gaudi。
Gaudi是一款完全可編程且可定制的處理器,搭載基于第二代Tensor處理核 (TPC) 并集成開發(fā)工具、庫和編譯器?;赗esNet-50,Gaudi可以提供每秒1650張的圖片處理能力這是在業(yè)界單一處理器中最高的計(jì)算能力。同時(shí),Gaudi的創(chuàng)新架構(gòu)可以實(shí)現(xiàn)訓(xùn)練系統(tǒng)性能的近線性擴(kuò)展,即使是在較小Batch Size的情況下,也能保持高計(jì)算力。這意味著,基于Gaudi處理器的訓(xùn)練性能可以實(shí)現(xiàn)從單一設(shè)備擴(kuò)展至由數(shù)百個(gè)處理器搭建的大型系統(tǒng)的線性擴(kuò)展。
還是和英偉達(dá)的V100相比,基于ResNet-50基準(zhǔn)測(cè)試,Gaudi所表現(xiàn)出來的計(jì)算性能、功耗比和延遲時(shí)間仍然相當(dāng)出色,在速度上要比V100快3.8倍。比如,在性能方面,V100單卡大概每秒處理600多張圖片,而Gaudi單卡則可以處理1600多張;在功耗方面,V100處理600多張圖片的功耗達(dá)到了300瓦,而Gaudi處理1600多張圖片的功耗只有150瓦左右。在這方面,Gaudi創(chuàng)造了新的性能紀(jì)錄。
關(guān)鍵詞:擴(kuò)展,本地,實(shí)現(xiàn)