xPU多樣化的硬件產品
時間:2022-04-29 16:15:02 | 來源:行業(yè)動態(tài)
時間:2022-04-29 16:15:02 來源:行業(yè)動態(tài)
其實在SC19大會之前,英特爾在舊金山舉行的2019英特爾人工智能峰會期間(Intel AI Summit 2019)上就展示了面向訓練(NNP-T1000)和面向推理(NNP-I1000)的英特爾Nervana神經網絡處理器(NNP)。作為英特爾為云端和數據中心客戶提供的首個針對復雜深度學習的專用ASIC芯片,英特爾Nervana NNP具備超高擴展性和超高效率。英特爾還發(fā)布了下一代英特爾Movidius Myriad視覺處理單元(VPU),用于邊緣媒體、計算機視覺和推理應用。
不管是Nervana NNP還是Movidius VPU,英特爾展示的這一系列新產品,旨在加速從云端到邊緣的人工智能系統開發(fā)和部署,迎接下一波人工智能浪潮的到來。如今,得益于三大趨勢的成熟數據科學的新突破、訓練數據的指數增長、計算力的不斷提升,人工智能正走向歷史轉折點,得到前所未有的大規(guī)模采用。高性能計算也正在加速這一勢頭,將AI的強大功能應用于現有的高性能計算工作流程,也擴展了人工智能算法的規(guī)模,以充分利用高性能計算系統的能力。同時,高性能計算和AI的融合,將從架構靈活性、擴展的內存存儲層級結構、軟件抽象化等方面變革IT系統范式。
英特爾的芯片產品組合由部署在各類芯片平臺上的多種架構組成。英特爾以數據為中心的產品組合提供了構建先進計算系統的根基,使得這些系統能夠傳輸、存儲和處理海量數據,更可以將高性能計算數據分析和人工智能加速整合到單一的計算環(huán)境中,并提供新的內存和存儲模式為計算引擎提供支持,進而解決高性能計算系統面臨的獨特挑戰(zhàn)。
英特爾至強可擴展處理器是英特爾以數據為中心戰(zhàn)略的基石,支持著目前全球超算500強中超過90%的超級計算機。英特爾至強可擴展處理器同時也是唯一一款內置人工智能加速的x86處理器,并針對高性能計算工作負載中大量數據集的分析進行了優(yōu)化。
顯然對于英特爾而言,面對多樣化的工作負載,一個豐富的產品組合是必不可少的,比如CPU、通用GPU、FPGA到NNP。在SC19上,英特爾展示了一款基于全新架構的全新類別的通用GPU。這款兼具高性能、高靈活性的獨立通用GPU,研發(fā)代號為Ponte Vecchio,專為高性能計算建模、模擬工作負載以及人工智能訓練而設計。
Ponte Vecchio將采用英特爾7納米工藝進行制造,并將成為英特爾首款基于全新架構的GPU,可為高性能計算和人工智能工作負載進行優(yōu)化。它采用英特爾Foveros 3D和嵌入式多芯片互連橋接(EMIB)創(chuàng)新封裝技術,以及多種其它技術,如高帶寬存儲器、CXL互連技術以及其它專利技術。
在筆者看來,GPU產品的補位讓英特爾真正具備了端到端的產品構建能力。隨著當今世界以數據為中心的工作負載日益多樣化,處理數據的架構也日益多樣化。英特爾提出了SVMS的架構,也就是覆蓋標量(Scalar)、矢量(Vector)、矩陣(Matrix)和空間(Spatial)?,F在的計算架構已經從CPU時代往XPU方向發(fā)展,也就是從原來比較流行的CPU(向量計算)向GPU(矢量計算)、AI(矩陣計算)和FPGA(空間計算)發(fā)展。GPU產品的加入讓英特爾成為提供SVMS全系產品的廠商。
之所以英特爾提出以數據為中心而不是以前的以CPU為中心,是當前產業(yè)變革的結果。單一的CPU已經無法支撐日漸多樣化的工作負載,這個時代是專業(yè)的人做專業(yè)的事,對于計算架構也是如此。如果將各種功能不斷疊加到CPU只會讓CPU變得更加龐大,以數據為中心,代表了英特爾將眾多專屬功能卸載到多樣化的產品中。
雖然我們能看到在最新一代的英特爾至強可擴展處理器中加入了全新的AVX-512以及VNNI等指令集來加速AI工作負載,但是這些更加側重AI推理方面。在AI訓練方面,GPU架構依然有著不同的優(yōu)勢。這次英特爾基于全新架構的的GPU產品顯然與新一代至強可擴展處理器是一種珠聯璧合。
日漸豐富的產品為英特爾客戶提供了更加多樣化的選擇,畢竟海量的英特爾客戶為新產品提供了很好的基礎,也易于用戶將其引入到已有的IT系統中,無縫融合已有計算架構這才是最大的想象空間。筆者此前采訪過一些AI創(chuàng)業(yè)公司或者用戶,他們之所以選擇英特爾架構,就是看中了英特爾生態(tài),不管是在成本還是豐富性方面為他們進行業(yè)務創(chuàng)新提供了更多選擇。
另外,我們注意到不管是ISC還是SC或者HPC China的榜單,其實英特爾架構與加速器的組合是常態(tài),那在英特爾推出自己的GPU產品后,其實CPU與GPU的打通更加容易,而且與英特爾傲騰技術實現無縫集成,這樣HPC的計算、存儲和網絡的瓶頸就會打破。畢竟HPC是一個系統,不存在單點瓶頸,需要整體打通。當這些都是Intel inside的產品在一起協同工作的時候,其產生的效應肯定不是簡單相加,而是一種乘數效果。