NVIDIA GPU為Apache Spark 3.0提速
時間:2022-03-29 08:18:01 | 來源:行業(yè)動態(tài)
時間:2022-03-29 08:18:01 來源:行業(yè)動態(tài)
Apache Spark作為全球最流行的數(shù)據(jù)分析應(yīng)用,現(xiàn)已通過此前發(fā)布的Spark 3.0版本為超過50萬用戶提供革命性的GPU加速。
Databricks為用戶提供了先進(jìn)的企業(yè)云平臺Spark,每天有超過100萬臺虛擬機運行該平臺。在6月25日的Spark+AI Summit峰會上,Databricks宣布其用于機器學(xué)習(xí)的Databricks Runtime 7.0將配備內(nèi)置Spark 3.0的GPU加速器感知調(diào)度功能。該功能由Databricks與NVIDIA和其他社區(qū)成員合作開發(fā)。
Google Cloud近期宣布在Dataproc image 2.0版本上提供Spark 3.0預(yù)覽版,同時指出在開源社區(qū)的協(xié)作下,現(xiàn)在已獲得強大的NVIDIA GPU加速。NVIDIA將于7月16日與Google Cloud共同舉辦一場網(wǎng)絡(luò)研討會,深入探討這些令數(shù)據(jù)科學(xué)家感到興奮的新功能。
此外,用于Apache Spark的新開源RAPIDS 加速器現(xiàn)在可以加速ETL(提取、轉(zhuǎn)換、加載)和數(shù)據(jù)傳輸,在無需更改任何代碼的情況下提高端到端分析性能。
Spark性能的加速不僅意味著能夠更快獲得洞見,而且由于企業(yè)可以使用更少的基礎(chǔ)設(shè)施來完成工作負(fù)載,因此還可以幫助企業(yè)降低成本。