加速數(shù)據(jù)分析:科學計算賦予AI更強大的力量
時間:2022-03-29 08:36:01 | 來源:行業(yè)動態(tài)
時間:2022-03-29 08:36:01 來源:行業(yè)動態(tài)
Spark有充分的理由成為新聞媒體報導的焦點。
數(shù)據(jù)對于幫助企業(yè)機構(gòu)應對不斷變化的機遇和潛在威脅至關(guān)重要。為此,他們需要破譯隱藏在數(shù)據(jù)中的關(guān)鍵線索。
每當客戶點擊網(wǎng)站、撥打客戶服務電話或生成每日銷售報告時,就會給企業(yè)機構(gòu)貢獻大量的信息。隨著AI的興起,數(shù)據(jù)分析對于幫助公司發(fā)現(xiàn)趨勢并保持市場領先地位所起到的作用日益重要。
前不久,數(shù)據(jù)分析還依靠小型數(shù)據(jù)集來收集歷史數(shù)據(jù)和洞見,通過ETL對存儲在傳統(tǒng)數(shù)據(jù)倉庫中的高度結(jié)構(gòu)化數(shù)據(jù)進行分析。
ETL常常成為數(shù)據(jù)科學家在獲取AI預測和建議時的瓶頸。ETL預計會占用數(shù)據(jù)科學家70%至90%的時間,這會減慢工作流程并將炙手可熱的人才束縛在最普通的工作上。
當數(shù)據(jù)科學家在等待ETL時,他們無法重新訓練模型來獲取更好的商業(yè)洞見。傳統(tǒng)的CPU基礎設施無法通過有效的擴展來適應這些工作任務,這通常會大幅增加成本。
憑借GPU加速的Spark,ETL就不會再產(chǎn)生這樣的麻煩。醫(yī)療、娛樂、能源、金融、零售等行業(yè)現(xiàn)在可以經(jīng)濟、高效地為其數(shù)據(jù)分析提速,更快地獲取洞見。