讓企業(yè)機器學習易如反掌
時間:2022-04-02 04:51:01 | 來源:行業(yè)動態(tài)
時間:2022-04-02 04:51:01 來源:行業(yè)動態(tài)
IBM人工智能戰(zhàn)略的強大之處在于我們實現(xiàn)了端到端的全方位的人工智能,踐行了人工智能的基礎在于相互優(yōu)化的硬件和軟件緊密配合這一理念。當客戶使用專為人工智能設計、優(yōu)化和加速的基礎設施時,可同步了解到其性能提升的潛力,這將有助于企業(yè)更快地獲得洞察價值,從而支持更大規(guī)模的企業(yè)級人工智能項目。
在IBM Think 2018時,我們成功驗證過這套策略的強大優(yōu)勢,當展示運行在IBM Power Systems服務器上的IBM SnapML機器學習庫的性能時,結果顯示SnapML機器學習庫在以廣告為主的數(shù)據(jù)集上運行機器學習,以46倍超過谷歌云(Google Cloud)的速度創(chuàng)下了萬億級數(shù)據(jù)集的全新紀錄。
自此,IBM研究人員一直努力改進,從而使SnapML成為一個為企業(yè)所用的更優(yōu)工具。通過集成新的自動化功能,IBM使那些暫時沒有配備如忍者數(shù)據(jù)科學家(ninja data scientists)的企業(yè)用戶可以更容易地使用機器進行學習,減少機器學習流程中時間密集卻又必不可少的任務類型(例如模型選擇和超參數(shù)調(diào)整等任務)的數(shù)量。通過跨集群擴展,以及跨多核CPU和功能強大的現(xiàn)代CPU的擴展,SnapML能夠及時識別精確的模型及其超參數(shù)配置,從而幫助企業(yè)獲得潛在的競爭優(yōu)勢。
伯明翰大學研究計算基礎設施架構師Simon Thompson表示:很多用戶并沒有意識到開源機器學習目錄到底有多么龐大,以及要為特定數(shù)據(jù)或預期結果找到合適工具有多么困難。SnapML的自動化模型和數(shù)據(jù)庫選擇功能極大地縮短了破解上述難題所需的時間,從而使用戶可以更快速地開始機器學習訓練。
基于這些新工具,IBM研究院構建了一個基于SnapML的自動學習架構,并在5個數(shù)據(jù)集中運行企業(yè)應用案例,如預測旅客錯過航班的可能性,有人點擊在線廣告的可能性,求職者的最優(yōu)薪酬等應用。此外,還有一個更有趣但也更嚴格的數(shù)據(jù)集,即預測5張隨意分發(fā)的撲克牌出現(xiàn)同花順的可能性。
我們在4臺IBM Power Systems AC922服務器集群上運行這個基于SnapML的架構,每臺服務器都配備了兩個20核IBM POWER9 CPU及4個GPU。為了更直觀地進行對比,在完全相同的配置條件下部署了兩個頂級的開源自動化機器學習架構。通過內(nèi)部觀測結果發(fā)現(xiàn),在所有5個數(shù)據(jù)集上,基于SnapML的架構所達到的特定精度高達另一組競爭架構的10倍及以上水平。