第四范式多維度創(chuàng)新與賦能
時間:2022-03-18 13:06:02 | 來源:行業(yè)動態(tài)
時間:2022-03-18 13:06:02 來源:行業(yè)動態(tài)
眾所周知,AI包含三大要素算力、算法和數(shù)據(jù)。針對企業(yè)智能化轉(zhuǎn)型的1+N的業(yè)務特點,第四范式從多個維度幫助企業(yè)實現(xiàn)AI轉(zhuǎn)型。第四范式聯(lián)合創(chuàng)始人、首席架構師胡時偉介紹說,針對1的高維和實時要求,第四范式開發(fā)了高維機器學習引擎,最高可支持到萬億維度,通過極致的機器算力,實現(xiàn)遠超傳統(tǒng)幾個數(shù)量級的精準性。在金融、互聯(lián)網(wǎng)和醫(yī)療行業(yè)AI應用中,高維為行業(yè)的核心業(yè)務效果提升50W4%。
二是實時,隨著服務線上化以及對極致體驗的要求,對業(yè)務的實時響應要求越來越高。而第四范式自主研發(fā)的RTiDB系統(tǒng)可以實現(xiàn)萬億維度模型毫秒級響應的精準決策。在企業(yè)核心場景的海量實時業(yè)務決策中,15個SageOne推理引擎節(jié)點都夠支撐20億維特征模型實時2萬次并發(fā)請求,其中99.9%請求在100ms內(nèi)響應,大幅提升實時決策在核心業(yè)務場景中的關鍵價值。
面對N的規(guī)?;涞貑栴},第四范式建立了一個以 庫伯學習圈理論為基礎的AI方法論,并基于此構建了先知平臺,將AI開發(fā)過程分成 行為數(shù)據(jù)采集、反饋數(shù)據(jù)采集、模型訓練、模型應用四個標準步驟,幫助客戶和合作伙伴的開發(fā)者在先知平臺上按照這樣的一二三四去產(chǎn)生AI。同時,面向AI的數(shù)據(jù)治理是企業(yè)AI規(guī)?;涞氐幕A,第四范式能夠為企業(yè)建立一套完整的AI的數(shù)據(jù)治理系統(tǒng),解決企業(yè)數(shù)據(jù)采集訪問雙實時、全量原始數(shù)據(jù) 、線上線下一致性及利用回流數(shù)據(jù)自動標注等AI數(shù)據(jù)治理能力難題,突破制約AI規(guī)模化落地的數(shù)據(jù)瓶頸。
在硬件層面,第四范式推出了企業(yè)級AI軟硬一體集成系統(tǒng)SageOne,通過軟件定義計算軟硬一體技術構建了閉環(huán)企業(yè)AI系統(tǒng),貫通硬件基礎設施、AI核心引擎、AI平臺和AI業(yè)務應用的全價值鏈條。SageOne包括SageOne Advanced、SageOne Standard和SageOne WorkStation三大系列共7款產(chǎn)品,覆蓋大中小企業(yè)中開發(fā)、投產(chǎn)和驗證等全部場景應用。
需要指出的是,SageOne采用了第四范自主研發(fā)的硬件加速卡4Paradigm ATX800,采用20nm制程,算力達到1.5TFLOPS,內(nèi)置FlashGBM加速系統(tǒng),充分用內(nèi)存和高速緩存帶寬,支持自動優(yōu)化訓練超參數(shù)、高位特征計算過程I/O加速和高維GBDT訓練加速等功能,在企業(yè)應用場景中表現(xiàn)出多達10倍的訓練性能。此外,第四范式和英特爾聯(lián)合實驗室一直探索最佳優(yōu)化技術,并針對最新Cascade Lake-AP處理器的全新AVX512指令集、多核心及主頻利用率和CLX AP微架構IO總線的利用率進行全面優(yōu)化。
胡時偉表示,無論是第四范式自己還是和合作伙伴一起一定把AI算力越做越深,沿著這條路將來是在整個系統(tǒng)級別更深入、更多的優(yōu)化和定制。解決企業(yè)AI應用算力負載問題,只有通過AI算法對整個AI算力平臺系統(tǒng)的重新定義,才能幫助企業(yè)支撐AI1+N應用場景的需求。
所有,除了硬件產(chǎn)品,第四范式在算法層面也進行了積極創(chuàng)新。第四范式聯(lián)合創(chuàng)始人、首席科學家陳雨強介紹說,2015年,第四范式戰(zhàn)略性投入和研究AutoML技術。如今第四范式在AutoML技術研發(fā)和產(chǎn)品落地領域已經(jīng)走在世界前列。全新特性的AutoML 2.0技術不僅是世界首個交互式AutoML技術,同時具備自動跨表特征增強能力。在世界知名的Kaggle機器學習競賽中,第四范式AutoML 2.0與數(shù)據(jù)科學家共同挑戰(zhàn)多項競賽,競賽結果數(shù)據(jù)顯示全世界平均每7-10位數(shù)據(jù)科學競賽選手,只有1位能擊敗第四范式AutoML 2.0;而在結構化機器學習問題上第四范式AutoML 2.0比Google Cloud AutoML排名靠前61.2%,在圖像分類問題上比它排名靠前64.2%。
基于目前企業(yè)AI應用的痛點問題,第四范式未來還將引入隱私保護遷移學習(AutoPTL)、自動半監(jiān)督機器學習(AutoSSL)、自動正樣本和無標簽樣本學習(AutoPU)、自動知識圖譜嵌入(AutoKGE) 等眾多Auto黑科技到產(chǎn)品體系中,提高企業(yè)AI應用率和價值。這些技術來源于我們的現(xiàn)實經(jīng)驗積累,能夠保證我們可以源源不斷地產(chǎn)生新技術,并且通過服務化來讓行業(yè)用到這些前沿技術。陳雨強說。
在產(chǎn)品和技術的創(chuàng)新讓第四范式能夠賦能產(chǎn)業(yè)變革,而通過生態(tài)建設,則可以加速這種進程。第四范式商務副總裁梁軍表示,1+N模式帶來了非常廣闊的藍海場景,這有賴于合作伙伴和客戶大力的支持。第四范式通過平臺產(chǎn)品賦能行業(yè)客戶,落地AI應用,這中間需要廣大合作伙伴的通力合作。第四范式宣布開啟啟航合作伙伴計劃,著力打造基于先知平臺的生態(tài)體系建設。第四范式面向合作伙伴和開發(fā)者的開放,將越來越全面和深入,讓越來越多的行業(yè)和企業(yè)能夠低門檻地獲取AI能力。
基于先知平臺,第四范式建立起產(chǎn)品賦能、咨詢賦能、交付賦能、營銷賦能、技術賦能五大賦能中心,正與廣大解決方案商、咨詢服務商、實施服務商、渠道分銷商及開發(fā)者開展生態(tài)合作,形成一個強強聯(lián)合、互補共贏的AI合作伙伴生態(tài),共同啟航AI藍海。