以下是戴文淵主題演講全文:
時間:2022-03-19 13:45:01 | 來源:行業(yè)動態(tài)
時間:2022-03-19 13:45:01 來源:行業(yè)動態(tài)
人工智能在今天是一個特別火又特別令人困惑的話題?;鹗且驗楸桓餍懈鳂I(yè)寄予厚望,困惑是因為目前公眾在新聞媒體上看到更多的AI集中在感知層,例如人臉識別、語音識別、無人車等。但回到我們的企業(yè)經(jīng)營,似乎和無人車這樣的技術(shù)完全聯(lián)系不到一起去。享受著AI紅利的企業(yè),例如BAT,也沒有哪家是靠人臉識別在經(jīng)營的。第四范式一直致力于解決的問題,是如何把人工智能技術(shù)和各行各業(yè)企業(yè)的生產(chǎn)、經(jīng)營能夠結(jié)合起來。一個企業(yè)、一個組織,通常自上而下分為戰(zhàn)略制定者、策略制定者、策略執(zhí)行者三種角色。過去20年,互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)解決了策略執(zhí)行的環(huán)節(jié)。未來的20年,人工智能將會通過改造策略制定的環(huán)節(jié)來提升企業(yè)業(yè)務(wù)。
第四范式的企業(yè)愿景是AI For Everyone,我們希望把人工智能技術(shù)帶到每一個行業(yè),比如金融、零售、能源、安防、醫(yī)療、媒體等,幫助企業(yè)去實現(xiàn)智能化轉(zhuǎn)型?;氐狡髽I(yè)本身,無論是否使用AI技術(shù),首先我們需要關(guān)心的是企業(yè)需要提升什么業(yè)務(wù)價值。
首先,每個企業(yè)可能都會有1個或多個核心業(yè)務(wù),這些業(yè)務(wù)提升會帶動整個企業(yè)的提升。例如,最近幾年,互聯(lián)網(wǎng)應(yīng)用越來越關(guān)心的千人千面,本質(zhì)上是通過個性化服務(wù)應(yīng)用提升客戶活躍度,降低客戶流失率。客戶活躍度的提升,會帶動企業(yè)整體的提升。對于零售或制造業(yè)企業(yè),提升供應(yīng)鏈效率,降低成本,也會帶動企業(yè)核心競爭力的提升。面對這些核心應(yīng)用場景,我們需要AI做到極致的效果,因為每提升一個百分點的效果,對企業(yè)都至關(guān)重要。
其次,很多企業(yè)也往往面臨場景應(yīng)用極其分散的情況。例如,大型金融企業(yè),他們的業(yè)務(wù)往往較為分散。這種情況下,AI的規(guī)?;涞?,往往比單場景的極致效果對企業(yè)更為重要。假設(shè)一個企業(yè)有一千個場景,其中一個場景提升10倍,對整個企業(yè)來說,只有百分之一的提升。而如果我們能高效地完成一千個場景的全面覆蓋,即使每個場景只提升1倍,那也百分之百的提升。所以,面對場景眾多的企業(yè),AI的規(guī)?;涞啬芰κ瞧髽I(yè)智能化轉(zhuǎn)型的關(guān)鍵。
我們習(xí)慣把企業(yè)的核心場景稱之為1,把眾多場景稱之為N。通常企業(yè)的智能化轉(zhuǎn)型需要一個1+N應(yīng)用模式。這里需要指出的是,1不一定只有一個應(yīng)用,有些企業(yè)可能會有若干個1這樣的核心應(yīng)用,但一定不會很多。
企業(yè)的業(yè)務(wù)一定是和企業(yè)的發(fā)展目標(biāo)相關(guān)的。例如,我們服務(wù)某知名國際零售集團,根據(jù)企業(yè)的發(fā)展目標(biāo),將其業(yè)務(wù)分為開源和節(jié)流兩大類。開源的目標(biāo)主要和客戶相關(guān),包括提升客戶留存率、單客戶價值、平均客戶留存時間等。手段上來說,可能有千人千面的推薦、coupon的營銷等。AI在里面可以通過優(yōu)化推薦、營銷等環(huán)節(jié),提升留存率、單客戶價值等核心指標(biāo)。節(jié)流的目標(biāo)主要是降低中后臺運營的成本和提升運營效率。通過提升供應(yīng)鏈等環(huán)節(jié)的效率,降低成本,提升企業(yè)的競爭力。這其中,個性化服務(wù)、供應(yīng)鏈?zhǔn)呛诵膽?yīng)用,是1,1個百分點的提升就足以改變企業(yè)的競爭格局。而眾多細分場景,如各種單據(jù)的OCR、各種場景的語音識別、智能客服、流程機器人等,是N,規(guī)?;穆涞乜梢蕴嵘髽I(yè)的整體效率。
1一定要做到極致的效果,這類標(biāo)桿型應(yīng)用對于AI系統(tǒng)的要求較高。一是高維,也就是精細,越高維度的AI,其效果上能做到越精細。過去的專家模型,往往維度(規(guī)則數(shù)量)在幾個到幾千個不等。傳統(tǒng)意義上的高維模型,往往局限在萬級別的維度以下。第四范式開發(fā)的高維機器學(xué)習(xí)引擎,最高可支持到萬億(10^12)維度,通過極致的機器算力,實現(xiàn)遠超傳統(tǒng)幾個數(shù)量級的精準(zhǔn)性。二是實時,隨著服務(wù)線上化以及對極致體驗的要求,對業(yè)務(wù)的實時響應(yīng)要求越來越高。尤其面對高維,我們發(fā)現(xiàn)往往過去能做到實時的系統(tǒng),做不到高維;能做到高維的系統(tǒng),做不到實時。為此,第四范式自主研發(fā)了RTiDB系統(tǒng),實現(xiàn)萬億維度模型毫秒級響應(yīng)的精準(zhǔn)決策。三是閉環(huán)(自學(xué)習(xí)能力),任何系統(tǒng)都不可能完美,都可能會犯錯。我們更怕的不是AI犯錯誤,而是AI持續(xù)不斷地犯同樣的錯誤。因此,持續(xù)利用業(yè)務(wù)應(yīng)用過程中的反饋數(shù)據(jù)進行系統(tǒng)自我更新與優(yōu)化的能力,是未來AI系統(tǒng)極其重要的核心能力。我們也經(jīng)常發(fā)現(xiàn),AI系統(tǒng)的最大提升,很多時候并不來自于系統(tǒng)上線的那一刻,而是來自于上線以后經(jīng)年累月的自我迭代提升。
N追求的是規(guī)模化落地,現(xiàn)在我們服務(wù)的很多企業(yè)都面臨著全面AI改造,在面對1千個甚至1萬個場景時,如果每個都做到極致,代價和效率是不夠的。實現(xiàn)規(guī)模化落地和極致效果的路徑不完全一樣。首先需要建立一個統(tǒng)一的方法論,讓更多人用統(tǒng)一方法規(guī)模化生產(chǎn)AI。第四范式建立了一個以庫伯學(xué)習(xí)圈理論為基礎(chǔ)的AI方法論,并基于此構(gòu)建了先知平臺,將AI開發(fā)分成行為數(shù)據(jù)采集、反饋數(shù)據(jù)采集、模型訓(xùn)練、模型應(yīng)用四個標(biāo)準(zhǔn)步驟,我們幫助客戶和合作伙伴的開發(fā)者在先知上按照這樣的一二三四去產(chǎn)生AI。以我們服務(wù)的某大型央企為例,其開發(fā)者數(shù)量眾多,AI開發(fā)者卻非常有限,我們?yōu)槠涮峁┝私y(tǒng)一的方法論和平臺,讓開發(fā)者針對業(yè)務(wù)目標(biāo),在上面開發(fā)各種各樣的AI應(yīng)用。
其次,AI規(guī)模化應(yīng)用過程中要有完善的數(shù)據(jù)治理能力,尤其是對于大中型的企業(yè),數(shù)據(jù)治理非常重要??赡芪覀冞^去已經(jīng)做了大數(shù)據(jù)系統(tǒng),但往往是面向BI建設(shè)的,BI大數(shù)據(jù)主要是幫助人去總結(jié)一些經(jīng)驗,因此更強調(diào)查詢、統(tǒng)計、可視化等功能。AI大數(shù)據(jù)是給機器看的數(shù)據(jù),需要的是完整、實時和支持機器自學(xué)習(xí)的閉環(huán)。兩個大數(shù)據(jù)系統(tǒng)的設(shè)計理念天然不同,我們經(jīng)常會看到企業(yè)由于過去建設(shè)了面向BI的大數(shù)據(jù)系統(tǒng),又將AI建設(shè)在這個系統(tǒng)之上,非但沒有幫到AI,反倒成為AI落地的障礙。因此,大規(guī)模AI實踐過程中企業(yè)需要一套面向AI的數(shù)據(jù)治理系統(tǒng),能夠存取PB級甚至更大量的日志、支持實時存儲、形成一個線上數(shù)據(jù)采集和處理的閉環(huán)等。
最后是AI算力,以往大家關(guān)注的焦點主要集中在兩個方面:一是通過購買大量的服務(wù)器和GPU來提升算力;二是通過芯片實現(xiàn)AI的加速。但是算力是一個完整的體系架構(gòu),甚至不僅僅包括硬件,而是軟件和硬件的結(jié)合體,只有了解AI算法的運算架構(gòu)與邏輯,才能針對硬件去做深層次的優(yōu)化。AI系統(tǒng)其實是有套路的設(shè)計,具備固定的計算模式,它需要的是一個專用計算,不像大數(shù)據(jù)和軟件需要的是通用計算?;趯S糜嬎愕奶攸c,算法和軟件其實可以直接定義好計算,提前把計算的部分去硬件化。此外,過去傳統(tǒng)的通用通信協(xié)議、存儲系統(tǒng)也同樣面臨著無法支撐AI的困境,需要針對于AI算法的特性進行深度優(yōu)化。以TCP的通信協(xié)議為例,該協(xié)議通過三次握手建立可靠的數(shù)據(jù)交換機制,保證數(shù)據(jù)傳輸不丟失。但AI只需要在傳輸過程中,保證數(shù)據(jù)的統(tǒng)計特性即可,傳輸100份數(shù)據(jù)與傳輸90份數(shù)據(jù)的統(tǒng)計結(jié)果差異微乎其微。
第四范式從去年開始研究開發(fā)新的硬件體系SageOne,我們不是為了去生產(chǎn)硬件,而是為了設(shè)計軟硬一體的方案,產(chǎn)出更適合人工智能專用算法的算力架構(gòu)。目前第四范式設(shè)計的軟硬一體優(yōu)化的服務(wù)器能夠做到TCO(總擁有成本)比傳統(tǒng)服務(wù)器降低一倍,到年底的時候希望有數(shù)量級的提升,會大幅降低企業(yè)AI落地門檻及總擁有成本。6月20日,我們將發(fā)布我們的全新產(chǎn)品矩陣,其中就包括第一次亮相的全新軟硬一體產(chǎn)品,進一步助力企業(yè)實現(xiàn)1+N全方位AI轉(zhuǎn)型。