構(gòu)建數(shù)據(jù)分析閉環(huán)
時(shí)間:2022-04-01 18:54:01 | 來源:行業(yè)動(dòng)態(tài)
時(shí)間:2022-04-01 18:54:01 來源:行業(yè)動(dòng)態(tài)
數(shù)據(jù)科學(xué)人才的短缺是當(dāng)下最令企業(yè)頭疼的問題之一。由于數(shù)據(jù)科學(xué)是集統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)和商業(yè)于一體的交叉學(xué)科,因此,從事數(shù)據(jù)科學(xué)分析工作的人通常也被要求是以上這些能力的綜合體,這就為人才的獲取和培養(yǎng)筑起了一個(gè)高門檻。
根據(jù)LinkedIn公司在去年8月發(fā)布的美國勞動(dòng)力報(bào)告中提到:具有數(shù)據(jù)科學(xué)技能的人才短缺問題幾乎存在于美國的所有大城市。在全美國范圍內(nèi),共缺少151717名具有數(shù)據(jù)科學(xué)技能的人,其中紐約市(34032人)、舊金山灣區(qū)(31798人)和洛杉磯(12251人)的人才短缺尤為嚴(yán)重。而放眼全球市場,這樣的人才短缺問題則更為嚴(yán)重。
當(dāng)然,巧婦難為無米之炊,即便企業(yè)擁有最頂級(jí)的數(shù)據(jù)科學(xué)家,他們又擁有萬花筒般的數(shù)據(jù)分析方法,如果數(shù)據(jù)質(zhì)量無法保證,那么分析得到的結(jié)果一點(diǎn)用都沒有。對(duì)此,企業(yè)必須根據(jù)業(yè)務(wù)的情況弄清楚數(shù)據(jù)的實(shí)際意義是什么,梳理出可用數(shù)據(jù),剔除無用的垃圾數(shù)據(jù)和干擾的偏見數(shù)據(jù),從輸入端扼殺輸出結(jié)果出錯(cuò)的可能性。
對(duì)此,在IBM看來,企業(yè)必須從全局出發(fā)制定數(shù)據(jù)戰(zhàn)略,通過具有智能功能的分析解決方案,進(jìn)行規(guī)劃分析、描述性分析、診斷分析、預(yù)測分析和規(guī)范分析,幫助企業(yè)確定計(jì)劃是什么、發(fā)生了什么、為什么發(fā)生以及接下來將發(fā)生什么。這才是一個(gè)完整的數(shù)據(jù)分析閉環(huán)。
其中,要解決上述的數(shù)據(jù)質(zhì)量識(shí)別問題,IBM認(rèn)為首先就要利用相關(guān)的技術(shù)管理數(shù)據(jù)的盲點(diǎn),在數(shù)據(jù)梳理過程中確定是否缺少數(shù)據(jù)、是否有數(shù)據(jù)不正確、是否有任何誤導(dǎo)信息等等,唯有如此,才能為數(shù)字化轉(zhuǎn)型的高樓打好數(shù)據(jù)的地基。而在此基礎(chǔ)上,企業(yè)還必須明確數(shù)據(jù)與業(yè)務(wù)成果的相關(guān)性和因果關(guān)系,了解背后的驅(qū)動(dòng)力,進(jìn)而找出某一業(yè)務(wù)場景的關(guān)聯(lián)數(shù)據(jù),并以可視化的方式呈現(xiàn)給決策者。
另一方面,針對(duì)數(shù)據(jù)分析,IBM也認(rèn)為,企業(yè)不應(yīng)該滿足于使用基礎(chǔ)數(shù)據(jù)模型,而應(yīng)該引入機(jī)器學(xué)習(xí)和其它更高級(jí)的分析模型組合,通過跨統(tǒng)計(jì)分析進(jìn)行預(yù)測建模,才能最大程度挖掘數(shù)據(jù)價(jià)值,形成更完整的洞察,為管理者的全盤決策提供可信的參考。