電商平臺數(shù)據(jù)分析——基于淘寶用戶行為數(shù)據(jù)
時間:2023-03-15 23:54:01 | 來源:電子商務
時間:2023-03-15 23:54:01 來源:電子商務
一、分析背景在網(wǎng)絡購物過程中,用戶會產(chǎn)生瀏覽、收藏、加入購物車、購買這4種行為。它們之間沒有明顯的順序,大部分用戶只產(chǎn)生“瀏覽”行為,部分用戶可能是通過推薦直達購物車、收藏頁面,也有部分剛需用戶會直接進入購買頁面,從而跳過“瀏覽”這一步。多數(shù)情況下,用戶的購物行為都是從“瀏覽”開始的,為了分析各種行為之間的關系,接下來將圍繞阿里巴巴天池的“2017年淘寶用戶行為數(shù)據(jù)(userbehavior.sql)”展開。
二、數(shù)據(jù)集的采集與清理2.1 數(shù)據(jù)來源數(shù)據(jù)集(userbehavior.sql)包含了2017年11月25日至2017年12月3日之間,有行為的約為一百萬隨機用戶的所有行為(行為包括點擊、購買、加購、喜歡)。
列名稱 | 說明 |
---|
用戶ID | 字符串類型,用戶ID |
商品ID | 字符串類型,商品ID |
商品類目ID | 字符串類型,商品所屬類目ID |
行為類型 | 字符串,枚舉類型,包括(‘pv’,‘buy’,‘cart’,‘fav’) |
時間戳 | 整型,行為發(fā)生的時間戳 |
行為類型 | 說明 |
---|
pv | 商品詳情頁pv,等價于點擊 |
buy | 商品購買 |
cart | 將商品加入購物車 |
fav | 收藏商品 |
通過navicatl運行SQL文件,查詢該數(shù)據(jù)集的數(shù)據(jù)量以及用戶人數(shù),SQL語句如下:
得出結(jié)果:數(shù)據(jù)量為999856,用戶人數(shù)為983
2.2 數(shù)據(jù)清理2.2.1處理時間戳新建列‘dates’,以‘年-月-日’格式顯示, 新建列‘hours’,以‘時-分-秒’格式顯示, 新建列‘datetime’,以‘年-月-日 時-分-秒’格式顯示, 新建列‘weekday’,以數(shù)字顯示星期幾。SQL語句如下所示:
2.2.2查找重復值user_id多數(shù)情況下是具有唯一性,但在本項目中user__id會出現(xiàn)多次行為的記錄,因此無需進行處理。
2.2.3查找空值對于空值,如果在數(shù)據(jù)量很大的情況下,對分析結(jié)果的影響可以忽略不計,因此直接刪除即可,但在特定的情況下可使用平均值、權重較大的值進行填補。在userbehavior表中的user_id,item_id,category_id,behavior_type,timestamp都不存在空值,不需要進行處理。
2.2.4 剔除所需時間范圍外的數(shù)據(jù)根據(jù)所需的時間刪除了44條不符合要求的數(shù)據(jù)。
三、數(shù)據(jù)分析3.1分析目標AIPL營銷模型與漏斗分析法可以很好地將會員行為與相應的運營周期關聯(lián)起來,其中A - Awareness 認知:瀏覽,I - Interested 興趣:收藏、加購,P - Purchase 購買:購買,L - Loyalty 忠誠:復購。再根據(jù)用戶行為類型(behavior_type),且為了便于分析,需要對表結(jié)構(gòu)進行行列互換,SQL語句如下所示:
得出結(jié)果如下:
由于數(shù)據(jù)結(jié)果較少,可通過excel進行可視化,以下圖所示:
總結(jié):
根據(jù)AIPL漏斗圖后,我們便可直觀地發(fā)現(xiàn)用戶運營的情況且獲得分析目標:
a.【拉新環(huán)節(jié) A→I】轉(zhuǎn)化率為9.14%, 部分做得較差,可能拉新完成率較低,值得注意。將該問題列為優(yōu)先級:重要緊急 P0
b.【客戶首購 I→P 】轉(zhuǎn)化率圍毆22.97%,部分效果還可以,可以進一步挖掘用戶購買轉(zhuǎn)化路徑。將該事項列為優(yōu)先級:重要不緊急 P1
c.【客戶復購 P→L】轉(zhuǎn)化率為64.31%, 部分做得很好好,可以據(jù)此總結(jié)業(yè)務經(jīng)驗或復購規(guī)律,進一步推廣應用。將該事項列為優(yōu)先級:不重要不緊急 P2
3.2目標及其分析方法3.2.1 A-I部分此部分計劃通過‘人貨場’分析方法,解決‘A’認知用戶到‘I’興趣用戶行為轉(zhuǎn)化率低的問題。
3.2.1.1 人‘人’的部分主要在于觀察用戶行為特點,以總結(jié)經(jīng)驗。此案例中,因為數(shù)據(jù)維度有限,會員自身行為相關的數(shù)據(jù)除了商品外就是時間。各時段AI 轉(zhuǎn)化,SQL語句以及結(jié)果如下:
有很多不同的值。根據(jù)對比分析方法,我們需要比較基準——平均值,才知道這些轉(zhuǎn)化率哪些高,哪些低。
因每個時段的瀏覽人數(shù)不同,為確保分析的結(jié)果有效,故需選擇 瀏覽值大于平均值3735的時段來觀察:在這些時段中, 我們認為轉(zhuǎn)化率大于 平均值9.1%的時段,既是瀏覽人數(shù)多,又是轉(zhuǎn)化率高的時段,即11點、15-17點、19點、22-23點。其中,23點為轉(zhuǎn)化率大于10%,為最大值,可作為最佳投放時間。
3.2.1.2 貨
此部分需要對人貨匹配的情況進行分析,進而可針對性地將貨品根據(jù)會員行為進行調(diào)整。
在分析之前,需要先對AI階段涉及的總商品情況進行觀察:
結(jié)果如圖,共有60592款商品被有效瀏覽,用戶共對5206款商品產(chǎn)生興趣。
接下來,通過假設驗證分析方法,基于有效瀏覽機產(chǎn)生興趣的商品數(shù)差異較大的情況,提出假設:用戶偏好的商品主要集中在少數(shù)商品,而大部分長尾商品則是被錯誤地推薦到用戶。驗證思路:
a. 將被瀏覽最多的前100款商品 以及 用戶最感興趣(即加購、收藏)的前100款商品 進行交叉查詢。
b.如果交叉出的商品數(shù)較少,則假設成立。反之,則假設不成立。
以下SQL語句進行驗證:
結(jié)果顯示,僅有5款商品既是高瀏覽量,也是高收藏/加購的,故假設成立:用戶偏好的商品主要集中在少數(shù)商品,而大部分長尾商品則是被錯誤地推薦到用戶。進而可得出‘人貨匹配’效率低的結(jié)論。
3.1.2.3 場‘場’廣義來說指的是與用戶的觸點,例如在線下零售業(yè),則是門店; 在線上電商,則是在線店鋪、平臺、投放渠道等。從這個角度,分析此段時間淘寶平臺的活動情況:
a. 結(jié)合業(yè)務經(jīng)驗,數(shù)據(jù)時間段在雙十一之后,雙十二之前,即是兩個大促的中間節(jié)點
b. 查詢2017年雙十二的相關信息如下:
活動:天貓雙12年終品牌盛典
預熱時間:2017年12月7日00:00:00-2017年12月11日23:59:59;
上線時間:2017年12月12日00:00:00-2017年12月12日23:59:59。
c. 由活動時間可知,分析時間段處于雙十二預熱時間前夕的低潮期,客觀上營銷效果整體比較平淡,進而影響AI轉(zhuǎn)化率。
3.1.2.4 小結(jié) 人:為提高轉(zhuǎn)化率,可選擇在 瀏覽值大于3735 且 轉(zhuǎn)化率大于 9.1%的時間段加大投放力度;其中,23點為轉(zhuǎn)化率大于10%,為最佳投放時間
貨:人貨匹配效率低,平臺大部分商品為長尾商品,但它們并不能很好地吸引用戶興趣,需要進一步優(yōu)化商品信息以提升轉(zhuǎn)化率。
場:從平臺活動周期角度來說,分析時間段正處于大促活動預熱前的低潮期,此客觀因素也在一定程度上導致轉(zhuǎn)化率低。
3.2.2 I-P部分有此前漏斗分析可知,平臺用戶復購率高達63%,也就是說用戶只要突破0到1的消費,接下來就有63%的機會復購,所以此部分重點應放在如何提升I→P。
為了提高AI客戶的購買轉(zhuǎn)化率,可以通過高購買率客戶與低購買率客戶對比,挖掘高購買率客戶特征,進而指導業(yè)務運營策略。
3.2.2.1 購買率高 vs 購買率低結(jié)合二八原則,認為前20%為高購買率客戶,后20%為低購買率客戶。
由此前統(tǒng)計可知,分析數(shù)據(jù)共有386個客戶,即20%分位為:
386*0.2 =77,即前77位客戶為高購買率客戶;
386-77 = 309,即309-386位的客戶為低購買率客戶
高購物率客戶集中度為399。
低購物率客戶集中度為96。
經(jīng)上分析得出,以下結(jié)論:
a.高購買率客戶瀏覽商品數(shù)36遠小于低購買率客戶瀏覽商品數(shù)117。
b.高購買率客戶平均加購率11% 大于 低購買率客戶平均加購率10%。
c.高購買率客戶購買品類集中度399 遠大于低購買率客戶購買品類集中度96。
綜上所述可得人群畫像:高購買率人群瀏覽商品數(shù)少,但加購率高,大概率為決策型顧客,看對了商品就下手購買;而低購買率人群更多是糾結(jié)型顧客,需要反復瀏覽商品來確認最終想要的。此外,低購買率人群品類集中度高,可列出這些品類,有目的性地優(yōu)化品類信息,減少用戶瀏覽跳失率。
3.2.2.2 AIPL+RFM分析為促進用戶購買,需進行精細化用戶運營,即可通過RFM模型分析方法實現(xiàn)。由于數(shù)據(jù)限制,并無用戶購買金額數(shù)據(jù),故此處可與AIPL模型結(jié)合,重新定義R、F、M:
R:客戶最近一次購買離分析日期的距離,用以判斷購買用戶活躍狀態(tài)
F:客戶收藏、加購行為次數(shù)
M:客戶購買行為次數(shù)
因此,RFM分群結(jié)果及人群特征如下:
a.重要價值用戶(R高F高M高):用戶處于購買活躍期,感興趣的商品多,購買次數(shù)也多。
b.一般價值用戶(R高F高M低):用戶處于購買活躍期,感興趣的商品多,購買次數(shù)少。
c.重要發(fā)展用戶(R高F低M高):用戶處于購買活躍期,感興趣的商品少,購買次數(shù)多。
d.一般發(fā)展用戶(R高F低M低):用戶處于購買活躍期,感興趣的商品少,購買次數(shù)少。
e.重要喚回用戶(R低F高M高):用戶已不活躍,感興趣的商品多,購買次數(shù)也多。
f. 一般喚回用戶(R低F高M低):用戶已不活躍,感興趣的商品多,購買次數(shù)少。
g.重要挽留用戶(R低F低M高):用戶已不活躍,感興趣的商品少,購買次數(shù)多。
h.一般挽留用戶(R低F低M低):用戶已不活躍,感興趣的商品少,購買次數(shù)少。
3.2.2.2.1 按以上定義,計算出每個客戶的R、F、M值(圖中結(jié)果省略其中部分)3.2.2.2.2 為了劃分R、F、M值的高 與低,這里采用常用的平均值法作為閾值3.2.2.2.3 根據(jù)以上RFM閾值,及RFM定義,將每個客戶劃分到不同的用戶價值組中。(圖中結(jié)果省略其中部分)3.2.2.2.4 統(tǒng)計各個組的用戶數(shù)及用戶占比,用于對用戶運營現(xiàn)狀進行分析,并給出運營策略方向。如上圖為RFM模型分組結(jié)果,對比分析需要對照組進行比照分析,因數(shù)據(jù)限制,此處結(jié)合業(yè)務經(jīng)驗進行判斷:
a.“重要”型用戶累計占比26.8%(3.1%+3.5%+7.4%+12.8%),符合二八規(guī)律。
b.從用戶RFM轉(zhuǎn)化路徑角度來看:重要價值用戶占比較少,而主要由一般價值用戶、重要發(fā)展用戶、重要喚回用戶轉(zhuǎn)化而來。
c.一般價值、重要喚回用戶基數(shù)較多,可優(yōu)先對兩個人群進行“升級”。
d.重要發(fā)展用戶數(shù)量少,需要從基數(shù)較多的一般發(fā)展用戶轉(zhuǎn)化,之后再考慮將重要發(fā)展轉(zhuǎn)為重要價值。
3.2.3 P-L階段結(jié)合具體業(yè)務,復購分析的目的是為了優(yōu)化用戶觸達策略,即何時何地向哪些已購用戶推送什么商品可提升復購率。此案例中,受數(shù)據(jù)限制及考慮受眾,暫不對商品推薦進行建模分析。將通過分析用戶復購周期以解決業(yè)務中觸達時間的問題。
現(xiàn)該部分問題轉(zhuǎn)化為分析用戶復購周期問題,對于此,從業(yè)務角度主要包括何時觸達、觸達多久兩部分。
3.2.3.1何時觸達可通過計算用戶平均回購周期,即可在用戶發(fā)生購買行為后,在平均回購周期內(nèi)對其進行營銷觸達。
a.通過以下語句先計算出每個用戶每次消費的回購周期如圖所示,user_id 為100的用戶 n_consume=2,回購周期=2天 即為期第二次消費時,與第一次消費間隔了2天,也就是說該用戶在2天前進行了第一次消費。
b.基于以上查詢結(jié)果,可以將每人次的回購周期進行平均,取得最終的 平均回購周期 如圖所示,在用戶購買行為后的2-3天內(nèi)對其進行觸達
3.2.3.2 觸達多久
a.統(tǒng)計每個客戶“首次消費日期”、“最后消費日期”后,相減即可算得每個客戶的消費周期,命名為“最長消費間隔”。b.基于上面的查詢結(jié)果,按日期進行分組統(tǒng)計,計算得每天消費的客戶平均最長消費間隔。結(jié)果如圖所示,在周六(11-25) 首購的客戶,最長消費間隔最長為5.9天。
四、業(yè)務建議4.1 【A→I】業(yè)務建議——從“認知”到“興趣”階段的轉(zhuǎn)化率過低
通過【人貨場】分析,可得以下業(yè)務建議:
a.推廣部門:優(yōu)化投放策略,在A→I轉(zhuǎn)化率高的時間點,尤其是23點加大投放力度,提升AI轉(zhuǎn)化率,進而提升整體轉(zhuǎn)化
b.產(chǎn)品部門:針對【人貨匹配】效率低的問題,及時處理低轉(zhuǎn)化率商品,總結(jié)高轉(zhuǎn)化產(chǎn)品特性,開發(fā)新品
c.運營部門:針對【人貨匹配】效率低的問題,參考高轉(zhuǎn)化商品描述,優(yōu)化產(chǎn)品標題、內(nèi)容描述; 針對大促前低潮期,提出吸引性促銷政策,提高此階段銷售
4.2【I→P】業(yè)務建議——轉(zhuǎn)化效果較為可以,可以進一步挖掘用戶購買轉(zhuǎn)化路徑
通過分析,可得建議如下:
4.2.1 分析【高購買率用戶特征】用戶部門:
針對高購買率客戶,即決策型客戶,可能更多為‘長尾商品領域’,可配合精準商品推薦模型,觸達優(yōu)質(zhì)長尾商品,提升購買率。
針對低購買率客戶,即糾結(jié)型,可能更多為‘熱門商品領域’,觸達熱門商品,提高購買率。
4.2.2 用【AIPL+RFM】分析方法對于用戶部門,根據(jù)此前結(jié)合用戶RFM轉(zhuǎn)化路徑分析結(jié)論制定提升策略:
a.優(yōu)先級P0重要價值用戶(R高F高M高)維護:用戶處于購買活躍期,感興趣的商品多,購買次數(shù)也多 → 針對興趣產(chǎn)品,保持一定頻率的觸達,持續(xù)維護。
一般價值用戶(R高F高M低):用戶處于購買活躍期,感興趣的商品多,購買次數(shù)少 → 針對該部分客戶,目的就是要讓他們購買,所以可以和運營部門溝通,降低利潤,給出有力折扣促進購買,進而轉(zhuǎn)為重要價值用戶。
b.優(yōu)先級P1一般發(fā)展用戶(R高F低M低):用戶處于購買活躍期,感興趣的商品少,購買次數(shù)少 → 可通過商品組合推薦,即通過連帶提升該人群購買頻次,進而轉(zhuǎn)為重要發(fā)展用戶。
重要發(fā)展用戶(R高F低M高):用戶處于購買活躍期,感興趣的商品少,購買次數(shù)多 → 通過關聯(lián)算法,找出與興趣商品關聯(lián)高的商品進行推薦觸達,提高用戶收藏、加購數(shù),進而轉(zhuǎn)為重要價值用戶。
4.3【P→L】業(yè)務建議——從“購買”到“忠誠”階段的轉(zhuǎn)化率高。
通過【用戶復購分析】后,可得以下建議:
用戶部門:針對用戶復購周期特性,客戶消費后2-3天內(nèi)結(jié)合回饋手段及時進行觸達; 此外,對于周六首購客戶,最長消費周期達6天,在此周期內(nèi)可對消費客戶連續(xù)優(yōu)惠觸達。