電商用戶行為數(shù)據(jù)分析
時(shí)間:2023-03-15 22:28:01 | 來(lái)源:電子商務(wù)
時(shí)間:2023-03-15 22:28:01 來(lái)源:電子商務(wù)
1 背景介紹
在快節(jié)奏的生活中,網(wǎng)絡(luò)購(gòu)物逐漸發(fā)展成了最受大眾喜愛(ài)的購(gòu)物方式之一。從用戶行為中分析用戶習(xí)慣與喜好、優(yōu)化產(chǎn)品體驗(yàn),成為提高用戶留存、提升平臺(tái)口碑、提高電商競(jìng)爭(zhēng)力的關(guān)鍵。
2 提出問(wèn)題
1) 日活與留存情況如何?
2) 何時(shí)做用戶推送最好?
3) 用戶的行為路徑是什么樣的?
4) 如何對(duì)客戶做精細(xì)化運(yùn)營(yíng)?
5) 什么商品賣(mài)得最好,哪些做得不夠好?
6) 各環(huán)節(jié)轉(zhuǎn)化率如何?
3 結(jié)論
1) PV、UV整體趨勢(shì)相似,雙十二當(dāng)天達(dá)到峰值,隨后回落到正常值。
2) UV呈平緩上升趨勢(shì),日活提高不明顯。
3) 第7日與第14日的留存率大多數(shù)在中位數(shù)之下,且留存率日環(huán)比大多為負(fù)增長(zhǎng)。
4) 用戶每天最活躍的時(shí)段為21-22點(diǎn)。
5) 用戶購(gòu)買(mǎi)前會(huì)進(jìn)行多次點(diǎn)擊,其次是加購(gòu)。
6) 總PV按點(diǎn)擊、加購(gòu)、收藏、購(gòu)買(mǎi)依次降低。
7) 重要挽留客戶占比最高,而后依次是重要價(jià)值客戶、重要深耕客戶、重要喚回客戶。
8) 銷量最好的商品ID是:38063851、239436199、14136232。銷量最好的品類是1863,銷量為0的品類共有10種。
9) 從點(diǎn)擊到收藏、加購(gòu)的轉(zhuǎn)化率為65.84%,從收藏、加購(gòu)到購(gòu)買(mǎi)的轉(zhuǎn)化率為60.26,從購(gòu)買(mǎi)到復(fù)購(gòu)的轉(zhuǎn)化率為41.56%。
4 數(shù)據(jù)說(shuō)明
4.1 數(shù)據(jù)來(lái)源
本次數(shù)據(jù)選取于阿里天池新人實(shí)戰(zhàn)賽之[離線賽]2020賽季,數(shù)據(jù)包含某電商移動(dòng)端 2014年 11月 18 日至 2014 年 12 月18日,共1546,3110行用戶行為數(shù)據(jù)。
4.2 字段說(shuō)明
字段 | 字段說(shuō)明 | 提取說(shuō)明 |
---|
user_id | 用戶標(biāo)識(shí) | 抽樣&字段脫敏 |
item_id | 商品標(biāo)識(shí) | 字段脫敏 |
behavior_type | 用戶對(duì)商品的行為類型 | 包括瀏覽、收藏、加購(gòu)物車、購(gòu)買(mǎi),對(duì)應(yīng)取值分別是1、2、3、4。 |
user_geohash | 用戶位置的空間標(biāo)識(shí),可以為空 | 由經(jīng)緯度通過(guò)保密的算法生成 |
item_category | 商品分類標(biāo)識(shí) | 字段脫敏 |
time | 行為時(shí)間 | 精確到小時(shí)級(jí)別 |
4.3 數(shù)據(jù)清洗
4.3.1 數(shù)據(jù)選擇1) 以上字段均為有效字段,故選取所有字段。
2) 考慮到電腦配置,本次隨機(jī)抽取100,0000行數(shù)據(jù)進(jìn)行分析。
4.3.2 數(shù)據(jù)去重利用Pandas的drop_duplicates() 方法對(duì)數(shù)據(jù)進(jìn)行去重,發(fā)現(xiàn)沒(méi)有重復(fù)數(shù)據(jù)。
4.3.3 缺失值處理使用Pandas的isnull() 方法查找缺失值,發(fā)現(xiàn)只有“user_geohash”列存在缺失值, 暫不做處理。
4.3.4 時(shí)間值處理將原時(shí)間列time分為date(日期列)與hour(小時(shí)列),并將數(shù)據(jù)類型修改為日期類型與整型。
4.3.5 排序處理將所有數(shù)據(jù)按date、hour、user_id升序排列。
4.3.6 異常值處理1) 日期異常值:排序后,所有日期均在2014-11-18到2014-12-18之間,無(wú)異常值。
2) 小時(shí)異常值:排序后,所有小時(shí)數(shù)均在00與23之間,無(wú)異常值。
3) 行為異常值:所有行為值均為1、2、3、4中的一個(gè),無(wú)異常值。
5 分析說(shuō)明
5.1 分析思路
1) 分析每日DAU,用戶的次日、3日、7日、14日留存率,找出二次激活用戶的關(guān)鍵時(shí)間點(diǎn)。
2) 找出用戶每天最活躍的時(shí)段,了解用戶的行為時(shí)間模式。
3) 分析用戶購(gòu)買(mǎi)前的行為,了解用戶的購(gòu)買(mǎi)行為模式。
4) 基于RFM模型,找出價(jià)值客戶。
5) 分析銷量最好、最次的商品和品類,以及復(fù)購(gòu)率情況。
6) 用戶從瀏覽到最終購(gòu)買(mǎi)整個(gè)過(guò)程的流失情況,提出改善轉(zhuǎn)化率的意見(jiàn)
5.2 分析方法
1) 電商行業(yè),使用“人貨場(chǎng)”模型進(jìn)行指標(biāo)拆解。
2) 淘寶用戶行為,利用“AIPL”模型進(jìn)行轉(zhuǎn)化率分析。
3) 用戶精細(xì)化運(yùn)營(yíng),選擇“RFM”模型進(jìn)行用戶分層。
6 方案實(shí)現(xiàn)
6.1 使用工具
1) 數(shù)據(jù)庫(kù):MySql與Navicat,導(dǎo)入及存儲(chǔ)數(shù)據(jù)。
2) 數(shù)據(jù)處理:pycharm,主要使用sqlachemy進(jìn)行數(shù)據(jù)庫(kù)連接、數(shù)據(jù)讀取與寫(xiě)入;pandas與numpy進(jìn)行數(shù)據(jù)清洗和統(tǒng)計(jì)。
3) 數(shù)據(jù)可視化:tableau,利用tableau進(jìn)行圖表繪制。
6.2 具體實(shí)現(xiàn)
6.2.1 數(shù)據(jù)處理1) 導(dǎo)入相關(guān)庫(kù)。
2) 抽樣并導(dǎo)入數(shù)據(jù)。
3) 刪除重復(fù)數(shù)據(jù)。
4) 定義表頭。
5) 查找缺失值,只有地理位置列有缺失,不影響本次統(tǒng)計(jì)分析,不做處理。
6) 查看數(shù)據(jù)類型。
7) 處理日期值。
8) 按時(shí)間和用戶對(duì)數(shù)據(jù)進(jìn)行升序排列。
6.2.2 日PV、UV分析
1) 統(tǒng)計(jì)總量
ⅰ. 總PV:1000,000。
ⅱ. 總UV:262,733。
2) 按日期統(tǒng)計(jì)PV、UV。
i. 獲取唯一日期值。
ⅱ. 統(tǒng)計(jì)日PV。
ⅲ. 統(tǒng)計(jì)日UV。
ⅳ. 繪圖與分析。
- PV、UV整體趨勢(shì)相似,符合預(yù)期。
- 雙十二 PV、UV達(dá)到峰值,符合預(yù)期。
- 雙十二之后PV、UV回落到日常值,符合預(yù)期。
- UV呈平緩上升趨勢(shì),日活提高不明顯。
6.2.3 留存率分析
1) 自定義留存率函數(shù)。
2) 統(tǒng)計(jì)每日的次日、第3日、第7日、第14日留存率。
3) 統(tǒng)計(jì)日環(huán)比。
4) 繪圖與分析。
i. 第1日、第3日、第7日、第14日留存率對(duì)比。
- 可以看出留存率趨勢(shì)相近,但第7日與第14日的留存率大多數(shù)在中位數(shù)之下,考慮第7日是用戶留存的關(guān)鍵日期。
- 留存率均達(dá)到峰值的,均為雙十二活動(dòng)影響,符合預(yù)期。
ⅱ. 留存率日環(huán)比、周環(huán)比對(duì)比。
- 雙十二活動(dòng)過(guò)后,UV降低,留存率為負(fù),符合預(yù)期。
- 日環(huán)與周環(huán)比相比,負(fù)增長(zhǎng)日較多。
6.2.4 日活躍時(shí)間段分析
1) 統(tǒng)計(jì)不同時(shí)刻、不同行為的PV。
2) 統(tǒng)計(jì)不同時(shí)刻、不同行為的UV。
3) 繪圖分析。
由下圖可知:
- 不同時(shí)刻PV、UV趨勢(shì)相似,且用戶以點(diǎn)擊瀏覽為主,且加購(gòu)用戶比收藏用戶要多。
- 用戶活躍最活躍的時(shí)段為21-22點(diǎn),0點(diǎn)之后活躍度降低,3-5點(diǎn)最低,6點(diǎn)后開(kāi)始上升,10點(diǎn)后達(dá)到水平值,10-18點(diǎn)期間用戶活躍度一般,19點(diǎn)后活躍度開(kāi)始當(dāng)日的二次上升,至21點(diǎn)達(dá)到峰值。
6.2.5 行為路徑分析
分析用戶購(gòu)買(mǎi)前的4個(gè)行為,了解用戶行為路徑。
1) 獲取具有購(gòu)買(mǎi)行為的用戶。
2) 將行為默認(rèn)值設(shè)置為“空”,并補(bǔ)齊第5個(gè)行為為購(gòu)買(mǎi)。
3) 獲取購(gòu)買(mǎi)的前4個(gè)行為。
4) 拼接行為路徑。
5) 繪圖分析。
共計(jì)196種不同的行為路徑,選取用戶數(shù)TOP10的記錄進(jìn)行繪圖。由圖可見(jiàn):
- 用戶購(gòu)買(mǎi)前最常見(jiàn)的行為是點(diǎn)擊,其次是加購(gòu)。
- 用戶收藏的商品購(gòu)買(mǎi)的并不多。
6.2.6 用戶價(jià)值分析
對(duì)用戶進(jìn)行RFM分析,實(shí)現(xiàn)用戶分層與精細(xì)化運(yùn)營(yíng)。
1) 設(shè)定當(dāng)前日期。
2) 獲取具有購(gòu)買(mǎi)行為的用戶。
3) 計(jì)算購(gòu)買(mǎi)日與當(dāng)前日期的間隔天數(shù)。
4) 以最近一次購(gòu)買(mǎi)日的間隔天數(shù)作為用戶的R值。
5) 計(jì)算F值。
6) 計(jì)算平均值。
7) 將用戶的R、F值與均值比較。
8) 用戶分層,由于沒(méi)有M值,本次僅將用戶分為四層。
9) 繪圖分析。
- 重要價(jià)值客戶、重要挽留客戶與重要深耕客戶占比相當(dāng),其中重要價(jià)值客戶占比30.04%,是創(chuàng)造價(jià)值的主力軍。
- 重要挽留客戶占比30.77%,占比最高,已接近流失階段,需要提升這部分用戶的粘性,并進(jìn)行消費(fèi)刺激。
- 重要深耕客戶近期活躍,但消費(fèi)頻次較低,需進(jìn)行消費(fèi)刺激。
- 重要喚回客戶占比11.53%,為過(guò)去消費(fèi)頻次較高的客戶,考慮是否轉(zhuǎn)到其它平臺(tái),可對(duì)其采取優(yōu)惠策略等進(jìn)行喚回。
6.2.7 商品分析
1) 獲取商品唯一ID及所屬品類。
2) 獲取各商品點(diǎn)擊、收藏、加購(gòu)、購(gòu)買(mǎi)PV量。
3) 獲取各商品的購(gòu)買(mǎi)用戶數(shù)。
4) 獲取各商品復(fù)購(gòu)率。
5) 繪圖分析。
i. 銷量Top10商品與品類。
- 本次統(tǒng)計(jì)共計(jì)商品734,163種,銷量最好的商品ID是:38063851、239436199、14136232。
- 銷量最好的商品不超過(guò)5個(gè),用戶復(fù)購(gòu)商品0種,收藏和加購(gòu)數(shù)也極低,但是點(diǎn)擊量都比銷量高出近一倍,對(duì)商品詳情頁(yè)做進(jìn)一步分析優(yōu)化。
- 銷量最好的品類是1863,共計(jì)購(gòu)買(mǎi)用戶數(shù)221個(gè)。
ⅱ. 下圖為銷量為0的品類,共計(jì)10種,這些品類下的商品銷量均為0,考慮這些品類與商品做進(jìn)一步的分析和優(yōu)化調(diào)整。
6.2.8 漏斗轉(zhuǎn)化分析
1) 獲取用戶行為與對(duì)應(yīng)用戶數(shù)。
2) 收藏與加購(gòu)后續(xù)階段均可能為購(gòu)買(mǎi),故將其視為同一階段,進(jìn)行去重加和處理。
3) 統(tǒng)計(jì)存在復(fù)購(gòu)行為的用戶數(shù)。
4) 計(jì)算轉(zhuǎn)化率。
5) 繪圖分析。
- 從點(diǎn)擊到收藏、加購(gòu)的用戶有六成,考慮優(yōu)化個(gè)性化推薦,提高用戶收藏與加購(gòu)率。
- 考慮有用戶從點(diǎn)擊到直接購(gòu)買(mǎi),購(gòu)買(mǎi)人數(shù)僅占點(diǎn)擊人數(shù)的一半,流失率較高。
- 存在復(fù)購(gòu)行為的用戶占購(gòu)買(mǎi)用戶的41.56%,復(fù)購(gòu)率尚可。
7 總結(jié)與建議
7.1 日PV、UV
- PV、UV整體趨勢(shì)相似,受雙十二影響,雙十二當(dāng)天為近一月峰值,隨后回落到正常值,符合預(yù)期。
- UV呈平緩上升趨勢(shì),需采取拉新措施提高新增用戶數(shù),或提高用戶粘性。
7.2 留存率
- 第7日與第14日的留存率大多數(shù)在中位數(shù)之下,考慮第7日是用戶留存的關(guān)鍵日期。
- 留存率日環(huán)比大多為負(fù)增長(zhǎng),考慮新用戶影響,應(yīng)結(jié)合渠道拉新進(jìn)行進(jìn)一步分析。
7.3 日活躍時(shí)間段
- 用戶每天最活躍的時(shí)段為21-22點(diǎn),0點(diǎn)之后活躍度降低,3-5點(diǎn)最低,6點(diǎn)后開(kāi)始上升,10點(diǎn)后達(dá)到水平值,10-18點(diǎn)期間用戶活躍度一般,19點(diǎn)后活躍度開(kāi)始當(dāng)日的二次上升,至21點(diǎn)達(dá)到峰值,可在21-22點(diǎn)進(jìn)行重點(diǎn)推送與直播等,其余推送可在10-18點(diǎn)進(jìn)行。
- 用戶以點(diǎn)擊瀏覽為主,且加購(gòu)用戶比收藏用戶要多,可對(duì)購(gòu)物車商品價(jià)格變動(dòng)做醒目提醒。
7.4 用戶行為路徑
- 用戶購(gòu)買(mǎi)前會(huì)進(jìn)行多次點(diǎn)擊,其次是加購(gòu)。
- 收藏的商品被購(gòu)買(mǎi)的不多,可針對(duì)收藏夾商品采取提醒策略,或考慮奢侈品策略。
7.5 用戶價(jià)值
- 重要價(jià)值客戶、重要挽留客戶與重要深耕客戶占比相當(dāng),其中重要價(jià)值客戶占比30.04%,是創(chuàng)造價(jià)值的主力軍。
- 重要挽留客戶占比30.77%,占比最高,已接近流失階段,需要提升這部分用戶的粘性,并進(jìn)行消費(fèi)刺激。
- 重要深耕客戶近期活躍,但消費(fèi)頻次較低,需進(jìn)行消費(fèi)刺激。
- 重要喚回客戶占比11.53%,為過(guò)去消費(fèi)頻次較高的客戶,考慮是否轉(zhuǎn)到其它平臺(tái),可對(duì)其采取優(yōu)惠策略等進(jìn)行喚回。
7.6 商品分析
- 本次統(tǒng)計(jì)共計(jì)商品734,163種,銷量最好的商品不超過(guò)5個(gè),用戶復(fù)購(gòu)商品0種,收藏和加購(gòu)數(shù)也極低,但是點(diǎn)擊量都比銷量高出近一倍。
- 銷量最好的品類是1863。
- 銷量為0的品類共有10種,這些品類下的商品銷量均為0,考慮是否對(duì)品類或商品做優(yōu)化調(diào)整。
7.7 各環(huán)節(jié)轉(zhuǎn)化率
- 從點(diǎn)擊到收藏、加購(gòu)的用戶有六成,考慮優(yōu)化個(gè)性化推薦,提高用戶收藏與加購(gòu)率。
- 考慮有用戶從點(diǎn)擊到直接購(gòu)買(mǎi),購(gòu)買(mǎi)人數(shù)僅占點(diǎn)擊人數(shù)的一半,流失率較高。
- 存在復(fù)購(gòu)行為的用戶占購(gòu)買(mǎi)用戶的41.56%,復(fù)購(gòu)率尚可。
關(guān)鍵詞:數(shù)據(jù),分析,用戶