電商項目數(shù)據(jù)分析報告
時間:2023-03-15 21:04:01 | 來源:電子商務
時間:2023-03-15 21:04:01 來源:電子商務
本文結構:
文章結構一、數(shù)據(jù)介紹1、數(shù)據(jù)簡介 該數(shù)據(jù)集包含兩個表—orderinfo和userinfo。
Orderinfo記錄了537510條數(shù)據(jù),表的每一行記錄了一個訂單信息(包括已支付和未支付),該表由訂單編號、用戶ID、是否支付、訂單金額、訂單時間構成。
Userinfo記錄了每個用戶的信息,每一行記錄包含一個用戶的信息,其中包含的信息有用戶ID、性別、出生日期,一共有101535條數(shù)據(jù)。
2、字段介紹Orderinfo:
Orderinfo其中ispaid包含“已支付”和“未支付”。
Userinfo:
Userinfo二、分析思路1、提出問題2、數(shù)據(jù)探索該數(shù)據(jù)集為電商領域的數(shù)據(jù),包含了用戶的下單信息及用戶的信息,包括了用戶、訂單號、是否支付、訂單金額、訂單時間五個維度。因為是電商數(shù)據(jù),所以得先了解相關的電商運營基礎指標,指標如下:
電商常用分析指標了解電商基礎運營指標后,結合本數(shù)據(jù)及看數(shù)據(jù)能做的分析包含哪些方面:
- 基于price、orderid、paidtime等字段數(shù)據(jù)可以分析銷售額等整體銷售業(yè)績指標;
- 基于userid、ispaid、paidtime等字段,可以進行用戶行為分析,計算復購和回購的情況。
- 結合userinfo中提供的用戶信息,進行用戶特征分析。
三、清洗數(shù)據(jù)導入數(shù)據(jù):直接通過sequel pro的導入按鈕,將數(shù)據(jù)源導入。
1、重復值處理不存在重復記錄:
2、缺失值處理Orderinfo:
記錄均為539414個,無缺失值。
查詢結果userinfo表也無缺失值。
3、異常值處理以日期(分組)對orderinfo表的數(shù)據(jù)量進行查看,得知數(shù)據(jù)主要集中在2016年3月和4月,5月的數(shù)據(jù)量只有7條,無參考意義。因此先刪除2016年5月的7條數(shù)據(jù)。
四、構建模型1、總體運營指標:(1)銷售業(yè)績指標:銷售金額、訂單量、單比訂單金額
總體銷售指標- 現(xiàn)象描述/分析:從2016年3月到4月,訂單量下降了6%,成交訂單總金額基本維持不變,單比訂單金額增長7%。因無其它數(shù)據(jù)對比,無法展開進一步分析。
2、用戶行為分析(1)訂單量/下單人數(shù)變化趨勢(日期、周、小時粒度)
a、日期粒度
日期粒度用戶行為走勢按日期粒度來看,訂單量和下單人數(shù)基本呈正相關的關系,且呈現(xiàn)有規(guī)律的波動。并且從圖標上波動的規(guī)律來看,訂單量在每周六達到最低點,同時,在4/2與4/3,訂單連續(xù)兩天到達在最低點(4/2-4/4為清明小長假)。我們也會在后面周粒度中去印證這一現(xiàn)象。
b、按周粒度
周粒度用戶行為走勢如日粒度中的展示結果,訂單量周六達到最低點,后面逐漸回升,在周二到周四達到峰值。因此,平臺或店鋪的營銷活動可以選擇在工作日展開,以達到最好的促銷效果。
c、按小時粒度
小時粒度用戶行為走勢每日0點到5點訂單量快速降低,降到一天中活躍量最低值,6點到10點訂單量快速上升,10點達到峰值。12點到21點用戶訂單量較平穩(wěn)。
結論:用戶白天的購買行為比率相比于晚上會高,白天使用平臺購買的目的性最強。
(2)用戶的回購率和復購率特征a、回購率:本月購買用戶中下個月又再次購買的比例,因此本月回購率=本月購買下個月再次購買的用戶數(shù)/本月購買的用戶總數(shù)。
- 現(xiàn)象描述/分析:由于該數(shù)據(jù)集只展示了2016/4-2016/5的數(shù)據(jù),因此只能展示2016年3月的回購率,為23%。無其它月份數(shù)據(jù)對比,不展開分析。
b、復購率特征
a、復購率
復購率=購買了多次的用戶占所有用戶的比例
- 現(xiàn)象描述/分析:整體復購率為37.9%,無其它數(shù)據(jù)比較,不展開分析。
b、復購特征分析
查詢代碼
看分布
復購特征分析由此可見大部分用戶集中在7次以內,將客戶按購買1次,2-4次,5-7次,8次以上分組,結果如下:
各購買次數(shù)占比如圖:
僅購買一次的客戶占比為50%,2-4次客戶占比為31%,5-7次為18%。說明該平臺絕大多數(shù)客戶購買少于4次,發(fā)展空間較大。
3、用戶畫像--用戶特征分析
a、男女消費頻次和金額的差異
- 現(xiàn)象描述/分析:有查詢結果看來,男女生在消費頻次上無太大差異。從中銷售額和平均消費金額來看,男女相差也不大。男生總消費額相比女生高5%,而平均消費金額比女生低6%。
b、不同年齡段及性別的消費金額差異
不同年齡段及性別的消費總金額從總體來看,消費人群主要集中在20-50歲,占了總銷量的89%,其中以30-34分布最多,20-30次之。在性別分布方面,20-30歲區(qū)間女性比男性銷量略高,其它區(qū)間,均是男性高于女性,后期可以針對具體主力人群進行目的性的廣告投放。
4、基于RFM模型分析用戶價值:(1) RFM模型簡介(2)分類維度及分類標準(3)實現(xiàn)過程參考RFM模型,結合該數(shù)據(jù)集的字段,通過R(Recency)、F(Frequency)和M(Monetary)三個維度把客戶分成8大類:
a、建立視圖,統(tǒng)計用戶R、F、M值:這里以2016/4/30為參考時間
b、給R、F、M分組,給用戶打分—數(shù)值分組查看最大值和平均值,確定分組標準。
R值:0-9,10-19,20-29,30-44,45-60分別對應5分、4分、3分、2分、1分;
F值:1-6,7-12,13-18,19-24,24-31分別對應為1分、2分、3分、4分、5分;
M值:1-1000,1001-2000,2001-4000,4000以上分別對應為1分、2分、3分、4分、5分。
(1)為用戶價值打分
將R、F、M分組后按照上面的標準進行打分
(2)計算R_score、F_score、M_score的平均值,確定評分標準,按RFM的平均值打標簽,然后將R/F/M的評分跟平均值做比較。
(3)給不同價值用戶貼上價值標簽:
代碼:
(4)查看不同價值用戶占比情況
各類型用戶計數(shù):
可視化展示:
客戶類型占比(5)現(xiàn)象描述/分析:
針對不同用戶實行不同的營銷策略:
- 新客戶:該類用戶占比最高,新付費用戶,需要挖掘客戶需求,提高用戶粘性,引導用戶再次購買。
- 重要價值客戶:他們是最優(yōu)質的用戶,需要重點關注并保持, 應該提高滿意度,增加留存,占整體客戶的25%。
- 重要深耕客戶:該類客戶潛力很大,但忠誠度不夠,可以推薦其它產品和服務,拓展用戶的消費場景和需求,提高用戶忠誠度。該類用戶也占了很高的比例,20%。
- 重要挽留客戶:他們雖然最近沒有購買,但以往購買頻率高,可以做觸達,以防止流失,12%比例比較高了。
五、總結建議(1)用戶行為特征
現(xiàn)象:按周來看,工作日活躍,周四開始活躍度下降,周六后活躍度繼續(xù)上升到正常值。按日來看,用戶在10點-21點活躍,在10點時,成交量達到最高峰。
建議:營銷活動時間節(jié)點選擇可根據(jù)用戶以上活躍規(guī)律進行,實現(xiàn)活動效果最大化。
(2)用戶的回購率和復購率特征
建議:總體復購率37.9%,可針對復購率高的商品和用戶,分析其畫像,提升復購,增加留存。
(3)用戶特征分析
現(xiàn)象:消費人群主要集中在20-50歲,占了總銷量的89%。在性別分布方面,20-30歲區(qū)間女性比男性銷量略高,其它區(qū)間,均是男性高于女性。
建議:后期可以針對具體主力人群進行目的性的廣告投放和運營。
(4)用戶價值
新客戶:該類用戶占比最高,占了總用戶的43%,說明近期針對新用戶的運營效果顯著。需要挖掘客戶需求,提高用戶粘性,引導用戶再次購買。
重要價值客戶:他們是最優(yōu)質的用戶,就是最近有消費且頻次高的用戶,占整體客戶的25%。 需要重點關注并保持, 應該提高滿意度,增加留存,
重要深耕客戶:該類客戶潛力很大,但忠誠度不夠,可以推薦其它產品和服務,拓展用戶的消費場景和需求,提高用戶忠誠度。該類用戶也占了很高的比例,20%。
重要挽留客戶:他們雖然最近沒有購買,但以往購買頻率高,可以做觸達,以防止流失,12%比例比較高了。