數(shù)據(jù)分析——深入探索電商母嬰數(shù)據(jù)
時(shí)間:2023-03-26 07:04:01 | 來源:電子商務(wù)
時(shí)間:2023-03-26 07:04:01 來源:電子商務(wù)
一、分析背景
隨著互聯(lián)網(wǎng)的普及和發(fā)展,人們越來越傾向于在網(wǎng)上購買商品。近幾年的嬰兒潮也使得母嬰市場成為電商領(lǐng)域具有商機(jī)中的一個(gè)細(xì)分領(lǐng)域。本文通過對兩組電商母嬰產(chǎn)品數(shù)據(jù)的深入探索,運(yùn)用多種分析方法,從不同維度尋找其中的規(guī)律及聯(lián)系,從而給出提高銷量的建議及方案。
二、數(shù)據(jù)背景
1、數(shù)據(jù)來源
表一包含了在12年到15年這個(gè)時(shí)間段,不同用戶購買母嬰類商品的數(shù)量及次數(shù)。
- user_id——用戶ID
- auction_id——訂單編碼(購買行為),但通過查重分析,同一個(gè)auction id的購買日期也不同。所以暫不做排重處理
- cat_id——二級分類
- cat1——一級分類
- property——商品屬性
- buy_mount——購買數(shù)量
- day——購買日期
表二包含了953個(gè)用戶的兒童信息,包含兒童年齡及性別
- user_id——用戶ID
- birthday——生日
- gender——性別
2、數(shù)據(jù)清洗
- 用分列將day列修改為正確日期形式;
- 商品屬性列有空值,但對最終分析結(jié)果沒有影響,我們只需知道商品類別的銷售總和,所以隱藏該列;
- 通過對購買數(shù)量列的描述統(tǒng)計(jì)分析,利用 平均值±3倍標(biāo)準(zhǔn)差方法剔除異常值,得出購買數(shù)量的正常值在(0,195)。剔除異常值后剩余29942行數(shù)據(jù);
- 利用表一購買時(shí)間減去表二出生日期,可以得出表二中兒童的年齡(利用Roundup將年齡數(shù)據(jù)向上取整),剔除不屬于兒童年齡的異常值。最后將兒童按照年齡分段;
- 利用Vlookup將表二信息匹配至表一,用數(shù)據(jù)透視表拉取不同維度信息。
三、分析思路
1、明確問題
如何提高今年母嬰類產(chǎn)品銷量?2、多維度拆解問題
我們根據(jù)清洗后的數(shù)據(jù)可以體現(xiàn)的信息,將問題拆解成為三個(gè)維度,并且再繼續(xù)細(xì)分以便逐一擊破。
圖1:分析思路四、數(shù)據(jù)分析(可視化)
1、行為數(shù)據(jù)
圖2:年度、季度銷量情況- 問題:母嬰產(chǎn)品的整體市場如何?
- 分析:我們通過對不同年份、不同季度的對比分析可以看出,15年第一季度的數(shù)據(jù)缺失導(dǎo)致不符合上升趨勢,但整體上看,每年銷售總量持續(xù)上漲,季度銷量同比上期均為上升趨勢。其中第二、第四季度都是每年銷量較好的季度。
圖3:年度、月份銷量情況圖4:每年11月日銷量進(jìn)一步觀察月份的銷售數(shù)據(jù),可以看到每年的5月、11月均為銷售高峰。深入到11月每一天的銷售,每年的銷售高峰都包含11.11,可以推斷有雙十一的活動(dòng)影響。其中12年的銷售高峰在11.5、11.10,可以確認(rèn)下是否平臺(tái)活動(dòng)有不一樣的地方;13年的銷售高峰在11.6、11.11、11.30;14年的銷售高峰在11.11、11.15、11.22、11.26,這些小高峰可以與平臺(tái)方確認(rèn)下是否當(dāng)年有其他的平臺(tái)活動(dòng)。
同理,銷售較好的12月,每年的銷售最高峰日是在12.12,也可以推斷是受到雙十二影響,13年銷售高峰在12.12、12.28。14年的12.6有一個(gè)銷售高峰,可以跟平臺(tái)確認(rèn)下是否有做預(yù)售活動(dòng),從而提升了銷量。
圖5:2013、2014年5月日銷量在圖3的月份銷量情況中我們可以看出,每年的5月也是銷量高峰。拉取13、14年的5月日銷量,可以看出銷量14年從5.12開始就有較大幅度的上漲,而且每隔幾日就有一個(gè)小高峰,由于沒有數(shù)據(jù)支持,這里不展開分析,建議與相關(guān)平臺(tái)人員查詢14年5月的平臺(tái)活動(dòng)情況。
圖6:2013、2014年1、2月日銷量1月、2月為銷售低峰,追溯往年春節(jié)時(shí)間,13年:2.9~2.15、14年:1.31~2.6,可以看出,在春節(jié)假期前一周,銷量就已經(jīng)開始進(jìn)入低谷期,推斷銷售下滑提前的原因受到了物流停運(yùn)的影響。
- 結(jié)論:大型平臺(tái)活動(dòng)(雙11、雙12)對銷量提升很快,每年5月也是銷量高峰,需要提前預(yù)熱活動(dòng),預(yù)估往年銷量聯(lián)動(dòng)商家進(jìn)行采購囤貨,避免出現(xiàn)無貨可賣的情況;
- 母嬰商品在年中的第三季度銷售較為平穩(wěn),可以啟動(dòng)新平臺(tái)活動(dòng)。
圖7:復(fù)購率用數(shù)據(jù)透視表拉取用戶ID的計(jì)數(shù)總和,利用count、countif函數(shù)進(jìn)行計(jì)數(shù),進(jìn)而求出復(fù)購率。從上表可以看出,整體的復(fù)購率都很差。其中一級分類中50008168的復(fù)購率最高。
- 問題:復(fù)購率差的原因有哪些?
- 分析:假設(shè)用戶活躍度與復(fù)購率相關(guān),其中與用戶活躍行為相關(guān)的數(shù)據(jù):復(fù)購人數(shù)、有兒童信息人數(shù)。我們利用相關(guān)關(guān)系分析方法,得出:有兒童信息人數(shù)與復(fù)購人數(shù)的相關(guān)系數(shù)=0.72,高度正相關(guān)。
- 結(jié)論:優(yōu)化信息收集的流程,增加有兒童信息的用戶數(shù),一是可以幫助后續(xù)了解客戶購買行為,二是借助這個(gè)流程(送券、積分等方式)可以提高用戶活躍度,提升復(fù)購率。
2、用戶數(shù)據(jù)
圖8:性別、年齡的銷量情況圖9:性別與品類銷量的關(guān)聯(lián)圖10:年齡與品類銷量的關(guān)聯(lián)可以看出幼童時(shí)期的購買需求是最大的、女童家庭的購買需求比男童家庭大、胎兒時(shí)期性別對銷量影響不大、嬰兒階段50014815需求最大。
- 問題:為什么男童銷量比女童差那么多?
- 分析:我們用多維度拆解+假設(shè)檢驗(yàn)進(jìn)行分析。我們將銷量拆解為用戶、產(chǎn)品兩個(gè)維度,提出假設(shè)。
圖11:為什么男童銷量比女童差?- 假設(shè)1:與用戶數(shù)量相關(guān)——不成立
男童數(shù)量:439 女童數(shù)量:489,人數(shù)差距不大,該假設(shè)不成立 - 假設(shè)2:與產(chǎn)品品類相關(guān)——成立
在第二張圖表中可以看出6個(gè)大類中,50014815的男女銷量差距最大,其次38,可以推斷出這2個(gè)類別商品與男童相關(guān)的產(chǎn)品較少,女童相關(guān)則較多,導(dǎo)致銷量差距過大。 - 結(jié)論:對不同階段的老用戶進(jìn)行精準(zhǔn)營銷活動(dòng)的推送,例如從嬰兒期進(jìn)入幼童階段的用戶,推送5008168的商品活動(dòng),及時(shí)對接用戶該階段需求;50014815、38大類中,增加引入與男童相關(guān)的產(chǎn)品,將潛在的男童家庭購買需求,轉(zhuǎn)化為銷量。
3、產(chǎn)品數(shù)據(jù)
圖12:一級分類銷量情況- 一級分類中,28、50008168、50014815總銷量最高;
- 一級分類中,28有最多的子分類,達(dá)267個(gè);122650008只有17個(gè)子分類;
- 提問:一級分類的銷量與二級分類數(shù)量是否有關(guān)?
圖13:二級分類數(shù)量與銷量的關(guān)聯(lián)圖12
分析:利用相關(guān)分析可以得出兩者相關(guān)系數(shù)=0.68,高度正相關(guān),但是有個(gè)異常值,就是38分類,僅有34個(gè)二級分類,總銷量排名卻第三。
圖14:二級分類銷量TOP10&滯銷情況- 二級分類中,前10名高銷商品分別來自50008168、28、50014815、38四個(gè)一級分類,值得注意的是,38大類下的熱銷商品211122的銷量達(dá)到2058,排名第三;
- 選取銷量5以下的二級分類定為滯銷品類,其中滯銷占比最高來自28、50014815、50022520這三個(gè)一級分類。
- 提問:滯銷與品類數(shù)量是否有關(guān)系?
圖15:二級分類數(shù)量與滯銷的關(guān)聯(lián)- 分析:結(jié)合一級分類的子類別數(shù)量,利用相關(guān)分析方法可以得出像相關(guān)系數(shù)=0.96,高度正相關(guān)。二級分類越多,滯銷的就越多。
- 結(jié)論:38、50008168從銷售總量以及品類來看,都有提高銷量的潛力,可以增加引入二級分類商品;28大類中滯銷商品類別過多,又是一級分類銷量最高,在商品曝光引流機(jī)會(huì)多的情況依舊滯銷,建議減少28大類中滯銷的商品種類。
圖16:品類的季度銷量所有大類的銷售情況均在第四季度表現(xiàn)最佳。一級分類中的28在每年的第二季度銷量明顯下滑,50014815、50008168對季節(jié)性較為敏感,波動(dòng)較大。其余大類相對平穩(wěn)。
- 問題:為什么50014815、50008168對季節(jié)性較為敏感,波動(dòng)較大?
- 分析:我們拉取了這兩個(gè)大類的銷量前10的子分類在每個(gè)季度的銷量,利用對比分析方法,可以看到只有50014815大類下的50018831銷量在第四季度激增,細(xì)分到月份跟每日銷量,可以看到12年11.5、11.10是銷量高峰;13年的銷量高峰則在11.6、11.30;14年的銷量高峰在11.11、12.12、12.28,均與每年整體銷量的趨勢一致,可以判斷為是受到平臺(tái)活動(dòng)影響。
圖17:50014815的二級分類的季度銷量圖18:50018831第四季日銷量- 結(jié)論:28大類在第二季度可以啟動(dòng)品類營銷活動(dòng),聯(lián)動(dòng)每年5月的銷售高峰,增加引流曝光度來提高銷量;調(diào)查及分析二級分類50018831下的產(chǎn)品特性,分析是哪個(gè)環(huán)節(jié)幫助這類產(chǎn)品加強(qiáng)了平臺(tái)活動(dòng)效果。
- 問題:從這個(gè)結(jié)論我們再引申出一個(gè)問題,雙十一活動(dòng)對每個(gè)品類的銷量都有很大的提升嗎?
- 分析:用對比分析方法,拉取出每個(gè)品類在不同月份的銷量對比,可以看出有三個(gè)大類對比另外三個(gè)在11月的銷量提升并不明顯。38大類反而是在14年的11.26有比較大的提升;前面提到,122680008及50022520大類的銷量雖然墊底,但13、14年的雙十一中也是銷量激增。
圖19:不同品類的月度銷量五、總結(jié)與建議
產(chǎn)品維度建議:
- 50014815、38大類中,增加引入與男童相關(guān)的產(chǎn)品,將潛在的男童家庭購買需求,轉(zhuǎn)化為銷量;
- 38、50008168從銷售總量以及品類來看,都有提高銷量的潛力,可以增加引入二級分類商品;
- 28大類中滯銷商品類別過多,又是一級分類銷量最高,在商品曝光引流機(jī)會(huì)多的情況依舊滯銷,建議減少28大類中滯銷的商品種類,節(jié)省營銷成本;
- 28大類在第二季度可以啟動(dòng)品類營銷活動(dòng),聯(lián)動(dòng)每年5月的銷售高峰,增加引流曝光度來提高銷量;
- 銷量最差的122680008及50022520應(yīng)引入市場上該分類下的爆品,對新商品做針對性的營銷活動(dòng),增加流量;
- 調(diào)查及分析二級分類50018831下的產(chǎn)品特性,分析是哪個(gè)環(huán)節(jié)幫助這類產(chǎn)品加強(qiáng)了平臺(tái)活動(dòng)效果。122680008及50022520大類的銷量墊底,推斷可能是曝光不足導(dǎo)致活動(dòng)效果不明顯,可以借鑒50018831,優(yōu)化這兩個(gè)大類的活動(dòng)。
平臺(tái)維度建議:
- 大型平臺(tái)活動(dòng)(雙十一)對銷量提升很快,每年5月也是銷量高峰,需要提前預(yù)熱活動(dòng),預(yù)估往年銷量聯(lián)動(dòng)商家進(jìn)行采購囤貨,避免出現(xiàn)無貨可賣的情況;
- 母嬰商品在年中的第三季度銷售較為平穩(wěn),可以啟動(dòng)新的平臺(tái)活動(dòng);
- 優(yōu)化信息收集的流程,增加有兒童信息的用戶數(shù),一是可以幫助后續(xù)了解客戶購買行為,二是借助這個(gè)流程(送券、積分等方式)可以提高用戶活躍度,提升復(fù)購率;
- 對不同階段的老用戶進(jìn)行精準(zhǔn)營銷活動(dòng)的推送,例如從嬰兒期進(jìn)入幼童階段的用戶,推送5008168的商品活動(dòng),及時(shí)對接用戶該階段需求,提高復(fù)購率;
六、商業(yè)分析報(bào)告
關(guān)鍵詞:數(shù)據(jù),分析,深入