淘寶電商數(shù)據(jù)分析:1套真實(shí)+完整的案例分析流程
時(shí)間:2023-03-15 23:44:01 | 來源:電子商務(wù)
時(shí)間:2023-03-15 23:44:01 來源:電子商務(wù)
該數(shù)據(jù)分析借鑒的的背景數(shù)據(jù)來源于天池?cái)?shù)據(jù)集,為2012年7月2日至2015年2月5日發(fā)生在淘寶天貓交易平臺關(guān)于嬰幼兒商品的交易數(shù)據(jù)。其中包括兩個(gè)表格,截圖如下:
涵括的字段有
用戶ID,交易編號,商品種類ID,商品類別,購買數(shù)量,購買日期,以及用戶人為提供的個(gè)人信息如嬰兒出生日期以及性別。字段含義解讀如下:
- 用戶ID:以電商行業(yè)的購買數(shù)據(jù)為例,用戶ID是電商平臺識別該購買者的唯一信息。從用戶ID可以得到其他信息包括注冊信息,購物歷史記錄,購物喜好等。
- 購買行為編號:我理解為交易號,通過這個(gè)號碼可以查詢到購買的具體事物,數(shù)量,購買行為產(chǎn)生日期,購買者或者需求者的位置。
- 商品種類ID:該電商平臺繼而又把每個(gè)類別下的產(chǎn)品細(xì)分了種類,即被購買產(chǎn)品屬于該電商平臺規(guī)定的某個(gè)類別的某個(gè)種類下面,并賦予每個(gè)種類一個(gè)ID.
- 商品類別:該電商平臺把產(chǎn)品分成了很多個(gè)種類。
- 商品屬性:即產(chǎn)品的詳細(xì)情況
- 購買數(shù)量和購買時(shí)間即是字面意思
- 出生日期:記錄的是該用戶注冊時(shí)填寫的自己或者需求者的嬰兒的出生日期
- 性別:即字面意思
分析目的該分析旨在通過以往的數(shù)據(jù)總結(jié)以前的
銷售表現(xiàn),找出需要
改變及改善的地方,針對性采取有效措施以達(dá)到
提升營業(yè)額的效果。
提出問題- 2015年的銷售下跌
- 第三,四季度銷量上漲的原因
- 性別對銷量的影響
- 年齡與銷量的關(guān)系
分析思路分析問題由于整個(gè)分析過程都涉及到銷量,所以在開始分析之前首先
對購買量進(jìn)行數(shù)據(jù)清洗。篩選購買量這一列可以發(fā)現(xiàn),數(shù)據(jù)區(qū)間跨度非常大,對其作描述性統(tǒng)計(jì)發(fā)現(xiàn),購買量的平均值不到3,標(biāo)準(zhǔn)差為65左右。
剔除與平均值的偏差超過三倍標(biāo)準(zhǔn)差的
高度異常值,即大于199.64的數(shù)值都需要剔除。因?yàn)樯唐返膯挝徊豢赡転樾?shù),所以實(shí)際應(yīng)剔除大于199的值。
1. 2015年的銷量下跌分析流程是這樣的:
對購買量進(jìn)行多維度拆解:
購買量=新用戶購買量+老用戶購買量新用戶為首次出現(xiàn),以前沒有過購買行為的用戶id,老用戶為以前有過購買行為(重復(fù)的)的用戶id。
通過查找重復(fù)值得知老用戶為27個(gè),占比為27/28396=0.93%,不到1%。換句話說,總購買量幾乎全是由占比大于99%的新用戶造成的,因此在這里我們忽略老用戶的購買量。而且,從以往的銷量折線圖可以看出,2015年數(shù)據(jù)下跌是因?yàn)閿?shù)據(jù)集里關(guān)于這一年的數(shù)據(jù)不全,只有1月和2月的數(shù)據(jù)。
假設(shè)在這一年里頭兩個(gè)月銷量下跌,找出2015年的銷售數(shù)據(jù),
同比歷年的數(shù)據(jù),來判斷是否假設(shè)是對的。由于2012年缺乏上半年的數(shù)據(jù),因此我們只能對比2013,2014和2015年銷量。從圖中可以看出,2015年1月銷量大幅高于2013和2014年,2月銷量低于前兩年,但總和并不少于前兩年。所以依據(jù)當(dāng)前的數(shù)據(jù)不能證明2015年銷量下跌,假設(shè)不成立。
2. 第三,四季度銷量上漲的原因分析流程如下:
假設(shè)下半年銷量上漲是因?yàn)樗蓄悇e銷量上漲。我們
提取各個(gè)季度各商品類別的銷量數(shù)據(jù),得到下圖。
從上圖可以看出,第一二季度銷量基本持平,第三季度的銷量主要是由類別5008168,和28帶來的,其他類別沒有明顯變化。第四季度銷量主要是由類別50014815,28帶來的,其他類別差別不大。所以可以說
季度銷量的上升是由于某個(gè)季度某些商品類別的銷量上漲導(dǎo)致的。再來深究為什么第三季度和第四季度的銷量主要貢獻(xiàn)者類別5008168和50014815會在下半年出現(xiàn)大幅度增長。
首先從類別5008168開始。搜集第三季度銷量數(shù)據(jù)可以得到下圖。
從圖中可以看到,7-9月期間大部分時(shí)間銷量都是比較平穩(wěn),唯獨(dú)9月20日這天該產(chǎn)品的銷量達(dá)到了2815。進(jìn)一步搜集數(shù)據(jù)發(fā)現(xiàn),是因?yàn)樵?014年該產(chǎn)品的銷量遠(yuǎn)遠(yuǎn)大于2012和2013年。
找出2014年9月該產(chǎn)品的銷售數(shù)據(jù),得到如下圖。
上圖告訴我們,在2014年9月20號當(dāng)天,508168的銷量達(dá)到了2779。
由于當(dāng)年當(dāng)月的節(jié)日如中秋節(jié)在9月8號,教師節(jié)在9月10號,產(chǎn)生熱銷的原因沒辦法證實(shí)。但可以揣測是因?yàn)樯碳覍υ擃惍a(chǎn)品做了
促銷活動導(dǎo)致的銷量上漲,從而導(dǎo)致第三季度銷量上升。
再來看類別50014815。
它在第四季度的11月份有一個(gè)顯著的增長高峰。
數(shù)據(jù)告訴我們,它的增長主要來源于2014年11月13日的銷量高峰,達(dá)到10029. 下面是該產(chǎn)品歷年的11月銷量圖。
上面三個(gè)圖我們可以看出,
歷年來11月的銷售高峰并沒有出現(xiàn)在雙十一當(dāng)天,而是2012年的11月10號,2013年的11月30號,2014年的11月13號。雖然2013年雙十一那天出現(xiàn)了銷量小高峰,但影響效果并不大。在其他日子出現(xiàn)銷量大幅上漲,猜測是由于商家進(jìn)行了
其他促銷活動,但缺乏數(shù)據(jù)支撐。
3. 性別對銷量的影響分析流程如下:
表1用If函數(shù)計(jì)算出成交單量,對表2用vlookup函數(shù)關(guān)聯(lián)表1的購買日期,購買數(shù)量,商品大類,成交單量。清洗數(shù)據(jù)集并統(tǒng)計(jì)有效數(shù)據(jù)后發(fā)現(xiàn)用戶里有406個(gè)女童,444個(gè)男童。所以男童用戶比女童用戶多。
從上圖得知,男女的購買比例為
62%:38%。
顯然男女用戶的比例不足以造成如此懸殊的銷量比例。
將購買量多維度拆解,可以得到:
總購買量=成交單量*每單購買量假設(shè)是因?yàn)槟型某山粏瘟吭斐傻摹?br>
男女用戶比例跟成交單量比例是一樣的,所以男童的購買量大于女童購買量可以說完全是因?yàn)槟型拿繂钨徺I量大于女童的每單購買量導(dǎo)致的。
那又是什么年齡段的男童的每單購買量比較大呢?可以看出,5歲以后的男童基本不再產(chǎn)生購買行為。主要買家為1歲以前的男童家長。
4. 年齡與銷量的關(guān)系購買量=各個(gè)商品類別的購買量之和由上圖可以看出,所有的類別的購買量隨著年齡的增加都在下降。類別50022520從一開始就一直在下降,剩下的其他產(chǎn)品類別的趨勢是先上升,幅度或大或小,然后再都下降。仔細(xì)看來,類別,50014815,50008168和28的銷量高峰都產(chǎn)生在年齡為0歲,類別122650008和38的銷量高峰產(chǎn)生在年齡為1歲的時(shí)候。
因此可以說1歲以后所有類別銷量都在下降,可以猜測這些商品類別應(yīng)該是適用低齡幼兒的產(chǎn)品。但不同年齡的銷量高峰對應(yīng)的
產(chǎn)品類別不同,又說明這些產(chǎn)品的
受眾不同,應(yīng)該采取
分年齡營銷策略。結(jié)論1. 依照現(xiàn)有數(shù)據(jù)2015年1,2月的銷量相比往年沒有下跌,反而比往年這兩個(gè)月銷量總和多。
2. 第三,四季度的銷量相比于第一,二季度上升是因?yàn)?b>個(gè)別商品類別購買量上漲導(dǎo)致,第三季度的增長主要是由類別5008168帶來的,第四季度銷量主要是由類別50014815帶來的。而5008168的增長是由于在2014年9月20號當(dāng)天,該類別的銷量達(dá)到了2779;50014815的增長是因?yàn)?014年11月13日的銷量高峰達(dá)到了10029,兩者都發(fā)生在2014年。雙十一購物節(jié)確實(shí)對刺激某些商品類別的銷量有積極影響,但
影響力度有限,有時(shí)候不及其他促銷活動有效果。
3. 在銷量上,男童大于女童,原因是男童用戶的每單購買量大于女童用戶的每單購買量。5歲以后的男童基本不再產(chǎn)生購買行為,主要買家為1歲以前的男童家長。
4. 對于1歲以上用戶,所有產(chǎn)品的吸引力都在下降。但每個(gè)品類最大受眾的年齡段不同,主要集中在0歲和1歲嬰幼兒。
建議- 優(yōu)化影響單量的各個(gè)因素,如可以從產(chǎn)品,客戶服務(wù),退貨款政策,廣告等方面著手,在2014年的基礎(chǔ)上進(jìn)一步壯大用戶基數(shù),提高留存與復(fù)購率。
- 在下半年將不暢銷產(chǎn)品類別與暢銷品類捆綁銷售,或者做加購活動,以帶動整體銷量。
- 調(diào)整產(chǎn)品范圍,縮減適用于5歲后孩子的產(chǎn)品,集中供應(yīng)這個(gè)年齡前的嬰幼兒產(chǎn)品。尤其是要豐富1歲前孩子適用的嬰幼兒產(chǎn)品,特別是男童,給顧客創(chuàng)造更多消費(fèi)的機(jī)會。
- 升級改善1歲到5歲孩子適用的產(chǎn)品,可以從提升質(zhì)量,捆綁營銷,買贈等方面刺激銷量。
- 采取分年齡營銷策略,讓每個(gè)品類精準(zhǔn)輻射到對應(yīng)的人群。
End.
作者:會蹬腿的小豆子
來源:本站
本文為轉(zhuǎn)載分享,如侵權(quán)請聯(lián)系后臺刪除
私信領(lǐng)取【天池?cái)?shù)據(jù)+免費(fèi)直播】?。。?
關(guān)鍵詞:分析,完整,流程,真實(shí),數(shù)據(jù)