分析報告 | 關(guān)于母嬰電商問題的分析報告
時間:2023-03-26 02:12:01 | 來源:電子商務(wù)
時間:2023-03-26 02:12:01 來源:電子商務(wù)
一、分析背景與目的
1.背景:1.1母嬰電商市場
母嬰電商市場是指線上零售媽媽用品和嬰幼兒用品。主要涵蓋奶粉、營養(yǎng)輔食、尿褲濕巾、喂養(yǎng)用品、洗護用品、童車童床、安全座椅、玩具書籍、童裝童鞋和服飾寢具等類別。
近幾年來,中國母嬰電商市場交易規(guī)??焖僭鲩L,線上交易滲透率走高,其中2011~2015年交易規(guī)模增長率達到一個高峰,之后便緩慢穩(wěn)定地增長。
來源:艾瑞檢測數(shù)據(jù)以及艾瑞統(tǒng)計模型推算下面用PEST分析方法來分析母嬰電商企業(yè)的宏觀環(huán)境:
PEST分析方法1.2本項目采用的數(shù)據(jù)集
數(shù)據(jù)獲取來源:阿里巴巴天池
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45數(shù)據(jù)來自淘寶和天貓上購買嬰兒用戶,本數(shù)據(jù)集包括2個表格文件:
2.目的提高母嬰電商店鋪的成交數(shù)量
二、分析思路與過程
1.分析思路本項目從用戶和產(chǎn)品兩個角度展開分析,分析思路概覽:
2.分析內(nèi)容2.1提出問題- 不同年齡段對總購買數(shù)量有什么影響?
- 不同性別青睞哪類一級商品?
- 哪些客戶是忠誠客戶?
- TOP N熱銷/滯銷的二級商品是什么?
- 近幾年的成交數(shù)量趨勢如何?
- 哪些二級商品使用戶的高頻需求?
2.2理解數(shù)據(jù)【表1】購買商品.csv 共7個字段,29971個記錄
表1字段描述【表2】嬰兒信息.csv 共3個字段,953個記錄
表2字段描述2.3數(shù)據(jù)清洗1)選擇子集隱藏不用的列名property
2)列名重命名將day名字修改為buy_day,以便和birthday區(qū)分并體現(xiàn)字段的含義為“購買日期”
3)刪除重復(fù)值4)缺失值處理通過檢查每列的記錄數(shù),得知表1、表2都沒有缺失值
5)一致化處理由于后面要對嬰幼兒的年齡進行計算和篩選,所以需要提前對birthday和buy_day字段進行格式轉(zhuǎn)換,轉(zhuǎn)換為日期格式:
TEXT()函數(shù)6)數(shù)據(jù)排序7)異常值處理目前對所有字段檢查之后沒有發(fā)現(xiàn)異常值,但數(shù)據(jù)分析部分可能會產(chǎn)生異常值。
異常值處理方法2.4數(shù)據(jù)分析1)明確問題2)分析<用戶角度>問題1:不同年齡段對總購買數(shù)量有什么影響?首先,將年齡段拆解為三維;
其次,在表2用VLOOKUP匹配表1的buy_mount,剔除未知年齡的記錄。不同年齡段的成交數(shù)量用柱形圖表現(xiàn)為:
對比分析思路:
結(jié)論:
1)0~3歲的嬰幼兒的成交數(shù)量最多
2)總成交數(shù)量隨年齡的增長而減少
問題2:不同性別青睞哪類一級商品?首先,將性別拆解為男、女二維,再分別對男、女按一級商品成交數(shù)量拆解;
在表2用VLOOKUP匹配表1的cat1,剔除未知性別2的記錄,分別對0(女)、1(男)的一級商品成交數(shù)量展開比較,分別篩選出成交數(shù)量大于20和10的記錄,用條形圖表現(xiàn):
結(jié)論:
1)女孩用戶青睞ID為50018831的一級商品
2)男孩用戶青睞ID為50013636的一級商品
問題3:哪些客戶是忠誠客戶?首先,篩選出復(fù)購過的客戶:在user_id中突出重復(fù)單元格的條件格式并篩選重復(fù)記錄;
其次,將忠誠客戶拆解為購買次數(shù)、成交數(shù)量這二維;
最后,復(fù)購用戶的購買次數(shù)和成交數(shù)量用不等寬柱形圖表現(xiàn)為:
結(jié)論:
1)按復(fù)購且成交數(shù)量的標準,最忠誠的客戶ID為890739828
2)按復(fù)購次數(shù)的標準,最忠誠的客戶ID為814316568
<產(chǎn)品角度>問題4:TOP N熱銷/滯銷的二級商品是什么?首先,創(chuàng)建數(shù)據(jù)透視表,以cat_id(二級商品ID)為行,求和:buy_mount(成交數(shù)量);
其次,以成交數(shù)量為依據(jù),分別降序和升序排序。降序之后篩選成交數(shù)量大于1000的記錄,則二級商品的成交數(shù)量可用條形圖表現(xiàn)為:
升序排序后得到的TOP1滯銷商品有83個。由于滯銷商品較多,這里就不一一列舉。
結(jié)論:
1)TOP 3熱銷的二級商品ID為50018831、50011993、50012788
2)TOP1滯銷商品有83個
問題5:近幾年的成交數(shù)量趨勢如何?首先,將年份拆解為2012、2013、2014、2015這四維;
其次,分別將成交數(shù)量“按年份分布”和“對各年份按月分布”用圖表可視化為:
由于2015年只有2個月份,這里剔除對2015年的分析
結(jié)論:
1)近幾年成交數(shù)量整體呈上升趨勢,但2014年第一季度稍有大幅下降
2)2014年第四季度環(huán)比其他任何季度的成交數(shù)量漲幅最大
結(jié)論:
3)2012年和2014年的最大成交數(shù)量在11月,2013年最大成交數(shù)量在12月
4)2014年11月的成交數(shù)量同比前兩年暴漲
結(jié)論2有兩個含義:
一是2014年第四季度成交量同比其他年份第四季度大增,二是環(huán)比當(dāng)年11月份前的成交數(shù)量大增。容易推出:前者是結(jié)論4的影響,后文將對此詳細分析;后者猜測是雙十一大促活動的影響,采用假設(shè)檢驗法進行分析。
提出假設(shè):2014年第四季度成交數(shù)量環(huán)比前期大增是因為雙十一大促活動
收集證據(jù):2014年11月每天的成交數(shù)量
上圖表明:2014年11月11號附近的成交數(shù)量出現(xiàn)暴漲,符合雙十一大促活動導(dǎo)致成交數(shù)量大增的假設(shè)。
結(jié)論:成立
除此之外根據(jù)其他三個結(jié)論發(fā)現(xiàn)以下3個新問題:
- 為什么2014年11月的成交數(shù)量同比前兩年暴漲?
- 在其他年份成交數(shù)量下降的情況下,為什么2013年12月成交數(shù)量還能增長?
- 為什么2014年第一季度成交數(shù)量稍有大幅下降?
由于這些問題都是圍繞成交數(shù)量展開的,可以將成交數(shù)量拆解為購買次數(shù)和單次購買數(shù)量這兩個維度,采用假設(shè)檢驗法進行分析。1)對成交數(shù)量及其分布變化的原因進行假設(shè)檢驗分析本文中的“變化”默認是環(huán)比變化
- 分析成交數(shù)量同比變化與購買次數(shù)同比變化的關(guān)系(同比)
上圖表明:各年份購買次數(shù)分布情況基本一致
結(jié)論:成交數(shù)量的同比變化與購買次數(shù)的變化基本沒有關(guān)系
- 分析成交數(shù)量同比變化與單次平均購買數(shù)量同比變化的關(guān)系(同比)
由于
成交數(shù)量=購買次數(shù)*單次購買數(shù)量,而上文已分析得出了各年份成交數(shù)量的分布和購買次數(shù)的變化基本沒有關(guān)系,可以直接推導(dǎo)出以下結(jié)論:
結(jié)論:成交數(shù)量同比變化與單次平均購買數(shù)量同比變化具有相關(guān)關(guān)系
- 分析購買次數(shù)和總購買量的相關(guān)關(guān)系(環(huán)比)
散點圖相關(guān)關(guān)系上圖表明:隨著購買次數(shù)的增加,成交數(shù)量也增加,二者的相關(guān)系數(shù)為0.72
結(jié)論:成交數(shù)量的變化與購買次數(shù)的變化有高度正相關(guān)關(guān)系
- 分析單次平均購買數(shù)量和成交數(shù)量的相關(guān)關(guān)系(環(huán)比)
散點圖相關(guān)系數(shù)上圖表明:隨著單次平均購買數(shù)量增加,成交數(shù)量也增加,二者的相關(guān)系數(shù)為0.88
結(jié)論:成交數(shù)量的變化與單次平均購買數(shù)量的變化有高度正相關(guān)關(guān)系
以上的分析思路為:
2)根據(jù)假設(shè)檢驗分析的結(jié)果對3個新問題分析原因- 為什么2014年11月的成交數(shù)量同比前兩年暴漲?(同比)
成交數(shù)量的分布只和單次購買數(shù)量有關(guān),因此直接分析各年份每月單次購買數(shù)量的變化:
上圖表明:近三年來,每月單次平均購買數(shù)量在1.45~4.03之間波動,但2014年11月單次平均購買數(shù)量同比暴漲至7.12,直接導(dǎo)致了其成交總量相對其他年份的巨大增幅。
結(jié)論:單次購買數(shù)量的同比急劇增大,直接導(dǎo)致了成交數(shù)量的同比暴漲。而一般單次購買數(shù)量的增大,跟促銷活動有很大的關(guān)系,但由于信息有限,沒有近幾年的促銷活動信息,其根本原因暫不深究。
- 在其他年份成交數(shù)量下降的情況下,為什么2013年12月成交數(shù)量還能增長?(環(huán)比)
成交數(shù)量的變化和單次購買數(shù)量、購買次數(shù)都有關(guān),因此需要對它們分別進行分析。
每月單次平均購買數(shù)量變化情況:上圖表明:2012年和2014年12月的單次平均購買數(shù)量呈下跌趨勢,而2013年12月的單次平均購買數(shù)量上升了1.83。
每月購買次數(shù)變化情況:上圖表明:每年12月的購買次數(shù)都下跌,而2013年12月的下跌較少。
綜合以上對兩個指標的分析,可以得出結(jié)論:2013年12月成交數(shù)量上升的原因主要是單次平均購買數(shù)量增加了。而一般單次購買數(shù)量的增大,跟促銷活動有很大的關(guān)系,但由于信息有限,沒有近幾年的促銷活動信息,其根本原因暫不深究。
- 為什么2014年第一季度成交數(shù)量稍有大幅下降?(環(huán)比)
每季度單次平均購買數(shù)量變化情況:上圖表明:單次平均購買數(shù)量基本呈現(xiàn)上升趨勢,只有2012年第二季度和2014年第一季度下跌,且2014年第一季度的單次平均購買數(shù)量是近年來最低,相比上一季度的跌幅最大。
每季度購買次數(shù)變化情況:上圖表明:購買次數(shù)呈震蕩向上的趨勢,其中2014年第一季度下跌幅度最大。
綜合以上對兩個指標的分析,可以得出結(jié)論:2014年第一季度成交數(shù)量稍有大幅下降是因為用戶的單次購買數(shù)量和購買次數(shù)同時發(fā)生了大幅下降。單次購買數(shù)量和購買次數(shù)的下降與很多因素有關(guān),由于信息有限,其根本原因暫不深究。
問題6:哪些二級商品是用戶的高頻需求?首先,篩選出復(fù)購的人數(shù)(購買2次任何商品的人數(shù))及其對應(yīng)的訂單信息,并復(fù)制到新的工作表“復(fù)購商品”中;
其次,在工作表“復(fù)購商品”中創(chuàng)建數(shù)據(jù)透視表,字段設(shè)置如下:
數(shù)據(jù)透視表字段設(shè)置再次,找到同一商品購買次數(shù)>1的商品ID
由上圖可得:同一商品復(fù)購的人數(shù)都為1
最后,可推算出:
付費人數(shù)=總記錄數(shù)(29971)-復(fù)購人數(shù)(1)=29970
復(fù)購率=同一商品復(fù)購的人數(shù)/付費人數(shù)=1/29970*100%=0.003337%
綜合以上,在該數(shù)據(jù)集中,所有被復(fù)購的商品的復(fù)購率都是0.003337%,屬于小概率事件,不構(gòu)成統(tǒng)計學(xué)意義,因此對此不作討論。
3)決策本項目的北極星指標是成交數(shù)量,通過上述分析知曉:
- 成交數(shù)量同比發(fā)生變化是因為單次購買數(shù)量同比發(fā)生變化
- 成交數(shù)量的變化是因為購買次數(shù)或單次購買數(shù)量發(fā)生變化
接下來用回歸分析方法來探究其
影響程度如何。
- 單次購買數(shù)量的變化對各年份間成交數(shù)量的分布的影響程度
首先,創(chuàng)建一個輔助表:
其次,用散點圖表現(xiàn)其相關(guān)關(guān)系,添加趨勢線并顯示公式
上圖顯示,成交數(shù)量同比變化y與單次平均購買數(shù)量同比變化x的回歸方程為:y = 1378x + 989.77,即當(dāng)單次購買數(shù)量同比增長1的時候,成交數(shù)量就同比增長1378。
結(jié)論:當(dāng)成交數(shù)量同比下跌或者沒有達到期望值的時候,可以先給成交數(shù)量制定一個可行性標準值,通過y = 1378x + 989.77回歸方程推算出相對應(yīng)的單次購買數(shù)量目標,再制定計劃使單次購買數(shù)量達到目標。
決策:當(dāng)成交數(shù)量同比下跌或者沒有達到期望值的時候,使用以下措施使單次購買數(shù)量達到目標:
1)買二送一或者第二件半價
2)買滿500-50或者贈送小禮品
- 單次購買數(shù)量的變化對成交數(shù)量的影響程度
上圖顯示,成交數(shù)量y與單次平均購買數(shù)量x的回歸方程為:y = 1725.5x - 1675.2,即當(dāng)
單次購買數(shù)量增長1的時候,成交數(shù)量就增長1725.5。
結(jié)論:當(dāng)成交數(shù)量下跌或者沒有達到期望值的時候,可以先給成交數(shù)量制定一個可行性標準值,通過y = 1725.5x - 1675.2回歸方程推算出相對應(yīng)的單次購買數(shù)量目標,再制定計劃使單次購買數(shù)量達到目標。
決策:當(dāng)成交數(shù)量下跌或者沒有達到期望值的時候,使用以下措施使單次購買數(shù)量達到目標:
1)買二送一或者第二件半價
2)買滿500-50或者贈送小禮品
- 購買次數(shù)的變化對成交數(shù)量的影響程度
上圖顯示,成交數(shù)量y與購買次數(shù)x的回歸方程為:y = 4.4968x - 1853.4,即當(dāng)購買次數(shù)增長1的時候,成交數(shù)量就增長4.4968。
結(jié)論:當(dāng)成交數(shù)量下跌或者沒有達到期望值的時候,可以先給成交數(shù)量制定一個可行性標準值,通過y = 4.4968x - 1853.4回歸方程推算出相對應(yīng)的購買次數(shù)目標,再制定計劃使購買次數(shù)達到目標。
決策:當(dāng)成交數(shù)量下跌或者沒有達到期望值的時候,使用以下措施使購買次數(shù)達到目標:
1)組織團購優(yōu)惠活動
2)定期拜訪老客戶,優(yōu)化售后服務(wù)
3)有償讓老客戶帶來新客戶
另外,當(dāng)成交數(shù)量下跌或者沒有達到期望值的時候,
如果企業(yè)資源有限,可以計算出各個方案的成本,根據(jù)每一單位成本對單次購買數(shù)量和購買次數(shù)的影響,結(jié)合回歸方程,來抉擇采用哪一種方案。三、分析結(jié)論與建議
根據(jù)以上分析,將問題的結(jié)論總結(jié)如下:
結(jié)論總結(jié)針對本項目的數(shù)據(jù)分析結(jié)果以及分析目的,我提出以下幾點建議:
<用戶角度>
1.加大對0~3歲嬰幼兒用戶的家長的產(chǎn)品宣傳力度,將高年齡段產(chǎn)品搭配嬰幼兒產(chǎn)品促銷;
2.分別對女孩、男孩用戶加大宣傳和促銷50018831、50013636這兩種產(chǎn)品;
3.邀請890739828和814316568加入會員,定期短信拜訪、贈送小禮物等。
<產(chǎn)品角度>
1.加大宣傳和促銷50018831、50011993、50012788的二級商品,分析其推廣渠道并借鑒;
2.對大量滯銷的產(chǎn)品做好庫存管理,向產(chǎn)品部門和客服部門咨詢產(chǎn)品信息,并做相應(yīng)的優(yōu)化;
3.當(dāng)成交數(shù)量下跌或者沒有達到期望值的時候:
1)使用以下措施使購買次數(shù)達到目標(環(huán)比)
- 組織團購優(yōu)惠活動
- 定期拜訪老客戶,優(yōu)化售后服務(wù)
- 有償讓老客戶帶來新客戶
2)使用以下措施使單次購買數(shù)量達到目標(同比+環(huán)比)
- 買二送一或者第二件半價
- 買滿500-50或者贈送小禮品
分析報告的PPT版本