天貓/淘寶母嬰電商數(shù)據(jù)分析
時間:2023-03-26 07:00:01 | 來源:電子商務(wù)
時間:2023-03-26 07:00:01 來源:電子商務(wù)
1 原始數(shù)據(jù)概覽
1.1 數(shù)據(jù)集介紹
本文用以分析的數(shù)據(jù)主要是來自淘寶和天貓上購買嬰兒用戶,數(shù)據(jù)集包括2個excel文件,分別為表1購買商品、表2嬰兒信息,兩表通過用戶ID字段進(jìn)行聯(lián)結(jié)。
數(shù)據(jù)集來源:阿里巴巴天池
1.2 字段概況
user_id(用戶id)、auction_id(購買行為編號)、cat_id(商品種類ID)、cat1(商品二級分類)、property(商品屬性)、buy_mount(購買數(shù)量)、day(購買時間)
user_id(用戶id)、birthday(出生日期)、gender(性別(0 男性;1 女性))
2 數(shù)據(jù)清洗與處理
2.1數(shù)據(jù)規(guī)范化處理
- 嬰兒信息表-性別字段,男性記為0,女性記為1;但數(shù)據(jù)表中存在部分值為2情況,這些記錄均屬于異常值,無實(shí)際意義,因而將其刪除;
2.2根據(jù)分析所需,進(jìn)行相應(yīng)字段的處理與創(chuàng)建
此處所指年齡指在購買商品時該嬰兒的年齡,計(jì)算嬰兒交易發(fā)生時年齡的邏輯是用商品購買下單時的時間減去嬰兒的生日。
為進(jìn)行計(jì)算,首先需要利用vlookup函數(shù),將嬰兒信息表中的相關(guān)字段(嬰兒生日與嬰兒性別)匹配至購買商品表,在此過程中,利用用戶ID字段作為匹配項(xiàng),經(jīng)過匹配,29972條數(shù)據(jù)僅有931條得到匹配數(shù)據(jù),這表明其他顧客在購買時未能采集到顧客的相關(guān)信息。
其后,由于原始數(shù)據(jù)中購買時間與嬰兒生日不是標(biāo)準(zhǔn)的時間格式,這里通過excel-數(shù)據(jù)-分列中相關(guān)功能將這兩列數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)時間格式數(shù)據(jù)。
第三步,用購買時間減去嬰兒生日,得出在交易發(fā)生時,該嬰兒的年齡。
第四步,將匹配到嬰兒生日的九百余條數(shù)據(jù),另外建表,表名為
嬰兒信息表??偙砼c之區(qū)分,稱為
銷售匯總表。
以下操作僅對嬰兒信息表進(jìn)行。觀察年齡列分布,發(fā)現(xiàn)存在異常值,箱線圖如下所示(SPSS):
為排除異常值,利用異常值判定公式,計(jì)算臨界值,排除年齡值在(-4.5~7.5)之外的數(shù)值。這里k取1.5。
最后,觀察銷售數(shù)量數(shù)據(jù),發(fā)現(xiàn)一條銷量為10000,經(jīng)過與其他數(shù)據(jù)對比,發(fā)現(xiàn)明顯異常。處于對后續(xù)數(shù)據(jù)分析準(zhǔn)確性考慮,這里提出異常值所在記錄,防止因?yàn)閭€別極端值對后續(xù)數(shù)據(jù)分析整體造成誤導(dǎo)。
3 數(shù)據(jù)分析
3.1分析框架與思路
本文分析將按照以上框架,分別從產(chǎn)品與用戶兩個角度進(jìn)行。
分析目的在于了解現(xiàn)有母嬰產(chǎn)品銷售狀況,對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)探索,發(fā)現(xiàn)其中存在的業(yè)務(wù)問題,分析其原因,為未來業(yè)務(wù)推進(jìn)提供指引,最終實(shí)現(xiàn)銷售總額的提升。該模塊使用的分析方法包含對比分析法、多維度拆解方法及假設(shè)檢驗(yàn)分析方法等。
這里分析核心目標(biāo)為提升銷售總額,根據(jù)銷售總額公式對指標(biāo)進(jìn)行分拆如下:
將銷售總額拆分為訪客數(shù)、轉(zhuǎn)化率、客單價、購買頻率四個細(xì)化指標(biāo)之積,想要實(shí)現(xiàn)銷售總額的增長,最理想的狀況是以上四個細(xì)分指標(biāo)均上升。根據(jù)現(xiàn)有數(shù)據(jù)及指標(biāo)現(xiàn)實(shí)含義,本模塊分析將按照以下幾個部分進(jìn)行:
①銷售數(shù)量從指標(biāo)含義來看,訪客數(shù)與轉(zhuǎn)化率之積為購買數(shù)量,加之原始數(shù)據(jù)僅有購買數(shù)量字段,并無訪客數(shù)及轉(zhuǎn)化率數(shù)據(jù),因此,第一部分將從指標(biāo)“銷售數(shù)量”著手進(jìn)行進(jìn)一步數(shù)據(jù)分析;
②客單價由于現(xiàn)有數(shù)據(jù)集缺乏商品價格及相關(guān)字段,因此無法通過計(jì)算得出顧客客單價,因此,本文暫不對店鋪客單價狀況做進(jìn)一步分析解讀;
③購買頻率/復(fù)購率最后一部分是用戶的購買頻率,該指標(biāo)可以通過現(xiàn)有數(shù)據(jù)得出,此外,此處也可引入復(fù)購率這一指標(biāo)進(jìn)行補(bǔ)充分析,了解店鋪留客狀況;
分析目的在于了解不同性別及不同年齡用戶對母嬰產(chǎn)品的偏好情況,此處主要采用對比分析的方法。只有了解細(xì)分群體用戶需求的差異,才能使得未來的銷售工作更有針對性,更加精準(zhǔn),從而提升店鋪轉(zhuǎn)化率,擴(kuò)大營收。
3.2 產(chǎn)品角度該模塊分析不涉及嬰兒信息,因此使用
銷售匯總表數(shù)據(jù)進(jìn)行分析。
3.2.1 銷售數(shù)量
3.2.1.1 思路1:從年度銷售數(shù)量探索
利用數(shù)據(jù)透視表,得到按年度計(jì)銷售數(shù)量,并做折線圖,如下所示
根據(jù)以上折線圖,可以看到2012年及2015年兩年銷售數(shù)量較其他年份數(shù)據(jù)低很多,存在異常情況,因而需對這一異?,F(xiàn)象進(jìn)行探索。
問題1:2012年及2015年銷售數(shù)額過低,存在異常。假設(shè)1:2012年以2015年部分?jǐn)?shù)據(jù)存在缺失導(dǎo)致整體數(shù)據(jù)呈現(xiàn)異常。
論證1:為驗(yàn)證假設(shè)1,對原始數(shù)據(jù)按月份進(jìn)行匯整處理。如下所示:
根據(jù)以上圖表顯示,原始數(shù)據(jù)中明顯缺失2012年1-6月及2015年3-12月的數(shù)據(jù),因而在上文年度銷量折線圖中2012年與2015年存在過低的問題,從而證明以上假設(shè)成立。
結(jié)論:假設(shè)成立。2012及2015年數(shù)據(jù)缺失導(dǎo)致銷量異常。問題2:2015年2月銷量數(shù)據(jù)低于前兩年2月份銷售數(shù)據(jù),不符常理。從按月分拆的銷售數(shù)量折線圖中能看出,除個別月份外,自2012年至2015年,每月銷售數(shù)量均呈現(xiàn)上升趨勢,符合對業(yè)務(wù)發(fā)展的基本認(rèn)知。但2015年2月銷量數(shù)據(jù)明顯過低,與業(yè)務(wù)發(fā)展趨勢背離。
假設(shè)2:2015年2月數(shù)據(jù)缺失,不完整。
論證2:為驗(yàn)證假設(shè)2,對2015年兩個月的原始數(shù)據(jù)按日進(jìn)行匯整處理。如下所示:
根據(jù)以上圖表顯示,原始數(shù)據(jù)中2015年2月的數(shù)據(jù)僅有1-5日,數(shù)據(jù)不完整,因而可證明以上假設(shè)2成立。
結(jié)論:假設(shè)成立。2015年2月數(shù)據(jù)缺失導(dǎo)致銷量異常。3.2.1.2 思路2:從月度銷售數(shù)據(jù)探索
利用數(shù)據(jù)透視表,得到按月度計(jì)銷售數(shù)量,并做折線圖,如下所示
從以上月度銷售數(shù)量折線圖中,可以看到
銷售量存在顯著的月度差異。2月、3月銷售數(shù)量都較低,均為三千左右;而1月、5月、7月至12月,銷售數(shù)量均較高,尤其是11月,銷售數(shù)量達(dá)到年度銷售峰值。以下將對這一現(xiàn)象進(jìn)行歸因分析。
問題3:11月銷售數(shù)量遠(yuǎn)高于其他月份。假設(shè)3.1:雙11電商促銷活動導(dǎo)致11月銷量大增。
論證3.1:為驗(yàn)證假設(shè)3,對11月銷售量數(shù)據(jù)按日拆解,繪制折線圖。如下所示:
以上圖表可得,銷量在11月11日當(dāng)天,出現(xiàn)大幅上漲,并達(dá)到當(dāng)月銷量峰值。基于雙十一當(dāng)天銷量數(shù)據(jù)出現(xiàn)顯著增長,可得出結(jié)論,
雙十一活動促進(jìn)了銷量的大幅增長。結(jié)論:假設(shè)成立。雙十一導(dǎo)致十一月銷量增長。假設(shè)3.2:十一月份數(shù)據(jù)出現(xiàn)暴增,可能是受到某年特殊情況影響。論證3.2:為證明以上假設(shè),首先將每年11月數(shù)據(jù)按年拆分,如下圖所示:
由上圖可知,2012年、2013年、2014年銷量均在11月10日或11日出現(xiàn)大幅上漲,尤其是2014年,雙十一當(dāng)日增幅較前兩年大幅提高。
結(jié)論:假設(shè)不成立。各年度雙十一母嬰產(chǎn)品銷量均大幅上漲,且隨著時間推移,增幅呈遞增態(tài)勢。;問題4:9月銷量出現(xiàn)較大幅度增長。假設(shè)4:中秋節(jié)促銷及淘寶9.12辣媽囤貨季活動,促進(jìn)銷量增長。論證4:為分析9月銷量增長原因,將9月銷售數(shù)據(jù)按天進(jìn)行分拆,如下圖所示:
上圖中可以看到,9月20日銷售數(shù)量遠(yuǎn)高于其他日銷量,由于當(dāng)天并非節(jié)假日及電商促銷時間,因而返回原始數(shù)據(jù)查看當(dāng)天銷售訂單,確認(rèn)是否存在極端值影響。根據(jù)原始數(shù)據(jù)所示,2014年9月20日,有一訂單銷售額為2748,由于其遠(yuǎn)遠(yuǎn)大于其他訂單銷售量,因此對數(shù)據(jù)分析有一定誤導(dǎo)。因此剔除該條記錄,重新進(jìn)行匯總分析。
首先查看各年中秋節(jié)銷量狀況。經(jīng)過核對2012年9月30日、2013年9月19日及2014年9月8日三日銷售數(shù)據(jù),發(fā)現(xiàn)當(dāng)日并未出現(xiàn)銷量增長。因而得出結(jié)論,并非是中秋節(jié)促銷相關(guān)原因?qū)е?月銷量增長。
其次,上圖中發(fā)現(xiàn)2013年及2014年9月12日,銷量均出現(xiàn)不同程度增長,尤其是2014年銷量增長極為顯著。從而驗(yàn)證了部分假設(shè),淘寶9.12辣媽囤貨季活動導(dǎo)致當(dāng)月銷量數(shù)據(jù)大幅提升。
結(jié)論4:假設(shè)部分正確。9月產(chǎn)品銷量增長來源于淘寶9.12辣媽囤貨季活動,中秋節(jié)促銷對當(dāng)月銷量無明顯影響。問題5:2月銷量出現(xiàn)大幅下跌。假設(shè)5:春節(jié)原因?qū)е?月銷量出現(xiàn)下跌。論證5:為證明以上假設(shè),首先將2月數(shù)據(jù)按年拆分,如下圖所示:
分析之前,經(jīng)過查詢2013年及2014年數(shù)據(jù),明確春節(jié)時間。
2013年春節(jié)假期為2月9日至2月15日,上圖中我們可以看到,2013年2日至2月15日,銷售量降至極低的水平,而2月16日,銷量出現(xiàn)回升。由此得出,2013年受春節(jié)假期影響,銷量大幅下降。
2014年春節(jié)假期為1月31日至2月6日,在圖表中可以看到這段時間產(chǎn)品銷量亦較低,而2月7日,銷量出現(xiàn)小幅回升。因此可得,與2013年相同,春節(jié)加期導(dǎo)致該月銷量下跌。
結(jié)論5:假設(shè)成立。受春節(jié)假期影響, 2月銷量出現(xiàn)大幅下跌。3.2.1 復(fù)購率
為分析店鋪復(fù)購率狀況,利用數(shù)據(jù)透視表得出復(fù)購客戶的數(shù)量,如下:
根據(jù)上表可得,該店鋪所有29943位顧客中,僅有25位顧客選擇進(jìn)行回購,
復(fù)購率為0.0835%,不到0.1%,復(fù)購率極低。復(fù)購率較低原因可能有很多。首先,在產(chǎn)品方面,店鋪產(chǎn)品質(zhì)量不佳、產(chǎn)品性質(zhì)因素等均會導(dǎo)致復(fù)購率低;其次,在店鋪服務(wù)方面,購買流程繁瑣、售后服務(wù)太差等原因也會導(dǎo)致顧客流失。
由于此處缺乏更多業(yè)務(wù)信息及統(tǒng)計(jì)數(shù)據(jù),此處不對復(fù)購率低的原因做進(jìn)一步深入分析。
3.3 用戶角度
由于該模塊分析需用到嬰兒性別及年齡數(shù)據(jù),本模塊分析使用
嬰兒信息表內(nèi)數(shù)據(jù)。該數(shù)據(jù)表內(nèi)共有914條銷售數(shù)據(jù)。
3.3.1 不同性別嬰兒產(chǎn)品偏好
3.3.1.1嬰兒性別分布
利用數(shù)據(jù)透視表,得出數(shù)據(jù)表中嬰兒男、女?dāng)?shù)量及其各自占比。
根據(jù)所得數(shù)據(jù),做餅狀圖。
結(jié)論:由以上數(shù)據(jù)可知,在淘寶及天貓平臺上產(chǎn)生交易嬰兒,男性所占比例略大于女性。3.3.1.2不同性別嬰兒產(chǎn)品偏好
根據(jù)數(shù)據(jù)透視表,得:(表中紅色底色部分表示同時出現(xiàn)在男、女嬰兒銷量top10榜單中得商品類別)。
以下就男、女嬰兒銷量top10商品類別進(jìn)行圖表呈現(xiàn):
結(jié)論:根據(jù)以上圖表,在男、女嬰兒銷量top10商品中,部分商品男女消費(fèi)無明顯差異,但也有商品呈現(xiàn)明顯得性別偏好。類別編號為50018831、50012456、50018825、211122、50013187、250822等的商品,從購買量來看,更受男性嬰兒歡迎;
而商品50010558、50019993、50012451、50007011的購買者中,女性占比明顯更高。
3.3.2 不同年齡嬰兒產(chǎn)品偏好3.3.2.1嬰兒年齡分布
利用數(shù)據(jù)透視表,得出數(shù)據(jù)表中嬰兒年齡分布狀況。
結(jié)論:由以上圖表可知,顧客嬰兒年齡主要集中于0-2歲,其他年齡段占比較少。3.3.2.2不同年齡嬰兒產(chǎn)品偏好
①年齡1:該年齡段嬰兒購買的商品主要集中于50018831,占年齡為1總銷量的39.2%。
②年齡0:該年齡段嬰兒購買的商品主要為50013187、50006602等,總體看,年齡段為0的嬰兒對很多種類商品都呈現(xiàn)出了一定數(shù)量的需求,整體數(shù)據(jù)比較分散。
③年齡2:該年齡段嬰兒購買的商品主要為50018825、50012456。
④年齡3:該年齡段嬰兒購買的商品主要為50013636、50018831。
⑤年齡4:該年齡段嬰兒購買的商品主要集中于211122。
⑥年齡-1:該年齡段嬰兒購買的商品主要為250822,其他商品購買量少。
⑦年齡5:該年齡段嬰兒購買的商品主要為50006602,其他商品購買量較少。
其他年齡段顧客數(shù)量過少,此處暫不進(jìn)行分析。4 結(jié)論與建議
①結(jié)論一:根據(jù)對過往銷售數(shù)據(jù)進(jìn)行分析,可以看到除春節(jié)停工外,大型節(jié)日及特定電商促銷日到來,會極大促進(jìn)產(chǎn)品銷量大幅上漲。
- 建議:抓住相關(guān)節(jié)日及平臺促銷活動時機(jī),推出促銷活動,利用節(jié)日優(yōu)惠政策吸引客流,提高當(dāng)日轉(zhuǎn)化。需注意的一點(diǎn)在于,需在活動前備足貨源,保證節(jié)后發(fā)貨。此外,由于春節(jié)期間銷量大幅下跌,因此需提前做好準(zhǔn)備,避免年中大量存貨,也可根據(jù)實(shí)際情況調(diào)整營銷力度。
②結(jié)論二:該店鋪復(fù)購率極低。
- 建議:針對店鋪復(fù)購率下降這一現(xiàn)象做深入分析,了解造成原因,有針對性的進(jìn)行改善,增強(qiáng)對老顧客的維護(hù)及運(yùn)營。
③結(jié)論三:顧客中,不同性別、不同年齡嬰兒占比各不相同,而不同群體的嬰兒對產(chǎn)品類型也有顯著的偏好傾向。
- 建議:在產(chǎn)品營銷過程中,根據(jù)不同群體客戶產(chǎn)品偏好,有針對的進(jìn)行精準(zhǔn)推送,有助于提升營銷及推廣的效率。