數(shù)據(jù)分析 -- 電商母嬰銷(xiāo)量
時(shí)間:2023-03-26 08:16:02 | 來(lái)源:電子商務(wù)
時(shí)間:2023-03-26 08:16:02 來(lái)源:電子商務(wù)
數(shù)據(jù)來(lái)源
阿里巴巴天池
https://tianchi.aliyun.com/dataset/dataDetail?dataId=45數(shù)據(jù)包含兩個(gè)表格:表1購(gòu)買(mǎi)商品、表2嬰兒信息
理解數(shù)據(jù)表1“購(gòu)買(mǎi)產(chǎn)品”總共有8列,29972行,列名分別是:
- user_id: 和表格“嬰兒信息”中的user_id一一對(duì)應(yīng)
- auction_id: 產(chǎn)品ID,從英中翻譯來(lái)理解auction_id比較困難,從官網(wǎng)上可以看出來(lái)auction_id就是item_id,也就是產(chǎn)品編號(hào),用于識(shí)別這個(gè)產(chǎn)品
- cat1: 產(chǎn)品一級(jí)分類(lèi)ID(官網(wǎng)英文全稱為Root Category ID)
- cat_id: 產(chǎn)品二級(jí)分類(lèi)ID(官網(wǎng)英文全稱為Category ID)
- property: 產(chǎn)品特性(官網(wǎng)解釋為Property of the corresponding item)
- buy_mount: 購(gòu)買(mǎi)數(shù)量
- day: 購(gòu)買(mǎi)日期
表2“嬰兒信息”總共分為3列,954行,列名分別是user_id, birthday和gender:
- user_id: 客戶編碼。每一個(gè)客戶都有一個(gè)唯一編碼,用于識(shí)別這個(gè)客戶
- birthday:客戶的嬰兒出生日期。不同年齡段的嬰兒,使用的產(chǎn)品,比如奶粉、尿不濕是不一樣的
- gender:嬰兒性別。男嬰兒和女?huà)雰涸诋a(chǎn)品上的使用也不一樣,比如說(shuō)服裝
數(shù)據(jù)從用戶、行為、產(chǎn)品可以分為用戶數(shù)據(jù):
- user_id(用戶ID)
- birthday(嬰兒生日)
- gender(嬰兒性別)
行為數(shù)據(jù):
- buy_mount(購(gòu)買(mǎi)數(shù)量)
- Purchase_day(購(gòu)買(mǎi)日期)
產(chǎn)品數(shù)據(jù):
- item_id(產(chǎn)品ID)
- category1(一級(jí)分類(lèi)產(chǎn)品)
- category2(二級(jí)分類(lèi)產(chǎn)品)
- property(產(chǎn)品特性)
提出問(wèn)題及分析思路
分析過(guò)程
這次使用的數(shù)據(jù)是電商產(chǎn)品的銷(xiāo)售數(shù)據(jù),所以我們從銷(xiāo)量的角度出發(fā),來(lái)提出和分析問(wèn)題。在數(shù)據(jù)理解部分我將數(shù)據(jù)劃分為產(chǎn)品數(shù)據(jù)和用戶數(shù)據(jù),所以根據(jù)
多維度拆分分析方法,將銷(xiāo)量從產(chǎn)品和用戶兩個(gè)維度來(lái)劃分。
產(chǎn)品維度先從時(shí)間上將銷(xiāo)量拆分為年銷(xiāo)量和月銷(xiāo)量,利用
對(duì)比分析方法進(jìn)行對(duì)比,再使用
假設(shè)驗(yàn)證分析來(lái)尋找銷(xiāo)量變化的原因
注意:購(gòu)買(mǎi)時(shí)間的范圍是從2012年到2015年,但是因?yàn)?012年和2015年的數(shù)據(jù)不完整,分析的時(shí)間范圍限制在2013年和2014年
從圖表中可以看出,2014年是2013年總銷(xiāo)量的近2倍。具體分析,2014年11月的銷(xiāo)量是2013年11月的銷(xiāo)量的5倍,是2014年銷(xiāo)售量增加的主要原因。所以我們具體分析:2014年11月份的銷(xiāo)量為何大增?
因?yàn)殇N(xiāo)量 = 購(gòu)買(mǎi)次數(shù) * 每次平均購(gòu)買(mǎi)量,將銷(xiāo)量劃分為購(gòu)買(mǎi)數(shù)次和每次平均購(gòu)買(mǎi)量。根據(jù)
假設(shè)驗(yàn)證分析方法,提出如下兩個(gè)假設(shè):
- 2014年的購(gòu)買(mǎi)次數(shù)遠(yuǎn)大于2013年的購(gòu)買(mǎi)次數(shù)
- 2014年的每次平均購(gòu)買(mǎi)量遠(yuǎn)大于2013年的每次平均購(gòu)買(mǎi)量
收集數(shù)據(jù)如下:
| 2013年11月 | 2014年11月 | 倍數(shù) |
---|
購(gòu)買(mǎi)總量 | 2538 | 13044 | 5.14 |
---|
購(gòu)買(mǎi)次數(shù) | 1153 | 1833 | 1.59 |
---|
每次平均購(gòu)買(mǎi)量 | 2.20 | 7.12 | 3.24 |
---|
假設(shè)驗(yàn)證分析過(guò)程和結(jié)論如下:
結(jié)論:2014年11月銷(xiāo)量大增的主要原因是因?yàn)槊看纹骄?gòu)買(mǎi)量大幅增加。
繼續(xù)分析每次平均購(gòu)買(mǎi)量增大的原因,給出兩個(gè)假設(shè):
- 大部分客戶的購(gòu)買(mǎi)量都在提升,比如有可能是用戶本身需求變大,產(chǎn)品新功能復(fù)合市場(chǎng)需求,競(jìng)爭(zhēng)對(duì)手變差等
- 少部分客戶的購(gòu)買(mǎi)量大幅提升,體現(xiàn)為小部分訂單的購(gòu)買(mǎi)量很大
接下來(lái)對(duì)2014年11月和2013年11月銷(xiāo)量做描述性統(tǒng)計(jì)分析,統(tǒng)計(jì)數(shù)據(jù)如下:
| 2013年 | 2014年 |
---|
Mean | 2.201214224 | 7.116202946 |
---|
Standard Error | 0.433192894 | 5.456867438 |
---|
Median | 1 | 1 |
---|
Mode | 1 | 1 |
---|
Standard Deviation | 14.70943452 | 233.6278629 |
---|
Sample Variance | 216.3674638 | 54581.9783 |
---|
Range | 409 | 9999 |
---|
Minimum | 1 | 1 |
---|
Maximum | 410 | 10000 |
---|
Sum | 2538 | 13044 |
---|
Count | 1153 | 1833 |
---|
Largest(5) | 80 | 100 |
---|
Smallest(5) | 1 | 1 |
---|
- 看方差或標(biāo)準(zhǔn)差,差異很大,數(shù)據(jù)分布范圍很廣,說(shuō)明不是因?yàn)榇蟛糠挚蛻舻馁?gòu)買(mǎi)量在提升,可以排除假設(shè)1
- 看排在第5位的最大值,也就是Largest(5)一欄,分別是80和100,差異也不大,但是最大值410和10000的差異巨大,復(fù)合假設(shè)2:少部分客戶的購(gòu)買(mǎi)量大幅提升。而且很大可能性是由于極個(gè)別訂單造成的
于是,將2013年11月和2014年11月單筆銷(xiāo)量top10的數(shù)據(jù)做圖表分析:
可以看出2014年的最大訂單(購(gòu)買(mǎi)量為10000)是造成數(shù)據(jù)的主要原因,將這個(gè)數(shù)據(jù)去掉,2014年11月的每次平均購(gòu)買(mǎi)量下降為1.66,低于2013年11月的每次平均購(gòu)買(mǎi)量
| 2013年11月 | 2014年11月(去掉最大訂單) | 倍數(shù) |
---|
購(gòu)買(mǎi)總量 | 2538 | 3044 | 5.14 |
---|
購(gòu)買(mǎi)次數(shù) | 1153 | 1832 | 1.59 |
---|
每次平均購(gòu)買(mǎi)量 | 2.20 | 1.66 | 0.75 |
---|
所以假設(shè)2:少部分客戶的購(gòu)買(mǎi)量大幅提升,成立
購(gòu)買(mǎi)總量受到了其中一個(gè)大訂單的影響,為了去除這個(gè)訂單對(duì)整體數(shù)據(jù)的影響,現(xiàn)在直接對(duì)2013年和2014年的每月購(gòu)買(mǎi)次數(shù)進(jìn)行分析:
可以看出銷(xiāo)售高峰期分別是11月和5月。因?yàn)?1月有雙11活動(dòng),所以銷(xiāo)量較大。而5月份的節(jié)日較多,估計(jì)商家也推出了較多的促銷(xiāo)活動(dòng),所以銷(xiāo)量也比較大。
可以看出銷(xiāo)售高峰期分別是11月和5月。估計(jì)11月有雙11活動(dòng),所以銷(xiāo)量較大。而5月份的節(jié)日較多,估計(jì)商家也推出了較多的促銷(xiāo)活動(dòng),所以銷(xiāo)量也比較大。
現(xiàn)在分別做驗(yàn)證:
可以看出:2013年和2014年11月份購(gòu)買(mǎi)次數(shù)最高的時(shí)間正好是11月11日,符合假設(shè)
可以看出:2014年5月銷(xiāo)量較高的日期分別是5月12日、5月20日和5月26日;2013年5月銷(xiāo)量較高的日期是5月14日、5月22日、5日27月;這些時(shí)間正好在母親節(jié)、520節(jié)日和兒童節(jié)附近,符合假設(shè)
現(xiàn)在從產(chǎn)品分類(lèi)的角度來(lái)分析,產(chǎn)品有一級(jí)分類(lèi)產(chǎn)品、二級(jí)分類(lèi)產(chǎn)品,這里主要是用到一級(jí)分類(lèi)產(chǎn)品數(shù)據(jù)。一級(jí)分類(lèi)產(chǎn)品的銷(xiāo)售情況如下
- 銷(xiāo)量最多的三種分類(lèi)產(chǎn)品分別是28、50014815、50008168
- 銷(xiāo)量最低的三種分類(lèi)產(chǎn)品分別是122650008、50022520、38
同樣運(yùn)用到,銷(xiāo)量 = 購(gòu)買(mǎi)次數(shù) * 每次平均購(gòu)買(mǎi)量,提出兩個(gè)假設(shè):
- 銷(xiāo)量大的產(chǎn)品購(gòu)買(mǎi)總次數(shù)多
- 銷(xiāo)量大的產(chǎn)品每次平均購(gòu)買(mǎi)量更大
將一級(jí)分類(lèi)產(chǎn)品銷(xiāo)量和購(gòu)買(mǎi)總次數(shù)對(duì)比,可以看出銷(xiāo)量越大的產(chǎn)品購(gòu)買(mǎi)總次數(shù)越多,假設(shè)1成立
在計(jì)算每次平均購(gòu)買(mǎi)量時(shí),我將2014年11月購(gòu)買(mǎi)量為10000的訂單刪除掉,因?yàn)?0000的訂單在整個(gè)數(shù)據(jù)中非常少見(jiàn),與每次購(gòu)買(mǎi)量的中位數(shù)、平均數(shù)和四分位數(shù)的差值也非常大。得到如下圖表:
可以看出:暢銷(xiāo)產(chǎn)品的次均購(gòu)買(mǎi)量比不暢銷(xiāo)產(chǎn)品的相對(duì)多些,但優(yōu)勢(shì)并不明顯,假設(shè)2不成立。
所以,暢銷(xiāo)產(chǎn)品主要是因?yàn)橘?gòu)買(mǎi)次數(shù)更多。而購(gòu)買(mǎi)次數(shù)由新客戶購(gòu)買(mǎi)和老客戶購(gòu)買(mǎi)次數(shù)購(gòu)買(mǎi)。如果老客戶購(gòu)買(mǎi)次數(shù)越多,說(shuō)明復(fù)購(gòu)率越高,反之則新客戶購(gòu)買(mǎi)次數(shù)越多。
數(shù)據(jù)分析如下:
可以看出,和整體銷(xiāo)量比較,每一產(chǎn)品的復(fù)購(gòu)數(shù)量都是非常低的,所以銷(xiāo)量大的產(chǎn)品主要還是因?yàn)樾掠脩舯容^多。
用戶維度先從性別維度出發(fā),分析男性嬰兒和女性嬰兒的購(gòu)買(mǎi)量和購(gòu)買(mǎi)次數(shù)對(duì)比
可以看出女性的購(gòu)買(mǎi)量比男性的高出為67.3%,同時(shí)購(gòu)買(mǎi)次數(shù)也比男性的略高出一點(diǎn)。
接下來(lái)看男性嬰兒的購(gòu)買(mǎi)偏好:
男性嬰兒購(gòu)買(mǎi)最多前三類(lèi)產(chǎn)品是50008168、28、50014815
女性嬰兒的購(gòu)買(mǎi)偏好:
女性嬰兒購(gòu)買(mǎi)最多前三類(lèi)產(chǎn)品是50014815、50008168、28
接著從年齡維度分析,對(duì)不同年齡的購(gòu)買(mǎi)量進(jìn)行排序,結(jié)果如下:
購(gòu)買(mǎi)最多的前三個(gè)年齡分別是0歲、1歲、出生前
現(xiàn)在分析0歲、1歲、出生前嬰兒各自的購(gòu)買(mǎi)偏好
0歲嬰兒不同類(lèi)別產(chǎn)品的購(gòu)買(mǎi)量:
0歲嬰兒購(gòu)買(mǎi)最多前三類(lèi)產(chǎn)品是50014815、50008168、28
1歲嬰兒不同類(lèi)別產(chǎn)品的購(gòu)買(mǎi)量:
1歲嬰兒購(gòu)買(mǎi)最多前三類(lèi)產(chǎn)品是50008168、38、50014815。值得注意的是產(chǎn)品38雖然總銷(xiāo)量不太好,但是在1歲嬰兒中銷(xiāo)量可以排到第二
出生前嬰兒不同類(lèi)別產(chǎn)品的購(gòu)買(mǎi)量:
出生前嬰兒購(gòu)買(mǎi)最多前三類(lèi)產(chǎn)品是50014815、50022520、28。值得注意的是產(chǎn)品50022520雖然總銷(xiāo)量不太好,但是在出生前嬰兒中銷(xiāo)量可以排到第二
結(jié)論與建議
- 一個(gè)大數(shù)量訂單(訂單數(shù)為10000)影響到了整體的銷(xiāo)售數(shù)據(jù)
- 除去這個(gè)大數(shù)量訂單,銷(xiāo)售量在5月和11月比較突出,分別是因?yàn)楣?jié)日較多和雙11,建議以后在這兩個(gè)月份多備貨
- 銷(xiāo)量最多的三個(gè)產(chǎn)品分別是28、50014815、50008168,主要因?yàn)樾掠脩糨^多
- 女性的購(gòu)買(mǎi)力要高于男性。不同性別的購(gòu)買(mǎi)偏好不同,但只是排序上的不同。男性嬰兒購(gòu)買(mǎi)最多前三類(lèi)產(chǎn)品是50008168、28、50014815,女性嬰兒購(gòu)買(mǎi)最多前三類(lèi)產(chǎn)品是50014815、50008168、28。建議對(duì)男性和女性嬰兒做廣告推廣時(shí),不同的產(chǎn)品使用不同推廣力度
- 不同年齡的購(gòu)買(mǎi)力也不同。購(gòu)買(mǎi)力最大的前三個(gè)年齡分別是0歲、1歲、出生前嬰兒。在資源有限的情況下,可集中資源向這三個(gè)年齡做推廣
- 0歲、1歲、出生前嬰兒的購(gòu)買(mǎi)偏好也不太一致,但主要購(gòu)買(mǎi)的產(chǎn)品仍集中在50014815、50008168這兩個(gè)產(chǎn)品上。50022520和38雖然總銷(xiāo)量偏低,但是它們分別在1歲和出生前的銷(xiāo)量還不錯(cuò)。建議對(duì)各不同年齡段的嬰兒做廣告推廣時(shí),不同的產(chǎn)品使用不同的推廣力度