數(shù)據(jù)分析報(bào)告01--母嬰電商銷售數(shù)據(jù)分析
時(shí)間:2023-03-26 06:38:02 | 來源:電子商務(wù)
時(shí)間:2023-03-26 06:38:02 來源:電子商務(wù)
數(shù)據(jù)來源
這是來源于阿里天池的母嬰產(chǎn)品電商銷售數(shù)據(jù)。
數(shù)據(jù)說明
共有兩個(gè)表。
表1為trade.csv:29971條記錄,7個(gè)字段;
- user_id-用戶ID
- audition_id-物品編號(hào)
- cat_id-商品種類ID(二級(jí)分類)
- cat1-商品種類ID(一級(jí)分類)
- property-商品屬性
- buy_mount-購買數(shù)量
- day-購買時(shí)間
表2為baby.csv:有956條記錄,3個(gè)字段,具體信息如下:
- user_id-用戶ID
- birthday-生日
- gender-性別(0女性;1男性;2未知)
分析思路
數(shù)據(jù)處理
第一步,導(dǎo)入相關(guān)第三方包import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
plt.rcParams["font.sans-serif"]=["SimHei"] #正常顯示中文標(biāo)簽
plt.rcParams["axes.unicode_minus"]=False #正常顯示負(fù)號(hào)
import warnings
warnings.filterwarnings('ignore') # 去除部分warning
第二步,讀取數(shù)據(jù)dfpart1 = pd.read_csv("C:/Users/Lin/Desktop/muying/trade.csv",header=0)
dfpart2 = pd.read_csv("C:/Users/Lin/Desktop/muying/baby.csv",header=0)
df1 = pd.merge(dfpart1, dfpart2,on=”user_id”,how=”outer”)
#將兩個(gè)表格合并讀入
http://df1.info() ##查看數(shù)據(jù)基本情況
第三步,數(shù)據(jù)前處理1、數(shù)據(jù)清洗、前處理復(fù)制一個(gè)副本data=df1.copy()
查看重復(fù)值:data.duplicated().sum()
##這個(gè)案例中無需去重,因?yàn)椴荒芘懦惶靸?nèi)某一客戶對(duì)相同的商品下了兩單
##若要去重,data=data.drop_duplicates()
缺失值: data.isna().mean()
##查看各字段缺失記錄占比
##發(fā)現(xiàn)生日和性別字段缺失值比例過大(96.8%),因此與性別、年齡有關(guān)的信息需要單獨(dú)分析。
可以把包含性別及年齡信息有關(guān)的記錄拿出來剪切為data1作為分析對(duì)象。轉(zhuǎn)換數(shù)據(jù)類型:data['day']=pd.to_datetime(data['day'],format='%Y%m%d')
data['birthday']=pd.to_datetime(data['birthday'],format='%Y%m%d')
刪除無關(guān)字段:auction_id、property 這兩列信息不需要,刪除;
data=data.drop(["auction_id","property"],axis=1,inplace=False)
創(chuàng)建表data1,用于探究用戶性別及年齡等相關(guān)信息:##創(chuàng)建表data1data1=data[~data["birthday"].isna()]
#在data1中,將gender列中0、1、2分別替換為女性、男性、未知def gender_convert(gender):
if gender==0:
return "female"
elif gender==1:
return "male"
else:
return "unknown"
data1["gender"]=data1["gender"].apply(gender_convert)
#在data1中,新增字段購買年齡purchase_age1;data1["purchase_age1"]=(pd.to_datetime(data1['day'],format='%Y%m%d')-pd.to_datetime(data1['birthday'],format='%Y%m%d'))/pd.Timedelta("365 days")
http://data.info()##data表格是用來探索與購買時(shí)間有關(guān)的信息http://data1.info()##data1表格是用來探索與性別、年齡有關(guān)的信息異常值data.describe()
data1.describe()
查看所有加工后字段的分布,分辨異常值并剔除異常值
對(duì)于字段purchase_age1
#購買年齡28歲,即在嬰兒出生28年后才下單,屬于異常數(shù)據(jù),予以剔除。
data1=data1.drop([8413],axis=0)
#相應(yīng)剔除data中的數(shù)據(jù)
data=data.drop([8413],axis=0)
2、分析(1)整體看:交易人數(shù)、商品品類數(shù)、訂單量、人均訂單量、銷量、人均銷量;日均訂單數(shù)、日均銷量;復(fù)購率重復(fù)購買的用戶僅4人,復(fù)購率很低,猜測可能原因:①產(chǎn)品為耐用型;②產(chǎn)品不受認(rèn)可;③產(chǎn)品庫存不足。需結(jié)合具體業(yè)務(wù)情況排查原因。(排除法找原因)
復(fù)購次數(shù)分析(復(fù)購次數(shù)分布):
這里因?yàn)橹挥兴娜诉M(jìn)行復(fù)購,分析復(fù)購次數(shù)分布沒有意義.
(2)用戶情況A分男性女性:交易人數(shù)、訂單量、人均訂單量、銷量、人均銷量交易用戶中男女比例均衡,女嬰交易人數(shù)偏多,購買力強(qiáng)于男嬰用戶(女嬰1.91件/人,男嬰1.27件/人)
B分不同購買年齡:交易人數(shù)、銷量、人均銷量##將年齡劃分為13組
一歲以內(nèi)嬰兒交易人數(shù)及銷量最多,此后隨著嬰兒年齡增大,交易用戶數(shù)和銷量有遞減趨勢。
(3)商品情況A不同品目商品的總銷量、總交易人數(shù) 從各類別商品交易人數(shù)和銷量看,28、50014815、50008168最受歡迎。從人均銷量,28、38、50014815表現(xiàn)優(yōu)異。50014815雖然銷量不高,但是人均銷量很高,可以嘗試提升其交易人數(shù)。
B不同品目商品銷量分布商品28銷量表現(xiàn)比其他品類較好。
28、50008168、50014815這三類商品均有銷量達(dá)2000+的大客戶訂單。C各類別商品男性女性客戶在交易人數(shù)、銷量方面的表現(xiàn):購買各品類商品的用戶中,男女人數(shù)占比差不多,其中女性略多,銷量有所差別還是因?yàn)榕匀司徺I商品數(shù)更多,與整體情況一致。
D各類別商品不同年齡段嬰兒在交易人數(shù)、銷量方面的表現(xiàn):0~1歲階段的嬰兒對(duì)商品品類50014815需求會(huì)大幅增加,嬰兒3歲后將購入更多500225520。嬰兒不同階段對(duì)商品有不同的需求,
建議結(jié)合商品定位和各年齡商品銷售情況定向向相應(yīng)年齡段用戶推送相關(guān)商品頁面。(4)時(shí)間維度分析——用戶在哪些時(shí)間、時(shí)段活躍時(shí)間數(shù)據(jù)從2012年6月至2015年2月,為保證分析區(qū)間的完備性,這里只取2013年、2014年的銷售數(shù)據(jù)進(jìn)行分析。
A年度交易人數(shù)及銷量相比2013年,2014年交易人數(shù)增長倍數(shù):1.54,銷量增長倍數(shù):1.85。
不同種類商品用戶量及銷量比起2013年均有增長.
B季度交易人數(shù)及銷量對(duì)比各類商品的交易人數(shù)及銷量季度變化,可以看出以下幾個(gè)現(xiàn)象:①50008168交易人數(shù)季度變化較為波折,尤其2014年第一季度和2014年第三季度交易人數(shù)都有下降,其他類別交易人數(shù)均隨季度平緩上升②28銷量在2014年第一季度下降明顯③50008168在2014年第四季度交易人數(shù)有所增加,但銷量下降顯著④50014815在2014年第四季度銷量陡增試著多維度拆分找到以上四點(diǎn)現(xiàn)象可能的原因.
C按月交易人數(shù)及銷量各月份總交易人數(shù)及總銷量變化縱觀全年各月份交易人數(shù)及銷量變化,交易人數(shù)及銷量在每年5月、11月會(huì)到達(dá)一個(gè)峰值,猜測可能與5月母親節(jié)、11月雙11促銷有關(guān)??梢栽谥鹑兆兓€中驗(yàn)證。
另外2014年11月銷量激增,對(duì)照季度變化曲線,現(xiàn)象4很可能源于50014815在11月的銷量激增所致。
全年各月份不同品目商品交易人數(shù)及銷量變化全年各月份不同品目商品交易人數(shù)及銷量變化根據(jù)不同品目商品銷量逐月變化,將季度變化的4個(gè)現(xiàn)象拆解原因到具體月。現(xiàn)象1:交易人數(shù)變化較大的月份應(yīng)當(dāng)是2013年6月明顯下降,2014年2月明顯下降,2014年6月明顯下降。
猜測可能一是由于5月五一及母親節(jié)節(jié)日促銷,購買力已提前釋放,1月2月正值春節(jié)是消費(fèi)低谷。現(xiàn)象2:28在2014年第一季度銷量下降明顯,具體可以看到是因?yàn)?013年12月銷量到達(dá)了兩年以來的峰值,2014年1月銷量僅是略低于平日值。這里的原因應(yīng)當(dāng)要看12月銷量是如何增加的。
現(xiàn)象3,50008168在2014年第四季度交易人數(shù)有所增加,但銷量下降顯著。定位時(shí)間區(qū)間到2014年10月、11月,此兩個(gè)月份交易人數(shù)處于高值,但銷量下降。
現(xiàn)象4,2014年第四季度銷量陡增應(yīng)當(dāng)來自50014815在11月銷量的增加,同時(shí)印證2014年11月總銷量激增也應(yīng)當(dāng)是50014815的原因。
根據(jù)商品銷量逐日變化,將現(xiàn)象拆解到具體每天探究原因。現(xiàn)象12013-3-15至2013-7-15的50008168交易人數(shù)逐日變化2013-3-15至2013-7-15的50008168銷量逐日變化根據(jù)2013-3-15至2013-7-15的逐日變化,明顯可以看到2013年5月份整體交易人數(shù)比其他月份高,另外節(jié)日后一天銷量均有大幅增長。
2013-3-15至2013-7-15的50008168交易人數(shù)逐日變化2013-3-15至2013-7-15的50008168銷量逐日變化根據(jù)2014年3-15至7-15的逐日變化,明顯可以看到5月份整體交易人數(shù)比6月高,另外節(jié)日后一天銷量大幅增長。
2013年及2014年在五月下旬交易人數(shù)均處于高值,6月初交易人數(shù)均有大幅下降,
猜測6月1日兒童節(jié)是否有在5月下旬進(jìn)行促銷預(yù)熱。具體需要溝通業(yè)務(wù)方信息再判斷。現(xiàn)象2: 2013-11-1至2014-2-28的28銷量逐日變化拆解到具體每天,根據(jù)銷量逐日變化曲線,我們可以得出結(jié)論,28品類的商品在2013年12月的銷量增加,主要是由于2013年12月20日當(dāng)日的銷量達(dá)到了2500+。
大訂單客戶很大程度上影響了28品類商品的銷量。現(xiàn)象3 2013-11-1至2014-2-28的28交易人數(shù)逐日變化2013-11-1至2014-2-28的28銷量逐日變化由2014-8-1至12-30的交易人數(shù)變化,可以看到雙十一、雙十二交易人數(shù)大幅增長,其余時(shí)候變化不大,因此第四季度交易人數(shù)有所增加。
由2014-8-1至12-30的銷量變化,可以看到10月銷量驟降是因?yàn)?月銷量突增,
9月20日單日銷量達(dá)到2500+。而雙十一雙十二雖然銷量也有增加,但是與九月份的大訂單相比太少,因此第四季度雖然交易人數(shù)增加,但是銷量反而減少。
現(xiàn)象4,
2014-10-1至2014-12-30的50014815銷量逐日變化根據(jù)逐日變化,
50014815在2014年11月13日單日銷量達(dá)到10000+,導(dǎo)致2014年第四季度該品類銷量陡增。
小結(jié):少數(shù)客戶購買銷量巨大,對(duì)各品類商品總銷量有明顯影響。建議對(duì)此部分客戶特別管理,以期達(dá)成長期合作。(5)用戶分層分析----RFM模型由于用戶復(fù)購率很低,因此舍棄購買頻率F指標(biāo);這里沒有購買金額信息,用累計(jì)購買銷量來代替M進(jìn)行客戶分層分析。
根據(jù)RFM模型對(duì)用戶分類后發(fā)現(xiàn)重要發(fā)展客戶及重要挽留客戶比例最高,重要價(jià)值用戶比例最低,對(duì)于重要挽留客戶,建議推送超大型活動(dòng)如雙十一等活動(dòng)信息,重要發(fā)展客戶,可以加大推送頻率,如新品信息,定期文案推送等;而對(duì)于重要保持客戶,可以推送折扣或促銷信息或贈(zèng)送優(yōu)惠券等。應(yīng)進(jìn)行針對(duì)性的客戶管理,留住重要挽留客戶,將重要保持客戶和重要發(fā)展客戶轉(zhuǎn)變?yōu)橹匾獌r(jià)值客戶。
(6)商品分析——用戶對(duì)哪些產(chǎn)品、類目感興趣熱門商品top10各品類熱門商品top5由此可見,28、50008168類目商品各自各子類別商品銷量均衡且較高,而38、50014815類目中有一子類銷量尤為突出。
二八法則分析前80%銷量有12%左右的商品提供,后20%的銷量由88%左右的商品提供,接近二八定律所表示的由
少數(shù)商品掌控了大部分的銷量。
數(shù)據(jù)分析結(jié)論
1、少數(shù)客戶下單量巨大對(duì)銷量有明顯影響,
建議做好對(duì)較大訂單客戶進(jìn)行特別管理,保持長期合作關(guān)系。2.、女嬰消費(fèi)人數(shù)及購買力均略高于男嬰.嬰兒不同階段對(duì)商品有不同的需求,
建議結(jié)合商品定位和各年齡商品銷售情況定向向相應(yīng)年齡段用戶推送相關(guān)商品頁面。3、
商品復(fù)購率極低,需要結(jié)合商品本身情況找到原因。
4、銷量貢獻(xiàn)主要集中在一級(jí)品類商品28、50008168、38,根據(jù)商品的過往銷量情況,商品28銷量表現(xiàn)較好,
建議做好品類28商品庫存管理。對(duì)于曾出現(xiàn)大訂單的商品28、50008168、50014815,
建議做好客戶管理,為大訂單提前備貨。5、節(jié)日性活動(dòng)對(duì)銷量提升有明顯促進(jìn)作用,
重點(diǎn)關(guān)注五一、母親節(jié)、雙十一和雙十二。6、根據(jù)客戶分層信息,應(yīng)
針對(duì)性進(jìn)行客戶管理,按照不同頻率推送優(yōu)惠信息。
反思(待續(xù))
關(guān)鍵詞:數(shù)據(jù),分析,銷售,報(bào)告