用數(shù)據(jù)分析方法分析電商數(shù)據(jù)
時間:2023-03-15 21:14:01 | 來源:電子商務(wù)
時間:2023-03-15 21:14:01 來源:電子商務(wù)
第一步:數(shù)據(jù)來源 表格為“表1:購買信息”,“表2:嬰兒信息”
根據(jù)二表內(nèi)容,本文試圖通過假設(shè)檢驗、對比分析、多維度分析方法對數(shù)據(jù)進(jìn)行深度分析解讀,發(fā)現(xiàn)隱藏于數(shù)據(jù)后面的深層原因,微店鋪運營提供扎實的分析依據(jù)。
第二步:理解數(shù)據(jù) 表格1:購買商品 用戶ID:用于識別交易用戶,在此數(shù)據(jù)中,用戶ID可以重復(fù),因為同一用戶可以購買多種商品 商品編號:為某一商品的識別編號,不可重復(fù) 商品二級分類:某一商品大類下的再分類 商品一級分類:商品的分類名稱 商品屬性:商品所具有的特性、屬性 購買數(shù)量:用戶的交易數(shù)量 購買時間:交易發(fā)生的準(zhǔn)確時間
表格2:嬰兒信息 用戶ID:用戶識別交易用戶,且每一個用戶對應(yīng)唯一ID 出生日期:嬰兒的出生日期 性別:嬰兒的性別
第三步:提出問題假設(shè)檢驗可以從用戶、產(chǎn)品、競品三個維度作為出發(fā)點觀察、分析數(shù)據(jù)。根據(jù)數(shù)據(jù)表中的數(shù)據(jù),表一著重于描述店鋪產(chǎn)品的銷量情況,表二著重于描述嬰兒信息,所以,可以分別從產(chǎn)品和用戶維度展開分析。
1.產(chǎn)品維度
- 歷年總成交量的波動情況:總成交量=購買量×購買次數(shù),總成交量的波動必然與購買量和購買次數(shù)有關(guān),所以在這里可以再次使用假設(shè)檢驗。
- 產(chǎn)品之間的銷量對比:有銷量,那么不同的產(chǎn)品之間就會有差距,這里可以使用對比分析、假設(shè)檢驗分析。
2.用戶維度
- 男女嬰兒對不同產(chǎn)品的需求情況
- 各年齡段嬰兒對不同產(chǎn)品的需求情況
第四步:數(shù)據(jù)清洗(不完全展示)1.選擇子集(隱藏不需要的行或列)
根據(jù)數(shù)據(jù)內(nèi)容可以隱藏部分暫時用不上的數(shù)據(jù)而不是將其直接刪除,鑒于數(shù)據(jù)列項并不多,所以,可以暫時先不隱藏數(shù)據(jù)。
2.列名重命名
表一、表二的列名標(biāo)注已經(jīng)相當(dāng)明確,所以列名重命名的工作可以直接跳過。
3.刪除重復(fù)值
表一為商品購買信息,商品編號用于唯一標(biāo)識某一商品,所以不會存在重復(fù)。實際情況中存在多個用戶購買同一商品,所以在購買信息中無需對列進(jìn)行重復(fù)值刪除。表二用戶ID無重復(fù)信息,所以在此工作上無需多做停留。
4.缺失值處理
表一除了“商品屬性”列為29828項,其余列均為29972項,而此列商品屬性并不明確,對數(shù)據(jù)后續(xù)分析意義不大,所以用0補充。表二無缺失值。
5.一致化處理(對數(shù)據(jù)列沒有統(tǒng)一命名的內(nèi)容處理)
表一、表二內(nèi)容基本沒有問題,唯獨表一購買時間、表二出生日期可以采用標(biāo)準(zhǔn)日期格式再進(jìn)一步調(diào)整。
調(diào)整后的日期yyyy/mm/dd
此外,在表2中用0或1表示性別,在識別度上會降低,所以,通過vlookup函數(shù)可以分別將0 、1 、2轉(zhuǎn)換為中文“女”、“男”、“未知”。
轉(zhuǎn)換完成后,D列的內(nèi)容為vlookup內(nèi)容,將該列復(fù)制,以“數(shù)值”形式粘貼在E列,然后將D列隱藏。
6.數(shù)據(jù)排序與異常值處理
經(jīng)過計算,以“年”為單位,存在一些嬰兒年齡異常過高的數(shù)據(jù),例如:
所以此處可刪除這些異常值,刪除后對整體數(shù)據(jù)影響不大。
第五步:對提出的問題進(jìn)行分析(一)產(chǎn)品維度根據(jù)表一的數(shù)據(jù)透視表可以對比出2012-2015年的各月銷售量情況。下圖數(shù)據(jù)是“購買數(shù)量”的求和項可視化結(jié)果,可以看出,從2012到2015年,該店鋪的銷售量是呈上升態(tài)勢的且2015年的11月銷量呈現(xiàn)出井噴的態(tài)勢,隨后又回落至平均水平。
上圖雖然可以看出各月的銷售量增長情況,但還是比較模糊。因為店鋪的銷售量=每個用戶單次購買量的總和,所以,銷售量的高低,取決于購買次數(shù)和單次購買量。
下圖將“購買數(shù)量”改為計數(shù)后,所呈現(xiàn)出的可視化結(jié)果??梢钥闯?,2012-2015年之間每年的月購買次數(shù)都比前一年有所增長。
根據(jù)上面的可視化結(jié)果,我們可以提取出如下有價值的分析分析方向:
- 總銷量的變化情況與什么有關(guān)
- 各產(chǎn)品類型的銷量變化
1. 總銷量的變化情況與什么有關(guān)店鋪總銷量只與兩個因素有關(guān),即購買次數(shù)和單次購買量。根據(jù)數(shù)據(jù)集的歷年購買次數(shù)和購買量可視化結(jié)果可以看出購買量的波動程度比購買次數(shù)的波動程度大??梢酝茢喑?,存在某一次交易中存在極大銷售量的情況。雖然在實際經(jīng)營中存在發(fā)生類似情況的概率,但為了不讓這些數(shù)值對整個分析影響太大,故可以剔除這種異常過高的值。
從下圖可以看出,購買量波動較大,其中,2014年11月、9月,2013年12月等出現(xiàn)極為突出的購買量,且2015年2月數(shù)據(jù)呈斷崖式下降趨勢。
剔除異常值后,可視化效果如下:
購買次數(shù)與購買量基本成正比。
1.1 單次購買量2012-2015年單次購買量的平均值基本分布在1.5-2之間,所以,單次購買量對總銷售量的影響并非決定因素,在每年的關(guān)進(jìn)活動節(jié)點,購買次數(shù)(即成交單數(shù))的上升才是帶來銷售量提升的原因。
1.2 購買次數(shù)2012-2015年購買次數(shù)呈顯著上升的趨勢。一年之中購買次數(shù)波動較為劇烈,因為我們需要進(jìn)一步分析,購買次數(shù)為什么會上升或下降呢?如下圖所示:每年2月購買次數(shù)明顯下降,每年5月、11月購買次數(shù)明顯上升。
如下圖所示,2013-2014兩年每年5月有3個銷售高峰,分別對應(yīng)5月11/12日,5月20日,5月26日。
經(jīng)查詢,2013年5月12日和2014年5月11日為母親節(jié),5月20日為“520”節(jié),5月底進(jìn)入六一兒童節(jié)促銷時間段,因此,5月份總體購買次數(shù)出現(xiàn)上升現(xiàn)象。
下圖在11月11日當(dāng)天消費者購買量明顯上升。
12月在12號當(dāng)天,購買量突然上升,隨后第二天回落至正常水平。
以上兩個節(jié)點分別對應(yīng)了“雙十一”和“上十二”兩個年底大促,消費者購買量上升,隨之推高2店鋪銷售量。
再來看一下2013-2014年2月出現(xiàn)銷量下降的原因。2013年春節(jié)假期為2.9-2.15;2014年春節(jié)假期為2.1-2.6。在春節(jié)期間,購買次數(shù)均出現(xiàn)了U型先下降后上升的趨勢。據(jù)此可以推測,農(nóng)歷春節(jié)是2月份出現(xiàn)銷量下滑的主要原因,春節(jié)期間店鋪員工放假、物流停運、走親訪友等因素影響消費者購買商品。
1.3 購買次數(shù)與新老用戶的關(guān)系通過“條件格式”篩選“用戶ID“列的數(shù)據(jù),只發(fā)現(xiàn)極個別重復(fù)ID,可見為該店鋪貢獻(xiàn)銷量的幾乎全部為第一次購物的新用戶。據(jù)此可以推測,該店鋪所銷售的商品使用周期較長,或僅針對某一年齡段的嬰兒使用。
2 產(chǎn)品之間平均單次購買量的對比分析下圖呈現(xiàn)出了所有一級分類商品的平均單次購買量,整體單次購買量在1~4之間,根據(jù)平均單次購買量可以推測出各個商品的耐用程度。根據(jù)產(chǎn)品的耐用程度,運營者可以根據(jù)促銷調(diào)節(jié)或營銷理論展開有針對性的產(chǎn)品運營。
從下圖的產(chǎn)品銷量圖來看,28、50008168兩個品類有較為明顯的增長趨勢,其他品類均保持平穩(wěn)。
(二)用戶維度1.男女嬰對不同商品的需求情況
在所有現(xiàn)有數(shù)據(jù)中,女嬰使用產(chǎn)品的量比男嬰使用產(chǎn)品的量更多。
在各品類用戶匯總,除了50022520男嬰用戶多于女嬰,其余女嬰用戶均占多數(shù)。
2.各年齡段嬰兒對不同商品的需求情況
在所有用戶中,商品的主要購買者為未出生、0歲、1歲的用戶。
在目前已有的用戶信息中,產(chǎn)品50014815為銷售占比最高的商品,也收到未出生及0-1歲嬰兒的父母青睞,說明該款商品對嬰兒父母具有較好的吸引力,也更適用于低齡嬰兒。
小結(jié):
1.年度總銷量的變化是由購買次數(shù)決定的,所以,店鋪商家可以盡可能的增加用戶的購買次數(shù)。而所有購買商品的用戶中,幾乎全部為新用戶,即老用戶的復(fù)購率相對較低。這取決于商品可能只針對嬰兒使用,當(dāng)嬰兒長大后就不在需要使用了, 在這種情況下,老用戶停止復(fù)購也是合理的。商家在運營過程中可以著重做口碑營銷,一方面通過自有渠道吸引新用戶,另一方面挖掘老用戶資源促使老用戶介紹新用戶,以此擴(kuò)大新用戶群體。
2.在所有商品中,28、50008168兩個品類有較為明顯的增長趨勢,商家應(yīng)該關(guān)注兩個品類商品的存貨情況。
3.未出生、0歲、1歲嬰兒是商品主要購買群體,商家可以針對這部分群體推出針對性服務(wù),開展節(jié)假日促銷等。
4.50014815商品是未出生、0歲、1歲嬰兒購買量最大的商品。50008168是2-3歲嬰兒購買量最大的商品,店家應(yīng)該根據(jù)不同年齡用戶開展有針對性的宣傳活動。
關(guān)鍵詞:數(shù)據(jù),分析,方法