電商母嬰童商品案例數據分析
時間:2023-03-26 04:38:02 | 來源:電子商務
時間:2023-03-26 04:38:02 來源:電子商務
數據來源:阿里巴巴天池Baby Goods Info Data-數據集-阿里云天池
表1 購買商品表2 嬰兒信息一、理解數據集及提出問題
- 表1有7個字段,每個字段29971條數據
- 表2有3個字段,每個字段有953條數據
提出問題- 產品各類別的銷量
- 不同時間段的銷量
- 不同性別的購買情況
- 不同年齡的購買情況
使用思維導圖來梳理問題
二、清理數據
1、將兩張表通過用戶ID連接合并,并將字段英文名改為自己習慣的名字。
2、將auctionid(物品編號)、property(商品屬性)選擇隱藏,不研究。
3、刪除重復值:在Excel中使用
刪除重復值功能,兩張表均沒有發(fā)現重復值。
4、缺失值處理:數據區(qū)域內通過
ctrl+G定位空值,未找到單元格。
5、一致化處理:購買日期與出生日期字段格都不是日期格式,需要
改為日期格式。其中出生日期需要計算年齡歸類方便分析。
6、異常值處理1)購買時間的區(qū)間為2012/7/2-2015/2/5。2015年2月只有5天的數據,不能研究,刪除。
2)對年齡排序發(fā)現,年齡最大值為28,應該是認為輸入錯誤,將其改為未知U。年齡為-1的可以理解為即將出生的寶寶提前購買商品,那么-2表示提前2年,明顯不合理。將年齡小于-1的值改為U。
3)性別字段中,將1改為男,0改為女。
4)產品銷量中超過100的全用眾數1代替,這次分析主要針對個人用戶,考慮到存在一次購買幾十件商品的土豪,所以將分界線設為100。
5)出生日期、性別、年齡字段存在錯誤值(#N/A),這是這些用戶沒有填寫嬰兒信息無法匹配到導致的,為了美觀可以將其修改為未知U。
清洗后將不需要的出生日期和年齡隱藏
處理后的數據清洗后有7個字段,每個字段29712條數據。三、分析
(一)產品角度——銷量1、各類別的銷量熱銷類別top3:28,50008168,50014815。這三大類占了80%左右的市場
1)對2013和2014的數據進行同比分析所有的產品都有
高增長率。按照
波士頓矩陣可劃分:明星業(yè)務與問題業(yè)務- 明星業(yè)務:28,50008168,50014815
這類產品可能成為企業(yè)的現金牛產品,需要加大投資以支持其迅速發(fā)展??梢圆捎玫陌l(fā)展戰(zhàn)略是:
增長戰(zhàn)略,積極擴大經濟規(guī)模和市場機會,以長遠利益為目標,
提高市場占有率,加強競爭地位。
- 問題業(yè)務:38,20022520,233650008
問題業(yè)務,是一些相對市場份額還不高,但市場增長率提高很快的業(yè)務。之所以叫“問題業(yè)務”,是因為它們最終會
成為明星業(yè)務,甚至現金牛業(yè)務,還是會死掉,是不確定的問題。為發(fā)展問題業(yè)務,企業(yè)必須增加設備和人員,以便跟上迅速發(fā)展的市場,并超過競爭對手,這些意味著大量的資金投入,這些需要多方面考慮,難以給出建議。
2、不同時間的銷量可以看出店鋪銷量整體上處于上升狀態(tài),有良好的增長趨勢。11月有著明顯的波峰,但在1月,2月迎來波谷。
對這些現象提出問題:- 為什么1月、2月時銷量普遍偏低?
- 為什么11月份會出現一個銷售波峰?
1)假設1月、2月受春節(jié)影響銷量下降
可以看出2013年在2/2-2/15期間銷量下降,2014年在1/25-2/4期間銷量下降。2013的春節(jié)時間為2/9-2/15,2014年的春節(jié)時間為1/30-2/6。
春節(jié)時間與銷量下降的時間高度吻合,證明了假設正確。
2)假設11月份受到購物節(jié)的影響銷量上升
觀察可發(fā)現在這三年的11月份中11日的銷量都居最高位,由此可證明是雙11活動為店鋪帶來明顯的流量和銷量,提高了11月的銷量。
3、總銷量=訂單量*人均購買量在接近30000個用戶購買數據中,只有25名用戶發(fā)生重復購買行為,老用戶對于銷量的影響極小,主要對銷量造成影響的是新用戶數。產品的復購率極低,用戶粘性差。
(二)用戶1、年齡階段在幼兒階段(1-3歲)的購買產品的最多。
可以看出不同年齡段對不同類別產品的喜愛程度:
- 未出生:50014815,50022520
- 新生兒:50014815,28,50008168
- 嬰幼兒:50014815
- 幼兒:最喜愛50008168,但50014815,28,38也有不錯的銷量,不可忽視
- 學前:50008168
- 小學:50008168
綜合來看,1歲前最受歡迎的是50014815,1歲后是50008168。
2、性別從圖中可以發(fā)現:為男寶寶購買的人數略少于女寶寶,但在購買量上二者明顯有相差。男寶寶的人均購買量為1.28,女寶寶的人均購買量為1.57。
說明店鋪的產品更吸引女寶寶。值得注意的是我國近些年出生嬰兒,男性總是多于女性,平均比例為1.15,與客戶的性別比例正好相反。對此現象提出假設:
在熱銷的商品中,存在為專門為女寶寶設計的商品為驗證假設,選出男女寶寶銷量top10的商品進行研究分析
對比看出女寶寶銷量top10中,有大部分的商品是男寶寶少量購買甚至不購買,說明這些商品存在性別差異。而男寶寶銷量top10的商品中就不存在這種性別差異。假設成立。因此有這些專門為女寶寶設計的商品,店鋪的女寶寶購買次數和購買量上總是多于男寶寶。
為提高男寶寶的購買率,建議也設計幾款對男寶寶的商品。
四、總結與建議
1、店鋪熱銷top3:28,50008168,50014815。
2、商品銷量逐年增長,前景非常廣闊
- 店鋪的所有大類別產品都有高增長率。其中有明星業(yè)務:28,50008168,50014815,建議加大投資,提高市場占有率;問題業(yè)務:38,20022520,233650008,這些為題業(yè)務最終會成為明星業(yè)務,甚至現金牛業(yè)務,也可能會死掉,是不確定的問題,需要店鋪好好斟酌。
3、在1月,2月份受春節(jié)影響銷量大幅度減少;在11月份受雙11購物節(jié)影響,銷量會爆發(fā)式增長。
- 大型促銷活動往往能帶動商品的銷售,雙11購物節(jié)往往能出現全年商品銷量的峰值,所以賣家應該跟緊淘寶和天貓平臺的大型促銷活動的機會,在自己的店鋪也做一些促銷活動促進商品銷售。
4、用戶的復購極低,粘性差。
- 可以從產品本身質量、產品售后服務、甚至是業(yè)務流程中哪個環(huán)節(jié)等問題,進行深層次探討。
- 還是說嬰兒成長快,產品使用壽命短,復購率低是整個行業(yè)的現象?
5、購買產品的年齡段以幼兒為主(1-3歲);不同年齡段對產品喜愛不同:1歲前最受歡迎的是50014815,1歲后是50008168。
6、女寶寶的購買次數和購買量都比男寶寶多。是因為店鋪存在不少針對女寶寶的商品,為了提高男寶寶的購買率,可以嘗試設計對男寶寶的商品。