電商數(shù)據(jù)分析
時(shí)間:2023-03-15 20:08:01 | 來源:電子商務(wù)
時(shí)間:2023-03-15 20:08:01 來源:電子商務(wù)
目錄
1 項(xiàng)目背景.. 1
2 數(shù)據(jù)來源.. 1
3 數(shù)據(jù)分析工作流程.. 1
3.1 提出問題.. 1
3.2 理解數(shù)據(jù).. 2
3.3 數(shù)據(jù)清洗.. 2
3.4 數(shù)據(jù)分析.. 2
3.4.1 消費(fèi)者屬性.. 3
3.4.2 各類別產(chǎn)品銷售額占比與消費(fèi)者屬性的關(guān)系.. 6
3.4.3 產(chǎn)品屬性.. 8
3.4.4 各城市銷售狀況.. 10
4 結(jié)論.. 12
1 項(xiàng)目背景
由于大數(shù)據(jù)的興起,數(shù)據(jù)在助力企業(yè)發(fā)展中發(fā)揮著重要的作用,企業(yè)更加注重對(duì)數(shù)據(jù)的運(yùn)用,大數(shù)據(jù)越來越成為驅(qū)動(dòng)業(yè)務(wù)的一個(gè)組成部分,在用戶運(yùn)營中發(fā)揮重要的作用。每個(gè)用戶的在線行為直接影響著企業(yè)在推廣產(chǎn)品上所作所為。本文通過研究用戶的購買行為,作為商家運(yùn)營和推廣的指導(dǎo)。
2 數(shù)據(jù)來源
從Kaggle網(wǎng)站下載‘黑五’的消費(fèi)者購物數(shù)據(jù),對(duì)下載的數(shù)據(jù)集每個(gè)字段進(jìn)行詳細(xì)的分析,數(shù)據(jù)包含的字段有:用戶ID(用戶即消費(fèi)者),產(chǎn)品ID,消費(fèi)者年齡,消費(fèi)者性別,城市類別,所在城市居住時(shí)長(以年為點(diǎn)位),消費(fèi)者職業(yè),商品類別1,商品類別2,商品類別3,購買金額。
3 數(shù)據(jù)分析工作流程
圖 1 數(shù)據(jù)分析工作流3.1 提出問題
圖 2 根據(jù)業(yè)務(wù)邏輯提出問題3.2 理解數(shù)據(jù)
圖 3 數(shù)據(jù)源前10條記錄從圖3看出整個(gè)數(shù)據(jù)集顯示了注冊(cè)用戶在電商網(wǎng)站的購買行為,對(duì)數(shù)據(jù)字段進(jìn)行如下分析:
[1]. 用戶ID:用戶ID在記錄中有重復(fù)顯示,表明同一個(gè)用戶可能購買了不同的商品。
[2]. 產(chǎn)品ID:每一種產(chǎn)品對(duì)應(yīng)一個(gè)產(chǎn)品ID。
[3]. 性別:用于分析不同性別用戶的購買行為。
[4]. 年齡:用戶的年齡為一個(gè)范圍,可分析各年齡段用戶的購買行為。
[5]. 城市類別:用于分析不同城市的用戶購買行為。
[6]. 職業(yè)類別:用于分析不同職業(yè)用戶的購買行為。
[7]. 產(chǎn)品類別:用于分析用戶的屬性與產(chǎn)品類別的關(guān)系。
3.3 數(shù)據(jù)清洗
具體清洗流程如下:
為便于分析和閱讀,將各字段名稱用中文替換:
[1]. 性別中F用‘女’替換,M用‘男’替換;
[2]. 婚姻狀況中0替換為‘未婚’,1替換為‘已婚’;
[3]. 重復(fù)值去除:對(duì)于用戶ID和產(chǎn)品ID都一致的多行記錄進(jìn)行去重。
圖 4 清洗后數(shù)據(jù)前10條記錄3.4 數(shù)據(jù)分析
分析消費(fèi)者的年齡,性別,婚姻狀況,職業(yè)類別,居住城市的情況。
3.4.1 消費(fèi)者屬性
(一) 年齡分布情況
圖 5 消費(fèi)者年齡分布情況從年齡分布圖上可以看出,‘黑五’期間,26-35歲為消費(fèi)人數(shù)最多的人群;主力消費(fèi)人群集中在18-45歲。
(二) 性別占比情況
圖 6 消費(fèi)者性別占比情況從性別占比圖中可以看出,男性消費(fèi)人群占75%,是女性消費(fèi)人群的3倍。
(三) 職業(yè)類別分布情況
圖 7 消費(fèi)者職業(yè)分布情況 職業(yè)類別為4、0、7的職業(yè),消費(fèi)人群占比排名前三。
(四) 居住年數(shù)分布情況
圖 8 消費(fèi)者居住年數(shù)分布情況 從居住年數(shù)分布圖中可以看出,居住滿一年的的消費(fèi)人群最多,隨著居住年數(shù)增多,消費(fèi)人數(shù)逐漸遞減??赡茉蚴蔷幼M一年,居住地比較穩(wěn)定,開始購買一些非日常的商品。
(五) 婚姻狀況占比
圖 9 消費(fèi)者婚姻狀況已婚的消費(fèi)者人數(shù)和未婚的消費(fèi)者人數(shù)相差20%,說明未婚的人群更愿意在‘黑五’購買更多的商品。
總結(jié)分析:
1) 26-35歲為消費(fèi)人數(shù)最多的人群。
2) 職業(yè)類別為4、0、7的職業(yè),消費(fèi)人數(shù)占比排名前三。
3) 男性消費(fèi)人群占75%,是女性消費(fèi)人群的3倍。
4) 居住滿一年的的消費(fèi)人群最多。
5) 未婚的人群更愿意在促銷活動(dòng)中購買更多的商品。
3.4.2 各類別產(chǎn)品銷售額占比與消費(fèi)者屬性的關(guān)系
本例中選用銷售額在前三的產(chǎn)品類別作為分析對(duì)象:
(一) 不同年齡段
圖 10 不同年齡段的消費(fèi)者消費(fèi)的產(chǎn)品類別情況 產(chǎn)品類別1的消費(fèi)群體隨著年齡的增大,消費(fèi)力度減?。?br>
產(chǎn)品類別1的銷售金額遠(yuǎn)大于產(chǎn)品類別5和8。
(二) 不同性別
圖 11 不同性別的消費(fèi)者消費(fèi)的產(chǎn)品類別情況總結(jié)分析:
對(duì)于產(chǎn)品類別1,男性的消費(fèi)金額占比高于女性15%;
對(duì)于產(chǎn)品類別5和8,男性的消費(fèi)金額低于女性10%。
(三) 不同婚姻狀況
圖 12 不同婚姻狀況的消費(fèi)者消費(fèi)的產(chǎn)品類別情況(四) 不同居住年數(shù)
圖 13 不同居住年數(shù)的消費(fèi)者消費(fèi)的產(chǎn)品類別情況 (五) 不同職業(yè)類別
圖 14 不同職業(yè)類別的消費(fèi)者消費(fèi)的產(chǎn)品類別的情況總結(jié)分析:
[1]. 產(chǎn)品類別1的銷售額遠(yuǎn)遠(yuǎn)高與產(chǎn)品類別5和8;
[2]. 對(duì)于產(chǎn)品類別1,男性的消費(fèi)金額占比高于女性15%;
[3]. 對(duì)于產(chǎn)品類別5和8,男性的消費(fèi)金額低于女性10%;
[4]. 每種產(chǎn)品類別的銷售額與婚姻狀況、職業(yè)類別和居住年數(shù)關(guān)系不大。
3.4.3 產(chǎn)品屬性
(一) 各產(chǎn)品的銷售額(按產(chǎn)品類別)
圖 15 各產(chǎn)品的銷售額銷售額最大的產(chǎn)品類別是類別1,占總的銷售額比例將近40%。
(二) 各產(chǎn)品的銷售額比例(按產(chǎn)品編號(hào))
圖 16 各產(chǎn)品的銷售額比例 產(chǎn)品編號(hào)為P00025442的產(chǎn)品銷售額占比最大,約為11.4%。
(三) 各產(chǎn)品的銷量(按產(chǎn)品類別)
圖 17 各產(chǎn)品的銷量(按產(chǎn)品類別)產(chǎn)品類別5的銷量占比最大;
(四) 各產(chǎn)品的銷量(按產(chǎn)品編號(hào))
圖 18 各產(chǎn)品的銷量(按產(chǎn)品編號(hào)) 產(chǎn)品編號(hào)為P00265242的產(chǎn)品銷量最大,約為12%。
3.4.4 各城市銷售狀況
(一) 各城市銷售額
圖 19 各城市銷售額 城市B的銷售額最大,占總銷售額的41%
(二) 各城市銷量
圖 20 各城市銷量 城市B的銷量最大,占銷量的42%
4 結(jié)論
1.銷量 top3商品編號(hào)為1、5、8,建議商家重點(diǎn)維護(hù)此類商品質(zhì)量,并持續(xù)為客戶提供優(yōu)質(zhì)的服務(wù)。
2.居住年數(shù)在1年以上,年齡在26-35,職位編號(hào)是4,0,7的顧客是購買的主力,商家需要重點(diǎn)維護(hù)。