數(shù)據(jù)分析實(shí)戰(zhàn)—電商產(chǎn)品數(shù)據(jù)分析
時間:2023-03-15 20:30:01 | 來源:電子商務(wù)
時間:2023-03-15 20:30:01 來源:電子商務(wù)
接上一篇文章的最后提到的分析思路繼續(xù)。
數(shù)據(jù)來源:阿里天池
首先對數(shù)據(jù)集進(jìn)行分類:
用戶數(shù)據(jù):用戶性別、出生日期、性別
行為數(shù)據(jù):購買數(shù)量、購買日期、購買行為
產(chǎn)品數(shù)據(jù):商品一級類目、商品二級類目、商品屬性
一、提出問題
產(chǎn)品角度:
- 商品的銷售量如何變化?
- 購買次數(shù)如何變化?
- 購買數(shù)量如何變化?
- 熱銷產(chǎn)品情況,差銷產(chǎn)品情況?
用戶角度:
不同性別嬰兒的購買偏好?
不同年齡嬰兒的購買偏好?
針對以上問題整理出相應(yīng)的分析思路 :
二、數(shù)據(jù)清洗
(一)選擇子集
隱藏auction_id列和property列,之后將表1和表2的數(shù)據(jù)通過Vlookup匹配整合到一張表中。
(二)列重新命名
為了方便觀察,將列名由英文改為中文
(三)刪除重復(fù)值
數(shù)據(jù)集中沒有發(fā)現(xiàn)重復(fù)值,故不用去刪除
(四)缺失值處理
數(shù)據(jù)沒有缺失值
(五)一致性處理
表中數(shù)據(jù)日期顯示格式不對,對其進(jìn)行分列+設(shè)置單元格使其按日期格式顯示。
對于問題中性別問題,將性別0,1利用if函數(shù)轉(zhuǎn)換為男,女
年齡用購買日期減去出生日期
(六)異常值處理
年齡異常值:對嬰兒年齡進(jìn)行篩選,發(fā)現(xiàn)年齡中有28的,不符合常理,刪除。
發(fā)現(xiàn)購買數(shù)量中位數(shù)是1,眾數(shù)都是1,最大值為10000。剔除與平均值的偏差超過三倍標(biāo)準(zhǔn)差的高度異常值,即剔除194.5以上的購買數(shù)量的數(shù)據(jù),取整則剔除購買數(shù)量為194以上的數(shù)據(jù)
三、構(gòu)建模型分析問題
產(chǎn)品角度1.產(chǎn)品銷量隨時間如何變化
從上圖可知2012年的銷量和2015年的銷量非常低,看起來是不正常的,推測其中一定有什么問題。
提出假設(shè):2012年和2015年的數(shù)據(jù)缺失
收集證據(jù):商品的按月銷量分布
可以看出,2012年只有7月到12月的數(shù)據(jù),而2015年只有1月到2月的數(shù)據(jù)。
得出結(jié)論:2012年和2015年商品總銷量低是由于數(shù)據(jù)缺失所導(dǎo)致。
由上圖可以看出,每年商品的月銷量是同比增長的,因此,商品每年的銷售總量也是增長的。其中,每年的2月銷量是一年中最低的,11月在一年中最高,5月也是一個高峰期。
(1)由于春節(jié)一般在2月份左右,銷量可能會受到影響,因此
提出假設(shè):春節(jié)快遞停運(yùn)導(dǎo)致商品銷量降低。
收集證據(jù):將2013年、2014年1月份 2月份的銷售量按日展開
可以發(fā)現(xiàn),2013年2月3號到2月15號之間的銷量達(dá)到最低值,2014年1月26號到2月3號之間的銷量達(dá)到最低值。發(fā)現(xiàn)2013年的春節(jié)是2月10號,2014年的春節(jié)是1月31號。春節(jié)假期和銷量最低值期間的時段是吻合的。
得出結(jié)論:春節(jié)假期與商品的銷量降低具有相關(guān)性。
(2)每年的五月份會出現(xiàn)一個高峰,這是為什么呢?
提出假設(shè):商家頻繁的商品促銷活動導(dǎo)致商品銷量走高
收集證據(jù):將2013年,2014年5月份的銷售量按日展開
從上圖中可以可以發(fā)現(xiàn),2013年5月13號,5月20號,5月30號的銷量比較高,2014年5月12號,5月20號,5月27號銷量比較高,經(jīng)過查閱發(fā)現(xiàn),這些時間點(diǎn)和每年的母親節(jié)、520等節(jié)日較接近,有充分理由推測商家在節(jié)假日搞促銷。
得出結(jié)論:節(jié)假日的促銷對商品的銷量增加有幫助。
(2)每年的十一月份是全年的最高峰,這是為什么呢?
提出假設(shè):每年的雙十一大促活動導(dǎo)致銷量增高
收集證據(jù):將2012年,2013年,2014年11月份的銷售量按日展開
由上圖可以得知,2012年11月10號,2013年11月11號,2014年11月11號銷量達(dá)到頂峰。由此可以推測促銷活動導(dǎo)致銷量增高。
2.不同類別商品數(shù)量
由圖表可以看出,商品大類銷量前三分別是28,5008168,50014815,屬于暢銷商品。其中,商品類別28銷量最高,是最受歡迎的商品類。
3.產(chǎn)品的復(fù)購率
下表表示購買次數(shù)超過2次的二級商品類目ID,即總共有25件商品被重復(fù)購買。
由上圖可以發(fā)現(xiàn),重復(fù)購買的只有25個用戶ID,發(fā)現(xiàn)用戶總數(shù)是29942。用戶復(fù)購率為25/29942。可見商品的銷量主要是新用戶帶來的。絕大部分用戶購買一次后不再購買,用戶粘性極低。
其中,商品類別50008168復(fù)購率最高,其次是商品38,第三名是商品28。
用戶角度
1.不用性別嬰兒的購買偏好
由上圖可以看出男嬰的購買量比女嬰的購買量購買量要大。男嬰的購買量是女嬰購買量的1.67倍。接下來從不同類別的商品進(jìn)行分析
從上圖可以看出,商品分類id為50008168、122650008以及28這三類商品對于男嬰和女嬰的需求量差異不大,可以采用相同的銷售方式,分類id為50014815和38的商品男嬰的購買數(shù)量更多,商品分類id為50022520的商品被女性用戶購買的數(shù)量更多。
2.不同年齡嬰兒的購買偏好
可以發(fā)現(xiàn),主要用戶人群是未出生和年齡在0-2歲之間的嬰兒。接下來分析0-2歲的嬰兒各商品的購買數(shù)量。
從上圖可以看出,50014815是商品購買數(shù)量最多的商品,未滿一歲的嬰兒購買量最多的是商品28,50008168,50014815,50022520,1歲的嬰兒購買量最多的是商品28,38,50008168,50014815。2歲的嬰兒購買量最多的商品是28,38,50008168,50014815。
四、結(jié)論與建議(一)商品
1.春節(jié)放假期間商品銷量會達(dá)到最年度最低,可以相應(yīng)的控制庫存和減少廣告推廣費(fèi)用。
2.每年的五月份是銷售的小高峰,可以配合五月的多個節(jié)假日進(jìn)行商品促銷活動;每年的11月份是全年銷量最高的時候,可以增加推廣費(fèi)用以及促銷活動的力度。
4. 商品28的全年銷量最高,可以加大這類商品的推廣力度和供應(yīng)。
5。商品的復(fù)購率很低,用戶的粘性很低。這需要從產(chǎn)品、市場、運(yùn)營,用戶體驗(yàn)以及售后服務(wù)等多個維度去分析具體的原因。
(二)用戶
1.男嬰的購買數(shù)量多于女嬰,不同性別的嬰兒對商品的需求量和需求種類是不一樣的,需要對其進(jìn)行差異化推廣,是用戶順利買到自己需要的商品。
2.0-2歲的嬰兒以及還未出生的嬰兒是商品購買的主力,對這部分人群應(yīng)重點(diǎn)關(guān)注和推廣,必要的時候可以增大優(yōu)惠力度和增加促銷活動吸引這部分用戶群體進(jìn)行購買。
關(guān)鍵詞:數(shù)據(jù),分析,產(chǎn)品,實(shí)戰(zhàn)