此次的數(shù)據(jù)集來自kaggle:Online Retail Data Set from UCI ML repo

包含了2010年12月1日到2011年12月9日在英國注冊的非實體網(wǎng)上零售所有交易,公司主要銷售獨(dú)特的全天候禮品,該公司許多客戶都是" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務(wù) > 電商零售數(shù)據(jù)分析

電商零售數(shù)據(jù)分析

時間:2023-03-15 21:40:01 | 來源:電子商務(wù)

時間:2023-03-15 21:40:01 來源:電子商務(wù)

一、提出問題

項目背景:

此次的數(shù)據(jù)集來自kaggle:Online Retail Data Set from UCI ML repo

包含了2010年12月1日到2011年12月9日在英國注冊的非實體網(wǎng)上零售所有交易,公司主要銷售獨(dú)特的全天候禮品,該公司許多客戶都是批發(fā)商。

本次的電子零售分析主要分為兩個方面:

(1)了解該公司基本營運(yùn)情況,通過分析計算運(yùn)營的各項指標(biāo)來了解目前經(jīng)營的效率和經(jīng)營趨勢;

(2)通過RFM模型對用戶進(jìn)行分級,找出價值用戶。

二、理解數(shù)據(jù)

1、導(dǎo)入數(shù)據(jù)分析相關(guān)庫以及本次分析的數(shù)據(jù)集

2、查看導(dǎo)入情況以及理解字段含義

三、數(shù)據(jù)清洗

1、統(tǒng)計缺失率:

通過上圖,我們可以發(fā)現(xiàn)用戶ID和產(chǎn)品描述都存在一定程度的缺失,由于本次分析要研究用戶的消費(fèi)行為以及產(chǎn)品的銷售情況,選擇刪除缺失數(shù)據(jù)

2、為后續(xù)方便統(tǒng)計,將訂單日期拆分,增加年月日時間四個字段,并增加合計購買字段

查看數(shù)據(jù)

3、重復(fù)值處理:

4、異常值處理:

查看數(shù)據(jù)發(fā)現(xiàn)商品數(shù)量和單價存在負(fù)值,進(jìn)一步查看異常數(shù)據(jù)

首先查看商品數(shù)量異常

輸出結(jié)果看,數(shù)量為負(fù)數(shù)的訂單都是訂單號為C開頭的退貨訂單,選把這部分?jǐn)?shù)據(jù)放在另一個數(shù)據(jù)框內(nèi),后續(xù)進(jìn)行分析

其次分析價格數(shù)量異常

查看數(shù)據(jù)發(fā)現(xiàn)單價為0的居多,查看單價分類

查詢單價異常結(jié)果一共2512條,其中2510條單價為0,預(yù)計為促銷贈品;另外還有2條單價是負(fù)數(shù),明細(xì)為壞賬記錄,本次不做分析。

四、數(shù)據(jù)分析

1、運(yùn)營指標(biāo)分析:

選取商品數(shù)量及單價正常數(shù)據(jù)進(jìn)行運(yùn)營指標(biāo)分析:

(1)月銷售單數(shù):

根據(jù)數(shù)據(jù)顯示,2011年9月,10月,11月銷售單數(shù)最多,且呈現(xiàn)穩(wěn)步上升的趨勢2011年11月達(dá)到最大值。

(2)月銷售額:

從銷售額方面看,2011年9月,10月,11月銷售額明顯高于其他月份,結(jié)合前面的月銷售單數(shù),11月份單數(shù)量高于十月份38%左右,但是銷售額只比10月份高出12%左右,明顯可以看出10月份銷售效果好于,需了解11月份是否有舉辦大型促銷活動。

(3)月平均銷售額:

(4)客單價:

由計算結(jié)果可知客單價為2048.69英鎊。

(5)件單價:

由計算結(jié)果可知,每件產(chǎn)品的平均價格為1.73英鎊。

6)退貨率:

可以看出,退貨率最高為2011年1月和12月,高于平均退貨率8%,特別是12月,具體情況應(yīng)該與相關(guān)部門溝通是什么原因?qū)е?,并且可以分析前幾年的退貨率,是否存在同樣的問題。

2、RFM模型分析:

RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段。通過分析一個客戶的近期購買行為,購買的總體頻率以及花費(fèi)的金額三項指標(biāo)來描述該客戶的價值狀況。

R-Recency:最近一次消費(fèi)

F-Frequency:消費(fèi)頻率

M-Monetary:消費(fèi)金額

分別查看R/F/M的值,對其設(shè)置合理閾值,進(jìn)行分層

查看R值:

可以看到,截至2011年12月9日,最后一次消費(fèi)距離截止日期的天數(shù)平均為92天,方差為100,波動較大,距離天數(shù)最大超過一年。

查看F值:

#由于極值的影響,可視化不明顯,考慮剔除異常值查看頻次小于50的

可知,在2010年12月1日至2011年12月9日時間內(nèi),用戶評價消費(fèi)4.2次

查看M值

#查看金額小于2000分布

可知,由于存在極值,平均值會被影響,通過查看中位數(shù),可知整體評價金額為668元

五、建立RFM模型

這里使RFM得分的平均值為閾值,得分大于平均值設(shè)置為得分高,小于平均值設(shè)置為得分低

把三個得分用字符串拼接的方式組合在一起:

去除字符串空格:

對結(jié)果進(jìn)行可視化:

通過RFM模型對用戶進(jìn)行分層,得到八個類別的客戶。根據(jù)上面的數(shù)據(jù)可知,該公司重要價值客戶,重要發(fā)展客戶占比比較大,達(dá)到47%,對于重要發(fā)展客戶,由于最近交易較少,建議及時推送公司活動及相關(guān)產(chǎn)品信息,喚回客戶;其次最多的為一般發(fā)展用戶和一般挽留客戶,站總客戶數(shù)40%。針對一般發(fā)展用戶,應(yīng)獲取該類用戶詳細(xì)數(shù)據(jù)進(jìn)行用戶畫像,了解用戶消費(fèi)需求,及時推送產(chǎn)品信息,對于重要保持客戶和重要挽留客戶,以贈送優(yōu)惠券或者推送折扣信息等措施增加用戶的活躍度。

關(guān)鍵詞:分析,數(shù)據(jù),零售

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關(guān)閉