這是一個跨國數(shù)據(jù)集,包含2010年12月9日至2011年12月9日期間發(fā)生的所有交易,這些交易來自一家在英國注冊的非店鋪在線零售店。該公司主要銷售各種適合特殊場合的禮品。公司的許多客戶都是" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務(wù) > 電商公司數(shù)據(jù)分析

電商公司數(shù)據(jù)分析

時間:2023-03-15 20:22:01 | 來源:電子商務(wù)

時間:2023-03-15 20:22:01 來源:電子商務(wù)

1. 數(shù)據(jù)獲取

數(shù)據(jù)集來自kaggle

這是一個跨國數(shù)據(jù)集,包含2010年12月9日至2011年12月9日期間發(fā)生的所有交易,這些交易來自一家在英國注冊的非店鋪在線零售店。該公司主要銷售各種適合特殊場合的禮品。公司的許多客戶都是批發(fā)商。

數(shù)據(jù)集大?。?198764*8

數(shù)據(jù)集字段含義: InvoiceNo(發(fā)票號碼), StockCode(貨物代碼),Description(貨物描述), Quantity(數(shù)量), InvoiceDate(發(fā)票日期), UnitePrice(單價), CustomerID(客戶ID),Country(客戶所在國家)

2. 提出問題

1.客戶行為:客戶可以進(jìn)行那些分類?哪些客戶最具價值? 哪些客戶最值得挽留?

2.訂單維度:筆單價是多少,連帶率是多少,筆單價與連帶率的關(guān)系?

3.客戶維度:客單價是多少,人均購買筆數(shù)是多少,客戶的留存率怎么樣?

4.商品維度:什么價位的商品銷售額最高,什么價位的商品銷量最高?

5.時間維度:銷售額隨時間的變化情況,是否有異常情況出現(xiàn),出現(xiàn)的原因?

6.位置維度:訂單主要來自哪些國家,哪些國家的平均客單價最高,哪些國家的用戶黏性最強(qiáng)?

3. 數(shù)據(jù)清洗:

將數(shù)據(jù)導(dǎo)入EXCEL,刪除重復(fù)項,去除完全相同的行。

以貨物代碼為主要關(guān)鍵字對數(shù)據(jù)進(jìn)行排序,發(fā)現(xiàn)貨物代碼以字母開頭的商品是樣品、郵費(fèi)、稅費(fèi)、壞賬等,篩出這些數(shù)據(jù)另外存放。

以商品單價為主要關(guān)鍵字對數(shù)據(jù)進(jìn)行排序,發(fā)現(xiàn)商品單價為零的數(shù)據(jù)是損壞的商品和商品包裝袋等贈品,篩出這些數(shù)據(jù)另外存放。

以數(shù)量為主要關(guān)鍵字對數(shù)據(jù)進(jìn)行排列,發(fā)現(xiàn)數(shù)量為負(fù)時,發(fā)票號碼都以C開頭,可推斷出發(fā)票號碼以C開頭的訂單都是取消的訂單,篩出這些數(shù)據(jù)另外存放。

以客戶ID為主要關(guān)鍵字對數(shù)據(jù)進(jìn)行排列,當(dāng) 客戶ID為空時,商品單價旁邊比非空的訂單高,且數(shù)量都較小。客戶來自EIRE和United Kingdom這兩個國家,還有一部分客戶國家未知??赏茢喑霎?dāng)客戶ID為空時,訂單非線上銷售,篩出這些數(shù)據(jù)另外存放。

補(bǔ)充sumPrice列,=Quantity*UnitePrice,算出訂單金額

4. 數(shù)據(jù)分析與可視化:

4.1用戶分級

根據(jù)用戶行為構(gòu)建RFM模型, RFM模型是衡量客戶價值和客戶創(chuàng)利能力的重要工具和手段。該模型通過一個客戶的近期交易行為、交易的總體頻率以及交易金額三項指標(biāo)來描述該客戶的價值狀況,依據(jù)這三項指標(biāo)劃分8類客戶價值。

通過數(shù)據(jù)透視表,將客戶ID設(shè)為列,銷售額設(shè)為值,就可得到客戶的交易金額。

通過數(shù)據(jù)透視表,將客戶ID設(shè)為列,時間設(shè)為值,并將時間的值字段設(shè)為最大值,就可得到客戶的最近一次交易日期,用DATEDIF函數(shù)算出時間間隔,我是設(shè)2011/12/10日為當(dāng)前時間。

以發(fā)票號碼、客戶ID、時間三個選項,刪除重復(fù)項。用countif函數(shù)計算出客戶的消費(fèi)次數(shù)。

設(shè)定1-5分對應(yīng)的數(shù)值范圍,通過vlookup函數(shù)匹配,算出R-score,F(xiàn)-score,M-score等列對應(yīng)的分值,再算出各列的平均值,如果大于平均值,為1。小于平均值,為0。最后得出客戶類型。

繪制關(guān)于客戶類型的柱形圖和餅圖:

該平臺的重要價值用戶與流失用戶占比都較大,需針對流失率高制定相應(yīng)的措施。

4.2 銷售情況的描述性統(tǒng)計

4.2.1訂單維度:

通過數(shù)據(jù)透視表,篩選出同一客戶ID,不同時間下的的訂單,匯總訂單的金額及產(chǎn)品件數(shù),但數(shù)據(jù)透視表的時間只能精確到月。點(diǎn)擊更多表格,在原數(shù)據(jù)透視表的基礎(chǔ)上進(jìn)一步建立數(shù)據(jù)透視表。

算出筆單價(每筆訂單的平均交易金額)和連帶率(每筆訂單平均購買的產(chǎn)品件數(shù)):

復(fù)制數(shù)據(jù)到新的工作表。用frequency函數(shù)算出小于等于D列值的單元格數(shù)量,再減去上一行的數(shù)量,可得出區(qū)間內(nèi)的單元格數(shù)量。

點(diǎn)擊數(shù)據(jù)分析,選擇描述性統(tǒng)計,得到描述性統(tǒng)計數(shù)據(jù)。根據(jù)QUARTILE函數(shù)算出1/4分位數(shù)和3/4分位數(shù)。

統(tǒng)計區(qū)間(2010年12月1日-2011年12月9日)內(nèi)共產(chǎn)生有效訂單18310筆,筆單價為478.49英鎊,連帶率為281.67件,說明以批發(fā)性質(zhì)的訂單為主。訂單交易金額和訂單內(nèi)商品數(shù)量,其均值都高于中位數(shù),與Q3分位數(shù)相近。說明訂單總體差異大,存在部分購買力極強(qiáng)的客戶。

通過Power BI繪制訂單交易金額的分布圖:

部分訂單交易金額過大,影響圖表的可讀性,篩去1000英鎊及以上的訂單:

訂單金額集中在400英鎊內(nèi),三個峰值分別為0-20英鎊、110-220英鎊、310-330英鎊。其中300-320英鎊的訂單數(shù)量特別多。

通過Power BI繪制訂單交易數(shù)量的分布圖:

由于小部分離群點(diǎn)使得橫坐標(biāo)的區(qū)間過大,篩去2000件及以上的訂單:

訂單內(nèi)的商品數(shù)量為長尾分布,大部分訂單的商品數(shù)量在300件內(nèi),商品數(shù)量越多,訂單數(shù)相對越少。

為了進(jìn)一步探究訂單交易金額與訂單內(nèi)商品數(shù)量的關(guān)系,繪制散點(diǎn)圖:

由于小部分離群點(diǎn)影響圖表的可讀性,篩去訂單金額大于8000,商品數(shù)量大于6000的部分:

總體來說訂單交易金額與訂單內(nèi)商品件數(shù)是正相關(guān)的,商品數(shù)量越多,訂單金額越大。不過,在商品件數(shù)接近0的時候,也有一部分高價訂單。

4.2.2客戶維度:

數(shù)據(jù)的處理方式與訂單維度相似。通過數(shù)據(jù)透視表,對客戶ID相同的訂單進(jìn)行匯總,得到匯總后的訂單金額、商品數(shù)量、訂單數(shù)量,并用描述性統(tǒng)計,得到描述性統(tǒng)計數(shù)據(jù)。根據(jù)QUARTILE函數(shù)算出1/4分位數(shù)和3/4分位數(shù)。

人均購買筆數(shù)為4筆,中位數(shù)為2筆,25%以上的客戶僅下過一次單,并未留存。每位客戶平均購買了1187件商品,甚至超過了Q3分位數(shù),最多的客戶購買了196915件;客單價為2049英鎊,平均值同樣超過了Q3分位數(shù),說明客戶的購買力存在較大差距,存在小部分的高消費(fèi)用戶拉高了人均數(shù)值。

觀察客戶消費(fèi)金額的分布:

從柱形圖圖看,大部分用戶的消費(fèi)能力確實(shí)不高,高消費(fèi)用戶在圖上幾乎看不到。這也確實(shí)符合消費(fèi)行為的行業(yè)規(guī)律。

篩去消費(fèi)金額大于2500的客戶:

客戶消費(fèi)金額的分布呈現(xiàn)雙峰長尾形態(tài),兩個峰值分別為110-260英鎊,290-420英鎊。

繪制客戶消費(fèi)金額與商品數(shù)量的散點(diǎn)圖:

篩去金額大于20000,商品數(shù)量大于10000的訂單:

客戶群體比較健康,而且規(guī)律性比訂單維度更強(qiáng),同時擁有購買商品數(shù)多和消費(fèi)能力強(qiáng)的用戶??蛻舻南M(fèi)金額與購買的商品數(shù)量呈正相關(guān),客戶購買的商品數(shù)越多,消費(fèi)金額相對就越高。

4.2.3商品維度:

通過數(shù)據(jù)透視表,對貨號相同的訂單進(jìn)行匯總,得到匯總后的訂單金額和商品數(shù)量,商品單價=訂單金額/商品數(shù)量。并用描述性統(tǒng)計,得到描述性統(tǒng)計數(shù)據(jù)。根據(jù)QUARTILE函數(shù)算出1/4分位數(shù)和3/4分位數(shù)。

平均單價為3.15英鎊,中位數(shù)為1.65英鎊,25%以上的商品單價不高于0.85英鎊。75%以上的商品單價不高于3.75英鎊。平均值接近Q3分位數(shù),說明該網(wǎng)站的商品單價存在較大差距,以低于4英鎊的低價商品為主,存在小部分的高價商品拉高了平均值。

繪制商品單價與商品銷量的散點(diǎn)圖,觀察哪種價位的商品更受歡迎:

很明顯,低價位的商品更受歡迎。

繪制商品單價與銷售額的散點(diǎn)圖:

繪制貨號與銷售額及單價的氣泡圖,

氣泡大小代表銷售額,氣泡越大,銷售額越高,氣泡越小,銷售額越低。顏色深淺代表商品單價,越偏青色,商品單價越低,越偏藍(lán)色,商品單價越高。

可以看出較低價位的商品構(gòu)成了銷售額的主要部分,部分單價稍高的商品,雖然銷售的商品數(shù)量不及低價位商品,但憑借單價,也為平臺銷售額做了不小貢獻(xiàn)。平臺可以重點(diǎn)監(jiān)測分析氣泡圖中面積較大的商品,以提高平臺的總銷售額。

4.2.4時間維度:

用數(shù)據(jù)透視表得到不同日期的銷售額、商品銷量與訂單量

用Power BI繪制銷售情況隨月份變化的柱形圖:

可知9月、10月、11月(注:12月只有9天)為平臺的銷售旺季。考慮該平臺主營禮品,可能受節(jié)日影響較大。歐洲重視的萬圣節(jié)(11月1日)、圣誕節(jié)(12月25日)、元旦(1月1日)以及英國主要的購物節(jié)boxing day(12月26日)、以及逐漸成為全球購物節(jié)的黑色星期五(11月第4個星期五)都在年末與圖中的趨勢能夠相呼應(yīng)。

用Power BI繪制銷售情況隨日期變化的折線圖:

可看出銷售額與銷量正相關(guān),出現(xiàn)兩個銷售額與與銷量同時較高的峰值,1月18日與12月9日。篩選出這兩日的數(shù)據(jù)查看情況,發(fā)現(xiàn)都有一筆大訂單。

用Power BI繪制銷售情況在一日內(nèi)隨時間節(jié)點(diǎn)變化的折線圖:

可知9點(diǎn)-11點(diǎn),11:40-15點(diǎn)為平臺的購物高峰期,需加強(qiáng)這段時間對平臺的維護(hù)。

若有商品上新或活動,也可選在該時間段內(nèi)。

4.2.5位置維度:

對國家進(jìn)行分組,增加AvgPrice列(該國家訂單內(nèi)的平均商品價格),人均訂單數(shù)列,人均交易額列,得到下表

可知絕大部分客戶和訂單都來自英國本土,主要境外收入來源也多為英國周邊國家。值得注意的是,Netherlands和EIRE這兩個國家,雖然客戶數(shù)少,但客戶的購買力及客戶的黏性都非常強(qiáng),需做好用戶的維護(hù)。后續(xù)平臺若想增加境外銷售額,可以以這兩個國家為主要目標(biāo)。也可對人均交易額高的國家的客戶進(jìn)行問卷調(diào)查,了解他們接觸平臺的途徑及購物中遇到的問題,后期針對性宣傳和改進(jìn),以提高平臺在境外的銷售額。

5. 總結(jié)

5.1用戶分級

根據(jù)用戶行為構(gòu)建RFM模型,得到8種客戶類型,對不同類型的用戶采用不同的維護(hù)手段。

5.2 訂單維度

筆單價為478.49英鎊,連帶率為281.67件,說明以批發(fā)性質(zhì)的訂單為主。訂單總體差異大,存在部分購買力極強(qiáng)的客戶。訂單內(nèi)的商品數(shù)量為長尾分布,大部分訂單的商品數(shù)量在300件內(nèi),商品數(shù)量越多,訂單數(shù)相對越少。總體來說訂單交易金額與訂單內(nèi)商品件數(shù)是正相關(guān)的,訂單商品數(shù)量越多,訂單金額越大。

5.3 客戶維度

人均購買筆數(shù)為4筆,客單價為2049英鎊,客戶的平均購買商品數(shù)為1187件。25%以上的客戶僅下過一次單,并未留存,說明平臺的留存率不高,需想辦法提高留存??蛻舻馁徺I力存在較大差距,大部分用戶的消費(fèi)能力不高,小部分的高消費(fèi)用戶拉高了人均數(shù)值。客戶的消費(fèi)金額與購買的商品數(shù)量呈正相關(guān),客戶購買的商品數(shù)越多,消費(fèi)金額相對就越高。

5.4 商品維度:

較低價位的商品比較受歡迎。

5.5 時間維度:

9月、10月、11月(注:12月只有9天)為平臺的銷售旺季??紤]該平臺主營禮品,可能受節(jié)日影響較大。如歐洲重視的萬圣節(jié)(11月1日)、圣誕節(jié)(12月25日)、元旦(1月1日),英國主要的購物節(jié)boxing day(12月26日,以及逐漸成為全球購物節(jié)的黑色星期五(11月第4個星期五)等。

9點(diǎn)-11點(diǎn),11:40-15點(diǎn)為平臺的購物高峰期,需加強(qiáng)這段時間對平臺的維護(hù)。若有商品上新或活動,也可選在該時間段內(nèi)。

5.6 區(qū)域維度:

絕大部分客戶和訂單都來自英國本土。英國境外的國家,雖然客戶數(shù)較少,但大部分國家的客戶都有較大潛力。如Netherlands和EIRE這兩個國家,雖然客戶數(shù)少,但客戶的購買力及客戶的黏性都非常強(qiáng),需做好客戶的維護(hù)。還有Australia、Singapore、Japan、Sweden這些國家,客戶的購買力都較強(qiáng)??梢詫@些國家的客戶進(jìn)行問卷調(diào)查,了解他們接觸平臺的途徑及購物中遇到的問題,后期針對性宣傳和改進(jìn),以提高平臺在境外的銷售額。

關(guān)鍵詞:數(shù)據(jù),分析

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉