數(shù)據(jù)分析步驟1.提出問題:正所謂有了問題才需要去針對性地分析數(shù)據(jù),從數(shù)據(jù)中得到問題的答案,脫離問題對數(shù)據(jù)分析得再透徹也是無用之功。

2.理解數(shù)據(jù):第二步理解數(shù)據(jù)中" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務 > 用excel對電商數(shù)據(jù)進行數(shù)據(jù)分析

用excel對電商數(shù)據(jù)進行數(shù)據(jù)分析

時間:2023-03-15 22:10:01 | 來源:電子商務

時間:2023-03-15 22:10:01 來源:電子商務

我們使用excel進行數(shù)據(jù)分析時,通常會經(jīng)歷五個步驟。

數(shù)據(jù)分析步驟
1.提出問題:正所謂有了問題才需要去針對性地分析數(shù)據(jù),從數(shù)據(jù)中得到問題的答案,脫離問題對數(shù)據(jù)分析得再透徹也是無用之功。

2.理解數(shù)據(jù):第二步理解數(shù)據(jù)中包含兩個小的方面,首先是針對要解決的問題采集相應的數(shù)據(jù)集,其次是查看數(shù)據(jù)集中的信息,了解每個字段的意義和數(shù)據(jù)集的描述性統(tǒng)計信息。

3.數(shù)據(jù)清洗:也就是數(shù)據(jù)的預處理,這占據(jù)了數(shù)據(jù)分析的大部分時間。只有清洗完成的數(shù)據(jù)才能用于之后的分析。數(shù)據(jù)清洗大致可分為七個步驟(選擇子集、列名重命名、刪除重復值、缺失值處理、一致化處理、數(shù)據(jù)排序、異常值處理),每一步都需要針對具體情況具體分析。

4.構建模型:也就是對清洗完成后的數(shù)據(jù)進行數(shù)據(jù)分析,通常是對業(yè)務問題進行具體分析,得出問題的答案。簡單的構建模型是進行一些描述性統(tǒng)計分析,得出一些業(yè)務指標,而復雜的就需要用到機器學習方面的知識。

5.數(shù)據(jù)可視化:也就是將分析問題得出的結果用圖形展示出來。

接上一節(jié),我們可以用這五步對嬰兒用品的電商數(shù)據(jù)進行分析

一、提出問題

上一節(jié)中提出了三個問題:

①哪些類別的產(chǎn)品銷量很好,細分到類別下的二級分類,又是哪些種類非常暢銷?

②男嬰兒購買信息中哪幾類最為暢銷,女嬰兒哪幾類更為熱賣?

③在暢銷的產(chǎn)品中按類別分類,分析出時間對產(chǎn)品銷量的影響。

二、理解數(shù)據(jù)

為了解決相應的問題,采集到與問題相關的數(shù)據(jù)集,接下來要理解數(shù)據(jù)集中的信息。

表1中的數(shù)據(jù)集:

用戶ID:是用戶在網(wǎng)站或APP上使用的購買賬號,也是用戶唯一標識

購買行為編號:記錄用戶在購買某件商品時的購買行為,是購買的唯一標識,

商品種類ID(一級):反映用戶購買的某件商品屬于哪一大類

商品類別ID(二級):反映用戶購買的商品屬于哪一類別,是上一字段大類中的分類

商品屬性:類似長度,厚度,商品品牌等一系列屬性值

購買數(shù)量:用戶對某件商品的下單量

購買時間:用戶購買商品的時間

表2中的數(shù)據(jù)集:

用戶ID:用戶購買商品時所用的賬號ID,是唯一標識

出生日期:嬰兒的出生日期

性別:嬰兒的性別,0為男性;1為女性

三、數(shù)據(jù)清洗

1.選擇子集 :由于購買行為編號和商品屬性對我們分析的問題沒有意義,故將其隱藏,以便于我們的分析。(但是購買行為編號是唯一標識,在用戶編號這一唯一標識缺失值時,可以拿出來判別其他數(shù)據(jù)是否缺失)。

表1 隱藏后的數(shù)據(jù)集截圖
表2 數(shù)據(jù)集截圖
2.列名重命名:由于兩張表的字段已經(jīng)非常便于理解,所以無需重命名。

3.刪除重復值:對兩張表分別在數(shù)據(jù)選項之下按照用戶編號這一唯一標識刪除重復值,發(fā)現(xiàn)沒有重復的數(shù)值。

4.缺失值處理:表1中每列數(shù)據(jù)計數(shù)都為29972(除了商品屬性值,但是對分析問題沒有影響,所以不必處理),表2中每列數(shù)據(jù)計數(shù)都為954,沒有缺失值。

5.一致化處理:觀察數(shù)據(jù)集中的數(shù)據(jù),發(fā)現(xiàn)表1中的購買時間和表2中的出生日期沒有按照相應的日期格式顯示,會影響到后面的分析。故對其進行分列+設置單元格格式的方法設置成標準日期格式。

表1 一致化處理后的數(shù)據(jù)截圖
表1 一致化處理后的數(shù)據(jù)截圖
6.數(shù)據(jù)排序:將表1中的數(shù)據(jù)按照購買數(shù)量進行降序排序

表1 降序后的截圖
可以發(fā)現(xiàn)單個用戶一次購買數(shù)量最多的是10000,可以得到相應的商品種類等其他相關信息。

7.異常值處理:結合業(yè)務問題實際判定是否為異常值。

四、構建模型

以上就是清洗完成后的數(shù)據(jù),之后需要對數(shù)據(jù)進行分析。首先可以通過excel自帶的分析工具庫得到購買數(shù)量的一些描述性統(tǒng)計分析。

購買數(shù)量描述性統(tǒng)計分析截圖
接下來對于業(yè)務問題進行針對性分析

①哪些類別的產(chǎn)品銷量很好,細分到類別下的二級分類,又是哪些種類非常暢銷?

插入數(shù)據(jù)透視表,把商品類別ID(一級)拖入行中,求和項購買數(shù)量拖入值中,獲得商品類別和購買數(shù)量之間的關系,并按照購買數(shù)量降序排序。

商品類別(一級) 購買數(shù)量數(shù)據(jù)透視圖
我們?nèi)≠徺I數(shù)量最多的前三類定義為暢銷,可以發(fā)現(xiàn)商品類別ID(一級)中最為暢銷的是28,50014815,50008168。

由于商品類別(一級)下的商品種類繁多,放在一起分析數(shù)據(jù)過長不太好查找,需要對每個暢銷商品單獨進行分析。這里需要用到篩選這一功能把大類相同的數(shù)據(jù)篩選出來,并且復制到另外一張表中進行分析。(因為數(shù)據(jù)透視表只會對所有數(shù)據(jù)進行分析)

28大類下各種類購買數(shù)量截圖
可以發(fā)現(xiàn)28這一一級分類下最為暢銷的三種商品種類是50011993,50012788,50003700。

可以同樣的方法對另外兩個大類的暢銷產(chǎn)品進行分析。分別得到數(shù)據(jù)透視圖:

50014815大類下各種類購買數(shù)量截圖
5008168大類下各種類購買數(shù)量截圖
可以發(fā)現(xiàn)50014815這一大類下最為暢銷的三種商品是50018831,50006520,50012564;50008168大類下最為暢銷的是50007016,50013636,50006602。

②男嬰兒購買信息中哪幾類最為暢銷,女嬰兒哪幾類更為熱賣?

由于要從嬰兒的性別入手進行分析,需要通過vlookup功能借助兩張表的共同字段用戶ID將表1中的商品類別,商品種類,購買數(shù)量這三個信息對應地查詢到表2中。

使用vlookup之后的表2中數(shù)據(jù)集
由于要對不同性別的嬰兒進行分析,需要將不同性別對應的購買信息篩選出來,復制到新的表中進行分析,其中0為男性,1為女性(發(fā)現(xiàn)還有性別為2的存在,通過篩選剔除掉這些數(shù)據(jù)進行分析)。這里先對男嬰兒進行分析,獲得行為購買種類(二級),列為購買類別(一級),值為購買數(shù)量求和的數(shù)據(jù)分析表:

男嬰兒各種類商品購買數(shù)量截圖
發(fā)現(xiàn)男嬰兒中賣的最好的三種商品是50014815大類下的50018831(簡記為50014815-50018831),50008168-50013636,50014815-50012456。

同樣地,對女嬰兒進行分析,獲得數(shù)據(jù)透視表:

女嬰兒各種類商品購買數(shù)量截圖
發(fā)現(xiàn)女嬰兒中賣的最好的三種商品是50008168-50013636,50008168-50010558,50008168-50006602。

③在暢銷的產(chǎn)品中按類別分類,分析出時間對產(chǎn)品銷量的影響。

通過問題1已經(jīng)獲得暢銷的商品類別以及這一類下的暢銷商品種類,這里只針對28這一商品大類進行分析討論。首先對問題①中獲得的暢銷商品28-50011993進行分析,將商品信息篩選出來繪制數(shù)據(jù)分析表,

28-50011993商品購買數(shù)量跟時間關系
由于數(shù)據(jù)中信息年份跨度很小,按年份分析沒有什么意義,這里只將季度和月份組合進行分析。發(fā)現(xiàn)28-50011993這類商品在第一季度和第四季度比較好賣,特別是1月,11月,12月賣的特別好,可以推測出這種商品在天氣冷的時候需求量比較大。

接著對28-50012788這類商品進行分析,得出數(shù)據(jù)透視表:

28-50012788商品購買數(shù)量跟時間關系
可以發(fā)現(xiàn),這類商品主要在12月需求量特別高,其他月份需求量很低,可以把主要重心放到12月,其余月份保證一定的數(shù)量即可。

最后,對28-50003700商品進行分析,獲得數(shù)據(jù)透視表:

28-50003700商品購買數(shù)量跟時間關系
這類商品購買數(shù)量跟時間之間沒有明顯的變化關系,全年都有一定的需求量,其中1月3月5月賣的特別好,可以在前兩個季度稍微增加商品數(shù)量。

關鍵詞:數(shù)據(jù),分析

74
73
25
news

版權所有? 億企邦 1997-2025 保留一切法律許可權利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關閉