国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務(wù) > 電商數(shù)據(jù)探索分析

電商數(shù)據(jù)探索分析

時(shí)間:2023-03-15 20:54:01 | 來源:電子商務(wù)

時(shí)間:2023-03-15 20:54:01 來源:電子商務(wù)

電商數(shù)據(jù)探索分析

現(xiàn)在根據(jù)數(shù)據(jù)集母嬰產(chǎn)品的表一和表二進(jìn)行探索性分析,主要分析目的是產(chǎn)品的銷量與哪些因素有關(guān),哪些因素影響較大,哪些因素影響較少,以及根據(jù)這些因素制定可能提高銷量的辦法!分析的步驟主要有明確分析問題、理解數(shù)據(jù)、數(shù)據(jù)清洗和數(shù)據(jù)分析等過程,下面就將對各個步驟進(jìn)行具體闡述!

一、明確分析問題

數(shù)據(jù)分析的第一步就是要明確分析問題,知道我們要分析什么,才好做后面的工作!明確分析問題可以從兩個方面著手,第一可以從我們實(shí)際工作中遇到的問題下手,以問題為導(dǎo)向來進(jìn)行分析,解決實(shí)際工作困難,提高工作效率為方向!第二個可以從數(shù)據(jù)集方面著手,數(shù)據(jù)集里面有哪些數(shù)據(jù),各個數(shù)據(jù)里面相互有什么關(guān)系,從這些關(guān)系中可以分析哪些問題!我們這次拿到的數(shù)據(jù)是電商平臺母嬰產(chǎn)品客戶下單的相關(guān)數(shù)據(jù),做電商最重要的目的就是提高產(chǎn)品的銷量,而且數(shù)據(jù)表里面也有銷量的相關(guān)數(shù)據(jù)。因此我們可以分析產(chǎn)品的銷量與哪些因素有關(guān),哪些因素影響較大,哪些因素影響較少等問題,以銷量問題作為主要方向來進(jìn)行分析!

二、理解數(shù)據(jù)

理解數(shù)據(jù)是做好數(shù)據(jù)分析的基礎(chǔ)工作,就像讀書時(shí)看一篇文章一樣,只有先理解這篇文章的關(guān)鍵字和詞的意思,才能夠把握文章的中心思想和作者觀點(diǎn)!那么我們進(jìn)行數(shù)據(jù)分析,前提就是要理解好數(shù)據(jù)表格里面各個列名的含義,知道它們在數(shù)據(jù)集的意義和作用!先把數(shù)據(jù)集里面的各個列名截取出來,再各個分析!

數(shù)據(jù)表格里面紅色圈住的就是各個數(shù)據(jù)的列名,想要更好的理解首先最好是把它翻譯成中文。

user_id:用戶id

auction_id:物品編號(item_id)

cat_id: 商品種類ID(商品二級分類,表示商品屬于哪個類別)

cat1: 商品種類ID(商品一級分類,表示商品屬于哪個類別)

buy_mount:購買數(shù)量

day:購買時(shí)間(是個時(shí)間戳格式,可以通過excel將時(shí)間戳顯示未日期格式)

user_id:用戶id

birthday:出生日期

gender:性別(0女性;1男性;2未知的性別)

當(dāng)我們把各個數(shù)據(jù)的英文列名翻譯成中文之后,也就非常清楚各個列的數(shù)據(jù)含義,沒有什么難懂深奧的詞語,現(xiàn)在就可以進(jìn)行下面一步!

三、數(shù)據(jù)清洗

數(shù)據(jù)清洗環(huán)節(jié),是我們從獲得雜亂無章的原始數(shù)據(jù)時(shí),按照一定的規(guī)則和方法對數(shù)據(jù)進(jìn)行一系列整理工作,以方便我們后面對它進(jìn)行正確的分析!數(shù)據(jù)清洗是數(shù)據(jù)分析的重要工作,也是分析過程中消耗時(shí)間最長的環(huán)節(jié)!它有很多的具體操作步驟,下面就對數(shù)據(jù)清洗的各個步驟進(jìn)行詳細(xì)講解!

1.選擇子集

選擇子集主要是因?yàn)閿?shù)據(jù)過于多且,為了不影響我們對數(shù)據(jù)正常的觀看,把不要的數(shù)據(jù)暫時(shí)隱藏起來,等需要的時(shí)候再把它展現(xiàn)出來!在數(shù)據(jù)集里面有兩個列名都是商品種類,可以現(xiàn)在隱藏其中一個!我選擇將D列進(jìn)行隱藏,隱藏后如下圖所示。

2.列名重命名

由于現(xiàn)在數(shù)據(jù)表里面的列名都是英文名稱,不習(xí)慣用英文來進(jìn)行數(shù)據(jù)的各項(xiàng)操作,現(xiàn)在把各個列名換成中文名,如下圖所示!

3.刪除重復(fù)值

在現(xiàn)有的數(shù)據(jù)集里面,有很多的數(shù)據(jù)可能是已經(jīng)重復(fù)出現(xiàn)。對于這些重復(fù)出現(xiàn)的數(shù)據(jù)對我們數(shù)據(jù)分析沒有什么價(jià)值,只會干擾我們做出任何判斷,于是我們要把它找出來并刪除掉。在這些字段中物品編號是每個產(chǎn)品唯一標(biāo)識,也就是說每個產(chǎn)品都只有唯一的物品編號。我們可以以物品編號作為重復(fù)的標(biāo)準(zhǔn),刪除物品編號相同的數(shù)據(jù),如下圖所示!

4.缺失值處理

這一步就是要統(tǒng)計(jì)一下數(shù)據(jù)表里面有沒有缺失值的情況,并對缺失值進(jìn)行處理。查看有沒有缺失值方法也很簡單,就是分別單擊各個數(shù)據(jù)字段,選中整列數(shù)據(jù),在數(shù)據(jù)表的最下面有一個計(jì)數(shù),如果沒有缺失值的話,各個列的計(jì)數(shù)是相同的,如果有缺失值,那么就有個邊列的計(jì)數(shù)會少于其他列,說明有缺失值。通過具體操作發(fā)現(xiàn)商品屬性這一列的計(jì)數(shù)是28279,而其他列的計(jì)數(shù)是28423,也就是少了144個數(shù)據(jù)。然后通過對整列進(jìn)行空值定位,找到缺失值后再進(jìn)行刪除!現(xiàn)在所有的列計(jì)數(shù)都是28279,就沒有出現(xiàn)缺失值了!

5.一致化處理

根據(jù)數(shù)據(jù)表的現(xiàn)有的數(shù)據(jù),發(fā)現(xiàn)購買時(shí)間這一列還是數(shù)字格式,沒有換成時(shí)間格式,還有性別這一項(xiàng)是用0和1表示,沒有換成我們熟悉的男女文字?,F(xiàn)在通過對數(shù)據(jù)的分列和單元格格式設(shè)置以及函數(shù)來操作調(diào)整,效果如下圖所示!

6.數(shù)據(jù)排序

下面這一步,就是針對已經(jīng)整理的數(shù)據(jù),對數(shù)據(jù)集按一定的規(guī)則進(jìn)行排序規(guī)則。一般情況下,大家最關(guān)心哪個數(shù)據(jù)就對哪個數(shù)據(jù)排序,在這個數(shù)據(jù)集里面,大家一般都對產(chǎn)品的銷量比較關(guān)心,就以銷量作為標(biāo)準(zhǔn)從大到小進(jìn)行排序,排序后效果如圖所示:

7.異常值處理

數(shù)據(jù)清洗的最后一步就是對原始數(shù)據(jù)進(jìn)行異常值的處理,要想處理異常時(shí),首先要發(fā)現(xiàn)異常在哪里,我們才好對它進(jìn)行處理。發(fā)現(xiàn)異常值最好的辦法就是建立數(shù)據(jù)透視表進(jìn)行觀察,原始數(shù)據(jù)太過龐大,一時(shí)很難發(fā)現(xiàn)異常。而在數(shù)據(jù)透視表里面可以對數(shù)據(jù)進(jìn)行不同維度的觀察和了解,達(dá)到總攬全局的效果!下面就是針對表二建立數(shù)據(jù)透視表如圖所示:

從上面的數(shù)據(jù)透視表里面可以看出,第一個異常的地方就是時(shí)間問題,1984年估計(jì)互聯(lián)網(wǎng)還沒有出來吧,阿里巴巴也才1999年才成立,怎么可能有人在1984年通過電商平臺購物呢,所以這個肯定是異常值。第二個問題就是有一部分?jǐn)?shù)據(jù)是未知性別,這一點(diǎn)不符合常理,也屬于異常值!根據(jù)生活常識70年代的人,醫(yī)學(xué)就能夠在母親胎中鑒別男女了,這也是為什么導(dǎo)致現(xiàn)在男多女少比例失衡的原因。而數(shù)據(jù)中13-15年出生的嬰兒竟然不知道性別,除了數(shù)據(jù)異常我實(shí)在想不出其他的原因!既然是異常值,找到之后就把它做刪除處理,刪除后效圖所示:

四、數(shù)據(jù)分析

通過上面對數(shù)據(jù)集的明確分析問題、理解數(shù)據(jù)意義和數(shù)據(jù)進(jìn)行一系列的清洗等步驟,現(xiàn)在終于到了最關(guān)鍵最重要的一步,數(shù)據(jù)分析工作!

1.嬰兒年齡與銷量有什么關(guān)系

根據(jù)上圖年齡與銷量的透視表可以看出,隨著年齡越大,產(chǎn)品銷量就會越低,產(chǎn)品的銷量主要集中在0-3歲之間嬰幼兒之間,這段時(shí)間的嬰幼兒身體變化最快,產(chǎn)品需要量巨大!

2.性別與銷量的關(guān)系

根據(jù)上圖性別與銷量的透視表中可以看出,整體趨勢是女性產(chǎn)品銷量要遠(yuǎn)大于男性銷量,雖然還有少部分性別是未知的銷量,但是不影響整體的判斷,還且在電商平臺購買女性產(chǎn)品的時(shí)間也要比男性要早兩年!

3.時(shí)間與銷量的關(guān)系

根據(jù)上圖時(shí)間與銷量的透視表中可以看出,整體趨勢是從02年到15年這段時(shí)間里面,產(chǎn)品的銷量隨著時(shí)間逐年提升,除了15年的數(shù)據(jù)記錄的不是很完整,可以暫時(shí)不計(jì)!從11年到14年這段時(shí)間,產(chǎn)品銷量逐步穩(wěn)定在300多左右。從季節(jié)角度分析,第四季度銷量最好,這段時(shí)間大部分處于冬季,而第二季銷量比較平淡,這段時(shí)間大部分處于夏季,第一、三季度產(chǎn)品銷量比較平穩(wěn),大部分處于春秋季節(jié)!

關(guān)鍵詞:分析,數(shù)據(jù)

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉