我們還是以之前的數(shù)據(jù)集,包括淘寶和天貓購買商品的文件來開始進(jìn)行數(shù)據(jù)分析。試圖解決銷售暢銷的品種是哪些,不同的時(shí)間會(huì)有什么影響,銷售不同類別商品的占比,嬰兒用品關(guān)于不同年齡段的分布,性別因素" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務(wù) > 以電商數(shù)據(jù)為例進(jìn)行數(shù)據(jù)分析

以電商數(shù)據(jù)為例進(jìn)行數(shù)據(jù)分析

時(shí)間:2023-03-15 20:04:01 | 來源:電子商務(wù)

時(shí)間:2023-03-15 20:04:01 來源:電子商務(wù)

一、明確問題

我們還是以之前的數(shù)據(jù)集,包括淘寶和天貓購買商品的文件來開始進(jìn)行數(shù)據(jù)分析。試圖解決銷售暢銷的品種是哪些,不同的時(shí)間會(huì)有什么影響,銷售不同類別商品的占比,嬰兒用品關(guān)于不同年齡段的分布,性別因素是否會(huì)影響等。

二、理解數(shù)據(jù)

數(shù)據(jù)來源

阿里巴巴天池 https://tianchi.aliyun.com/dataset/dataDetail?dataId=45

數(shù)據(jù)集包括2個(gè)excel文件,表1淘寶購買商品和表2天貓嬰兒信息的數(shù)據(jù)來描述。

A:表1購買商品一共有29971條記錄,7個(gè)字段:

user_id:用戶id

auction_id:物品編號(hào)(item_id)

cat_id: 商品種類ID(商品二級(jí)分類,表示商品屬于哪個(gè)類別)

cat1: 商品種類ID(商品一級(jí)分類,表示商品屬于哪個(gè)類別)

(cat1和cat_id分別是商品的一級(jí)分類和二級(jí)分類,比如上衣和衣服,汽車和玩具汽車這樣的關(guān)系。雖然都是數(shù)字串id,但是根據(jù)這層關(guān)系,就可以用數(shù)據(jù)透視表來展示邏輯關(guān)系。比如商品大類下面,哪個(gè)分類更暢銷)

property:商品屬性(屬性值可以是大小,可以是尺碼、毫升等數(shù)字,還可以指品牌等,一切可以描述商品特征的都可以稱為屬性值)

buy_mount:購買數(shù)量

day:購買時(shí)間(是個(gè)時(shí)間戳格式,可以通過excel將時(shí)間戳顯示未日期格式)

B:表2嬰兒信息表一共有953條記錄,3個(gè)字段:

user_id:用戶id

birthday:出生日期

gender:性別(0女性;1男性;2未知的性別)

三、數(shù)據(jù)清洗

數(shù)據(jù)清洗大致分為7步,我們通過反復(fù)的清洗來梳理出需要分析指標(biāo)的數(shù)據(jù),為之后的數(shù)據(jù)指標(biāo)分析打下堅(jiān)實(shí)基礎(chǔ)。在開始進(jìn)行數(shù)據(jù)清洗時(shí),我們可以復(fù)制原始數(shù)據(jù)工作表保留原始數(shù)據(jù)并重命名“清洗”工作表進(jìn)行數(shù)據(jù)清洗操作。

3.1選擇子集

選擇子集是我們需要選擇感興趣的或者相關(guān)分析需要的列,其他列可以進(jìn)行隱藏。

表1中“property”列是商品屬性,包括大小,可以是尺碼、毫升等數(shù)字,還可以指品牌等一切可以描述商品特征。在進(jìn)行更細(xì)致的對(duì)于某個(gè)特定商品屬性分析時(shí)會(huì)用到,這里暫時(shí)不需要可以隱藏。

在開始-格式-可見性下有隱藏和取消隱藏的選項(xiàng),可以進(jìn)行行或者列的取消和隱藏。

3.2列名重命名

由于表1表2中的列名均為英文,為了方便交流和展示,將列名全部修改為中文。雙擊列名即可進(jìn)行修改。

3.3刪除重復(fù)值

全選表格在數(shù)據(jù)-刪除重復(fù)值中選擇

在表1表2中均為發(fā)現(xiàn)重復(fù)值。

3.4缺失值處理

表1的單列計(jì)數(shù)均為29972,表2的單列計(jì)數(shù)均為954,沒有缺失值需要處理,說明獲取的數(shù)據(jù)信息比較完整。我們可以通過條件定位來快速定位缺失值進(jìn)行操作。

3.5一致化處理

適合用于一個(gè)單元格里有多個(gè)數(shù)據(jù)的情況,需要進(jìn)行分列操作。分列會(huì)覆蓋原有的單元格,我們需要先復(fù)制到表格最后進(jìn)行操作。此例里只有表1中“property:商品屬性”這一列有多個(gè)數(shù)據(jù),因不需要在此不做具體操作。操作在數(shù)據(jù)-分列進(jìn)行選擇。

在需要查找和字符串截取時(shí)需要用到:find查找, left、right、mid關(guān)于字符串所在單元格位置,和len截取函數(shù)。

3.6數(shù)據(jù)排序

通過需要的不同指標(biāo)來對(duì)數(shù)據(jù)進(jìn)行升序或者降序的排列,方便比較。在開始-排序和篩選中操作。我們對(duì)表1中購買數(shù)量進(jìn)行降序排列可以直觀的看到購買數(shù)量的較多的數(shù)據(jù)。

3.7異常值處理

我們通過對(duì)表格的不同操作,可能會(huì)出現(xiàn)異常值,需要用到數(shù)據(jù)透視表功能,包括:數(shù)據(jù)分組、應(yīng)用函數(shù)和組合結(jié)果。

四、數(shù)據(jù)分析

4.1 商品種類和時(shí)間的關(guān)系

調(diào)整日期格式,-數(shù)據(jù)-分列-第三步日期YMD,如還需要調(diào)整設(shè)置單元格格式-自定義為“yyyy/m/d”。

根據(jù)數(shù)據(jù)透視表操作,通過不同年度商品一級(jí)商品種類的購買量,來找到暢銷商品的種類,在一級(jí)種類里銷量前三的品類依次為:“28”“50014815”“50014815”,分別占比為:“37.44%”“25.92%”“24.65%”。此三類產(chǎn)品為暢銷產(chǎn)品占總體的近88%。關(guān)于年度增長趨勢,2012年數(shù)據(jù)為下半年的6個(gè)月,2015年為1、2月份不是整年的數(shù)據(jù),只能進(jìn)行同時(shí)間段的數(shù)據(jù)比較。13-14年“50014815”“50014815”這兩種商品的增長比較快,具體各種類的子類可以通過同樣方式加入二級(jí)種類和時(shí)間加入季度來分析,可以進(jìn)行更精細(xì)的商品存貨訂單的調(diào)整。

4.2母嬰商品和性別的關(guān)系

通過共事-插入函數(shù)-vlookup來查找出母嬰用品的商品種類、購買數(shù)量和購買時(shí)間三項(xiàng)。分別將數(shù)字和性別進(jìn)行替換:0女性;1男性;2未知。

根據(jù)數(shù)據(jù)透視表操作,得到性別和各類嬰兒商品購買的關(guān)系,嬰兒用品暢銷的種類是“50014815”“50008168”“28”,一共占據(jù)80%的數(shù)量。其中女性嬰兒用品的購買占比60.69%遠(yuǎn)超過男性嬰兒的36.44%,近乎2倍的關(guān)系。但是此處沒有考慮其他的因素,以及只有952條數(shù)據(jù),數(shù)量比較少,需要其他因素對(duì)比進(jìn)一步分析。

4.3母嬰商品和年齡的關(guān)系

使用datedif公式通過購買時(shí)間和出生日期來計(jì)算出嬰兒年齡。有一個(gè)潛規(guī)則:第一個(gè)參數(shù)(起始日期)必須小于第二個(gè)參數(shù)(結(jié)束日期),否則就會(huì)返回#NUM。我們替換為“未出生”。有一個(gè)年齡28的異常數(shù)據(jù),只有一條數(shù)據(jù)可以進(jìn)行刪除。

根據(jù)數(shù)據(jù)透視表操作,得到年齡和各類嬰兒商品購買的關(guān)系。從未出生-3歲間這四個(gè)階段的購買量比較大占82.72%,其中0歲的嬰兒占比最大35.66%,其他依次為1歲占21.51%、未出生占15.32%、2歲占10.32%。但是此處沒有考慮其他的因素,以及只有952條數(shù)據(jù),數(shù)量比較少,需要其他因素對(duì)比進(jìn)一步分析。但是此處沒有考慮其他的因素,以及只有952條數(shù)據(jù),數(shù)量比較少,需要其他因素對(duì)比進(jìn)一步分析。

總結(jié)

我們通過數(shù)據(jù)集商品購買信息表和嬰兒信息表為例,通過明確問題、理解數(shù)據(jù)、數(shù)據(jù)清洗的步驟進(jìn)行了數(shù)據(jù)分析。并且梳理了數(shù)據(jù)清洗的7個(gè)步驟。

關(guān)鍵詞:數(shù)據(jù),分析

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點(diǎn)擊下載Chrome瀏覽器
關(guān)閉