電商母嬰數(shù)據(jù)分析
時(shí)間:2023-03-26 04:08:01 | 來源:電子商務(wù)
時(shí)間:2023-03-26 04:08:01 來源:電子商務(wù)
上一篇文章我們通過對描述統(tǒng)計(jì)分析的學(xué)習(xí)對電商母嬰數(shù)據(jù)進(jìn)行了初步的了解,那么如何通過Excel進(jìn)行數(shù)據(jù)分析來制定公司下一步的銷售計(jì)劃呢?其實(shí)我們可以通過以下5個(gè)步驟進(jìn)行。
①
明確目標(biāo):基于業(yè)務(wù)出發(fā),明確自己最終想要獲取的信息是什么。
②
理解數(shù)據(jù):采集數(shù)據(jù)、數(shù)據(jù)信息、對字段進(jìn)行理解 。
③
數(shù)據(jù)清洗:在理解數(shù)據(jù)的基礎(chǔ)上我們要進(jìn)行基礎(chǔ)的數(shù)據(jù)預(yù)清洗,把不需要的字段隱藏,對列名進(jìn)行處理并刪除重復(fù)值,缺失值處理,一致化處理,數(shù)據(jù)排序,異常值處理。
④
數(shù)據(jù)分析:描述統(tǒng)計(jì)、數(shù)據(jù)透視表、數(shù)據(jù)分組、函數(shù)的應(yīng)用、組合結(jié)果。
⑤
數(shù)據(jù)可視化:為了讓客戶更直觀的理解數(shù)據(jù),可利用Tableau等工具對數(shù)據(jù)進(jìn)行可視化處理。
接下來我們就可以按照上述步驟對上一篇文章中的母嬰數(shù)據(jù)進(jìn)行分析啦!
①
明確目標(biāo):2020已過大半,下半年淘寶京東會推出各種購物節(jié)活動,假設(shè)本公司為了使母嬰產(chǎn)品都想以便有針對性上線各類打折活動:
a) 不同種類商品銷量和時(shí)間的關(guān)系?b) 不同性別的寶寶對不同商品類別的需求是否有差異?理解數(shù)據(jù):現(xiàn)在我們手頭現(xiàn)有的數(shù)據(jù)如下
① 表一:購買商品
表一中共包含29971條,7個(gè)字段:user_id: 用戶id;auction_id: 物品編號(item_id);cat_id: 商品種類ID(二級類); cat1:商品種類ID(一級類);property:商品屬性;buy_mount: 購買數(shù)量;day: 購買時(shí)間。
② 表二:嬰兒信息
表二中包含954條信息,3個(gè)字段:user_id: 用戶id;birthday: 出生日期;gender:性別(0女性;1男性;2未知的性別)??赏ㄟ^鏈接兩個(gè)表格得知不同性別的嬰兒對何種商品需求量更大。
② 數(shù)據(jù)清洗:a) 選擇子集:我們需要表一、表二中需要的有效數(shù)據(jù)留下,其他做隱藏處理。表一(商品列表)中,我們選擇將物品編號隱藏起來,圖表二保留原狀。
b) 列名重命名
c) 刪除重復(fù)值:我們對用戶ID進(jìn)行了重復(fù)值刪除,共發(fā)現(xiàn)27條個(gè)重復(fù)值;表二中未發(fā)現(xiàn)重復(fù)值。
d) 缺失值處理:總數(shù)29945,表一中商品屬性字段中共缺失142條數(shù)據(jù),表二中無數(shù)據(jù)缺失,由于缺失值較少,對整體結(jié)果的影響也較小,所以此時(shí)我們選擇不做處理。
e) 一致化處理:經(jīng)檢查發(fā)現(xiàn),我們只需要對表一表二日期進(jìn)行一致化處理,處理結(jié)果如下(只展示表一部分?jǐn)?shù)據(jù)):
f) 數(shù)據(jù)排序: 根據(jù)我們此次數(shù)據(jù)分析的目的,我們選擇對表一中的購買數(shù)量進(jìn)行降序排序。得出如下結(jié)果:
g) 異常值處理:將表二中的性別中2全部替換為未知,1替換為男,0替換為女4。通過VLOOKUP函數(shù)將表一表二鏈接起來并計(jì)算出用戶年齡(運(yùn)用DATEDIF函數(shù),年齡中的-1代表未出生,0歲代表未達(dá)1歲的小寶寶。)處理后數(shù)據(jù)如下:
③ 數(shù)據(jù)分析/數(shù)據(jù)可視化(數(shù)據(jù)可視化將在下一章進(jìn)行展示)a) 不同種類商品銷量和時(shí)間的關(guān)系?這個(gè)問題我們可以通過建立一個(gè)透視表來解決,我們可以發(fā)現(xiàn)每年
11月份是母嬰產(chǎn)品的銷售旺季
b) 不同性別寶寶更喜歡哪些品類?通過建立數(shù)據(jù)透視表可以看出,男女寶寶對一類、二類產(chǎn)品的需求量還是有區(qū)別的。
以上就是通過使用Excel進(jìn)行的初級母嬰數(shù)據(jù)的分析,新手操作起來還是有點(diǎn)費(fèi)勁,思維也不是太能跟上,僅供參考~ 下一篇文章我們將會看到如何用數(shù)據(jù)可視化的形式更直觀的感受數(shù)據(jù)!下次見吧~~beybey~