對電商數(shù)據(jù)的業(yè)務(wù)分析
時間:2023-03-15 23:10:01 | 來源:電子商務(wù)
時間:2023-03-15 23:10:01 來源:電子商務(wù)
從第三講的live學(xué)習(xí)中,熟悉了數(shù)據(jù)清洗的步驟:選擇子集、列的重命名、刪除重復(fù)值、缺失值處理、一致化處理(無統(tǒng)一命名)、數(shù)據(jù)排序、異常值處理。熟悉了if find mid left vlookup函數(shù),初步熟悉了透視表的運用。接下來運用以上知識對第表1購買商品、表2嬰兒信息進行數(shù)據(jù)清洗。
第一步:將原始數(shù)據(jù)另存為兩張新表,且加上后綴“清洗數(shù)據(jù)”,將原始數(shù)據(jù)另存為兩張新表,且加上后綴“清洗數(shù)據(jù)”
第二步:刪除重復(fù)值。用戶編號是每個用戶的唯一編號,如果有重復(fù)的數(shù)據(jù)項,需要對其進行清理。選中用戶編號列,點擊數(shù)據(jù)選項卡下的刪除選項項如下圖:
第三步:簡查缺失值。點擊用戶編號、購買行為編號、商品種類編號、商品類別、購買數(shù)量、購買時間,查看右下角計數(shù)為“29945”,商品屬性列僅有“29803”,存在缺失值,因商品屬于無規(guī)律可行,無法補充,不做處理。
第四步,使用分列功能,將購買日期列中的數(shù)值轉(zhuǎn)換為標(biāo)準(zhǔn)日期格式Y(jié)MD。同樣的,對嬰兒信息表的出生日期也進行同樣的操作。
第五步,在此數(shù)據(jù)集中,暫時未發(fā)現(xiàn)需要進行其他數(shù)據(jù)清洗工作的情況(如數(shù)據(jù)異常值、數(shù)據(jù)一致化等),因此進行下一步工作,進行數(shù)據(jù)統(tǒng)計和建模工作。
1、查看一級商品分類的購買量統(tǒng)計
使用數(shù)據(jù)透視表功能,統(tǒng)計“一級商品分類”的銷售量,得出如下結(jié)果,其中商品類別“50008168”的購買數(shù)量最多。
2、查看一級商品分類的購買量統(tǒng)計
使用數(shù)據(jù)透視表功能,統(tǒng)計“一級商品分類”的銷售量,得出如下結(jié)果,其中商品類別“50013636、50010558、50013207”的購買數(shù)量最排至前三。
3、按購買時間查看一下一類商品和二類商品在每年和每季度的匯總購買量。從中可以看到每季度排名前三的暢銷產(chǎn)品,后續(xù)可以根據(jù)此信息來進行提前備貨。
不足之處:這種分析無論從技術(shù)層面還是業(yè)務(wù)層面過于表面,并沒有深入業(yè)務(wù)層次,用這種練習(xí)求職肯定是行不通的。
關(guān)鍵詞:業(yè)務(wù),分析,數(shù)據(jù)