關(guān)于電商案例的數(shù)據(jù)分析
時(shí)間:2023-03-15 21:46:02 | 來(lái)源:電子商務(wù)
時(shí)間:2023-03-15 21:46:02 來(lái)源:電子商務(wù)
數(shù)據(jù)分析分為5個(gè)步驟:
1. 提出問(wèn)題明確自己需要通過(guò)數(shù)據(jù)分析解決什么的問(wèn)題。
2. 理解數(shù)據(jù)理解數(shù)據(jù)各個(gè)字段的含義。
3. 數(shù)據(jù)清洗- 1. 選擇子集
- 2. 列名重命名
- 3. 刪除重復(fù)值
- 4. 缺失值處理
- 5. 一致化處理 (分列處理)
- 6. 數(shù)據(jù)排序
- 7. 異常值處理
4. 構(gòu)建模型:運(yùn)用函數(shù)、數(shù)據(jù)透視表,分析工具庫(kù)(描述統(tǒng)計(jì)分析)5. 數(shù)據(jù)可視化具體的案例分析演練一. 提出問(wèn)題- 這幾年的銷售情況如何?
- 哪種商品銷售的數(shù)量最多?
- 年齡與購(gòu)買商品數(shù)量之間有什么聯(lián)系?
- 性別與購(gòu)買商品種類之間有什么聯(lián)系?
二. 理解數(shù)據(jù)今年每個(gè)月的銷售情況是怎么樣的?
User id:用戶id號(hào)
Auction id:標(biāo)記用戶行為
Cat id:一級(jí)類目
Cat 1:子類目
Property :屬性
Buy amount:購(gòu)買的數(shù)量
Day:購(gòu)買日期
Birthday:生日
l Gender:0代表男性,1代表女性
三. 數(shù)據(jù)清洗(1). 復(fù)制粘貼一份新的Excel文件,并重命名:表1購(gòu)買商品 - 數(shù)據(jù)清洗結(jié)果;表2嬰兒信息 - 數(shù)據(jù)清洗結(jié)果
(2). 隱藏暫時(shí)無(wú)關(guān)的字段Auction id,property
(3). 刪除重復(fù)值: 無(wú)重復(fù)值
(4). 缺失值處理:未發(fā)現(xiàn)缺失值
(5). 一致化處理:時(shí)間按照yyyy/m/d的格式輸出
商品表-yyyy/m/d的格式嬰兒表-yyyy/m/d的格式(6). 按時(shí)間升序排序
商品表-時(shí)間升序排列嬰兒表-時(shí)間升序排列(7). 異常值處理:性別中篩選出“2”的結(jié)果將不列入計(jì)算
異常值-不列入計(jì)算清洗結(jié)果如下:
表1購(gòu)買商品 - 數(shù)據(jù)清洗結(jié)果表2嬰兒信息 - 數(shù)據(jù)清洗結(jié)果四.構(gòu)建模型
哪種商品銷售的數(shù)量最多?
類別5001883的商品在四年間賣出12657件5. 數(shù)據(jù)可視化
這幾年的銷售情況如何?
2012-2015年的商品銷售情況-單位(月)2012-2015年的商品銷售情況-單位(年)由圖觀察得知,2012-2015年中,2014年的商品銷售情況最為樂觀,購(gòu)買量達(dá)到42241,其中11月份的購(gòu)買量更是多達(dá)全年的1/4,達(dá)到13044,同時(shí)也是四年間銷量最好的一個(gè)月。
- 年齡與購(gòu)買商品數(shù)量之間有什么聯(lián)系?
年齡與購(gòu)買數(shù)量之間的聯(lián)系通過(guò)觀察上圖得知,年齡在7歲和8歲時(shí),商品購(gòu)買數(shù)量的占比分別達(dá)到了整個(gè)樣本人群的21%和24%;相反,17歲和35歲購(gòu)買數(shù)量的占比最少,甚至不足1%。
性別與購(gòu)買商品種類之間有什么聯(lián)系?
性別與購(gòu)買數(shù)量之間的聯(lián)系