嬰兒電商市場分析
時間:2023-03-26 02:30:01 | 來源:電子商務(wù)
時間:2023-03-26 02:30:01 來源:電子商務(wù)
一、立足業(yè)務(wù),解決實際問題。大多數(shù)的數(shù)據(jù)分析都是為了解決實際的問題,或者為解決實際問題提供判斷依據(jù)。這時就要求數(shù)據(jù)分析師對公司的業(yè)務(wù)非常的了解,只有了解了實際的業(yè)務(wù)之后,才能主動從中發(fā)現(xiàn)問題,理解業(yè)務(wù)部門提出的問題,以便更好的解決問題。一個不熟悉業(yè)務(wù)的數(shù)據(jù)分析師就不是一個好的數(shù)據(jù)分析師。
當(dāng)boss給你一大堆數(shù)據(jù),讓你分析一下。你第一反應(yīng)肯定是要明確boss的需求,如boss想通過這個分析的結(jié)果去解決哪些實際的問題,有時候不僅要完成boss所交代的任務(wù),而且還要站在boss的角度上去發(fā)現(xiàn)那些boss也沒發(fā)現(xiàn)的問題,這樣就可以得到boss的青睞。
設(shè)想一下作為一個開淘寶店的店主,通過技術(shù)的手段拿到了自己運營多年店鋪的后臺數(shù)據(jù),他會想從中得到哪些信息呢?
(1)歷史的銷量如何,未來的銷量走勢?
(2)各商品歷史銷量情況,如何進(jìn)行選品,以實現(xiàn)銷量最大化?
(3)對客戶性別、年齡等信息進(jìn)行了解。
二、理解數(shù)據(jù)打開源始數(shù)據(jù)之后,首先要對各字段進(jìn)行理解,將原有的字段翻譯為方便自己理解的大白話字段。
針對于第一步提出的我問題,需要找到解決這個問題需要用到數(shù)據(jù)集里面的哪些字段。如“購買數(shù)量”“購買時間”“商品種類”“用戶ID”“出生日期”“性別”這些字段都是需要用到的,接下來對這些字段的數(shù)據(jù)進(jìn)行清洗,處理一些重復(fù)的、缺失的數(shù)據(jù)。
三、清洗數(shù)據(jù)(1)去重復(fù)值想要去除數(shù)據(jù)集里面的重復(fù)數(shù)據(jù),就得找到該數(shù)據(jù)集里面的一個可以作為“主鍵ID”的字段,這個字段的數(shù)據(jù)是不會出現(xiàn)重復(fù)的。數(shù)據(jù)集里面所有的字段都可以出現(xiàn)重復(fù)值,這里就無法進(jìn)行去除重復(fù)值的操作。如果要去除重復(fù)值,則需要新添加一個新字段作為“主鍵ID”。
(2)缺失值處理計算出“用戶ID”字段的數(shù)值,然后去和其他的字段進(jìn)行對比,如果少于這個數(shù)值這說明該字段數(shù)據(jù)是有缺失部分的。對于缺失的數(shù)據(jù)可以采用補齊,刪除,平均值替代等方式進(jìn)行處理。
(3)一致化處理為了方便后續(xù)的數(shù)據(jù)處理,就需要對字段格式等進(jìn)行處理。如用數(shù)據(jù)分列將文本格式的“購買時間”更改為日期格式,再對單元格顯示進(jìn)行調(diào)整,改為“日期”顯示方式。
(4)去繁就簡,添加需要的字段將數(shù)據(jù)集里面用不上的字段進(jìn)行隱藏處理,盡量不要刪除。對于一些額外的字段需要進(jìn)行添加,如業(yè)務(wù)分析需要用到用戶年齡,則需要添加年齡這個字段,并根據(jù)前面“出生日期”字段進(jìn)行簡單的計算就可以得到。
四、數(shù)據(jù)分析、構(gòu)建模型(1)歷史的銷量如何,未來的銷量預(yù)估?
將第一步提出的問題轉(zhuǎn)化為具體的數(shù)據(jù)模型。如想預(yù)估未來的銷量,就需要知道歷史的業(yè)績情況及未來業(yè)績發(fā)展的趨勢。
(2)各商品歷史銷量情況,如何進(jìn)行選品,以實現(xiàn)銷量最大化?
商品類別50008168銷量相比其他類別是最好的,建議商品選品都選這種類別的。所有商品的銷量周期都是一致的,在第四年的時候就需要提前換新的商品,避免銷量出現(xiàn)明顯的下滑。
(3)對客戶性別、年齡等信息進(jìn)行了解,哪些是優(yōu)質(zhì)客戶,做好老客戶的維系工作及新客戶的開發(fā)工作。
客戶群體中,男性占52.75%,女性占47.25%??蛻舻哪挲g段主要集中在4-12歲,占比94.43%。