一、項目背景及項目分析目的

項目背景介紹UserBehavior是阿里巴巴提供的一個淘寶用戶行為數(shù)據(jù)集,該數(shù)據(jù)集包含了2017年11月25日至2017年12月3日之間,有行為的約一百萬隨機用戶的所有行為(行為包括點擊、購買、加" />

国产成人精品无码青草_亚洲国产美女精品久久久久∴_欧美人与鲁交大毛片免费_国产果冻豆传媒麻婆精东

18143453325 在線咨詢 在線咨詢
18143453325 在線咨詢
所在位置: 首頁 > 營銷資訊 > 電子商務(wù) > 電商平臺用戶數(shù)據(jù)分析

電商平臺用戶數(shù)據(jù)分析

時間:2023-03-15 23:00:01 | 來源:電子商務(wù)

時間:2023-03-15 23:00:01 來源:電子商務(wù)

目錄

一、項目背景及項目分析目的

  1. 項目背景介紹
UserBehavior是阿里巴巴提供的一個淘寶用戶行為數(shù)據(jù)集,該數(shù)據(jù)集包含了2017年11月25日至2017年12月3日之間,有行為的約一百萬隨機用戶的所有行為(行為包括點擊、購買、加購、喜歡)。

推薦系統(tǒng)中用戶對物品的反饋分為顯式和隱式反饋,顯式反饋 (如評分、評級) 或單一的隱式反饋 (如瀏覽、點擊、加入購物車)。 隱式反饋推薦是推薦系統(tǒng)通過對內(nèi)容和用戶行為的分析,建立適當(dāng)?shù)哪P?幫助用戶從海量的數(shù)據(jù)中找到自己感興趣的內(nèi)容。推薦系統(tǒng)中用戶的行為反饋包括顯式反饋和隱式反饋,隱式反饋信息在推薦系統(tǒng)算法中被廣泛應(yīng)用。隱式反饋體現(xiàn)著用戶的興趣愛好,對隱式反饋信息的挖掘有助于提高推薦系統(tǒng)的效果,以更好地設(shè)計推薦系統(tǒng)。
2. 項目分析目的

通過對該數(shù)據(jù)集的分析,給用戶推薦精準(zhǔn)的隱式反饋推薦。從用戶維度來講,我們能快速滿足用戶需求,提高用戶忠誠度。從平臺角度來看,能給平臺帶來大量忠實用戶,平且提高平臺知名度,以及幫助平臺實現(xiàn)長久盈利。

二、理解數(shù)據(jù)

  1. 數(shù)據(jù)來源:
2. 理解字段

數(shù)據(jù)集介紹,且該數(shù)據(jù)集是2017年11月25日至2017年12月3日之間的數(shù)據(jù)

3. 字段介紹

其中行為類型,分為共有四種,分別是

4. 數(shù)據(jù)集大小說明

三、數(shù)據(jù)清洗

  1. 修改列名
我們將數(shù)據(jù)集導(dǎo)入Navicat以后發(fā)現(xiàn),我們沒有列名,數(shù)據(jù)集的第一行就是我們的數(shù)據(jù),因此我們要手動為數(shù)據(jù)集添加列名,以便后來更好的處理數(shù)據(jù)。

列名修改結(jié)果如下

2. 缺失值處理

首先,我們先來確認(rèn),數(shù)據(jù)中是否存在缺失值

select count(*), count(UserID), count(Product_ID), count(Product_Category_ID), count(Behavior),count(Timestamp)from Userbehavior;我們在當(dāng)初定義表的時候,選擇了not null選項,現(xiàn)在在用count計算時,會發(fā)現(xiàn),我們時沒有缺失值的。

可是如果我們在未來工作中,碰到需要處理缺失值的時候,我們應(yīng)該怎么做呢?

一般有兩種處理方式,第一種,是刪除缺失值,即,刪除缺失值所在行,code如下

delete from 表名 where 列名 is null;第二種,是填充缺失值

select coalesce(列名, 要填充的值) from 表名;3. 將時間戳轉(zhuǎn)換和拆分為日期和時間

首先,從時間戳中抽取日期

alter table Userbehavior add 日期 varchar(255);update Userbehaviorset 日期=from_unixtime(時間戳,'%Y-%m-%d');修改后結(jié)果如圖

然后,從時間戳中抽取時間

alter table Userbehavior add Time varchar(255);update Userbehaviorset Time =from_unixtime(時間戳,'%H:%i:%s')修改結(jié)果如圖

這樣就能更好,更直觀的幫助我們理解數(shù)據(jù)啦。

4. 異常值處理

我們在描述數(shù)據(jù)集時提到過,該數(shù)據(jù)時2017年11月25日至2017年12月3日之間的數(shù)據(jù),因此,若是在此時間段外的數(shù)據(jù),應(yīng)該就是我們需要刪除的異常值了。

DELETE FROM userbehavior WHERE 日期 not BETWEEN '2017-11-25' AND '2017-12-03';這樣就刪除了,不在我們需要的日期范圍內(nèi)的數(shù)據(jù)啦

我們再一次檢查的時候,就會發(fā)現(xiàn)比之前少了三行數(shù)據(jù)

四、業(yè)務(wù)分析思路

我們將從四個方面對數(shù)據(jù)集進(jìn)行分析

產(chǎn)品,業(yè)務(wù)流程,用戶以及促銷四個方面來對數(shù)據(jù)集進(jìn)行分析

  1. 分析思路:
產(chǎn)品方面分析:熱銷產(chǎn)品和滯銷產(chǎn)品分別有哪些,導(dǎo)致熱銷或滯銷的的原因可能是哪些原因?

分析方法: 群組分析法 ,假設(shè)檢驗分析法

業(yè)務(wù)流程轉(zhuǎn)化率分析:通過用戶的購買流程,確定各個環(huán)節(jié)的流失率,留存率

分析方法:漏斗分析法

用戶的行為習(xí)慣分析:以PV、UV等指標(biāo),找出用戶最活躍的日期以及每天活躍時間段。

分析方法: 群組分析法 ,假設(shè)檢驗分析法


產(chǎn)品方面分析

我們將數(shù)據(jù)清洗整理后,我們先來看看我們的熱銷產(chǎn)品有哪些

SELECT product_category_ID,COUNT(product_category_ID)AS Num FROM userbehaviorGROUP BY product_category_IDORDER BY Num DESCLIMIT 10;我們選取了熱銷產(chǎn)品的TOP10來看,但是這里有一個問題,這個榜是包含了用戶所有行為的表格,包括加購,收藏,點擊和購買,我們拆開來看看,每個環(huán)節(jié)的情況。

select Product_Category_ID,COUNT(product_category_id)AS Num,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buyFrom userbehavior u1Group by u1.product_category_idOrder By Num DescLIMIT 10;我們可以看到,毫不意外,用戶主要的行為還是在點擊量上。

我們來看這個分析結(jié)果,可以發(fā)現(xiàn),針對不同類別的產(chǎn)品,我們可以使用不同的策略。鑒于,商家最后追求的都是成交量,因此,我們將轉(zhuǎn)化率列出來,用戶的點擊量和購買量之間的比。方便我們更直觀的觀察數(shù)據(jù)。

select Product_Category_ID,COUNT(product_category_id)AS Sum,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv') as pv,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'cart') as cart,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'fav') as fav,(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy') as buy,CONCAT(ROUND(((Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'buy')/(Select COUNT(u2.product_category_id) from userbehavior u2 WHERE u1.product_category_id = u2.Product_Category_ID AND Behavior = 'pv')*100),2),'%') AS changesFrom userbehavior u1Group by u1.product_category_idOrder By sum DescLIMIT 10; 我們發(fā)現(xiàn),行為總數(shù)最多的商品種類3607361,成交率是0.那么很顯然,產(chǎn)品的高點擊量本質(zhì)上毫無意義,因為不能給店鋪帶來收益。在高點擊量的情況下,我們能夠看出,該產(chǎn)品的獲客能力是很強的,證明公司的推廣策略本身很有效,但是用戶點擊進(jìn)來后的,加購,收藏,和購買行為都在我們上面展示的10條數(shù)據(jù)里面,并不算是偏高的。由此說明,用戶點擊進(jìn)來后,沒有找到自己想要的,或者說,用戶點擊來發(fā)現(xiàn)產(chǎn)品不是自己期望的。該產(chǎn)品就需要在這種方面進(jìn)行改善。

我們再來看看購買量排名前十的產(chǎn)品品類的狀況。

由上面數(shù)據(jù)可以看出,轉(zhuǎn)化率最高的能達(dá)到150%的890050,就說明,用戶點擊進(jìn)入店鋪后,還瀏覽的店鋪的其他商品,并且促成了成交。這個種類的策略偏向也很明顯了,pv只有兩個,后期產(chǎn)品的策略選擇上,應(yīng)該著重放在獲客情況上面。

業(yè)務(wù)流程轉(zhuǎn)化率分析

通過用戶的購買流程,確定各個環(huán)節(jié)的流失率,留存率

用戶達(dá)成購買行為可能存在以下幾種路徑

  1. 點擊 - 購買
SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 加購流失率FROM userbehavior;我們看到這個用戶流失率高達(dá)88.07%,我們先來看看剩下幾個路徑,再來一起對比。

2. 點擊 - 加購 - 購買

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加購流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 購買流失率FROM userbehavior;加購流失率:84.48% 加購后購買流失率 - 3.58%

3. 點擊 - 收藏 - 購買

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 購買流失率FROM userbehavior;收藏流失率: 86.87%, 購買流失率: 1.19%

4. 點擊 - 收藏 - 加購 - 購買

SELECT CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'pv')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'cart'))/COUNT(*)*100,2),'%') AS 加購流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'cart')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'fav'))/COUNT(*)*100,2),'%') AS 收藏流失率,CONCAT(ROUND(((SELECT COUNT(UserID) FROM userbehavior WHERE Behavior = 'fav')-(SELECT COUNT(UserID)FROM userbehavior WHERE Behavior = 'buy'))/COUNT(*)*100,2),'%') AS 購買流失率FROM userbehavior;加購流失率: 84.48%, 收藏流失率: 2.39%, 購買流失率 : 1.19%

流失率
其實,我們可以看出,用戶點擊進(jìn)入頁面后,流失率其實比較大。我們就要分析可能有哪些方面的原因,比如加購流失率高達(dá)84.88%,用戶點擊我們的產(chǎn)品,側(cè)面反映出來,用戶對我們的產(chǎn)品主圖以及標(biāo)題是感興趣的。那么我就需要弄明白,在用戶進(jìn)入頁面后,是產(chǎn)品詳情頁或者是副圖不符合客戶預(yù)期,導(dǎo)致加購和收藏流失率極度攀升。

用戶分析

用戶的行為習(xí)慣分析

我們來看看用戶分析,首先來看看用戶的行為習(xí)慣分析,首先來看,每日點擊量pv,以及獨立點擊量uv

SELECT date, COUNT(behavior) as pv, COUNT(DISTINCT UserID) AS uvFROM userbehaviorWHERE Behavior = 'pv'GROUP BY DateORDER BY Date;我們從上述數(shù)據(jù)可以看出,在1202和1203這兩天,用戶無論是點擊量還是獨立用戶訪問數(shù),都略高于平時。我們對這兩天訪問量高做假設(shè)檢驗的分析

提問:1202和1203訪問量高的原因是什么?

假設(shè):1202和1203有特殊的節(jié)日

而后,我們通過查詢歷史數(shù)據(jù)發(fā)現(xiàn),1202和1203兩天,是那周的周末。由此,我們確認(rèn),假設(shè)成立。

用戶價值分析


對于本次數(shù)據(jù),我們?nèi)狈ο嚓P(guān)的M值的數(shù)據(jù),因此我們主要關(guān)注,R值,和F值。

由于我們拿到的是歷史數(shù)據(jù),因此我們定義適合本次數(shù)據(jù)的R值和F值

R值:用戶最近一次購買行為12月3日時長。

F值:用戶2017年11月27日至2017年12月3日的消費了次數(shù),F(xiàn)值越大,用戶價值越高

SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R ,count(Behavior) as Ffrom userbehaviorwhere Behavior ='buy'group by UserIDORDER BY R DESC,F DESC;隨后,我們指定自己的打分規(guī)則

隨后,我們根據(jù)我們的打分規(guī)則,對用戶進(jìn)行分組,確認(rèn)用戶價值

SELECT a.*,(case when R<=2 then 4when R between 3 and 4 then 3when R between 5 and 6 then 2when R between 7 and 8 then 1 end) as Rscore,(case when F between 1 and 3 then 1when F between 4 and 6 then 2when F between 7 and 9 then 3when F>=10 then 4 end) as Fscorefrom (SELECT UserID,DATEDIFF('2017-12-3',max(date)) as R ,count(Behavior) as Ffrom userbehaviorwhere Behavior ='buy'group by UserID)a;

總結(jié)與建議

產(chǎn)品方面,我們可以看到,在我們看到,各類的產(chǎn)品的銷售狀況很不一樣,有的產(chǎn)品種類獲客很容易,但是轉(zhuǎn)化率很低,但是有的產(chǎn)品,獲客能力不足,但是轉(zhuǎn)化率卻極高。因此,對于不同類型的產(chǎn)品,應(yīng)該因地制宜選擇不同的銷售策略。

業(yè)務(wù)流程方面,我們對各種不同類型的業(yè)務(wù)流程分別進(jìn)行了分析,然后我們就會發(fā)現(xiàn),普遍情況,客戶的流失都是在點擊后,這就意味著,大家的重點都集中在引流,但是客戶點擊進(jìn)來之后,很快就會走,這樣的引流毫無意義,關(guān)于這方面,商家應(yīng)該更側(cè)重在客戶點進(jìn)來之后,如何留住客戶。

用戶行為方面,我們可以看到,在周六日這種特殊的日子,用戶的訪問時間明顯變長,如果考慮做活動的話,應(yīng)該主動集中在這些日子,能帶來不少自然流量的同時,也能更好的提高轉(zhuǎn)化率。

關(guān)鍵詞:數(shù)據(jù),分析,用戶,平臺

74
73
25
news

版權(quán)所有? 億企邦 1997-2025 保留一切法律許可權(quán)利。

為了最佳展示效果,本站不支持IE9及以下版本的瀏覽器,建議您使用谷歌Chrome瀏覽器。 點擊下載Chrome瀏覽器
關(guān)閉